Rettyの分析基盤について --データ分析基盤Night #1--

Rettyの分析基盤について Retty jp_taku2

自己紹介 Retty すずたく @jp_taku2 2014.4 オールアバウト新卒入社 2016.8 Retty 入社
インフラを主にやっています。料理担当：なし

agenda 1. Rettyの分析基盤の歴史 2. 現在の分析基盤 3. 機械学習基盤について 4. まとめ

Rettyの分析基盤の歴史

Retty分析基盤の流れ 1. Treasure Data 2. Treasure Data + BigQuery 3.
現在の分析基盤

Treasure Dataで発生した課題 ▪ 利用する用途・頻度・人が増えてしまった →プランナーもクエリを投げて分析するため ▪ データー量の爆増 →ユーザー数が増えたため発行されるログの量が増加した ▪ クエリの実行時間がかかってしまう
→ クエリのレビューが徹底されていなかったために起きていた

Treasure Data + BigQueryの課題 ▪ 統一した環境を構築しなかった →野良で立ち上がっていったため、統一されていない ▪ データの粒度が違うもの個々人で使用していた →weekly/dayly/hourlyでは結果が異なる
▪ 金額をハンドルする人がいなかった →カジュアルに作られていて管理下に置かれていなかったため

データ分析基盤の構築

要件 ▪ 分析者がストレスなく分析することが可能な環境を構築する ▪ 各チームで共通のデータを使用することができている状態を作る ▪ サービスDBの必要なデータとログが一つのDBに格納されている ▪ 短時間での復元が可能な状態を保持し続ける

現在のデータ分析基盤の構成

データを貯める 1. appサーバー等からaggregatorに送くり Treasure Dataにログデータを送る 2. Treasure Dataに貯められたログは1時間毎にS3へ保存される 3.
サービス用のDBからは必要なデータが、csv 形式でファイルに出力されS3へ保存される 4. サーバからGCSへのログ送信も行われる

DWHからDM 1. Athenaは各BIツールで必要な形に整形 S3へ保存 2. 出力されたファイルを元にDMは更新を行う 3. BIツール用のDMでは、datapi[lineを使用して、RDSへ保存 4.
AdHoc分析用のDMでは BigQueryへデーターの取り込む

結果

機械学習基盤について

Retty 機械学習マシンの紹介 (Docker 周りを中心に)

GPU付自作PCを全自動ネットインストールでセットアップ

使い方 (ssh してログインして使う)

どのマシンにログインしても同じデータがあります

nvidia-smi

アーキテクチャ全体像 Hardware - Akiba 1-x OS hdd Distributed storage Container
Home Container Containers Network GPU CPU, devices Configuration Container Qemu KVM Kubernetes (docker) qemu on docker

根幹はRubuntu Server (Retty ubuntu) と Kubernetes (Docker) Hardware - Akiba
1-x OS hdd Home Container GPU CPU, devices Configuration Kubernetes (docker)

開発者は Docker コンテナを使う Hardware - Akiba 1-x OS hdd Home
Container GPU CPU, devices Configuration Kubernetes (docker)

Quadro GP100とは ▪ FP32用CUDA Core数：3584基 ▪ FP64用CUDA Core数：1792基 ▪ グラフィックスメモリ容量：16GB
▪ マルチGPU対応：NVLink（※最大2-way）世界初 NVLink対応 PCIe拡張カード

まとめ

まとめ今回のデータ分析基盤のリプレイスにより、今まで課題となっていた問題を解決できるはず。また、先のことを考慮して、移行のし易い環境を構築できた。今後の課題としては、appサーバーからのログの送信やデータの鮮度を上げていくというようなことを考慮してアップデートをしていかなければいけないと考えております。

最後に Rettyはグルメなユーザさんがオススメする、信頼できる飲食店の情報をわかりやすく提供していきます「人から探す」グルメサービスの開発に興味のある方、ご応募お待ちしております

ご清聴ありがとうございました.

Rettyの分析基盤について --データ分析基盤Night #1--

Rettyの分析基盤について --データ分析基盤Night #1--

jp_taku2

More Decks by jp_taku2

Other Decks in Technology

Featured

Transcript

Rettyの分析基盤について Retty jp_taku2

自己紹介 Retty すずたく @jp_taku2 2014.4 オールアバウト新卒入社 2016.8 Retty 入社

agenda 1. Rettyの分析基盤の歴史 2. 現在の分析基盤 3. 機械学習基盤について 4. まとめ

Rettyの分析基盤の歴史

Retty分析基盤の流れ 1. Treasure Data 2. Treasure Data + BigQuery 3.

Treasure Data + BigQueryの課題 ▪ 統一した環境を構築しなかった →野良で立ち上がっていったため、統一されていない ▪ データの粒度が違うもの個々人で使用していた →weekly/dayly/hourlyでは結果が異なる

データ分析基盤の構築

現在のデータ分析基盤の構成

データを貯める 1. appサーバー等からaggregatorに送くり Treasure Dataにログデータを送る 2. Treasure Dataに貯められたログは1時間毎にS3へ保存される 3.

DWHからDM 1. Athenaは各BIツールで必要な形に整形 S3へ保存 2. 出力されたファイルを元にDMは更新を行う 3. BIツール用のDMでは、datapi[lineを使用して、RDSへ保存 4.

結果

機械学習基盤について

Retty 機械学習マシンの紹介 (Docker 周りを中心に)

GPU付自作PCを全自動ネットインストールでセットアップ

使い方 (ssh してログインして使う)

どのマシンにログインしても同じデータがあります

nvidia-smi

アーキテクチャ全体像 Hardware - Akiba 1-x OS hdd Distributed storage Container

根幹はRubuntu Server (Retty ubuntu) と Kubernetes (Docker) Hardware - Akiba

開発者は Docker コンテナを使う Hardware - Akiba 1-x OS hdd Home

Quadro GP100とは ▪ FP32用CUDA Core数：3584基 ▪ FP64用CUDA Core数：1792基 ▪ グラフィックスメモリ容量：16GB

まとめ

最後に Rettyはグルメなユーザさんがオススメする、信頼できる飲食店の情報をわかりやすく提供していきます「人から探す」グルメサービスの開発に興味のある方、ご応募お待ちしております

ご清聴ありがとうございました.