Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MOV お客さま探索ナビの GCP ML開発フローについて

MOV お客さま探索ナビの GCP ML開発フローについて

2019/10/31に実施されたMobility.dev2019の発表スライド
https://mobilitydev.jp

Takashi Suzuki

October 31, 2019
Tweet

More Decks by Takashi Suzuki

Other Decks in Technology

Transcript

  1. 自己紹介 鈴木 隆史 | Takashi Suzuki AI本部 AIシステム部 MLエンジニアリンググループ 前職では新卒でITメガベンチャーに入社し、サーバーサイドエンジニアとしてゲーム開発とビッグ

    データを活用したサービス分析をリード。 その後、大規模データ基盤の新規構築と運用保守などのデータエンジニアリング業務と、レコメンド アルゴリズムの設計開発やチャットボット開発などのMLエンジニアリング業務に従事していた。 2019年にDeNAに入社し、オートモーティブ事業における機械学習の実験基盤やパイプラインの設 計開発を行っている。 2
  2. 9 コンポーネント概要 リアルタイム データ処理 • 車両データのETL • DWH • データ前処理

    需要供給予測 • 特徴量作成 • MLモデル予測 走行ルート推薦 • 最適方策の獲得 • 全体最適化
  3. フルマネージド学習基盤 • 1分単位の起動時間課金 • Dockerカスタムイメージの学習をサポート • ジョブ実行までidle timeが発生する v.s. GKE

    • 柔軟なインスタンス変更 • クラスタ作成不要の手軽さ 学習時のスケール:AI Platform Training Job 16 AI Platform
  4. comet.ml - 豊富な視覚化/比較 - ハイパラ探索 - コード管理 - Git Integration

    - 有料 各実験パラメータの管理 19 mlflow - 視覚化/比較 - 簡易ハイパラ探索 - 無料 BigQuery - 視覚化はDataPortal - リストはDataConnector - カスタムしやすい
  5. CI/CDにおける課題 21 01
 コードの再現性 データサイエンティストから MLエンジニアに渡された コード・モデルの実行/再現の担 保 02
 ロールバック

    新しいモデルにバグが あった場合の 以前のモデルに切り戻し たいとき 03
 モデルのテスト パイプラインに反映する前の 簡易な動作テストと 小規模データの検証テスト
  6. マネージドAirflow • 複雑な依存関係定義によりヒューマンエラー防止 • 冪等性なJob実行により再現性を担保 • 定期的にJobを実行してモデルを更新 • 重い処理はGKEやTraining Jobを利用

    v.s. Kubeflow Pipeline • 途中Jobから再実行可能 • 外部トリガー・外部リソースの利用が容易 • 評価指標は管理できない パイプラインにおける課題:Cloud Composer 26 Cloud Composer