Mobility Technologies Co., Ltd. n 著名なStrata Data Conferenceの近くの会場で開催されたカンファレンス n 間違いなくStrataの参加者を取り込もうと狙ったカンファレンス n セッションは1並列だが、著名な企業の発表が多く内容の濃いカンファレンスだった n Uber, Netflix, Twitter, Walmart, Nike, New York Times, Google, Microsoft, Twitter, NVIDIA, Payoneer, Iguazio n 参加費は約$300 「MLOps NYC 19」 にいってきました。 14 動画:https://www.youtube.com/playlist?list=PLH8M0UOY0uy6d_n3vEQe6J_gRBUrISF9m
Mobility Technologies Co., Ltd. nMLプロジェクトの60%〜80%がプロダ クションにならずに頓挫している n 連携不⾜ n IT担当、エンジニア、データ、そしてデータサ イエンスのチームの連携不⾜ n データサイエンティストがエンジニアリングの 知識不⾜ n ビジネスの理解を得られない n データの品質が不明瞭 n ビジネスとの握りが曖昧 n ビジネスへの説明不⾜ n MLのOps(運⽤)の難しさ n データサイエンティストが書いたコードは本番 には採⽤できない n データのETLにかなり苦労する Walmartの発表 16 n3つのゴールデンルールを作った 1. なぜ重要なのか? n だれかがそれに⾦を払うか n 「Cool」なプロダクトはいらない 2. 説明できるか? n ビジネスの⾔葉で説明できるか 3. 実装できるか? n 本番化する計画は明瞭か
Mobility Technologies Co., Ltd. n MLのプロジェクト n データ探索(〜2週間) n プロトタイピング(6〜8週間) n 本番化 (12〜14週間) n リリース後のモデル更新 (〜8週間) n 課題 n プロトタイピング、本番化、リリース後 のモデル更新に時間がかかる n 解決法 n 独⾃フレームワーク「Metaflow」の導⼊ n Metaflowは以下の開発スタック全体を ラッピングしてくれる Netflixの発表 17 Metaflow
Mobility Technologies Co., Ltd. nID n @tstomoki n名前 n 齋藤智輝 n学⽣ n 東京⼤学(学部・⼤学院)で船の研究をしていました n職歴 n ヤフー株式会社 n ナレッジパネルの開発 n ユーザ位置情報を⽤いた研究開発 n 株式会社バンク n 機械学習モデルの開発・導⼊ n Mobility Technologies株式会社 n AI技術開発部 アルゴリズムグループ ⾃⼰紹介 21 nエディタ n Emacs => Atom => Emacs + PyCharm n役割 データサイエンティスト 兼 データエンジニア
Mobility Technologies Co., Ltd. n機械学習モデルをサービスで運⽤するにはやることが多い n データサイエンティストがやらないこと全て(MLOpsの定義) n 定常的にモデル精度やヘルスチェックの必要性 n本番⽤コードの品質維持 n データサイエンティストが書いたコードは本番には採⽤できない n システムが落ちないような考え(エラーハンドリングなど) nサイエンティストの負担軽減 n データサイエンティストが全て⾏うのは複雑、時間がかかる n データサイエンティストの負担を軽減することでより効率的な開発が可能 まとめ 31