Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習実用化失敗黙示録
Search
shibuiwilliam
April 20, 2022
Programming
0
190
機械学習実用化失敗黙示録
機械学習実用化の失敗経験談
shibuiwilliam
April 20, 2022
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
生成AI時代のデータ基盤
shibuiwilliam
6
4.5k
LLM時代の検索とコンテキストエンジニアリング
shibuiwilliam
3
1.5k
AI人生苦節10年で会得したAIがやること_人間がやること.pdf
shibuiwilliam
1
370
LayerXのApplied R&D
shibuiwilliam
2
50
LLM時代の検索
shibuiwilliam
3
1.1k
生成AIを作るエンジニアリングと使うエンジニアリング
shibuiwilliam
2
120
AI Agentのキャッシュ、再利用、Ops
shibuiwilliam
2
140
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
5
700
LLMで推論するライブラリを整理する
shibuiwilliam
6
1.8k
Other Decks in Programming
See All in Programming
What's new in Spring Modulith?
olivergierke
1
140
NixOS + Kubernetesで構築する自宅サーバーのすべて
ichi_h3
0
670
Web フロントエンドエンジニアに開かれる AI Agent プロダクト開発 - Vercel AI SDK を観察して AI Agent と仲良くなろう! #FEC余熱NIGHT
izumin5210
3
520
CSC305 Lecture 06
javiergs
PRO
0
220
『毎日の移動』を支えるGoバックエンド内製開発
yutautsugi
2
240
Domain-centric? Why Hexagonal, Onion, and Clean Architecture Are Answers to the Wrong Question
olivergierke
2
820
CSC305 Lecture 03
javiergs
PRO
0
240
Pull-Requestの内容を1クリックで動作確認可能にするワークフロー
natmark
2
500
明日から始めるリファクタリング
ryounasso
0
140
Railsだからできる 例外業務に禍根を残さない 設定設計パターン
ei_ei_eiichi
0
470
大規模アプリのDIフレームワーク刷新戦略 ~過去最大規模の並行開発を止めずにアプリ全体に導入するまで~
mot_techtalk
1
440
GraphQL×Railsアプリのデータベース負荷分散 - 月間3,000万人利用サービスを無停止で
koxya
1
1.3k
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
189
55k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
The Power of CSS Pseudo Elements
geoffreycrofte
79
6k
Done Done
chrislema
185
16k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.2k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Leading Effective Engineering Teams in the AI Era
addyosmani
2
300
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Transcript
機械学習実用化失敗黙示録 2022/04/20 しぶい
自己紹介 shibui yusuke • いろいろ → Launchable(いまここ) • MLOpsとかいろいろエンジニア •
もともとクラウド基盤の開発、運用 • ここ6年くらいMLOpsとバックエンドとインフラとたまに データ分析とAndroidで仕事 • Github: @shibuiwilliam • FB: yusuke.shibui • Meety: https://meety.net/matches/OPJgijxiEMHE • 最近の趣味:本の執筆と副業と ARとネコ cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知 2
MLOps勉強会を毎月開催してます! https://mlops.connpass.com/
ワシの失敗談は百八式まであるぞ • 成功の裏には多くの失敗が存在する。 • 成功しなくても多くの失敗は存在する。 • 機械学習の実用化関係の仕事を続けてきて犯した大小の失敗のうち、 代表的な1個を説明します。
機械学習を実用化するためのエンジニアリング 学習 コード 学習 データ 学習 評価 モデル レポート 推論
コード CI テスト データ 評価 コード CD システム A A/B テスト システム B 負荷 試験 ログ 収集 評価 データ ユニット テスト ユニット テスト 機械学習エンジニアが得意 ソフトウェアエンジニアが得意 SREが得意
機械学習を実用化するためのエンジニアリング 学習 コード 学習 データ 学習 評価 モデル レポート 推論
コード CI テスト データ 評価 コード CD システム A A/B テスト システム B 負荷 試験 ログ 収集 評価 データ ユニット テスト ユニット テスト 機械学習エンジニアが得意 ソフトウェアエンジニアが得意 SREが得意 機械学習のエンジニアリングには 機械学習の知識が必要
0->1 フェーズのよくある失敗 全部できるスーパーエンジニアが全部作る ・・・けど作るだけで終わる 機械学習を実用化するためのエンジニアリング 学習 コード 学習 データ 学習
評価 モデル レポート 推論 コード CI テスト データ 評価 コード CD システム A A/B テスト システム B 負荷 試験 ログ 収集 評価 データ ユニット テスト ユニット テスト 機械学習エンジニアが得意 ソフトウェアエンジニアが得意 SREが得意
機械学習黎明期に謎の機械学習システムが出来上がる コード管理 DWH CI CRD 学習 パイプライン ビルド パイプライン マイクロサービス
CRD デプロイ パイプライン CRD 学習 クラスター サービス クラスター cron リソース コントローラ
チームメンバー モチベーション 俺は0->1が得意! 新しいプロダクトを考 えたよ♪ どうにか運用せねば ・・・ 作った人の尻拭いは 嫌だ。無駄に複雑で 不安定だし。
作った人 PdM EM
作り直すことのエンジニアリング • 目標を立てる:チームメンバーが技術選定して小さな変更でまともな運用を目指す ◦ 独自パイプラインCRDをマネージドサービスとサーバレスに寄せる • モチベーションを作る:作ったときに存在しなかった新しい技術を取り入れる ◦ Vertex AIやMLflowの導入
• フルスタックを目指さない:エンジニアとして今得たい技術に集中する ◦ 機械学習Kubernetesクラスターをインフラチームクラスターに移行 • 技術的負債をビジネス的に説明する:運用負荷を下げたほうが開発効率は上がる ◦ 開発vs運用工数の指標化
開発のチームワークはフェーズによって異なる 機械学習 導入開始 実用化 開発自動化 リリース 自動化 機械学習 エンジニア一人 機械学習
エンジニア複数 機械学習エンジニア + バックエンドエンジニア プロダクト別・事業別 チーム 頑張れ! 一番自由な時期! 阿吽の呼吸で わいわい楽しい ♪ 軋轢が生まれ始める コード品質 vs Jupyter 各チームの独自運用 他チームはあまり知らない スーパーエンジニア レガシー企業は 実はこのステージが多い 動いてるけどメンテナンスが 難しいことが多い バックエンドエンジニアの 支援がありがたいフェーズ 素晴らしいチームワーク!
学び • 作りたいものや作ってほしいものが、本当に作るべきものとは限らない。 • 作り直しは必ず発生する。新技術を扱ったプロダクトでは特に。 • 組織とプロダクトのフェーズによって突破志向と安定志向を使い分ける。
昨年出版した本の宣伝 • AIエンジニアのための 機械学習システムデザインパターン • 2021年5月17日発売 • https://www.amazon.co.jp/dp/4798169447/ • 機械学習よりもKubernetesとIstioに詳しくなれる一冊!
• Amazon.co.jp 情報学・情報科学部門 1位! 人工知能部門 1位! • 韓国語版も発売中! • 英語版出したい!