Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How to start MLOps
Search
shibuiwilliam
March 17, 2022
Technology
0
160
How to start MLOps
How to start MLOps for DevOpsDays Tokyo 2021.
https://www.devopsdaystokyo.org/
shibuiwilliam
March 17, 2022
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
画像生成AIについて
shibuiwilliam
0
16
2026年はチャンキングを極める!
shibuiwilliam
9
2k
R&Dチームを起ち上げる
shibuiwilliam
1
150
AIエージェント開発と活用を加速するワークフロー自動生成への挑戦
shibuiwilliam
5
970
プロンプトやエージェントを自動的に作る方法
shibuiwilliam
17
18k
生成AIシステムとAIエージェントに関する性能や安全性の評価
shibuiwilliam
2
540
AIエージェントによるエンタープライズ向けスライド検索!
shibuiwilliam
4
1.3k
実践マルチモーダル検索!
shibuiwilliam
3
990
生成AI時代のデータ基盤
shibuiwilliam
7
5.2k
Other Decks in Technology
See All in Technology
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
530
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
170
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
230
変化するコーディングエージェントとの現実的な付き合い方 〜Cursor安定択説と、ツールに依存しない「資産」〜
empitsu
4
1.4k
AWS Network Firewall Proxyを触ってみた
nagisa53
1
230
仕様書駆動AI開発の実践: Issue→Skill→PRテンプレで 再現性を作る
knishioka
2
650
Webhook best practices for rock solid and resilient deployments
glaforge
1
290
GitLab Duo Agent Platform × AGENTS.md で実現するSpec-Driven Development / GitLab Duo Agent Platform × AGENTS.md
n11sh1
0
140
SREじゃなかった僕らがenablingを通じて「SRE実践者」になるまでのリアル / SRE Kaigi 2026
aeonpeople
6
2.3k
Frontier Agents (Kiro autonomous agent / AWS Security Agent / AWS DevOps Agent) の紹介
msysh
3
170
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
230
Featured
See All Featured
How GitHub (no longer) Works
holman
316
140k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.9k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
The SEO identity crisis: Don't let AI make you average
varn
0
240
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
We Are The Robots
honzajavorek
0
160
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
130
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
170
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Thoughts on Productivity
jonyablonski
74
5k
Building AI with AI
inesmontani
PRO
1
690
Transcript
MLOpsのはじめ方 2021/04/15 shibui yusuke
自己紹介 shibui yusuke • 自動運転スタートアップのティアフォー所属 • MLOpsエンジニア & インフラエンジニア &
データエンジニア • もともとクラウド基盤の開発、運用。 • ここ5年くらいMLOpsで仕事。 • Github: @shibuiwilliam • Qiita: @cvusk • FB: yusuke.shibui • 最近やってること: FlutterとIstio cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知
CatOps! 放置しているとネコに 椅子を奪われる。 ネコ障害対応(餌、遊ぶ)。 「遊ぶ」を自動化する。 椅子に座っていても ハンズフリーで遊べる。 day 奪 わ
れ 回 数 ハンズフリー導入 飽き始める Dev Data-driven 3 Ops
今日話すこと 1. これまでの機械学習プロジェクトの経験( 5年くらい)から、発生する課題と打開策を説明 2. 機械学習にDevOpsの方法論を応用してプロダクトにインパクトを与える方針を解説 今日話さないこと 1. 機械学習のアルゴリズム、開発方法、基盤の作り方、ライブラリの使い方
なぜ機械学習にDevOpsが必要か
• 機械学習の有用性を試す PoCから次の段階に行くためには機械学習の DevOpsが必要 • 機械学習を含むプロダクトの価値を継続的に引き出すのが MLOps 0->1の次を目指す PoCの数々 ようやく成功した
プロダクト 成長するには なにが足りない? →ビジネス指標から機械学習を評価する →機械学習だけにフォーカスしない
最近の機械学習界隈の状況 • モデル開発から利用へ データ収集 学習 デプロイ 利用
機械学習を使ったプロダクト例 画像処理 写真を撮る タイトル入力 説明入力 登録する 自然言語処理 違反検知 登録情報から違反を フィルタリング
入力情報から 入力補助 超解像による 画質改善 ねこ 検索 協調フィルタリングや ランク学習による 並べ替え あるコンテンツ登録アプリ 画像分類と 検索
機械学習を使ったプロダクトの評価例 画像処理 写真を撮る タイトル入力 説明入力 登録する 自然言語処理 違反検知 登録情報から違反を フィルタリング
入力情報から 入力補助 超解像による 画質改善 ねこ 検索 協調フィルタリングや ランク学習による 並べ替え あるコンテンツ登録アプリ 画像分類と 検索 Accuracy, Precision, Recall →間違って表示される 違反コンテンツと、 非表示にされる 正常コンテンツの比率 Precision, Recall, nDCG →検索数、CTR、 コンバージョン率、 レスポンスタイム、 etc MSE, MAE →コンテンツの滞在時間、 CTR、いいね数、 etc
機械学習と仕組みと事業のライフサイクル コンバージョン コンバージョン率 クリック数 クリック率 表示回数 検索数 レイテンシー 協調フィルタリング ランク学習等
リアルタイム 初期:数ヶ月 更新:数日〜 初期:数ヶ月 更新:数週間〜 データ 実行 システム
課題
機械学習で解決する課題と発生する課題 • 解決する課題:データに基いた自動化により、人間の一部の作業を代替する ◦ 適切な検索結果や商品を上方に表示する、違反行為を検知する、等々 • 発生する課題:機械学習でプロダクトにインパクトを与えるためのワークフローとシステム ◦ 機械学習のためのCI/CD、A/Bテスト、フィードバックループ データ収集
前処理 評価 利用 学習 ビルド フィードバック デプロイ A/Bテスト ロギング
プロダクトを改善できない • 推論システムをリリースしても推論結果を評価してモデルを改善していないケースは多い データ収集 学習 デプロイ 利用
ワークフローを作れない • タスク間を繋げる仕組みや文化を作ることができず、個々のプログラムが非連続に存在する データ収集 前処理 評価 利用 学習 ビルド フィードバック
デプロイ A/Bテスト ロギング
組織的な壁 • 機械学習は機械学習だけではない → 関係チームも多い https://papers.nips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf
組織的な壁(諸説あり) infrastructure engineer, SRE PM ??? ML engineer, data scientist
backend engineer data engineer test engineer, QA engineer
MLOpsのはじめ方
Good • プロダクトの課題からはじめる • 評価からはじめる • リリースからはじめる Bad • 機械学習からはじめる
• 汎用基盤からはじめる • 技術的な課題からはじめる Issueからはじめる
モデルをリリースして効果を記録する 協調フィルタリング ランク学習等 time metrics 導入 コンバージョン コンバージョン率 クリック数 クリック率
表示回数 検索数 レイテンシー
アンチパターン:アサインはリリースまで データ収集 前処理 評価 利用 学習 ビルド フィードバック デプロイ A/Bテスト
ロギング PM ML engineer Backend engineer ? engineer リリース!
機械学習の価値を評価する time metrics 導入 上がっている場合: 1. 維持、改善 2. 新たな施策の導入 下がっている場合:
1. 別モデルの開発 2. 停止判断 コンバージョン 検索数 before ML latency after ML before ML CTR after ML 新 モデル改善 リソース 増強
複数のモデルをリリースする time metrics 導入 導入 現 新 コンバージョン 検索数 before
ML latency after ML before ML CTR after ML latencyを 改善する モデル
アンチパターン:リリース基準がない 新 機械学習の基準 システムの基準 セキュリティの基準 Precision MAE nDCG Accuracy F-score
RMSE ログ 監視 テスト網羅率 負荷 遅延 コストの基準 ・・・ 切り戻す基準
複数のモデルを比較する time metrics 導入 導入 - このリスクを回避したい - 長期的に比較したい 現
コンバージョン 検索数 新
カナリアリリースとA/Bテストを実施する 現 現:90%アクセス 新:10%アクセス 90% 10% group A CTR 新
group B
素早くモデルを増やす 現 現:50%アクセス 新:45%アクセス v2:5%アクセス 50% 45% v1 v2 v3
モデル開発の 技術的負債を 解消する 新 5%
アンチパターン:機械学習だけ更新する ねこ v1 v2 v3 ・・・ 汎用的に使えるモデル 動物の検索に有効 20代ユーザに有効 同じUI/UX
効果ある?
スケールさせるために基盤と自動化する
まとめ
まとめ • 機械学習の価値を測るためには貢献しようとしているビジネス価値の数値化が必要。 • プロダクトの評価から機械学習を改善する。その逆ではない。 • 機械学習が価値を出しているからこそ研究開発や基盤が必要。その逆ではない。
出版します! • AIエンジニアのための 機械学習システムデザインパターン • 2021年5月17日出版 • https://www.amazon.co.jp/dp/4798169447/