Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOpsはDevOpsと何が違うの?
Search
shibuiwilliam
July 21, 2022
Technology
1
360
MLOpsはDevOpsと何が違うの?
Developers Summit 2022 Summer(デブサミ2022夏)の登壇資料です。
shibuiwilliam
July 21, 2022
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
LLM時代の検索
shibuiwilliam
2
730
生成AIを作るエンジニアリングと使うエンジニアリング
shibuiwilliam
2
69
AI Agentのキャッシュ、再利用、Ops
shibuiwilliam
2
110
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
5
610
LLMで推論するライブラリを整理する
shibuiwilliam
6
1.6k
生成AIの研究開発を事業につなげる データ、仕組み、コミュニケーション
shibuiwilliam
2
110
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
3
740
今日からRAGを 始めることを考える
shibuiwilliam
3
1.7k
2024年生成AI新年会登壇資料
shibuiwilliam
1
370
Other Decks in Technology
See All in Technology
Frontier Airlines Customer®️ USA Contact Numbers: Complete 2025 Support Guide
frontierairlineswithflyagent
0
100
エンジニアリングマネージャー“お悩み相談”パネルセッション
ar_tama
1
140
AIエージェントが書くのなら直接CloudFormationを書かせればいいじゃないですか何故AWS CDKを使う必要があるのさ
watany
19
7.7k
Talk to Someone At Delta Airlines™️ USA Contact Numbers
travelcarecenter
0
160
「現場で活躍するAIエージェント」を実現するチームと開発プロセス
tkikuchi1002
4
580
Semantic Machine Intelligence for Vision, Language, and Actions
keio_smilab
PRO
2
260
P2P通信の標準化 WebRTCを知ろう
faithandbrave
3
1.3k
サイバーエージェントグループのSRE10年の歩みとAI時代の生存戦略
shotatsuge
4
1.1k
60以上のプロダクトを持つ組織における開発者体験向上への取り組み - チームAPIとBackstageで構築する組織の可視化基盤 - / sre next 2025 Efforts to Improve Developer Experience in an Organization with Over 60 Products
vtryo
3
2k
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
18k
三視点LLMによる複数観点レビュー
mhlyc
0
240
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
820
Featured
See All Featured
Statistics for Hackers
jakevdp
799
220k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
30
2.2k
How to Ace a Technical Interview
jacobian
278
23k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.7k
GraphQLとの向き合い方2022年版
quramy
49
14k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
BBQ
matthewcrist
89
9.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
750
Transcript
MLOpsはDevOpsと何が違うの? 澁井 雄介 shibui yusuke
自己紹介 shibui yusuke ▶ Launchable Inc. ソフトウェアエンジニア ▶ MLOpsコミュニティ運営 ▶
もともとクラウド基盤の開発、運用。 ▶ ここ6年くらいMLOpsで仕事。 ▶ Github: @shibuiwilliam ▶ 最近やってること: 本を書いてます cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知
本日の流れ ▶ DevOps and MLOps ▶ DevOps for ML
DevOps and MLOps
DevOps
MLOpsとは ▶ DevOps for ML or ML operations ▶ 機械学習という確率的、データ依存、発展途上、便利な技術を
DevOpsに組み込む ▶ いわゆる機械学習基盤や機械学習パイプラインだけでなく、要件定義、インフ ラ、データ管理、サービング、コスト、品質、組織論まで含む 広範な概念に成長中
DevOps for ML??? M L ML ML M L ML
M L ML M L 雑にMLを入れればMLOpsになるわけではない。 ML
DevOps for ML
機械学習を使ったプロダクト例 画像処理 写真を撮る タイトル入力 説明入力 登録する 自然言語処理 違反検知 登録情報から違反を フィルタリング
入力情報から 入力補助 超解像による 画質改善 ねこ 検索 ランク学習による 並べ替え あるコンテンツ登録アプリ 画像分類と 検索
違反検知を例に考える 写真を撮る タイトル入力 説明入力 登録する 違反検知 登録情報から違反を フィルタリング ねこ あるコンテンツ登録アプリ
違反とは 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 公序良俗に反する画像 著作権違反の画像 グロテスクな画像
サービスに則さない画像 ・・・を違反として排除したい
開発の前にデータ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 機械学習には大量のデータが必要 •
集める • 意味付ける • 管理する 正常 違反 集める 意味付ける 管理する
実験して性能を評価する 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 実験を繰り返して性能を評価する。 必要に応じてDataやPlanに戻る。
ここでGPUや分散処理→コスト増大。 正常 違反 性能が低い データが足りない 遅い 実験 戻る
実験的なコード:頻繁に書き直す、 途中から実行、使い捨て 本番コード: 動かし続ける、再現性、 デバッグ 実験的なコードを清書する 写真を撮る タイトル入力 説明入力 登録する
ねこ あるコンテンツ登録アプリ 正常 違反 実験 DATA 動かし方がわからない・・・
しかしそれは始まりでしかなかった・・・ リリース・・・ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 正常 違反
実験 DATA
偽陽性と偽陰性 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 偽陽性:違反なのに正常と判定
偽陰性:正常なのに違反と判定 データの品質や網羅性が足りないと、 偽陽性や偽陰性が高くなる 正常なのに 違反と判定された 投稿者は不快 閲覧者は不快 違反なのに 正常扱い
ヒューマンインザループ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 自動化が進んだ仕組みにおいて、
一部の判断に人間を介在させること。 機械学習の誤りを正すためには人間の ダブルチェックが必要。 正常 違反 違反と間違えや すい正常 正常と間違えや すい違反 人間
正常 違反 推測するな計測せよ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験
DATA 機械学習の判定と実用上の価値を評価する。 評価に応じて次のActionを決める。 人間 評価 正答率: xx Precision: yy Recall: zz 違反画像閲覧数: aa クレーム数: bb コスト: cc Go: 改善Plan No Go: 停止措置
DevOps for ML 実験 DATA 人間 評価
▶ AIエンジニアのための 機械学習システムデザインパターン ▶ 2021年5月17日出版 ▶ https://www.amazon.co.jp/dp/4798169447/ ▶ 続編執筆中! ▶
2022年11月発売予定!? ▶ 機械学習で需要予測、違反検知、検索を実 現するシステムの作り方を解説 出版しました! ?
参考資料 ▶ MLOps: Continuous delivery and automation pipelines in machine
learning https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning ▶ Introduction to MLOps https://speakerdeck.com/asei/introduction-to-mlops ▶ Machine Learning Operations (MLOps): Overview, Definition, and Architecture https://arxiv.org/abs/2205.02302 ▶ People + AI Research https://pair.withgoogle.com/ ▶ Awesome MLOps https://github.com/visenger/awesome-mlops ▶ AIシステムが成熟する今「 MLOps」が必要とされる理由とは? MLOpsを推進するために大切なこと https://codezine.jp/article/detail/15953
Thank you!