Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOpsはDevOpsと何が違うの?
Search
shibuiwilliam
July 21, 2022
Technology
0
290
MLOpsはDevOpsと何が違うの?
Developers Summit 2022 Summer(デブサミ2022夏)の登壇資料です。
shibuiwilliam
July 21, 2022
Tweet
Share
More Decks by shibuiwilliam
See All by shibuiwilliam
生成AIのためのデータ収集とデータエンジニアリング
shibuiwilliam
4
460
LLMで推論するライブラリを整理する
shibuiwilliam
5
1.3k
生成AIの研究開発を事業につなげる データ、仕組み、コミュニケーション
shibuiwilliam
1
81
デプロイして本番システムで使うことから考えるAI
shibuiwilliam
2
630
今日からRAGを 始めることを考える
shibuiwilliam
2
1.6k
2024年生成AI新年会登壇資料
shibuiwilliam
0
330
Creative as Software Engineering
shibuiwilliam
2
640
Kubernetesクラスターを引き継ぐ技術
shibuiwilliam
3
340
機械学習システム構築実践ガイド
shibuiwilliam
1
920
Other Decks in Technology
See All in Technology
偏光画像処理ライブラリを作った話
elerac
1
180
大規模アジャイルフレームワークから学ぶエンジニアマネジメントの本質
staka121
PRO
3
1.3k
リクルートのエンジニア組織を下支えする 新卒の育成の仕組み
recruitengineers
PRO
1
120
わたしがEMとして入社した「最初の100日」の過ごし方 / EMConfJp2025
daiksy
14
5.2k
Oracle Database Technology Night #87-1 : Exadata Database Service on Exascale Infrastructure(ExaDB-XS)サービス詳細
oracle4engineer
PRO
1
190
MIMEと文字コードの闇
hirachan
2
1.4k
AIエージェント元年@日本生成AIユーザ会
shukob
1
230
OSS構成管理ツールCMDBuildを使ったAWSリソース管理の自動化
satorufunai
0
650
OPENLOGI Company Profile
hr01
0
60k
DeepSeekとは?何がいいの? - Databricksと学ぶDeepSeek! 〜これからのLLMに備えよ!〜
taka_aki
1
110
Snowflake ML モデルを dbt データパイプラインに組み込む
estie
0
110
エンジニアリング価値を黒字化する バリューベース戦略を用いた 技術戦略策定の道のり
kzkmaeda
7
3k
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
A Philosophy of Restraint
colly
203
16k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Designing Experiences People Love
moore
140
23k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.1k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
650
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Optimizing for Happiness
mojombo
376
70k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
46
2.3k
Transcript
MLOpsはDevOpsと何が違うの? 澁井 雄介 shibui yusuke
自己紹介 shibui yusuke ▶ Launchable Inc. ソフトウェアエンジニア ▶ MLOpsコミュニティ運営 ▶
もともとクラウド基盤の開発、運用。 ▶ ここ6年くらいMLOpsで仕事。 ▶ Github: @shibuiwilliam ▶ 最近やってること: 本を書いてます cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知
本日の流れ ▶ DevOps and MLOps ▶ DevOps for ML
DevOps and MLOps
DevOps
MLOpsとは ▶ DevOps for ML or ML operations ▶ 機械学習という確率的、データ依存、発展途上、便利な技術を
DevOpsに組み込む ▶ いわゆる機械学習基盤や機械学習パイプラインだけでなく、要件定義、インフ ラ、データ管理、サービング、コスト、品質、組織論まで含む 広範な概念に成長中
DevOps for ML??? M L ML ML M L ML
M L ML M L 雑にMLを入れればMLOpsになるわけではない。 ML
DevOps for ML
機械学習を使ったプロダクト例 画像処理 写真を撮る タイトル入力 説明入力 登録する 自然言語処理 違反検知 登録情報から違反を フィルタリング
入力情報から 入力補助 超解像による 画質改善 ねこ 検索 ランク学習による 並べ替え あるコンテンツ登録アプリ 画像分類と 検索
違反検知を例に考える 写真を撮る タイトル入力 説明入力 登録する 違反検知 登録情報から違反を フィルタリング ねこ あるコンテンツ登録アプリ
違反とは 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 公序良俗に反する画像 著作権違反の画像 グロテスクな画像
サービスに則さない画像 ・・・を違反として排除したい
開発の前にデータ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 機械学習には大量のデータが必要 •
集める • 意味付ける • 管理する 正常 違反 集める 意味付ける 管理する
実験して性能を評価する 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ DATA 実験を繰り返して性能を評価する。 必要に応じてDataやPlanに戻る。
ここでGPUや分散処理→コスト増大。 正常 違反 性能が低い データが足りない 遅い 実験 戻る
実験的なコード:頻繁に書き直す、 途中から実行、使い捨て 本番コード: 動かし続ける、再現性、 デバッグ 実験的なコードを清書する 写真を撮る タイトル入力 説明入力 登録する
ねこ あるコンテンツ登録アプリ 正常 違反 実験 DATA 動かし方がわからない・・・
しかしそれは始まりでしかなかった・・・ リリース・・・ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 正常 違反
実験 DATA
偽陽性と偽陰性 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 偽陽性:違反なのに正常と判定
偽陰性:正常なのに違反と判定 データの品質や網羅性が足りないと、 偽陽性や偽陰性が高くなる 正常なのに 違反と判定された 投稿者は不快 閲覧者は不快 違反なのに 正常扱い
ヒューマンインザループ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験 DATA 自動化が進んだ仕組みにおいて、
一部の判断に人間を介在させること。 機械学習の誤りを正すためには人間の ダブルチェックが必要。 正常 違反 違反と間違えや すい正常 正常と間違えや すい違反 人間
正常 違反 推測するな計測せよ 写真を撮る タイトル入力 説明入力 登録する ねこ あるコンテンツ登録アプリ 実験
DATA 機械学習の判定と実用上の価値を評価する。 評価に応じて次のActionを決める。 人間 評価 正答率: xx Precision: yy Recall: zz 違反画像閲覧数: aa クレーム数: bb コスト: cc Go: 改善Plan No Go: 停止措置
DevOps for ML 実験 DATA 人間 評価
▶ AIエンジニアのための 機械学習システムデザインパターン ▶ 2021年5月17日出版 ▶ https://www.amazon.co.jp/dp/4798169447/ ▶ 続編執筆中! ▶
2022年11月発売予定!? ▶ 機械学習で需要予測、違反検知、検索を実 現するシステムの作り方を解説 出版しました! ?
参考資料 ▶ MLOps: Continuous delivery and automation pipelines in machine
learning https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning ▶ Introduction to MLOps https://speakerdeck.com/asei/introduction-to-mlops ▶ Machine Learning Operations (MLOps): Overview, Definition, and Architecture https://arxiv.org/abs/2205.02302 ▶ People + AI Research https://pair.withgoogle.com/ ▶ Awesome MLOps https://github.com/visenger/awesome-mlops ▶ AIシステムが成熟する今「 MLOps」が必要とされる理由とは? MLOpsを推進するために大切なこと https://codezine.jp/article/detail/15953
Thank you!