Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOps のはじめかた
Search
Asei Sugiyama
April 12, 2023
Technology
2
2k
MLOps のはじめかた
第30回 MLOps 勉強会の発表資料です。Money Forward でのこれまでの取り組みについて、振り返った内容を共有します。
Asei Sugiyama
April 12, 2023
Tweet
Share
More Decks by Asei Sugiyama
See All by Asei Sugiyama
MLOps の現場から
asei
8
750
LLMOps: Eval-Centric を前提としたMLOps
asei
7
530
The Rise of LLMOps
asei
13
2.8k
生成AIの活用パターンと継続的評価
asei
15
2.3k
最近の Citadel AI の取り組みのご紹介 (Nov, 2024)
asei
2
93
仕事で取り組む 生成 AI 時代の対話の品質評価
asei
2
70
MLOps の処方箋ができるまで
asei
3
580
LLM を現場で評価する
asei
5
960
生成 AI の評価方法
asei
8
2.2k
Other Decks in Technology
See All in Technology
Formal Development of Operating Systems in Rust
riru
1
380
機械学習を「社会実装」するということ 2025年版 / Social Implementation of Machine Learning 2025 Version
moepy_stats
3
120
The key to VCP-VCF
mirie_sd
0
160
MasterMemory v3 最速確認会
yucchiy
0
300
【令和最新版】ロボットシミュレータ Genesis x ROS 2で始める快適AIロボット開発
hakuturu583
2
1.4k
.NET AspireでAzure Functionsやクラウドリソースを統合する
tsubakimoto_s
0
140
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
180
#TRG24 / David Cuartielles / Post Open Source
tarugoconf
0
420
ZOZOTOWN の推薦における KPI モニタリング/KPI monitoring for ZOZOTOWN recommendations
rayuron
1
890
AI×医用画像の現状と可能性_2024年版/AI×medical_imaging_in_japan_2024
tdys13
0
1.2k
AWSの生成AIサービス Amazon Bedrock入門!(2025年1月版)
minorun365
PRO
7
370
Opcodeを読んでいたら何故かphp-srcを読んでいた話
murashotaro
0
370
Featured
See All Featured
It's Worth the Effort
3n
183
28k
Agile that works and the tools we love
rasmusluckow
328
21k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.4k
How STYLIGHT went responsive
nonsquared
96
5.3k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
GitHub's CSS Performance
jonrohan
1030
460k
Making Projects Easy
brettharned
116
6k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Bash Introduction
62gerente
609
210k
Transcript
MLOps のはじめかた Asei Sugiyama
自己紹介 杉山 阿聖 (@K_Ryuichirou) Software Engineer @ Citadel AI Advisor
@ Money Forward Google Cloud Innovators Champion @ Cloud AI/ML MLSE 機械学習オペレーション WG 機械学習図鑑 共著
背景 機械学習は未だ日進月歩 Foundation Model 登場以降の動きは凄まじい さまざまな機械学習の運用に関する事例も出てきている 一方、これから始める組織も数多くある その場合、出てくる事例は最初に参考とするには難しすぎる
最近の例 NTT Docomo 分析用基盤に papermil & Airflow スケーラビリティを Kubernetes で確保
費用と運用負荷から考えて はじめた直後にはオススメ できない たった3人で運用するドコモを支える機械学習基盤の作り方 ー Kubernates × Airflow × DataRobot を使ったMLOpsパイプライン ー - ENGINEERING BLOG ドコモ開発者ブログ https://nttdocomo-developers.jp/entry/202212191200_2
主旨 機械学習を運用し始めるための技術的な取り組みについて、Money Forward でのこれまでの活動を振り返りつつ共有します
まとめ Money Forward のこれまでの MLOps に関する取り組みを振り返り re:Invent で発表した Inferentia に取り組みへ至るまでには複数の取り組
みがあった 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い 自分たちのスキルセットとマッチする技術を選ぶことは大事
TOC これまでの歩み <- はじめての機械学習パイプラインの構築 これまでのふりかえり
これまでの歩み 次の3つが大きなイベント AI 推進部設立 Step Functions による機械学習パイプライン構築 AWS Inferentia を用いた推論API開発
AI 推進部設立 2名からスタート 担当者の Note 記事 採用がすごい速度で進 んでいった AI推進部って何だ?|Tatsuya Kono|note
https://note.com/tatsuyakono/n/n305d8d614f16
Step Functions による機械学習 パイプライン構築 AWS Step Functions で機械学習 パイプラインを構築 当時の新機能を用いて、カナリ
アリリースを実装 StepFunctionsを使ってSageMakerエンドポイントのデプロイを実行する - Money Forward Developers Blog https://moneyforward- dev.jp/entry/2021/11/16/stepfunctions-sagemaker-endpoint-deploy/
AWS Inferentia を用いた推論 API開発 チャットボット用機械学習 基盤の新基盤への移行 ユーザーに学習、推論の機 能を開放 短期間 (2ヶ月)
で実施 AWS re:Invent 2022 - How four customers reduced ML inference costs and drove innovation (CMP226) - YouTube https://youtu.be/dVlNobmvoTg? t=1073
Money Forward Techbook #5 Inferentia を含めたさまざまな推 論環境でのベンチマークが記さ れている Money Forward
Techbook #5:まねふぉ執筆部 https://techbookfest.org/product/6NXreHXRLLWVPx9g4DRTsZ? productVariantID=pWr6n1KxikP4g9YC2uqTyj
これまでの歩みを振り返って 最初は「MLOpsってなんですか?」から始まっていた DevOps との違いは? ML 特有な問題は? HiTTO では超短期間で高負荷に耐えるサービス基盤を作成しているが、 それまでの経験の上に成り立っている
次のポイントを移行で重点的にふりかえり 初期のチームビルディングでどのような議論をしたか? どのように技術選定を行ったのか?
TOC これまでの歩み はじめての機械学習パイプラインの構築 <- これまでのふりかえり
はじめての機械学習パイプラインの構築 勉強会 読書会 機械学習パイプラインの構築
勉強会 MLOpsや機械学習の一般論について情報提供 テーマを決めて1時間で実施 月1ペースで実施
None
読書会 MLOps に関する書籍を用いて週1ペースで読書会 i. Introducing MLOps ii. 入門 機械学習パイプライン 該当箇所の内容の確認と、業務適用についての議論
Introducing MLOps MLOps に関連する概念を実装に 依存しないように述べた書籍 広く MLOps について調べたい ときには良い 実際に自分たちの現場に適用し
ようとすると迷う Introducing MLOps https://www.oreilly.com/library/view/introducing- mlops/9781492083283/
入門 機械学習パイプライン TFX (TensorFlow Extended) に 基づいて機械学習パイプライン の実装方法について述べた書籍 具体的な実装方法について述べ ているので業務をイメージしや
すい TensorFlow や Google Cloud を 前提としているので癖は強い 入門 機械学習パイプライン https://www.oreilly.co.jp/books/9784873119519/
読書会での議論内容 (1/2) 本当にこれやる? モデルの精度評価に基づくデプロイって必要? Fairness とか今やる? 本当にこれ使う? TFX 使う? Kubeflow
Pipelines 使う? TF Serving 使う?
読書会での議論内容 (2/2) 自分たちのスキルセットと照らし合わせたときに、それらのプラクティ スや技術を採用すべきか議論 大概の場合は「最初はスキップしたほうがいい」「やめたほうが良い」 と答えた
機械学習パイプラインの構築 AWS Step Functions による構築 AWS のサービスの中でもっとも ミニマムに構築できるサービス だった アップデートがあり、AWS
のほ ぼすべての機能を使えるように なった StepFunctionsを使ってSageMakerエンドポイントのデプロイを実行する - Money Forward Developers Blog https://moneyforward- dev.jp/entry/2021/11/16/stepfunctions-sagemaker-endpoint-deploy/
TOC これまでの歩み はじめての機械学習パイプラインの構築 これまでのふりかえり <-
これまでのふりかえり 技術選定に際しての考慮事項 構築したあとで直面した課題 もしもう一度始めるならば
技術選定に際しての考慮事項 自分たちのスキルセットとマッチする技術を選ぶことは大事 MLOps だからという理由で新しい技術に手を出すと痛い目を見る 困難に直面した際に頼れる先があることは大事 サポート コミュニティ
構築したあとで直面した課題 (1/2) ML 特有の事情で困ったこと 結構 ML 特有の事情で困るので、それ以外の箇所で困らないようにして おくのが理想 HW の制約上、典型的なサーバレス用サービスを活用できない
(Fargate ではなく EC2 が必要) 自然言語処理で想定していなかった入力が与えられ緊急対応
構築したあとで直面した課題 (2/2) ステークホルダーが多様になる点は注意が必要 データの利用についての価値観の差異 セキュリティを保ちたいチーム データを利用したいチーム きれいなワークフローを構築してからリリースしたいものの、最初のリ リースではさまざまな事情で難しい 事前の期待とマッチしない場合の対応も大変 (思っていたほど使われな
い、思っていた精度が出ない、など)
もしもう一度始めるならば 最初のリリースはミニマムに始められるよう注力する 想定外のことや未知の課題に直面することが不可避 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い
まとめ Money Forward のこれまでの MLOps に関する取り組みを振り返り re:Invent で発表した Inferentia に取り組みへ至るまでには複数の取り組
みがあった 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い 自分たちのスキルセットとマッチする技術を選ぶことは大事