$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MLOps のはじめかた
Search
Asei Sugiyama
April 12, 2023
Technology
2
2.2k
MLOps のはじめかた
第30回 MLOps 勉強会の発表資料です。Money Forward でのこれまでの取り組みについて、振り返った内容を共有します。
Asei Sugiyama
April 12, 2023
Tweet
Share
More Decks by Asei Sugiyama
See All by Asei Sugiyama
AI エージェント活用のベストプラクティスと今後の課題
asei
2
510
エージェントの継続的改善のためのメトリクス再考
asei
3
730
生成AI活用のベストプラクティス集を作ってる件
asei
1
850
GenAIOps: 生成AI時代の DevOps
asei
0
58
生成AI活用の実践解説 (速報版)
asei
1
1.6k
実践AIガバナンス
asei
3
990
Eval-Centric AI: Agent 開発におけるベストプラクティスの探求
asei
1
360
AI工学特論: MLOps・継続的評価
asei
11
3k
生成AIを用いるサービス開発の原則
asei
1
89
Other Decks in Technology
See All in Technology
20251209_WAKECareer_生成AIを活用した設計・開発プロセス
syobochim
7
1.5k
プロンプトやエージェントを自動的に作る方法
shibuiwilliam
5
4.1k
Fashion×AI「似合う」を届けるためのWEARのAI戦略
zozotech
PRO
2
400
ガバメントクラウド利用システムのライフサイクルについて
techniczna
0
190
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
330
.NET 10の概要
tomokusaba
0
100
品質のための共通認識
kakehashi
PRO
3
260
ログ管理の新たな可能性?CloudWatchの新機能をご紹介
ikumi_ono
1
700
生成AI活用の型ハンズオン〜顧客課題起点で設計する7つのステップ
yushin_n
0
150
評価駆動開発で不確実性を制御する - MLflow 3が支えるエージェント開発
databricksjapan
1
170
re:Invent2025 コンテナ系アップデート振り返り(+CloudWatchログのアップデート紹介)
masukawa
0
360
会社紹介資料 / Sansan Company Profile
sansan33
PRO
11
390k
Featured
See All Featured
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Agile that works and the tools we love
rasmusluckow
331
21k
A better future with KSS
kneath
240
18k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Code Reviewing Like a Champion
maltzj
527
40k
Producing Creativity
orderedlist
PRO
348
40k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
For a Future-Friendly Web
brad_frost
180
10k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.4k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Into the Great Unknown - MozCon
thekraken
40
2.2k
Transcript
MLOps のはじめかた Asei Sugiyama
自己紹介 杉山 阿聖 (@K_Ryuichirou) Software Engineer @ Citadel AI Advisor
@ Money Forward Google Cloud Innovators Champion @ Cloud AI/ML MLSE 機械学習オペレーション WG 機械学習図鑑 共著
背景 機械学習は未だ日進月歩 Foundation Model 登場以降の動きは凄まじい さまざまな機械学習の運用に関する事例も出てきている 一方、これから始める組織も数多くある その場合、出てくる事例は最初に参考とするには難しすぎる
最近の例 NTT Docomo 分析用基盤に papermil & Airflow スケーラビリティを Kubernetes で確保
費用と運用負荷から考えて はじめた直後にはオススメ できない たった3人で運用するドコモを支える機械学習基盤の作り方 ー Kubernates × Airflow × DataRobot を使ったMLOpsパイプライン ー - ENGINEERING BLOG ドコモ開発者ブログ https://nttdocomo-developers.jp/entry/202212191200_2
主旨 機械学習を運用し始めるための技術的な取り組みについて、Money Forward でのこれまでの活動を振り返りつつ共有します
まとめ Money Forward のこれまでの MLOps に関する取り組みを振り返り re:Invent で発表した Inferentia に取り組みへ至るまでには複数の取り組
みがあった 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い 自分たちのスキルセットとマッチする技術を選ぶことは大事
TOC これまでの歩み <- はじめての機械学習パイプラインの構築 これまでのふりかえり
これまでの歩み 次の3つが大きなイベント AI 推進部設立 Step Functions による機械学習パイプライン構築 AWS Inferentia を用いた推論API開発
AI 推進部設立 2名からスタート 担当者の Note 記事 採用がすごい速度で進 んでいった AI推進部って何だ?|Tatsuya Kono|note
https://note.com/tatsuyakono/n/n305d8d614f16
Step Functions による機械学習 パイプライン構築 AWS Step Functions で機械学習 パイプラインを構築 当時の新機能を用いて、カナリ
アリリースを実装 StepFunctionsを使ってSageMakerエンドポイントのデプロイを実行する - Money Forward Developers Blog https://moneyforward- dev.jp/entry/2021/11/16/stepfunctions-sagemaker-endpoint-deploy/
AWS Inferentia を用いた推論 API開発 チャットボット用機械学習 基盤の新基盤への移行 ユーザーに学習、推論の機 能を開放 短期間 (2ヶ月)
で実施 AWS re:Invent 2022 - How four customers reduced ML inference costs and drove innovation (CMP226) - YouTube https://youtu.be/dVlNobmvoTg? t=1073
Money Forward Techbook #5 Inferentia を含めたさまざまな推 論環境でのベンチマークが記さ れている Money Forward
Techbook #5:まねふぉ執筆部 https://techbookfest.org/product/6NXreHXRLLWVPx9g4DRTsZ? productVariantID=pWr6n1KxikP4g9YC2uqTyj
これまでの歩みを振り返って 最初は「MLOpsってなんですか?」から始まっていた DevOps との違いは? ML 特有な問題は? HiTTO では超短期間で高負荷に耐えるサービス基盤を作成しているが、 それまでの経験の上に成り立っている
次のポイントを移行で重点的にふりかえり 初期のチームビルディングでどのような議論をしたか? どのように技術選定を行ったのか?
TOC これまでの歩み はじめての機械学習パイプラインの構築 <- これまでのふりかえり
はじめての機械学習パイプラインの構築 勉強会 読書会 機械学習パイプラインの構築
勉強会 MLOpsや機械学習の一般論について情報提供 テーマを決めて1時間で実施 月1ペースで実施
None
読書会 MLOps に関する書籍を用いて週1ペースで読書会 i. Introducing MLOps ii. 入門 機械学習パイプライン 該当箇所の内容の確認と、業務適用についての議論
Introducing MLOps MLOps に関連する概念を実装に 依存しないように述べた書籍 広く MLOps について調べたい ときには良い 実際に自分たちの現場に適用し
ようとすると迷う Introducing MLOps https://www.oreilly.com/library/view/introducing- mlops/9781492083283/
入門 機械学習パイプライン TFX (TensorFlow Extended) に 基づいて機械学習パイプライン の実装方法について述べた書籍 具体的な実装方法について述べ ているので業務をイメージしや
すい TensorFlow や Google Cloud を 前提としているので癖は強い 入門 機械学習パイプライン https://www.oreilly.co.jp/books/9784873119519/
読書会での議論内容 (1/2) 本当にこれやる? モデルの精度評価に基づくデプロイって必要? Fairness とか今やる? 本当にこれ使う? TFX 使う? Kubeflow
Pipelines 使う? TF Serving 使う?
読書会での議論内容 (2/2) 自分たちのスキルセットと照らし合わせたときに、それらのプラクティ スや技術を採用すべきか議論 大概の場合は「最初はスキップしたほうがいい」「やめたほうが良い」 と答えた
機械学習パイプラインの構築 AWS Step Functions による構築 AWS のサービスの中でもっとも ミニマムに構築できるサービス だった アップデートがあり、AWS
のほ ぼすべての機能を使えるように なった StepFunctionsを使ってSageMakerエンドポイントのデプロイを実行する - Money Forward Developers Blog https://moneyforward- dev.jp/entry/2021/11/16/stepfunctions-sagemaker-endpoint-deploy/
TOC これまでの歩み はじめての機械学習パイプラインの構築 これまでのふりかえり <-
これまでのふりかえり 技術選定に際しての考慮事項 構築したあとで直面した課題 もしもう一度始めるならば
技術選定に際しての考慮事項 自分たちのスキルセットとマッチする技術を選ぶことは大事 MLOps だからという理由で新しい技術に手を出すと痛い目を見る 困難に直面した際に頼れる先があることは大事 サポート コミュニティ
構築したあとで直面した課題 (1/2) ML 特有の事情で困ったこと 結構 ML 特有の事情で困るので、それ以外の箇所で困らないようにして おくのが理想 HW の制約上、典型的なサーバレス用サービスを活用できない
(Fargate ではなく EC2 が必要) 自然言語処理で想定していなかった入力が与えられ緊急対応
構築したあとで直面した課題 (2/2) ステークホルダーが多様になる点は注意が必要 データの利用についての価値観の差異 セキュリティを保ちたいチーム データを利用したいチーム きれいなワークフローを構築してからリリースしたいものの、最初のリ リースではさまざまな事情で難しい 事前の期待とマッチしない場合の対応も大変 (思っていたほど使われな
い、思っていた精度が出ない、など)
もしもう一度始めるならば 最初のリリースはミニマムに始められるよう注力する 想定外のことや未知の課題に直面することが不可避 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い
まとめ Money Forward のこれまでの MLOps に関する取り組みを振り返り re:Invent で発表した Inferentia に取り組みへ至るまでには複数の取り組
みがあった 堅牢なものを時間をかけて目指すのではなく、小さくはじめて少しずつ ステップアップするほうが良い 自分たちのスキルセットとマッチする技術を選ぶことは大事