1人1アプリから標準化へ：Vertex AIを活用したMLOps推進 / Shibuya_AI_4

by Visional Engineering ＆ Design

Embed

Start on current slide

Slide 1

Slide 1 text

1人1アプリから標準化へ： Vertex AIを活用したMLOps推進プロダクト本部データプロダクト部 AIプラットフォームグループ内村優太

Slide 2

Slide 2 text

自己紹介 2 内村優太 2021年新卒で通信キャリアに入社 2024年7月からビズリーチで主にAI Platform開発/運用に取り組むランニング、登山、SF小説経歴趣味

Slide 3

Slide 3 text

事業紹介 3 転職市場のデータと社員データをリアルタイムかつ一元的に集積・分析し社内の人材マッチングや採用戦略に活かすことが、最適な人的資本経営につながる私たちが描く未来

Slide 4

Slide 4 text

1. MLOpsについて 2. これまでの開発体制 3. 目指す姿 4. MLOpsプラットフォーム構築 5. まとめアジェンダ 4

Slide 5

Slide 5 text

MLOpsについて

Slide 6

Slide 6 text

MLOpsのHow to, best practiceは既にあるので今回は触れません。改善サイクルを回すことが大切！ MLOps 6 Machine Learning - Model - Data Development - Create - Verify - Package Operation - Release - Conﬁgure - Monitor

Slide 7

Slide 7 text

これまでの開発体制

Slide 8

Slide 8 text

モデルの検証から実装までをスピード感を持って行うことができる体制 - AIの価値を証明し早く世に出すことを目的 - 広い領域に対して探索的に機能を実装 - メンバーはスポット的な形でプロダクト機能開発に入る AI機能開発：0->1フェーズ 8 コラボレーション 

Slide 9

Slide 9 text

コンテナ内部で学習/推論/結果出力を実行 - シンプルなインフラ基盤でアプリに応じて柔軟な処理 - 開発環境で確認した動作をそのままプロダクト環境で再現 - 開発者が慣れ親しんだ方法で開発が可能 1人1機能を開発 9

Slide 10

Slide 10 text

開発・運用する機能の数が増えていく - 運用するアプリ数が増えるのに比例してコンテナ、リポジトリが増加 - メンバーが入れ替わる中で実装者がいないアプリも多くなる AI機能開発：1->10フェーズ 10 開発中のアプリ運用中のアプリ開発メンバーが不在になったアプリ

Slide 11

Slide 11 text

- アプリ側で記述するコード量が多く、理解するのに時間がかかる - 処理がステップに切り分けられていないため、中間生成物の確認ができないバッチコンテナのブラックボックス化 11 似ている処理でも機能ごとに独立して実行各ステップのモニタリングがしづらい

Slide 12

Slide 12 text

出来ていた点 - インフラの共通化 - 継続的トレーニング - 継続的なデリバリ AI機能開発：1->10フェーズのMLOps 12 出来ていなかった点 - 処理のパイプライン化 - モデルの自動評価 - データの質的モニタリング起こったこと - 既存アプリの技術的な負債化 - 品質の管理不足 - 属人化

Slide 13

Slide 13 text

出来ていた点 - インフラの共通化 - 継続的トレーニング - 継続的なデリバリ AI機能開発：1->10フェーズのMLOps 13 出来ていなかった点 - 処理のパイプライン化 - モデルの自動評価 - データの質的モニタリング起こったこと - 既存アプリの技術的な負債化 - 運用コストの増大 - 品質の管理不足改善サイクルを回せない！！

Slide 14

Slide 14 text

目指す姿

Slide 15

Slide 15 text

AI機能開発：10->100フェーズ 15 Raw Data 予測結果 Feature Store Model Registry アプリ固有の実装は最小限に特徴パイプライン学習パイプライン推論パイプライン品質管理複雑な特徴変換の一元化扱う機能が増える中でスケールさせるための土台構築を目指す - 品質管理 - 処理の標準化

Slide 16

Slide 16 text

MLOpsプラットフォーム構築

Slide 17

Slide 17 text

AIプロダクトの開発/運用を横串で改善していく AIプラットフォームチーム誕生 17 Raw Data 予測結果 Feature Store Model Registry 特徴パイプライン学習パイプライン推論パイプラインアプリの固有ロジックに注力共通部分の開発/運用に注力

Slide 18

Slide 18 text

MLワークフローの自動化基盤 - 自動化　　：データ処理・学習・デプロイを一本のパイプラインとして表現 - サーバレス： Google管理のサーバーレス環境（Kubeﬂow等）で実行 - 再現性　　：「いつ・どのデータで・何を作ったか」というリネージを自動で記録・可視化　 Vertex AI Pipelineとは？ 18 ワークフローコンポーネント：ワークフロー内の1処理データセット：実体はGCSに保存モデル：Model Registryに登録されたモデル

Slide 19

Slide 19 text

MLのフローはテンプレートパイプラインとして提供 - 開発者はモデルのロジック部分のみを実装 - それ以外の部分は標準化されたパイプラインにパラメータとして値を渡す処理の標準化：共通テンプレート 19 提供しているテンプレート例

Slide 20

Slide 20 text

モデルに関連した情報の一括管理 - モデルのバージョニング - image+model ﬁleの組み合わせ - モデルの評価管理品質管理：モデルレジストリの利用 20

Slide 21

Slide 21 text

まとめ

Slide 22

Slide 22 text

As Isで出ていた課題と解決 22 属人化処理の重複モニタリング品質管理標準化パイプラインテンプレートモデルレジストリプラットフォームチーム課題 ToBe やったことリネージ

Slide 23

Slide 23 text

今はMLOpsを進めるプラットフォームができた状態改善サイクルを回すことが大切！ MLOpsの今後 23 Machine Learning - Model - Data Development - Create - Verify - Package Operation - Release - Conﬁgure - Monitor 既存アプリのVertex AI移行 ML運用のさらなる自動化/高度化取得可能になったメトリクスの利用

Slide 24

Slide 24 text

No content

Slide 25

Slide 25 text

Appendix

Slide 26

Slide 26 text

アプリ間での統一性がなく属人化が加速 - アプリごとに異なる実装/インターフェース - コンテナ内の処理がブラックボックス化属人化 26 各機能、実装を深く知っているのは 1人だけという状況に

Slide 27

Slide 27 text

実装の速さと各アプリごとの独立性を重視して1アプリ1リポジトリで開発 - 実装の独立性を担保 - アプリごとに高速に検証/開発を回せる 1機能1リポジトリ 27 アプリA/リポジトリアプリB/リポジトリ

Slide 28

Slide 28 text

処理の標準化：アプリの開発フロー 28 ロジック実装 - コアとなるロジックのみ実装 - 学習は前処理後のデータがinput - 推論時のIFはAPI テンプレートの利用 - 既存のテンプレートを利用 - 共通処理はパラメータのみ最終パイプライン実装 - モデル固有の処理コンポーネントを作成 - 推論結果の連携先への保存など

Slide 29

Slide 29 text

モデルのロジック以外の部分の処理はコンポーネント化 - データ取得 - モデル評価 - モデル登録処理の標準化：共通コンポーネント　 29