Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Databricks における 『MLOps』

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

Databricks における 『MLOps』

MLOpsをDatabricks上でどう実現するかについて、網羅的に説明します。

Avatar for Databricks Japan

Databricks Japan

April 17, 2024
Tweet

More Decks by Databricks Japan

Other Decks in Technology

Transcript

  1. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    DatabricksにおけるMLOps • [Blog] Simplifying Production MLOps with Lakehouse AI • [eBook] Big Book of MLOps 2
  2. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    3 アジェンダ • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  3. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    4 DatabricksにおけるMLOps • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  4. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    MLOpsとは、MLシステムのパフォーマンス、安定性、長期的な効率性を改善するための MLOpsとは? 5 データ、コード、モデルの管理に対する 一連のプロセスと自動化処理です MLOps = DataOps + DevOps + ModelOps
  5. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    6 データインテリジェンスプラットフォーム ModelOps DataOps DevOps データ中心のMLプラットフォーム
  6. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    7 データインテリジェンスプラットフォーム ModelOps DataOps DevOps データ中心のMLプラットフォーム Unity Catalog Workflows Model Serving Lakehouse Monitoring
  7. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    なぜMLOpsに注意が必要なのか? MLOpsはあなたのリスクの軽減に役立ちます 8 • 技術的なリスク - 精度の低いモデル、壊れやすいインフラ • コンプライアンスのリスク - 規制や企業ポリシーの違反 MLOpsは自動化を通じて長期的な効率性を改善します • モデルのプロダクションへのデリバリーを整流化 • プロダクションでエラーが発生する前に捕捉 • 遅くて手動のプロセスを回避
  8. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    9 人とプロセス → データパイプラインを構築 → ビジネス問題を翻訳。モデルのトレーニングと  チューニング → プロダクションにMLモデルをデプロイ → データガバナンスとコンプライアンスに責任を持つ → MLソリューションのビジネス価値に責任を持つ
  9. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    10 人とプロセス データ準備 探索的データ分 析 特徴量エンジニ アリング モデル トレーニング モデル評価 デプロイメント モニタリング
  10. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    ガイドの原則 常にビジネスゴールを念頭に 11 モジュール化してMLOpsを実装 プロセスは自動化をガイドすべき 機械学習に対するデータ中心アプローチを採用
  11. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    MLワークフローのアセット: dev、staging、prodのセマンティクス 12 アセットはそれぞれのフェーズで:
  12. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    Dev vs. staging vs. prod 14 信頼性、品質、テストのレ ベル: アクセスのオープン性: Low High Open Locked-down
  13. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    多くの場合、モデルとコードのライフサイクルは非同期的になります • 週次の不正検知モデル • モデルの更新。コードの変更なし。 • コンピュータビジョンモデル、大規模言語モデルのファインチューン • モデルの更新なし。コードの変更。 モデル vs. コードのライフサイクル 15
  14. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    19 コードデプロイのプロセス dev staging prod トレーニングコードの開発 補助的なコードの開発 → コードをプロモート ✔ データのサブセットでモデルトレーニングコードをテスト ✔ 補助的なコードのテスト → コードをプロモート ✔ プロダクションデータでモデルをトレーニング ✔ モデルをテスト → モデルをデプロイ → 補助的なコードをデプロイ
  15. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    21 DatabricksにおけるMLOps • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  16. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    22 Unity Catalog データとAIアセットに対する単一のガバナンスソリューション: ◦ 中央管理のアクセス制御 ◦ 監査 ◦ リネージ ◦ 検索 データとAIに対する統合ガバナンス MLOps - What’s new? ボリューム (生データ) Delta テーブル 特徴量 モデル 推論 テーブル メトリック テーブル
  17. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    23 Unity Catalog Unity Catalogでの特徴量エンジニアリングによって: • 主キー(およびタイムスタンプキー)が割り当てられたUnity CatalogのすべてのDelta テーブルを、モデルのトレーニングとサービングのためのソースとして利用可能 • 特徴量テーブルはワークスペース横断で容易に共有でき、レイクハウスの他のアセットとのリネー ジが記録される Unity Catalogでの特徴量エンジニアリング MLOps - What’s new? ボリューム (生データ) Delta テーブル 特徴量 モデル 推論 テーブル メトリック テーブル
  18. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    24 Unity Catalog Unity Catalogでのモデル管理によって • Unity Catalogですべてのモデルライフサイクルを管理可能 • Databricksワークスペース横断でモデルを共有可能 • データとモデルの両方に対するリネージを追跡可能 Unity Catalogでのモデル管理 MLOps - What’s new? ボリューム (生データ) Delta テーブル 特徴量 モデル 推論 テーブル メトリック テーブル
  19. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    25 モデルサービング リアルタイムのMLモデルデプロイメント • モデルサービングは、リアルタイムのMLモデ ルデプロイメントをシンプルにするためのプロ ダクションレディ、サーバレスのソリューション を提供します。 • アプリケーションやウェブサイトと モデルの予測結果を連携するためのAPIとし てモデルをデプロイします。 • モデルサービングは: ◦ 運用コストを削減します。 ◦ MLライフサイクルを円滑にします。 ◦ データサイエンスチームは、 プロダクションレベルのリアル タイムMLを自身のソリューションに組み 込むためのコアタスクに フォーカスできます。 MLOps - What’s new?
  20. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    26 モデルサービング MLOpsのメリット MLOps - What’s new? デプロイメントを自動化し エラーを削減する自動 特徴量/ベクトル検索 モニタリング 統合ガバナンス レイクハウスネイティブ CPUやGPUに任意のモデルを デプロイ。自動化された コンテナ構築とインフラ管理はメ ンテナンスコストを削減し、デプ ロイメントを スピードアップ シンプルなデプロイメント 非常に低いレーテンシーで 高可用性かつスケーラブルな サービング (オーバーヘッドレー テンシーのp50は <10ms)か つ、大ボリュームのクエリーに対 応 (QPS >25k) サーバレス
  21. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    27 モデルサービング オンラインでの評価 MLOps - What’s new? サービングエンドポイントへの複数モデ ルのサービングを通じたA/B テストやカナリアデプロイメントのような オンライン評価戦略を サポート
  22. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    28 モデルサービング 推論テーブル モデルのモニタリングとデバッグのための推論テーブル: • それぞれのリクエストとレスポンスはUnity Catalogの推論テーブルに記録されます ◦ お使いのモデルの次のイテレーションで再トレーニングのデータセットとして活用 ◦ プロダクションのデータとモデルに対する品質モニタリングの作成 ◦ 疑わしい推論の診断とデバッグの実行 ◦ 再度ラベリングすべきラベルミスのあるデータセットの作成 MLOps - What’s new? ボリューム (生データ) Delta テーブル 特徴量 モデル 推論 テーブル メトリック テーブル
  23. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    データとAIアセットの両方が高品質、正確、信頼できるこ とを保証するためのデータ中心のモニタ リングソリューション。 • UCテーブルでデータをインクリメンタルに処理 • UCテーブルに格納されるプロファイル メトリクスを計算 • UCテーブルに格納されるドリフト メトリクスの計算 • SQLエクスプレッションとしてのカスタム メトリクスをサポート • メトリクスの時間変化を可視化する自動 生成のDBSQLダッシュボード レイクハウスモニタリング MLOps - What’s new? レイクハウスネイティブ
  24. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    31 DatabricksにおけるMLOps • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  25. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    32 Unity Catalog Concepts MLOps design decisions
  26. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    33 Unity Catalog コンセプト MLOps design decisions カタログ: • データとAIアセットのコンテナとして 機能
  27. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    34 Unity Catalog コンセプト MLOps design decisions カタログ: • データとAIアセットのコンテナとして 機能 スキーマ: • 関連するテーブル、ビュー、モデルを グルーピングするカタログ内の論理的 構成体
  28. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    35 Unity Catalog コンセプト MLOps design decisions カタログ: • データとAIアセットのコンテナとして 機能 スキーマ: • 関連するテーブル、ビュー、モデルを グルーピングするカタログ内の論理的 構成体 データテーブル: • <catalog>.<schema>.<table>の 形式で提供される3レベルの名前を 用いて参照
  29. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    36 Unity Catalog コンセプト MLOps design decisions カタログ: • データとAIアセットのコンテナとして 機能 スキーマ: • 関連するテーブル、ビュー、モデルを グルーピングするカタログ内の論理的 構成体 データテーブル: • <catalog>.<schema>.<table>の 形式で提供される3レベルの名前を 用いて参照 ボリューム: • クラウドオブジェクトストレージロケーションの 論理的ボリューム。テーブル 以外のデータセットにガバナンスを追加。
  30. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    37 Unity Catalog Concepts MLOps design decisions カタログ: • データとAIアセットのコンテナとして 機能 スキーマ: • 関連するテーブル、ビュー、モデルを グルーピングするカタログ内の論理的 構成体 データテーブル: • <catalog>.<schema>.<table>の 形式で提供される3レベルの名前を 用いて参照 ボリューム: • クラウドオブジェクトストレージロケーションの論 理的ボリューム。テーブル 以外のデータセットにガバナンスを追加。 関数: • SQLとPythonのUDF
  31. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    38 Unity Catalog コンセプト MLOps design decisions 登録モデル: • Unity Catalogに登録されたMLflow モデル。
  32. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    39 Unity Catalog コンセプト MLOps design decisions 登録モデル: • Unity Catalogに登録されたMLflow モデル。 モデルバージョン: • 登録モデルのバージョン。同じモデル名で モデルが登録されるとバージョン番号が増 加。
  33. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    40 Unity Catalog Concepts MLOps design decisions 登録モデル: • Unity Catalogに登録されたMLflow モデル。 モデルバージョン: • 登録モデルのバージョン。同じモデル名で モデルが登録されるとバージョン番号が増 加。 モデルのエイリアス: • 登録モデルの特定のバージョンに対する変 更可能な名前付きリファレンス。
  34. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    41 Unity Catalog 推奨の構成 - カタログレベル dev bronze silver gold fraud_detection > Tables: offline_location_features fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance staging bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance prod bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance MLOps design decisions
  35. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    42 Unity Catalog 推奨の構成 - スキーマレベル dev bronze silver gold fraud_detection > Tables: offline_location_features fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance staging bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance prod bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance MLOps design decisions
  36. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    43 Unity Catalog 推奨の構成 - スキーマレベル dev bronze silver gold fraud_detection > Tables: offline_location_features fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance staging bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance prod bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance MLOps design decisions
  37. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    44 Unity Catalog 推奨構成 dev bronze silver gold fraud_detection > Tables: offline_location_features fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance staging bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance prod bronze silver gold fraud_detection > Tables: fraud_clf_inference fraud_clf_metrics > Volumes: > Models: fraud_clf > Functions: compute_distance MLOps design decisions サンプルの prodカタログ
  38. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    45 DatabricksにおけるMLOps • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  39. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    50 Implementing MLOps on Databricks • Databricks MLOps Stack ◦ Customizable stack for starting new ML projects on Databricks ◦ Follows deploy code paradigm ◦ Cloud: Azure, AWS ◦ CI/CD: GitHub, Azure DevOps ◦ Databricks Infrastructure: Databricks asset bundles
  40. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    51 DatabricksにおけるMLOps • イントロダクション ◦ MLOpsとは何でなぜ注意が必要か? ◦ 人とプロセス ◦ ガイドの原則 ◦ development、staging、productionのセマンティクス ◦ MLデプロイメントパターン • 新機能 ◦ Unity Catalog ◦ モデルサービング ◦ レイクハウスモニタリング • 設計上の意思決定 • リファレンスアーキテクチャ • リソース
  41. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    MLOps Resources • Read the updated Big Book of MLOps. Throughout the eBook, we provide links to resources for details and for learning more about specific topics. • Catch up on the Data+AI Summit 2023 talks on MLOps, including: ◦ Wednesday keynote on Lakehouse IQ, MosaicML, and Lakehouse AI, as well as JetBlue’s personal story ◦ Databricks vision and product updates ▪ LLMOps: Everything You Need to Know to Manage LLMs, which overviews the Databricks vision for developing LLM-powered applications ▪ Deep Dive into the Latest Lakehouse AI Capabilities ▪ Advancements in Open Source LLM Tooling, Including MLflow ◦ Key Insights From Running LLMs in Production From MLOps.Community • Read and watch about success stories: ◦ CareSource on their MLOps platform for improving healthcare ◦ Walgreens Boots Alliance on the details of their MLOps architecture ◦ Gucci on their end-to-end MLOps architecture ◦ Ahold Delhaize on their move to Serverless Model Serving ◦ The Trade Desk on scaling NLP for 100 million web pages per day 52
  42. ©2023 Databricks Inc. — All rights reserved Confidential and Proprietary

    Resources: Big Book MLOps eBook Big Book of MLOps (Release: 10/19) Models in Unity Catalog Deep Dive deck Part 2: LLMOps deck (go/llmops/deck) 53