Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[2023年11月版] Databricksを用いた『生成AIアプローチ』

[2023年11月版] Databricksを用いた『生成AIアプローチ』

Databricksを用いたGen AIアプローチについて網羅的に説明します。

Databricks Japan

April 15, 2024
Tweet

More Decks by Databricks Japan

Other Decks in Technology

Transcript

  1. ©2023 Databricks Inc. — All rights reserved Generative AI on

    Databricks データ中心アプローチのテクニカル ・ウォークスルー
  2. ©2023 Databricks Inc. — All rights reserved • GenAIへのアプローチ •

    GenAIの旅 • プロンプトエンジニアリング • 検索補強型ジェネレーション(RAG) • ファインチューニング • 事前トレーニング • MLOps for GenAI • GenAIで何が変わるのか? • リファレンスアーキテクチャ • リソースと次のステップ Outline
  3. ©2023 Databricks Inc. — All rights reserved • GenAIへのアプローチ •

    GenAIの旅 • プロンプトエンジニアリング • 検索補強型ジェネレーション(RAG) • ファインチューニング • 事前トレーニング • MLOps for GenAI • GenAIで何が変わるのか? • リファレンスアーキテクチャ • リソースと次のステップ Outline
  4. ©2023 Databricks Inc. — All rights reserved Databricks AI レイクハウスに完全統合されたGenAI

    AI Models & Tools Cloud Storage Prepare Data Develop & Evaluate AI Serve AI SQL Workflows DLT Features Model Serving (CPU/GPU) Model Registry Notebooks Marketplace AI Functions Lakehouse Monitoring Spark AutoML Databricks AI specific capabilities Lakehouse common capabilities Unity Catalog MLflow CI/CD support OpenAI … Delta Files (Volumes) MosaicML Serve Data Data & AI Governance MLOps + LLMOps Hugging Face Feature Store MLflow (Track/Evaluate) External Services MLflow AI Gateway Vector Search Runtimes
  5. ©2023 Databricks Inc. — All rights reserved GenAIに関する(生成された)ストーリーを紹介: MLチームが1週間で自動顧客アシスタントを構築! •

    シンプルなUX:顧客はアシスタントと チャットで注文できる • 迅速な導入: ◦ AutoGPTを使用して迅速に構築 ◦ 顧客のデータにアクセスし、注文を代行で きる • 初期のテスト: ◦ 社内テストによれば、リクエストの75%は 自動的に処理できる
  6. ©2023 Databricks Inc. — All rights reserved Is this a

    good or bad story? 顧客価値の可能性 すべての要求にはコストがかかる可 能性がある ⇒ ROIが低いかマイナス 独自データを一部活用。 顧客データをサードパーティの APIに送信。 いいことかも? 逃げ道があればね。 悪いこと? 偽陰性と陽性。 これをどのように生産し、監視するのか? これはプロトタイプ? 可能性を素早く証明 これが製品なのか? 競争上の差別化がない実験的な技術で 作られている • シンプルなUX:顧客はアシスタントと チャットで注文できる • 迅速な導入: ◦ AutoGPTを使用して迅速に構築 ◦ 顧客のデータにアクセスし、注文を代 行できる • 初期のテスト: ◦ 社内テストによれば、リクエストの 75%は自動的に処理できる
  7. ©2023 Databricks Inc. — All rights reserved Underlying needs 本番利用

    コントロール/ カスタマイズ コスト管理 • シンプルなUX:顧客はアシスタントと チャットで注文できる • 迅速な導入: ◦ AutoGPTを使用して迅速に構築 ◦ 顧客のデータにアクセスし、注文を代 行できる • 初期のテスト: ◦ 社内テストによれば、リクエストの 75%は自動的に処理できる
  8. ©2023 Databricks Inc. — All rights reserved Lower Costs Production

    Quality Complete Control Key questions モデルやデータを所有し、 管理していますか? 競合他社に対する優位性 は何か? セキュリティとプライバシー のリスクは? 効率的にモデルやパイプラ インを提供するには? モデルの微調整やプリトレイ ンを効率的に行うには? どのように研究開発から生産 に移行するのか? GenAIはMLOpsプラット フォームとプロセスにどのよう に適合しますか? コスト 本番利用 コントロール
  9. ©2023 Databricks Inc. — All rights reserved Key advice How

    do you serve models and pipelines efficiently? How do you fine-tune and pretrain models efficiently? How do you move from R&D to production? How does GenAI fit into your MLOps platform and processes? データは競争力です。 データを管理し、GenAIア プリケーションやカスタムモ デルに活用しましょう。 最適化されたサービングシ ステムを活用する。 主要なML/AIプラットフォー ム上でモデルの微調整と 事前学習を計画する GenAIはデータ中心のプラッ トフォーム上で展開するのが 最適である。 従来のMLOpsのほとんどは GenAIに対応するが、GenAI のいくつかの新しい要件に注 意する コスト 本番利用 コントロール
  10. ©2023 Databricks Inc. — All rights reserved GenAIの行動を誘導するため の特別なプロンプトとパイプラ インの作成

    LLMとカスタム・エンタープライ ズ・データの組み合わせ 事前に訓練されたGenAIモデ ルを特定のデータセットやドメ インに適応させる GenAIモデルをゼロからト レーニングする コントロールとカスタマイズの幅は広がるが、計算量と複雑さは増す GenAI journey データを活用しながら、基本的なGenAIから高度なGenAIへの反復的なパスを計画 する Prompt Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training
  11. ©2023 Databricks Inc. — All rights reserved • これらは相互に排他的な選択肢ではない。 •

    シンプルに始め、ベースラインを作り、反復す る。 GenAI journey • 以下に基づいてテクニックを選択する : ◦ データの量と質 ◦ コンピューティング・リソース ◦ レイテンシー要件 ◦ 特定のドメインまたはアプリケーション Prompt Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training データを活用しながら、基本的なGenAIから高度なGenAIへの反復的なパスを計画 する
  12. ©2023 Databricks Inc. — All rights reserved Method Definition Primary

    use case Data requirements Training time Advantages Considerations Prompt engineering モデルの行動を導くた めの特別なプロンプト の作成 迅速なオンザフラ イ・モデル・ガイダ ンス None None 迅速、費用対効果、 トレーニング不要 微調整よりもコント ロール性が劣る Retrieval augmented generation (RAG) Combining an LLM with external knowledge retrieval Dynamic datasets & external knowledge External knowledge base or vector database Moderate (e.g. computing embeddings) Dynamically updated context, enhanced accuracy Increases prompt length and inference computation Fine-tuning Adapting a pre-trained LLM to specific datasets or domains Domain or task specialization Thousands of domain-specific or instruction examples Moderate - long (depending on data size) Granular control, high specialization Requires labeled data, computational cost Pre-training Training an LLM from scratch Unique tasks or domain-specific corpora Large datasets (billions to trillions of tokens) Long (days to many weeks) Maximum control, tailored for specific needs Extremely resource-intensive GenAI journey
  13. ©2023 Databricks Inc. — All rights reserved Method Definition Primary

    use case Data requirements Training time Advantages Considerations Prompt engineering モデルの行動を導くた めの特別なプロンプト の作成 迅速なオンザフラ イ・モデル・ガイダ ンス None None 迅速、費用対効果、 トレーニング不要 微調整よりもコント ロール性が劣る Retrieval augmented generation (RAG) LLMと外部知識検索 の組み合わせ ダイナミックなデー タセットと外部知識 外部の知識ベース またはベクトルデー タベース 適度な (埋め込み計算な ど) コンテクストが動的に 更新され、精度が向 上 プロンプトの長さと推 論の計算量が増加 Fine-tuning Adapting a pre-trained LLM to specific datasets or domains Domain or task specialization Thousands of domain-specific or instruction examples Moderate - long (depending on data size) Granular control, high specialization Requires labeled data, computational cost Pre-training Training an LLM from scratch Unique tasks or domain-specific corpora Large datasets (billions to trillions of tokens) Long (days to many weeks) Maximum control, tailored for specific needs Extremely resource-intensive GenAI journey
  14. ©2023 Databricks Inc. — All rights reserved Method Definition Primary

    use case Data requirements Training time Advantages Considerations Prompt engineering モデルの行動を導くた めの特別なプロンプト の作成 迅速なオンザフラ イ・モデル・ガイダ ンス None None 迅速、費用対効果、 トレーニング不要 微調整よりもコント ロール性が劣る Retrieval augmented generation (RAG) LLMと外部知識検索 の組み合わせ ダイナミックなデー タセットと外部知識 外部の知識ベース またはベクトルデー タベース 適度な (埋め込み計算な ど) コンテクストが動的に 更新され、精度が向 上 プロンプトの長さと推 論の計算量が増加 Fine-tuning 事前に訓練されたモデ ルを特定のデータセッ トやドメインに適応させ る ドメインまたはタス クの専門化 何千もの分野別ま たは指導例 中~長(データサイ ズによる) きめ細かなコント ロール、高い専門性 ラベル付きデータが必 要、計算コスト Pre-training Training an LLM from scratch Unique tasks or domain-specific corpora Large datasets (billions to trillions of tokens) Long (days to many weeks) Maximum control, tailored for specific needs Extremely resource-intensive GenAI journey
  15. ©2023 Databricks Inc. — All rights reserved Method Definition Primary

    use case Data requirements Training time Advantages Considerations Prompt engineering モデルの行動を導くた めの特別なプロンプト の作成 迅速なオンザフラ イ・モデル・ガイダ ンス None None 迅速、費用対効果、 トレーニング不要 微調整よりもコント ロール性が劣る Retrieval augmented generation (RAG) LLMと外部知識検索 の組み合わせ ダイナミックなデー タセットと外部知識 外部の知識ベース またはベクトルデー タベース 適度な (埋め込み計算な ど) コンテクストが動的に 更新され、精度が向 上 プロンプトの長さと推 論の計算量が増加 Fine-tuning 事前に訓練されたモデ ルを特定のデータセッ トやドメインに適応させ る ドメインまたはタス クの専門化 何千もの分野別ま たは指導例 中~長(データサイ ズによる) きめ細かなコント ロール、高い専門性 ラベル付きデータが必 要、計算コスト Pre-training GenAIモデルをゼロか らトレーニングする 独自のタスクまた はドメイン固有の コーパス 大規模データセット (数十億~数兆トー クン) 長い(数日から数 週間) 特定のニーズに合わ せた最大限のコント ロール 極めて資源集約的 GenAI journey
  16. ©2023 Databricks Inc. — All rights reserved GenAI journey Prompt

    Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training Method Definition Primary use case Data requirements Training time Advantages Considerations Prompt engineering モデルの行動を導くた めの特別なプロンプト の作成 迅速なオンザフラ イ・モデル・ガイダ ンス None None 迅速、費用対効果、 トレーニング不要 微調整よりもコント ロール性が劣る
  17. ©2023 Databricks Inc. — All rights reserved AI App Application

    architecture: prompt engineering Users Create Prompts 2 Send prompts Response 4 1 Model Hub Model Serving 3 Models in Unity Catalog Hugging Face Hub … Query AI Gateway Choose and serve LLM Templates Instructions Examples Prompts Model Serving (CPU/GPU) Web App … OpenAI Monitoring Lakehouse Monitoring Inference Tables Mosaic Inference Log query, response, metrics 5 Notebooks (e.g. Python) SQL (AI functions)
  18. ©2023 Databricks Inc. — All rights reserved Prompt engineering GenAIモデルのテキストプロンプトを調整し、より良い回答を引き出す

    18 Evaluation UI プロンプトエンジニアリングは、基礎となるモデルを変更する ことなく、より正確で文脈を考慮したアウトプットのためにモ デルの相互作用を洗練させる MLflow で評価 UI を使用すると、モデル間のプロンプト とコンテキストのテストが簡素化されるため、アプリケー ションに最適なモデルを発見できます
  19. ©2023 Databricks Inc. — All rights reserved Prompt engineering GenAIモデルのテキストプロンプトを調整し、より良い回答を引き出す

    19 Evaluation UI プロンプトエンジニアリングは、基礎とな るモデルを変更することなく、より正確で 文脈を考慮したアウトプットのためにモデ ルの相互作用を洗練させる MLflow でEvaluation UI を使用する と、モデル間のプロンプトとコンテキス トのテストが簡素化されるため、アプリ ケーションに最適なモデルを発見でき ます
  20. ©2023 Databricks Inc. — All rights reserved Databricks Model Serving

    サービスに必要なすべてのモデルを一元管理 Model Serving Custom Models External Models Foundational Models • LangChain • sklearn • MLflow pyfunc • … • Llama2 70B • MPT 7B • BGE-Large • … • OpenAI GPT-* • AWS Bedrock • Anthropic • …
  21. ©2023 Databricks Inc. — All rights reserved Databricks Model Serving

    Unified management of all models you need to serve Model Serving Custom Models External Models Foundational Models UC / Marketplace / Workspaceから任意のMLflow モデルをAPIとしてServerless Computeでデプロイ。 CPUとGPU。 Feature Serving やVector Searchとの統合。 トップのFoundationモデルをAPI として呼び出します。 迅速な実験のためのトークン単 位の課金。 専用コンピュート用のスループッ トベースのDBU価格設定 外部モデルと API を管理しま す。 これは、MLflow AI Gatewayの ガバナンスに加え、従来の Databricks Model Servingのモ ニタリングとペイロードロギング を提供します。 Available now as Model Serving Available via MosaicML Inference Available via AI Gateway preview
  22. ©2023 Databricks Inc. — All rights reserved OSS Model Marketplace

    最適化されたモデルサービングに支えられたキュレーションモデル Governed: マーケットプレイスのモデルを Unity カタログで管理することで、コンプライアンスとガ バナンスを確保します Simple: ボイラープレート・コードを書くことなく、 わずか数クリックで最新のオープンソース・モデル を入手できる Optimized: 一般的なモデルアーキテクチャの ための自動最適化により、コスト効率とパフォー マンスの高い方法でModel Servingにデプロイ し、拡張することができます Instruction following MPT-7B-Instruct MPT-30B-Instruct Falcon-7B-Instruct Text embeddings instructor-xl e5-base-v2 all-mpnet-base-v2 Code generation StarCoderBase replit-code-v1-3b Transcription whisper-large-v2 whisper-medium Image generation stable-diffusion-2-1 OSS model guidance: Research team findings are also published here.
  23. ©2023 Databricks Inc. — All rights reserved MLflow AI Gateway

    Central Management and Governance Unified APIs for AI Models and Providers Enable Multiple Gen AI Use Cases ルート ユーザは、各組織が管理するクレデ ンシャルを使用して、指定されたモデルを 照会できます 組織は、コストを管理するためにルートを 制 限することができます。 ルートは、より良いトラッキングと観測可能 性のために、リクエストの ロギングとキャッ シングを可能にする。 多様なモデルやプロバイダーに 共通のAPI を提供することで、ユーザーはベンダー固有 のAPIやドキュメントに精通する必要がなくな る。 残りのコードを再構築することなく 、最新かつ 最高のLLMに簡単にアップグレードできま す。 モデルへのアクセスと 管理を一元化すること で、開発者は最終製品に集中でき、インフラの 更新に費やす時間を減らすことができる。 シンプルな統合により、リリースされる最適な モデルを常に使用できる柔軟性を提供するこ とで、将来性を証明します。 コスト管理と運用監視 により、AIアプリケーショ ンを責任を持ってスケールアウトすることがで きます。 23 モデルの管理、統治、評価、切り替えが容易 All of Databricks Model Serving will provide these benefits.
  24. ©2023 Databricks Inc. — All rights reserved MLflow Deployments Server

    モデルの管理、統治、評価、切り替えが容易 以前は「AI Gateway」と呼ばれていた All of Databricks Model Serving will provide these benefits. Central Management and Governance Unified APIs for AI Models and Providers Enable Multiple Gen AI Use Cases ルート ユーザは、各組織が管理するクレデ ンシャルを使用して、指定されたモデルを 照会できます 組織は、コストを管理するためにルートを 制 限することができます。 ルートは、より良いトラッキングと観測可能 性のために、リクエストの ロギングとキャッ シングを可能にする。 多様なモデルやプロバイダーに 共通のAPI を提供することで、ユーザーはベンダー固有 のAPIやドキュメントに精通する必要がなくな る。 残りのコードを再構築することなく 、最新かつ 最高のLLMに簡単にアップグレードできま す。 モデルへのアクセスと 管理を一元化すること で、開発者は最終製品に集中でき、インフラの 更新に費やす時間を減らすことができる。 シンプルな統合により、リリースされる最適な モデルを常に使用できる柔軟性を提供するこ とで、将来性を証明します。 コスト管理と運用監視 により、AIアプリケーショ ンを責任を持ってスケールアウトすることがで きます。
  25. ©2022 Databricks Inc. — All rights reserved Lakehouse Monitoring Integrated:

    トレーニングデータ、フィーチャー テーブル、モデル、推論ログのエンドツーエンドの リネージをUnityカタログで追跡し、よりシンプル なガバナンスを実現します Simple: 推論テーブルを自動的に記録し、メ トリックテーブルとSQLダッシュボードを生成 します。 Proactive: テーブルの品質やカスタムメトリ クスに関するアラートを自動化し、データや モデルの問題を診断します。 信頼性が高く、洞察に富み、シンプルなデータからAIへのパイプラインを実現する統 合モニタリング
  26. ©2023 Databricks Inc. — All rights reserved AI App Application

    architecture: prompt engineering Users Create Prompts 2 Send prompts Response 4 1 Model Hub Model Serving 3 Models in Unity Catalog Hugging Face Hub … Query AI Gateway Choose and serve LLM Templates Instructions Examples Prompts Model Serving (CPU/GPU) Web App … OpenAI Monitoring Lakehouse Monitoring Inference Tables Mosaic Inference Log query, response, metrics 5 Notebooks (e.g. Python) SQL (AI functions) Flexible deployment Governance and cost controls Choice of models Scalability MLOps integration
  27. ©2023 Databricks Inc. — All rights reserved Model Serving AI

    Gateway Model Serving (CPU/GPU) … OpenAI Mosaic Inference Reusable infrastructure Model Hub Models in Unity Catalog Hugging Face Hub … Monitoring Inference Tables Lakehouse Monitoring 最初のGenAIのユースケース は、最終的なGenAI+データプ ラットフォームの主要部分を組 み立てるのに役立ちます AI App Web App Notebooks (e.g. Python) SQL (AI functions) Flexible deployment Governance and cost controls Choice of models Scalability MLOps integration
  28. ©2023 Databricks Inc. — All rights reserved GenAI journey Prompt

    Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training Method Definition Primary use case Data requirements Training time Advantages Considerations Retrieval augmented generation (RAG) LLMと外部知識検索 の組み合わせ ダイナミックなデー タセットと外部知識 外部の知識ベース またはベクトルデー タベース 適度な (埋め込み計算な ど) コンテクストが動的に 更新され、精度が向 上 プロンプトの長さと推 論の計算量が増加
  29. ©2023 Databricks Inc. — All rights reserved 29 Benefit Explanation

    最新のカスタム知識 モデル・レスポンスは、トレーニング・データだけでなく、更新されたカスタム・ドキュメントやデー タにも基づくことができる。 幻覚のリスクが減少 RAGはモデルのインプットを外部の知識に基づかせ、ソースを引用することができる。 ドメイン固有の文脈化 RAGは、独自のデータやドメイン固有のデータを使用することで、特殊でドメイン固有のクエリを 処理することができる。 効率性と費用対効果 RAGは、データによるカスタマイズを可能にし、微調整のオーバーヘッドをなくし、開発時間とコ ストを削減します。 Retrieval Augmented Generation (RAG)
  30. ©2023 Databricks Inc. — All rights reserved RAGはLLMを静的モ デルとしてではなく、 推論エンジンとして使

    用する Your data + an LLM “brain” Retrieval Augmented Generation (RAG) Users Query RAG chain “What is Spark Connect?” 2 Vector Database or Feature Store Retrieve relevant info/data (context) “The Spark Connect client translates DataFrame…” 3 Prompt with context Augment prompt with context Respond to Q based on D: Relevant docs Question Instruction-following LLM 4 Generate answer from context “Spark Connect allows a decoupled client-server…”
  31. ©2023 Databricks Inc. — All rights reserved • お客様のために管理される取り込みパイプライ ン

    • Unityカタログが管理するインデックス • また API対応 ◦ 非管理エンベッディング ◦ CRUD APIのアップサート/デリート MLflow AI Gateway Vector Search Unity Catalogによって管理される、自動更新のベクター・インデックスを作成する client.create_delta_sync_index( endpoint_name="storage_endpoint", index_name=f"{catalog}.{schema}.{index}", source_table_name="ml.llm.spark_docs", primary_key="id", embedding_source_column="text", ai_gateway_route_name="openai-embedding", pipeline_type="CONTINUOUS" ) ソーステーブルを選択する セマンティック検索インデックスを作 成するためのシンプルなAPIを呼び 出す リアルタイム検索用コール・ エンドポイント result = index.similarity_search( query_text="What is Spark Connect?", columns=["id", "text", "link"], filters={"doctype": "wiki"}) 任意のエンベッディング・モデルを選択 する • LangChain、LlamaIndexなどと統合 • 必要に応じてエンドポイントをスケー ルアウト
  32. ©2023 Databricks Inc. — All rights reserved Chains (and agents)

    Vector DB lookup Prompt template LLM summarizer Example chain チェーンとエージェントは、モジュール化された LLMの 機能を構造的につなぎ合わせることができる 一般的なフレームワークには以下のようなものがある : • LangChain • LlamaIndex • Hugging Face mlflow.langchain.log_model(lc_model=llm_chain, …) コンテキストと複雑な推論を含むパイプラインの構築 MLflowは、チェーン、エージェント、モデルのトラッキングとロギ ングをサポートします。 モデルは、ガバナンスと系統追跡のた めに Unity カタログに登録できます。 内蔵のMLflowフレーバーは以下の通り: • LangChain • OpenAI • Transformers • Sentence Transformers • PyFunc (for any custom framework) Development Deployment and Tracking
  33. ©2023 Databricks Inc. — All rights reserved Model Hub Hugging

    Face Hub … Models in Marketplace RAG Architecture: Unstructured data processing Model Serving External Models Custom Models Vector DB Vector Search Storage External Sources Ingestion Tables Volumes Delta Tables OpenAI Automatic sync Deploy model(s) Foundational Models files & metadata Document processing 1. parsing 2. cleaning 3. chunking 4. featurization chunks & features chunks vector Workflows Delta Live Tables Notebooks Databricks managed embeddings
  34. ©2023 Databricks Inc. — All rights reserved Model Hub Hugging

    Face Hub … Models in Marketplace RAG Architecture: Unstructured data processing Unified Serving Endpoints Remote Models Custom Models Vector DB Vector Search Batch Storage External Sources Ingestion Tables Volumes Delta Tables OpenAI Automatic sync Deploy model(s) Foundational Models files & metadata Document processing 1. parsing 2. cleaning 3. chunking 4. featurization chunks & features Embedding chunks, vectors & features chunks vector Workflows Delta Live Tables Notebooks Customer managed embeddings
  35. ©2023 Databricks Inc. — All rights reserved RAG Architecture: Structured

    data processing External Sources Ingestion Delta Table rows Data Prep 1. parsing 2. cleaning 3. chunking 4. featurization Workflows Delta Live Tables Notebooks Serving Feature Serving Storage Delta Tables Automatic sync features
  36. ©2023 Databricks Inc. — All rights reserved RAG Architecture: Chain

    AI Serving Models Functions Data External Models Custom Models Vector Search Index Question Query Processing Deploy Foundational Models Feature Serving Query Expansion Retriever(s) Prompt Engineering Generation Response Chain Logic Function Serving Post Processing Unity Catalog Inference Tables Logs Monitoring Lakehouse Monitoring 🦜🔗
  37. ©2023 Databricks Inc. — All rights reserved Product How it

    solves this problem? Benefit 市場投入までの 時間を短縮 必要なエンジニアリ ングリソースが少な い より正確で高品質な ボット Vector Search 任意のデルタテーブルをスケーラブルで低レイテン シのベクトルデータベースに自動同期し、RAGアプ リで利用可能にします。 ✅デプロイまで1 分 vs 数日 ✅データETLパイプ ラインは不要 ☑あなたのデータ は、より簡単にボット で使用されます Feature Serving スケーラブルで低レイテンシーのデルタテーブルを RAGアプリで利用可能にします。 ✅デプロイまで1 分 vs 数日 ✅データETLパイプ ラインは不要 ☑あなたのデータ は、より簡単にボット で使用されます Problem: Data prep: 構造化データおよび非構造化データ をRAG用に準備するスケーラブルなパイプライン
  38. ©2023 Databricks Inc. — All rights reserved AI Application Application

    architecture: RAG Users Construct Prompts 3 Send prompts to LLM to generate response Response 5 1 Instruction Following Model 4 Query AI Gateway Templates Prompts Model Serving (CPU/GPU) Related docs (from ) 2 2 Search for related content Data Serving Vector Search See implemented in https://www.dbdemos.ai/demo.html?demoName=llm-dolly-chatbot ETL Prepare docs (cleanse, chunk, …) Ingest docs Files Tables Volumes Delta Live Tables RAG Chain Embedding Model Model Serving (GPU) … OpenAI Mosaic Inference Automatically sync with Delta table Choose and load model(s) Compute embeddings Query RAG model Monitoring Model Hub Hugging Face Hub … Models in Unity Catalog Model Serving (CPU) 🦜🔗 …
  39. ©2023 Databricks Inc. — All rights reserved AI Application Application

    architecture: RAG Users Construct Prompts 3 Send prompts to LLM to generate response Response 5 1 Instruction Following Model 4 Query Templates Prompts Related docs (from ) 2 2 Search for related content Data Serving Vector Search See implemented in https://www.dbdemos.ai/demo.html?demoName=llm-dolly-chatbot ETL Prepare docs (cleanse, chunk, …) Ingest docs Files Tables Volumes Delta Live Tables RAG Chain Model Serving (CPU) Embedding Model Model Serving (GPU) … OpenAI Mosaic Inference Automatically sync with Delta table Choose and load model(s) Compute embeddings Query RAG model Monitoring Automatic ingestion Unity Catalog governance Choice of models MLOps integration Choice of frameworks Model Hub Hugging Face Hub … Models in Unity Catalog 🦜🔗 … AI Gateway Model Serving (CPU/GPU)
  40. ©2023 Databricks Inc. — All rights reserved GenAI journey Prompt

    Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training Method Definition Primary use case Data requirements Training time Advantages Considerations Fine-tuning 事前に訓練されたモデ ルを特定のデータセッ トやドメインに適応させ る ドメインまたはタス クの専門化 何千もの分野別ま たは指導例 中~長(データサイ ズによる) きめ細かなコント ロール、高い専門性 ラベル付きデータが必 要、計算コスト
  41. ©2023 Databricks Inc. — All rights reserved 41 Fine-tuning Benefit

    Explanation 特定ドメインのカスタマイズ 一般的なLLMは、大規模で一般的なデータセットでトレーニングされるため、幅広い知識を持つ が、ニッチな分野では深みに欠ける。 モデルを微調整することで、組織は特定のドメインやアプリケーション向けにモデルを特化させ ることができる モデルの動作をよりコントロール ファインチューニングは、モデルの出力をきめ細かく制御する。 これにより、組織は特定のバイアスに対処し、正しさを強制し、フィードバックに基づいてモデル の動作を改良することができる。 推論コストの削減 微調整によってLLMに応答方法を教えることができるので、プロンプトにそのような指示を含め る必要はない。
  42. ©2023 Databricks Inc. — All rights reserved Fine-tuning What is

    it? Fine-tuning 既存のGenAIモデルを特定のドメインやタスクに適応させるために、小規模なデータセット (1,000億の代わりに数百万のトークン)で特別なトレーニングを行います。 2 つの一般的なフォーム : • Supervised instruction fine-tuning: • 1000例の(指示、文脈、反応)データセットで学習を続ける • 例) 質問応答アプリケーション • Continued pre-training: • 新しい語彙や新しい言語を含むテキストなど、ドメイン固有の非構造化テキストでの継続的なト レーニング • 例) 難解なコーディング言語のコード補完
  43. ©2023 Databricks Inc. — All rights reserved Databricks Fine-Tuning API

    一般的なエンベッディングと命令追従アーキテクチャを微調 整するためのシンプルなツール Set configs • Training cost • Quality target • Serving cost • Serving latency Bring custom training data Choose model architecture Custom code in Databricks 最新のツールを使って、あらゆるGenAI モデルを微調整: Hugging Face、 DeepSpeed、PyTorch、TensorFlowな ど。 標準的なDatabricksワークフローを使 用: GPUクラスター、MLflow、ノートブッ ク/ジョブ、... Examples: • Hugging Face and MLflow (docs) • Hugging Face and DeepSpeed (blog) • Parameter Efficient Fine-Tuning with LoRA (blog) Fine-tuning with Databricks Available in AutoML Private Preview Fine Tuning Build custom models using your data via a simple API and configs MosaicML More in the next section! Generally available
  44. ©2023 Databricks Inc. — All rights reserved Model Hub AI

    Orchestrator & Tools Files Application workflow: fine-tuning Load base model 3 Compute 4 myModel Register customized model 5 Fine-tune model Models in Unity Catalog Ingest training docs 1 DeepSpeed MosaicML Notebooks Tables GPU cluster Trainer PEFT Spark Hugging Face Hub … Prepare data 2 Volumes PyTorch MLflow Data Preparation TensorFlow Notebooks Transformers Spark PyTorch Delta Live Tables … …
  45. ©2023 Databricks Inc. — All rights reserved Model Hub AI

    Orchestrator & Tools Files Application workflow: fine-tuning Load base model 3 Compute 4 myModel Register customized model 5 Fine-tune model Models in Unity Catalog Ingest training docs 1 DeepSpeed MosaicML Notebooks Tables GPU cluster Trainer PEFT Spark Hugging Face Hub … Prepare data 2 Volumes PyTorch MLflow Data Preparation TensorFlow Notebooks Transformers Spark PyTorch Delta Live Tables … … Seamless transition from Data Engineering to Data Science Unity Catalog governance Simple infrastructure for your custom code Scalability Unity Catalog governance
  46. ©2023 Databricks Inc. — All rights reserved GenAI journey Prompt

    Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training Method Definition Primary use case Data requirements Training time Advantages Considerations Pre-training GenAIモデルをゼロか らトレーニングする 独自のタスクまた はドメイン固有の コーパス 大規模データセット (数十億~数兆トー クン) 長い(数日から数 週間) 特定のニーズに合わ せた最大限のコント ロール 極めて資源集約的
  47. ©2023 Databricks Inc. — All rights reserved Pre-training Benefit Explanation

    特定ドメインのフルカスタマイズ モデルをゼロからトレーニングすることで、モデルの基礎知識が特定のドメイン(医療、法律、 コードなど)に合わせて調整されます。 独自のデータソース 貴社独自のデータは、他の事前訓練された Gen AIモデルがアクセスできる以上の知識と洞察 をモデルに提供することができます。 トレーニングデータの完全管理 事前トレーニングは、モデルがトレーニングされるデータの透明性とコントロールを提供する。こ れにより、データのセキュリティ、プライバシー、法的要件が満たされることを保証することがで きる。 第三者のバイアスを避ける サードパーティの事前トレーニング済みモデルには、トレーニングデータによるバイアスや制限 があります。 カスタムプリトレーニングは、 Gen AIアプリケーションにおいて、そのようなバイア スや制限をよりコントロールすることができます。
  48. ©2023 Databricks Inc. — All rights reserved Pre-training 新しいGenAIモデルをゼロからトレーニングする •

    ファインチューニングとは対照的で、事前に訓練 された既存のモデルをさらに適合させる。 • 事前に訓練されたモデルは、そのまま使用する ことも、さらに微調整することもできる For example: • 1970年から2022年までのPubmedの全記事を 学習したモデル • Bloomberg GPTは、Bloombergのすべての記 事とファイナンスについて知っている What is it?
  49. ©2023 Databricks Inc. — All rights reserved MosaicML Up to

    7X faster and cheaper training of large AI Models 大規模なAIモデルのトレーニングを 簡素化、スケーラブル、かつコスト 効率よく行うことができます お客様のセキュアな環境で、お客 様のデータを使って独自の生成 AI モデルをトレーニングまたは微調 整します モデルの完全な制御とデータのプ ライバシー Your data, your model, built in your secure environment.
  50. ©2023 Databricks Inc. — All rights reserved MosaicML example use

    case "MosaicMLプラットフォームを使うことで、私たちは1週間以内に自分たちのデータを使っ てLLMを訓練し、展開することができました" Amjad Masad, CEO
  51. ©2023 Databricks Inc. — All rights reserved GenAI journey Prompt

    Engineering Retrieval Augmented Generation (RAG) Fine-tuning Pre-training
  52. ©2023 Databricks Inc. — All rights reserved Databricks, powered by

    AI Example: Databricks Assistant ノートブック、SQLエディタ、ファイルエディタ内 で、データの文脈を理解する AIアシスタント • コードとクエリの生成と自動補完 • 問題の説明と修正 • Unity Catalogと統合し、データ資産に関 連するコンテキストに基づいた結果を提 供
  53. ©2023 Databricks Inc. — All rights reserved Search あなたの組織の構造、専門用 語、データを理解する

    Lakehouse IQ お客様のビジネスを独自に理解するAI搭載のナレッジエンジン Org Chart Unity Catalog Docs Popularity Dashboards Lineage Notebooks Queries Databricks Assistant Unityカタロ グ、テーブルのセマンティクス、および パーミッションを知っている Administration テーブル・メタデータ の自動生成など、Unityカタログ向け Custom apps Lakehouse IQ API Listen to the DAIS 2023 keynote announcing Lakehouse IQ
  54. ©2023 Databricks Inc. — All rights reserved • GenAIへのアプローチ •

    GenAIの旅 • プロンプトエンジニアリング • 検索補強型ジェネレーション(RAG) • ファインチューニング • 事前トレーニング • MLOps for GenAI • GenAIで何が変わるのか? • リファレンスアーキテクチャ • リソースと次のステップ Outline
  55. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps LLMには様々な形態がある: • 有料APIを介した一般的なプロプライエタリおよび OSSモデル • 既製のオープンソースモデル • 特定のアプリケーション用に微調整されたカスタムモ デル • カスタム訓練済みモデル Development process: • 段階的な開発 • APIから始め、カスタムモデルへ進む
  56. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps LLMには様々な形態がある: • 有料APIを介した一般的なプロプライエタリおよび OSSモデル • 既製のオープンソースモデル • 特定のアプリケーション用に微調整されたカスタムモ デル • カスタム訓練済みモデル Development process: • 段階的な開発 • APIから始め、カスタムモデルへ進む LLMは自然言語プロンプトを入力として受け取る : • プロンプトは、望ましい反応を引き出すように設計す ることができる 開発プロセス: • LLMクエリ用のプロンプト・テンプレートをデザインする パッケージの成果物: • MLロジックをモデルだけでなくパイプラインとしてパッケージ化す る
  57. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps LLMには様々な形態がある: • 有料APIを介した一般的なプロプライエタリおよび OSSモデル • 既製のオープンソースモデル • 特定のアプリケーション用に微調整されたカスタムモ デル • カスタム訓練済みモデル Development process: • 段階的な開発 • APIから始め、カスタムモデルへ進む LLMは自然言語プロンプトを入力として受け取る : • プロンプトは、望ましい反応を引き出すように設計す ることができる 開発プロセス: • LLMクエリ用のプロンプト・テンプレートをデザインする パッケージの成果物: • MLロジックをモデルだけでなくパイプラインとしてパッケージ化す る LLMには、例文や文脈を用いたプロンプトを与えることが できる インフラを提供する: • ベクトルデータベースやその他のツールを使って、関連する文脈 を見つける
  58. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps サードパーティの APIは、プロプライエタリモデルとオープン ソースモデルを提供する。 API governance: • APIプロバイダー間のオプションと柔軟性を持つために、集中型 APIガバナンスを使用する。
  59. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps サードパーティの APIは、プロプライエタリモデルとオープン ソースモデルを提供する。 API governance: • APIプロバイダー間のオプションと柔軟性を持つために、集中型 APIガバナンスを使用する。 LLMは非常に大きな ディープラーニングモデルで、多くの 場合、ギガバイトから数百ギガバイトに及ぶ。 Serving infrastructure: • LLMの処理にはGPUを使う。 • モデルを動的にロードする必要がある場合は、高速ストレージを 使用する。
  60. ©2023 Databricks Inc. — All rights reserved MLOps - What

    changes with LLMs? Properties of LLMs Implications for MLOps サードパーティの APIは、プロプライエタリモデルとオープン ソースモデルを提供する。 API governance: • APIプロバイダー間のオプションと柔軟性を持つために、集中型 APIガバナンスを使用する。 LLMは非常に大きな ディープラーニングモデルで、多くの 場合、ギガバイトから数百ギガバイトに及ぶ。 Serving infrastructure: • LLMの処理にはGPUを使う。 • モデルを動的にロードする必要がある場合は、高速ストレージを 使用する。 LLMは、単一の「正しい」答えがないことが多いため、 従来 のMLメトリクスで評価するのは難しい。 Human feedback: • ユーザーフィードバックによる LLMの評価とテスト。 • ユーザーからのフィードバックを、テスト、モニタリング、将来の 微調整を含むMLOpsプロセスに直接組み込む。
  61. ©2023 Databricks Inc. — All rights reserved 多くの既存のツールやプロセスは変わらない • 開発、ステージング、プロダクションの分離は変わりません。

    • GitとUnityカタログModelは、MLのロジックをプロダクションに向けて推進するための主要な導管であることに変わりはありま せん。 • Lakehouseアーキテクチャは、効率とコラボレーションのために不可欠であることに変わりはない。 • 既存のCI/CDインフラを再利用できる。 • MLOpsの構造は、モデルトレーニング、モデル推論などの個別のパイプラインを持つモジュール式のままです。 DevOps MLOps - What changes with LLMs? 61 Lakehouse Platform development staging production DataOps Unity Catalog ModelOps
  62. ©2023 Databricks Inc. — All rights reserved • GenAIへのアプローチ •

    GenAIの旅 • プロンプトエンジニアリング • 検索補強型ジェネレーション(RAG) • ファインチューニング • 事前トレーニング • MLOps for GenAI • GenAIで何が変わるのか? • リファレンスアーキテクチャ • リソースと次のステップ Outline
  63. ©2023 Databricks Inc. — All rights reserved Resources Learn about

    Gen AI • edX LLM Courses (also on Databricks Academy) • Generative AI Fundamentals (Databricks Academy) Learn about Gen AI on Databricks • RAG End-to-End Example (code) • Vector Search + Lakehouse Monitoring (talk) • LLM Eval best practices and LLM Eval in MLflow (blogs) Learn about MLOps • Big Book of MLOps (includes a Gen AI section) • LLMOps Data+AI Summit 2023 talk
  64. ©2023 Databricks Inc. — All rights reserved JetBlue blog post

    and Data+AI Summit 2023 talk on Databricks AI and LLMs for many use cases easyJet blog post on LLMs for digital customer service, personalization and operations Comcast Data+AI Summit 2023 talk on the Databricks AI platform Texas Rangers YouTube short on Databricks AI for powering player performance and fan experience Barracuda blog post on Databricks AI for preventing email phishing attacks at scale Customer Stories
  65. ©2023 Databricks Inc. — All rights reserved Unified security and

    governance Unified data storage, management, and sharing Unity Catalog Delta Lake Intelligence Engine LakehouseIQ Real-time Analytics ETL & Orchestration Data Warehousing Data Science & Gen AI Databricks AI Delta Live Tables Workflows Databricks SQL Databricks Generative Data Platform
  66. ©2023 Databricks Inc. — All rights reserved Fine-tune or Pretrain

    Train the LLM with your unique enterprise data ファインチューニング:事前に訓練した LLMを特定のドメインやタスクに適応さ せる 事前訓練:ゼロからLLMモデルを構築 する モデルと重みの所有権を維持 データは安全かつ非公開
  67. ©2023 Databricks Inc. — All rights reserved MLflow End-to-end LLMOps

    モデルの実験、追跡、評価、管理 AI Gatewayがデータの権限とガバナンス を自動化 月間1,100万ダウンロード
  68. ©2023 Databricks Inc. — All rights reserved Model Serving Real-time

    inference of Models with up to 10X lower latency and reduced costs 高可用性、低レイテンシー、自動スケーリ ングによるサービス提供 自動機能検索、モニタリング、統合ガバナ ンス OSS GenAIモデルに最適化 レイテンシーとコストを最大10倍削減
  69. ©2023 Databricks Inc. — All rights reserved Lakehouse Monitoring Intelligent

    data and model monitoring すべてのデータとモデルを完全に可視化 データおよびモデルの異常をプロアクティ ブかつシンプルに検出 異常の根本原因を遡ることによるシームレ スなデバッグ
  70. ©2023 Databricks Inc. — All rights reserved Your data is

    your competitive advantage and it needs to be core to your generative AI solution
  71. Databricks AI — a data-centric approach Use Pre-trained Model or

    Build Custom Model Serve Models into Real-Time Apps and Monitor Prepare data & features with native tools Data Platform — Delta Lake Governance — Unity Catalog Datasets Models Applications
  72. ©2023 Databricks Inc. — All rights reserved Confidential Generative AI

    with Databricks Foundation model + your data Custom model fine tuned or trained on your data Data requirements Small: 10s of thousands of words Medium - Large: Millions - Trillions of words Objective Securely host an open source model and connect to your enterprise data Customize models on your data for your specific use cases Models MPT family • Llama 2 • Falcon MPT family • Llama 2 • Your Specific Model
  73. ©2023 Databricks Inc. — All rights reserved Confidential Foundation Model

    + Your Data Customer has small amounts of text (~100k words max), such as ▪ HR handbook ▪ Instruction manual ▪ Support tickets Customer data is organized using Vector Search and queried using an open source model hosted in Databricks Model Serving Falcon LlaMA 2
  74. ©2023 Databricks Inc. — All rights reserved Confidential Customer has

    medium to large amounts of text (1M-1T words) • Enables models to have domain knowledge • Enables new modalities, such as code, images and proteinomics Customer data is used to securely build a custom model in customer’s private environment using MosaicML. This model is unique to their data and becomes their IP Custom Model fine-tuned or trained with your data
  75. ©2023 Databricks Inc. — All rights reserved What’s needed to

    be successful データとモデルを所有する プライバシーの向上 企業データによって安全に トレーニングされたGenAI モデルを所有する GenAIモデルを迅速かつ確 実に本番稼動させる LLMの訓練と配備は、規模に 応じて費用対効果が高い 標準化されたオペレーションにより、ユースケー スを問わず本番環境へ拡張可能 ガバナンスとモニタリング LLM育成の費用対効果 生産化までの時間短縮