Databricksによるエージェント構築

2025 Databricks Inc. — All rights reserved 1 Databricksによるエージェント構築
Databricks Japan 1

©2025 Databricks Inc. — All rights reserved Mosaic AIにより、本番品質でエンタープライズ対応のエージェントをより迅速に構築できます
2 既存のデータおよび AI ガバナンスを尊重するエージェントとツールエンドツーエンドのガバナンスプライバシーおよびレピュテーションに関する潜在的なリスクを軽減評価およびモニタリングされる正確なエージェントを提供本番運用品質最先端の研究に基づいた、ネイティブな評価およびモニタリングを提供当社のエージェントツールを使用して、市場投入までの時間を数か月短縮可能迅速にイテレーションと再デプロイを行い、品質を向上迅速な開発

©2025 Databricks Inc. — All rights reserved データに基づいて推論しツールを活用するエージェントエージェント構造化データ
非構造化データ取り込み変換オーケストレーション LakeFlow Vector Search ML特徴量データ AIモデルツール /関数チェーンレイクハウス上に構築された唯一のAI基盤により、データに対してセキュアに推論ハルシネーションなしに正確な回答を提供するツールと関数を活用データからベクトルインデックスと特徴量を自動的に生成エージェントコンポーネント(カスタマイズされたモデル、関数、チェーン)を簡単に構築および使用 3

©2025 Databricks Inc. — All rights reserved ユースケースに合わせたカスタム評価ユースケースに適した任意の商用または OSSモデルを比較して使用
AIアシスト型ジャッジにより、出力品質を大規模に自動測定品質問題の根本原因を追跡し、修正を反復的に実装および評価し、迅速に再デプロイすべてのAIモデルを評価、活用エージェントシステムの評価 Deﬁne ground truth Human grading app LLM Judges OpenAI Anthropic Google Mistral DBRX Meta Llama ファインチューンした生成AIモデル事前トレーニングした古典的ML モデル商用オープンソースカスタム 4

©2025 Databricks Inc. — All rights reserved データとモデルに対するガバナンスデータからAIモデル、ツールに至るすべてのアセットをネイティブに管理
アクセス制御、レート制限の設定、ガードレールの提供、リネージの追跡が可能 AI Gatewayにより、任意のOSSまたはプロプライエタリモデルを実行、保護、管理 Unity Catalog 発見データ共有アクセス制御監査リネージ監視テーブルファイル AIモデルノートブックダッシュボード AIツール 5

©2025 Databricks Inc. — All rights reserved Databricksの品質に対するアプローチ高速な開発者インナーループ正確な品質測定
SME(領域専門家)との容易なコラボレーション要約: 評価駆動開発がすべての人に利用可能になりました 6

©2024 Databricks Inc. — All rights reserved 7 データ準備エージェント
構築エージェントのデプロイエージェントの評価エージェントサービング LLMジャッジピアラベリングトレーシング MLOps / LLMOps ML特徴量ベクトルインデックスリネージデータ取り込み GenAIモデル古典的MLモデル関数 & ツールエージェントシステムを構築するための統合プラットフォーム Credentials AI guardrails エージェントの管理 AIガードレール使用量追跡資格情報レート制限

©2025 Databricks Inc. — All rights reserved エージェントのライフサイクルを順を追って確認し、 Mosaic AIが高品質な
エージェントの構築をどのように支援するかを見ていきましょうプロトタイプの構築、 LLMジャッジによるバイブ品質チェックデータの準備、ツールの作成品質問題の根本原因を反復的に特定して修正関係者から本番前エージェントに対するフィードバックを収集品質評価のベンチマークとして評価データにラベル付けエージェントを本番環境にリリースし、本番環境で品質をモニタリング 1 2 3 5 6 4 新たなユースケース 8

©2025 Databricks Inc. — All rights reserved Unity Catalog エージェン
ト1 ツール2 テーブルツールコード記録 & バージョン非構造化データの埋め込みとインデックス Vector Search ノートブック、Lakeﬂowを使用してデータをETL Vector Searchで非構造化データを埋め込み、インデックスノートブックでPython、SQLを使用してツールを作成 Genieスペースで非構造化データ /text2sqlをエージェントに統合 Step 1: データの準備、ツールの作成 Genie スペース構造化データの活用 1. UCモデルとして格納 ; 2. UC関数として格納 9

©2025 Databricks Inc. — All rights reserved Step 2: LLMジャッジ品質チェックによる迅速なプロトタイピング
Unity Catalog エージェントツールテーブルツール活用エージェントコード AutoGen OpenAI SDK AI Playground エージェントのプロトタイピング 2 Agent Evaluation プロトタイプの評価 2 Playgroundのノーコードインターフェースでプロトタイプを迅速にテストし、Agent Evaluationで評価した後、コードにエクスポートして品質のイテレーションを継続 10

©2025 Databricks Inc. — All rights reserved Step 2: 迅速なプロトタイピング
AI Playgroundでは、コードを一切書かずにエージェントのプロトタイプを迅速に作成し、イテレーション可能 Agent Evaluationに組み込まれたLLM ジャッジにより、初期品質を迅速に評価完了したら、本番対応のコードをエクスポートして、さらなるカスタマイズ、評価、デプロイ 11

©2025 Databricks Inc. — All rights reserved Step 3: 評価データセットのラベル付け
高品質な合成評価データを生成するために、 Agent Evaluationに生のドキュメントを提供 (オプション)合成評価データを SMEに送信、レビュー依頼ユーザーリクエスト / トレース / 評価データ Unity Catalog • 合成データを生成 • 品質/コスト/レイテンシを評価 • UIでメトリクスとエージェント出力を確認して品質をデバッグ Agent Evaluation エージェントツールテーブル評価データ • ラベリングUI Agent Evaluatio n 評価データのレビュー訂正 1 3 3 12

©2025 Databricks Inc. — All rights reserved Step 3: 評価データセットのラベル付け
高品質で研究に裏付けられた合成データにより、SMEなしでも即座に品質評価を開始 • 貴重なSMEの時間を数時間節約冗長な文章による回答ではなく、事実のグラウンドトゥルースリストを生成するため、 SMEによるレビューがより効率的に使いやすく美しくデザインされた UIにより、SMEはゼロから始めることなく、合成データを迅速に検証 SMEによる更新は、開発者がインナーループですぐに使用可能 13

©2025 Databricks Inc. — All rights reserved Step 4: 品質問題の特定、修正の繰り返し
Agent Evaluationを使用して品質問題の根本原因を特定 MLﬂow TracingとAgent EvaluationのUIを使用してデバッグ特定された根本原因を修正するためにコード/設定を変更して品質をイテレーションし、Agent Evaluationを再実行して修正が機能したかを検証し、これを繰り返します Unity Catalog • 合成データを生成 • 品質/コスト/レイテンシを評価 • UIでメトリクスとエージェント出力を確認して品質をデバッグ Agent Evaluation エージェントツールテーブルエージェントコード AutoGen OpenAI SDK ツールコード • コードパッケージ • 可観測性のためのトレース記録 & バージョン記録 & バージョン評価データ 4 4 4 4 14

©2025 Databricks Inc. — All rights reserved Mosaic AI Researchが開発したDatabricks
LLMジャッジは、クラス最高の品質測定と速度を提供します。評価の根拠を平易な言葉で説明することも含まれます Agent Evaluationは品質問題の最も可能性の高い根本原因を自動的に特定シンプルなUIでエージェントの出力を確認し、エージェントの2つのバージョンを比較 MLﬂow Tracingにより、複雑なエージェントロジックを迅速にデバッグ MLﬂow loggingにより、エージェントのコードと設定のバージョンを追跡 Step 4: 品質問題の特定、修正の繰り返し 15

©2025 Databricks Inc. — All rights reserved Unity Catalog ユーザーリクエスト
/ トレース / 評価データオープンソース/ カスタムLLM 商用 LLM • エージェントのデプロイエージェント1 ツール2 テーブル Genie Room Vector Search 1. UCモデルとして格納 ; 2. UC関数として格納 Serverless Compute Agent Framework • 品質/コスト/レイテンシを測定 • UIで本番ログを確認 • ログを評価セットに追加 • 品質/コスト/レイテンシをモニタリング AI/BI Dashboard エージェントでのツール活用エージェントでのデータ活用 • レビューアプリ (フィードバック用チャット UI) Agent Evaluatio n • リクエスト/レスポンス • ユーザーフィードバック Serverless SQL Online Tables Model Serving AI Gateway エージェントエンドユーザー Agent Evaluation REST API 推論テーブル経由のデータフロー • 品質評価 • レイテンシ / 使用量 • ログ & トレース • ユーザーフィードバック 2 1 3 4 Agent Frameworkを使用してレビューアプリ(フィードバックを簡単に収集できる組み込みのチャット UI)にデプロイ。または、Model Servingにデプロイされたエージェントの REST APIと通信するカスタムインターフェースを作成 Agent Evaluationのモニタリング機能を使用して、さらなる品質問題を特定し、ダッシュボードでユーザーフィードバックを追跡 Step 5: 関係者からフィードバックを収集するため、本番前環境にリリース 18

©2025 Databricks Inc. — All rights reserved Step 5: 関係者からフィードバックを収集するた
め、本番前環境にリリース Agent Frameworkにより1行のコードで迅速にデプロイ Agent Evaluationレビューアプリは、SMEからのフィードバックを簡単に収集できる構築済みのチャットアプリを提供 • または、同じAPIを使用して独自の UIを構築 Review Appからのすべてのリクエスト /レスポンス、 MLﬂow Traces、フィードバックは、AI Gateway経由でDelta Tablesに記録 Agent EvaluationとAI/BIダッシュボードを使用して、LLMジャッジとユーザーフィードバックに基づき品質問題を特定 19

©2025 Databricks Inc. — All rights reserved Unity Catalog ユーザーリクエスト
/ トレース / 評価データ • カスタムアプリ / UI オープンソース/ カスタムLLM 商用 LLM • エージェントのデプロイ • 合成データを生成 • 品質/コスト/レイテンシを評価 • UIでメトリクスとエージェント出力を確認して品質をデバッグ Agent Evaluation エージェント1 ツール2 テーブル Genie Room Vector Search 1. UCモデルとして格納 ; 2. UC関数として格納エージェントコード AutoGen OpenAI SDK ツールコード Serverless Compute • コードパッケージ • 可観測性のためのトレース Agent Framework • 品質/コスト/レイテンシを測定 • UIで本番ログを確認 • ログを評価セットに追加 • 品質/コスト/レイテンシをモニタリング AI/BI Dashboard 記録 & バージョン記録 & バージョンエージェントでのツール活用エージェントでのデータ活用評価データ • ラベリングUI Agent Evaluatio n 評価データのレビュー訂正 • リクエスト/レスポンス • ユーザーフィードバック Serverless SQL Online Tables Model Serving AI Gateway Agent Databricks Apps エンドユーザーカスタムアプリ Agent Evaluation REST API 推論テーブル経由のデータフロー • 品質評価 • レイテンシ / 使用量 • ログ & トレース • ユーザーフィードバック 8 8 8 8 7 8 8 AI/BIダッシュボードを使用して品質をモニタリング。ログのLLMジャッジ分析により品質問題を特定。ログを開発ループに戻して品質問題を修正。必要に応じて、ログを SMEに送信してラベル付けを依頼本番デプロイは、本番前環境とまったく同じインターフェースを使用。 Agent Frameworkでデプロイし、 REST APIを作成します。 Databricks AppsでUIを構築するか、APIを既存のアプリに統合 20

©2025 Databricks Inc. — All rights reserved Step 6: 本番環境にデプロイして品質をモニタリング
Agent Frameworkを使用して、エージェントの UC モデルをスケーラブルで本番対応の REST APIに1行のコードでデプロイ Agent Evaluationジョブをスケジュールして、トラフィックのx%にLLMジャッジの品質分析 AI/BIダッシュボードを使用して品質、使用状況、レイテンシをモニタリング Agent Evaluationの品質分析を使用して、ログの LLMジャッジ分析により品質問題を特定し、ログを Agent Evaluationの開発ループに戻して品質問題を修正 • 必要に応じて、ログを SMEに送信してラベル付けを依頼 21

2025 Databricks Inc. — All rights reserved 1. Databricksはあらゆるタイプのエージェントを構築するための完全なソリューションです
a. 当社のソリューションはエンタープライズ対応であり、開発からオンラインモニタリングまでのエンドツーエンドの機能を提供します 2. 評価、LLMops、モニタリング、ガバナンスを通じて、モデルレイヤーに付加価値を提供します a. 高品質なLLMに加えて、これらが必要です 3. Unity Catalogは、エージェントとツールを含む、データとAIガバナンスのための統合ソリューションです 4. ノーコードのUIのみのエージェントソリューションはデモでは優れて見えますが、必要な品質を達成することはできません a. Databricksは開始時にはノーコードを提供しますが、品質向上が必要な場合にはコードを使用できます。これによって、単なる PoCではなく、高いROIを実現するエージェントを提供できますサマリー 22

Databricksによるエージェント構築

Databricksによるエージェント構築

Takaaki Yayoi

More Decks by Takaaki Yayoi

Other Decks in Technology

Featured

Transcript

2025 Databricks Inc. — All rights reserved 1 Databricksによるエージェント構築

©2025 Databricks Inc. — All rights reserved Mosaic AIにより、本番品質でエンタープライズ対応のエージェントをより迅速に構築できます

©2025 Databricks Inc. — All rights reserved データに基づいて推論しツールを活用するエージェントエージェント構造化データ

©2025 Databricks Inc. — All rights reserved ユースケースに合わせたカスタム評価ユースケースに適した任意の商用または OSSモデルを比較して使用

©2025 Databricks Inc. — All rights reserved データとモデルに対するガバナンスデータからAIモデル、ツールに至るすべてのアセットをネイティブに管理

©2025 Databricks Inc. — All rights reserved Databricksの品質に対するアプローチ高速な開発者インナーループ正確な品質測定

©2024 Databricks Inc. — All rights reserved 7 データ準備エージェント

©2025 Databricks Inc. — All rights reserved エージェントのライフサイクルを順を追って確認し、 Mosaic AIが高品質な

©2025 Databricks Inc. — All rights reserved Unity Catalog エージェン

©2025 Databricks Inc. — All rights reserved Step 2: LLMジャッジ品質チェックによる迅速なプロトタイピング

©2025 Databricks Inc. — All rights reserved Step 2: 迅速なプロトタイピング

©2025 Databricks Inc. — All rights reserved Step 3: 評価データセットのラベル付け

©2025 Databricks Inc. — All rights reserved Step 3: 評価データセットのラベル付け

©2025 Databricks Inc. — All rights reserved Step 4: 品質問題の特定、修正の繰り返し

©2025 Databricks Inc. — All rights reserved Mosaic AI Researchが開発したDatabricks

©2025 Databricks Inc. — All rights reserved Databricksのジャッジは高速 16

©2025 Databricks Inc. — All rights reserved Databricksジャッジは高品質人間との一致度を継続的にチューニングしていますブログ記事を

©2025 Databricks Inc. — All rights reserved Unity Catalog ユーザーリクエスト

©2025 Databricks Inc. — All rights reserved Step 5: 関係者からフィードバックを収集するた

©2025 Databricks Inc. — All rights reserved Unity Catalog ユーザーリクエスト

©2025 Databricks Inc. — All rights reserved Step 6: 本番環境にデプロイして品質をモニタリング

2025 Databricks Inc. — All rights reserved 1. Databricksはあらゆるタイプのエージェントを構築するための完全なソリューションです

©2025 Databricks Inc. — All rights reserved 次のステップ 23

2025 Databricks Inc. — All rights reserved 次のステップ当社のチームと連携して、高いROIが見込めるユースケースを特定してください。 Databricksでエージェントのプロトタイピングをお試しください。