CodeAgentとMCPで実現するデータ分析エージェント

CodeAgentとMCPで実現するデータ分析エージェント村脇光洋 CA DATA NIGHT #6

自己紹介村脇光洋職種：サーバーサイド所属 : AI事業本部アプリ運用カンパニー ➡ AI
POS カンパニー (2025/1~) 業務内容: ◦ 小売業/メーカー向けデータ分析SaaS開発 2

Table of Contents 1. プロダクト紹介「AI POS」 2. 事例紹介 : 分析コンテンツの開発速度を向上させるLLM利用
3. LLM領域の技術選定 3

プロダクト紹介「AI POS」 4

AI POS とは？ 5

AI POS とは？ 6 メールレポートチャット小売業・製造業の方に情報を提供

AI POS のシステム構成 7 メールレポートチャット多くの分析メニュー

ユーザの質問に応じた分析を、 LLMによる生成は行っていない（データの正確性が求められるため） AI POS におけるLLMの活用ポイント 8 メールレポートチャット
多くの分析メニュー

AI POS におけるLLMの活用ポイント 9 多くの分析メニュー分析メニュー開発をLLMエージェントで高速化

分析コンテンツの開発速度を向上させる LLM利用 10

LLMを利用した分析メニュー開発のフロー 11 ① 分析エージェントを利用して分析メニューのプロトタイプを作成する ② Cursorで事前定義済み(mdc)の設計パターンに則ってプロトタイプをプロダクションコード化 ③ 人間がチェック・修正。品質を担保

LLMを利用した分析メニュー開発のフロー 12 ② mdcファイルに事前定義済みの設計パターンに則ってプロトタイプをプロダクションコード化 ③ 人間がチェック。品質を担保 ① 分析エージェントを利用して分析メニューのプロトタイプを作成する
今回はこの分析エージェントの話をします

分析エージェント（実際のUI） 13 プロファイル（利用ツールなどエージェント設定）選択プロファイル（利用ツールなどエージェント設定）選択ツール群（MCPなどで連携）選択分析定義入力

分析エージェント（実際のUI） 14 カテゴリ情報 step1: カテゴリ情報取得 ※一部情報をマスクしています

分析エージェント（実際のUI） 15 ※一部情報をマスクしています step2: Queryを記述してデータを取得

分析エージェント（実際のUI） 16 ※一部情報をマスクしています step3,4: 取得したデータを加工して可視化

分析エージェントの効果 17 • 分析メニューの開発工数を1/3以下に圧縮 • 最終アウトプットを事前にメンバーが見ながら議論ができる • PMなど、開発メンバー以外でも分析メニューの作成ができる

分析エージェントの構成 18

分析エージェントの構成 19 エージェントの実装について

エージェントの実装 20 • フレームワークにHugging Face社の「smolagents」を採用 • 特徴 ◦ 動作原理にCodeActを採用 ◦
最小限の機能。ワークフローが組めない ◦ MCP対応 ◦ OpenTelemetry準拠 ◦ LLMモデルの切り替えが容易(litellm)

smolagentsの特徴 : CodeAct 21 関連 ReAct: https://arxiv.org/abs/2210.03629, CodeAct: https://arxiv.org/abs/2402.01030 （画像はCodeActの論文より引用）
従来のエージェントは、ツールとツールの繋ぎ込みに課題があった • 既存アプローチではjsonがtoolのインターフェース • toolの結果が、別のtoolへと渡される時に欠損する • 扱う値の変換も容易ではない • CodeActはツール呼び出しを Python上で行うことで、それらの課題を解決

smolagentsの特徴 : CodeAct 22 具体例 : 先の分析の例 step2 sqlを実行し、結果を result変数に格納

smolagentsの特徴 : CodeAct 23 step4 step2で取得したresultを DataFrameとして利用 Pandasの機能を使って可視化するために、データをPython上で加工 Pythonの表現力を使って振る舞うこ
とができる具体例 : 先の分析の例

LLM領域の技術選定 24

分析エージェントの構成（再掲） 25

分析エージェントの構成（再掲） 26 なぜツール定義にMCPを採用？なぜワークフローが組めないフレームワークを採用？

分析エージェントの構成（再掲） 27 なぜツール定義にMCPを採用？なぜワークフローが組めないフレームワークを採用？ LLM関連領域の技術発展が日進月歩なため

LLMとその周辺の技術状況 28 • 最高性能のモデルはすぐに更新される • エージェント/ワークフローツールは乱立している • LLMにデータ、ツール、文脈を与える手法も日夜開発されている
出典: https://www.insightpartners.com/ideas/ai-agents-disrupting-automation/

ベストプラクティスの覆りやすさ 29 エージェント部 : 高基盤モデルの性能向上や、新手法、新プロダクトによって覆される（マルチエージェントの自社開発そのものがほぼ不要になるかも）

ベストプラクティスの覆りやすさ 30 ツール部分: 中現在は多くのエージェントがMCPに対応しているので、すぐに使えなくなることはないしかしE2B(仮想環境ベースの文脈付与)など別の手法が主流になる可能性はある

ベストプラクティスの覆りやすさ 31 ツールが参照する自社情報の整備 : 低（例: データベースのスキーマ、APIの仕様） MCPで繋いだとしても、メタ情報や活用すべきドメイン知識が、アクセス可能な形で言語化されていないと、エージェントの性能が高くても最大限の性能を出せない

技術の発展を考慮したチームリソースの投下 32 自社が投資しなくても進歩していく自社が投資しないと進歩しないエージェント最適化選択肢が移り変わりやすい選択肢が変化しづらい MCP対応 LLMリーダブルに情報を整備すぐ乗り換えられる
ように、軽量に実装新しいMCPクライアントをすぐに試すことができるので、できるだけ対応一定コストを払って整備例: APIドキュメントを充実化データベースを一般的な規格にして、固有表現をなるべく排除。メタデータを可能な限り付与

まとめ 33 • smolagentsで分析用のエージェントを開発 ◦ CodeActは複数ツール連携や、データ加工にPythonの表現力を使えることが利点 • LLM領域の移り変わりが激しいことを考慮して技術選定を実施 ◦
『エージェント＜ MCPのツール＜元となるリソース』の優先順位で力を入れて整備すると報われやすいのでは？

CodeAgentとMCPで実現するデータ分析エージェント

CodeAgentとMCPで実現するデータ分析エージェント

CyberAgent PRO

More Decks by CyberAgent

Featured

Transcript