Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CodeAgentとMCPで実現するデータ分析エージェント
Search
CyberAgent
PRO
May 27, 2025
1
210
CodeAgentとMCPで実現するデータ分析エージェント
CyberAgent
PRO
May 27, 2025
Tweet
Share
More Decks by CyberAgent
See All by CyberAgent
2025年度 生成AI 実践編
cyberagentdevelopers
PRO
2
160
LLMを用いたメタデータベースレコメンド検証
cyberagentdevelopers
PRO
4
1.3k
SQL Agentによるタップルのデータ利活用促進
cyberagentdevelopers
PRO
1
370
NAB Show 2025 動画技術関連レポート / NAB Show 2025 Report
cyberagentdevelopers
PRO
1
360
【2025年度新卒技術研修】100分で学ぶ サイバーエージェントのデータベース 活用事例とMySQLパフォーマンス調査
cyberagentdevelopers
PRO
7
9.8k
【CA.ai #1】未来を切り拓くAIエージェントの可能性
cyberagentdevelopers
PRO
2
140
【CA.ai #1】MCP世界への招待:AIエンジニアが創る次世代エージェント連携の世界
cyberagentdevelopers
PRO
2
140
【CA.ai #1】ABEMA のコンテンツ制作を最適化! 生成 AI × クラウド映像編集システム
cyberagentdevelopers
PRO
0
110
The Composable Architecture (TCA) を用いたAmebaのリアーキテクチャ
cyberagentdevelopers
PRO
0
84
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
137
34k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
480
Java REST API Framework Comparison - PWX 2021
mraible
31
8.6k
Building Applications with DynamoDB
mza
95
6.4k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
A better future with KSS
kneath
239
17k
How GitHub (no longer) Works
holman
314
140k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Transcript
CodeAgentとMCPで実現 するデータ分析エージェン ト 村脇 光洋 CA DATA NIGHT #6
自己紹介 村脇 光洋 職種:サーバーサイド 所属 : AI事業本部 アプリ運用カンパニー ➡ AI
POS カンパニー (2025/1~) 業務内容: ◦ 小売業/メーカー向けデータ分析SaaS開発 2
Table of Contents 1. プロダクト紹介「AI POS」 2. 事例紹介 : 分析コンテンツの開発速度を向上させるLLM利用
3. LLM領域の技術選定 3
プロダクト紹介「AI POS」 4
AI POS とは? 5
AI POS とは? 6 メールレポート チャット 小売業・製造業の方に 情報を提供
AI POS の システム構成 7 メール レポート チャット 多くの分析メニュー
ユーザの質問に応じた分析を、 LLMによる生成は行っていない (データの正確性が求められるため) AI POS におけるLLMの活用ポイント 8 メール レポート チャット
多くの分析メニュー
AI POS におけるLLMの活用ポイント 9 多くの分析メニュー 分析メニュー開発をLLMエージェントで高速化
分析コンテンツの開発速度を向上させる LLM利用 10
LLMを利用した分析メニュー開発のフロー 11 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する ② Cursorで事前定義済み(mdc)の設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック・修正。品質を担保
LLMを利用した分析メニュー開発のフロー 12 ② mdcファイルに事前定義済みの設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック。品質を担保 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する
今回はこの分析エージェントの話をします
分析エージェント(実際のUI) 13 プロファイル(利用ツールなどエージェント設定)選択 プロファイル(利用ツールなどエージェント設定)選択 ツール群(MCPなどで連携)選択 分析定義 入力
分析エージェント(実際のUI) 14 カテゴリ情報 step1: カテゴリ情報取得 ※一部情報をマスクしています
分析エージェント(実際のUI) 15 ※一部情報をマスクしています step2: Queryを記述して データを取得
分析エージェント(実際のUI) 16 ※一部情報をマスクしています step3,4: 取得したデータを 加工して可視化
分析エージェントの効果 17 • 分析メニューの開発工数を1/3以下に圧縮 • 最終アウトプットを事前にメンバーが見ながら議論ができる • PMなど、開発メンバー以外でも分析メニューの作成ができる
分析エージェントの構成 18
分析エージェントの構成 19 エージェントの実装について
エージェントの実装 20 • フレームワークにHugging Face社の「smolagents」を採用 • 特徴 ◦ 動作原理にCodeActを採用 ◦
最小限の機能。ワークフローが組めない ◦ MCP対応 ◦ OpenTelemetry準拠 ◦ LLMモデルの切り替えが容易(litellm)
smolagentsの特徴 : CodeAct 21 関連 ReAct: https://arxiv.org/abs/2210.03629, CodeAct: https://arxiv.org/abs/2402.01030 (画像はCodeActの論文より引用)
従来のエージェントは、ツールとツールの繋ぎ込みに課題があった • 既存アプローチではjsonがtoolの インターフェース • toolの結果が、別のtoolへと渡さ れる時に欠損する • 扱う値の変換も容易ではない • CodeActはツール呼び出しを Python上で行うことで、それら の課題を解決
smolagentsの特徴 : CodeAct 22 具体例 : 先の分析の例 step2 sqlを実行し、結果を result変数に格納
smolagentsの特徴 : CodeAct 23 step4 step2で取得したresultを DataFrameとして利用 Pandasの機能を使って可視化するた めに、データをPython上で加工 Pythonの表現力を使って振る舞うこ
とができる 具体例 : 先の分析の例
LLM領域の技術選定 24
分析エージェントの構成 (再掲) 25
分析エージェントの構成 (再掲) 26 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用?
分析エージェントの構成 (再掲) 27 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用? LLM関連領域の技術発展が日進月歩なため
LLMとその周辺の技術状況 28 • 最高性能のモデルはすぐに更新される • エージェント/ワークフローツールは 乱立している • LLMにデータ、ツール、文脈を与える 手法も日夜開発されている
出典: https://www.insightpartners.com/ideas/ai-agents-disrupting-automation/
ベストプラクティスの覆りやすさ 29 エージェント部 : 高 基盤モデルの性能向上や、新手法、新プロダクトによって覆される (マルチエージェントの自社開発そのものがほぼ不要になるかも)
ベストプラクティスの覆りやすさ 30 ツール部分: 中 現在は多くのエージェントがMCPに対応しているので、すぐに使 えなくなることはない しかしE2B(仮想環境ベースの文脈付与)など別の手法が主流になる可 能性はある
ベストプラクティスの覆りやすさ 31 ツールが参照する自社情報の整備 : 低 (例: データベースのスキーマ、APIの仕様) MCPで繋いだとしても、メタ情報や活用すべきドメイン知識が、 アクセス可能な形で言語化されていないと、エージェントの性能 が高くても最大限の性能を出せない
技術の発展を考慮したチームリソースの投下 32 自社が投資しなくても進歩していく 自社が投資しないと進歩しない エージェント最適化 選択肢が移り変わりやすい 選択肢が変化しづらい MCP対応 LLMリーダブルに情報を整備 すぐ乗り換えられる
ように、軽量に実装 新しいMCPクライア ントをすぐに試すこ とができるので、 できるだけ対応 一定コストを払って整備 例: APIドキュメントを充実化 データベースを一般的な規格にし て、固有表現をなるべく排除。メ タデータを可能な限り付与
まとめ 33 • smolagentsで分析用のエージェントを開発 ◦ CodeActは複数ツール連携や、データ加工にPythonの表現 力を使えることが利点 • LLM領域の移り変わりが激しいことを考慮して技術選定を実施 ◦
『エージェント < MCPのツール < 元となるリソース 』の 優先順位で力を入れて整備すると報われやすいのでは?