Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CodeAgentとMCPで実現するデータ分析エージェント
Search
CyberAgent
PRO
May 27, 2025
580
1
Share
CodeAgentとMCPで実現するデータ分析エージェント
CyberAgent
PRO
May 27, 2025
More Decks by CyberAgent
See All by CyberAgent
2026年度新卒技術研修 サイバーエージェントのデータベース 活用事例とパフォーマンス調査入門
cyberagentdevelopers
PRO
6
7.4k
マッチングアプリにおけるユーザー構成の変化は、事業KPIにどう影響しているのか
cyberagentdevelopers
PRO
1
78
Geo-Experiments : ABEMAはなぜ新しい宣伝の効果検証にチャレンジするのか
cyberagentdevelopers
PRO
2
770
ABEMA NEWSにおける PoCをAIプロダクト化する ビジネスリードエンジニアリング
cyberagentdevelopers
PRO
0
360
チーム開発の基礎_研究を事業につなげるために
cyberagentdevelopers
PRO
8
4.9k
生成AIの研究活用_AILab2025研修
cyberagentdevelopers
PRO
12
7.2k
生成AIを活用したデータ分析でいまできること
cyberagentdevelopers
PRO
2
480
IBC 2025 動画技術関連レポート / IBC 2025 Report
cyberagentdevelopers
PRO
2
490
2025年度 生成AI 実践編
cyberagentdevelopers
PRO
8
1.1k
Featured
See All Featured
Crafting Experiences
bethany
1
110
Are puppies a ranking factor?
jonoalderson
1
3.3k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.3k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Being A Developer After 40
akosma
91
590k
Navigating Weather and Climate Data
rabernat
0
160
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
710
Speed Design
sergeychernyshev
33
1.6k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
54k
A designer walks into a library…
pauljervisheath
211
24k
Transcript
CodeAgentとMCPで実現 するデータ分析エージェン ト 村脇 光洋 CA DATA NIGHT #6
自己紹介 村脇 光洋 職種:サーバーサイド 所属 : AI事業本部 アプリ運用カンパニー ➡ AI
POS カンパニー (2025/1~) 業務内容: ◦ 小売業/メーカー向けデータ分析SaaS開発 2
Table of Contents 1. プロダクト紹介「AI POS」 2. 事例紹介 : 分析コンテンツの開発速度を向上させるLLM利用
3. LLM領域の技術選定 3
プロダクト紹介「AI POS」 4
AI POS とは? 5
AI POS とは? 6 メールレポート チャット 小売業・製造業の方に 情報を提供
AI POS の システム構成 7 メール レポート チャット 多くの分析メニュー
ユーザの質問に応じた分析を、 LLMによる生成は行っていない (データの正確性が求められるため) AI POS におけるLLMの活用ポイント 8 メール レポート チャット
多くの分析メニュー
AI POS におけるLLMの活用ポイント 9 多くの分析メニュー 分析メニュー開発をLLMエージェントで高速化
分析コンテンツの開発速度を向上させる LLM利用 10
LLMを利用した分析メニュー開発のフロー 11 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する ② Cursorで事前定義済み(mdc)の設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック・修正。品質を担保
LLMを利用した分析メニュー開発のフロー 12 ② mdcファイルに事前定義済みの設計パターン に則ってプロトタイプをプロダクションコード化 ③ 人間がチェック。品質を担保 ① 分析エージェントを利用して分析メニューの プロトタイプを作成する
今回はこの分析エージェントの話をします
分析エージェント(実際のUI) 13 プロファイル(利用ツールなどエージェント設定)選択 プロファイル(利用ツールなどエージェント設定)選択 ツール群(MCPなどで連携)選択 分析定義 入力
分析エージェント(実際のUI) 14 カテゴリ情報 step1: カテゴリ情報取得 ※一部情報をマスクしています
分析エージェント(実際のUI) 15 ※一部情報をマスクしています step2: Queryを記述して データを取得
分析エージェント(実際のUI) 16 ※一部情報をマスクしています step3,4: 取得したデータを 加工して可視化
分析エージェントの効果 17 • 分析メニューの開発工数を1/3以下に圧縮 • 最終アウトプットを事前にメンバーが見ながら議論ができる • PMなど、開発メンバー以外でも分析メニューの作成ができる
分析エージェントの構成 18
分析エージェントの構成 19 エージェントの実装について
エージェントの実装 20 • フレームワークにHugging Face社の「smolagents」を採用 • 特徴 ◦ 動作原理にCodeActを採用 ◦
最小限の機能。ワークフローが組めない ◦ MCP対応 ◦ OpenTelemetry準拠 ◦ LLMモデルの切り替えが容易(litellm)
smolagentsの特徴 : CodeAct 21 関連 ReAct: https://arxiv.org/abs/2210.03629, CodeAct: https://arxiv.org/abs/2402.01030 (画像はCodeActの論文より引用)
従来のエージェントは、ツールとツールの繋ぎ込みに課題があった • 既存アプローチではjsonがtoolの インターフェース • toolの結果が、別のtoolへと渡さ れる時に欠損する • 扱う値の変換も容易ではない • CodeActはツール呼び出しを Python上で行うことで、それら の課題を解決
smolagentsの特徴 : CodeAct 22 具体例 : 先の分析の例 step2 sqlを実行し、結果を result変数に格納
smolagentsの特徴 : CodeAct 23 step4 step2で取得したresultを DataFrameとして利用 Pandasの機能を使って可視化するた めに、データをPython上で加工 Pythonの表現力を使って振る舞うこ
とができる 具体例 : 先の分析の例
LLM領域の技術選定 24
分析エージェントの構成 (再掲) 25
分析エージェントの構成 (再掲) 26 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用?
分析エージェントの構成 (再掲) 27 なぜツール定義にMCPを採用? なぜワークフローが組めないフレームワークを採用? LLM関連領域の技術発展が日進月歩なため
LLMとその周辺の技術状況 28 • 最高性能のモデルはすぐに更新される • エージェント/ワークフローツールは 乱立している • LLMにデータ、ツール、文脈を与える 手法も日夜開発されている
出典: https://www.insightpartners.com/ideas/ai-agents-disrupting-automation/
ベストプラクティスの覆りやすさ 29 エージェント部 : 高 基盤モデルの性能向上や、新手法、新プロダクトによって覆される (マルチエージェントの自社開発そのものがほぼ不要になるかも)
ベストプラクティスの覆りやすさ 30 ツール部分: 中 現在は多くのエージェントがMCPに対応しているので、すぐに使 えなくなることはない しかしE2B(仮想環境ベースの文脈付与)など別の手法が主流になる可 能性はある
ベストプラクティスの覆りやすさ 31 ツールが参照する自社情報の整備 : 低 (例: データベースのスキーマ、APIの仕様) MCPで繋いだとしても、メタ情報や活用すべきドメイン知識が、 アクセス可能な形で言語化されていないと、エージェントの性能 が高くても最大限の性能を出せない
技術の発展を考慮したチームリソースの投下 32 自社が投資しなくても進歩していく 自社が投資しないと進歩しない エージェント最適化 選択肢が移り変わりやすい 選択肢が変化しづらい MCP対応 LLMリーダブルに情報を整備 すぐ乗り換えられる
ように、軽量に実装 新しいMCPクライア ントをすぐに試すこ とができるので、 できるだけ対応 一定コストを払って整備 例: APIドキュメントを充実化 データベースを一般的な規格にし て、固有表現をなるべく排除。メ タデータを可能な限り付与
まとめ 33 • smolagentsで分析用のエージェントを開発 ◦ CodeActは複数ツール連携や、データ加工にPythonの表現 力を使えることが利点 • LLM領域の移り変わりが激しいことを考慮して技術選定を実施 ◦
『エージェント < MCPのツール < 元となるリソース 』の 優先順位で力を入れて整備すると報われやすいのでは?