Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LangfuseでAIエージェントの 可観測性を高めよう!/Enhancing AI Agen...
Search
Junya Miyake
April 16, 2025
Technology
1
620
LangfuseでAIエージェントの 可観測性を高めよう!/Enhancing AI Agent Observability with Langfuse!
2025-4-16に開催された ML OpsコミュニティのAI AgentOps LT大会でお話しした内容です。
https://mlops.connpass.com/event/347046/
Junya Miyake
April 16, 2025
Tweet
Share
More Decks by Junya Miyake
See All by Junya Miyake
自律型コーディングエージェントでどこまで出来るかやってみる~ Claude Code vs GitHub Copilot(Agent mode) ~ / How Far Can Autonomous Coding Agents Go? ~Claude Code vs GitHub Copilot (Agent Mode)~
jnymyk
0
380
BEYOND THE RAG🚀 ~とりあえずRAG?を超えていけ! 本当に使えるAIエージェント&生成AIプロダクトを目指して~ / BEYOND-THE-RAG-Toward Practical-GenerativeAI-Products-AOAI-DevDay-2025
jnymyk
4
1.2k
完全に理解した!生成AI自社プロダクトのアジャイル開発の進め方!/ Fully understood! Agile tips for developing our generative AI product!(AOAI Dev Day)
jnymyk
5
2.7k
AzureでRAGをガンガン試行錯誤してみて得たナレッジを紹介します!/Azure RAG knowledge share
jnymyk
25
9.5k
GitHub Actions & オートスケールするSelf-hosted runnerで実現する KAGのみんなのCI/CD
jnymyk
5
1.5k
KDDIのTech blogを爆速レスポンスでつくったよ
jnymyk
3
310
Other Decks in Technology
See All in Technology
開発チームとQAエンジニアの新しい協業モデル -年末調整開発チームで実践する【QAリード施策】-
kaomi_wombat
0
200
GCASアップデート(202601-202603)
techniczna
0
250
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
430
事例から紐解くSHIFT流QA支援 ~大規模プロジェクトの品質管理支援、QA組織立ち上げ~ / 20260320 Nozomu Koketsu
shift_evolve
PRO
0
120
既存アプリの延命も,最新技術での新規開発も:WebSphereの最新情報
ktgrryt
0
110
SLI/SLO 導入で 避けるべきこと3選
yagikota
0
140
Windows ファイル共有(SMB)を再確認する
murachiakira
PRO
0
220
Phase10_組織浸透_データ活用
overflowinc
0
800
AIエージェント×GitHubで実現するQAナレッジの資産化と業務活用 / QA Knowledge as Assets with AI Agents & GitHub
tknw_hitsuji
0
150
Kiroで見直す開発プロセスとAI-DLC
k_adachi_01
0
110
1GB RAMのラズピッピで何ができるのか試してみよう / 20260319-rpijam-1gb-rpi-whats-possible
akkiesoft
0
720
Phase01_AI座学_基礎
overflowinc
0
2k
Featured
See All Featured
Google's AI Overviews - The New Search
badams
0
940
Believing is Seeing
oripsolob
1
90
Optimizing for Happiness
mojombo
378
71k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
180
Writing Fast Ruby
sferik
630
63k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.2k
Building Applications with DynamoDB
mza
96
7k
Embracing the Ebb and Flow
colly
88
5k
Everyday Curiosity
cassininazir
0
170
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
120
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
790
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
160
Transcript
AI AgentOps LT大会!!! LT#6 LangfuseでAIエージェントの 可観測性を高めよう! 2025.04.16 KDDIアジャイル開発センター株式会社(KAG) MJ (三宅
潤也 @jnymyk)
1 KDDI Agile Development Center Corporation 結論 • LangfuseでAIエージェントを見える化しよう (可観測性を高
めよう!) • チームやプロジェクトに応じて適切なLLM Opsツールを選択しよ う! ◦ Langfuseじゃなくても可観測性が担保できればどんなツールでもOK! • AIがどのような情報を受け取って、どんな処理をしているのか? 目的を達成するまでのプロセスやコストを適切に把握する必要が ある。(AIでも人でもこれは一緒) ◦ AIエージェントの開発・運用を持続可能な活動にしよう
2 KDDI Agile Development Center Corporation 自己紹介 • 三宅 潤也
Miyake Junya(@jnymyk) • MJ(えむじぇー)という芸人ネームで最近活動し 始めました!まずはXとSlackから ◦ コミュニティで三宅かぶり(ZENアーキテクツ三宅さん)、今日もトップバッターの @zawakinさんも三宅さん・・・ ◦ 社内でJunya Miyakeの字面かぶり(JunXX MiyaXXまで同じ)による誤爆メンショ ン多数・・・ • KDDIアジャイル開発センター(KAG)のスクラムマスター/エンジニア • チーム開発, クラウド(Azure/AWS), CI/CD, 生成AI/LLMアプリ開発が好 きです New!!!
3 KDDI Agile Development Center Corporation なぜ、AI AgentOpsでObservability ? •
複雑なマルチステップでの失敗要因を特定するため ◦ Traceで各ステップの入力・出力・LLM呼び出しを可視化 ◦ バグ・ハルシネーションを素早く特定
4 KDDI Agile Development Center Corporation なぜ、AI AgentOpsでObservability ? •
精度とコストのトレードオフのバランスを取るため ◦ リアルタイムでコストやレイテンシを見える化 ◦ 高コストな呼び出しを抑制しながら精度を検証
5 KDDI Agile Development Center Corporation AI AgentOpsツールとしてのLangfuseとは? • Langfuseとは?
◦ 生成AI(LLM)アプリケーション向けのOSS監視・ 分析プラットフォーム ◦ Self hosting or Cloudを選択可能。 • 複数人でクローズドな環境で利用するならSelf hosting • Self hostingは構築・継続メンテが大変なので、プラット フォームエンジニアリングチームで共通基盤にできると ベスト
6 KDDI Agile Development Center Corporation AI AgentOpsツールとしてのLangfuseとは? • Langfuseで出来ること
◦ トレース ◦ コスト追跡 ◦ LLMアプリケーションのパフォーマンス監視 ◦ プロンプトの管理 ◦ ユーザーフィードバックの収集と分析
7 KDDI Agile Development Center Corporation デモ • LangGraphで簡易的なQA AIエージェントを実装
• 問い合わせに対して複数のロールのエージェントが対応して目的を達成する までの過程をLangfuseで見える化
8 KDDI Agile Development Center Corporation デモ
9 KDDI Agile Development Center Corporation 実際のプロジェクトとLangfuseのユースケース • 社内問い合わせ業務の生成AIによる業務効率化 ◦
営業・SEからサービス企画部門へのサービス仕様・販売施策・契約手続等 の社内問い合わせ業務で生成AIを活用 ◦ 社内ドキュメントでRAGするAIチャット →正しい検索先を見てるか? →社内ドキュメント更新時のAI回答の継続的な精度評価
10 KDDI Agile Development Center Corporation 実際のプロジェクトとLangfuseのユースケース • 全社員向けの生成AIチャットへのDeep Research機能の組み込み
◦ Web検索, 社内文書を取り込んだベクトルDBへの検索 ◦ 単に検索結果の一部をコンテキストとして渡すのではなく、必 要な情報が揃ってレポートできるまで何度も検索を繰り返す →何回検索を繰り返して回答すると納得感のあるレポートを生成 できるか?を見極め →検索の繰り返し回数 vs コストのバランス
11 KDDI Agile Development Center Corporation [再掲]結論 • LangfuseでAIエージェントを見える化しよう (可観測性を高
めよう!) • チームやプロジェクトに応じて適切なLLM Opsツールを選択しよ う! ◦ Langfuseじゃなくても可観測性が担保できればどんなツールでもOK! • AIがどのような情報を受け取って、どんな処理をしているのか? 目的を達成するまでのプロセスやコストを適切に把握する必要が ある。(AIでも人でもこれは一緒) ◦ AIエージェントの開発・運用を持続可能な活動にしよう
Be a Change Leader. アジャイルに力を与え 共に成長し続ける社会を創る AI/MLやアジャイル開発に想いのあるエンジニア、スクラム マスター、デザイナー、プロダクトオーナー(PdM/PjM)を募 集中です! みなさん、ぜひ一緒に働きましょう!!!
採用関連note 採用サイト