Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
レバレジーズのLangfuse活用事例
Search
Tech Leverages
November 25, 2025
Technology
0
26
レバレジーズのLangfuse活用事例
2025/11/29に開催された「Data Engineering Summit 前夜祭」の登壇資料です。
https://langfuse.connpass.com/event/372733/
Tech Leverages
November 25, 2025
Tweet
Share
More Decks by Tech Leverages
See All by Tech Leverages
ディメンショナルモデリングを採用してない組織がモデリング本を通じて得られたこと
leveragestech
0
76
CloudComposerによる大規模ETL 「制御と実行の分離」の実践
leveragestech
0
360
「ELT職人」から卒業!Fivetranでデータパイプラインの構築・運用から解放され、 本来の価値創造に集中できる ようになった事例
leveragestech
0
33
SpecKitでどこまでできる? コストはどれくらい?
leveragestech
2
3.6k
未来を拓くAI技術〜エージェント開発とAI駆動開発〜
leveragestech
2
280
コンテキストエンジニアリングで変わるAI活用 リファクタリングワークフローの実践から学んだ形式知
leveragestech
0
170
AirflowでDataformを制御するポイント
leveragestech
0
140
古き良き Laravel のシステムは関数型スタイルでリファクタできるのか
leveragestech
1
1.5k
リファクタリングいつやるの? 〜依存の整理〜
leveragestech
0
200
Other Decks in Technology
See All in Technology
技術以外の世界に『越境』しエンジニアとして進化を遂げる 〜Kotlinへの愛とDevHRとしての挑戦を添えて〜
subroh0508
1
430
エンジニアリングマネージャー はじめての目標設定と評価
halkt
0
280
乗りこなせAI駆動開発の波
eltociear
1
1.1k
研究開発×プロダクトマネジメントへの挑戦 / ly_mlpm_meetup
sansan_randd
0
110
SSO方式とJumpアカウント方式の比較と設計方針
yuobayashi
7
600
re:Invent 2025 ふりかえり 生成AI版
takaakikakei
1
200
法人支出管理領域におけるソフトウェアアーキテクチャに基づいたテスト戦略の実践
ogugu9
1
220
LLM-Readyなデータ基盤を高速に構築するためのアジャイルデータモデリングの実例
kashira
0
240
文字列の並び順 / Unicode Collation
tmtms
3
550
最近のLinux普段づかいWaylandデスクトップ元年
penguin2716
1
690
MLflowで始めるプロンプト管理、評価、最適化
databricksjapan
1
140
コミューンのデータ分析AIエージェント「Community Sage」の紹介
fufufukakaka
0
480
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Thoughts on Productivity
jonyablonski
73
5k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
KATA
mclloyd
PRO
32
15k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
How to train your dragon (web standard)
notwaldorf
97
6.4k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Navigating Team Friction
lara
191
16k
Scaling GitHub
holman
464
140k
Raft: Consensus for Rubyists
vanstee
141
7.2k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.6k
Transcript
1 © 2025 Leverages Co., Ltd. レバレジーズのLangfuse活用
2 © 2025 Leverages Co., Ltd. 自己紹介
3 © 2025 Leverages Co., Ltd. 苑田 朝彰 普段の業務内容 •
AI エージェント開発(Google ADK, Strands Agent) • 社内AI推進(AI駆動開発、Agent開発) • クラウド(AWS, Google Cloud) 資格 • AWS Community Builders(ML) • 甲賀流忍者検定(中級) • 2024 AWS Top Engineers(前職) 趣味 • 月一で面白いことをするのにハマってます ◦ Spartanレース ◦ 100kmウォーキング ◦ 無人島かくれんぼ ◦ 滝行 SNS • https://x.com/sonoda_mj • https://zenn.dev/tomomj • https://note.com/sonoda_mj Tomotada Sonoda システム本部/テクノロジー戦略室/AIMLチーム 自己紹介
4 © 2025 Leverages Co., Ltd. Contents レバレジーズについて レバレジーズのAgent開発体制 レバレジーズのLangfuse活用事例
レバレジーズのチャレンジ まとめ 01. 02. 03. 04. 05.
5 © 2025 Leverages Co., Ltd. レバレジーズについて
会社概要 所在地 本社:渋⾕スクランブルスクエア 24 ‧ 25階 設⽴ 2005年 従業員数 正規:3,343名(2025年4⽉時点)
資本⾦ 5,000万円 年商 1428億円(2024年度) 事業内容 ⾃社メディア事業‧⼈材関連事業‧システムエンジニアリング 事業‧M&Aコンサルティング事業‧ ASP/ SaaS/クラウド関連 事業
創⽴20周年を迎えました👏 ◉公式Youtubeサイト ◉特設サイト 【レバレジーズ20周年】岩槻代表と辿る20年の軌跡
事業紹介 (※既存事業より⼀部抜粋) 医療‧介護 若年層 就活‧転職 M&A 海外 SaaS IT
事業紹介 アイデアから新しい事業を⽣み出す。 型を拡⼤し、効率化していく。 型を作り、事業をグロースさせていく。 0→1 1→10 10→100
売上推移 創業から黒字経営 年間130%成⻑
11 © 2025 Leverages Co., Ltd. レバレジーズの Agent開発体制
12 © 2025 Leverages Co., Ltd. インフラ基盤 LangfuseはEKSにセルフホストされています。インフラの運用・監視はSREチームが担当し ているので、AgentチームはAgentの開発に専念しています。
13 © 2025 Leverages Co., Ltd. 体制図 エンジニアは機能(Tool)を改善し、ドメインエキスパートはプロンプトを改善していま す。Langfuseで責務を分解し、 高速な改善サイクルを回しています。
Langfuse ドメイン エキスパート Agent 開発者 trace プロンプト改善 デプロイ ・Tool開発 ・システム改善
14 © 2025 Leverages Co., Ltd. レバレジーズの Langfuse活用事例
15 © 2025 Leverages Co., Ltd. Langfuseを中心としたPDCAサイクル トレース プロンプト管理 プロンプトを変更する
何が起きてるかみる Good/Badを評価する 評価 Agentを 動かす Langfuse 4部署が使用していて、合計で12プロジェクトが導入している!
16 © 2025 Leverages Co., Ltd. トレース AgentやLLMの実行フローを可視化し、複雑な挙動も簡単に確認できます。 Agentの軌跡 タグを追加
17 © 2025 Leverages Co., Ltd. トレース(マルチモーダル) 画像のようなマルチモーダルでも、きちんとtraceされる。update_current_generation機 能を使用することで、きちんとコストも表示される。 4枚生成している
18 © 2025 Leverages Co., Ltd. プロンプト管理 AgentのシステムプロンプトはLangfuseで管理しています。ドメインエキスパートが直接 Agentのシステムプロンプトを変更しています。 Agent
エンジニア ドメイン エキスパート Agent ドメイン エキスパート Before After
19 © 2025 Leverages Co., Ltd. プロンプト管理(ラベル戦略) dev環境はdevラベル、prd環境はproductionラベルで運用しています。ある一定の基準を満 たした場合のみproductionラベルをつけることで、品質を担保しています。 本番
Agent ドメイン エキスパート ラベル戦略なし 即反映 本番 Agent ドメイン エキスパート ラベル戦略あり ルール
20 © 2025 Leverages Co., Ltd. 評価の流れ(オフライン評価) 例:Agentが接続されているデータソースの情報を正しく返答するかをテスト Datasets 評価
Agent ドメイン エキスパート input output expected output 確認
21 © 2025 Leverages Co., Ltd. 評価の流れ(オフライン評価) 例:Agentが接続されているデータソースの情報を正しく返答するかをテスト Datasets 評価
Agent ドメイン エキスパート input output expected output 確認
22 © 2025 Leverages Co., Ltd. ダッシュボード 部署ごとにコストを確認するときに使用している。metadataでフィルタリングできるの で、組織情報をmetadataに追加するだけで対応可能。 Strands
Agents
23 © 2025 Leverages Co., Ltd. レバレジーズの チャレンジ
24 © 2025 Leverages Co., Ltd. マルチターンの評価 マルチターンは文脈考慮が必要であり、シングルターンに比べ評価難度が高くなります。 Langfuseの全ターントレースを用いてマルチターン評価パイプラインを構築予定です。 こんにちは!
自己紹介をお願いします! 苑田です! 自己紹介をお願いします! さっき言ったが?? ・同じ質問をしていないか ・会話内容を忘れていないか ・ロールに沿った質問をしているか などなど
25 © 2025 Leverages Co., Ltd. まとめ
26 © 2025 Leverages Co., Ltd. まとめ 1. LangfuseにTraceを送ることで、Agentの挙動が確認できる。 2.
Langfuseのプロンプト管理を使用することで、エンジニアの工数を削減。 3. LangfuseのDatasetを活用し、評価を簡単に実施。
27 © 2025 Leverages Co., Ltd. ご清聴ありがとう ございました!!