Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LangfuseとClickHouse で進化するLLMOps
Search
Yuto Toya
September 20, 2025
3
2.3k
LangfuseとClickHouse で進化するLLMOps
Yuto Toya
September 20, 2025
Tweet
Share
More Decks by Yuto Toya
See All by Yuto Toya
DSPyとLangfuseで行うプロンプト最適化
toyayuto
0
170
Langfuse ✖️ Clickhouse MCPサーバを活用した分析
toyayuto
0
89
Langfuseを活用して、評価用プロンプトを育てていく
toyayuto
0
280
Langfuseを活用したLLM評価について
toyayuto
1
150
Featured
See All Featured
WENDY [Excerpt]
tessaabrams
9
35k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
AI: The stuff that nobody shows you
jnunemaker
PRO
2
190
How to Talk to Developers About Accessibility
jct
1
100
How to train your dragon (web standard)
notwaldorf
97
6.5k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
100
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
410
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
140
Between Models and Reality
mayunak
1
170
Transcript
ガオ株式会社 遠⽮ 侑⾳ ~トレースを価値に変える LLM評価エージェントの開発 ~ ServerlessDays Tokyo 2025/09/20 LangfuseとClickHouse
で進化する LLMOps
2 自己紹介
3 遠矢 侑音(Toya Yuto) ガオ株式会社 エンジニア Langfuseを活用した生成AIエージェントの開発や運 用のサポートを行なってます
4 エージェント改善の課題
5 トレースの必要性
6 可視化の課題とLangfuse
7 Langfuseとは • エージェントの挙動をグラフ形式で 可視化が可能 • コストとレイテンシの可視化も可能 • プロンプトの管理が可能 •
LLM as a JudgeをUIで設定可能 • セルフホスト可能 LLMアプリ開発~運用までをサポート するOSSのLLMOpsプラットフォーム
8 Langfuseのインフラ構成 • エージェントの挙動のトレースや LLM as a Judgeの スコアはClickhouseに格納
• サーバレスで作成も可能 ◦ Clickhouse CloudのAWSやGoogle Cloudでのデプロイによる、セット アップと運用の 負担軽減 構成図
9 Clickhouseとは • オープンソースのカラム指向データベース • データ圧縮率が高い • クエリパフォーマンスが他データベースと比べて高い • エージェントでDBを参照する際に、従量制課金ではない
◦ クエリごとの課金を考える必要性がない ClickHouseの高速性が、エージェントによる DBのリアルタイム分析を可能にし、優れ たユーザー体験と高いコストパフォーマンスを両立します。
10 評価の重要性
11 エージェントの評価の課題
12 評価エージェントのメリット
13 エージェントの役割
14 利用した技術・ツール
15 レポート結果 また、このようなエージェントを作ることでレポートの疑問点も適宜 対話していき、分析を行うことができる
16 BIツールでの分析との比較
17 このアプローチにより、LLMOpsにおける評価は単なるスコアリングから、 具体的な改善アクションに直結する 「意味のある活動へ」 進化します 継続的な改善サイクルを回すため強力なエンジンになる LLMOpsにおける評価(Eval)の進化
18 最後に
We’re hiring! https://www.gao-ai.com/contact
ご清聴ありがとうございました 20 (C) GAO, Inc.