$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LangfuseとClickHouse で進化するLLMOps
Search
Yuto Toya
September 20, 2025
3
2.1k
LangfuseとClickHouse で進化するLLMOps
Yuto Toya
September 20, 2025
Tweet
Share
More Decks by Yuto Toya
See All by Yuto Toya
DSPyとLangfuseで行うプロンプト最適化
toyayuto
0
120
Langfuse ✖️ Clickhouse MCPサーバを活用した分析
toyayuto
0
85
Langfuseを活用して、評価用プロンプトを育てていく
toyayuto
0
260
Langfuseを活用したLLM評価について
toyayuto
1
140
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Unsuck your backbone
ammeep
671
58k
Building Adaptive Systems
keathley
44
2.9k
A Tale of Four Properties
chriscoyier
162
23k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Why Our Code Smells
bkeepers
PRO
340
57k
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Transcript
ガオ株式会社 遠⽮ 侑⾳ ~トレースを価値に変える LLM評価エージェントの開発 ~ ServerlessDays Tokyo 2025/09/20 LangfuseとClickHouse
で進化する LLMOps
2 自己紹介
3 遠矢 侑音(Toya Yuto) ガオ株式会社 エンジニア Langfuseを活用した生成AIエージェントの開発や運 用のサポートを行なってます
4 エージェント改善の課題
5 トレースの必要性
6 可視化の課題とLangfuse
7 Langfuseとは • エージェントの挙動をグラフ形式で 可視化が可能 • コストとレイテンシの可視化も可能 • プロンプトの管理が可能 •
LLM as a JudgeをUIで設定可能 • セルフホスト可能 LLMアプリ開発~運用までをサポート するOSSのLLMOpsプラットフォーム
8 Langfuseのインフラ構成 • エージェントの挙動のトレースや LLM as a Judgeの スコアはClickhouseに格納
• サーバレスで作成も可能 ◦ Clickhouse CloudのAWSやGoogle Cloudでのデプロイによる、セット アップと運用の 負担軽減 構成図
9 Clickhouseとは • オープンソースのカラム指向データベース • データ圧縮率が高い • クエリパフォーマンスが他データベースと比べて高い • エージェントでDBを参照する際に、従量制課金ではない
◦ クエリごとの課金を考える必要性がない ClickHouseの高速性が、エージェントによる DBのリアルタイム分析を可能にし、優れ たユーザー体験と高いコストパフォーマンスを両立します。
10 評価の重要性
11 エージェントの評価の課題
12 評価エージェントのメリット
13 エージェントの役割
14 利用した技術・ツール
15 レポート結果 また、このようなエージェントを作ることでレポートの疑問点も適宜 対話していき、分析を行うことができる
16 BIツールでの分析との比較
17 このアプローチにより、LLMOpsにおける評価は単なるスコアリングから、 具体的な改善アクションに直結する 「意味のある活動へ」 進化します 継続的な改善サイクルを回すため強力なエンジンになる LLMOpsにおける評価(Eval)の進化
18 最後に
We’re hiring! https://www.gao-ai.com/contact
ご清聴ありがとうございました 20 (C) GAO, Inc.