Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Langfuse ✖️ Clickhouse MCPサーバを活用した分析
Search
Yuto Toya
June 05, 2025
0
75
Langfuse ✖️ Clickhouse MCPサーバを活用した分析
Yuto Toya
June 05, 2025
Tweet
Share
More Decks by Yuto Toya
See All by Yuto Toya
LangfuseとClickHouse で進化するLLMOps
toyayuto
3
1.3k
Langfuseを活用して、評価用プロンプトを育てていく
toyayuto
0
210
Langfuseを活用したLLM評価について
toyayuto
1
120
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
830
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Thoughts on Productivity
jonyablonski
70
4.8k
GraphQLとの向き合い方2022年版
quramy
49
14k
How to Ace a Technical Interview
jacobian
280
23k
Fireside Chat
paigeccino
40
3.6k
Six Lessons from altMBA
skipperchong
28
4k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
188
55k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
940
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
30
2.9k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Transcript
Langfuse 概要・ClickhouseのMCPサー バーによってできること Yuto Toya ガオ株式会社
自己紹介
スピーカー 遠矢侑音(Toya Yuto) ガオ株式会社 エンジニア 主に、Langfuseを活用したLLMシステムの 運用のサポートなどを行なってます。
Langfuseとは? LLMの開発~デバッグまでをサポートするOSSの LLMOpsプラットフォーム
Langfuse v2の課題 v2の構成図 Langfuse v2のスケール課題 PostgreSQLの限界に直面 • 毎分数万イベント :処理が必要な規模に成長 •
取り込み API: 50 秒:レスポンス(スパイク時) • プロンプト API: 7 秒:レイテンシ(p95) • 分析クエリ : 数十億行でダッシュボード使用不能 根本原因:行指向ストレージの限界 • IOPS 枯渇: 大量書き込みでI/O 限界 • CPU 消費: トークン化処理で CPU 急騰 • 分析性能 : 全列読み込みで非効率 • スケール困難 : 垂直スケールのみ、コスト急増
Langfuse v3構成 v3の構成図 Langfuse v3の解決策 • ClickHouseによる改善 ◦ PostgreSQLの行指向ストレージから列指向 ストレージに移行することで、分析クエリを
30秒以上→1秒未満に改善 ◦ 数十億行のダッシュボードが使用不能から 高速表示に変化 ◦ ReplacingMergeTreeエンジンで更新処理を 挿入+バックグラウンド重複除去に変更し、 IOPSボトルネックを解決 ◦ ストレージを 5-10倍圧縮してコスト削減も実現 • Redis + 非同期処理による改善 • S3 + イベント駆動による改善
Clickhouse導入結果( v3)
None
LLMシステム評価における主要課題 たとえば... • 評価の基準がハッキリしない • 評価するのが大変・時間がかかる • 評価しても次に活かせない 根本的な課題:改善サイクルの停滞 LLMの評価は複雑のため、その結果として「どのように改善すれば良いのか」
という具体的な道筋が見えにくい状況
従来のデータ分析の限界と「眠れる Traceデータ」 従来のBIツールでは、LLMの複雑な挙動や背景にある「なぜ?」は深掘りできない 実は、そのヒントは「Traceデータ」に眠っている。しかし、その活用ができていないため、貯めているだ けのデータの塊になっている
私たちの挑戦 この眠っているデータの塊である Traceデータに、 それによって、LLMの評価と改善を加速することを目指す 「Traceデータに価値を与える」 生成AIの力で「意味」と「価値」を与えたい
なので、LLMの出力結果等のトレースの情報を格納し ているDBを分析して、プロンプトの改善レポートを出 力するエージェントを作ってみた
利用した主なツール・技術
結果 まずはClickhouseのMCPを利用して、必要なデータを取得 (プロンプトにある程度のDB内の情報を記載済み)
次に、Generation HTML MCPを利用してレポートの作成を行う
これが、Traceデータに「価値を与えた」結果としての分析レポート例です。 単なるデータの羅列ではなく、具体的な洞察や改善案に繋がります。 プロンプトの 改善案例 分析結果
これまでの分析との違い: BIツールを超えて 従来のBIツールでは見えにくかった「なぜこのスコアなのか?」 「どうすれば改善できるのか」という問いに直接的に迫れます。 静的なレポーティングからから動的な分析と改善が可能
LLMOpsにおける評価( Eval)の進化 このアプローチにより、LLMOpsにおける評価は単なるスコアリングから、具体的な改善アクションに 直結する「意味のある活動へ」 進化します 継続的な改善サイクルを回すため強⼒なエンジンになる
まとめ • Traceデータの戦略的活用が鍵 ◦ LLMシステムの評価・分析において、Traceデータの収集・蓄積された不可欠 です。 • LLMによる進化した分析・評価 ◦ 従来のBIツールでは見えなかった「なぜ?」
に迫る分析・評価が、 Clickhouse MCPやADKの活用で誰でも簡単にデータ分析の実現を行うシス テムの作成が可能になります。 • AIエージェント開発の加速 ◦ MCPとADKを組み合わせることで、高度なAIエージェント開発も、 より迅速かつ容易になります。
None