Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLM監視基盤の選び方

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 LLM監視基盤の選び方

CA.ai#4 〜AIOpsの最前線〜 (https://cyberagent.connpass.com/event/383129/) で使用した資料になります。2025年後半から急激に注目を集める llm observability について、そのツール選定の大局観を整理します。

Avatar for Haruki Nagasawa

Haruki Nagasawa

March 02, 2026
Tweet

More Decks by Haruki Nagasawa

Other Decks in Technology

Transcript

  1. 自己紹介 長澤春希 (Nagasawa Haruki) • 東北大学 Tohoku NLP Group 出身

    ◦ 学部早期卒業後、修士課程に進学・修了 ◦ ACL・EMNLP・ICASSPなどの国際学会で発表 • 2023/10 よりサイバーエージェントに Join ◦ AI Shiftで機械学習エンジニアとして勤務 ◦ 音声認識精度の向上、チャットボットの改修、論文執筆、 自律型エージェントの開発、監視基盤のデプロイ・組み込み etc. • 好きなもの ◦ 梅干しとHipHopとLa La Land @sp_1999N
  2. LLM監視基盤は変化が激しい 2024/6: Datadog の LLM Observability 機能がGAとして発表 2025/2: Arize AI

    約110億円をシリーズCで調達 2025/3: W&B が CoreWeave に買収される 2025/8: Humanloop が Anthropic に買収される 2026/1: Langfuse が Clickhouse に買収される 2026/2: Braintrust 約120億円をシリーズBで調達 2026/3: Traceloop が ServiceNow に買収される https://www.datadoghq.com/about/latest-news/press-releases/datadog-llm-observability-is-now-generally-available-to-help-businesses-monitor-improve-and-secure-generative-ai-applications/ https://arize.com/blog/arize-ai-raises-70m-series-c-to-build-the-gold-standard-for-ai-evaluation-observability/ https://wandb.ai/wandb/wb-announcements/reports/W-B-being-acquired-by-CoreWeave--VmlldzoxMTY0MDI1MQ https://humanloop.com/ https://langfuse.com/blog/joining-clickhouse https://www.braintrust.dev/blog/announcing-series-b https://traceloop.com/blog/traceloop-is-joining-servicenow
  3. コラム:OpenLLMetry という存在 2023 OTelがLLM未対応 Traceloopが主導して 独自にOTelをLLM向け に拡張 =OpenLLMetry誕生 OTelがLLM対応開始 TraceloopもOTel

    GenAI SIGに参加 標準化をリード OpenLLMetryの セマンティック規約が OTelに正式統合 プロジェクト自体の 寄贈提案もされている 2024 https://www.traceloop.com/docs/openllmetry/contributing/s emantic-conventions https://github.com/open-telemetry/semantic-conventions/iss ues/327 2025 https://community.dynatrace.com/t5/AI-Observability/OpenL LMetry-semantic-conventions-are-now-part-of-OpenTeleme try/m-p/267984
  4. OpenTelemetry の観点から改めて見る 各種LLM監視ツールでは OTel 標準サポートを進めている Datadog:OTel GenAI Semantic Conventions v1.37+

    をネイティブ サポート(従来は独自 SDK が必要だった) LangSmith:2025 年 3 月にフル E2E OTel サポートを追加 Langfuse:OTLP エンドポイントを提供し、OpenLLMetry / OpenLIT のインストルメンテーションを受容 Arize Phoenix:OpenTelemetry 上に完全構築 その他、Dynatrace、New Relic、Grafana Cloud、Splunk、 Honeycomb が OTel GenAI テレメトリを受け入れ
  5. AI Shift では何を使っている? A. Langfuseをセルフホストしている • Why ◦ 利用しているMastraと親和性が高い ◦

    データは自社管理したい / マルチテナント運用したい ◦ 評価基盤としても利用できるものが良い • How ◦ Helm chartを dependency として取り込み、k8sで運用 ◦ RBACでの権限管理(エンタープライズ機能) ◦ 自社IDPを利用したSSOの強制
  6. 関連資料 本日お話しした内容に関連するものを公開しています よければご覧ください • Arize Phoenix で実現する LLM アプリケーションのトレース ◦

    https://www.ai-shift.co.jp/techblog/5608 • LLMエージェントオブサーバビリティ基盤についてまとめてみた ◦ https://www.ai-shift.co.jp/techblog/6009 • Langfuse セルフホストでハマったポイントをまとめてみる ◦ https://www.ai-shift.co.jp/techblog/6554 • OpenEvals × Langfuseで始めるAIエージェントのマルチターン評価 ◦ https://www.ai-shift.co.jp/techblog/6705 • Langfuseで支える AIエージェントの監視・評価 ◦ https://speakerdeck.com/haruki1999/langfusedezhi-eru-aiezientonojian-shi-ping-jia