エージェント開発におけるObservability

エージェント開発における Observability 2025/10/31 @UB Tech vol.21 1 1 株式会社ユーザベーススピーダ事業
小玉祐輝

自己紹介 • @kuy / 小玉祐輝 • 株式会社ユーザベーススピーダ事業フェロー
• 今年に入ってからPythonを書く機会が増えた 🐍 • コーヒーが大好きで、来年パナマの農園に遊びに行く ☕ 2

背景 3

LLM Observabilityことはじめトークン数とコストの算出まとめ 01 02 03 4

5 LLM Observabilityことはじめ | 01 |

Observabilityとは？ • 可観測性: システム内部で何が起こっているのか、外部からどれだけ詳しく把握できるか • なぜ重要なのか: クラウドネイティブ、マイクロサービスな環境においてはシステムが複雑かつ分散していて、状況把握だけでも一筋縄ではいかない •
目的の違い: Monitoring（監視）は既知の問題の検知。Observabilityは未知の問題の発見を支援する基盤の提供。 • 実現のための要素: ログ、メトリクス、トレース 6

LLMおよびAIエージェントにおけるObservability LLM向けに当てはめると例えば・・・ • ログ ◦ LLMのInputとOutputは重要なデバッグ情報 • トレース ◦ ツール呼び出し（特にAPI、MCP、RAG）
◦ エージェント同士の連携 ◦ LLM呼び出しにかかった時間 • メトリクス ◦ 使用したトークン数 7

手軽にLLM Observabilityをはじめる • 料理レシピを分析するAIエージェントに組み込んで検証 ◦ レシピ一覧を取得して、各レシピ発祥の地とレシピ投稿者の所在地が一致しているか判断する ◦ サンプルコード: https://github.com/kuy/adk-ddtrace-example
• Google ADK PythonとDatadogの組み合わせ ◦ ADKはできるだけ最新を使う（2週間に1回の定期アップデート） ◦ DatadogはADK向けの改善が入った dd-trace-py 3.16.1 以降がおすすめ 8

構成図 9

エージェントの実行結果 10

Datadogでの表示 11

Google ADK + Datadogの落とし穴 15 • import ddtrace.auto ではLLM Observabilityが自動的に有効にならなかった
◦ from ddtrace.llmobs import LLMObs して手動で LLMObs.enable() • DD_LLMOBS_ENABLED や DD_LLMOBS_AGENTLESS_ENABLED は指定しても効果はなかった • DatadogにはDatadog Agent（データ送信するための常駐プログラム）経由で各種データを送信する必要があり、ローカル環境で動かすには工夫が必要 ◦ http://localhost:8162 に対して送信する ◦ 例えば本番環境にDatadog Agentがあるならプロキシで転送する ◦ 稼働しているDatadog Agentの数で課金されるので注意！

16 トークン数とコストの算出 | 02 |

LLMのコスト、トークン数 • LLMのコストはモデルとトークン数で決まる • トークンにはInputトークンとOutputトークンがある ◦ Inputトークン: システムプロンプト、ユーザープロンプト、その他LLMに読み込ませるあらゆるもの ◦
Outputトークン: LLMから出力された回答 • 一般にOutputトークンの方がInputトークンよりコストが高い例: Gemini 2.5 Flashの場合、100万Inputトークンあたり$0.3、100万Outputトークンあたり$2.5 (※ 2025/10/21 時点) 17

コスト計算してみる • data_collection: get_recipes ◦ Input: 163, Output: 39 (gemini-2.5-flash)
• data_collection: get_user（3回） ◦ Input: 676, Output: 179 (gemini-2.5-flash) ◦ Input: 1007, Output: 168 (gemini-2.5-flash) ◦ Input: 1452, Output: 120 (gemini-2.5-flash) • data_collection: 取得したデータの整理 ◦ Input: 1850, Output: 391 (gemini-2.5-flash) • analysis ◦ Input: 3240, Output: 1220 (gemini-2.5-pro) 18 • トークン合計 ◦ Input: 5148, Output: 897 (gemini-2.5-flash) ◦ Input: 3240, Output: 1220 (gemini-2.5-pro) • コスト算出 ◦ Input: $0.0015444, Output: $0.0022425（flash） ◦ Input: $0.00405, Output: $0.0122（pro） • 合計: $0.0200369 = 約3.1円（1ドル154円換算） ※ 画像のEstimated Costはモデル設定をしていないため間違った料金が表示されています（Gemini未対応？） ※ Inputトークンは部分的にキャッシュされることがあり、その場合はキャッシュが有効なときの料金で計算する必要があります

19 まとめ | 04 |

まとめ • Google ADK PythonとDatadogでお手軽にLLM Observabilityを試せる • A2Aを介したマルチエージェント構成ではトークン算出にのびしろあり ◦ Datadogのtrace
id付きでGoogle CloudのCloud Loggingにログを飛ばして、trace idですべてのログをかき集めてトークン集計してコスト算出したりした • エージェント開発・運用においてObservabilityはこれまで以上に重要 • LLM Observabilityはエコシステムが急激に進化している熱い分野 20

最後までご清聴ありがとうございました。 Thank you 21

エージェント開発におけるObservability

エージェント開発におけるObservability

Yuki Kodama

More Decks by Yuki Kodama

Featured

Transcript