AI Agent Agentic Workflow の可観測性 / Observability of AI Agent Agentic Workflow

AI Agent / Agentic Workflow の可観測性 AI Agents in Production
#1 2026/01/15 Joe/@joe_yuzupi

自己紹介

Joe (Yuzuru Ohira) © LayerX Inc. About Me 株式会社 LayerX
Ai Workforce 事業部テクニカルプロジェクトマネージャー 2025/7~ 趣味: ゴルフ(昨年40ラウンド前後) シングルになりたい。。。 3

事業紹介 © LayerX Inc. 4

一緒にイシューを解決してくれる仲間を募集しています © LayerX Inc. We're hiring! LayerX Ai Workforce 事業部
採用情報ページ 5

本日の流れ

アジェンダ © LayerX Inc. 本日の流れ Ai Workforce と Agentic Workflow
なぜ可観測性が難しいのか取り組みまとめ 7

話すこと話さないこと © LayerX Inc. 本日の流れ Ai Workforce と Agentic
Workflow なぜ可観測性が難しいのか取り組みまとめツールや技術の比較 8

Ai Workforce と Agentic Workflow

AI Workflow から Agentic Workflow へ従来の AI Workflow（ルールベース） ©
LayerX Inc. Ai Workforce と Agentic Workflow 当初はルールベースの AI Workflow を構築より広い業務領域をカバーするために柔軟な判断が必要に Agentic Workflow への移行を決断 10

Agentic Workflow とは従来の決定論的なワークフローと、自律的だが非決定論的な AI Agent の中間に位置づけられるシステム固定的なワークフローに、状況に応じて計画を柔軟
に組み替えるエージェント的なメカニズムを組み合わせた「半決定論的」なアプローチ © LayerX Inc. Ai Workforce と Agentic Workflow 11

AI Agent と Agentic Workflow 比較軸 AI Agents Agentic Workflows
定義与えられた目標に基づき、必要な手順を自ら立案・実行する自律的システム大枠のフローは人間が設計し、内部の判断・修正・最適化を AI が担う仕組み自律性のレベル高い：次に何をするか自律的に決める中程度〜高い：手順の構造は固定だが、ステップ内判断は AI が行う手順・計画決定の主体 AI 自身（環境を観察し計画を立てる）人間が大枠を設計し、AI はその中で判断を最適化柔軟性高い（予期せぬ状況にも対応しやすい）一定の柔軟性（フロー内で判断・修正できる）予測可能性低め（動的に振る舞う可能性があり予測困難）高め〜中（フローが固定なので比較的予測可能）制御・信頼性低め〜注意が必要（無限ループなどのリスクあり）高い（大枠が固定されていて制御しやすい） AI の役割ゴール達成のための計画立案／実行主体あらかじめ決められたステップ内で判断・調整を担当典型的な特徴例行動順序を自ら決める、計画の立案・実行・修正まで担う設計された一連の流れの中で、AI が「どの分岐を選ぶべきか」などを判断引用: https://www.youtube.com/watch?v=Qd6anWv0mv0 © LayerX Inc. Ai Workforce と Agentic Workflow 12

なぜ可観測性が難しいのか

なぜ可観測性が難しいのか → 従来のステップ実行モデルとは根本的に異なる © LayerX Inc. なぜ可観測性が難しいのか非決定性: 同じ入力でも異なる出力になり得る非同期処理:
複数の処理が並行して進む動的分岐: LLM の判断で処理経路が変わる 14

従来の Observability 3つの柱柱役割 Metrics 数値指標（レイテンシ、エラー率） Logs イベントの記録 Traces
リクエストの流れを追跡 → 「何が起きたか」は分かりやすい → なぜそうなったかは別の話 © LayerX Inc. なぜ可観測性が難しいのか 15

しかし AI Agent / Agentic Workflow では足りない従来の可観測性では見えないもの： © LayerX
Inc. なぜ可観測性が難しいのかなぜその判断をしたか（意思決定の根拠）どの選択肢を検討したか（判断経路）失敗がエージェント起因か、それともツール起因か（帰属） 16

非同期境界の多さ例: Ai Workforce の Agentic Workflow アーキテクチャ © LayerX
Inc. なぜ可観測性が難しいのか各境界でコンテキストが途切れるリスク → workflow_run_id / span_id の伝播が鍵 17

分岐理由の説明が困難請求書 → LLM 判定 → 要確認 ❓ なぜ？判断プロセスがブラックボックス
© LayerX Inc. なぜ可観測性が難しいのか AI の判断理由がログでは見えない「なぜこの請求書を要確認と判定したか」「なぜこの項目を自動抽出できなかったか」「なぜこの勘定科目を消耗品費と判断したか」 18

原因特定が困難 → 観測可能な状態ではなく説明可能な状態を目指したい © LayerX Inc. なぜ可観測性が難しいのか失敗・遅延がどのレイヤー起因か追いにくい LLM？DB？外部API？ネットワーク？キュー滞留？複数のコンポーネントが絡み合い、エラーが伝播
ノイジーネイバー問題: 特定テナントの過剰な LLM コールが全体に影響 19

取り組み

分散トレース（遅延の特定） Workflow Run └ Task A (OCR抽出) └ DB Read
(ドキュメント取得) └ LLM Call (項目抽出) └ DB Write (結果保存) └ Task B (仕訳判定) └ LLM Call (勘定科目判定) └ External API (会計システム) └ DB Write (仕訳保存) © LayerX Inc. 取り組み + 3.2s 1.3s 120ms 850ms 80ms 1.8s 720ms 580ms 150ms 可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ 21

非同期境界の伝播 © LayerX Inc. 取り組み非同期処理間でコンテキストを伝える trace_id / parent_id /
workflow_run_id を必ず引き継ぐキューイング時もヘッダーに含める 22

Span Links で非同期処理を繋ぐ親子関係を作らず、トレース間の関係性を表現 © LayerX Inc. 取り組み API がジョブ投入
→ 別プロセスのワーカーが実処理親子関係ではなくリンクで関連性を追跡 Ai Workforce では Assistant Orchestrator 間で活用 23

Span Links 実装例キューに載せる情報 → 詳細: tech.layerx.co.jp/entry/ai-agent-span-links © LayerX Inc.
取り組み traceparent / tracestate （W3C標準） Producer の SpanContext（trace_id / span_id） 24

属性設計後追い分析・フィルタリングのための属性：属性用途 workflow_run_id 1回の実行を一意に識別 task_type タスクの種類でフィルタ tenant_id テナント（顧客）単位の分析
workspace_id Workspace 単位の分析 model_name 使用した LLM モデル decision_path 判断経路の記録 © LayerX Inc. 取り組み 26

イベントログ設計状態変化をイベントとして記録 → 長時間実行や停滞を検出可能に © LayerX Inc. 取り組み task_started /
task_completed / task_failed llm_request_sent / llm_response_received decision_made (判断内容と根拠) 27

計画中: APM と AI Agent 間の相互連携トレーシング Application (APM) ↓ trace_id
/ parent_id ↓ AI Agent (LLM Observability) ┌───┼───┐ Task A Task B Task C © LayerX Inc. 取り組み既に APM 等が導入済みのため、シームレスな連携を期待 Datadog LLM Observability の導入を検討中 datadoghq.com/blog/monitor-ai-agents 28

Tips: 開発環境から導入する可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ © LayerX Inc. 取り組み可観測性は本番環境だけでなく開発環境から導入する開発時から計装を意識することで、
本番投入後のデバッグが容易にローカル環境でも可視化できる環境を整備 29

まとめ

まとめ © LayerX Inc. まとめ半決定論的な設計で観測ポイントを設計可能に従来の Observability + 意思決定の観測が必要
階層的 Trace / イベントログ / Timeline で実現観測可能な状態ではなく説明可能な状態を目指す 32

ご清聴ありがとうございました

AI Agent Agentic Workflow の可観測性 / Observability...

AI Agent Agentic Workflow の可観測性 / Observability of AI Agent Agentic Workflow

yuzujoe

More Decks by yuzujoe

Other Decks in Technology

Featured

Transcript

AI Agent / Agentic Workflow の可観測性 AI Agents in Production

自己紹介

Joe (Yuzuru Ohira) © LayerX Inc. About Me 株式会社 LayerX

事業紹介 © LayerX Inc. 4

一緒にイシューを解決してくれる仲間を募集しています © LayerX Inc. We're hiring! LayerX Ai Workforce 事業部

本日の流れ

アジェンダ © LayerX Inc. 本日の流れ Ai Workforce と Agentic Workflow

話すこと話さないこと © LayerX Inc. 本日の流れ Ai Workforce と Agentic

Ai Workforce と Agentic Workflow

AI Workflow から Agentic Workflow へ従来の AI Workflow（ルールベース） ©

Agentic Workflow とは従来の決定論的なワークフローと、自律的だが非決定論的な AI Agent の中間に位置づけられるシステム固定的なワークフローに、状況に応じて計画を柔軟

AI Agent と Agentic Workflow 比較軸 AI Agents Agentic Workflows

なぜ可観測性が難しいのか

なぜ可観測性が難しいのか → 従来のステップ実行モデルとは根本的に異なる © LayerX Inc. なぜ可観測性が難しいのか非決定性: 同じ入力でも異なる出力になり得る非同期処理:

従来の Observability 3つの柱柱役割 Metrics 数値指標（レイテンシ、エラー率） Logs イベントの記録 Traces

しかし AI Agent / Agentic Workflow では足りない従来の可観測性では見えないもの： © LayerX

非同期境界の多さ例: Ai Workforce の Agentic Workflow アーキテクチャ © LayerX

分岐理由の説明が困難請求書 → LLM 判定 → 要確認 ❓ なぜ？判断プロセスがブラックボックス

取り組み

分散トレース（遅延の特定） Workflow Run └ Task A (OCR抽出) └ DB Read

非同期境界の伝播 © LayerX Inc. 取り組み非同期処理間でコンテキストを伝える trace_id / parent_id /

Span Links で非同期処理を繋ぐ親子関係を作らず、トレース間の関係性を表現 © LayerX Inc. 取り組み API がジョブ投入

Span Links 実装例キューに載せる情報 → 詳細: tech.layerx.co.jp/entry/ai-agent-span-links © LayerX Inc.

実例: Span Links の双方向リンク API側トレース → Forward Backward ← Worker側トレース

属性設計後追い分析・フィルタリングのための属性：属性用途 workflow_run_id 1回の実行を一意に識別 task_type タスクの種類でフィルタ tenant_id テナント（顧客）単位の分析

イベントログ設計状態変化をイベントとして記録 → 長時間実行や停滞を検出可能に © LayerX Inc. 取り組み task_started /

計画中: APM と AI Agent 間の相互連携トレーシング Application (APM) ↓ trace_id

Tips: 開発環境から導入する可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ © LayerX Inc. 取り組み可観測性は本番環境だけでなく開発環境から導入する開発時から計装を意識することで、

まとめ

これからやっていくことテーマ内容スケール/SLO SLO に基づいた可用性・スケール設計ツール/モデル増加標準化された観測設計が必要に監査/ガバナンス「何がどこで起きたか」を証明する必要性

まとめ © LayerX Inc. まとめ半決定論的な設計で観測ポイントを設計可能に従来の Observability + 意思決定の観測が必要

ご清聴ありがとうございました