Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI Agent Agentic Workflow の可観測性 / Observability...
Search
yuzujoe
January 16, 2026
Technology
2.7k
10
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AI Agent Agentic Workflow の可観測性 / Observability of AI Agent Agentic Workflow
yuzujoe
January 16, 2026
More Decks by yuzujoe
See All by yuzujoe
AI Agent をどう観測するか - AI Workforce における OpenTelemetry 計装の実践 / How to Observe AI Agents: Implementing OpenTelemetry for the AI Workforce
yuzujoe
3
1.1k
2人のチームでどうやって開発者をkubernetes開発に巻き込んでいくか
yuzujoe
2
530
GitOps環境におけるremote_clusterでの開発
yuzujoe
0
580
Other Decks in Technology
See All in Technology
Rubyで音を視る
ydah
1
100
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
7
4.1k
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
19
11k
そのPoC、何を検証したつもりでしたか? AIプロダクトの価値検証で陥った落とし穴
techtekt
PRO
0
150
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
220
美味しいスイスチーズを作ろう🧀🐭
taigamikami
1
250
正解のないAIプロダクトをどう導くか?dodaが挑む、ユーザーの『本音』を構造化する評価設計と検証のリアル
techtekt
PRO
0
190
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
49
54k
運用を見据えたAIエージェント設計実践
amacbee
1
3.1k
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
510
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.7k
protovalidate-es を導入してみた
bengo4com
0
130
Featured
See All Featured
Making Projects Easy
brettharned
120
6.7k
Statistics for Hackers
jakevdp
799
230k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
So, you think you're a good person
axbom
PRO
2
2.1k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
240
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
250
Transcript
AI Agent / Agentic Workflow の可観測性 AI Agents in Production
#1 2026/01/15 Joe/@joe_yuzupi
自己紹介
Joe (Yuzuru Ohira) © LayerX Inc. About Me 株式会社 LayerX
Ai Workforce 事業部 テクニカルプロジェクトマネージャー 2025/7~ 趣味: ゴルフ(昨年40ラウンド前後) シングルになりたい。 。 。 3
事業紹介 © LayerX Inc. 4
一緒にイシューを解決してくれる仲間を募集しています © LayerX Inc. We're hiring! LayerX Ai Workforce 事業部
採用情報ページ 5
本日の流れ
アジェンダ © LayerX Inc. 本日の流れ Ai Workforce と Agentic Workflow
なぜ可観測性が難しいのか 取り組み まとめ 7
話すこと 話さないこと © LayerX Inc. 本日の流れ Ai Workforce と Agentic
Workflow なぜ可観測性が難しいのか 取り組み まとめ ツールや技術の比較 8
Ai Workforce と Agentic Workflow
AI Workflow から Agentic Workflow へ 従来の AI Workflow(ルールベース) ©
LayerX Inc. Ai Workforce と Agentic Workflow 当初はルールベースの AI Workflow を構築 より広い業務領域をカ バーするために柔軟な 判断が必要に Agentic Workflow へ の移行を決断 10
Agentic Workflow とは 従来の決定論的なワークフローと、 自律的だが非決定論的な AI Agent の中間に位置づ けられるシステム 固定的なワークフローに、状況に応じて計画を柔軟
に組み替えるエージェント的なメカニズムを組み合 わせた 「半決定論的」 なアプローチ © LayerX Inc. Ai Workforce と Agentic Workflow 11
AI Agent と Agentic Workflow 比較軸 AI Agents Agentic Workflows
定義 与えられた目標に基づき、必要な手順を自ら立案・実行する自 律的システム 大枠のフローは人間が設計し、内部の判断・修正・最適化を AI が 担う仕組み 自律性のレベル 高い:次に何をするか自律的に決める 中程度〜高い:手順の構造は固定だが、ステップ内判断は AI が行 う 手順・計画決定の 主体 AI 自身(環境を観察し計画を立てる) 人間が大枠を設計し、AI はその中で判断を最適化 柔軟性 高い(予期せぬ状況にも対応しやすい) 一定の柔軟性(フロー内で判断・修正できる) 予測可能性 低め(動的に振る舞う可能性があり予測困難) 高め〜中(フローが固定なので比較的予測可能) 制御・信頼性 低め〜注意が必要(無限ループなどのリスクあり) 高い(大枠が固定されていて制御しやすい) AI の役割 ゴール達成のための計画立案/実行主体 あらかじめ決められたステップ内で判断・調整を担当 典型的な特徴例 行動順序を自ら決める、計画の立案・実行・修正まで担う 設計された一連の流れの中で、AI が「どの分岐を選ぶべきか」な どを判断 引用: https://www.youtube.com/watch?v=Qd6anWv0mv0 © LayerX Inc. Ai Workforce と Agentic Workflow 12
なぜ可観測性が難しいのか
なぜ可観測性が難しいのか → 従来のステップ実行モデルとは根本的に異なる © LayerX Inc. なぜ可観測性が難しいのか 非決定性: 同じ入力でも異なる出力になり得る 非同期処理:
複数の処理が並行して進む 動的分岐: LLM の判断で処理経路が変わる 14
従来の Observability 3つの柱 柱 役割 Metrics 数値指標(レイテンシ、エラー率) Logs イベントの記録 Traces
リクエストの流れを追跡 → 「何が起きたか」は分かりやすい → なぜそうなったかは別の話 © LayerX Inc. なぜ可観測性が難しいのか 15
しかし AI Agent / Agentic Workflow では足りない 従来の可観測性では見えないもの: © LayerX
Inc. なぜ可観測性が難しいのか なぜその判断をしたか(意思決定の根拠) どの選択肢を検討したか(判断経路) 失敗がエージェント起因か、それともツール起因か(帰属) 16
非同期境界の多さ 例: Ai Workforce の Agentic Workflow アーキテクチャ © LayerX
Inc. なぜ可観測性が難しいのか 各境界でコンテキストが途切れるリスク → workflow_run_id / span_id の伝播が鍵 17
分岐理由の説明が困難 請求書 → LLM 判定 → 要確認 ❓ なぜ? 判断プロセスがブラックボックス
© LayerX Inc. なぜ可観測性が難しいのか AI の判断理由がログでは見えない 「なぜこの請求書を要確認と判定した か」 「なぜこの項目を自動抽出できなかった か」 「なぜこの勘定科目を消耗品費と判断し たか」 18
原因特定が困難 → 観測可能な状態ではなく説明可能な状態を目指したい © LayerX Inc. なぜ可観測性が難しいのか 失敗・遅延がどのレイヤー起因か追いにくい LLM?DB?外部API?ネットワーク?キュー滞留? 複数のコンポーネントが絡み合い、エラーが伝播
ノイジーネイバー問題: 特定テナントの過剰な LLM コールが全体に影響 19
取り組み
分散トレース(遅延の特定) Workflow Run └ Task A (OCR抽出) └ DB Read
(ドキュメント取得) └ LLM Call (項目抽出) └ DB Write (結果保存) └ Task B (仕訳判定) └ LLM Call (勘定科目判定) └ External API (会計システム) └ DB Write (仕訳保存) © LayerX Inc. 取り組み + 3.2s 1.3s 120ms 850ms 80ms 1.8s 720ms 580ms 150ms 可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ 21
非同期境界の伝播 © LayerX Inc. 取り組み 非同期処理間でコンテキストを伝える trace_id / parent_id /
workflow_run_id を必ず引き継ぐ キューイング時もヘッダーに含める 22
Span Links で非同期処理を繋ぐ 親子関係を作らず、トレース間の関係性を表現 © LayerX Inc. 取り組み API がジョブ投入
→ 別プロセスのワーカーが実処理 親子関係ではなくリンクで関連性を追跡 Ai Workforce では Assistant Orchestrator 間で活用 23
Span Links 実装例 キューに載せる情報 → 詳細: tech.layerx.co.jp/entry/ai-agent-span-links © LayerX Inc.
取り組み traceparent / tracestate (W3C標準) Producer の SpanContext(trace_id / span_id) 24
実例: Span Links の双方向リンク API側トレース → Forward Backward ← Worker側トレース
© LayerX Inc. 取り組み 25
属性設計 後追い分析・フィルタリングのための属性: 属性 用途 workflow_run_id 1回の実行を一意に識別 task_type タスクの種類でフィルタ tenant_id テナント(顧客)単位の分析
workspace_id Workspace 単位の分析 model_name 使用した LLM モデル decision_path 判断経路の記録 © LayerX Inc. 取り組み 26
イベントログ設計 状態変化をイベントとして記録 → 長時間実行や停滞を検出可能に © LayerX Inc. 取り組み task_started /
task_completed / task_failed llm_request_sent / llm_response_received decision_made (判断内容と根拠) 27
計画中: APM と AI Agent 間の相互連携トレーシング Application (APM) ↓ trace_id
/ parent_id ↓ AI Agent (LLM Observability) ┌───┼───┐ Task A Task B Task C © LayerX Inc. 取り組み 既に APM 等が導入済みのため、 シームレスな連携を期待 Datadog LLM Observability の導 入を検討中 datadoghq.com/blog/monitor-ai-agents 28
Tips: 開発環境から導入する 可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ © LayerX Inc. 取り組み 可観測性は本番環境だけでなく開発 環境から導入する 開発時から計装を意識することで、
本番投入後のデバッグが容易に ローカル環境でも可視化できる環境 を整備 29
まとめ
これからやっていくこと テーマ 内容 スケール/SLO SLO に基づいた可用性・スケール設計 ツール/モデル増加 標準化された観測設計が必要に 監査/ガバナンス 「何がどこで起きたか」を証明する必要性
© LayerX Inc. まとめ 31
まとめ © LayerX Inc. まとめ 半決定論的な設計で観測ポイントを設計可能に 従来の Observability + 意思決定の観測が必要
階層的 Trace / イベントログ / Timeline で実現 観測可能な状態ではなく説明可能な状態を目指す 32
ご清聴ありがとうございました