Cloud Operator Days Tokyo 2025の動画セッションで登壇させていただいた際の資料です。
AI エージェントとは?オブザーバビリティとは?という概念の紹介から、AI エージェントを実運用する際のオブザーバビリティの実践について整理しています。
セッション概要:
AI エージェントの活用が急速に進む中でそれらを活用した運用監視の高度化(AIOps)とAI エージェント自体に対する運用監視の重要性が高まりつつあります。
AI エージェントの複雑な構成やブラックボックス化された内部ロジックは監視やトラブルシュートを困難にし、結果としてパフォーマンスの低下やコストの増大、ユーザーの信頼性の低下といったリスクを引き起こしかねません。
そこで本セッションでは、実際にAI エージェントをAIOpsの商用サービスとして提供すると共に、お客様が運用中のAI エージェントに対するオブザーバビリティを高めてきたDatadogの実績を踏まえ、AI エージェントに対するオブザーバビリティを高め、クラウドインフラからLLMの出力まで、AIスタック全体を可視化して深いインサイトを得るアプローチを解説します。
具体的には以下の内容を学べます:
AI エージェントとオブザーバビリティに関する基本的な概念
AI エージェントを実運用する上で直面する課題
AI エージェントに対してオブザーバビリティを実践する上でのポイント