Response & AI î 前述のような課題を解決するために AI / LLM を活用するケースが増えてきÛ î 「難しい」「つらい」「大変」「職人芸」の部分を AI で支援すÙ î 例えば 2025/07 段階の Waroom では次のようなことが出来Ù î インシデント情報のサマライズ・ポストモーテムの自動生µ î 一方で AI / LLM の領域はどんどん進化を遂げていÙ î Model Context Protocol (MCPá î AI が様々なリソースにアクセスして情報を取得・更新可能になっÛ î Coding Agent (Claude Code, Devin, GitHub Copilot Agent, ...á î AI がタスク分解→コード生成→テスト実行→PR まで自律的に可能 î → Incident Response 領域でもこれらを活用してより「楽に」なれそI î → AI と Incident Response 領域の現在地と今後はどうなっていくのか? 17
Response: AIOps View 33 ö 一方で AI のインシデントレスポンスの「安全性」「精度」は大きな課Ç É コード生成に関しては莫大なデータセットがあって上手くいきがl É 実際のオペレーションや障害緩和策はデータセットが少ないがl É いい精度を出すのが今のところはコード生成に比べると難しp ö OpenRCA ( github.com/microsoft/OpenRCA ) ― Xu et al., ICLR 202e É 過去の実際の障害対応を題材にした Root Cause Analysis ベンチマーy É 335 件の障害ケースと 68GB 超のログ・メトリクス・トレースを収÷ É AI に「原因コンポーネント」「発生時刻」「理由」の3つを答えさせw ö Claude 3.5 Sonnet + Multi-Agent でも正答率は 11% 程P ö 単純なシステムでは精度が高いが複雑になると精度が大きく低下