Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI × Incident Response: What ’s Next?

Avatar for kenta_hi kenta_hi
September 19, 2025
17

AI × Incident Response: What ’s Next?

Youtrust主催のHistory Confarence 2025でおこなったLTです。

https://lp-prohis.youtrust.jp/

Avatar for kenta_hi

kenta_hi

September 19, 2025
Tweet

Transcript

  1. AI × Incident Response: What’s Next? 株式会社 Topotal / Kenta

    Hishida (@kenta_hi) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) 1
  2. Kenta Hisihda @kenta_hi Director @ Topotal, Inc. 2 PRODUCT HISTORY

    CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
  3. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか

    一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析
  4. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか

    一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析 Triage~Test/Treatの 支援はこれから
  5. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ビジネス影響が限られたものは、重大度が低いインシデント

    インシデント対応のTriageで重大度を定めます。重大度に応じて対応方針が決 まっている。 ※1 : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介  株式会社Topotal 髙村成道  https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 HIGH (P1) 大多数の顧客に対して明確に不 便を感じさせる劣化が生じてい る 迅速な対応が必要(24h365d、 15分以内着手) 該当エンジニアチームにページ ング 関連エンジニアチームのリー ダーに通知。影響を受けた顧客 へのコミュニケーションを検討 WARNING (P2) 一部の顧客に対して顧客体験の 軽度な劣化が生じている 営業時間帯に他の業務よりも優 先して対応 営業時間内のみページング 関連エンジニアチームのマネー ジャーに通知。重要顧客のみ対 応検討 INFO (P3) 顧客体験に目立った劣化がない か、非常に軽微な影響が生じて いる 通常業務と並行して勤務時間内 に対応 ページング不要 関連エンジニアチームのマネー ジャーに通知。顧客向け通知は 不要
  6. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1

    : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介  株式会社Topotal 髙村成道  https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 重大度の低いINFOやWARNINGに 対して、AIを活用するのが現実的 さらにAIの行動を人が承認する フローにすることで 広範囲なAIの活用が可能に AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
  7. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1

    : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介  株式会社Topotal 髙村成道  https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 近い将来、「つらい」インシデン ト対応はなくなるのではないで しょうか 重大度の低いものはよく発生する ので、AIに任せるだけでも楽にな るはずです。 AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
  8. 6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) Waroom

    MCP デモ ※3 https://www.youtube.com/watch?v=uydmjdv0Efs