Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI × Incident Response: What ’s Next?
Search
kenta_hi
September 19, 2025
0
230
AI × Incident Response: What ’s Next?
Youtrust主催のHistory Confarence 2025でおこなったLTです。
https://lp-prohis.youtrust.jp/
kenta_hi
September 19, 2025
Tweet
Share
More Decks by kenta_hi
See All by kenta_hi
SREの組織類型に応じた リーダシップの考察
kenta_hi
2
950
SRE NEXT 2024 で形にした バトンを渡せる仕組み
kenta_hi
1
180
SRE活動を促進させるドキュメント技術 〜ドキュメントレビューって、どうやってる?〜
kenta_hi
1
440
SREの組織類型におけるリーダーシップの考察
kenta_hi
3
3.1k
SRE Lounge #14 LT
kenta_hi
0
480
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
34
8.9k
Facilitating Awesome Meetings
lara
57
6.6k
Scaling GitHub
holman
463
140k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
116
20k
The Pragmatic Product Professional
lauravandoore
36
7k
It's Worth the Effort
3n
187
28k
Balancing Empowerment & Direction
lara
5
710
Side Projects
sachag
455
43k
How GitHub (no longer) Works
holman
315
140k
Agile that works and the tools we love
rasmusluckow
331
21k
Building Adaptive Systems
keathley
44
2.8k
Transcript
AI × Incident Response: What’s Next? 株式会社 Topotal / Kenta
Hishida (@kenta_hi) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) 1
Kenta Hisihda @kenta_hi Director @ Topotal, Inc. 2 PRODUCT HISTORY
CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
3 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
6 なぜ、AIが進化しているのに インシデント対応では 活用されてないの? PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析 Triage~Test/Treatの 支援はこれから
6 インシデント対応はビジネス に影響するので、AIの想定外 の振る舞いは困る PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 ビジネス影響が限られた範囲で AIを活用すればよさそう PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ビジネス影響が限られたものは、重大度が低いインシデント
インシデント対応のTriageで重大度を定めます。重大度に応じて対応方針が決 まっている。 ※1 : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 HIGH (P1) 大多数の顧客に対して明確に不 便を感じさせる劣化が生じてい る 迅速な対応が必要(24h365d、 15分以内着手) 該当エンジニアチームにページ ング 関連エンジニアチームのリー ダーに通知。影響を受けた顧客 へのコミュニケーションを検討 WARNING (P2) 一部の顧客に対して顧客体験の 軽度な劣化が生じている 営業時間帯に他の業務よりも優 先して対応 営業時間内のみページング 関連エンジニアチームのマネー ジャーに通知。重要顧客のみ対 応検討 INFO (P3) 顧客体験に目立った劣化がない か、非常に軽微な影響が生じて いる 通常業務と並行して勤務時間内 に対応 ページング不要 関連エンジニアチームのマネー ジャーに通知。顧客向け通知は 不要
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 重大度の低いINFOやWARNINGに 対して、AIを活用するのが現実的 さらにAIの行動を人が承認する フローにすることで 広範囲なAIの活用が可能に AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 近い将来、「つらい」インシデン ト対応はなくなるのではないで しょうか 重大度の低いものはよく発生する ので、AIに任せるだけでも楽にな るはずです。 AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 人とAIの協働する インシデントレスポンス(Demo) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) Waroom
MCP デモ ※3 https://www.youtube.com/watch?v=uydmjdv0Efs