Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI × Incident Response: What ’s Next?
Search
kenta_hi
September 19, 2025
0
130
AI × Incident Response: What ’s Next?
Youtrust主催のHistory Confarence 2025でおこなったLTです。
https://lp-prohis.youtrust.jp/
kenta_hi
September 19, 2025
Tweet
Share
More Decks by kenta_hi
See All by kenta_hi
SREの組織類型に応じた リーダシップの考察
kenta_hi
2
940
SRE NEXT 2024 で形にした バトンを渡せる仕組み
kenta_hi
1
180
SRE活動を促進させるドキュメント技術 〜ドキュメントレビューって、どうやってる?〜
kenta_hi
1
440
SREの組織類型におけるリーダーシップの考察
kenta_hi
3
3k
SRE Lounge #14 LT
kenta_hi
0
480
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.1k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Building Adaptive Systems
keathley
43
2.8k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Side Projects
sachag
455
43k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.2k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6.1k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
900
Transcript
AI × Incident Response: What’s Next? 株式会社 Topotal / Kenta
Hishida (@kenta_hi) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) 1
Kenta Hisihda @kenta_hi Director @ Topotal, Inc. 2 PRODUCT HISTORY
CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
3 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi)
6 なぜ、AIが進化しているのに インシデント対応では 活用されてないの? PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) なぜ、AIにインシデント対応が任せられないのか
一般的なインシデント対応のプロセスは、優先度付け、調査、診断、テスト/修 正と流れていく ※ SRE Book Chapter 12 - Effective Troubleshooting https://sre.google/sre-book/effective-troubleshooting/ インシデント対応前 Runbook、Runbook rule インシデント対応中 チャンネルの自動作成、チーム組成 ドキュメント自動生成 インシデント対応後 ポストモーテム自動生成 メトリクス収集・可視化 分析 Triage~Test/Treatの 支援はこれから
6 インシデント対応はビジネス に影響するので、AIの想定外 の振る舞いは困る PRODUCT HISTORY CONFERENCE 2025 | Kenta
Hishida (@kenta_hi)
6 ビジネス影響が限られた範囲で AIを活用すればよさそう PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ビジネス影響が限られたものは、重大度が低いインシデント
インシデント対応のTriageで重大度を定めます。重大度に応じて対応方針が決 まっている。 ※1 : インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 HIGH (P1) 大多数の顧客に対して明確に不 便を感じさせる劣化が生じてい る 迅速な対応が必要(24h365d、 15分以内着手) 該当エンジニアチームにページ ング 関連エンジニアチームのリー ダーに通知。影響を受けた顧客 へのコミュニケーションを検討 WARNING (P2) 一部の顧客に対して顧客体験の 軽度な劣化が生じている 営業時間帯に他の業務よりも優 先して対応 営業時間内のみページング 関連エンジニアチームのマネー ジャーに通知。重要顧客のみ対 応検討 INFO (P3) 顧客体験に目立った劣化がない か、非常に軽微な影響が生じて いる 通常業務と並行して勤務時間内 に対応 ページング不要 関連エンジニアチームのマネー ジャーに通知。顧客向け通知は 不要
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 重大度の低いINFOやWARNINGに 対して、AIを活用するのが現実的 さらにAIの行動を人が承認する フローにすることで 広範囲なAIの活用が可能に AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) ※1
: インシデントの重大度(Severity)とは?組織的なインシデントレスポンスに役立つプラクティスのご紹介 株式会社Topotal 髙村成道 https://blog.topotal.tech/entry/2025/08/05/054351 レベル 定義(影響度) 緊急度 オンコール対応 コミュニケーション CRITICAL (P0) 全体または大多数の顧客に対し て重要機能が停止、深刻な体験 劣化が生じている 即時対応が必要(24h365d、即 着手) 対応可能なすべての関係者にペー ジング 経営幹部に通知。全顧客向けの 公開コミュニケーションを検討 H IGH (P1 ) 大多数の顧客に対して明確 に不 便 を感 じさせ る劣化が生じてい る 迅速 な対応が必要(24h365d、 1 5分以内 着手) 該当エ ンジニアチ ーム にページ ング 関連エ ンジニアチ ーム のリ ー ダ ーに通知。影響 を受 けた顧客 へ のコミュニケーションを検討 W ARN ING (P2 ) 一 部の顧客に対して顧客体験の 軽度 な劣化が生じている 営業 時間帯 に他 の業務よりも優 先 して対応 営業 時間内 のみ ページング 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。重要顧客のみ 対 応検討 INFO (P3 ) 顧客体験に目立っ た劣化がない か 、非常 に軽微 な影響 が生じて いる 通常業務と並行 して勤務 時間内 に対応 ページング不 要 関連エ ンジニアチ ーム のマネ ー ジャ ーに通知。顧客向け通知は 不 要 近い将来、「つらい」インシデン ト対応はなくなるのではないで しょうか 重大度の低いものはよく発生する ので、AIに任せるだけでも楽にな るはずです。 AIに任せるインシデントは、ビジネス影響が少ない、重大度 の低いインシデントから
6 人とAIの協働する インシデントレスポンス(Demo) PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida
(@kenta_hi)
6 PRODUCT HISTORY CONFERENCE 2025 | Kenta Hishida (@kenta_hi) Waroom
MCP デモ ※3 https://www.youtube.com/watch?v=uydmjdv0Efs