Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
インシデント対応入門
Search
gr1m0h
February 21, 2026
Technology
0
7
インシデント対応入門
gr1m0h
February 21, 2026
Tweet
Share
More Decks by gr1m0h
See All by gr1m0h
フルリモートを支える技術
grimoh
0
49
マイクロモビリティシェアサービスを支える プラットフォームアーキテクチャ
grimoh
1
590
"君は見ているが観察していない"で考えるインシデントマネジメント
grimoh
4
3.8k
Enabling Client-side SLO
grimoh
7
5.4k
Luupの開発組織におけるインシデントマネジメントの変遷 ver.RoadtoSRENEXT2024
grimoh
2
1.1k
Luupの開発組織におけるインシデントマネジメントの変遷
grimoh
2
1.8k
IoTサービスにおけるSLI設計とLUUPでの実践
grimoh
1
2.2k
Luupの開発組織におけるインシデントマネジメントのこれから
grimoh
2
1.4k
電動マイクロモビリティのシェアサービス「LUUP」におけるEnabling SLOの実践
grimoh
3
2.3k
Other Decks in Technology
See All in Technology
AWSが推進するAI駆動開発ライフサイクル入門 〜 AI駆動開発時代に必要な人材とは 〜/ introduction_to_aidlc_and_skills
fatsushi
5
2.9k
通話データから価値を生む 生成AIデータ基盤の実践 / CO-LAB_Tech_Night
sansan_randd
0
110
AI時代のAPIファースト開発
nagix
1
130
AgentCore RuntimeをVPCにデプロイして 開発ドキュメント作成AIエージェントを作った
alchemy1115
3
220
EMから現場に戻って見えた2026年の開発者視点
sudoakiy
1
100
量子クラウドシステムと運用
oqtopus
0
170
量子クラウドサービスの裏側 〜Deep Dive into OQTOPUS〜
oqtopus
0
340
判断は人、準備はAI - チケット管理で見えた仕事の境界
yusukeshimizu
3
130
ブロックテーマ、WordPress でウェブサイトをつくるということ / 2026.02.07 Gifu WordPress Meetup
torounit
0
220
2026年のAIエージェント構築はどうなる?
minorun365
7
1k
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
4
260
【Developers Summit 2026】Memory Is All You Need:コンテキストの「最適化」から「継続性」へ ~RAGを進化させるメモリエンジニアリングの最前線~
shisyu_gaku
3
170
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
How to train your dragon (web standard)
notwaldorf
97
6.5k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
150
Statistics for Hackers
jakevdp
799
230k
Design in an AI World
tapps
0
150
For a Future-Friendly Web
brad_frost
182
10k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
280
The Invisible Side of Design
smashingmag
302
51k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
750
Evolving SEO for Evolving Search Engines
ryanjones
0
130
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
59
50k
Transcript
インシデント対応入門 みんなで考える障害対応のベストプラクティス インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 1
whoami Wataru Tsuda / gr1m0h SWE, SRE at Topotal, inc.
インシデントマネジメントSaaS: Waroom SRE as a Service(SREの技術支援) 竹原市で生まれ育ち、広島市在住 広島商船高専 -> 東京(港区 -> 中野区) -> 2023年にUター ン インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 2
今日のゴール 1. インシデント対応の流れを理解する 2. 自分たちの現状を振り返る 3. ディスカッションで知見を共有する 正解は1つじゃない、色んなやり方を知ろう インシデント対応入門 2026/02/21
SRE Lounge Hiroshima #1 3
インシデントとは? サービスに影響を与える予期しない出来事 サービスにアクセスできない 決済処理が失敗する レスポンスが極端に遅い 判断基準: ユーザーに影響があるかどうか インフラコスト急増など間接的影響もインシデントとして扱うケースもある Discussion: どこからを「インシデント」と呼んでいますか?
インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 4
インシデント対応のライフサイクル フェーズ やること 準備 体制・手順・ツールの整備 検知・初動 問題発見、緊急度判定 対応・復旧 調査・復旧作業 振り返り
原因分析、再発防止策立案 恒久対応 再発防止策の実行 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 5
フェーズ1: 準備 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 6
準備フェーズでやること 項目 内容 体制整備 当番制、役割定義、連絡網 基準の策定 緊急度の定義、連絡ルール 手順書作成 よくある問題への対応手順 監視整備
アラート設定、ノイズ削減 ポイント: 準備がないと「どうする?」から始まる Discussion: 手順書はありますか?更新されていますか? インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 7
フェーズ2: 検知・初動 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 8
検知と初動対応 理想的な検知: 監視システムからの自動通知 避けたい検知: ユーザーからのクレームで気づく 初動でやること 1. 状況確認と影響範囲の把握 2. 緊急度の判断(どれくらい深刻か)
3. 関係者への連絡 ポイント: 「様子見」している間にも被害は広がる Discussion: 緊急度の判断基準はありますか? インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 9
フェーズ3: 対応・復旧 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 10
対応時の役割分担 役割 責任 対応リーダー 全体の指揮、意思決定 連絡担当 社内外への情報発信 調査・復旧担当 原因調査、復旧作業 最低限:
「指揮する人」と「作業する人」は分ける 復旧の優先順位: まずサービスを戻す(原因調査は後回しでOK) Discussion: 役割分担は決まっていますか? インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 11
フェーズ4: 振り返り インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 12
振り返りでやること 話し合うこと 何が起きたか(時系列で) なぜ起きたか(根本原因) 何がうまくいった / いかなかったか 再発防止策は何か 重要: 犯人探しはNG!仕組みの問題として捉える
Discussion: 振り返りをやっていますか?形骸化していませんか? インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 13
フェーズ5: 恒久対応 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 14
恒久対応でやること やること 内容 再発防止策の実行 振り返りで決めたことの実施 手順書の更新 今回の学びを反映 監視の改善 検知を早める ポイント:
期限と担当者を決めて追跡する Discussion: 再発防止策は実行されていますか? インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 15
インシデント対応でよくある課題 課題 状況 誰が対応するか不明 「誰か見てる?」問題 情報が散らばる Slack、電話、口頭でバラバラ 同じ問題が繰り返す 振り返りが形骸化 負担の偏り
当番制が整っていない インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 16
改善のヒント まず始めるなら... 1. 緊急度の基準を定義する 2. 連絡ルールを文書化する 3. 振り返りを習慣化する(小さなインシデントでも) インシデント対応入門 2026/02/21
SRE Lounge Hiroshima #1 17
参考リソース 書籍 『SRE サイトリライアビリティエンジニアリング』 (Google) Web PagerDuty Incident Response Atlassian
Incident Management インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 18
Appendix: SRE用語の解説 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 19
SEV(Severity)とは インシデントの重大度を数値で表現する レベル 影響 対応 SEV1 サービス全体停止 全員招集、即時対応 SEV2 主要機能の停止
担当チーム即時対応 SEV3 一部機能の低下 営業時間内に対応 SEV4 軽微な問題 通常の優先度で対応 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 20
インシデントコマンダー(IC)とは 対応全体を指揮する司令塔 対応の全体統括と意思決定 関係者の招集と役割分担 エスカレーションの判断 対応の終了宣言 重要: ICは技術的な作業をしない!指揮に専念する インシデント対応入門 2026/02/21
SRE Lounge Hiroshima #1 21
SLI/SLO/SLAとは サービス品質を数値で管理する 用語 意味 例 SLI サービスレベル指標 可用性、レイテンシ SLO サービスレベル目標
可用性 99.9% SLA サービスレベル契約 顧客との約束 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 22
ポストモーテムとは 「死後検死」が語源の振り返り手法 何が起きたか(タイムライン) なぜ起きたか(根本原因) 何がうまくいった / いかなかったか 再発防止策は何か Blameless(非難なし)が原則 インシデント対応入門
2026/02/21 SRE Lounge Hiroshima #1 23
MTTD / MTTRとは インシデント対応の速度を測る指標 指標 意味 MTTD 検知までの平均時間 MTTR 復旧までの平均時間
MTTRの問題点 インシデントごとのばらつきが大きく、平均値の信頼性が低い 各インシデントの復旧時間を10%短縮しても、約50%のケースでMTTRに反映され ない 粒度が粗く、どこを改善すべきか分からない インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 24
TTX メトリクスで改善する MTTRを細分化した実践的な指標 メトリクス 意味 改善策の例 TTDetect 検知までの時間 監視の強化 TTEngage
チーム編成の時間 シフト・連絡網の明確化 TTInvestigate 調査の時間 ダッシュボードの整備 TTFix 復旧の時間 ロールバックの高速化 ポイント: フェーズごとに計測することで、改善すべき箇所が明確になる 参考: インシデント主要メトリクスを用いたインシデント対応の改善 / SRE Kaigi 2025 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 25
Runbook / オンコールとは Runbook = 対応手順書 よくあるアラートの対応手順 調査に使うコマンド・クエリ 復旧手順 オンコール
= 24時間対応の当番制 ローテーションで担当を決める 勤務時間外でもアラートに対応 インシデント対応入門 2026/02/21 SRE Lounge Hiroshima #1 26