Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
インシデントコマンダーやってみた
Search
Hayato Kawai
February 22, 2024
5
1.2k
インシデントコマンダーやってみた
「ゆるSRE勉強会 #4」の LT 資料です。
https://yuru-sre.connpass.com/event/306649/
Hayato Kawai
February 22, 2024
Tweet
Share
More Decks by Hayato Kawai
See All by Hayato Kawai
Bedrock のコスト監視設計
fohte
2
390
Data Access Control で実現するより細かい権限制御
fohte
0
280
Datadog が支える Wantedly のシステム運用
fohte
0
86
Devin や Cursor などの生成 AI ツール導入に向けて何を取り組んだのか
fohte
2
320
Datadog Network Monitoring を活用して NAT Gateway 課金を 80 % 削減した話
fohte
2
740
Trace Metrics と Istio Metrics でサービス健全性を監視する
fohte
0
520
段階的リリースを実現する kube canary
fohte
1
220
巨大 tfstate に立ち向かう技術
fohte
1
1.1k
RubyKaigi で LT 初登壇したきっかけと感想
fohte
1
1.4k
Featured
See All Featured
It's Worth the Effort
3n
187
29k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Being A Developer After 40
akosma
91
590k
エンジニアに許された特別な時間の終わり
watany
106
220k
Code Review Best Practice
trishagee
74
19k
Unsuck your backbone
ammeep
671
58k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
49
A Tale of Four Properties
chriscoyier
162
24k
The Pragmatic Product Professional
lauravandoore
37
7.1k
GraphQLとの向き合い方2022年版
quramy
50
14k
Odyssey Design
rkendrick25
PRO
0
460
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
2
78
Transcript
© 2024 Wantedly, Inc. インシデントコマンダーやってみた ゆるSRE勉強会 #4 2024-02-22 Hayato Kawai
(@fohte)
© 2024 Wantedly, Inc. あなた誰 名前: @fohte (ふぉーて) 川井 颯人
(Hayato Kawai) 所属: ウォンテッドリー株式会社 趣味: 🎮 🎹
© 2024 Wantedly, Inc. 障害対応どうしてますか?
© 2024 Wantedly, Inc. 今日伝えたいこと • 障害対応訓練には価値がある ◦ 障害対応訓練によってインシデント対応のハードルが下がった ◦
インシデントコマンダーもやればできる
© 2024 Wantedly, Inc. ウォンテッドリーの障害対応文化 https://speakerdeck.com/irotoris/wantedly-incident-commander
© 2024 Wantedly, Inc. 三行まとめ • 障害対応の Slack #war_room に通知がくると
わらわらと人が集まる • 失敗を許す文化 • インシデントコマンダーは難しいので備えよう
© 2024 Wantedly, Inc. エスカレーションフロー システム ユーザー カスタマーサポート プロダクト開発チーム /基盤チーム
オンコール担当 #war_room #alert 重大なアラートの み PD へ 問題が大きい 場合はエスカレ/招集
© 2024 Wantedly, Inc. 障害対応の心構え - Wantedly Engineering Hanbook https://docs.wantedly.dev/introduction/incident
© 2024 Wantedly, Inc. 現状の課題 • インシデントコマンダーを やる人が固定化されている ◦ 長く在籍
&& コンテキスト理解が深いメン バーが対応している ◦ 開発チームでインシデントコマンダーがで きる人は 1 割ほど ▪ 障害対応の経験自体が全体の 3 割ほ ど
© 2024 Wantedly, Inc. 障害対応訓練はじめました • 障害対応訓練の取り組みを始めました ◦ 年末、2 月で現在
2 回開催。今後も毎月開催予定 ◦ この障害対応訓練でインシデントコマンダーをやってみた
© 2024 Wantedly, Inc. 障害対応訓練でインシデントコマンダーやりました • インシデントコマンダーはなにをやる? ◦ 対応メンバーの招集 ▪
(障害訓練ではあらかじめすでに集まっている ) ◦ やるべきこと判断 ▪ 何から進めるか ▪ どこを調べていくか ▪ どう対応するか ◦ 対応メンバーに対する、役割・仕事のアサイン ▪ 例: ユーザーアナウンスは xx さんに任せました ▪ 例: 今手空いている人は ? => xx さんにこのあたりを調べてほしい ▪ メンバーには対応に集中してもらえるようにする
© 2024 Wantedly, Inc. 障害対応訓練の感想 • 👍 障害対応のハードルが下がった ◦ 今まで:
出る幕がなさそうと感じていた ▪ 詳しそうなメンバーが集まっているし … ▪ 自分が何手伝えるのか分からないし … ◦ 今: 自分も役に立てる & 何やれば良いかが分かった ▪ 他メンバーからも同様の感想をもらった • 🤔 リモートだと混線する ◦ Slack huddle で対応者が集まって通話している ◦ 同時に 1 つの話題しか話せない
© 2024 Wantedly, Inc. 障害対応訓練でインシデントコマンダーやった感想 • 👍 意外とできる ◦ 本番でもできそう
• 🤔 自分で手を動かしてしまう ◦ 🤔 障害対応メンバーの中で自分が詳しい領域は、自分で手を動かしてしまう ◦ => こうなったらインシデントコマンダーを他の人にパスする のが良さそう
© 2024 Wantedly, Inc. 今日伝えたいこと • 障害対応訓練には価値がある ◦ その障害訓練によってインシデント対応のハードルが下がった ◦
インシデントコマンダーもやればできる
© 2024 Wantedly, Inc. https://www.wantedly.com/projects/522096