Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
失敗を経験したあなたへ〜建設的なインシデントの振り返りを行うために実践するべきこと〜
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiKikuchi
May 20, 2022
Technology
810
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
失敗を経験したあなたへ〜建設的なインシデントの振り返りを行うために実践するべきこと〜
JAWS-UG SRE支部 #3
今回のテーマは「これってSREなの?LT大会」
NobuakiKikuchi
May 20, 2022
More Decks by NobuakiKikuchi
See All by NobuakiKikuchi
ハッカー飯に New Relic を導入して実践した3つのこと
nobuakikikuchi
0
830
エンジニアと気軽に繋がれるプラットフォーム「ハッカー飯」で行った セキュリティ・モニタリングに関する取り組みについて
nobuakikikuchi
0
960
約1万台のサーバー運用を行うMSPの舞台裏
nobuakikikuchi
0
570
Dockerをざっくり知る
nobuakikikuchi
0
760
Other Decks in Technology
See All in Technology
AI-DLCを活用した高品質・安全なAI駆動開発実践 / AI Driven Development with AI-DLC
yoshidashingo
0
170
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.1k
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
760
Chainlitで作るお手軽チャットUI
ynt0485
0
190
10倍の生産性を実現するAI駆動並列エージェントのすべて
kumaiu
5
1.3k
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
140
MCP Appsを作ってみよう
iwamot
PRO
4
520
脆弱性対応、どこで線を引くか
rymiyamoto
0
360
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
120
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.9k
自律型AIエージェントは何を破壊するのか
kojira
0
150
MIERUNE JCT 発表資料「宇宙から伊能忠敬ごっこ」
syuchimu
0
210
Featured
See All Featured
Accessibility Awareness
sabderemane
1
140
Deep Space Network (abreviated)
tonyrice
0
170
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
201
75k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
280
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
Un-Boring Meetings
codingconduct
0
310
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Transcript
失敗を経験したあなたへ ~建設的なインシデントの振り返りを行うために実践するべきこと~ 2022/05/20 JAWS-UG SRE支部 #3 菊池 宣明
このセッションでお話しすること SRE 本の “Postmortem Culture: Learning from Failure” の章では事後分析 (Postmortem)
について記載されています。 また、インシデントが発生しても非難を行わず、建設的な事後分析を行うことは SRE の信条で あるとも説明されています。 https://sre.google/sre-book/table-of-contents/
このセッションでお話しすること SRE 本の “Postmortem Culture: Learning from Failure” の章では事後分析 (Postmortem)
について記載されています。 また、インシデントが発生しても非難を行わず、建設的な事後分析を行うことは SRE の信条で あるとも説明されています。 今日はここに着目します https://sre.google/sre-book/table-of-contents/
このセッションでお話しすること SRE 本の “Postmortem Culture: Learning from Failure” の章では事後分析 (Postmortem)
について記載されています。 また、インシデントが発生しても非難を行わず、建設的な事後分析を行うことは SRE の信条で あるとも説明されています。 失敗が発生した際に自分および周りの人はどのような立ち回りをすると良いのかについて僕の 考えを述べていこうと思います! https://sre.google/sre-book/table-of-contents/ 今日はここに着目します
自己紹介
• 菊池 宣明(Twitter:@kikulabo) ◦ 普段は X-Tech 5 で SRE 業務を行っています
◦ 副業で「ハッカー飯」というサービスの運営と開発をやってます • 趣味 ◦ ゲーム(スマブラ、Fortnite) • 好きな AWS のサービス ◦ AWS サポート
”失敗” した経験ありますか?
僕の失敗エピソード① EC2 のインスタンスタイプを変更する際に ELB から外さず作業を行った
僕の失敗エピソード② 「再起動しない」にチェックを入れずに AMI を取得しサービス影響を起こした
僕の失敗エピソード③ お客様が使用しているユーザを全て削除(無効化)してしまった
人の手で運用している以上 インシデントの発生は避けられない
失敗は学びに変えろと世間一般的には言われるが…
初めのうちはメンタル的に失敗を受け入れるのは辛い
ではメンタルをどのように回復させれば良いか?
僕が失敗をしてしまった時のルーチン① インシデントの対処後その日の業務は終了する 理由:落ち込んでいる時に続けて作業をするのは効率が悪いから
僕が失敗をしてしまった時のルーチン② 普段よりも贅沢して美味しいものを食べる 理由:手っ取り早く幸福感を味わえるから
僕が失敗をしてしまった時のルーチン③ 沢山寝る 理由:睡眠とメンタルヘルスには密接な関係があるから
メンタルの復旧が行われてからインシデントの振り返りを行う ※詳細を忘れてしまうこともあるので次の日には取り組むようにしましょう
自分の部下がインシデントを起こしてしまった時は
報告内容に関して批判を行わない 理由:心理的安全性を確保できるから(隠蔽化されるケースを防ぐため)
ミスを許容し対処内容に関して称賛する 理由:組織全体としてミスに対する理解を促進させるため
インシデントの振り返りを部下と一緒に行う 理由:インシデントの発生原因を自分の不注意のせいにしがちになるから 運用でカバーするのではなく仕組みで解決できるように上司は導いてあげる
インシデントの振り返り:ポストモーテムに関する参考記事 • Postmortem Culture: Learning from Failure ◦ https://sre.google/sre-book/postmortem-culture/ •
失敗から学ぶ - ポストモーテム / Postmotem culture at Wantedly ◦ https://speakerdeck.com/munisystem/postmotem-culture-at-wantedly • 1年間のポストモーテム運用とそこから生まれたツール sre-advisor / SRE NEXT 2022 ◦ https://speakerdeck.com/fujiwara3/1nian-jian-falseposutomotemuyun-yong-tosokokarasheng-maretatu ru-sre-advisor
このセッションで伝えたかったこと • インシデント対応も大事だが自分のメンタルの復旧作業も忘れずに取り組むこと • 自分の部下が失敗した時はメンタルヘルスケアを行ってあげること • 組織としてミスを許容し批判を行わず障害に対して健全な議論を行うこと ご清聴ありがとうございました!