Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ポストモーテム読書会のすすめ
Search
taxin
July 04, 2024
Technology
1
2.5k
ポストモーテム読書会のすすめ
taxin
July 04, 2024
Tweet
Share
More Decks by taxin
See All by taxin
監視SaaSの運用におけるObservability改善の歩み
taxin
4
5k
OpenTelemetry実践 はじめの一歩
taxin
0
3.1k
カスタムダッシュボードの活用方法とMackerel開発チームでの実践例
taxin
0
1.7k
SREを「続けていく」あなたへ
taxin
1
360
Cloud runユーザーから見たk8s
taxin
0
900
ローカルk8s環境のススメ / k8s-tools-for-local
taxin
0
1.2k
EKS 101
taxin
0
950
Other Decks in Technology
See All in Technology
定期的な価値提供だけじゃない、スクラムが導くチームの共創化 / 20251004 Naoki Takahashi
shift_evolve
PRO
3
300
リーダーになったら未来を語れるようになろう/Speak the Future
sanogemaru
0
280
AI駆動開発を推進するためにサービス開発チームで 取り組んでいること
noayaoshiro
0
160
GA technologiesでのAI-Readyの取り組み@DataOps Night
yuto16
0
270
Optuna DashboardにおけるPLaMo2連携機能の紹介 / PFN LLM セミナー
pfn
PRO
1
880
From Prompt to Product @ How to Web 2025, Bucharest, Romania
janwerner
0
120
extension 現場で使えるXcodeショートカット一覧
ktombow
0
210
Green Tea Garbage Collector の今
zchee
PRO
2
390
M5製品で作るポン置きセルラー対応カメラ
sayacom
0
140
Azure SynapseからAzure Databricksへ 移行してわかった新時代のコスト問題!?
databricksjapan
0
140
実装で解き明かす並行処理の歴史
zozotech
PRO
1
320
Access-what? why and how, A11Y for All - Nordic.js 2025
gdomiciano
1
110
Featured
See All Featured
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
RailsConf 2023
tenderlove
30
1.2k
Become a Pro
speakerdeck
PRO
29
5.5k
Mobile First: as difficult as doing things right
swwweet
224
10k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
19
1.2k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Thoughts on Productivity
jonyablonski
70
4.9k
GitHub's CSS Performance
jonrohan
1032
460k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
61k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
51k
BBQ
matthewcrist
89
9.8k
Transcript
ポストモーテム読書会 のすすめ id:taxintt / @taxin_tt 2024/07/05 Road To SRE NEXT@京都
1
自己紹介 • 西川 拓志 ◦ id: taxintt / @taxin_tt •
Mackerel開発チーム SRE 2
3 みなさん
4 ポストモーテム書いてますか?
5 ポストモーテム 「読んで」ますか?
ポストモーテムとは? • post-mortem=事後検証 ◦ > a medical examination of a
dead person's body in order to find out the cause of death. • インシデントの再発防止策を検討するための プロセス 6 https://dictionary.cambridge.org/ja/dictionary/english/post-mortem
7 https://sre.google/sre-book/postmortem-culture/
ポストモーテムとは? • インシデントの再発防止策をまとめた社内向け のドキュメント ◦ インシデントとそのインパクト ◦ その緩和や解消のために行われたアクション ◦ インシデントの根本原因
◦ インシデントの再発を避けるためのアクション 8
9 https://sre.google/workbook/postmortem-culture/
はてなのポストモーテム文化 • ポストモーテムを書く文化がある • 他チームのポストモーテムは社内ナレッジ ベースに載り、作成時には全社通知がくる ◦ ポストモーテムの存在を知ることができる ◦ 他チームのポストモーテムも閲覧できる
10
11 読むしかないでしょ
ポストモーテム読書会 • 社内外のポストモーテムから題材を1つ選ぶ • Cosenseを使いながら読書会を実施する ◦ 読書 + コメント記入タイム (20
~ 25分) ◦ コメントをみながら議論をする (30分) ◦ 議論の中で挙がったTODO を確認する (5分) 12
13
読書会やってよかったこと • 「生きた」学びを得て、活用できる ◦ 特に、社内のポストモーテムは障害原因から障害対応の 様子、再発防止策まで具体的なことが書いてある ◦ 具体的な内容の方が、学びを得たり改善に繋げやすい 14
読書会やってよかったこと ◦ インシデントの根本原因 ▪ 「この障害、自分達のプロダクトでも発生し得るのでは? 」 ◦ 障害対応のフロー・ドキュメント ▪ いいと思った所を真似する、アレンジして取り入れる
◦ インシデントの再発防止策 ▪ 先んじて調査・実施することで障害を未然に防ぐ 15
読書会で出たTODO • 障害対応のプロセスの改善 ◦ 障害対応ドキュメントテンプレート、Runbookの改善 ◦ メンテナンス時の考慮事項のドキュメント化 • 監視ルールの点検会 ◦
コンポーネントごとに監視が充足しているか点検する • etc… 16
17
18 ポストモーテム 読んで活用していきましょう