Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ポストモーテム読書会のすすめ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
taxin
July 04, 2024
Technology
3.1k
1
Share
ポストモーテム読書会のすすめ
taxin
July 04, 2024
More Decks by taxin
See All by taxin
Mackerelにおけるインシデント対応とポストモーテム - 現場での工夫と学び
taxin
0
190
監視SaaSの運用におけるObservability改善の歩み
taxin
4
6.2k
OpenTelemetry実践 はじめの一歩
taxin
0
3.5k
カスタムダッシュボードの活用方法とMackerel開発チームでの実践例
taxin
0
1.9k
SREを「続けていく」あなたへ
taxin
1
400
Cloud runユーザーから見たk8s
taxin
0
950
ローカルk8s環境のススメ / k8s-tools-for-local
taxin
0
1.3k
EKS 101
taxin
0
1k
Other Decks in Technology
See All in Technology
M&Aで増え続けるプロダクトに少数QAはどう立ち向かうか─GENDAが挑む、全員で取り組む品質標準化戦略 / GENDA Tech Talk #4
genda
0
230
Terragrunt x Snowflake + dbt で作るマルチテナントなデータ基盤構築プラットフォーム
gak_t12
0
500
エンタープライズの厳格な制約を開発者に意識させない:クラウドネイティブ開発基盤設計/cloudnative-kaigi-golden-path
mhrtech
0
460
ラズパイ & Picoで入門:Zephyr(RTOS)の環境構築からビルドまでの紹介
iotengineer22
0
110
全社統制を維持しながら現場負担をどう減らすか〜プラットフォームチームとセキュリティチームで進めたSecurity Hub活用によるAWS統制の見直し〜/secjaws-security-hub-custom-insights
mhrtech
1
620
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.4k
[4] Power BI Deep Dive [2026-05]
ohata_bi
0
100
なぜ、IAMロールのプリンシパルに*による部分マッチングが使えないのか? / 20260518-ssmjp-iam-role-principal
opelab
2
140
TypeScriptで実現する既存APIを活用したリモートMCPサーバー構築 / TSKaigi 2026
soarteclab
0
130
分断された OT と IT を繋ぐ架け橋 -Kubernetes が切り拓く 産業用組み込み製品の現在地 -
yudaiono
1
130
AWS WAFの運用を地道に改善し、自社で運用可能にするプラクティス
andpad
1
590
JTCでRedmine利用者2700人を実現した手法 第二部
nobuonakamura
0
140
Featured
See All Featured
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
The Cult of Friendly URLs
andyhume
79
6.9k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.5k
Embracing the Ebb and Flow
colly
88
5k
YesSQL, Process and Tooling at Scale
rocio
174
15k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
140
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Code Review Best Practice
trishagee
74
20k
The Curse of the Amulet
leimatthew05
1
12k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Agile that works and the tools we love
rasmusluckow
331
21k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
360
Transcript
ポストモーテム読書会 のすすめ id:taxintt / @taxin_tt 2024/07/05 Road To SRE NEXT@京都
1
自己紹介 • 西川 拓志 ◦ id: taxintt / @taxin_tt •
Mackerel開発チーム SRE 2
3 みなさん
4 ポストモーテム書いてますか?
5 ポストモーテム 「読んで」ますか?
ポストモーテムとは? • post-mortem=事後検証 ◦ > a medical examination of a
dead person's body in order to find out the cause of death. • インシデントの再発防止策を検討するための プロセス 6 https://dictionary.cambridge.org/ja/dictionary/english/post-mortem
7 https://sre.google/sre-book/postmortem-culture/
ポストモーテムとは? • インシデントの再発防止策をまとめた社内向け のドキュメント ◦ インシデントとそのインパクト ◦ その緩和や解消のために行われたアクション ◦ インシデントの根本原因
◦ インシデントの再発を避けるためのアクション 8
9 https://sre.google/workbook/postmortem-culture/
はてなのポストモーテム文化 • ポストモーテムを書く文化がある • 他チームのポストモーテムは社内ナレッジ ベースに載り、作成時には全社通知がくる ◦ ポストモーテムの存在を知ることができる ◦ 他チームのポストモーテムも閲覧できる
10
11 読むしかないでしょ
ポストモーテム読書会 • 社内外のポストモーテムから題材を1つ選ぶ • Cosenseを使いながら読書会を実施する ◦ 読書 + コメント記入タイム (20
~ 25分) ◦ コメントをみながら議論をする (30分) ◦ 議論の中で挙がったTODO を確認する (5分) 12
13
読書会やってよかったこと • 「生きた」学びを得て、活用できる ◦ 特に、社内のポストモーテムは障害原因から障害対応の 様子、再発防止策まで具体的なことが書いてある ◦ 具体的な内容の方が、学びを得たり改善に繋げやすい 14
読書会やってよかったこと ◦ インシデントの根本原因 ▪ 「この障害、自分達のプロダクトでも発生し得るのでは? 」 ◦ 障害対応のフロー・ドキュメント ▪ いいと思った所を真似する、アレンジして取り入れる
◦ インシデントの再発防止策 ▪ 先んじて調査・実施することで障害を未然に防ぐ 15
読書会で出たTODO • 障害対応のプロセスの改善 ◦ 障害対応ドキュメントテンプレート、Runbookの改善 ◦ メンテナンス時の考慮事項のドキュメント化 • 監視ルールの点検会 ◦
コンポーネントごとに監視が充足しているか点検する • etc… 16
17
18 ポストモーテム 読んで活用していきましょう