Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
Search
Isao Shimizu
April 24, 2025
Technology
1
310
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
2025/04/24 ポストモーテムを実践へ ─学びを組織に定着させるには─
https://findy-tools.connpass.com/event/350544/
Isao Shimizu
April 24, 2025
Tweet
Share
More Decks by Isao Shimizu
See All by Isao Shimizu
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
1k
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
3k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.2k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
2
1.9k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.1k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
410
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.3k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
610
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in FamilyAlbum
isaoshimizu
4
810
Other Decks in Technology
See All in Technology
SES向け、生成AI時代におけるエンジニアリングとセキュリティ
longbowxxx
0
320
BidiAgent と Nova 2 Sonic から考える音声 AI について
yama3133
2
150
20260114_データ横丁 新年LT大会:2026年の抱負
taromatsui_cccmkhd
0
140
これまでのネットワーク運用を変えるかもしれないアプデをおさらい
hatahata021
2
110
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Java 25に至る道
skrb
3
220
Oracle Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
2
870
2025年 山梨の技術コミュニティを振り返る
yuukis
0
160
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
Introduction to Bill One Development Engineer
sansan33
PRO
0
340
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
61k
First-Principles-of-Scrum
hiranabe
4
2k
Featured
See All Featured
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
430
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
270
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Ruling the World: When Life Gets Gamed
codingconduct
0
120
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Designing for humans not robots
tammielis
254
26k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.7k
Transcript
©MIXI Notion x ポストモーテムで 広げる組織の学び 株式会社MIXI みてね事業本部 みてねプラットフォーム部 清⽔ 勲
@isaoshimizu
2 ©MIXI About me • New Relic User Group 運営メンバー
• AWS Summit Tokyo 2014/2019、SRE NEXT 2020/2022、その他SRE関連勉強会に多数登壇 • 技術評論社「Software Design」寄稿、オライリー‧ジャパン「SREをはじめよう」翻訳レビュー • 週末は社会⼈吹奏楽団での活動(楽団⻑、担当楽器はトロンボーン)、キャンプとクラフトビールが好き 清⽔ 勲 (X: @isaoshimizu) 株式会社MIXI みてね事業本部 みてねプラットフォーム部 部⻑(SRE/CRE/セキュリティ領域) SIer時代(受託‧⾃社開発) SNS「mixi」 モンスター ストライクなど 家族アルバム みてね 2003年 2011年 2014年 2018年 2025年 新卒⼊社 ミクシィ(現MIXI)⼊社 C/C++/C#/PHP/Python/iOS/AWS Fedora/MySQL/LXC/ OpenStack Linux/MySQL/Ruby AWS/MySQL/Ruby 2022年1⽉〜EM おもに関わった技術
©MIXI 家族アルバム みてね について簡単に紹介
家族アルバム みてねはスマホで撮った⼦どもの写真や動画を家族と共有し、 コミュニケーションして楽しむ家族アルバムサービスです。
ビジネスモデル ⼦どもや家族を中⼼に、より⼦育てが楽しく、安⼼‧安全につながるサービスを提供。
家族アルバム みてねの利⽤者数推移 2015年にリリース。7⾔語‧175の国と地域で2,500万⼈以上の⽅にご利⽤いただいています。 2015 20,000,000 15,000,000 10,000,000 5,000,000 0 2016
2017 2018 2019 2020 2021 2022 国内 海外 ※ iOS‧Android™ アプリ登録者数、ブラウザ版登録者数の合計 2023 2024 25,000,000 2025年4⽉時点 2025.4
©MIXI Notion x ポストモーテムで広げる組織の学び
8 ©MIXI ポストモーテム どんなときに作る? • ユーザーに影響のあるシステム障害、バグが発⽣した時 • 障害の規模によって作らないケースもある • ユーザーに影響はないがミスや失敗をした時
• たとえば開発環境や分析環境でのトラブル、オペレーションミスなど • 障害には⾄らなかったが⾼負荷を乗り切った記録として残すことも どこに作る? • Notionのポストモーテムページ • 以前は別のドキュメントツール(DocBase) • 直近2年くらいはNotionで管理
©MIXI ポストモーテムにおけるNotionの活⽤
10 ©MIXI ポストモーテムにおけるNotionの活⽤ Notionのテンプレートを活⽤ • ボタン⼀つでテンプレートに沿ったページを作成 • あらかじめ⽤意された項⽬や説明に従って書いていく Notion AIによるサマリ作成
• ページの上部にAIサマリのエリアを設置 • 原因や再発防⽌、タイムラインなどの記載内容から⾃動的にサマリを作成 • プロンプトは「このページの要約を3⾏程度でまとめる」 Notion AIによる検索 • たとえば「直近1ヶ⽉間のポストモーテムどんなものがあったかまとめてください」 • 障害対応Slackチャンネルのやりとりの要約
11 ©MIXI ポストモーテムNotionページのテンプレート • AIサマリ(以下の情報から3⾏にまとめた要約を⾃動⽣成) • 影響(ユーザー影響‧収益への影響‧CSへの影響‧etc..) • 発⽣要因(問題が発⽣するきっかけとなった要因) •
根本原因(問題が発⽣しうる状態になった原因) • 検知(問題が発⽣したことに気付いた経緯) • 暫定対応(発⽣した問題に対する暫定対応) • 再発防⽌策(詳細は次ページに記載) • 教訓 • うまくいったこと • うまくいかなかったこと • 幸運だったこと • タイムライン
©MIXI 再発防⽌で意識していること
13 ©MIXI 再発防⽌の基本 ⾮難しない(blameless) • ⼈間ではなくシステムに注⽬する • ⼼理的安全性(⾮難によって正直に話せなくなってしまわないように) ⼈間は修正できない •
⼈為的ミスを根本原因としない • 仕組み、プロセスを改善する事が⼤事 • 「気をつける」「注意深くレビューをする」「複数⼈でチェックする」は避ける • ⼈は誰でも間違いを犯す
14 ©MIXI 再発防⽌欄の項⽬ 予防 • 障害の再発をポジティブに防ぐにはどうしたらよいか 検出 • 同様の障害を正確に検出するまでの時間を減らすにはどうするべきか 緩和
• 次回この種の障害が起きたときの深刻度や影響度の%を減らすにはどうしたらいいか 修正 • 次回障害が検出されたときにどうすればより速く回復できるか の観点で考えられるとより良い再発防⽌策となる
©MIXI ポストモーテムの活⽤
16 ©MIXI ポストモーテムの活⽤ • Notionのポストモーテムのページは事業部の最上位に配置 • 事業に関わるすべての⼈が追加‧閲覧可能 • エンジニアにかかわらず誰でも書いてよい •
⼊社したメンバーが過去のポストモーテムから学ぶ機会にもつながる • 作成したポストモーテムはSlackのgeneralチャンネル(すべての⼈がいるチャン ネル)でも共有する • 毎週のエンジニア交流会で直近のポストモーテムを共有できる機会がある • この会では、全エンジニアが集まり、業務連絡やTips共有をしている
17 ©MIXI 階層とポストモーテムのリスト
©MIXI 障害対応におけるNotion活⽤
19 ©MIXI 障害対応におけるNotion活⽤ 障害対応ポータルページを⽤意。随時⼿順を追加。いわゆるRunbook。 アラート通知に紐づけて対応⼿順がすぐわかるように⼯夫。
©MIXI まとめ
21 ©MIXI まとめ • 「⾮難しない」前提がないとポストモーテムはうまくいかない • ⾮難があると学びを得られない • ⼈間の能⼒に頼った再発防⽌にしない •
プロセスや仕組みを考える • ポストモーテムの情報は学びの宝庫 • 新しいメンバー、既存メンバーにとっても価値のある情報 • Notionはナレッジベースとして活⽤するのにとても便利 • テンプレートをうまく活⽤して作成の⼿間を減らす • Notion AIを活⽤して⼿間を減らす、理解を促進させる
©MIXI