Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
Search
Isao Shimizu
April 24, 2025
Technology
1
260
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
2025/04/24 ポストモーテムを実践へ ─学びを組織に定着させるには─
https://findy-tools.connpass.com/event/350544/
Isao Shimizu
April 24, 2025
Tweet
Share
More Decks by Isao Shimizu
See All by Isao Shimizu
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
990
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
2k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.2k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
2
1.8k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.1k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
390
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.1k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
590
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in FamilyAlbum
isaoshimizu
4
790
Other Decks in Technology
See All in Technology
Platform開発が先行する Platform Engineeringの違和感
kintotechdev
4
540
「全員プロダクトマネージャー」を実現する、Cursorによる仕様検討の自動運転
applism118
18
8.1k
5分でカオスエンジニアリングを分かった気になろう
pandayumi
0
200
「どこから読む?」コードとカルチャーに最速で馴染むための実践ガイド
zozotech
PRO
0
280
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
420
JTCにおける内製×スクラム開発への挑戦〜内製化率95%達成の舞台裏/JTC's challenge of in-house development with Scrum
aeonpeople
0
190
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.7k
ガチな登山用デバイスからこんにちは
halka
1
230
会社紹介資料 / Sansan Company Profile
sansan33
PRO
6
380k
2025年夏 コーディングエージェントを統べる者
nwiizo
0
140
DDD集約とサービスコンテキスト境界との関係性
pandayumi
2
280
なぜSaaSがMCPサーバーをサービス提供するのか?
sansantech
PRO
8
2.7k
Featured
See All Featured
Designing Experiences People Love
moore
142
24k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
Producing Creativity
orderedlist
PRO
347
40k
Raft: Consensus for Rubyists
vanstee
140
7.1k
Six Lessons from altMBA
skipperchong
28
4k
For a Future-Friendly Web
brad_frost
180
9.9k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
520
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Thoughts on Productivity
jonyablonski
70
4.8k
Transcript
©MIXI Notion x ポストモーテムで 広げる組織の学び 株式会社MIXI みてね事業本部 みてねプラットフォーム部 清⽔ 勲
@isaoshimizu
2 ©MIXI About me • New Relic User Group 運営メンバー
• AWS Summit Tokyo 2014/2019、SRE NEXT 2020/2022、その他SRE関連勉強会に多数登壇 • 技術評論社「Software Design」寄稿、オライリー‧ジャパン「SREをはじめよう」翻訳レビュー • 週末は社会⼈吹奏楽団での活動(楽団⻑、担当楽器はトロンボーン)、キャンプとクラフトビールが好き 清⽔ 勲 (X: @isaoshimizu) 株式会社MIXI みてね事業本部 みてねプラットフォーム部 部⻑(SRE/CRE/セキュリティ領域) SIer時代(受託‧⾃社開発) SNS「mixi」 モンスター ストライクなど 家族アルバム みてね 2003年 2011年 2014年 2018年 2025年 新卒⼊社 ミクシィ(現MIXI)⼊社 C/C++/C#/PHP/Python/iOS/AWS Fedora/MySQL/LXC/ OpenStack Linux/MySQL/Ruby AWS/MySQL/Ruby 2022年1⽉〜EM おもに関わった技術
©MIXI 家族アルバム みてね について簡単に紹介
家族アルバム みてねはスマホで撮った⼦どもの写真や動画を家族と共有し、 コミュニケーションして楽しむ家族アルバムサービスです。
ビジネスモデル ⼦どもや家族を中⼼に、より⼦育てが楽しく、安⼼‧安全につながるサービスを提供。
家族アルバム みてねの利⽤者数推移 2015年にリリース。7⾔語‧175の国と地域で2,500万⼈以上の⽅にご利⽤いただいています。 2015 20,000,000 15,000,000 10,000,000 5,000,000 0 2016
2017 2018 2019 2020 2021 2022 国内 海外 ※ iOS‧Android™ アプリ登録者数、ブラウザ版登録者数の合計 2023 2024 25,000,000 2025年4⽉時点 2025.4
©MIXI Notion x ポストモーテムで広げる組織の学び
8 ©MIXI ポストモーテム どんなときに作る? • ユーザーに影響のあるシステム障害、バグが発⽣した時 • 障害の規模によって作らないケースもある • ユーザーに影響はないがミスや失敗をした時
• たとえば開発環境や分析環境でのトラブル、オペレーションミスなど • 障害には⾄らなかったが⾼負荷を乗り切った記録として残すことも どこに作る? • Notionのポストモーテムページ • 以前は別のドキュメントツール(DocBase) • 直近2年くらいはNotionで管理
©MIXI ポストモーテムにおけるNotionの活⽤
10 ©MIXI ポストモーテムにおけるNotionの活⽤ Notionのテンプレートを活⽤ • ボタン⼀つでテンプレートに沿ったページを作成 • あらかじめ⽤意された項⽬や説明に従って書いていく Notion AIによるサマリ作成
• ページの上部にAIサマリのエリアを設置 • 原因や再発防⽌、タイムラインなどの記載内容から⾃動的にサマリを作成 • プロンプトは「このページの要約を3⾏程度でまとめる」 Notion AIによる検索 • たとえば「直近1ヶ⽉間のポストモーテムどんなものがあったかまとめてください」 • 障害対応Slackチャンネルのやりとりの要約
11 ©MIXI ポストモーテムNotionページのテンプレート • AIサマリ(以下の情報から3⾏にまとめた要約を⾃動⽣成) • 影響(ユーザー影響‧収益への影響‧CSへの影響‧etc..) • 発⽣要因(問題が発⽣するきっかけとなった要因) •
根本原因(問題が発⽣しうる状態になった原因) • 検知(問題が発⽣したことに気付いた経緯) • 暫定対応(発⽣した問題に対する暫定対応) • 再発防⽌策(詳細は次ページに記載) • 教訓 • うまくいったこと • うまくいかなかったこと • 幸運だったこと • タイムライン
©MIXI 再発防⽌で意識していること
13 ©MIXI 再発防⽌の基本 ⾮難しない(blameless) • ⼈間ではなくシステムに注⽬する • ⼼理的安全性(⾮難によって正直に話せなくなってしまわないように) ⼈間は修正できない •
⼈為的ミスを根本原因としない • 仕組み、プロセスを改善する事が⼤事 • 「気をつける」「注意深くレビューをする」「複数⼈でチェックする」は避ける • ⼈は誰でも間違いを犯す
14 ©MIXI 再発防⽌欄の項⽬ 予防 • 障害の再発をポジティブに防ぐにはどうしたらよいか 検出 • 同様の障害を正確に検出するまでの時間を減らすにはどうするべきか 緩和
• 次回この種の障害が起きたときの深刻度や影響度の%を減らすにはどうしたらいいか 修正 • 次回障害が検出されたときにどうすればより速く回復できるか の観点で考えられるとより良い再発防⽌策となる
©MIXI ポストモーテムの活⽤
16 ©MIXI ポストモーテムの活⽤ • Notionのポストモーテムのページは事業部の最上位に配置 • 事業に関わるすべての⼈が追加‧閲覧可能 • エンジニアにかかわらず誰でも書いてよい •
⼊社したメンバーが過去のポストモーテムから学ぶ機会にもつながる • 作成したポストモーテムはSlackのgeneralチャンネル(すべての⼈がいるチャン ネル)でも共有する • 毎週のエンジニア交流会で直近のポストモーテムを共有できる機会がある • この会では、全エンジニアが集まり、業務連絡やTips共有をしている
17 ©MIXI 階層とポストモーテムのリスト
©MIXI 障害対応におけるNotion活⽤
19 ©MIXI 障害対応におけるNotion活⽤ 障害対応ポータルページを⽤意。随時⼿順を追加。いわゆるRunbook。 アラート通知に紐づけて対応⼿順がすぐわかるように⼯夫。
©MIXI まとめ
21 ©MIXI まとめ • 「⾮難しない」前提がないとポストモーテムはうまくいかない • ⾮難があると学びを得られない • ⼈間の能⼒に頼った再発防⽌にしない •
プロセスや仕組みを考える • ポストモーテムの情報は学びの宝庫 • 新しいメンバー、既存メンバーにとっても価値のある情報 • Notionはナレッジベースとして活⽤するのにとても便利 • テンプレートをうまく活⽤して作成の⼿間を減らす • Notion AIを活⽤して⼿間を減らす、理解を促進させる
©MIXI