Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップでポストモーテムを4年で200回やって得た学び
Search
Hiroaki KARASAWA
April 24, 2025
0
29
スタートアップでポストモーテムを4年で200回やって得た学び
https://findy-tools.connpass.com/event/350544/
Hiroaki KARASAWA
April 24, 2025
Tweet
Share
More Decks by Hiroaki KARASAWA
See All by Hiroaki KARASAWA
DomainException と Result 型で作る型安全なエラーハンドリング
karszawa
0
1.2k
成功する技術選定について
karszawa
2
2.7k
飲食店のインフラサービス “ダイニー” のトラブル対応のすべて
karszawa
0
59
Google Cloud のモニタリング製品を徹底活用してみた
karszawa
0
56
ダウンタイム 30 秒で AlloyDB に移行した話
karszawa
0
500
DMS で AlloyDB に簡単移行!
karszawa
0
61
【現場の本音】App Engine から Cloud Run に移行してみた
karszawa
0
160
cls-hooked による実行コンテキストの保存と利用
karszawa
0
910
Hasura の Relationship と権限管理
karszawa
0
960
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
337
57k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
KATA
mclloyd
29
14k
Making Projects Easy
brettharned
116
6.3k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
Designing for humans not robots
tammielis
253
25k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
790
Documentation Writing (for coders)
carmenintech
71
4.9k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Gamification - CAS2011
davidbonilla
81
5.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Transcript
© 2025 Dinii Inc. スタートアップでポストモーテムを 4年で200回やって得た学び ポストモーテムを実践へ ─学びを組織に定着させるには─ 2025-04-24 Hiroaki
KARASAWA
株式会社 ダイニー © 2025 Dinii Inc. ※こちらの枠内に詳細や、画像を記載/貼り付けしてください。 白枠は、必要に応じて消していただいても大丈夫です。 @karszawa Introduction
Hiroaki KARASAWA (karszawa) 株式会社ダイニー VP of Technology Google Champion Innovator → Google Developer Experts (Modern Architecture, Serverless Application, Data) 明日から6連休 🗽 自己紹介
株式会社 ダイニー © 2025 Dinii Inc. Introduction トラブル対応のすべて、と題したが日常的な 対応から緊急事態の対応まですべてを20分 で説明し切るのは無理だった。
SRE Lounge #17 実際に発生した大規模障害とそこから得られ た学びについて。全文非公開。 Incident Response Meetup #2 TypeScript について話すこともある。 noren.ts @karszawa 最近の登壇
株式会社 ダイニー © 2025 Dinii Inc. 本日のトピック 「ポストモーテム」 @karszawa
株式会社 ダイニー © 2025 Dinii Inc. 01 02 03 04
05 ダイニーについて インシデント関連の取り組みの全体像 日常的なトラブルに対処するワークフロー ポストモーテムを成功させるには さいごに @karszawa
株式会社 ダイニー © 2025 Dinii Inc. ダイニーについて 01 @karszawa
株式会社 ダイニー © 2024 Dinii Inc. 飲食店の売上UPに貢献する唯一無二のスーパーモバイルPOS オペレーションなしで 売上UP! AIと専属スタッフにお任せ
お客様を 自動で会員化 自動販促 メッセージ アンケート 自動回収 店員への チップ/投げ銭 圧倒的な 使いやすさで 客単価UP ロイヤルティ プログラム 顧客情報を 接客に活用
ダイニーが目指すのは、 ダイニーについて 株式会社ダイニー | Company Deck for Product © 2025
Dinii Inc.
株式会社 ダイニー © 2025 Dinii Inc. ダイニーについて @karszawa 【大前提】ダイニーは POS
を開発している 1. POS は金夜ピークの飲食店でもスムーズに使える必要がある 2. POS は一日何時間も使われる 3. POS は老若男女どんな従業員にも使われる 4. POS は使えないなら使わないで済むプロダクトではない → ダイニーは、極めて分かりやすく、スムーズに稼働するプロダクトでなければならない ダイニーにおけるインシデントハンドリングの重要性 「トラブルがないこと」 はそのための第一歩
株式会社 ダイニー © 2025 Dinii Inc. インシデント関連の取り組みの全体像 02 @karszawa
株式会社 ダイニー © 2025 Dinii Inc. インシデント関連の取り組みの全体像 @karszawa [1] 日常的なトラブル対応
株式会社 ダイニー © 2025 Dinii Inc. インシデント関連の取り組みの全体像 @karszawa [2] 緊急事態的なトラブル対応
緊急時に対応できるよう 緊急事態訓練を実施
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処する ワークフロー 03 @karszawa
株式会社 ダイニー © 2025 Dinii Inc. Q. トラブル対応の目的はなにか? @karszawa
A. ユーザーの業務を回復すること つまり、原因を理解することではない 極論、信頼を毀損しない トラブルは発生しても良い すべては顧客からの 信頼回復のため むしろそこに投資する メリットはあるのか?
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲)
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) ユーザーサポート
(90%) or システムアラート (10%)
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) 本当に発生しているか?
報告内容は正しいか? ここがズレているとかなり遠回りに
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) 他ユーザーに影響を与えず回復する方法がないか?
リバートや修正のリリースは別の問題を引き起こす可能性も 設定の問題であることを祈る
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) ここはやり方次第
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) 対象は報告のあったユーザーだけか?
再発の可能性はないか?
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) 回復まで時間がかかる場合は
一定の頻度で顧客に連絡を行う
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー 資料名を記載 日常的なトラブル対応(エンジニアの対応範囲) ポストモーテムへ続く
None
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー @karszawa ポストモーテムの観点 当日の対応が妥当であったか
そもそもユーザーに影響を 与えないためには何ができたか ポストモーテムで見るべきこと ① ポストモーテムで見るべきこと ②
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムのフォーマットを紹介 @karszawa
株式会社 ダイニー © 2025 Dinii Inc. 件数・スコア等の集計値 インシデントレポートへの リレーション (これがあるから
Notion は最高)
株式会社 ダイニー © 2025 Dinii Inc. ニューカマーのための インストラクション 前回からのネクストアクション
株式会社 ダイニー © 2025 Dinii Inc. @karszawa 件数・スコア等の集計値 インシデントレポートへの リレーション
(これがあるから Notion は最高) 業務影響度 影響店舗数 原因カテゴリ スコア(参考値) スコア(確定値)
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテム参加者に事例を共有するための情報 原因・一次対応・恒久対応・再発防止・対応チケット
株式会社 ダイニー © 2025 Dinii Inc. これを200回繰り返す @karszawa
株式会社 ダイニー © 2025 Dinii Inc. @karszawa 日常的なトラブルに対処するワークフロー 一定のリズムで記録しているから分かることがある 発生件数、影響度、対応時間、対応者の偏り、他
ダイニーでは200回以上の記録を行っている ポストモーテムを分析 インシデント管理に Notion を使うと可視化も便利
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー @karszawa 4ヶ月連続で起票件数が徐々に減少していた。 「システムが安定してきた」という実感は無かった。
分析が役に立った事例
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー @karszawa [A] 新設された「仕様質問」のためのワークフローで異常な挙動について確認されていたから
なぜ起票件数が減少していたのか?
株式会社 ダイニー © 2025 Dinii Inc. 日常的なトラブルに対処するワークフロー インシデントのフォーマットに従っていない ため調査のための情報が埋められていない 調査のための情報の不足
伴って、適切な温度感で対応ができない イラストこれで合ってる? 業務影響度が分からない 正しいデータベースに存在しないため 振り返りが漏れることになる 振り返りができない @karszawa インシデントとして扱われないことの弊害
株式会社 ダイニー © 2025 Dinii Inc. でも気持ちも分かる @karszawa
株式会社 ダイニー © 2025 Dinii Inc. 正常性バイアス =異常を認めたくない気持ち は誰にでもある 分断は
NG @karszawa
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには 04 @karszawa
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには @karszawa 1. 判断に恣意性を持ち込まない、すべてを機械的に処理する
🤖 2. 人の判断を持ち込むから「判断の良し悪し」の話になる 🙅 [1] 対象を恣意的に選別しない 緊急性の高低 発生日時 が現在時刻の 一時間以内 であれば緊急性が 高い ダイニーでは
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには @karszawa 発生抑止 1.
既定のリリースフローに則っていたか 2. テストは実施されていたか 事後対応 1. 初動までの速度は適切か 2. 影響範囲をどのように確かめたか 3. 顧客への連絡は適切な頻度で実施されていたか [2] 一定のチェックポイントで振り返りを行う 改善できる箇所をチェックポイントにする ポイント 改善のための活動なのだから 改善できる箇所に着目すれば良い
株式会社 ダイニー © 2025 Dinii Inc. ポストモーテムを成功させるには 資@karszawa いわゆる Blameless
な分化 [3] 人ではなくプロセスに注目する チェックポイントごとの判断をしていれば必然的にそうなる あまり意識的にやっている訳では無いが自然とそうなっている ダイニーでは
株式会社 ダイニー © 2025 Dinii Inc. さいごに 05 資料名を記載
株式会社 ダイニー © 2025 Dinii Inc. @karszawa さいごに 募集の背景 1.
会社としてインシデントハンドリングの重要性を認知している 2. むしろインシデントハンドリングの巧拙が事業強度に繋がるとすら考えている 3. 組織的なインシデントハンドリングのレベル向上のため専任のポジションを設けている SRE (Incident Management) を募集中!
株式会社 ダイニー © 2025 Dinii Inc. さいごに @karszawa ダイニーにおける日常的なトラブル対応のフローとポストモーテムの実施方法について紹介しました まとめ
「プロセスに人の判断を持ち込むな」 「一定のリズムで振り返りを実施せよ」 ポストモーテムのポイント ① ポストモーテムのポイント ②
株式会社 ダイニー © 2025 Dinii Inc. さいごに @karszawa 告知