Upgrade to Pro — share decks privately, control downloads, hide ads and more …

障害対応フローを定めてから1年の現在地 / One Year Mark: Progress i...

Avatar for FukutomiQA FukutomiQA
October 30, 2025

障害対応フローを定めてから1年の現在地 / One Year Mark: Progress in Incident Management

マイベストで障害対応フローを定めてから1年が経ちました。
フローの詳細、成果、課題をまとめた資料です。

Avatar for FukutomiQA

FukutomiQA

October 30, 2025

Other Decks in Technology

Transcript

  1. 福富 はじめ(ふくとみ はじめ) • 1991年 静岡県生まれ • 2014.04 - 地元の制作会社でSWEになる •

    2017.11 - 上京、赤い第三者検証会社で QAエンジニアになる • (なんやかんやあって) • 2024.02 - 株式会社マイベスト(現職) スポーツをTV観戦するのが好きです(海外サッカー、野球が中心です が、最近NBAにも目覚めてしまいました) @FukutomiQA 自己紹介 FukutomiQA
  2. 修正完了から再発防止策実装まで Point! • 事前にオーナーを選定して、再発防止策実装まで責任を持って行う人を決める • 障害報告は Notion DBで管理 • 障害報告には影響を受けたコンテンツ数や該当期間の

    PV数まで詳細に記入してもらう • 再発防止策は仕組み化できることを条件とし、場合によっては防止策がないこともある • 振り返りで出た再発防止策案は、テックリードや CTOのレビューを通して最終決定される • 障害内容や再発防止策実装状況は、隔週で実施するエンジニア相談会で共有する
  3. • そもそも、実装完了までトラッキングできるようになったことが収穫 ◦ 今までは実装完了まで追えていなかった • 障害を記録に残すことでナレッジ化することができている • 「〇〇しないことを意識する」みたいな再発防止策が生まれない • ステップ数が多すぎて、対応者がドキュメントを見ながらじゃないと対応できない

    ◦ 仕組み管理者である Fukutomiがフォローしないとまわらない部分がある • 再発防止策は事業課題に優先度で敵わないことがある ◦ 再発防止策の実装は放置されがち。。。 よかったところ、まだまだ課題なところ 運用を始めたからこそわかる課題がたくさん More... Good!
  4. 運用を始めてから 1年あまり、、、まだまだ改善したい! やりたいことはたくさんある • まだまだバッチリフィットしたフローにはなっていない ◦ 前のスライドで挙げた通り、改善点はいっぱいある • 実装済みの防止策を棚卸ししたい ◦

    時間が経てば運用も変わる 不要になる再発防止策もあるはずだ • 再発防止策の実装優先度を定義して、期日も簡単に決められるようにしたい ◦ 現状は障害重要度によって決められているが、それだと違和感があることもある • 再発防止策の実装状況管理を各ミッションにお願いするようにしたい ◦ ミッションで起こした障害はミッションで再発防止までちゃんとやりたいね • etc…