Slide 10
Slide 10 text
暫定対応 -> 恒久対応
まずはとにかく止血をする(= 暫定対応)
Datadog などでメトリクスを確認 / ログ収集
メトリクス・ログからユーザーへの影響を逆算して整理
なるべくビジネスモデルも踏まえて考える
例: エンタープライズユーザーへのインパクト
ユーザー・ビジネスへの影響を最小限にする迅速な対応を優先
例: 一時的にバッチ処理を止める・サーバー台数を倍増する
アンチパターンにこだらない
その後にやっと恒久対応
Postmortem の実施
システム不具合を修正
ログ・メトリクスの拡充 10