Slide 10
Slide 10 text
担当サービスの状況を確認してみる
シナリオ①関連システムの停止により処理が行えない
エラー発生時のCloudWatch Alarm→Slack通知
SQSを使用し、リトライ/再実行可能に
上記の処理が正しく動作するかの検証
シナリオ②災害発生によるシステムダウン
マルチAZ対応
データバックアップおよび別リージョンへのコピー
バックアップデータから復元できることの検証
探知
復旧
テスト
予防
復旧
テスト
この他にも、社内ガイドラインに従ってチームで対応を継続中