Slide 1

Slide 1 text

AWS Backup 自動復元テストをやってみる 2023/12/23 @JAWS-UG 横浜支部 re:Invent re:Cap Storage かわごえ 1

Slide 2

Slide 2 text

2 かわごえ / Hikaru KAWAGOE • 金融系SIerでいろんなことしてます • CDK書いたりしたい人 • Community Builder (2023~) • 2023 Japan AWS Top Engineer • CDK支部/Storage-JAWS 運営

Slide 3

Slide 3 text

本題へ入る前に 3 https://www.youtube.com/watch?v=M4rsf_M6Abw

Slide 4

Slide 4 text

バックアップとは データ損失や業務停止のリスクを回避するために 復元可能な状態でデータを複製・保管すること 4

Slide 5

Slide 5 text

バックアップとは データ損失や業務停止のリスクを回避するために 復元可能な状態でデータを複製・保管すること 5

Slide 6

Slide 6 text

バックアップが「復元可能な状態」をどう担保するのか 6 リストア手順の確認 データの確認

Slide 7

Slide 7 text

バックアップが「復元可能な状態」をどう担保するのか 7 リストア手順の確認 データの確認 いわゆるゲームデイ、(擬似環境などで)定期的 に運用手順を実施し、復元可能であるかの確認 AWS Well-Architected Framework ・REL12-BP06 定期的にゲームデーを実施する きちんとやれている組織の方が少ない(と思う)

Slide 8

Slide 8 text

バックアップが「復元可能な状態」をどう担保するのか 8 リストア手順の確認 データの確認 総合テスト/運用テストなどのフェーズで 1回はやるはず(がそのあとは大体やらない) AWS Well-Architected Framework ・REL09-BP04 データの定期的な復旧を行って バックアップの完全性とプロセスを確認する そのスナップショットで問題なく業務継続でき るのか

Slide 9

Slide 9 text

バックアップが「復元可能な状態」をどう担保するのか 9 リストア手順の確認 データの確認 AWS Well-Architected Framework ・REL09-BP04 データの定期的な復旧を行って バックアップの完全性とプロセスを確認する そのスナップショットで問題なく業務継続でき るのか 総合テスト/運用テストなどのフェーズで 1回はやるはず(がそのあとは大体やらない)

Slide 10

Slide 10 text

バックアップが「復元可能な状態」をどう担保するのか 10 リストア手順の確認 データの確認 総合テスト/運用テストなどのフェーズで 1回はやるはず AWS Well-Architected Framework ・REL09-BP04 データの定期的な復旧を行って バックアップの完全性とプロセスを確認する そのスナップショットで問題なく業務継続でき るのか 総合テスト/運用テストなどのフェーズで 1回はやるはず(がそのあとは大体やらない) “定期的な” 復旧とデータの確認を どうやって実現するのか

Slide 11

Slide 11 text

どうすればいいのかの答えの一つがきっと AWS Backup自動復元テスト 11

Slide 12

Slide 12 text

AWS Backup 自動復元テストとは 12 Backup vault Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード バックアップ取得

Slide 13

Slide 13 text

AWS Backup 自動復元テストとは 13 Backup vault Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード バックアップ取得 バックアッププラン or オンデマンドバッ クアップによりバックアップを取得、 Backup Vaultにリカバリーポイントとして 保持する

Slide 14

Slide 14 text

AWS Backup 自動復元テストとは 14 Backup vault Backup restore Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード Amazon S3 Amazon Aurora Amazon EFS Amazon EBS 復元 バックアップ取得 リストア 定期的にリストアテストを開始

Slide 15

Slide 15 text

AWS Backup 自動復元テストとは 15 Backup vault Backup restore Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード Amazon S3 Amazon Aurora Amazon EFS Amazon EBS 復元 バックアップ取得 リストア 定期的にリストアテストを開始 ランダム or 最新の復旧ポイ ントから定期的(最小1h)で リストアを実行する 1h~7dayの間の任意の 時間、リソースを保持 することが可能 RTOを達成可能かを定期的 に評価する

Slide 16

Slide 16 text

AWS Backup 自動復元テストとは 16

Slide 17

Slide 17 text

AWS Backup 自動復元テストとは 17

Slide 18

Slide 18 text

AWS Backup 自動復元テストとは 18

Slide 19

Slide 19 text

AWS Backup 自動復元テストとは 19 Backup vault Backup restore Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード Amazon S3 Amazon Aurora Amazon EFS Amazon EBS 復元 バックアップ取得 リストア 定期的にリストアテストを開始 1h~7dayの間の任意の 時間、リソースを保持 することが可能

Slide 20

Slide 20 text

AWS Backup 自動復元テストとは 20 Backup vault Backup restore Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード Amazon S3 Amazon Aurora Amazon EFS Amazon EBS 復元 バックアップ取得 Amazon EventBridge AWS Lambda リストア テスト 定期的にリストアテストを開始 EventBridgeトリガーで、任意の テストを実行することが可能

Slide 21

Slide 21 text

AWS Backup 自動復元テストとは 21 Backup vault Backup restore Amazon S3 Amazon Aurora Amazon EFS Amazon EBS ワークロード Amazon S3 Amazon Aurora Amazon EFS Amazon EBS 復元 バックアップ取得 Amazon EventBridge AWS Lambda リストア テスト PutRestoreValidationResult 定期的にリストアテストを開始 OK/NG PutRestoreValidationResultを利 用して、スナップショットごと にFAILED/SUCCESSFULのラベ ルを付与することも可能

Slide 22

Slide 22 text

まとめ • AWS Backup 自動復元テストでスナップショットを定期的に評価する • RPO/RTOを満たせるのか • 実際に復旧したデータで業務継続できるか • 定期的に評価することでシステムの信頼性を高めていく 22

Slide 23

Slide 23 text

23 EOF