Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Sugita
December 18, 2025
0
230
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
Sugita
December 18, 2025
Tweet
Share
More Decks by Sugita
See All by Sugita
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
sugitaseiya
0
880
Featured
See All Featured
How to Talk to Developers About Accessibility
jct
2
140
エンジニアに許された特別な時間の終わり
watany
106
240k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
150
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.4k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
810
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
170
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Docker and Python
trallard
47
3.8k
The Cult of Friendly URLs
andyhume
79
6.8k
Transcript
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜 ENECHANGE株式会社 杉田 青哉 2025.12.18 ゆるSRE勉強会 #14 ゆるSRE忘年会 〜ゆるく
SREの話をしよう〜 https://yuru-sre.connpass.com/event/376206/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 SRE・infraチーム 技術スタック: AWS,Ruby 趣味:
イベント参加 SRE Kaigi / SRE NEXT / JAWS DAYS X: @Mnbvc124
今日話すこと ・SLAを満たすDR戦略の検討内容 ・採用した方式 ・運用で気をつけていること
SLA要件 大規模災害で東京リージョン全体に影響があった場合、大阪リージョンに3日以内に復旧させる 具体的には以下の指標 RTO (Recovery Time Objective) 3日 目標復旧時間 システムを復旧させるまでの時間
RPO (Recovery Point Objective) 1日 目標復旧時点 どの時点のデータまで復旧するか
インフラ構成( DR対応前) 東京リージョンのみで稼働 フロントエンド CloudFront + S3 バックエンド ALB +
ECS + RDS
DR戦略の4パターン バックアップ &リストア Backup and Restore 復旧時間 時間単位 コスト $
検討対象 パイロットライト Pilot Light 復旧時間 分単位 コスト $$ 検討対象 ウォームスタンバイ Warm Standby 復旧時間 秒単位 コスト $$$ オーバースペック ホットスタンバイ Hot Standby 復旧時間 リアルタイム コスト $$$$ オーバースペック RTO 3日の要件に対して、ウォームスタンバイ・ホットスタンバイはオーバースペック
バックアップ &リストア方式 通常時 ・S3 東京 → 大阪へクロスリージョンレプリケーション ・RDS 東京で取得したスナップショットを大阪リージョンへ定期コピー
バックアップ &リストア方式(異常時) 異常時の復旧手順 • RDSスナップショットからインスタンス立ち上げ • ALB・ECSを構築 • CloudFront・Route53の向き先を大阪リージョンに変更 ✓
メリット: コストが最も低い ✗ デメリット: 一から構築するため作業が多い
パイロットライト方式 通常時 ・S3 東京 → 大阪へクロスリージョンレプリケーション ・Aurora Global Database 東京–大阪間でデータを常時レプリケーション
(リアルタイム同期)
パイロットライト方式(異常時) 異常時の復旧手順 • ALB・ECSを構築 • CloudFront、Route53の向き先を大阪リージョンに変更 ✓ メリット: DBは常時同期されており、復旧が早い ✗
デメリット: 東京–大阪間の常時レプリケーションによりコストが高い
採用した方式 バックアップ &リストア 選定理由 RTO(3日)の要件を十分に満たしつつ、追加コストを最も低く抑えられる方式だったため。 実際の検証でも、約4時間で復旧できることを確認できた。
運用で気をつけていること 📄 ドキュメント整備 •復旧手順書の作成 •Terraformコードの整備 🔄 定期的な訓練 •DR訓練の実施 •手順書の有効性確認
まとめ 1. RTO 3日ならバックアップ&リストアで十分対応できた 2. バックアップ&リストアは作業が多いので、手順書化・復旧訓練が重要 今後の展望 AWS Fault
Injection Service(FIS)を活用して、より運用性を高めていきたいと考えています。