Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Search
Sugita
February 20, 2025
0
870
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Sugita
February 20, 2025
Tweet
Share
More Decks by Sugita
See All by Sugita
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
sugitaseiya
0
210
Featured
See All Featured
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
130
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
110
Done Done
chrislema
186
16k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
190
Balancing Empowerment & Direction
lara
5
900
Become a Pro
speakerdeck
PRO
31
5.8k
Between Models and Reality
mayunak
1
200
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
380
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7k
Transcript
SLAチェックしてみたら...マルチAZ未対応!? その改善プロセス ENECHANGE株式会社 杉田 青哉 2025.2.21 ゆるSRE勉強会 #9 〜最近始めた取り組み共有大会〜 https://yuru-sre.connpass.com/event/342085/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 業務内容: テックリード、バックエンド /インフラ 技術スタック:
Ruby、AWS 趣味: ウイスキー X: @Mnbvc124
アジェンダ 01 02 03 04 05 現在のチーム体制 運用強化したこと 運用強化したことで見つけた問題 マルチ
AZ対応の実施プロセス まとめ
現在のチーム体制 SREチームはなく、開発と運用を兼務している そのため色々な問題が ... • 開発に手を取られて運用・監視はほとんどできていない • 運用状況を把握していないため障害対応が遅れる
運用強化したこと 安定稼働のためにできる取り組みを初めてみた!! • 稼働状況・パフォーマンス・リソース使用状況などを継続的に監視 • 死活監視の導入 • インフラリソースのコスト最適化
運用強化したことで見つけた問題 監視している中で、 NAT Gatewayが単一AZにしか 存在しないことを発見
運用強化したことで見つけた問題 SLAには... データセンターレベルの大規模災害の発生に備え、2つの地理的に異なる場所に設備が構築されること
運用強化したことで見つけた問題 マルチAZ必須なので早速対応!!
マルチAZ対応の実施プロセス 【新ECS構築】 • ALB、ECS新規構築 ◦ RDSは共通 【補足】 • コスト観点でNAT Gateway廃止
マルチAZ対応の実施プロセス 【新旧ECS同時稼働】 • 新しいECSにトラフィックを向ける • DNSキャッシュが残ってる間は新旧同時稼 働
マルチAZ対応の実施プロセス 【旧ECS停止】 • 旧ECS停止して新ECSのみ稼働
まとめ 運用強化したことから問題を発見し、マルチ AZ対応で可用性を向上させることができた。 しかし、運用の課題は依然として残るため「チームで運用を回せる体制づくり」を作っていく必要がある