Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Search
Sugita
February 20, 2025
900
0
Share
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Sugita
February 20, 2025
More Decks by Sugita
See All by Sugita
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
sugitaseiya
0
240
Featured
See All Featured
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.7k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
160
Balancing Empowerment & Direction
lara
5
1k
30 Presentation Tips
portentint
PRO
1
270
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
350
Test your architecture with Archunit
thirion
1
2.2k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
410
Building Flexible Design Systems
yeseniaperezcruz
330
40k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.6k
GitHub's CSS Performance
jonrohan
1032
470k
Transcript
SLAチェックしてみたら...マルチAZ未対応!? その改善プロセス ENECHANGE株式会社 杉田 青哉 2025.2.21 ゆるSRE勉強会 #9 〜最近始めた取り組み共有大会〜 https://yuru-sre.connpass.com/event/342085/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 業務内容: テックリード、バックエンド /インフラ 技術スタック:
Ruby、AWS 趣味: ウイスキー X: @Mnbvc124
アジェンダ 01 02 03 04 05 現在のチーム体制 運用強化したこと 運用強化したことで見つけた問題 マルチ
AZ対応の実施プロセス まとめ
現在のチーム体制 SREチームはなく、開発と運用を兼務している そのため色々な問題が ... • 開発に手を取られて運用・監視はほとんどできていない • 運用状況を把握していないため障害対応が遅れる
運用強化したこと 安定稼働のためにできる取り組みを初めてみた!! • 稼働状況・パフォーマンス・リソース使用状況などを継続的に監視 • 死活監視の導入 • インフラリソースのコスト最適化
運用強化したことで見つけた問題 監視している中で、 NAT Gatewayが単一AZにしか 存在しないことを発見
運用強化したことで見つけた問題 SLAには... データセンターレベルの大規模災害の発生に備え、2つの地理的に異なる場所に設備が構築されること
運用強化したことで見つけた問題 マルチAZ必須なので早速対応!!
マルチAZ対応の実施プロセス 【新ECS構築】 • ALB、ECS新規構築 ◦ RDSは共通 【補足】 • コスト観点でNAT Gateway廃止
マルチAZ対応の実施プロセス 【新旧ECS同時稼働】 • 新しいECSにトラフィックを向ける • DNSキャッシュが残ってる間は新旧同時稼 働
マルチAZ対応の実施プロセス 【旧ECS停止】 • 旧ECS停止して新ECSのみ稼働
まとめ 運用強化したことから問題を発見し、マルチ AZ対応で可用性を向上させることができた。 しかし、運用の課題は依然として残るため「チームで運用を回せる体制づくり」を作っていく必要がある