Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Sugita
February 20, 2025
900
0
Share
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Sugita
February 20, 2025
More Decks by Sugita
See All by Sugita
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
sugitaseiya
0
240
Featured
See All Featured
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
220
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
Making Projects Easy
brettharned
120
6.6k
SEO for Brand Visibility & Recognition
aleyda
0
4.4k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
430
A Modern Web Designer's Workflow
chriscoyier
698
190k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
990
Practical Orchestrator
shlominoach
191
11k
Transcript
SLAチェックしてみたら...マルチAZ未対応!? その改善プロセス ENECHANGE株式会社 杉田 青哉 2025.2.21 ゆるSRE勉強会 #9 〜最近始めた取り組み共有大会〜 https://yuru-sre.connpass.com/event/342085/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 業務内容: テックリード、バックエンド /インフラ 技術スタック:
Ruby、AWS 趣味: ウイスキー X: @Mnbvc124
アジェンダ 01 02 03 04 05 現在のチーム体制 運用強化したこと 運用強化したことで見つけた問題 マルチ
AZ対応の実施プロセス まとめ
現在のチーム体制 SREチームはなく、開発と運用を兼務している そのため色々な問題が ... • 開発に手を取られて運用・監視はほとんどできていない • 運用状況を把握していないため障害対応が遅れる
運用強化したこと 安定稼働のためにできる取り組みを初めてみた!! • 稼働状況・パフォーマンス・リソース使用状況などを継続的に監視 • 死活監視の導入 • インフラリソースのコスト最適化
運用強化したことで見つけた問題 監視している中で、 NAT Gatewayが単一AZにしか 存在しないことを発見
運用強化したことで見つけた問題 SLAには... データセンターレベルの大規模災害の発生に備え、2つの地理的に異なる場所に設備が構築されること
運用強化したことで見つけた問題 マルチAZ必須なので早速対応!!
マルチAZ対応の実施プロセス 【新ECS構築】 • ALB、ECS新規構築 ◦ RDSは共通 【補足】 • コスト観点でNAT Gateway廃止
マルチAZ対応の実施プロセス 【新旧ECS同時稼働】 • 新しいECSにトラフィックを向ける • DNSキャッシュが残ってる間は新旧同時稼 働
マルチAZ対応の実施プロセス 【旧ECS停止】 • 旧ECS停止して新ECSのみ稼働
まとめ 運用強化したことから問題を発見し、マルチ AZ対応で可用性を向上させることができた。 しかし、運用の課題は依然として残るため「チームで運用を回せる体制づくり」を作っていく必要がある