Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Search
Sugita
February 20, 2025
0
870
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Sugita
February 20, 2025
Tweet
Share
More Decks by Sugita
See All by Sugita
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
sugitaseiya
0
210
Featured
See All Featured
A Soul's Torment
seathinner
5
2.3k
Thoughts on Productivity
jonyablonski
74
5k
Automating Front-end Workflow
addyosmani
1371
200k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
90
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
450
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
110
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
460
A better future with KSS
kneath
240
18k
Facilitating Awesome Meetings
lara
57
6.8k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
650
Transcript
SLAチェックしてみたら...マルチAZ未対応!? その改善プロセス ENECHANGE株式会社 杉田 青哉 2025.2.21 ゆるSRE勉強会 #9 〜最近始めた取り組み共有大会〜 https://yuru-sre.connpass.com/event/342085/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 業務内容: テックリード、バックエンド /インフラ 技術スタック:
Ruby、AWS 趣味: ウイスキー X: @Mnbvc124
アジェンダ 01 02 03 04 05 現在のチーム体制 運用強化したこと 運用強化したことで見つけた問題 マルチ
AZ対応の実施プロセス まとめ
現在のチーム体制 SREチームはなく、開発と運用を兼務している そのため色々な問題が ... • 開発に手を取られて運用・監視はほとんどできていない • 運用状況を把握していないため障害対応が遅れる
運用強化したこと 安定稼働のためにできる取り組みを初めてみた!! • 稼働状況・パフォーマンス・リソース使用状況などを継続的に監視 • 死活監視の導入 • インフラリソースのコスト最適化
運用強化したことで見つけた問題 監視している中で、 NAT Gatewayが単一AZにしか 存在しないことを発見
運用強化したことで見つけた問題 SLAには... データセンターレベルの大規模災害の発生に備え、2つの地理的に異なる場所に設備が構築されること
運用強化したことで見つけた問題 マルチAZ必須なので早速対応!!
マルチAZ対応の実施プロセス 【新ECS構築】 • ALB、ECS新規構築 ◦ RDSは共通 【補足】 • コスト観点でNAT Gateway廃止
マルチAZ対応の実施プロセス 【新旧ECS同時稼働】 • 新しいECSにトラフィックを向ける • DNSキャッシュが残ってる間は新旧同時稼 働
マルチAZ対応の実施プロセス 【旧ECS停止】 • 旧ECS停止して新ECSのみ稼働
まとめ 運用強化したことから問題を発見し、マルチ AZ対応で可用性を向上させることができた。 しかし、運用の課題は依然として残るため「チームで運用を回せる体制づくり」を作っていく必要がある