Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Sugita
February 20, 2025
1k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SLAチェックしてみたら…マルチAZ未対応!? その改善プロセス
Sugita
February 20, 2025
More Decks by Sugita
See All by Sugita
SLAを満たすディザスタリカバリ(DR)構成 〜東京-大阪リージョン間の切り替え設計〜
sugitaseiya
0
350
Featured
See All Featured
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
240
Context Engineering - Making Every Token Count
addyosmani
9
940
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
220
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Ethics towards AI in product and experience design
skipperchong
2
300
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
A Soul's Torment
seathinner
6
2.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Designing for Performance
lara
611
70k
It's Worth the Effort
3n
188
29k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
Transcript
SLAチェックしてみたら...マルチAZ未対応!? その改善プロセス ENECHANGE株式会社 杉田 青哉 2025.2.21 ゆるSRE勉強会 #9 〜最近始めた取り組み共有大会〜 https://yuru-sre.connpass.com/event/342085/
自己紹介 名前: 杉田 青哉 所属: ENECHANGE株式会社 業務内容: テックリード、バックエンド /インフラ 技術スタック:
Ruby、AWS 趣味: ウイスキー X: @Mnbvc124
アジェンダ 01 02 03 04 05 現在のチーム体制 運用強化したこと 運用強化したことで見つけた問題 マルチ
AZ対応の実施プロセス まとめ
現在のチーム体制 SREチームはなく、開発と運用を兼務している そのため色々な問題が ... • 開発に手を取られて運用・監視はほとんどできていない • 運用状況を把握していないため障害対応が遅れる
運用強化したこと 安定稼働のためにできる取り組みを初めてみた!! • 稼働状況・パフォーマンス・リソース使用状況などを継続的に監視 • 死活監視の導入 • インフラリソースのコスト最適化
運用強化したことで見つけた問題 監視している中で、 NAT Gatewayが単一AZにしか 存在しないことを発見
運用強化したことで見つけた問題 SLAには... データセンターレベルの大規模災害の発生に備え、2つの地理的に異なる場所に設備が構築されること
運用強化したことで見つけた問題 マルチAZ必須なので早速対応!!
マルチAZ対応の実施プロセス 【新ECS構築】 • ALB、ECS新規構築 ◦ RDSは共通 【補足】 • コスト観点でNAT Gateway廃止
マルチAZ対応の実施プロセス 【新旧ECS同時稼働】 • 新しいECSにトラフィックを向ける • DNSキャッシュが残ってる間は新旧同時稼 働
マルチAZ対応の実施プロセス 【旧ECS停止】 • 旧ECS停止して新ECSのみ稼働
まとめ 運用強化したことから問題を発見し、マルチ AZ対応で可用性を向上させることができた。 しかし、運用の課題は依然として残るため「チームで運用を回せる体制づくり」を作っていく必要がある