Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Aurora Serverless v2 移行への道
Search
CREATIVE SURVEY Inc.
July 04, 2023
Technology
0
460
Amazon Aurora Serverless v2 移行への道
第31回 ちょっぴり DD / AWS Dev Day 2023 Tokyo 延長戦の資料です。
CREATIVE SURVEY Inc.
July 04, 2023
Tweet
Share
More Decks by CREATIVE SURVEY Inc.
See All by CREATIVE SURVEY Inc.
プロダクトの持続的成長を実現するための開発体制作り
creativesurvey
0
220
dbt testを導入した話
creativesurvey
0
510
SnowflakeのCI/CDフローを整備した話 / snowflake-cicd-flow-maintenance
creativesurvey
0
820
【技術負債も解消しつつ顧客価値を最大化】ストリームアラインドチームでの挑戦と成果
creativesurvey
0
43
プロダクトエンジニアを支えるSREの動きと理想
creativesurvey
0
250
クリエイティブサーベイ社でのStreamlit活用事例
creativesurvey
0
300
STI導入で開発スピードアップ!一元管理で外部連携をスムーズに
creativesurvey
0
64
新規機能の開発における_早く価値を届ける開発の取り組み.pdf
creativesurvey
0
130
入社1ヶ月目でSREチームの方針と あり方を見直している話
creativesurvey
0
1.3k
Other Decks in Technology
See All in Technology
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
410
ドメイン名の終活について - JPAAWG 7th -
mikit
33
20k
隣接領域をBeyondするFinatextのエンジニア組織設計 / beyond-engineering-areas
stajima
1
270
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
170
複雑なState管理からの脱却
sansantech
PRO
1
140
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
430
iOS/Androidで同じUI体験をネ イティブで作成する際に気をつ けたい落とし穴
fumiyasac0921
1
110
BLADE: An Attempt to Automate Penetration Testing Using Autonomous AI Agents
bbrbbq
0
300
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
470
障害対応指揮の意思決定と情報共有における価値観 / Waroom Meetup #2
arthur1
5
470
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
100
Platform Engineering for Software Developers and Architects
syntasso
1
520
Featured
See All Featured
A better future with KSS
kneath
238
17k
Facilitating Awesome Meetings
lara
50
6.1k
Product Roadmaps are Hard
iamctodd
PRO
49
11k
What's new in Ruby 2.0
geeforr
343
31k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
506
140k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Building Applications with DynamoDB
mza
90
6.1k
Code Review Best Practice
trishagee
64
17k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.9k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Building an army of robots
kneath
302
43k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Transcript
第31回 ちょっぴり DD / AWS Dev Day 2023 Tokyo 延長戦
Amazon Aurora Serverless v2 移行への道 2023.06.29
自己紹介 鈴木康寛 クリエイティブサーベイ株式会社 CTO 2013年にSansan入社。 webアプリケーションエンジニアとして、 Eightの開発に従 事。サーバーレスアーキテクチャを用いた、リコメンデー ションサービスに関して、 2017
AWS Dev Dayにて登 壇。 その後、エンジニアリングマネージャーの経験を経て、昨 年6月より現職。 yasuzukisan
None
今年よりSansanグループに参画
ミッション 顧客の声を機会に変える
アンケートサービスの特性 大規模なスパイク
スケーラビリティとの戦い 2022/6: CTO就任 2022/6〜: 諸々の技術的負債への対応 • Ruby/Rails/MySQLバージョンアップ • 開発環境のコンテナ化 •
CI / CDパイプライン整備によるデプロイの自動化 2022/12: EC2ベースからECS on Fargateベースになり、オートスケーリン グが可能に
データベースの変遷 2022/6〜: MySQLバージョンアップ • 5.7から8.0へ • DATETIME型の比較で明示的にCASTが必要だった • 上記対応をして5.7系の環境に事前にバックポート 2022/12:
RDS for MySQL から Amazon Auroraへ移行 • Aurora MySQL version 3.02.1
Auroraの利用状況 • プロビジョニングされたインスタンス • インスタンスタイプ: db.r6g.4xlarge 平常時はCPU負荷10%以下
DBもオートスケーリング できないか? 🤔
Aurora Serverless v2
要件の確認 • Serverless V1よりもスケーリングの応答性が高く、高可用性 • Aurora MySQL version 3.02.1 のため、移行可能
• 同等性能(ACU換算)では、プロビジョニングされたインスタンスよりも 高価 ◦ アンケートサービスの特性にマッチ
切り替え方法は? • Amazon Aurora Blue/Green Deployments • 昨年のRe:Inventで発表 ◦ 使えるなら使いたい
• 1分程度のダウンタイムで本番DBへ昇格 ◦ 顧客影響を最小限に
ということで、 無事移行できました 🎉
Blue/Greenデプロイメントの事前準備 • サービスの停止を伴うもの ◦ binlogの設定を変更 ▪ `binlog_format`のパラメータ値をMIXEDに変更 • サービスの停止を伴わないもの ◦
Blue/Green の構成 ▪ Green環境を Serverless v2に変更 ◦ Terraformの微修正 ▪ 構成管理上の軽微なもの
Blue/Green環境構築コスト • 一時的にGreen環境のインスタンスを立ち上げる必要がありコストが かかる 準備作業により、コ スト増 移行後
Blue/Greenデプロイメントの実施 • 事前準備を済ませ、AWSコンソール上からスイッチオーバー ◦ 1,2分で切り替え完了し、Serverless v2のDBが適用 • 移行時の苦労話は? ◦ 特に苦労はなかった
◦ Terraform の構成管理についても事前対応のおかげで、運用が 変わることはなかった
移行後の影響(コスト) • 1日あたりの平均コスト ◦ $136 -> $101 (約25.7%削減) 日によっては 移行前よりも増加
移行後コスト減
移行後の影響(パフォーマンス) • SLIとして設定していた、p90, p99のLatencyが悪化 ◦ 事前の性能検証で影響範囲ないと想定 ◦ p99に関してはより顕著な影響 移行後にLatency悪化
移行後の運用 • ACU(Aurora Capacity Unit)について ◦ Serverless v2のキャパシティ単位 ◦ 1ACU当り、2GiBのメモリに相当
◦ 移行前のdb.r6g.4xlarge相当は、64ACU • ACUの設定 ◦ Min ACU: 2 ◦ Max ACU: 64 ▪ 移行前のインスタンスと同等性能に設定
移行後の問題点 • 移行当初の問題 ◦ Min: 0.5ACUにしていたため、負荷に追従しきれなかった ◦ パフォーマンスインサイトの設定を有効にしているため、推奨値の Min ACU:
2に設定 • 定期的にフェイルオーバーが発生 ◦ サービス影響は軽微ではある ◦ サポートに問い合わせ、AWS側の問題である可能性 ◦ Auroraのバージョンが若干古いことに起因?
今後について • データベースアクセスのチューニングが必要 ◦ 過剰なスペックのDBを利用していたことで問題が隠蔽 • SLIの妥当性検証 ◦ p99のLatencyについて再考が必要 •
フェイルオーバーへの対策 ◦ Auroraのバージョンを最新化(3.03.1)して様子見 ▪ Blue/Greenデプロイメントを活用
まとめ 📝
まとめ • 通常時とピーク時のアクセス特性が大きく異なるアプリケーションにお いてAurora Serverless v2は有用な選択肢 • Blue/Green DeploymentsによるDBの構成変更が容易に •
オートスケールする仕組みだからこそ、DBのパフォーマンスチューニン グは不可避