Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Makuake の急成長を支える Aurora 移行事例 / AWS Solution Day...
Search
Yoshiaki Yoshida
July 05, 2017
Technology
1
12k
Makuake の急成長を支える Aurora 移行事例 / AWS Solution Days 2017
Yoshiaki Yoshida
July 05, 2017
Tweet
Share
More Decks by Yoshiaki Yoshida
See All by Yoshiaki Yoshida
技術ブロガーを育てる!ブログメンタリングで何を教えているのか / Passion for Blog Mentoring
kakakakakku
8
37k
プログラミング初心者に教えるときは「身近な比喩」が重要なのだ! / Metaphor is Important for Beginner Programmer
kakakakakku
2
5.6k
プロジェクトの成功を支える ZenHub と モブプログラミング / ZenHub and Mob Programming
kakakakakku
1
5.8k
楽しく!アウトプットを習慣化しよう / Let's Enjoy Output
kakakakakku
3
6.8k
さぁ!今すぐプロジェクトリーダーに立候補しよう / Be a Project Leader
kakakakakku
3
9.1k
プロジェクトをリードする技術 (Kyash 社 再演) / Project Leading is Skill for Kyash
kakakakakku
4
2.1k
プロジェクトをリードする技術 / Project Leading is Skill
kakakakakku
43
47k
Mackerel で ECS をどこまでモニタリングできるのか / Monitoring ECS with Mackerel
kakakakakku
0
13k
[2018/01/30] Redash 初心者向けハンズオン / Redash Meetup #0.1
kakakakakku
0
2.4k
Other Decks in Technology
See All in Technology
Amazon S3標準/ S3 Tables/S3 Express One Zoneを使ったログ分析
shigeruoda
2
370
Agentic DevOps時代の生存戦略
kkamegawa
0
850
Welcome to the LLM Club
koic
0
120
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
210
ローカルLLMでファインチューニング
knishioka
0
120
IAMのマニアックな話 2025を執筆して、 見えてきたAWSアカウント管理の現在
nrinetcom
PRO
4
640
doda開発 生成AI元年宣言!自家製AIエージェントから始める生産性改革 / doda Development Declaration of the First Year of Generated AI! Productivity Reforms Starting with Home-grown AI Agents
techtekt
0
190
JSX - 歴史を振り返り、⾯⽩がって、エモくなろう
pal4de
3
1.1k
(非公式) AWS Summit Japan と 海浜幕張 の歩き方 2025年版
coosuke
PRO
1
320
AI技術トレンド勉強会 #1MCPの基礎と実務での応用
nisei_k
1
240
Model Mondays S2E02: Model Context Protocol
nitya
0
170
成立するElixirの再束縛(再代入)可という選択
kubell_hr
0
590
Featured
See All Featured
Docker and Python
trallard
44
3.4k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
228
22k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Fireside Chat
paigeccino
37
3.5k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Transcript
Makuake の急成長を支える Aurora 移行事例 AWS Solution Days 2017 ~ AWS
DB Day ~ 2017.07.05
吉田 慶章 @kakakakakku - CyberAgent Crowd Funding, Inc. - 開発本部所属
- DevOps エンジニア & サーバサイドエンジニア - エンジニアリングマネージャー - 趣味 : 技術ブログを毎週書くこと - http://kakakakakku.hatenablog.com/
Makuake - 2013年8月リリース - 国内最大の「クラウドファンディング・プラットフォーム」 - プロジェクト情報, 決済情報, コミュニケーション情報など 多種多様なデータを扱っている
課題感
データベースのライフサイクルは長い ウェブサーバと比較すると, スケールアウトも難しく, SPOF になりがち
課題感 - RDS ではなく MySQL 5.5 on EC2 を運用していた -
サービスをリリースしてから, 1度も止まらずに稼働していた - uptime 1000 days 以上 ( ゚д゚)!!! - ボトルネックになる「アーキテクチャの課題」と「運用の課題」 - サービスの急成長を支える新基盤にリプレイスを検討していた
「アーキテクチャの課題」と「運用の課題」 - 「アーキテクチャの課題」 - フェールオーバーができなかった ( MHA などの考慮なし ) -
バージョンアップが難しかった - 1TB 以上の EBS (Magnetic) がアタッチされていた - 「運用面の課題」 - 重い分析クエリが発行されてスレーブが高負荷になっていた - スロークエリを確認するために, 直接サーバに接続していた
Amazon Aurora そこで !!!
なぜ Aurora を採用したのか
なぜ Aurora を採用したのか - クエリパフォーマンスの高さ - Auto Scaling ストレージ (10
GB 単位) - 限りなくゼロに近い, Reader のレプリカラグ - 高速なフェイルオーバー - MySQL 5.6 完全互換
Aurora 移行の前に考えたこと
1. データを削減するアプローチ 「本当にこのデータは必要なのか?」と考えた
データ削減 - 思っている以上に, 不要なデータが大量に残っている (はず) - データ削減をすると, データ見積もりが容易になる - さらに,
データ移行時間を短くできるなど様々なメリットがある - 実績 - 約20テーブルを削除した - 不要なレポート系のデータを約1000万レコード削除した
2. メトリクスを見てスペックを見積もる 「適切な RDS インスタンスクラスはどれなのか?」と考えた
max_connections - MySQL で connections 関連のメトリクスを取得した - Max_used_connections を指標の1個にした
max_connections - パラメータグループのデフォルト値 - GREATEST({log(DBInstanceClassMemory/ 805306368)*45},{log(DBInstanceClassMemory/ 8187281408)*1000}) - インスタンスクラスごとのサイズを見て, 適切なクラスを見積もる
- db.r3.large 1000 - db.r3.xlarge 2000
innodb_buffer_pool_size - MySQL で InnoDB 関連のメトリクスを取得した - Buffer Pool Size
の使用量を指標の1個にした last(mysql.innodb[buffer_pool_pages_free]) / last(mysql.innodb[buffer_pool_pages_total]) * 100
innodb_buffer_pool_size - パラメータグループのデフォルト値 - {DBInstanceClassMemory*3/4} - インスタンスクラスごとのサイズを見て, 適切なクラスを見積もる - db.r3.large
7.45 GiB - db.r3.xlarge 18.72 GiB
パラメータグループのコツ - 「適用タイプ : static」のパラメータを最優先に考える - 反映に再起動が必要になるため - 基本的にはデフォルト値のまま使う -
Aurora Team がチューニングして厳選した値のため - default.aurora5.6 をコピーして環境ごとに用意しておく - 稼働中にどうしても変更したい場合に備えて
Aurora 移行
移行概要 - MySQL 5.5 on EC2 -> Aurora に移行 -
データ量を削減した「レポート DB」を「メイン DB」に統合 - 移行を「5フェーズ」に分類した - システムメンテナンスあり
app db (master) Read / Write batch 日次 mysqldump db
(report) db (slave) Read / Write レプリ Read Read フェーズ1 リストア リストア S3 Aurora Reader Aurora Reader 同期 Aurora Writer .dump.sql
app db (master) Read / Write batch db (report) Aurora
Reader Read / Write Aurora Reader レプリ 同期 Read Read フェーズ2 多段レプリ Aurora Writer db (slave) レプリ
app db (master) Read / Write batch db (report) db
(slave) Read / Write Aurora Reader レプリ レプリ Read フェーズ3 Reader Read 同期 参照系を Aurora にする Aurora Writer Aurora Reader
app db (master) batch db (report) db (slave) Aurora Reader
Aurora Reader レプリ レプリ 同期 Read メンテナンス = 更新なし メンテナンス = 更新なし mysqldump を 直接流し込む (DB 統一) フェーズ4 Writer Read / Write Aurora Writer Read / Write
app Read / Write batch Aurora Writer Aurora Reader Read
/ Write Aurora Reader 同期 Read Amazon ES + Kibana aggregator Redash スロークエリ集計 分析 フェーズ5 最終型
Aurora 移行後の効果
効果 - クエリパフォーマンスの向上 - スロークエリを可視化できるように - データドリブンな意思決定ができるように
クエリパフォーマンスの向上 - 発行回数 TOP 5 のクエリ全てが2倍以上のパフォーマンスに - SELECT 系 (単一テーブル,
JOIN など) - NewRelic で計測している - Aurora スゴイ
スロークエリを可視化できるように - fluent-plugin-rds-slowlog と fluent-plugin-aws-elasticsearch-service を使って スロークエリを Amazon ES Kibana
で可視化できるようにした - 事前にパラメータグループで設定しておく
データドリブンな意思決定ができるように - 分析用の Aurora Reader を立てたことにより, サービス影響を気にせずにクエリを発行できるようになった - 新しく Redash
を導入したことにより, KPI など, データドリブンな意思決定ができるようになった ( ダッシュボード 27個 ) ( クエリ 146個 )
忘れてはいけないこと
Aurora は「銀の弾丸」ではない
忘れてはいけないこと - 全てのクエリパフォーマンスが向上するわけではない - 手動で全機能テストを実施して, 問題ないことを確認した - 障害時に無停止でフェールオーバーができるわけではない - ALTER
SYSTEM CRASH で障害シュミレーションをして 障害時の動作確認をした
忘れてはいけないこと - 無停止でバージョンアップが行えるわけではない - 戦略的にメンテナンスを選択する気持ちを大切に - 定期的にバージョンアップが行えるような組織文化を作る - データベースも定期的に健康診断が必要
まとめ
まとめ - Makuake を支える新基盤として Aurora を採用した - MySQL 5.5 on
EC2 から多段レプリを活用した 移行フローで, 完璧に移行ができた - クエリパフォーマンスが2倍以上も改善した - データドリブンな組織文化を築けたのも Aurora のスゴさ
詳しくは CyberAgent Developers Blog に! https://developers.cyberagent.co.jp/blog/archives/6588/