365日24時間稼働必須サービスの完全無停止DB移行

by Kyuden Masahiro

Slide 1

Slide 1 text

365 日 24 時間稼働必須サービスの完全無停止 DB 移行〜 MongoDB to Amazon Aurora 〜

Slide 2

Slide 2 text

Hi! I’m kyuden ● Github: kyuden ● Twitter: @kyuden_ ● Sorcery gem commiter ● https://github.com/Sorcery/sorcery ● Banken gem creator ● https://github.com/kyuden/banken ● WEB+DB Press Ruby 連載 (vol96~101)

Slide 3

Slide 3 text

どんなサービス ?

Slide 4

Slide 4 text

collection の規模感 RubyKaigi 2017

Slide 5

Slide 5 text

Ruby biz Grand prix 2017

Slide 6

Slide 6 text

Our Team

Slide 7

Slide 7 text

はじまりはじまり

Slide 8

Slide 8 text

昨年 7 月に 38 億レコード ( ドキュメント ) を不整合データなしダウンタイムゼロで MongoDB から Amazon Aurora にデータ移行した

Slide 9

Slide 9 text

昨年 7 月に 38 億レコード ( ドキュメント ) を不整合データなしダウンタイムゼロで MongoDB から Amazon Aurora にデータ移行した

Slide 10

Slide 10 text

このトークで主に話すこと ● 具体的なデータ移行方法 ● 移行のために作ったツールの設計 / 内部実装

Slide 11

Slide 11 text

移行対象のコレクション ● node_values ● 翻訳データが格納されたコレクション ● 約 12 億ドキュメント ● page_node_values ● どのページにどの翻訳データがあるかが格納されたコレクション ● 大まかに言うと page と node_values のジャンクションテーブル ( ジャンクションコレクション ) ● 約 26 億ドキュメント

Slide 12

Slide 12 text

制約 ● そもそもダウンタイムゼロである必要はあったのか ● 仮にダウンタイムがあっても翻訳データはキャッシュされているので 10000+ の Web サイト / サービスは翻訳可能 ● しかし、ダウンタイムがあるとその間は翻訳の作成 / 更新 / 削除は不可能 ● ユーザは日本だけでなく世界中に存在 ● たとえば、 EC サイトなどは頻繁に新しいページが公開されるが、その間新しい翻訳がなされないと元言語以外を使用するユーザからの売上は確実に減少する ● ビジネスサイドと話し合いをした結果、数分であればダウンタイムの許可は取れそう ● しかし、ダウンタイムゼロにこしたことはないし、エンジニアとしはチャレンジングなのでやりたかった

Slide 13

Slide 13 text

なぜ MongoDB から移行するのか ● そもそもスキーマレスである必要がなかった ● 厳密な整合性求められるケースが増えてきた ● Mongos 突然の死 ( 不安定 ) ● クエリが激烈に重くなり調べてみるとある Mongo サーバーだけインデックスがはられていない ● Mongoid の機能不足 ● 小さなチームにはメンテナンスコストが高すぎた ● Etc ● ちゃんと話そうとすると時間足りないので省略。別の機会にでも。なぜ Aurora なのかも同じく省略

Slide 14

Slide 14 text

移行手順

Slide 15

Slide 15 text

Step0: アプリケーションコードの修正両方の DB を使えるようアプリケーションコードを修正する ● すべての DB アクセスを Abstracter クラス経由に書き換える ● ユーザごとにどちらの DB を使用するかのフラグを持たせる ● `use_mongo?` はフラグを参照している ● フラグは MongoDB にある users collection の field

Slide 16

Slide 16 text

移行ステップと対応するフラグ名一覧 Write Read Read Write 2 Read Write 1 Read Write Write 1 Write 2 aurora_write aurora_read aurora Step 1 Step 2 Step 3 Step 4 nil Aurora Aurora Aurora Aurora