Slide 1

Slide 1 text

Aurora DSQL と楽観的同時実行制御(OCC) AWS re:Invent 2024 re:Cap 名古屋 2024/12/26 まつひさ(hmatsu47)

Slide 2

Slide 2 text

自己紹介 松久裕保(@hmatsu47) ● https://qiita.com/hmatsu47 ● 名古屋で Web インフラのお守り係をしています ● 普段は JAWS-UG 名古屋(・浜松)で DB ネタを中心 に話しています(主に RDS / Aurora・たまに DynamoDB) ● 全国各地の JAWS(& AWSJ)イベントを巡っています ○ DAYS(東京)→佐賀→金沢(福井開催)→山形→ Summit →ミート(豊橋)→ 岩手(滝沢)→青森(弘前) 2

Slide 3

Slide 3 text

12/4 に Aurora DSQL(プレビュー)発表 ● シングルリージョン/マルチリージョン大規模分散 DB ○ リレーショナルモデルと SQL が使用可能 ■ いわゆる NewSQL の一種 ○ ワークロードに合わせて自動でスケール(UP / DOWN) ○ PostgreSQL ワイヤープロトコル互換 ■ 対応 SQL 文は PostgreSQL のサブセット ○ アクティブ/アクティブ構成 ■ マルチ Writer でシャーディングを使わないアーキテクチャ 3

Slide 4

Slide 4 text

[1] シングルリージョン構成(可用性 99.99%) 4 引用元 : https://aws.amazon.com/jp/blogs/news/introducing-amazon-aurora-dsql/ Transaction log layer がある

Slide 5

Slide 5 text

[2] マルチリージョン構成(可用性 99.999%) 5 引用元 : https://aws.amazon.com/jp/blogs/news/introducing-amazon-aurora-dsql/ Witness Region がある (リージョンクラスター間調停・ 障害リージョンのデータ修復)

Slide 6

Slide 6 text

Aurora PostgreSQL Limitless Database では? 6 引用元 : https://aws.amazon.com/jp/blogs/news/amazon-aurora-postgresql-limitless-database-is-now-generally-available/ 前段のルーター層でコマンド/ クエリをシャードに振り分ける 各シャードでデータを分割管理 する (テーブルの種類によってデータの 配置は異なる) Limitless Database はシャーディング によってデータと負荷を分散するので テーブル設計が難しい

Slide 7

Slide 7 text

シャーディングを使わずにスケールするには? ● 楽観的同時実行制御(OCC)を採用 ○ 一般の RDBMS は悲観的同時実行制御(PCC)を採用 ■ ロック機構を使う ○ OCC ではロックを使わない ■ コミット時に他のトランザクションとの更新競合を検知したらアボート ■ アボート後必要に応じてリトライ処理(アプリケーション側で実装) ○ ロックしないので他のトランザクションを待たせることがない ■ ただし更新競合が頻発するとアプリケーションの性能が下がる欠点がある 7

Slide 8

Slide 8 text

トランザクション A トランザクション B テーブル X の id = 1 の行 (コミット済み) 開始(BEGIN) 10(初期値) 開始(BEGIN) テーブル X の id = 1 の値を +1 →id = 1 の行ロック獲得成功 (11) (別の処理を実行) テーブル X の id = 1 の値を +1 →id = 1 の行ロック獲得待ち コミット(COMMIT)→成功 (↑行ロック獲得待ち) 11 id = 1 の行ロック獲得成功 (12) (別の処理を実行) コミット(COMMIT)→成功 12 例 [1] 通常の RDBMS(PCC / READ COMMITTED) 8

Slide 9

Slide 9 text

トランザクション A トランザクション B テーブル X の id = 1 の行 (コミット済み) 開始(BEGIN) 10(初期値) 開始(BEGIN) テーブル X の id = 1 の値を +1 →id = 1 の行 : 11 (別の処理を実行) テーブル X の id = 1 の値を +1 →id = 1 の行 : 11 コミット(COMMIT)→成功 (別の処理を実行) 11 コミット(COMMIT) →失敗・アボート 例 [2] Aurora DSQL(OCC / SNAPSHOT ISOLATION) 9 必要ならリトライする

Slide 10

Slide 10 text

OCC は PCC と比べて本当に効率が良いのか? ● そもそも更新競合が少ないケースで使うもの ○ 更新競合が多い処理→別データストアを選択して実装したほうが 良い ● 分散 DB ではネットワークの遅延が大きく影響 ○ 都度ロックする場合、地理的に離れたノード・クラスターにも ロックの伝達が必要 →トランザクションコミット時にまとめて確認したほうが効率が良い 10

Slide 11

Slide 11 text

OCC の注意点 ● 長いトランザクションには向かない ○ あくまでも更新競合が少ないトランザクション向け ■ トランザクションが長くなるほど更新競合が発生しやすくなる ● リトライはアプリケーションで実装する必要がある ● コミット成功の順序が保証されない ○ トランザクション A → B → C で B が競合してリトライすると、 コミット成功の順序が A → C → B(リトライ)になることも 11

Slide 12

Slide 12 text

まとめ ● Aurora DSQL は SQL が使える大規模分散 DB ○ シングルリージョンでもマルチリージョンでも使える ○ OCC の採用によりシャーディングなしにスケールが可能に ● 通常の RDBMS とはトランザクションの流れが異なる ○ 更新が競合したらアボート ○ 必要ならアプリケーション側でリトライ処理を実装する 12

Slide 13

Slide 13 text

宣伝 : PHP カンファレンス名古屋 2025 開催! ● PHP 以外の話も(少し)あります!(私は MySQL の話を…) ○ https://phpcon.nagoya/2025/ 13