AWS Fault Injection ServiceによるYugabyteDBの可用性検証

AWS Fault Injection ServiceによるYugabyteDBの可用性検証 YugabyteDB Japan Meetup #4　2024/01/23（Tue）

1 自己紹介藺牟田　佳佑（いむた　けいすけ） • 2020年ウルシステムズ株式会社に新卒入社 • 開発案件を担当 • 主にwebアプリケーション •
フロントエンド: JavaScript（vue.js） • バックエンド: Java（Spring）TypeScript（nest.js）C# • インフラ: AWS、Azure

2 LTの内容 YugabyteDBは高可用性・高回復性！ DCに障害が発生しても、短時間のダウンタイムで回復すると謳われています障害発生した際の実際の挙動を確認してみました！

YugabyteDBのおさらい

4 YugabyteDBはNewSQLの一種です YugabyteDBとはYugabyte社が開発しているオープンソースのNewSQLデータベースです RDB NewSQL NoSQL … PostgreSQL MySQL
Oracle SQL Server … Cloud Spanner Cockroach DB TiDB Yugabyte DB … Apache Cassandra Dynamo DB Radis Mongo DB

5 NewSQLはRDBとNoSQLのいいとこどり！ RDB NoSQL NewSQL SQL ◦ × ◦ ACIDトランザクション
◦ × ◦ 可用性 × ◦ ◦ スケーラビリティ × ◦ ◦ データベース機能比較 SQL ACIDトランザクション RDB 可用性スケーラビリティトレードオフを排除 NewSQL NoSQL

6 YugabyteDBはNewSQLの一種です！

7 YugabyteDBはさらにこのような特徴があります PostgreSQL/ Cassandra 互換マルチクラウド/ ハイブリッドクラウド DR対策/ 地理分散
PostgreSQL、Cassandraと互換性があるため、移行コストが低減されます。また開発担当者の学習コストを抑えることができます。複数のクラウドサービスにまたがってデータを配置できます。また、オンプレミスとのハイブリッドクラウド構成も可能です。ノードを異なるリージョンに配置し、Active-Active構成のDR を実現できます。事業継続の観点のみならずユーザーの近い場所にデータを配置することでUXを高めます。

8 YugabyteDBのデータ保存の仕組みノード2 ノード3 ノード4 • YugabyteDBはtabletと言われる単位でデータをパーティションし、他ノードへシャーディングしています。 • 各ノード間のデータ整合性は、RAFTコンセンサスというアルゴリズムを用いて担
保します（RAFTコンセンサスするグループをtablet peerと呼びます） follower follower leader follower follower follower leader update update update update tablet peer tablet ノード1 follower leader tablet数が3の例

9 データをシャーディングしているため可用性が高いノード2 ノード3（障害発生）ノード4 • 特定AZに障害発生しても、他ノードにデータが残っており、そのノードで処理継続できるため、高い可用性を維持できます follower follower
leader follower follower follower leader update update update update ノード1 follower leader tablet数が3の例 tablet peer tablet

10 障害発生時はこのように回復しているノード2 ノード3（障害発生）ノード4 1. leaderを再選出します • 障害発生tabletが担当していたleaderを他tabletに担当してもらいます 2.
データを再配置します • 障害発生tabletで保管していたデータを他ノードに移します follower follower leader follower follower → leader follower leader update update update update ノード1 follower leader tablet数が3の例 ① leaderを再選出 follower follower ② データの再配置 ② データの再配置 tablet peer tablet

11 改めて本日のLTテーマは YugabyteDBの可用性・回復性を実際に AZ障害を発生させつつ確認します！ダウンタイムはどれくらいなのか？回復途中にリクエストが届いたら、エラーが返却される？回復途中、書き込みはできないけ
ど、読み込みはできるってどこかで見たけど本当？

検証内容

13 検証テーマ AZ障害発生後、回復途中にリクエストされた場合、どのような挙動となるか？アプリ【結果の想定】書き込みはエラーが返ってくる？ただし、読み込みは200 OKが返ってくる

14 検証の構成 EC2上にYugabyteDBを構築します。また、AZ障害はAWS Fault Injection Service（以降、FISと記載）で再現します AWS Fault Injection Service
VPC クライアント VM（EC2）（onEC2） ap-northeast-1a ap-northeast-1c ap-northeast-1d （onEC2）（onEC2）スクリプトを使用し、 VMに構築したAPIに 1秒間隔でリクエストし続ける指定したAZに障害を発生させる Create/Readリクエスト 3ノードを1クラスターにまとめる VM上にAPIを構築各AZに YugabyteDBを1台ずつ配置

15 AWS Fault Injection Service とは意図的にAWS環境に障害を発生させ、障害発生時の挙動や回復性を検証できるサービス障害を発生させられるサービス例  -
Amazon CloudWatch - Amazon EBS - Amazon EC2 - Amazon ECS - Amazon EKS - Amazon RDS - AWS Systems Manager - AZなどその他ネットワーク 

検証準備

17 検証準備 ① YugabyteDBクラスターを作成 ③ シェルスクリプトを作成 ② APIを作
成 ④ FISを設定

18 検証準備 ①YugabyteDBクラスターを作成（1/3） ① YugabyteDBクラスターを作成 ③ シェルスクリプトを作成 ②
APIを作成 ④ FISを設定

19 検証準備 ①YugabyteDBクラスターを作成（2/3）オープンソースのYugabyteDBを3台のEC2にそれぞれインストールし、1クラスターで起動しました YugabyteDBのバージョン YugabyteDBのキャパシティ 3ノード（1AZに1ノード配置）でクラ
スタを構成

20 検証準備 ①YugabyteDBクラスターを作成（3/3） DBに初期データを投入しました（公式サイトのサンプルを参考） 4テーブル作成 18760件投入 200件投入 2500件投入 1112件投入

21 検証準備 ②APIを作成（1/2） ① YugabyteDBクラスターを作成 ③ シェルスクリプトを作成 ②

22 検証準備 ②APIを作成（2/2） • GETとPOST、計2本のAPIを作成しました • DB接続するためにJDBC「YugabyteDB smart drivers」を使用しました
• クラスター内の複数ノードに対してリクエストを振り分ける対応を手軽に実現できます（PostgreSQLの場合、サービス導入や実装変更が必要となり手間となります） HTTPメソッド概要 Get ordersテーブルのレコード件数と先頭10件を返却する Post reviewsテーブルのレコードを1件追加する

23 YugabyteDB smart driversとは • クライアントサイドでロードバランシングできます • 複数の接続先に対して、クライアント側で負荷分散できる • 接続先がダウンした場合でも生きているノードへ接続できる
spring.datasource.url=jdbc:yugabytedb://57.180.54.242:5433,~~,.173:5433/test?load-balance=true spring.datasource.username=yugabyte spring.datasource.password=yugabyte spring.datasource.driver-class-name=com.yugabyte.Driver 指定した複数のIPアドレスにアクセスします

24 検証準備 ③シェルスクリプトを作成（1/2） ① YugabyteDBクラスターを作成 ③ シェルスクリプトを作成 ②

25 検証準備 ③シェルスクリプトを作成（2/2）詳細省略（GetとPostのAPIに対して1秒間隔でcurlリクエストし続けるスクリプトを作成しました）

26 検証準備 ④AWS FISを作成（1/2） ① YugabyteDBクラスターを作成 ③ シェルスクリプトを作成
② APIを作成 ④ FISを設定

27 検証準備 ④AWS FISを作成（2/2）特定のAZを停止するよう設定しましたネットワーク障害を発生させる 5分間停止障害発生させるAZ （サブネット）を選択

28 検証準備動作確認（1/2）クライアントでシェルスクリプト実行！シェルスクリプトのログからAPIリクエストが通っていることが確認できました！ GETリクエストの結果 POSTリクエストの結果 1秒間隔でAPIリクエストしている

29 検証準備動作確認（2/2） YugabyteDB UIからモニタリング結果を見ると、、各ノードにリクエスト到達していることが確認できました！ノード1のモニタリングノード2のモニタリングノード3のモニタリングノード毎の
モニタリング結果各ノードにリクエストが到達している

30 検証の流れざっくり以下の手順で検証しますローカルPCにてスクリプトを実行する API経由でYugabyteDBに 1秒間隔でリクエストを送り続けます（15分間）数分後、FIS経由で AZ障害を発生させる
障害AZに配置されているノードが停止し、 leaderの再選出などが始まります APIレスポンスや YugabyteDB UIのモニタリング結果を確認するエラーが返却されるか・レイテンシー/スループットなどの性能が悪化するか確認します

検証結果

32 検証結果改めて検証テーマは、、

33 スクリプト実行！シェルスクリプトが出力したログを見ると、、 APIリクエストが始まったことが確認できました！ curl　GETリクエストのログ curl　POSTリクエストのログ

34 AZ障害開始！数秒後Yugabyte UIを確認すると、、、ノードが死んでいることが確認できました！

35 検証結果 APIリクエストの結果 • エラーレスポンスは返ってこなかった。 • ただし、AZ障害発生（2024/01/23:02:40:09）直後、約10～15秒間、レイテンシーが悪化していた • 10～15秒後、元のレイテンシーに戻った
シェルスクリプト　GETリクエストのログシェルスクリプト　POSTリクエストのログ

36 検証結果 YugabyteDB UIのモニタリング結果各ノードの平均レイテンシーのモニタリング結果ノード1 ノード2 ノード3（障害発生ノード）障害発生期間読み込み:
0.75ms、書き込み: 4.59ms 読み込み: 0.74ms、書き込み: 4.49ms （期待どおり）ノード停止している

37 検証結果わかったこと • 特定のノードに障害発生時、YugabyteDBはエラーを返却しない。クライアントはLeaderの再選出などが終了するまで待機することとなる • 今回の場合、約10～15秒ほど待機していた様子 •
YugabyteDBからエラーは返却されないものの、アプリ側でタイムアウト値を設けるなど、ハンドリングした方がよさそう • 書き込みだけではなく、読み込みも同様に長時間待機していた工夫次第で改善可能？ Follower Readなどの工夫で改善可能？

まとめ

39 実際動かすと分かってくるものがある • 机上でこう動くはず！な事象を実際に検証したことにより、新たな疑問が生まれるとともに、より具体的な理解を得ることができました！ • 次は、より本番な環境を想定した検証を実施してみたいと思います！ •
tablet数やシャーディングの単位など、YugabyteDBの設定周りをいじる • K8s上に構築してノードをセルフヒーリングしてみる …

AWS Fault Injection ServiceによるYugabyteDBの可用性検証

AWS Fault Injection ServiceによるYugabyteDBの可用性検証

More Decks by YugabyteDB Japan

Featured

Transcript