Cloud Native開発者のためのDatabase with Kubernetes

by tzkoba

Slide 1

Slide 1 text

Cloud Native開発者のための Database with Kubernetes July Tech Festa 2019 , 12/8 Takahiro, Kobayashi ( @tzkb)

Slide 2

Slide 2 text

2 最近やっていること • Cloud Native Days Tokyo 2019 “Cloud Native Storageが拓く Database on Kubernetesの未来” • PGConf.Asia 2019 “Building PostgreSQL as a Service with Kubernetes” ＋＝∞

Slide 3

Slide 3 text

3 1. 突撃！お宅のデータベース 2. Managed Serviceで出来ること／出来ないこと 3. ここまで出来る Database with Kubernetes 4. Kubernetesはプラットフォームへアジェンダ #JTF2019 #JTF2019_A

Slide 4

Slide 4 text

4 突撃！お宅のデータベース 1

Slide 5

Slide 5 text

5 昔々あるところに、 LB AP AP AP • 古きよきLB-AP-DBのWebシステムがありました。 • VMかもしれないし、ベアメタルかも。 • 機器は老朽化、アーキテークチャも陳腐化。 • ある日、偉い人は言いました。「これからはクラウド」

Slide 6

Slide 6 text

6 Lift & Shift だ！ • 担当者は不眠不休でがんばりました。 • クラウド上へシステムを移行。 • アプリケーションをコンテナ化、Kubernetesにデプロイ。 • データベースはManaged Serviceを使った。良くありますよね？ (むしろ頑張ったほう） AP AP AP

Slide 7

Slide 7 text

7 使ってるDBはどこに？ @PostgreSQLアンカンファレンスオンプレクラウド（Managed）コンテナ 9 11 8 4 1 5 1

Slide 8

Slide 8 text

8 なぜManagedなデータベースを使うのか（建前） • RDSは素晴らしい。 • ベストプラクティスでしょ？ • 構築もらっくらく。 • 運用もほぼ自動。（本音） • インストールとか面倒。 • 開発が本業。DBAいない。 • ストレージもわからない。 • おれたちは雰囲気でDBやってる。 DB

Slide 9

Slide 9 text

9 今日のゴール～ Managed Service以外の選択肢を～  アプリケーションはコンテナ化して、Kubernetesも使う／使おうとしている、Cloud Native開発者の方に。  データベースの選択肢もいろいろあります。  Managed Serviceが唯一解ではありません。  DBのコンテナ化、という手もあります。  Kubernetes の力を借りてみましょう。

Slide 10

Slide 10 text

10 今日話さないこと  Kubernetesの一般的な概念。（一部、Statefulな機能の紹介はあります。）  Kubernetesクラスタの構築・管理方法。（K8sクラスタは構築済みを前提とします。異論はあると思います。）  PostgreSQL以外のデータベースでの事例。（ちょっとは話すかも知れません。）

Slide 11

Slide 11 text

11 Managed Serviceで出来ること/出来ないこと 2

Slide 12

Slide 12 text

12 RDSで出来ること電源、ラックサーバ管理 OSインストール OSパッチ DBインストール DBパッチバックアップ/リストア HA スケールアプリケーション電源、ラックサーバ管理 OSインストール OSパッチ DBインストール DBパッチバックアップ/リストア HA スケールアプリケーションオンプレミス Amazon RDS ユーザによる管理による管理

Slide 13

Slide 13 text

13 RDSで出来ないこと（制限されること）制限事項（例）具体的な例バージョン選択現在の最新は11.5（12はBeta）リソース上限 r5.24xl(96vCPU、768GBメモリ)、ストレージは最大64TB リソース下限 t3.mic(2vCPU、1GBメモリ) 一部パラメータが変更不可 full_page_writesなど一部のパラメータは変更できない Extensionが限られる pg_hint_planなど一部はインストール可、全てではない。 OSログインできない ssh接続によるOSログインはできない。 • オンプレミスでの構築の場合は、そもそもManagedは使えない。

Slide 14

Slide 14 text

14 それ、Database with Kubernetesでも出来ますよ？電源、ラックサーバ管理 OSインストール OSパッチ DBインストール DBパッチバックアップ/リストア HA スケールアプリケーション Database w/ K8sクラスタによる管理バージョン選択任意のバージョンを選べるリソース上限 Nodeのキャパシティ次第リソース下限 CPUはmill core単位で指定可パラメータ全て変更可能 Extension 全て導入可能 OSログイン可能（任意のユーザ作成も可）

Slide 15

Slide 15 text

15 ちょっと視点を変えて • ManagedなDBは確かに便利だが、全工程で最適ではない。特徴 • 開発者向け • 1人で1DBが理想 • リリース確認用 • ユーザ/内部テスト • 本番サービス用 Managed 向き？ • No. • 1人1インスタンスは辛い • Yes. • インスタンスが増えていくことも。 • Yes. • Managedのサービスレベル次第 Development Test/Staging Production

Slide 16

Slide 16 text

16 Developmentでは AP AP AP AP 1人1DBあると捗る。詰め込んでお安く。可用性は諦めるデータ保護は開発者で。温かみのある手動デプロイ。

Slide 17

Slide 17 text

17 Test/Stagingでは連結テストユーザ確認環境をきちんと分ける。可用性は最低限レベルで必要。データ保護、バックアップも。データのCloneも便利。統制の利いたCI/CD。 AP AP AP AP AP AP AP AP

Slide 18

Slide 18 text

18 Productionでは • ワークロード毎に求められる要件は変わってくる。梅竹松 RDS (Multi-AZ) RDS (Readレプリカ) Aurora Spanner • 最低限の可用性。 • AZ超えて、データを保護。 • スケールはしない。 • 3重以上のデータ保護。 • Readのみスケールが可能。 • 構成管理は複雑に。 • 3重以上のデータ保護。 • Writeヘビーなワークロードでもスケール。 • データ設計が特殊に。例

Slide 19

Slide 19 text

19 ここまでできる Database with Kubernetes 3

Slide 20

Slide 20 text

20 For Development • オンデマンドなインスタンス作成をKubernetesで実現。 apiVersion: v1 kind: Pod metadata: name: postgres-tzkb spec: containers: - name: postgres12-1 image: postgres:12.1 resources: requests: cpu: 500m memory: 512Mi limits: cpu: 1000m memory: 1024Mi volumeMounts: - name: pg-vol mountPath: /var/lib/postgresql/data

Slide 21

Slide 21 text

21 （解説）Development向けの超シンプルPostgreSQL apiVersion: v1 kind: Pod metadata: name: postgres-tzkb spec: containers: - name: postgres12-1 image: postgres:12.1 resources: requests: cpu: 500m memory: 512Mi limits: cpu: 1000m memory: 1024Mi volumeMounts: - name: pg-vol mountPath: /var/lib/postgresql/data ports: - containerPort: 5432 volumes: - name: pg-vol emptyDir: {} 柔軟なバージョン選択リソース上限/下限の設定ローカルディスクの一時利用より詳細に知りたい方は「Production Ready Kubernetesに必要な15のこと」 https://speakerdeck.com/govargo/production-ready-kubernetes-15-rules コンテナ(Pod)を停止するとデータが消える。

Slide 22

Slide 22 text

22 Development->Test/Stagingの課題  単純にコンテナをNodeに詰め込んだだけ。 • 1ノードならDockerレベルのことをやっているだけ。  Kubernetesのデータ永続化の仕組みを使っていない。 • StatefulSetやPersistentVolumeという仕組みがある。  ローカルディスクのキャパシティ管理が難しい。 • ローカルディスクの空きはPodデプロイ時に考慮されない。

Slide 23

Slide 23 text

23 （参考）TopoLVMとは topolvm lvmd /dev/hoge1 /dev/hoge2 /dev/hoge3 • サイボウズが開発した、LVMベースのCSIプラグイン。 • ローカルボリュームのキャパシティ管理に関する問題を解決する。【特徴】 • LVMによるボリューム管理。 • サイズやフォーマットなどを作成時に指定可能。 • 動的プロビジョニングに対応。 • ノードの空き容量に応じたスケジューリング。 https://github.com/cybozu-go/topolvm

Slide 24

Slide 24 text

24 For Test/Staging Kubernetesの仕組みを使って、正しく作る。 • StatefulSet（sts） – 安定的なストレージ利用、一意なホスト名などデータベースでの利用に向いている。 • Persistent Volume（PV） – PV/PVC/StorageClassを用いて、データを永続化。 – データ保護の面ではクラウド・ストレージを使うのが最も簡単。 AP AP AP 連結テストユーザ確認 PV AP AP AP PVC PVC PVC PVC PV PV PV

Slide 25

Slide 25 text

25 Test/Stagingをオンプレで構築するなら～既存機器の利用～ AP クラウド・ストレージの変わりに、既設ハードウェアをそのまま使えるケースがある。 • 下記の製品は自社ストレージをコンテナ・Kubernetesから利用可能とする仕組みを提供。 – NetApp Trident – Pure Storage PSO 既設のストレージ PVC

Slide 26

Slide 26 text

26 Test/Staging->Productionの課題  可用性が十分でない。 • StatefulSetのデプロイ対象Nodeを複数に出来ていない。 • そのため、Auto-Healingが効かない。 • EBSを使った場合、AZ障害で利用継続できない。  シングルインスタンスでスケーラビリティがない。 • データベースのスケールアウトに必要な、Readレプリカなどの仕組みが考慮されていない。

Slide 27

Slide 27 text

27 For Production • DB with Kubernetesで何処までカバーできるかの見極めが必要。梅竹松可用性データ保護運用性拡張性いずれも高 2重化(Multi-AZ) 3重化以上なし Readレプリカ Wrire分散 Operatorによる自動化 DBAによる運用

Slide 28

Slide 28 text

28 For Production（梅モデル）～OSS版～ kube-fencing AZ-a AZ-b 【特徴】 • SDSを用いたAZ跨ぎのリアルタイムなデータ冗長化。 – LINSTOR/DRBDとは、Linuxの HA構成では昔からあるネットワークRAIDをSDS化したもの。 • kube-fencingによる自動フェイルオーバ。 • はシングルインスタンスでシンプルで管理も容易。

Slide 29

Slide 29 text

29 Fencingとは？ kube-fencing • Kubernetesに本来向かない、共有ディスク型HAに必要な仕組み。 • K8sではNW分断などでsplit brainとなることを防ぐため、自動FOをしない。 • kube-fencingは管理ポート・クラウドAPI等を使って、 Nodeの電源を強制断。 • リソースが解放され、待機系でDBが起動される。

Slide 30

Slide 30 text

30 For Production（梅モデル）～プロプライエタリ版～ kube-fencing AZ-a AZ-b 【特徴】 • NetAppがAWS等で提供する、 Cloud Volume ONTAPを使ってAZを超えてデータの冗長化が可能。 • HPE Cloud Volumesも同じ用途で利用可能と思われる。 • その他の特徴はOSS SDSのものと同じ。

Slide 31

Slide 31 text

31 For Production（竹モデル） kubedb-operator -0 -1 -2 postgres snapshot dormantdabases S3等にスナップショットの保存が可能 AZ-a AZ-b AZ-c 【特徴】 • KubeDB というOSSで、 Streaming Replication。 • 1台のMaster、複数のSlave で構成され、Readクエリは分散可能。 • 面倒な初期構築やリカバリを KubeDB Operatorが管理。 • バックアップなどもK8sから実行可能、DBAの負荷が軽減される。

Slide 32

Slide 32 text

32 For Production：Zalandoのケース • PGConf.Asiaで発表された on Kubernetesの例。 Productionとして大規模に展開。

Slide 33

Slide 33 text

33 For Producion（松モデル）

Slide 34

Slide 34 text

34 For Production（松モデル）？  Writeヘビーなワークロードをこなせる分散DBは、そもそも非常に難しい。  例えば、以下のようなソリューションがあるが、いずれも現時点でKubernetes上に実装するのは簡単でない。 • Oracle Exadata • Amazon Aurora • Google Cloud Spanner • Azure Database for PostgreSQL – Hyperscale(Citus)

Slide 35

Slide 35 text

35 （参考）アプリケーション・パーティショニング AP AP AP 0

Slide 36

Slide 36 text

36 Kubernetesはプラットフォームへ 4

Slide 37

Slide 37 text

37 Database with Kubernetesの現実 • Productionで難しいケースがあることは事実。梅竹松 RDS (Multi-AZ) RDS (Readレプリカ) Aurora Spanner Managed • SDSでAZを超えてデータ冗長化。 • 共有ディスク型HAを模した可用性。 w/ K8s • Replicationで冗長化、 Readはスケール。 • Operatorで自動化、運用効率化。王道かつ現実解

Slide 38

Slide 38 text

38 For Producion（松モデル）も実現する可能性が！ • with K8sなが開発されている。 tablet3 tablet2 tablet1 tablet4 tablet2 tablet1 tablet4 tablet3 tablet1 tablet4 tablet3 tablet1 Distrbuted Txn Mgr Distrbuted Txn Mgr Distrbuted Txn Mgr Distrbuted Txn Mgr syscatalog syscatalog syscatalog 【特徴】 • Spannerに似た分散DB でWriteヘビーに強い。 • PostgreSQLのSQLエンジンと分散ストレージとしてのDocDBで構成される。 • データはShardingかつ冗長化される。

Slide 39

Slide 39 text

39 （参考）MySQLでの分散DB(Sharding)の運用例 VTtablet VTtablet VTtablet VTgate • MySQLでのwith Kubernetesといえば、Vitessが著名。 • Youtubeで利用されている実績がある。 • CNCFでもIncubatingから Graduatedになり、成熟化したと認められている。 • 何十億ユーザの大規模データベースを実用レベルで動かすなら、ここまで必要。 AP AP AP

Slide 40

Slide 40 text

40 （参考）Shardingとは • ノード間でデータを分割して保持、一つのDBのように見せる。 • コーディネータが処理を振り分け、負荷を分散する。 • ReadもWriteも分散できる。 • データ冗長化は基本的に含まない。合わせて実装することもある。 • トランザクション実装が難しい。 • 可用性よりも拡張性を高める際に使われる構成。コーディネータ

Slide 41

Slide 41 text

41 Kubernetesはデータベース・プラットフォームへ Sharding RDB on 分散KVS • Vitessがメジャーな事例。 • Hyperscale(Citus)も同様。 • 多数のインスタンス管理は Kubernetesの得意ワザであり、相性は良い。 • Spannerなどが典型。 • プラットフォームとしての KubernetesでSQLエンジンと分散KVSを、大規模に展開・管理できる可能性がある。 • 2種の分散DBのプラットフォームとして、Kubernetesに注目。

Slide 42

Slide 42 text

42 （再掲）今日のゴール～ Managed Service以外の選択肢を～  アプリケーションはコンテナ化して、Kubernetesも使う／使おうとしている、Cloud Native開発者の方に。  データベースの選択肢はいろいろあります。  Managed Serviceが唯一解ではありません。  DBのコンテナ化、という手もあります。  Kubernetes の力を借りてみましょう。 with K8sも選択肢になり得る時代です。 Kubernetesでアプリだけ、は勿体ないですよ。

Slide 43

Slide 43 text

43 Questions? @tzkb @tzkoba