#kichijojipm Database on Kubernetesのお話(短縮版)

Cloud Native Storageが拓く Database on Kubernetesの未来吉祥寺.pm #19 2019/8/2 @tzkb

2 自己紹介  名前： Takahiro Kobayashi  職種：
DBを中心としたインフラエンジニア  好物：速いDB、太い帯域、小さなレイテンシ  出没する場所 Oracle、PostgreSQL、Kubernetesなどの勉強会

3 PostgreSQL on Kubernetes、色々やってます CloudNativeDays Tokyo 2019 Cloud Native Storageが拓く
Database on Kubernetesの未来 PGConf.Asia 2019 @Bali Building PostgreSQL as a Service with Kubernetes  ＋＝∞

4 アジェンダ 1. そもそもKubernetesって何？ 2. Kubernetes上でデータベースを動かす際の課題 3. Database on Kubernetesの検証
 HAパターン  Replication（Operator）パターン 4. DBプラットフォームとしてのKubernetes

5 1. そもそもKubernetesって何？

6 Kubernetesを知っていますか？「おれがKubernetesだ。」「Kubernetes、完全に理解した。」「Kubernetes、なにもわからない。」

7 Kubernetes＝コンテナ・オーケストレーターコンテナコンテナコンテナコンテナコンテナ • 軽量VMであるコンテナを良い感じに管理してくれる。特徴として以下がある。
• 宣言的設定  構築手順を定めるのではなく、状態を定義する。 • 自己修復  上記の状態に自動で復旧 • Immutable  Drop & Create  PetではなくCattle

8 Kubernetesはデータベースに不向き？ Node Node Node Master Slave Replicate • DBやSDSは、K8sで扱うには向いていないとされてきた。
特徴が足枷に。 • 宣言的設定 • 自己修復  一貫性を担保するために、リカバリ手順が必要  起動順序などが問われるケースもある • Immutable  データ消失はありえない  ペット的な扱いが必要

10 Storageにも色々あるけれど • CNCFという団体で定めたLandscapeにStorageも沢山。 • ただ、今までのストレージと何が違うのか分かりづらい。

11 Compute Control plane Data plane Kubernetesから使える２種類のストレージ Controler Controler •
K8sがストレージのどこまでを管理する/できるかで違いがある。 Kubernetes Ready Kubernetes Native

12 ２. Kubernetes上でデータベースを動かす際の課題

13 Kubernetesの本質は分散システム • K8sクラスタはetcdを中心とした分散システムとして構築される。 • つまりノードが未応答の際に、 – ネットワーク分断？ – プロセス(kubelet)障害？
– ノード障害？どれに該当するか、判断が難しい。 • ディスクリソースがattachされていれば、その状態も把握する必要がある。永続ボリュームを利用する workloadが嫌われる理由はこれ。 FailOver?

14 解はあるのか？DBアーキテクトは知っている。 • 状態がわからないなら、安全側に倒して処理を継続させたら良いんじゃない？ • 共有リソースをつくらなければ良いんじゃない？ • それってクラスタリングでは昔から
やっていることだよね。

15 分散システムへの対応① HA構成におけるFencing VIP Linux-HA Controller Controller << 状態不明なマスターが発生したら>> ①
強制的にノードの電源落とす i. プロセスを確実に停止 ii. ストレージのマウントを外す iii. VIPを外す ② その上で別ノードでリソースを獲得して、マスターを起動 ※強制電源断はHWベンダ提供の管理ポートやクラウドAPIを通して行われる。 • 障害ノードをフェンスで囲うこと(隔離) ＝Fencing

16 分散システムへの対応② Replicationにおけるリーダー選出 WAL データは最新、リーダーに選出。他はスレーブ。 • 複数候補から常に1台のマスタを選出
• 元マスタが復帰後もスレーブになっていることを通知する <<状態不明なマスタが発生したら>> ① 残ったスレーブから1台のリーダーを選出する ② 選出されたらマスターへ昇格 ③ 復帰ノードはスレーブになる • アルゴリズムとしてはPaxos、Raftなどが有名。マスタスレーブ

17 ３. Database on Kubernetesの検証

18 HA構成パターン(i)： Replicas:1 • PostgreSQLはStatefulSet、PVとしてRook/Cephを用いる。 • DBもストレージも全て K8sで管理するHA構成 • 共有ディスクはCeph
• kube-fencingでNode 障害時のFencing << 課題 >> • 複雑すぎるCeph • ネットワーク越しのIO による性能劣化 kube-fencing

19 HA構成パターン(ii)： Replicas:1 kube-fencing • LINSTORがProvisioning/AttachするDRBDボリュームを用いる。 • DBもストレージも全て K8sで管理するHA構成 •
DRBDでデータ冗長化 • シンプル • ReadはローカルIO、性能面でCephに優る << 課題 >> • スケール上限あり

20 （参考）SDS別のベンチマーク結果シングル構成(EBS) Rook/Ceph DRBD 1インスタンス 5インスタンス 2インスタンス 100 37.8
77.1 • pgbenchによる簡易ベンチマークでは以下のような差が出た。 TPS

21 Replicationパターン(Operator)： • KubeDBはPostgreSQLに限らず、様々なDBを扱えるOperator。 kubedb-operator -0 -1 -2 postgres snapshot
dormantdabases • KubeDBでは – PostgreSQL – MySQL – Redis 等のCRDが準備済。 • kubedb-operatorが PostgreSQLのSRを構成。 • SnapshotのCRDもあり、バックアップ・リストアが可能。 S3等にスナップショットの保存が可能

22 4. DBプラットフォームとしてのKubernetes

23 ここまで見てきたこと  DBクラスタリングをKubernetes Nativeで行うことについては、SDSやFencingなど部品が揃いつつある。  Replication構成をK8s化する試みは続いており、 Operatorを利用してDBAタスクを自動化する流れが生まれてきている。
 しかし、それで終わりではない（かも知れない）。 Cloud Native Storage ＋＋＝ ???

24 DB/Storage プラットフォームとしてのKubernetes DBaaS by Kubernetes STaaS by Kubernetes <<DBaaSの基本要素>>
• HA • Replication • DB Operator <<STaaSの基本要素>> • シンプルな冗長化 • 分散ストレージ • 互換性の高いIF(CSI) • “Platform for Platforms”として、K8sが各Serviceを支える。

Building PostgreSQL as a Service with Kubernetes PGConf.Asia 2019 2019/9/9
@tzkb

26 Questions? @tzkb @tzkoba

#kichijojipm Database on Kubernetesのお話(短縮版)

#kichijojipm Database on Kubernetesのお話(短縮版)

tzkoba

More Decks by tzkoba

Other Decks in Technology

Featured

Transcript

Cloud Native Storageが拓く Database on Kubernetesの未来吉祥寺.pm #19 2019/8/2 @tzkb

2 自己紹介  名前： Takahiro Kobayashi  職種：

3 PostgreSQL on Kubernetes、色々やってます CloudNativeDays Tokyo 2019 Cloud Native Storageが拓く

4 アジェンダ 1. そもそもKubernetesって何？ 2. Kubernetes上でデータベースを動かす際の課題 3. Database on Kubernetesの検証

5 1. そもそもKubernetesって何？

6 Kubernetesを知っていますか？「おれがKubernetesだ。」「Kubernetes、完全に理解した。」「Kubernetes、なにもわからない。」

7 Kubernetes＝コンテナ・オーケストレーターコンテナコンテナコンテナコンテナコンテナ • 軽量VMであるコンテナを良い感じに管理してくれる。特徴として以下がある。

8 Kubernetesはデータベースに不向き？ Node Node Node Master Slave Replicate • DBやSDSは、K8sで扱うには向いていないとされてきた。

10 Storageにも色々あるけれど • CNCFという団体で定めたLandscapeにStorageも沢山。 • ただ、今までのストレージと何が違うのか分かりづらい。

11 Compute Control plane Data plane Kubernetesから使える２種類のストレージ Controler Controler •

12 ２. Kubernetes上でデータベースを動かす際の課題

13 Kubernetesの本質は分散システム • K8sクラスタはetcdを中心とした分散システムとして構築される。 • つまりノードが未応答の際に、 – ネットワーク分断？ – プロセス(kubelet)障害？

14 解はあるのか？DBアーキテクトは知っている。 • 状態がわからないなら、安全側に倒して処理を継続させたら良いんじゃない？ • 共有リソースをつくらなければ良いんじゃない？ • それってクラスタリングでは昔から

15 分散システムへの対応① HA構成におけるFencing VIP Linux-HA Controller Controller << 状態不明なマスターが発生したら>> ①

16 分散システムへの対応② Replicationにおけるリーダー選出 WAL データは最新、リーダーに選出。他はスレーブ。 • 複数候補から常に1台のマスタを選出

17 ３. Database on Kubernetesの検証

18 HA構成パターン(i)： Replicas:1 • PostgreSQLはStatefulSet、PVとしてRook/Cephを用いる。 • DBもストレージも全て K8sで管理するHA構成 • 共有ディスクはCeph

19 HA構成パターン(ii)： Replicas:1 kube-fencing • LINSTORがProvisioning/AttachするDRBDボリュームを用いる。 • DBもストレージも全て K8sで管理するHA構成 •

20 （参考）SDS別のベンチマーク結果シングル構成(EBS) Rook/Ceph DRBD 1インスタンス 5インスタンス 2インスタンス 100 37.8

21 Replicationパターン(Operator)： • KubeDBはPostgreSQLに限らず、様々なDBを扱えるOperator。 kubedb-operator -0 -1 -2 postgres snapshot

22 4. DBプラットフォームとしてのKubernetes

24 DB/Storage プラットフォームとしてのKubernetes DBaaS by Kubernetes STaaS by Kubernetes <<DBaaSの基本要素>>

Building PostgreSQL as a Service with Kubernetes PGConf.Asia 2019 2019/9/9

26 Questions? @tzkb @tzkoba