Kubernetesストレージ可用性の監視ツール「pie」のご紹介

Slide 1

Slide 1 text

Kubernetesストレージ可用性の監視ツール「pie」のご紹介 2022年11月24日サイボウズストレージチーム大神祐真 1

Slide 2

Slide 2 text

自己紹介 ▌大神祐真 ▌サイボウズストレージチームにて分散ストレージCephと自社製CSIドライバTopoLVMを用いたデータ移行と運用に従事しています 2

Slide 3

Slide 3 text

はじめに ▌サイボウズの新インフラ基盤(Neco)は Kubernetesクラスタです ▌ストレージチームではNeco上のアプリケーションへ 2種のストレージを提供しています Rook/Ceph – 分散ストレージ TopoLVM – ノード内のローカルストレージ(LVM)を動的に切り出して提供する自社製CSIドライバ 3

Slide 4

Slide 4 text

はじめに ▌サイボウズの新インフラ基盤(Neco)は Kubernetesクラスタ ▌ストレージチームではNeco上のアプリケーションへ 2種のストレージを提供している Rook/Ceph – 分散ストレージ TopoLVM – ノード内のローカルストレージ(LVM)を動的に切り出して提供する自社製CSIドライバ 4 PVの払い出しや、払い出したボリュームへの読み書きが正常に行えるか監視する仕組みが欲しい pie

Slide 5

Slide 5 text

正常性の確認方法 ▌以下の処理を定期的に実施します 1. 指定したNodeでCSIドライバ(TopoLVM)に PVを払い出させる 2. PodからPVにデータを書く 3. Podを消す ▌そして、PVの払い出しにかかった時間や、アクセスのパフォーマンスを測って、メトリクスとして出力します 5 払い出しに時間がかかりすぎる、パフォーマンスがしきい値を超える等で異常と判定することができます

Slide 6

Slide 6 text

pieの中での2つの役割分担 (Probe/Controller) ▌以下の処理を定期的に実施します 1. 指定したNodeでCSIドライバ(TopoLVM)に PVを払い出させる 2. PodからPVにデータを書く 3. Podを消す ▌そして、Podの払い出しにかかった時間や、アクセスのパフォーマンスを測って、メトリクスとして出力します 6 ←を行う役割が Probeです ↑に加えてProbeをPodとして生成する役割が Controllerです

Slide 7

Slide 7 text

PV監視の基本的な流れ 7 CronJob プローブ用Pod volume Probe 確認対象のNodeにプローブ用Podをデプロイ CSI Driver Pod再起時に PV(volume)を作成 Controller Pod Controller Prometheus, VictoriaMetrics metrics を scrape して回収 ≈ 異常値を検出して発報 pieのプログラム新しくデプロイするリソース既存のリソース凡例生成 metrics を post Node Reconciler Event Reconciler

Slide 8

Slide 8 text

PV監視の基本的な流れ 8 CronJob プローブ用Pod volume Probe 確認対象のNodeにプローブ用Podをデプロイ CSI Driver Pod再起時に PV(volume)を作成 Controller Pod Controller Prometheus, VictoriaMetrics metrics を scrape して回収 ≈ 異常値を検出して発報 pieのプログラム新しくデプロイするリソース既存のリソース凡例生成 metrics を post Node Reconciler Event Reconciler

Slide 9

Slide 9 text

Node Reconciler ▌Node別・Storage Class別にプローブ用Podを生成するCronJobを生成します 現状のCronJobでは 1分周期でプローブ用Podを生成します 9

Slide 10

Slide 10 text

PV監視の基本的な流れ 10 CronJob プローブ用Pod volume Probe 確認対象のNodeにプローブ用Podをデプロイ CSI Driver Pod再起時に PV(volume)を作成 Controller Pod Controller Prometheus, VictoriaMetrics metrics を scrape して回収 ≈ 異常値を検出して発報 pieのプログラム新しくデプロイするリソース既存のリソース凡例生成 metrics を post Node Reconciler Event Reconciler

Slide 11

Slide 11 text

プローブ用Pod ▌PVの払い出しと、払い出されたPVをマウントし、読み書きのチェック(現状ではfio) を行います Generic Ephemeral Volumeを用いています ▌得られたメトリクスをControllerへpostします 11

Slide 12

Slide 12 text

PV監視の基本的な流れ 12 CronJob プローブ用Pod volume Probe 確認対象のNodeにプローブ用Podをデプロイ CSI Driver Pod再起時に PV(volume)を作成 Controller Pod Controller Prometheus, VictoriaMetrics metrics を scrape して回収 ≈ 異常値を検出して発報 pieのプログラム新しくデプロイするリソース既存のリソース凡例生成 metrics を post Node Reconciler Event Reconciler

Slide 13

Slide 13 text

Event Reconciler ▌プローブ用PodのEventをチェックし、タイムスタンプ情報を元にメトリクスを作成します ▌例) (Pod完了時刻) – (Pod生成時刻) があるしきい値以上である場合、「CreateProbeSlowCount」というメトリクスをインクリメントします 13

Slide 14

Slide 14 text

動作例 14 pieを動作しているホスト(この場合はローカルホスト) の8080番ポートの”/metrics”からメトリクスの確認が行えます

Slide 15

Slide 15 text

OSSとして公開中 ▌以下のリポジトリで公開しています https://github.com/topolvm/pie 15

Slide 16

Slide 16 text

主な課題 ▌PVの削除時間に関するメトリクスの追加 ▌ドキュメント拡充 16

Slide 17

Slide 17 text

17 おわりご清聴ありがとうございました！