Upgrade to Pro — share decks privately, control downloads, hide ads and more …

オンプレ Kubernetes クラスタの全サーバーを宣言的に再起動する方法

オンプレ Kubernetes クラスタの全サーバーを宣言的に再起動する方法

Daichi Sakaue

January 21, 2021
Tweet

Transcript

  1. Kubernetes クラスタの全ノードを再起動したい ▌⽬的 l ファームウェア更新 l 多くの場合、更新後に再起動が必要 l セキュリティ対応 l

    アプリの耐障害性の確認 l カオスエンジニアリング ▌条件 l クラスタ上で動いているサービスを⽌めない l ⼿作業で複雑なオペレーションをしない
  2. その他注意点 ▌サービスを壊さないよう PodDisruptionBudget と Eviction API を 活⽤する l Pod

    が Eviction できない場合は時間をおいてリトライする l ⼀定時間経つとアラートも鳴る ▌多少再起動に失敗したサーバーがあっても動作を続ける l アラートは鳴る ▌⼀時停⽌ボタンを付けておく