Workshop: control and fix your own K8s cluster.

Slide 1

Slide 1 text

動手玩耍 K8s Cluster https://reurl.cc/nN59zl

Slide 2

Slide 2 text

請進去這邊 -> https://reurl.cc/nN59zl • 認領一個 Cluster，並且打勾 • 使用密碼 sre_summit_2024 去貼上 private_key • 記得權限 600 • 使用 [email protected] 搭配這把 key 登入三台機器 • Port: 31111 -> Grafana • Port: 31112 -> Prometheus • 請用 sudo 的方式執行 kubectl • 請先確保自己可以連進去到所有節點並且有能力於 master 節點運行 kubectl versions • 節點都是 Debian 的系統

Slide 3

Slide 3 text

環境介紹 • 三台機器搭建的 K8s • 請用提供的 private key 存取 • 三台機器都有 public IP • 每個環境都預先安裝好 • Prometheus: 31112 • Grafana: 31111 • 用 Public IP + Port 即可存取

Slide 4

Slide 4 text

Cluster Provider https://docs.cloudnative.tw/

Slide 5

Slide 5 text

環境介紹 • Master 機器下有一個名為 sre-2024-workshop 的資料夾 • 裡面有 q1~q10 對應 10 個問題的相關檔案 (除了 q2) • *.yaml -> 每個問題需要部署的腳本 • App -> 每個 image 的 source code • 基本上你不需要重新 Build Image，專心看 YAML 與 source code 找出問題並且修復即可 • 資料夾內的 others 有描述如何安裝 kube-prometheus-stack，包含 Grafana + Prometheus 的安裝方式

Slide 6

Slide 6 text

Question 1 • 觸發條件: 部署 q1/deploy.yaml • 症狀 • Application 大概70秒左右後會 crash • 目標 • 其不會 Crash

Slide 7

Slide 7 text

A 1 • 問題點有兩個 • OOM • Liveness Probe • 調高兩者的 limit 即可 • CPU • Memory

Slide 8

Slide 8 text

Question 2 • 觸發條件: N/A • 症狀 • Kubectl get nodes 後有節點發生顯示 not ready • 目標 • 修正節點，讓節點運作正常

Slide 9

Slide 9 text

A 2 • 節點的 Kubelet 因為 swap 的關係沒有辦法起來 • 關閉 swap 並且重啟 kubelet 即可 • sudo swapoff -a • sudo systemctl restart kubelet

Slide 10

Slide 10 text

Question 3 • 觸發條件: 部署 q3/deploy.yaml 且確保 Q2 問題已經修復 • 症狀 • kubectl get pods 後，發現每個副本都 crash，但是有些會顯示 invalid • 目標 • 找出原因，解釋為什麼是 invalid • 修復，讓其正確顯示

Slide 11

Slide 11 text

A 3 • sudo timedatectl set-ntp on

Slide 12

Slide 12 text

Question 4 • 觸發條件: 部署 q4/deploy.yaml • 症狀 • Client 沒有辦法連接到 Server，顯示 Response Code:000 • 目標 • Client 可以順利連接

Slide 13

Slide 13 text

A 4 • 問題點有多個 • Server: Service 沒有連接好 • Client 的參數 port 是 8080，但是 service 是 80

Slide 14

Slide 14 text

Question 5 • 觸發條件: 部署 q5/deploy.yaml • 症狀 • Statefulset application 跑不起來 • 目標 • 如何再不移除 PVC 的情況下修好問題，並且可以用 deploy.yaml 順利部署 • 意思就是 kubectl get sts q5 -o yaml 必須是要可以反應最新資訊

Slide 15

Slide 15 text

A 5 • 問題點有多個 • Statefulset 空間不夠 • 解法 • 編輯 PVC，改動大小 • 本來的 deploy.yaml 也需要一起改變 • sudo kubectl delete sts --cascade=orphan q5 • 單純刪掉紀錄，但是物件不刪除 • 這樣就可以重新用更新過的 YAML Apply 過去

Slide 16

Slide 16 text

Question 6 • 觸發條件: 部署 q6/deploy.yaml • 症狀 • Server 會定期列印出收到的檔案內容 • 透過 kubectl edit cm q6-con f igmap 去更新內容，結果內容似乎都不會反應回去 Pod 內 • 目標 • 可以修改 Con f igMap 的內容且 Pod 可以順利看到更新後的結果

Slide 17

Slide 17 text

A 6 • 問題點有多個 • Con f igMap 若採取 subpath 的話，背後的設計會使得目前的更新機制無法運作 • 簡單方法就是不要用 subpath，複雜的解法會需要針對 soft link 進行一些處理 • 拔掉 subpath，根據 mountPath & env (DATA_PATH) 進行調整

Slide 18

Slide 18 text

Question 7 • 觸發條件: 部署 q7/deploy.yaml • 症狀 • 希望透過 HPA 的機制，讓 Server 自動根據 CPU 用量去調整 • 大量的 Client 去打流量，結果 HAP 好像不如預期 • 目標 • 找出原因 • 行有餘力就解決

Slide 19

Slide 19 text

A 7 • 沒有安裝 metrics server • Prometheus 可以收集並不代表 HPA 就可以正常運作

Slide 20

Slide 20 text

Question 8 • 觸發條件: 部署 q8/deploy.yaml • 症狀 • 部署一個 ReadWriteOnce 的 PVC • 有兩個 Deployment 都不小心去使用到該 PVC • 很多 Pod 似乎都可以同時使用 • 目標 • 發生什麼事情？說好的 ReadWriteOnce 呢

Slide 21

Slide 21 text

A 8 • ReadWriteOnce 的單位是 Node 不是 Pod • 因此如果多個 Pod 屬於同講 Node，還是可以一起共享 • 要改用 • ReadWriteOncePod 才是真正一個 Pod 使用，同時其他的會直接卡 Pending

Slide 22

Slide 22 text

Question 9 • 觸發條件: 部署 q9/deploy.yaml • 症狀 • Server 有實作 Prometheus Endpoint，但是似乎 Prometheus 網頁都看不到 • 也有部署 ServiceMonitor • 目標 • 可以透過 IP:31112 看到該 App 分享的 Metrics • q9_http_request_total

Slide 23

Slide 23 text

A 9 • ServiceMonitor 有東西不正確 • 沒有和 Prometheus 的 Label 一致 • sudo kubectl -n monitoring get prometheus -o yaml • serviceMonitorSewlector • 也沒有和 Service 的 Label 一樣

Slide 24

Slide 24 text

Question 10 • 觸發條件: 部署 q10/*.yaml • 症狀 • 部署的服務，透過 Grafana 內的 q10 dashboard 觀察 HTTP latency，看來 P90 後數值都飆高 • 目標 • 找到原因並且修復

Slide 25

Slide 25 text

A 10 • CPU Throttling，調高 CPU Limit 即可舒緩