Pod が終了するときに起きること / What happens when the pod exits

Pod が終了するときに起きること 1

確認したい処理パターン 2  パターン1  Pod の削除と同時にエンドポイントに接続された新規コネクションが削除中の Pod に振り分けられること
 パターン2  Pod の削除と同時にエンドポイントに接続された新規コネクションが削除中の Pod に振り分けられること  preStop のスリープ処理により新規コネクションの処理を待ってから Terminate 処理に入ること  パターン3  Pod の削除から若干の時間が経過後(=Service からの切り離し後)、エンドポイントに接続された新規コネクションが削除中の Pod に振り分けられないこと  新規コネクションが新しい Pod で処理されること  パターン4  SIGTERM 処理を適切に行っているアプリケーションがコネクションを強制的に切断しないこと

パターンの詳細 3 パターンアプリケーションの動き通信と操作 ReplicaSet/Pod のパラメーター 1 1 リクエストに必要な処理時間
= 10 秒 SIGTERMにかかる時間 = 15 秒コネクション1の接続 →5 秒後: Pod の削除とコネクション 2 の新規接続 terminationGracePeriodSeconds: 既定(30秒) preStop: 設定なし ReplicaSet のスケール = 1 2 terminationGracePeriodSeconds: 既定(30秒) preStop: 11 秒間のスリープ + SIGTERMの送信 ReplicaSet のスケール = 1 3 コネクション1 の接続 →5 秒後: Pod の削除 →さらに 1 秒後: コネクション 2 の新規接続 terminationGracePeriodSeconds: 既定(30秒) preStop: 設定なし ReplicaSet のスケール = 1 4 1 リクエストに必要な処理時間 = 20 秒 SIGTERMにかかる時間 = 5 秒 ReplicaSet のスケール = 1 コネクション1の接続 →5 秒後: Pod の削除 terminationGracePeriodSeconds: 既定(30秒) preStop: 設定なし ReplicaSet のスケール = 1

アプリケーションのコード  処理の流れ 1. HTTP サーバーの起動(TCP 80番ポート) 2. シグナルの監視 3.
HTTP コネクション発生時の処理 • リクエストに対する処理(DBアクセス等)を想定 • -d オプションで指定秒数スリープ 4. シグナル受信時の処理 • 終了処理(DBのコネクションクローズ等)を想定 • -t オプションで指定秒数スリープ 5. Web サーバーの動作 • 処理中のコネクションがクローズするまで待機 • 新規接続は受け付けない 4 https://github.com/tsubasaxZZZ/aks-testpod

パターン1 5

確認したいこと 6  Pod の削除と同時にエンドポイントに接続された新規コネクションが削除中の Pod に振り分けられること

ReplicaSet  ReplicaSet  レプリカ数: 1  イメージ: tsubasaxzzz/signal 
引数 • -d : 1リクエストに必要な処理時間(秒) = 10 • -t : シグナル処理に必要な処理時間(秒)= 15  Service  80 番ポートで待ち受ける LoadBalancer 7

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 8  パターン1 (初期状態)
Pod A Service コネクション 1 が新規接続 <時間の流れ> Pod Aの時間の流れ処理残り時間: 10 秒

9 <Pod> <実行コマンド> k logs $(k get po -ojsonpath="{.items[0].metadata.name}") -f
<ログ確認用コマンド>

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 10  パターン1 (5
秒後) Pod A Service コネクション 2 が新規接続 Pod Aの削除開始 • SIGTERMの受信 Pod Aの時間の流れ <時間の流れ> 処理残り時間: 5 秒処理残り時間: 10 秒 SIGTERM 処理残り時間: 15 秒 Pod B Service からの切り離し開始 Pod B の作成開始 Pod B のService の追加開始

11 <Pod> <signal-5gt84 のログ> • delete と同時に Terminating 状態となり、また新しい
Pod が作成され始める ※delete 実行から数秒後に作成開始 • 5秒間はコネクション1のみ • 5秒後にコネクション2と同時に SIGTERM の受信 $ ./pattern_1-2.sh Connection start: duration=10, hostname=signal-5gt84, requestURI=/client1 Connection start: duration=10, hostname=signal-5gt84, requestURI=/client2 pod "signal-5gt84" deleted <curl の出力> • 5秒後にコネクション2が出力 • どちらも同じ Pod で処理されていることが分かる • Pod の削除開始

秒後) Pod A Service Pod Aの削除中 • SIGTERM の処理中 Pod Aの時間の流れ <時間の流れ> 処理終了処理残り時間: 5 秒 SIGTERM 処理残り時間: 10 秒コネクション 1の処理終了コネクション 2の処理中 Pod B Service からの切り離し完了 Pod B の作成完了 Pod B のService の追加完了

13 <Pod> <signal-5gt84 のログ> • コネクション1の処理終了 • コネクション2の処理中(5秒経過) • SIGTERM
処理中(5秒経過) • signal-pq9k2 の作成完了 ※厳密に10秒後ではない

秒後) Pod A Service Pod Aの削除中 • SIGTERM の処理中 Pod Aの時間の流れ <時間の流れ> 処理終了処理終了 SIGTERM 処理残り時間: 5 秒コネクション 2の処理終了 Pod B

15 • コネクション2の処理終了 • SIGTERM 処理中(10秒経過) <Pod> <signal-5gt84 のログ>

秒後) Service Pod Aの削除完了 Pod Aの時間の流れ <時間の流れ> 処理終了処理終了 SIGTERM 処理終了 Pod B

17 • SIGTERM 処理終了 <signal-5gt84 のログ> • signal-5gt84 の削除完了 ※実際はさらに数秒後に削除
<Pod>

パターン2 18

確認したいこと 19  Pod の削除と同時にエンドポイントに接続された新規コネクションが削除中の Pod に振り分けられること  preStop のスリープ処理により新規コネクションの処理を待ってから
Terminate 処理に入ること

引数 • -d : 1リクエストに必要な処理時間(秒) = 10 • -t : シグナル処理に必要な処理時間(秒)= 15  preStop • コネクションの処理を待つための 11 秒間の待機  Service  80 番ポートで待ち受ける LoadBalancer 20

秒後) Pod A Service Pod Aの時間の流れ <時間の流れ> 処理残り時間: 5 秒 preStop 処理開始 Pod B Pod B の作成開始 Pod B の Service の追加開始 Service からの切り離し開始 Pod Aの削除開始 • preStop 処理の開始 • SIGTERMの待機 • preStop 処理により Service からの切り離し開始から切り離し終了まで待機 • Service からの切り離し中に入ってきた新規コネクションの処理を完了させる • preStop 処理が完了するまで SIGTERM の送信は待機されるコネクション 1 の処理中コネクション 2 がエンドポイントに新規接続

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 24  5.x 秒後
Pod A Service Pod Aの時間の流れ <時間の流れ> 処理残り時間: 5 秒 Pod B Pod B の作成開始 Pod B の Service の追加開始 Service からの切り離し開始 Service からの切り離し中に Pod に入ってくるコネクション2 コネクション 1 の処理中 • Service からの切り離し中に Pod に入ってくるコネクションの処理が完了するまで待つ処理残り時間: 10 秒 Pod Aの削除開始 • preStop 処理中 • SIGTERMの待機 preStop 処理中処理残り時間: 11 秒

25 <Pod> <signal-pn6pv のログ> • preStop 処理(11秒間のスリープ)により、 "Terminate start"のログは無い

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 26  10秒後 Pod
A Service Pod B Pod B の作成完了 Pod B のService の追加完了 Pod Aの時間の流れ <時間の流れ> 処理終了 Service からの切り離し完了 Service からの切り離し中に Pod に入ってくるコネクション2 コネクション 1 の処理完了処理残り時間: 5 秒 preStop 処理中処理残り時間: 6秒 Pod Aの削除開始 • preStop 処理中 • SIGTERMの待機

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 27  16 秒後(preStop
処理の終了) Service Pod B Pod Aの時間の流れ <時間の流れ> 処理終了 Service からの切り離し中に Pod に入ってくるコネクション2の処理が完了処理終了 preStop 処理終了 Pod Aの削除開始 • preStop 処理完了 • SIGTERM送信 Pod A SIGTERM 送信開始

28 • delete コマンドの実行 • preStop の実行開始(11秒のスリープ) • preStop の終了
• Terminate の開始 • コネクション2の処理終了

パターン3 29

確認したいこと 30  Pod の削除から若干の時間が経過後(=Service からの切り離し後)、エンドポイントに接続された新規コネクションが削除中の Pod に振り分けられないこと 
新規コネクションが新しい Pod で処理されること

秒後) Pod A Service Pod Aの削除開始 • SIGTERMの受信 Pod Aの時間の流れ <時間の流れ> 処理残り時間: 5 秒 SIGTERM 処理残り時間: 15 秒 Pod B Service からの切り離し開始 Pod B の作成開始 Pod B のService の追加開始コネクション 1の処理中

35 <Pod> <signal-wpvjc のログ> • delete と同時に Terminating 状態となり、また新しい
Pod が作成され始める ※delete 実行から数秒後に作成開始 • 5秒間コネクション1のみ • 5秒後にSIGTERM の受信 ※コネクション2のログは無い $ ./pattern_3.sh Connection start: duration=10, hostname=signal-wpvjc, requestURI=/client1 pod "signal-wpvjc" deleted <curl の出力> • Pod の削除開始

秒後) Pod A Service Pod Aの時間の流れ <時間の流れ> 処理残り時間: 4 秒 SIGTERM 処理残り時間: 14 秒 Pod B Pod B の作成開始 Pod B のService の追加開始 Service からの切り離し完了コネクション 2 が新規接続試行 ※Pod Bが作成されるまでコネクションは保留コネクション 1の処理中 Pod Aの削除中 • SIGTERM の処理中

37 <signal-wpvjc のログ> • コネクション2のログは無い

ReplicaSet スケールイン時の動作・手順について kubectl delete pod をした時の流れ 38  パターン3 (Pod
B の作成完了後) Pod A Service Pod B Pod B の作成完了 Pod B のService の追加完了コネクション 2 が新規接続コネクション 1の処理終了 Pod Aの削除中 • SIGTERM の処理中 Pod Aの時間の流れ <時間の流れ> 処理終了 SIGTERM 処理残り時間: 10 秒 (コネクション 2 は Pod B で処理開始)

39 <Pod> コネクション 2 の処理 <signal-rj2rr のログ> 新しく作られた Pod ！

秒後) Pod A Service Pod Aの削除中 • SIGTERM の処理中 Pod Aの時間の流れ <時間の流れ> 処理終了 SIGTERM 処理残り時間: 5 秒コネクション 2の処理中 Pod B

秒後) Service Pod Aの削除完了 Pod Aの時間の流れ <時間の流れ> 処理終了 SIGTERM 処理終了コネクション 2の処理中 Pod B

パターン4 42

確認したいこと 43  SIGTERM 処理を適切に行っているアプリケーションがコネクションを強制的に切断しないこと

秒後) Pod A Service Pod Aの削除開始 • SIGTERMの受信 Pod Aの時間の流れ <時間の流れ> 処理残り時間: 15 秒 SIGTERM 処理残り時間: 5 秒 Pod B Service からの切り離し開始 Pod B の作成開始 Pod B のService の追加開始コネクション 1の処理中

秒後) Pod A Service Pod Aの削除開始 • SIGTERMの処理終了 • コネクションの受付不可 Pod Aの時間の流れ <時間の流れ> 処理残り時間: 10 秒 SIGTERM 処理終了 Pod B Service からの切り離し終了 Pod B の作成開始 Pod B のService の追加開始コネクション 1の処理中

秒後) Pod A Service Pod Aの削除完了 Pod Aの時間の流れ <時間の流れ> 処理終了 SIGTERM 処理終了 Pod B Service からの切り離し終了 Pod B の作成開始 Pod B のService の追加開始コネクション 1の処理終了

50 • delete コマンドの実行 • Terminate 処理の開始 • Terminate 処理の終了
• 処理中のコネクションは継続

番外編: terminationGracePeriodSeconds の動き 51

52 • delete コマンドの実行 • Terminate 処理の開始 • 30秒で強制的に終了 terminationGracePeriodSeconds
の既定の 30 秒を過ぎると KILL が送られる Connection start: duration=40, hostname=signal-2plwk, requestURI=/client1 pod "signal-2plwk" deleted curl: (18) transfer closed with outstanding read data remaining 強制的にコネクションが終了した場合の curl の出力

53 • delete コマンドの実行 • Terminate 処理の開始 • 全ての処理が完了 terminationGracePeriodSeconds
の値を 60 秒に設定

Pod が終了するときに起きること / What happens when the pod e...

Pod が終了するときに起きること / What happens when the pod exits

More Decks by tsubasa

Other Decks in Technology

Featured

Transcript