Slide 19
Slide 19 text
検出経緯
1. OSD Podが存在するノードが慢性的なメモリ不足になっていた
2. 偶然前述の問題の再現試験のような状況になった
⚫ OOM killerによるプロセスの殺戮
⚫ Kubeletによるプロセスの再生成
⚫ メモリ不足によるPod eviction
3. OSD Podが二重起動。死
19
node
プロセス
OOM Killer
なかなかメモリが空かないなあ
殺戮
プロセス
プロセス
再生成
kubelet
HDD
OSD
Ceph-osd
Ceph-osd
Podをスケジュールしなきゃ
& 追い出さなきゃ