Slide 11
Slide 11 text
11
問題
• 1. ゲスト VM でページフォルトが発生する
• tdp_page_fault() で struct kvm の mmu_lock を取ろうとする
• 2. wazuh がファイルを read(2) まくり -> Free なメモリが減り slab の回収処理が走る
• mmu_shrink_scan() で struct kvm の mmu_lock を取ろうとする
• 1, 2 が並行してスピンロックが競合 🔥
解決
• wazuh を cgroup のメモリ制限化に入れた
• slab 回収処理が cgroup 内だけで走るようにして ページフォルトと競合しないようにした
トラブルシューティング事例 (1) CPU %system がスパイク