Slide 11
Slide 11 text
Failure 1: 技術的制約
Autopilot 特有の制限
特権コンテナ(privileged: true)が
利⽤できない、動的リソース割り当て
(DRA)が使えない、など
Googleがノード管理を完全に引き受ける
が、その引き換えに様々な制約が存在。
対策:
1. 特権モードが必要な特殊ワークロードはGKE
外で実⾏。GKE 上で動作しているかどうかは、
ユーザの関⼼事ではない。
2. MIG(multi-instance GPUs)でGPUを効率的に
使⽤し、カスタムComputeClassでSpot
インスタンスの優先利⽤することでコスト効率
的を最適化
Gateway Controllerでの
IAP 権限設定が不便
IAPの有効化⾃体はマニフェストで
可能だが、Backend Serviceの名前が
⽣成されるまで不明なため、IAM権限を
事前に定義できない。これにより、
リソース作成後にIAM設定を⾏う必要が
⽣じ、作業のタイムラグが発⽣。
対策:
Google Cloud さんに機能リクエストは出しつつ、
⾃分たちでカスタムコントローラーを実装すること
を検討中。