EDM2[1] (当時のSOTA) • Poor model • 学習時間の短縮 • モデルサイズの縮小 • 上記の両方 • 比較手法 • CFG • CFG + Guidance interval ImageNetの画像生成タスクにおける品質評価 10 ※ FDDINOv2についても評価し同様の結果 ※ 一部条件なしでの 実験もあり Baseline&比較手法より優れた精度 学習時間の短縮,モデルサイズの縮小 だけでもCFGより品質改善 (両方が最も良い) 条件なし (unconditional)の生成でも 品質が改善 [1] Karras+, CVPR2024 [2] Kynkäänniemi+, NeurIPS2024