Slide 7
Slide 7 text
定量的結果 :代表的な尺度でベースライン手法を上回る
- 7 -
HM3D [Ramakrishnan+, NeurIPS21]の画像に基づくデータセット[Korekata+, 24]
Polos
SPICE CIDEr
対象物体画像 配置目標画像
提案手法 50.9 50.7 22.7 64.8
GRIT [Nguyen+, ECCV22] 41.2 39.0 19.8 59.2
BLIP-2 [Li+, ICML23] 42.4 40.1 16.9 36.6
Gemini [Reid+, 24]
29.5 29.4 11.2 26.2
GPT-4o [Achiam+, 24]
34.5 35.5 15.2 33.4
+8.5 +10.6 +2.9 +5.6