Slide 20
Slide 20 text
実験設定: 多様なベンチマークにおいて評価
20
o ベンチマーク
• POPE [Li+, EMNLP23] / AMBER [Wang+, 23]
• Hallusion-Bench [Liu+, CVPR24] / MMHal-Bench [Sun+, ACL24]
o ベースライン (すべてLLaVA-v1.5-7Bにおいて実験)
• DPO [Rafailov+, NeurIPS23]
• HA-DPO [Zhao+, 23]
o データセット
• Synthetic Augmented Data: 半⾃動的に収集(前⾴)
• RLHF-V [Yu+, CVPR24]: ⼈⼿で収集
o 実験環境: A100 x 4台
POPE [Li+, EMNLP23]
Hallusion-Bench
[Liu+, CVPR24]