Slide 4
Slide 4 text
関連研究:参照表現セグメンテーションを扱う⼿法
- 4 -
⼿法 概要
LAVT [Yang+, CVPR22] エンコーダの中間層で⾔語と画像の特徴量を早期に融合
SeqTR [Zhu+, ECCV22] ポリゴン予測によりセグメンテーションマスクを⽣成
STOW [Li+, CoRL23] 未知物体に対するセグメンテーションによる物体追跡
LISA [Lai+, CVPR24] マルチモーダルLLMにセグメンテーション能⼒を付与
Generate a segmentation mask of
the wall picture closest to the front
door in the entryway.
L ⽂中の対象物
以外もマスク