Slide 9
Slide 9 text
既存研究は高コストな実世界データのみを用いて学習
→データの大規模化が大変
PFN-PIC [Hatori+, ICRA18]
4つの箱に分け入れられた約20種類の日用品を
対象に,対象物体および目標位置の特定
MTCM
[Magassouba+, RA-L19]
自然言語による命令文と視覚的情報から
対象物体を特定, LSTMおよびVGGを利用
Target-Dependent UNITER
[Ishikawa+, RA-L21]
UNITER [Chen+, ECCV20] に対して候補領域を扱う
構造を追加. MLU-FIに適用
Target-Dependent UNITER [Ishikawa+, RA-L21] PFN-PIC [Hatori+, ICRA18]
- 9 -