Slide 15
Slide 15 text
2. 関連研究②︓Transform-Retrieve-Generate: Natural
Language-Centric Outside-Knowledge Visual
Question Answering(CVPR2022)
Copyright © Acroquest Technology Co., Ltd. All rights reserved.
15
画像をテキスト空間に様々な⽅式(画像説明, Tagging, OCR)でマッピング
し、コンテキスト検索+⽣成モデルで回答を⽣成する。