Slide 2
Slide 2 text
2
論⽂情報
タイトル: CoCa: Contrastive Captioners are Image-Text Foundation Models
• 論⽂: https://arxiv.org/abs/2205.01917
• コード: https://github.com/lucidrains/CoCa-pytorch
• 投稿学会: Transactions on Machine Learning Research
• 著者: Jiahui Yu, Zirui Wang, Vijay Vasudevan, Legg Yeung, Mojtaba Seyedhosseini,
Yonghui Wu
• 所属:Google Research
選んだ理由:
• Google CloudのVertexAIを使ったデモを⾒て、その特徴ベクトルを⽣成している
Vision-Language foundation modelに興味をもった。