http://nonbiri-tereka.hatenablog.com/ 3. Kaggle Competitions Grandmaster ① 1st and Feature – Player Contact Detection 9th ② Happywhale – Whale and Dolphin Identification 11th ③ Google Universal Image Embedding 12th 4. CQ出版 Interface ML/AI関連記事を 複数寄稿 Kaggle Grandmaster
All rights reserved. 12 1.画像と質問を与えたときに答えを導き出す問題 2.通称VQAと呼ばれ、背景知識がないと回答できない KnowledgeベースのVQAをK-VQA(Knowledge Aware)として呼ばれる。 映っているのは教会だが、教会がいつ開いて いるのかを⼀般的に知らないと回答できない。
All rights reserved. 21 画像とQuestionから出⼒される特徴量間のコサイン類似度を計測し、 TopNを取得する。 VとQと⼊⼒として得られる Backboneの出⼒ 次のGPT-3に⼊⼒する回答に近しいサンプルを取得する。 以下の図 Latent answer space のベクトルがz