Slide 18
Slide 18 text
AI 18
▪ データセットからノイズをなるべく除去するように後処理を行う
▪ 推測的な単語を含むサブセンテンスを削除
▪ “indicating”, “suggesting”, “possibly”など
▪ 意味のないキャプションを除外
▪ “In the image, a man a man a man...(repeating)”,
“Sorry, I can not answer the question.” など
▪ 初回生成時のキャプションが100トークン未満の画像については
キャプションを再生成
GroundingCap-1Mの構築: データクリーニング