Slide 7
Slide 7 text
SimCSE: 教師無し
教師無しで文埋め込みを作成するにはどうすればよいか?
• CV 分野で画像を埋め込む際は, 画像の切り抜きや回転, 反転など
の Data Augmentation 手法が使える.
• ラベルのない画像をたくさん用意して, ある画像に対して, その
画像を切り抜いたり回転させたりした画像を正例, 他の画像を負
例とすればよい
しかし, 自然言語は離散的なので, CV 分野のような連続的な Data
Augmentation テクは使いにくい(例えば, ある文章を逆向きにしたら
意味が同じになるはずがない).
7 / 21