Slide 3
Slide 3 text
研究背景
• 学習データを減らしたい
• ディープラーニングの学習には⼤量のデータが必要
• 世界の多くの⾔語では学習に⼗分な量のデータの確保は困難
Ø ラベルなしデータから汎⽤的な表現を学習する⾃⼰教師あり学習へ
• ⾃⼰教師あり学習の興隆
q ⾃然⾔語処理
• BERT [Delvin+, 2018], GPT-2 [Radford+, 2018]
q コンピュータビジョン [Henfaff+, 2019]
q ⾳声
• wav2vec [Schneider+, 2019], vq-wav2vec [Baevski+, 2020]
Ø よりよい⾃⼰教師あり学習へ
3