Slide 12
Slide 12 text
vs. Data augmentation
• Paraphrase identification dataset QQP (⼆値分類)
• データ拡張・縮⼩を⾏ったデータセットで実験
• ラベルが均等になるようなデータ拡張を⾏わなくとも,
DSCだけでそこそこの性能向上が得られる
訓練事例数 363,871 458,477 458,477 269,165 458,477(?)
pos/neg⽐ 37% 63% 50% 50% 21% 79% 50% 50% 50% 50%
2020/9/21 最先端NLP2020 12