Slide 8
Slide 8 text
8
Realistic Noising Method
token-based type-based
Prepare
● preposition, noun, verb で同じ品詞のセットを作っておく
Generate
● token-basedで置換されなかったトークンに対して、品詞に応じて以下を実行
○ preposition → 他の前置詞に置換
○ noun → 単数形/複数形を変化
○ verb → 活用を変化 (候補の中からランダムに選択 )
token token*