Slide 6
Slide 6 text
6
NLPで使えるワザ (戦術レベル)
● (初期に有用)敵対的データを作って効率よく学習する
○ NLPの教師データは比較的作りやすい
■ 例えば画像データや音声データの
トレーニングデータを集めるのは超大変
● 例:猫のようにも見える角度で犬の写真を集めるの、できます?
■ エキスパートがいればNLPでは「成長に効く」
データを作りやすい(オーバーフィットには注意)
■ 弱教師+Adversarial Exampleのループ
● プリトレーンドモデルをレバレッジする
○ BERT等の学習済みのモデルを使うことで該当ドメインの
データ量がある程度少なくとも精度が出せる
● Small Clean Dataに投資する
○ Small Clean Data > Big Data
○ "Data量を倍にするのとデータを
きれいにするのは同じ効果" (Andrew Ng)