• 例:猫のようにも見える角度で犬の写真を集めるの、できます? ▪ エキスパートがいればNLPでは「成長に効く」 データを作りやすい(オーバーフィットには注意) ▪ 弱教師+Adversarial Exampleのループ • プリトレーンドモデルをレバレッジする ◦ BERT等の学習済みのモデルを使うことで該当ドメインの データ量がある程度少なくとも精度が出せる • Small Clean Dataに投資する ◦ Small Clean Data > Big Data ◦ "Data量を倍にするのとデータを きれいにするのは同じ効果" (Andrew Ng)