Slide 3
Slide 3 text
Deep Learning for NLP
- NLP固有の処理
- 単語系列のpaddingとそのmask
- word -> indexの管理
- 未知語が現れたときの処理
- character -> word ...の階層的な処理
- pretrained modelの使用
- e.g) word2vec, ELMo etc…
- train時とtest時の違い
- e.g) teacher forcing, testだけbeam search etc…
- 先行研究のモデルそのまま使うだけで良い場合もあれば、
特徴量追加(e.g character情報, tag情報)など拡張したい場合もある
- 実装でちゃんとモジュールを切り分けて、使い回せる部分は再利用
- 特徴量追加してもできるだけソースの変更は最小限にしたい