Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Grammatical error correction using neural machine translation

Grammatical error correction using neural machine translation

文献紹介
2017/07/20
長岡技術科学大学 自然言語処理研究室

youichiro

July 20, 2017
Tweet

More Decks by youichiro

Other Decks in Technology

Transcript

  1. Grammatical error correction using neural machine translation Zheng Yuan and

    Ted Briscoe Proceedings of NAACL-HLT 2016, pages 380–386 文献紹介(2017/07/20) 自然言語処理研究室 小川 耀一朗 0
  2. 低頻度語問題のアプローチ 単語レベルの翻訳モデルの構築: GIZA++:単語アライメントツール GIZA++に学習者コーパスを訓練、単語アライメントデータを作成 I am goign to make a

    plan → I am going to make a plan METEORを併⽤することで語幹や同義語、⾔い換えも考慮する 7 /13 I → I am → am goign → going to → to a → a plan → plan
  3. 実験 l ターゲットの語彙サイズを30Kに制限 l ソースの語彙サイズを30K、50K、80K l 学習者データ:Cambridge Learner Corpus(CLC) ソース側:

    約25万語彙 ターゲット側:約14万語彙 l 評価尺度 I-measure: システムの性能とベースラインの性能を⽐較 M2 score: CoNLL-2014と同様 GLUE: ⼈間の判断と良い相関を⽰す 8 /13
  4. 実験結果 Original sentence There are kidnaps everywhere and not all

    of the family can afford the ransom ... SMT hypothesis There are kidnaps everywhere and not all of the families can afford the ransom ... NMT hypothesis There are kidnappings everywhere and not all of the families can afford the ransom ... Gold standard There are kidnappings everywhere and not all of the families can afford the ransom ... (kidnaps→kidnappings)がSMTのフレーズテーブルにない→SMT× この2つの単語は訓練データに存在→NMT◦ 12 /13
  5. 参考文献 [1] Thang Luong, Ilya Sutskever, Quoc Le, Oriol Vinyals,

    and Wojciech Zaremba. 2015. Addressing the Rare Word Problem in Neural Machine Translation. In Pro- ceedings of the ACL- IJCNLP, pages 11–19. 14 /13