Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Confusionset-guided Pointer Networks for Chinese Spelling Check

youichiro
November 27, 2019

Confusionset-guided Pointer Networks for Chinese Spelling Check

長岡技術科学大学
自然言語処理研究室
文献紹介(2019-11-28)
Confusionset-guided Pointer Networks for Chinese Spelling Check
https://www.aclweb.org/anthology/P19-1578/

youichiro

November 27, 2019
Tweet

More Decks by youichiro

Other Decks in Research

Transcript

  1. 3 Abstract • Chinese Spelling Check (CSC) タスクの研究 • Seq2SeqモデルとPointer

    Networkを組み合わせた手法を提案 • 文字生成時にConfusionSet (文字候補)を活用することで性能が大きく向上した
  2. 5 Chinese Spelling Check Task SharedTaskが開催されており、研究が盛ん • SIGHAN2013 • CIPS-SIGHAN2014

    • SIGHAN2015 Chinese Spelling Check (CSC) の開発・評価データセット、評価プラットフォームを 提供
  3. 8 Model copy: • 入力系列でのコピー確率分布 • 一番右がmaxならgenerate generate: • 生成確率分布

    • ConfusionSet行列(M)をかけて語彙を 強制的に制限する その他の設定: • 入力は文字レベル • 入力文字数 == 出力文字数 • position embeddingも入力に加える copy generate
  4. 11 Conclusion • Chinese Spell Check (CSC) タスクの研究 • Seq2SeqモデルとPointer

    Networkを組み合わせた手法を提案 • 生成時にConfusionSet (類似セット)を活用することで性能が大きく向上、 SoTAを 達成
  5. 12 References • [1] Introduction to SIGHAN 2015 Bake-off for

    Chinese Spelling Check ◦ Tseng, Yuen-Hsien et al., ACL2015 ◦ https://www.aclweb.org/anthology/W15-3106/ • [2] A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check ◦ Wang, Dingmin et al., EMNLP2018 ◦ https://www.aclweb.org/anthology/D18-1273/