Upgrade to Pro — share decks privately, control downloads, hide ads and more …

intro-paper-06.pdf

MARUYAMA
June 21, 2017
83

 intro-paper-06.pdf

MARUYAMA

June 21, 2017
Tweet

Transcript

  1. Automatic Text Simplification for Spanish: Comparative Evaluation of Various Simplification

    Strategies Sanja Štajner and Iacer Calixto and Horacio Saggion Proceedings of Recent Advances in Natural Language Processing, pages 618–626, 2015 B4 丸山 拓海
  2. 1. Introduction 1. 小規模な平易化コーパスを使用した場合, PB-SMTとHIEROモデルはどれだけうまく動作するか? 2. PB-SMTと HIEROの結果は異なるか? 3. Simplextと比較して、SMTベースのシステムはどう機能するか?

    Simplext: state-of-the-art text simplification system for Spanish Ø⼩規模なデータセットでも、SMTベースのシス テムがSimplext よりも優れていることを⽰した Ø本論⽂の貢献 3
  3. ØHeavy ØLight [1] • 様々なテキスト(Heavyに存在するものを含む)を 6つの平易化ルールにしたがって、⼈⼿で平易に書 き換えたもの [ 平易化規則 ]

    ・ 頻度の高い単語(1000語)を使用を推奨する ・ 冗長性のある単語を削除する ・ より簡単な言い換えを使用する etc. 6 3.1 Text simplification corpus
  4. 3.3 Evaluation Ø⾃動評価 BLEU • S-BLEU: ⽂単位のBLEU • BLEU: ⽂書単位のBLEU

    Ø⼈による評価 : 13⼈の評価者に5段階(1〜5)で評価 Grammar (G) Meaning preservation (M) Simplicity (S) 8
  5. Reference 15 [1] R. Mitkov and S. Štajner, “The Fewer,

    the Better? A Contrastive Study about Ways to Simplify,” Proc. Work. Automatic. Text Simplification: Methods Application. Multilingual Society., pp. 30–40, 2014.
  6. 16