Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Split-and-Rephrase-ja.pdf

MARUYAMA
February 27, 2018
71

 Split-and-Rephrase-ja.pdf

MARUYAMA

February 27, 2018
Tweet

Transcript

  1. Split and Rephrase S. Narayan, C. Gardent, S. B. Cohen,

    and A. Shimorina, EMNLP, pp. 606–616, 2017. ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 丸⼭ 拓海
  2. WEBSPLIT Benchmarkの構築 Ø WEBNLG Dataset (Gardent, 2017)を利⽤ RDF tripleと対応する1つ以上のテキストによって構成 Ø

    RDF (Resource Description Format) triple • WEB上のリソースを記述する枠組み • (subject | property | object)の3つの要素を持つ 「空の⾊は⻘い」: (空|⾊を持つ|⻘) subject 空 object ⻘ property (〜という)⾊を持つ 7
  3. WEBSPLIT Benchmarkの構築 Ø 構築⼿順 1. WEBNLG datasetを⽂単位に分割 − Stanford CoreNLPを使⽤

    − ⼈⼿で修正 2. RDF tripleと⽂数に基づいてテキストを対応付け 3. RDF tripleに基づいて' , … , * を並び替え 10
  4. WEBSPLIT Benchmarkの構築 Ø 構築⼿順 1. WEBNLG datasetを⽂単位に分割 2. RDF tripleと⽂数に基づいてテキストを対応付け

    3. RDF tripleに基づいて' , … , * を並び替え 11 , , , , … , , , … , : テキスト , … , : 意味表現 , … , は独⽴ : 難解テキスト : の意味表現 = ∪ ⋯ ∪
  5. ⽂分割モデル Ø 問題の定式化 15 4: の意味表現 '6* : 意味表現 '

    , … , * : ⽂分割されたテキスト : 難解⽂ : ⽂分割モデルの変数 Parameter
  6. ⽂分割モデル Ø 問題の定式化 16 4: の意味表現 '6* : 意味表現 '

    , … , * : ⽂分割されたテキスト : 難解⽂ : ⽂分割モデルの変数 Parameter MULTISEQ2SEQ (Zoph and Knight, 2016) HYBLID SIMPL (Narayan and Gardent,2014) SEQ2SEQ (Luong, 2015) SPLIT-MULTISEQ2SEQ, SPLIT-SEQ2SEQ
  7. ⽂分割モデル Ø HYBRID SIMPL (Narayan and Gardent,2014) • |; をモデル化

    • PB-SMTを⽤いた平易化モデル • 談話構造を利⽤した⽂分割 17
  8. ⽂分割モデル Ø SEQ2SEQ (Luong, 2015) • |; をモデル化 • Encoder-Decoder

    (Local attention, Input feed approach) 18 Local attention Input feed approach
  9. ⽂分割モデル Ø MULTI SEQ2SEQ (Zoph and Knight, 2016) • |;

    4 ; をモデル化 • Multi-source encoder-decoder model • 難解⽂と意味表現4(深さ優先で線形化)を⼊⼒ 19 Encoder Decoder
  10. ⽂分割モデル Ø SPLIT-MULTISEQ2SEQ ' , … , * |; 4

    ; , < |; < ; をモデル化 Ø SPLIT-SEQ2SEQ ' , … , * |; 4 ; , < |; < ; をモデル化 20 ' , … , * |; 4 ; : 確率モデル < |; < ; : MULTI SEQ2SEQ ' , … , * |; 4 ; : 確率モデル < |; < ; : SEQ2SEQ
  11. 参考⽂献 [1] C. Gardent, A. Shimorina, S. Narayan, and P.

    Loria, “Creating Training Corpora for NLG Micro-Planning,” In Proceedings of ACL, 2017. [2] S. Narayan, D. Lorraine, and C. Gardent, “Hybrid Simplification using Deep Semantics and Machine Translation,” Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, pp. 435–445, 2014. [3] M. Luong, H. Pham, and C. D. Manning, “Effective Approaches to Attention based Neural Machine Translation,” Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, pp. 1412–1421, 2015. [4] B. Zoph and K. Knight, “Multi-Source Neural Translation,” Proceedings of NAACL-HLT, pp. 30–34, 2016.