Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

Split-and-Rephrase-ja.pdf

Avatar for MARUYAMA MARUYAMA
February 27, 2018
77

 Split-and-Rephrase-ja.pdf

Avatar for MARUYAMA

MARUYAMA

February 27, 2018
Tweet

More Decks by MARUYAMA

Transcript

  1. Split and Rephrase S. Narayan, C. Gardent, S. B. Cohen,

    and A. Shimorina, EMNLP, pp. 606–616, 2017. ⻑岡技術科学⼤学 ⾃然⾔語処理研究室 丸⼭ 拓海
  2. WEBSPLIT Benchmarkの構築 Ø WEBNLG Dataset (Gardent, 2017)を利⽤ RDF tripleと対応する1つ以上のテキストによって構成 Ø

    RDF (Resource Description Format) triple • WEB上のリソースを記述する枠組み • (subject | property | object)の3つの要素を持つ 「空の⾊は⻘い」: (空|⾊を持つ|⻘) subject 空 object ⻘ property (〜という)⾊を持つ 7
  3. WEBSPLIT Benchmarkの構築 Ø 構築⼿順 1. WEBNLG datasetを⽂単位に分割 − Stanford CoreNLPを使⽤

    − ⼈⼿で修正 2. RDF tripleと⽂数に基づいてテキストを対応付け 3. RDF tripleに基づいて' , … , * を並び替え 10
  4. WEBSPLIT Benchmarkの構築 Ø 構築⼿順 1. WEBNLG datasetを⽂単位に分割 2. RDF tripleと⽂数に基づいてテキストを対応付け

    3. RDF tripleに基づいて' , … , * を並び替え 11 , , , , … , , , … , : テキスト , … , : 意味表現 , … , は独⽴ : 難解テキスト : の意味表現 = ∪ ⋯ ∪
  5. ⽂分割モデル Ø 問題の定式化 15 4: の意味表現 '6* : 意味表現 '

    , … , * : ⽂分割されたテキスト : 難解⽂ : ⽂分割モデルの変数 Parameter
  6. ⽂分割モデル Ø 問題の定式化 16 4: の意味表現 '6* : 意味表現 '

    , … , * : ⽂分割されたテキスト : 難解⽂ : ⽂分割モデルの変数 Parameter MULTISEQ2SEQ (Zoph and Knight, 2016) HYBLID SIMPL (Narayan and Gardent,2014) SEQ2SEQ (Luong, 2015) SPLIT-MULTISEQ2SEQ, SPLIT-SEQ2SEQ
  7. ⽂分割モデル Ø HYBRID SIMPL (Narayan and Gardent,2014) • |; をモデル化

    • PB-SMTを⽤いた平易化モデル • 談話構造を利⽤した⽂分割 17
  8. ⽂分割モデル Ø SEQ2SEQ (Luong, 2015) • |; をモデル化 • Encoder-Decoder

    (Local attention, Input feed approach) 18 Local attention Input feed approach
  9. ⽂分割モデル Ø MULTI SEQ2SEQ (Zoph and Knight, 2016) • |;

    4 ; をモデル化 • Multi-source encoder-decoder model • 難解⽂と意味表現4(深さ優先で線形化)を⼊⼒ 19 Encoder Decoder
  10. ⽂分割モデル Ø SPLIT-MULTISEQ2SEQ ' , … , * |; 4

    ; , < |; < ; をモデル化 Ø SPLIT-SEQ2SEQ ' , … , * |; 4 ; , < |; < ; をモデル化 20 ' , … , * |; 4 ; : 確率モデル < |; < ; : MULTI SEQ2SEQ ' , … , * |; 4 ; : 確率モデル < |; < ; : SEQ2SEQ
  11. 参考⽂献 [1] C. Gardent, A. Shimorina, S. Narayan, and P.

    Loria, “Creating Training Corpora for NLG Micro-Planning,” In Proceedings of ACL, 2017. [2] S. Narayan, D. Lorraine, and C. Gardent, “Hybrid Simplification using Deep Semantics and Machine Translation,” Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, pp. 435–445, 2014. [3] M. Luong, H. Pham, and C. D. Manning, “Effective Approaches to Attention based Neural Machine Translation,” Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, pp. 1412–1421, 2015. [4] B. Zoph and K. Knight, “Multi-Source Neural Translation,” Proceedings of NAACL-HLT, pp. 30–34, 2016.