Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介: 入れ子依存木の刈り込みによる単一文書要約手法

文献紹介: 入れ子依存木の刈り込みによる単一文書要約手法

2017/03/21の文献紹介で発表

Yumeto Inaoka

March 21, 2017
Tweet

More Decks by Yumeto Inaoka

Other Decks in Technology

Transcript

  1. 入れ子依存木の刈り込み による単一文書要約手法 菊池 悠太, 平尾 努, 高村 大也, 奥村 学,

    永田 昌明 言語処理学会, Vol. 22, No. 3, pp.197-217, 2015 1 文献紹介(2017/03/21) 自然言語処理研究室 稲岡 夢人
  2. 概要 • 従来手法 ◦ 単語間の関係を利用して文を圧縮 ◦ 文と文の関係には着目せず • 提案手法 ◦

    文書を文間、単語間の依存関係を表す 入れ子依存木とみなす ◦ 単語重要度の和が最大な木の刈り込み ◦ 要約精度の向上 2
  3. 評価実験 • RST Discourse Treebankの要約評価用 テストセットを使用 • 原文書の25%(long), 10%(short)程度のトークン 数の参照要約を使用

    • 比較手法としてEDU, 文を単位とした 要約手法を用意 • テストセットに含まれる修辞構造を用いた場合 と解析器で自動で解析した場合 10
  4. 評価実験 • n:原文書の文数 • m i :文iの単語数 • w ij

    :i番目の文におけるj番目の単語の重み • z ij :i番目の文におけるj番目の単語を   要約に含めるときに1となる変数 • 目的関数:要約に含まれた単語の重みの総数 • tf ij は単語w ij の頻度 • depth(i)は文x i の根からの深 11