Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「新幹線要約」のための文末の整形

 「新幹線要約」のための文末の整形

池田 諭史, 大橋 一輝, 山本 和英. 「新幹線要約」のための文末の整形. 情報処理学会 研究報告, NL163-22 / FI76-22 (2004.9)

自然言語処理研究室

September 30, 2004
Tweet

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 新幹線要約文の文末の特徴 品詞 日本経済新聞 新幹線要約 名詞 23.70 55.92 動詞 28.66 15.91

    形容詞 1.80 0.19 副詞 0.20 0.22 助詞 1.56 8.83 助動詞 38.59 18.52 出現比率[%] (うちサ変名詞) (5.00) (39.90) (うち格助詞) (0.34) (6.41)
  2. 新幹線要約文の和語と漢語の比率 和語に対する漢語の比率 和語 漢語 b/a 見つかる 発見 1.059 2.658 2.510

    決める 決定 0.622 2.184 3.511 選ぶ 選出 0.210 2.643 12.586 分かる 判明 0.181 2.875 15.884 命じる 命令 1.132 3.841 3.393 述べる 発言 0.451 0.181 0.401 調べる 調査 6.284 53.333 8.487 2.712 7.271 2.681 日経(a) 新幹線要約(b) 以上7個の統計
  3. 人手による正解率(2/2) 全体 全体 「しまう」 「しまう」 「明らかに」 「明らかに」 断定表現及び敬語表 断定表現及び敬語表 現

    現 未来の行動を示唆す 未来の行動を示唆す る表現 る表現 「示す」 「示す」 和語 和語 サ変動詞 サ変動詞 「なる」 「なる」 「立つ」 「立つ」 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 正解率
  4. 各手法の適用頻度 全体 「明らかに」 「立つ」 「しまう」 未来の行動を示唆する表 現 「示す」 和語 「なる」

    断定表現及び敬語表現 サ変動詞 0 10000 20000 30000 40000 50000 60000 70000 80000 適用頻度
  5. サ変動詞の換言(2/4) 「助詞 1 +名詞+すること+助詞 2 +サ変名詞」      →「すること」を削除  助詞 1 「を」「か」→「の」

    両国政府の実務者協議を2月にも開催することで合意した も開催することで合意した。 ↓ 両国政府の実務者協議を2月にも開催で合意 も開催で合意。