Upgrade to Pro — share decks privately, control downloads, hide ads and more …

感情生起表現を基にしたレビュー文生成

 感情生起表現を基にしたレビュー文生成

大田 浩志, 山本 和英. 感情生起表現を基にしたレビュー文生成. 言語処理学会第14回年次大会, pp.596-599 (2008.3)

Transcript

  1. 感情生起表現を 基にした レビュー文生成 長岡技術科学大学 電気系 大田 浩志, 山本 和英

  2. „ 主観表現を含んだ文の生成 „ 意見・評価・感情 „ レビュー „ ・文の自然らしさと感情の関係に注 目 „

    プレゼントを貰う 場面が 喜ばしい →自然 „ プレゼントを貰う 場面が 怖い →不自然 目的
  3. レビュー文の定義 „ 対象と態度を含む1文 „ 参考:感情表現のモデル[中山ら05] 去る彼を追うシーンが悲しい 感情生起表現 感情表現 対象/場面 態度/感情

  4. システム概要 去る彼を追う 去る彼を追う・・・ あぁ、悲しい ①レビュー対象入力 ②感情判断 ③レビュー文生成 感情生起表現辞書 去る彼を追うシーンが悲しかった

  5. 感情生起表現辞書の構築 ブログ 悲 SVM e 悲 e 悲以外 悲・辞書 A.感情ブログ抽出

    ・・ C.辞書の構築 ブログの感情判別 B.感情判別モデル 構築 怖 喜
  6. A.感情ブログの抽出 „ 悲ブログの抽出要件 „ 1) タイトルに「悲しい」を含む „ 2) 本文中の感情表現で「悲しい」が最多 表1.抽出結果

    要件 (1) (2) (1)かつ(2) 精度 (悲/抽出数) 0.5 (10/20) 0.6 (12/20) 0.85 (17/20)
  7. B.感情判別モデル „ SVM „ 素性: 本文中の内容語 „ 学習データ „ 正例:

    悲ブログ „ 負例: 喜ブログ, 怖ブログ 表2.分割交差検定結果 判別モデル 喜 悲 怖 Acc. 70.9 71.1 71.1
  8. C.辞書の構築 „ 単位:構文片 „ 係り受けの最小単位 [Aoki et al. 07] „

    意味のまとまりを1つの表現として扱える „ 構文情報を持つ „ スコア: -1 〜 +1 „ 悲ブログへの出現の偏り[藤村ら 04] „ 正のスコア → 悲・辞書に追加
  9. 感情生起表現辞書 喜 悲 怖 喉を 潤す 初戦を 落とす 事件が 起きる

    チャンスを つかむ 川に 落ちる 命に 関わる 旅行に 行く 職場を 去る 泥沼に はまる 結婚式を あげる 腰を やる 指を 切断する [誤例] 容疑者が 逮捕される(怖) → 人手評価(喜) 正:26%, 誤:4%
  10. 文生成手法 „ 自然な文を生成するために 人・が書いたレビューを模倣利用 涙をこらえるシーンは切なすぎてやばい メダルを逃す 書籍Aのレビュー文生成 置換 書籍Bのレビュー文 書籍Aのひと場面

  11. レビュー文の生成・ フレーム ◦◦場面が悲しい(悲) △△シーンはゾッとする(恐) ・・・ レビュー シス テム レビュー対象入力 レビュー文出力

    レビュー文フレーム抽出 レビュー文フレームの選択 “メダルを逃す” (悲) “メダルを逃す 場面が悲しい”
  12. レビュー文フレーム抽出 „ 抽出ルール 特徴名詞 + 助詞 + 感情表現 場面 シーン

    ところ が は で 楽しい 悲しい 怖い 誰も信じたくないというくだりは悲しいな(悲) 刀でザックリのシーンはちょっと怖いですね(怖)
  13. レビュー文の自然らしさ „ 感情の一貫性がある・ない文を生成し評価 一貫性がある文:30/30 一貫性がない文:11/60 (自然な文数/評価文数) (感情生起表現辞書) 川に落ちる 場面が 喜ばしい

    悲しい 怖い
  14. 考察 „ 感情の一貫性はないが自然な文 „ レビュー対象は2文節 „ 複数の状況が想像できる „ 対象の情報量を増やすことで特定で きる感情もある

    „ 川に落ちる場面 „ 誰が?いつ?どこで?
  15. まとめ „ 主観表現を含む文の生成を行った „ 感情生起表現辞書の構築手法を提案 „ ひとつのまとまりで感情を持つ表現 „ 文を組み立てやすい „

    レビュー文の生成手法を提案 „ ルールによるレビュー文フレームの自動収集 „ 感情の一貫性がある文は自然らしい
  16. 感情生起表現辞書の評価 喜 悲 恐 正解 19 8 7 不正解 0

    2 3 感情なし 20 29 21 評価できない 7 6 9 原因を→調べる 圧力を→思う
  17. スコア算出式[藤村ら04] „ piece: 構文片 „ Pe(piece):感情eのブログに出現する確率 „ Pe(piece):感情e以外 „ scoree(piece):感情eについてのスコア