Upgrade to Pro — share decks privately, control downloads, hide ads and more …

係り受け関係を利用した感情生起表現の抽出

 係り受け関係を利用した感情生起表現の抽出

遠藤 大介、齋藤 真実、山本 和英. 係り受け関係を利用した感情生起表現の抽出. 言語処理学会第12回年次大会, pp.947-950 (2006.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 5 種用感情表現辞書 ▪既存の感情表現事典から一部使用  感情分類 10 分類 ( 喜怒哀怖恥好厭昂安驚 )

     登録語数 2167 語収録 ↓  種用感情表現辞書に登録した表現数 → 333 語 ➔楽しい ( 喜 ) 、腹立たしい ( 怒 ) 等 種用感情表現辞書の条件 - 「形容詞」または「名詞 - 形容動 詞語幹」
  2. 7 提案手法 (2/3) ▪感情生起表現候補の抽出  南瓜を用いて構文解析を行う。 例 人前に 出る (

    のが )恥ずかしい 典型的な 長男。 感情表現 : 恥ずかしい 感情生起表現 : 人前に出るのが
  3. 8 提案手法 (3/3) ▪品詞情報によるフィルタリング 「 人前に 出るのが 」 「連体詞」「名詞 -

    非自立」「名詞 - 数」 「形容詞 - 自立」 「名詞 - サ変接続」 「名詞 - 形容動詞語幹」 「動詞」 例:「ことが」「大きな」等の表現 例:「安い」「会う」等の表現 × ◦
  4. 9 評価実験 (1/3) ▪使用したコーパス→ Web コーパス  Web コーパスを利用する利点 ➔

    大量のテキストを容易に収集でき る。 ➔新聞に含まれるテキストよりも掲示 板や Weblog など主観的な文章が存在 する。 ➔多くの人が書いているため、様々な 表現が抽出できる。
  5. 10 評価実験 (2/3) ▪感情生起表現の抽出数推移 2131 8043 10059/10174 Webコーパス1 Webコーパス2 異なり数/合計

    抽出表現数[個] 抽出表現数 ・ Web コーパス 1 : 0.4GB 486 万文 ・ Web コーパス 2 : 1.0GB 898 万文 合計と異なり数の差が小さい → コーパス量の増加で表現数が増加する
  6. 11 評価実験 (3/3) A[%] B[%] C[%] D[%] 21 39 3

    37 15 25 4 56 総合 16 28 4 52 Webコーパス1 Webコーパス2 コーパス別抽出精度 評価 A :「提示している感情を生起する」 評価 B :「人によっては提示している感情を生起する」 評価 D :「表現が感情を生起する要因とならない」 評価 C :「提示している感情以外の感情を生起する」 喜:自然とふれあうことが 哀:はかなくきえてしまうのが
  7. 14 抽出例 (AB) ▪ A  わいわいやるのが ( 喜 )

     苗が大きくなっていくことが ( 喜 )  ズカズカ入り込んでこられるのが ( 怒 )  残業代がつかないのが ( 哀 )  展開が読めてしまうのが ( 厭 )  どうにも出来ないのが ( 昂 ) ▪ B  人と話すのが ( 喜 )  アクションが見れるのが ( 喜 )  歳をとることが ( 哀 )  答え合わせをするのが ( 怖 )  絵を描くのが ( 好 )  話題を共有することが ( 安 )
  8. 15 抽出例 (CD) ▪ C  信頼を得られていないのが ( 怒 )

     情報を蓄積しておくことが ( 怖 )  ひとつだけ気に入らなかったのが ( 恥 ) ▪ D  世界に没頭するのが ( 喜 )  データとして利用されるのが ( 怒 )  感じに老けちゃってるのが ( 哀 )  量が減り続けているのが ( 怖 )  そのまま持っていくのが ( 恥 )  特に寝るのが ( 好 )  世の中になったのが ( 厭 )  アキラと遊ぶのが ( 安 )  名前があったのが ( 驚 )