Upgrade to Pro — share decks privately, control downloads, hide ads and more …

第5回

miyanishi
February 04, 2013
130

 第5回

単語格子とマルコフモデルによる日本語機能表現の解析

miyanishi

February 04, 2013
Tweet

Transcript

  1. 研究について  日本語機能表現辞書「つつじ」  機能表現を構成するエントリー+意味ラベル  応用:評判解析・係り受け解析 など  現在:日本語機能表現の解析器は無し

     放送番組の反響を分析するアプリケーション  日本語の形態素解析と同じ手法を使用  単語格子を作成  最適経路の選択→マルコフモデル使用
  2. 曖昧性の問題  同一のエントリーが複数の意味を持つ  という:「同格」「伝聞」「強調」  機能的な意味で用いられていない  という:↑+「機能的でない」 

    どこまでを機能表現と認定すべきか  「机の上には宝石だけある」  「さすがは宝石だけある」  「ある」は機能表現でない場合もある
  3. 機能表現解析モジュール  最適経路を選択する確率モデル  マルコフモデル  素性  表層文字列 

    品詞  機能表現の意味属性  低頻度の接続確率  バックオフスムージング  5事象より少ない接続→未知語への確率と割当て
  4. 実験条件  品詞  4階層すべてを用いる  最上位1階層のみを用いる  複数形態素にまたがる機能表現 

    最初の形態素の品詞のみを用いる  形態素の品詞の組み合わせを用いる  表層文字列  用いる  用いない  Openな実験orClosedな実験