Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介8月分

miyanishi
September 02, 2014
350

 文献紹介8月分

miyanishi

September 02, 2014
Tweet

Transcript

  1. 論文情報 • Part-of-Speech Tagging using Conditional Random Fields: Exploiting Sub-Label

    Dependencies for Improved Accuracy • Miikka Silfverberg et al. • Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Short Papers), pages 259–264,Baltimore, Maryland, USA, June 23-25 2014.
  2. 既存の形態素解析 • 品詞付与のみのもの – CRFを使用 – トレーニングデータではツリーバンクを使用 • トレーニング時の品詞の扱い –

    付いたタグをそのまま使用 – もっと大切な情報があるのでは・・・? PRON+1SG V+NON3SG+PRES N+SG I like him
  3. 実験 • 使用した言語資源 – Penn Treebank・・・英語 – Turku Depedency Treebank・・・フィンランド語

    – Multext-East・・・チェコ・ルーマニア・エストニア語 • 使用言語 – 5種類の言語で実験 – 英語・フィンランド・チェコ・ルーマニア・エストニア
  4. 実験結果について • 英語のみ提案手法の方が精度が下がった – 他の言語において精度向上が見られた • CRF(1,m)の方がCRF(2,-)の結果より良い – 英語は除く –

    次数が低くてもサブラベルを使えば勝てる • 提案手法の方が処理時間が増えた – 待てないほど大きく増えたわけではない
  5. まとめ • サブラベルの情報を用いてタグ付け – そのままのタグの情報+サブラベル情報 • 実験では・・・ – 5つの言語を比較 –

    3パターンの品詞の扱いを比較 – CRFの次数は1か2で比較 • 結果として・・・ – サブラベル情報の有用性を示す