Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介11月

Avatar for miyanishi miyanishi
November 12, 2015
250

 文献紹介11月

Avatar for miyanishi

miyanishi

November 12, 2015
Tweet

Transcript

  1. 文献情報 Employing Word Representations and Regularizati on for Domain Adaptation

    of Relation Extraction • 著者: Thien Huu Nguyen,RalphGrishman • Proceedings of the 52nd Annual Meeting of the Association f or Computational Linguistics(Short Paper), 2014, p 68-74
  2. 概要 • 語の関係抽出(RE)タスクの分野適応に関する研究 • Word Representationとしてword embedding とクラスタリングを使用 • さらにRegularizationを行い結果を比較

    • 3種類の実験を実行 1. word embeddingの素性の組み合わせに関する調査 2. word representationの組み合わせに関する調査 3. 2に追加して、Regularizationを行った場合の調査
  3. 語の関係抽出(RE) • エンティティのペアに予め用意された関係ラベルを付与 • feature-based • kernel-based • 分野適合の問題が解決されていないという問題 •

    現在REの分野適合に関する研究はひとつだけ • kernel-basedで構築されている • 以下の不明点が存在する • クラスタの粒度による影響が不明 • その手法がword embeddingなどの実数素性をエンコードできるか不明
  4. Word Representation • 手法が2種類 • Brown word clustering • word

    embeding • word embeddingの言語モデルが2種類 • C&W embedding(Collober& Weston 2008) C&W ⇛ • Hierarchical log-bilinear embedding HLBL ⇛
  5. 素性について(Baseline) • (Sun et al. 2011)で利用された素性を使用 • (Zhouet al.2005) +αの素性

    • 人手でアノテーションされたデータが含まれている 今回は利用しない ⇛
  6. 使用したコーパス • ACE 2005コーパス • 6種類の関係+6種類の分野を含む • 6分野に分ける • ニュースの放送原稿(bn)

    • newswire(nw) • 放送の会話文(bc) • 電話の会話文(cts) • ウェブのログ(wl) • ネットニュース(un)