Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介11月

miyanishi
November 12, 2015
240

 文献紹介11月

miyanishi

November 12, 2015
Tweet

Transcript

  1. 文献情報 Employing Word Representations and Regularizati on for Domain Adaptation

    of Relation Extraction • 著者: Thien Huu Nguyen,RalphGrishman • Proceedings of the 52nd Annual Meeting of the Association f or Computational Linguistics(Short Paper), 2014, p 68-74
  2. 概要 • 語の関係抽出(RE)タスクの分野適応に関する研究 • Word Representationとしてword embedding とクラスタリングを使用 • さらにRegularizationを行い結果を比較

    • 3種類の実験を実行 1. word embeddingの素性の組み合わせに関する調査 2. word representationの組み合わせに関する調査 3. 2に追加して、Regularizationを行った場合の調査
  3. 語の関係抽出(RE) • エンティティのペアに予め用意された関係ラベルを付与 • feature-based • kernel-based • 分野適合の問題が解決されていないという問題 •

    現在REの分野適合に関する研究はひとつだけ • kernel-basedで構築されている • 以下の不明点が存在する • クラスタの粒度による影響が不明 • その手法がword embeddingなどの実数素性をエンコードできるか不明
  4. Word Representation • 手法が2種類 • Brown word clustering • word

    embeding • word embeddingの言語モデルが2種類 • C&W embedding(Collober& Weston 2008) C&W ⇛ • Hierarchical log-bilinear embedding HLBL ⇛
  5. 素性について(Baseline) • (Sun et al. 2011)で利用された素性を使用 • (Zhouet al.2005) +αの素性

    • 人手でアノテーションされたデータが含まれている 今回は利用しない ⇛
  6. 使用したコーパス • ACE 2005コーパス • 6種類の関係+6種類の分野を含む • 6分野に分ける • ニュースの放送原稿(bn)

    • newswire(nw) • 放送の会話文(bc) • 電話の会話文(cts) • ウェブのログ(wl) • ネットニュース(un)