Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介 5月23日

gumigumi7
May 23, 2017
130

文献紹介 5月23日

gumigumi7

May 23, 2017
Tweet

Transcript

  1. 文献 ▪ 論文 ▪ Arvind Neelakantan*, Jeevan Shankar*, Alexandre Passos,

    Andrew McCallum Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector Space Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 1059-1069 ▪ キーワード ▪ Skip-gram, 語義曖昧性解消 2
  2. 概要 ▪ 教師なしによる語義曖昧性解消 ▪ Skip-gram (Le and Mikolov (2013)) のモデルの

    拡張 ▪ 短い計算時間で精度の高い意味ベクトルを取得可能 3
  3. 導入 ▪ 通常のSkip-gram (W2V) ▪ 同じ書き方で違う意味の単語をそのまま学習してしまう → その単語に近い意味の全く違う単語が引っ張り合ってしまう ▪ 例)

    plant (設備) と plant (植物) が意味的に引っ張り合い、 pollen (花粉) と refinery (精製所) が近くなってしまう。 ▪ 意味的なコンテキストを考えることで語義ごとの ベクトルを計算するモデルに変更する 4
  4. 実験 11 ▪ April 2010 snapshot of the Wikipedia corpus

    ▪ Wikipediaのコーパスを学習 ▪ 200万記事, 約10億トークン
  5. 実験 13 ▪ Stanford’s Contextual Word Similarities (SCWS) ▪ 2003

    word pairs and their sentential contexts. ▪ 1328 noun-noun pairs, 399 verb-verb pairs, 140 verb-noun, 97 adjective-adjective, 30 noun-adjective, 9 verb-adjective, and 241 same word pairs.