Upgrade to Pro — share decks privately, control downloads, hide ads and more …

What Substitutes Tell Us-Analysis of an “All-Words” Lexical Substitution Corpus

katsutan
September 20, 2017

What Substitutes Tell Us-Analysis of an “All-Words” Lexical Substitution Corpus

文献紹介

katsutan

September 20, 2017
Tweet

More Decks by katsutan

Other Decks in Technology

Transcript

  1. What Substitutes Tell Us – Analysis of an “All-Words” Lexical

    Substitution Corpus Gerhard Kremer, Katrin Erk, Sebastian Padó, Stefan Thater Proceedings of the 14th Conference of the European Chapter of the Association for Computational Linguistics, pages 540–549, Gothenburg, Sweden, April 26-30 2014. 自然言語処理研究室 B4 勝田 哲弘 2017/9/20 1 図、表などは論文中から引用しています。
  2. はじめに • 語義の曖昧さを解消する方法 ▫ supervised word sense disambiguation ▫ WSD

    (McCarthy, 2008; Navigli, 2009) • WordNet ▫ coverage and granularityが批判されている • Lexical Substitution ▫ (McCarthy and Navigli, 2009) ▫ 文脈の中で置換候補をリストする
  3. Amazon Mechanical Turk (AMT) • HITs. ▫ 3文表示し、その中の1単語を基本1語で書き換え る ▫

    1単語6人が書き換えるように依頼 • データセット ▫ 2,474文(7,117の名詞、4,617の動詞、2,470の形 容詞、1,425の副詞)の15,629個
  4. Ranking Paraphrases • McCarthyとNavigliのSEMEVAL 2007データ セットと3つの計算モデルで比較 ▫ Erk and Padó

    (2008, EP08) ▫ Thater et al. (2010, TFP10) ▫ Thater et al. (2011, TFP11) • (Kishida, 2005, GAP)を使用し、頻度を重視し てランク付けされたリストを作成
  5. まとめ • 利点 ▫ 連続したドキュメントをカバー ▫ 規模が大きいためよりlexical substitutionの詳細 な分析が可能 •

    1つの対象単語がWordNetのsynsetに類似する • WordNetでは区別できない意味要素を文脈は含 んでいる。