Distributional Lesk: Effective Knowledge-Based ...

September 24, 2018

Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation


  1. Distributional Lesk: Effective Knowledge- Based Word Sense Disambiguation Dieke Oele,

    Gertjan Van Noord 2018 9/24 文献紹介 長岡技術科学大学 自然言語処理研究室 福嶋 真也 IWCS 2017 — 12th International Conference on Computational Semantics — Short papers URL: http://aclweb.org/anthology/W17-6931
  2. 3 introduction • 現在、最も優れたWSDシステムは教師あり学習を用いた 手法 (Snyder and Palmer, 2004; Pradhan

    et al., 2007; Navigli and Lapata, 2007; Navigli, 2009; Zhong and Ng, 2010) 問題点  ・多くのアノテーションされたデータが必要  ・特定のドメインでしかうまく機能しない  (Escudero et al., 2000)
  3. 5 Method • 単語wの語義sに対して、コサイン類似度を計算 Score(s, w) = cos(Gs, Cw) +

    cos(Ls,w, Cw) Gs・・・注釈のベクトル、Cw・・・文脈のベクトル Ls,w・・・語彙素のベクトル (語彙素:単語と1つの語義の組み合わせ) →スコアの高い語義が選ばれる
  4. 6 Method • Ls,wについて AutoExtend (Rothe and Schutze, 2015)を用いて、単語の分散表現を 元にWordNetから語義の分散表現を獲得

    • Cwについて 文中にある全ての内容語の分散表現を平均したもの すでに語義を決定した単語については語義の分散表現を使用 • Gsについて 注釈にある全ての内容語の分散表現を平均したもの