Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Distributional Lesk: Effective Knowledge-Based ...
Search
masaya82
September 24, 2018
0
110
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
September 24, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
150
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
160
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
99
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
130
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
150
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
130
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
140
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
130
Using Linked Disambiguated Distributional Networks for Word Sense Disambiguation
masaya82
0
93
Featured
See All Featured
It's Worth the Effort
3n
187
28k
The World Runs on Bad Software
bkeepers
PRO
72
12k
The Language of Interfaces
destraynor
162
25k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
Making the Leap to Tech Lead
cromwellryan
135
9.6k
Practical Orchestrator
shlominoach
190
11k
Agile that works and the tools we love
rasmusluckow
331
21k
Become a Pro
speakerdeck
PRO
29
5.6k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Raft: Consensus for Rubyists
vanstee
140
7.2k
4 Signs Your Business is Dying
shpigford
186
22k
Transcript
Distributional Lesk: Effective Knowledge- Based Word Sense Disambiguation Dieke Oele,
Gertjan Van Noord 2018 9/24 文献紹介 長岡技術科学大学 自然言語処理研究室 福嶋 真也 IWCS 2017 — 12th International Conference on Computational Semantics — Short papers URL: http://aclweb.org/anthology/W17-6931
2 Abstract • 知識ベースと分散表現を用いた、シンプルなWSD を提案 • 語義の注釈と文脈の類似度を分散表現から計算 • 他のLesk法を用いた手法より優れた性能を発揮 した
3 introduction • 現在、最も優れたWSDシステムは教師あり学習を用いた 手法 (Snyder and Palmer, 2004; Pradhan
et al., 2007; Navigli and Lapata, 2007; Navigli, 2009; Zhong and Ng, 2010) 問題点 ・多くのアノテーションされたデータが必要 ・特定のドメインでしかうまく機能しない (Escudero et al., 2000)
4 introduction • 提案手法 Lesk法を元にした知識ベースのWSD Lesk法:注釈と文脈間で重複している単語の数 から類似度を計算 分散表現を用いて類似度を計算
5 Method • 単語wの語義sに対して、コサイン類似度を計算 Score(s, w) = cos(Gs, Cw) +
cos(Ls,w, Cw) Gs・・・注釈のベクトル、Cw・・・文脈のベクトル Ls,w・・・語彙素のベクトル (語彙素:単語と1つの語義の組み合わせ) →スコアの高い語義が選ばれる
6 Method • Ls,wについて AutoExtend (Rothe and Schutze, 2015)を用いて、単語の分散表現を 元にWordNetから語義の分散表現を獲得
• Cwについて 文中にある全ての内容語の分散表現を平均したもの すでに語義を決定した単語については語義の分散表現を使用 • Gsについて 注釈にある全ての内容語の分散表現を平均したもの
7 Method • WSDの前に語義の少ない順に単語を並べ替え、 語義の少ない単語からWSDを行う →語義の少ない単語ほど、曖昧性を解消しやすいため (Chen et al.,
2014)
8 Experiments • オランダ語と英語について実験 • 評価用データセット ・オランダ語:DutchSemCor ・英語:SemCor Senseval-2 (SE-2)
Senseval-3 (SE-3)
9 Result • accuracyの比較
10 Result • 効果の比較
11 Result • 異なるドメインでの比較
12 Conclusion • 分散表現を用いて単語の語義と文脈の類似性を計算する 手法を提案 • 最先端の知識ベースシステムより優れた性能を発揮 • 他の言語にも簡単に適用可能で、必要とするデータも 少ない