Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Distributional Lesk: Effective Knowledge-Based ...
Search
masaya82
September 24, 2018
0
120
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
September 24, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
150
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
160
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
110
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
130
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
160
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
140
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
150
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
130
Using Linked Disambiguated Distributional Networks for Word Sense Disambiguation
masaya82
0
100
Featured
See All Featured
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
76
YesSQL, Process and Tooling at Scale
rocio
174
15k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
210
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
37
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
130
For a Future-Friendly Web
brad_frost
180
10k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
100
Transcript
Distributional Lesk: Effective Knowledge- Based Word Sense Disambiguation Dieke Oele,
Gertjan Van Noord 2018 9/24 文献紹介 長岡技術科学大学 自然言語処理研究室 福嶋 真也 IWCS 2017 — 12th International Conference on Computational Semantics — Short papers URL: http://aclweb.org/anthology/W17-6931
2 Abstract • 知識ベースと分散表現を用いた、シンプルなWSD を提案 • 語義の注釈と文脈の類似度を分散表現から計算 • 他のLesk法を用いた手法より優れた性能を発揮 した
3 introduction • 現在、最も優れたWSDシステムは教師あり学習を用いた 手法 (Snyder and Palmer, 2004; Pradhan
et al., 2007; Navigli and Lapata, 2007; Navigli, 2009; Zhong and Ng, 2010) 問題点 ・多くのアノテーションされたデータが必要 ・特定のドメインでしかうまく機能しない (Escudero et al., 2000)
4 introduction • 提案手法 Lesk法を元にした知識ベースのWSD Lesk法:注釈と文脈間で重複している単語の数 から類似度を計算 分散表現を用いて類似度を計算
5 Method • 単語wの語義sに対して、コサイン類似度を計算 Score(s, w) = cos(Gs, Cw) +
cos(Ls,w, Cw) Gs・・・注釈のベクトル、Cw・・・文脈のベクトル Ls,w・・・語彙素のベクトル (語彙素:単語と1つの語義の組み合わせ) →スコアの高い語義が選ばれる
6 Method • Ls,wについて AutoExtend (Rothe and Schutze, 2015)を用いて、単語の分散表現を 元にWordNetから語義の分散表現を獲得
• Cwについて 文中にある全ての内容語の分散表現を平均したもの すでに語義を決定した単語については語義の分散表現を使用 • Gsについて 注釈にある全ての内容語の分散表現を平均したもの
7 Method • WSDの前に語義の少ない順に単語を並べ替え、 語義の少ない単語からWSDを行う →語義の少ない単語ほど、曖昧性を解消しやすいため (Chen et al.,
2014)
8 Experiments • オランダ語と英語について実験 • 評価用データセット ・オランダ語:DutchSemCor ・英語:SemCor Senseval-2 (SE-2)
Senseval-3 (SE-3)
9 Result • accuracyの比較
10 Result • 効果の比較
11 Result • 異なるドメインでの比較
12 Conclusion • 分散表現を用いて単語の語義と文脈の類似性を計算する 手法を提案 • 最先端の知識ベースシステムより優れた性能を発揮 • 他の言語にも簡単に適用可能で、必要とするデータも 少ない