Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Distributional Lesk: Effective Knowledge-Based ...
Search
masaya82
September 24, 2018
0
83
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
September 24, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
120
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
130
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
73
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
100
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
120
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
99
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
110
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
110
Using Linked Disambiguated Distributional Networks for Word Sense Disambiguation
masaya82
0
70
Featured
See All Featured
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Why Our Code Smells
bkeepers
PRO
335
57k
Code Reviewing Like a Champion
maltzj
521
39k
Fontdeck: Realign not Redesign
paulrobertlloyd
82
5.3k
A better future with KSS
kneath
238
17k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.4k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.2k
Code Review Best Practice
trishagee
65
17k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Fireside Chat
paigeccino
34
3.1k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Transcript
Distributional Lesk: Effective Knowledge- Based Word Sense Disambiguation Dieke Oele,
Gertjan Van Noord 2018 9/24 文献紹介 長岡技術科学大学 自然言語処理研究室 福嶋 真也 IWCS 2017 — 12th International Conference on Computational Semantics — Short papers URL: http://aclweb.org/anthology/W17-6931
2 Abstract • 知識ベースと分散表現を用いた、シンプルなWSD を提案 • 語義の注釈と文脈の類似度を分散表現から計算 • 他のLesk法を用いた手法より優れた性能を発揮 した
3 introduction • 現在、最も優れたWSDシステムは教師あり学習を用いた 手法 (Snyder and Palmer, 2004; Pradhan
et al., 2007; Navigli and Lapata, 2007; Navigli, 2009; Zhong and Ng, 2010) 問題点 ・多くのアノテーションされたデータが必要 ・特定のドメインでしかうまく機能しない (Escudero et al., 2000)
4 introduction • 提案手法 Lesk法を元にした知識ベースのWSD Lesk法:注釈と文脈間で重複している単語の数 から類似度を計算 分散表現を用いて類似度を計算
5 Method • 単語wの語義sに対して、コサイン類似度を計算 Score(s, w) = cos(Gs, Cw) +
cos(Ls,w, Cw) Gs・・・注釈のベクトル、Cw・・・文脈のベクトル Ls,w・・・語彙素のベクトル (語彙素:単語と1つの語義の組み合わせ) →スコアの高い語義が選ばれる
6 Method • Ls,wについて AutoExtend (Rothe and Schutze, 2015)を用いて、単語の分散表現を 元にWordNetから語義の分散表現を獲得
• Cwについて 文中にある全ての内容語の分散表現を平均したもの すでに語義を決定した単語については語義の分散表現を使用 • Gsについて 注釈にある全ての内容語の分散表現を平均したもの
7 Method • WSDの前に語義の少ない順に単語を並べ替え、 語義の少ない単語からWSDを行う →語義の少ない単語ほど、曖昧性を解消しやすいため (Chen et al.,
2014)
8 Experiments • オランダ語と英語について実験 • 評価用データセット ・オランダ語:DutchSemCor ・英語:SemCor Senseval-2 (SE-2)
Senseval-3 (SE-3)
9 Result • accuracyの比較
10 Result • 効果の比較
11 Result • 異なるドメインでの比較
12 Conclusion • 分散表現を用いて単語の語義と文脈の類似性を計算する 手法を提案 • 最先端の知識ベースシステムより優れた性能を発揮 • 他の言語にも簡単に適用可能で、必要とするデータも 少ない