Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Distributional Lesk: Effective Knowledge-Based ...
Search
masaya82
September 24, 2018
0
86
Distributional Lesk: Effective Knowledge-Based Word Sense Disambiguation
masaya82
September 24, 2018
Tweet
Share
More Decks by masaya82
See All by masaya82
文献紹介 : More is not always better: balancing sense distributions for all-words
masaya82
0
120
文献紹介:Enhancing Modern Supervised Word Sense Disambiguation Models
masaya82
0
130
文献紹介:The Word Sense Disambiguation Test Suite at WMT18
masaya82
0
76
文献紹介:Preposition Sense Disambiguation and Representation
masaya82
0
110
文献紹介:Word Sense Disambiguation Based on Word Similarity Calculation Using Word Vector Representation from a Knowledge-based Graph
masaya82
0
130
Japanese all-words WSD system using the Kyoto Text Analysis ToolKit
masaya82
0
100
Improving Word Sense Disambiguation in Neural Machine Translation with Sense Embeddings
masaya82
0
120
Learning_to_Identify_the_Best_Contexts_for_Knowledge-based_WSD
masaya82
0
110
Using Linked Disambiguated Distributional Networks for Word Sense Disambiguation
masaya82
0
73
Featured
See All Featured
Building Adaptive Systems
keathley
40
2.4k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.1k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
Being A Developer After 40
akosma
89
590k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Making Projects Easy
brettharned
116
6k
Code Review Best Practice
trishagee
67
17k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
GraphQLとの向き合い方2022年版
quramy
44
13k
Become a Pro
speakerdeck
PRO
26
5.1k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Transcript
Distributional Lesk: Effective Knowledge- Based Word Sense Disambiguation Dieke Oele,
Gertjan Van Noord 2018 9/24 文献紹介 長岡技術科学大学 自然言語処理研究室 福嶋 真也 IWCS 2017 — 12th International Conference on Computational Semantics — Short papers URL: http://aclweb.org/anthology/W17-6931
2 Abstract • 知識ベースと分散表現を用いた、シンプルなWSD を提案 • 語義の注釈と文脈の類似度を分散表現から計算 • 他のLesk法を用いた手法より優れた性能を発揮 した
3 introduction • 現在、最も優れたWSDシステムは教師あり学習を用いた 手法 (Snyder and Palmer, 2004; Pradhan
et al., 2007; Navigli and Lapata, 2007; Navigli, 2009; Zhong and Ng, 2010) 問題点 ・多くのアノテーションされたデータが必要 ・特定のドメインでしかうまく機能しない (Escudero et al., 2000)
4 introduction • 提案手法 Lesk法を元にした知識ベースのWSD Lesk法:注釈と文脈間で重複している単語の数 から類似度を計算 分散表現を用いて類似度を計算
5 Method • 単語wの語義sに対して、コサイン類似度を計算 Score(s, w) = cos(Gs, Cw) +
cos(Ls,w, Cw) Gs・・・注釈のベクトル、Cw・・・文脈のベクトル Ls,w・・・語彙素のベクトル (語彙素:単語と1つの語義の組み合わせ) →スコアの高い語義が選ばれる
6 Method • Ls,wについて AutoExtend (Rothe and Schutze, 2015)を用いて、単語の分散表現を 元にWordNetから語義の分散表現を獲得
• Cwについて 文中にある全ての内容語の分散表現を平均したもの すでに語義を決定した単語については語義の分散表現を使用 • Gsについて 注釈にある全ての内容語の分散表現を平均したもの
7 Method • WSDの前に語義の少ない順に単語を並べ替え、 語義の少ない単語からWSDを行う →語義の少ない単語ほど、曖昧性を解消しやすいため (Chen et al.,
2014)
8 Experiments • オランダ語と英語について実験 • 評価用データセット ・オランダ語:DutchSemCor ・英語:SemCor Senseval-2 (SE-2)
Senseval-3 (SE-3)
9 Result • accuracyの比較
10 Result • 効果の比較
11 Result • 異なるドメインでの比較
12 Conclusion • 分散表現を用いて単語の語義と文脈の類似性を計算する 手法を提案 • 最先端の知識ベースシステムより優れた性能を発揮 • 他の言語にも簡単に適用可能で、必要とするデータも 少ない