Unsupervised Word
Polysemy Quantification
with Multiresolution Grids of
Contextual Embeddings
Christos Xypolopoulos, Antoine Tixier, Michalis Vazirgiannis
EACL2021
論文紹介
手法:アイデア
- 画像処理における pyramid matching と同じ
17
Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories. (Lazebnik+2006)
Slide 18
Slide 18 text
vs. クラスタリング
- 文脈あり単語ベクトルも一様ではない
- クラスタリングは空間に対して均等に分割をせず
(密度ベース)、外れ値のクラスタも
- クラスタ数=多義語の度合い は信頼できない
18
How Contextual are Contextualized Word Representations? Comparing
the Geometry of BERT, ELMo, and GPT-2 Embeddings (Ethayarajh2019)
Slide 19
Slide 19 text
実験:多義語の度合いの順位付け
- 対象の1822単語のうち、Ground Truth で使えた
単語数
19