各置換クラスは単語の⽂脈化に異なる影響を与えると仮定 n 意味変化と関連があるクラスが⽤意されている n 同義語、反義語、上位語、ランダム単語 n 対象単語と置換語は同じ品詞になるように⽤意 n 正確な置換を⾏うため 7/40 [Fellbaum, 1998] WordNet: An Electronic Lexical Database
を⽤いて品詞と意味を考慮した置換語を選定 [Miller+, 1993] n 品詞ごとに分析対象の⽂を⽤意 n Model n BERT n mBERT n XLM-R 12/40 [Miller+, 1993] A Semantic Concordance. [Fellbaum, 1998] WordNet: An Electronic Lexical Database
の埋め込み(cat の埋め込み) n 同じ⽂脈 c における置換語 r の埋め込み(chair の埋め込み) n Self-Embedding Distance(SED) n 対象単語 w と置換語 r のコサイン距離を SED と定義 n SED が⾼い:対象単語と置換語が離れた意味 n SED が低い:対象単語と置換語が似ている意味 13/40
埋め込みは異⽅性を持つことから SED は⽐較不可能 [Ethayarajh, 2019] n 各層や品詞ごとに SED を⽐較するために、層特有の正規化を実施 14/40 [Ethayarajh, 2019] How Contextual are Con- textualized Word Representations? Comparing the Geometry of BERT, ELMo, and GPT-2 Embeddings.
先⾏研究と同じ結果 [Ethayarajh, 2019] 16/40 [Ethayarajh, 2019] How Contextual are Con- textualized Word Representations? Comparing the Geometry of BERT, ELMo, and GPT-2 Embeddings.
JSD:クラスタリングしてクラスタのJSダイバージェンスを計算 22/40 [Periti and Tahmasebi, 2024] Systematic Comparison of Contextualized Word Embeddings for Lexical Semantic Change より数式を引⽤
Top-k の置換語ごとの SED の平均を意味変化スコアと定義 n ⼊⼒:単語の置換セット n WordNet:対象単語の同義語や上位語のレンマを使⽤ [Fellbaum, 1998] n Wiktionary:対象単語に関連する単語を抽出 25/40 [Fellbaum, 1998] WordNet: An Electronic Lexical Database
n 類義語に落としてタスクを解いているので解釈が容易に n 解釈性を上げる⽅向でこの研究が評価されている n 2つの時期間での意味変化度合い n 結構やり尽くされている気がする n 理想的には教師なしの設定で意味変化した単語を⽰したい n 2つの時期よりも複数時期での分析が欲しい[Periti and Tahmasebi , 2024] 39/40 [Periti and Tahmasebi , 2024] Towards a Complete Solution to Lexical Semantic Change: an Extension to Multiple Time Periods and Diachronic Word Sense Induction
Word in Context を使う[Periti+, 2024] n 意味変化の種類の分類 [Cassotti+, 2024] n 単語埋め込み vs ⽂埋め込み n ⽂埋め込みから単語埋め込みが得られたら⼀気に情勢が変わりそう n XLM-R を fine-tuning して⽂埋め込みから単語埋め込みを獲得[Cassotti+, 2023] n 強い⽂埋め込みのモデルを適応すると…? 40/40 [Periti+ , 2024] (Chat)GPT v BERT: Dawn of Justice for Semantic Change Detection [Cassotti+, 2024] Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [Cassotti+, 2023] XL-LEXEME: WiC Pretrained Model for Cross-Lingual LEXical sEMantic changE