Slide 17
Slide 17 text
実験2:多様な意味変化について
提案手法と既存手法を比較
- 比較する既存手法
- PROCR の結果(各単語における t=0, t=i (i>2) の余弦類
似度)を用いる:Shoemark2019[4]
i. 単語 α について各時期との余弦類似度の結果 cos(w(α)
0
, w(α)
1
),
cos(w(α)
0
, w(α)
2
), …, cos(w(α)
0
, w(α)
i
) と 1, 2, …, i の Pearson 相関を計
算し、全ての単語について絶対値で並び替え(GTc)
- 相関が強い:t=0 の時の単語ベクトルから 徐々に離れる・近くなる ため、意味が変化し
た可能性が高い
ii. 単語 α について各時期との余弦類似度の結果 cos(w(α)
0
, w(α)
1
),
cos(w(α)
0
, w(α)
2
), …, cos(w(α)
0
, w(α)
i
) について線形回帰を適用し、傾き
の大きさで並び替え(GTβ)
- 傾きが大きい:意味が変化した可能性が高い
iii. 単語 α について各時期との余弦類似度の結果 cos(w(α)
0
, w(α)
1
),
cos(w(α)
0
, w(α)
2
), …, cos(w(α)
0
, w(α)
i
) を平均して並び替え(PROCR*)
17