Discovering Universal Geometry in Embeddings with ICA

Slide 1

Slide 1 text

Discovering Universal Geometry in Embeddings with ICA 2023.12.20 NLPコロキウム Hiroaki Yamagiwa*, Momose Oyama*, Hidetoshi Shimodaira EMNLP2023

Slide 2

Slide 2 text

⼤⼭百々勢 (Oyama Momose) l 京都⼤学下平研究室修⼠２年（D進の予定） l 埋め込み表現の研究 ○ Norm of Word Embedding Encodes Information Gain [Oyama, Yokoi, Shimodaira, EMNLP 2023] [Paper] ○ Discovering Universal Geometry in Embeddings with ICA [Yamagiwa*, Oyama*, Shimodaira, EMNLP 2023] [Paper] l 国内のコミュニティ ○ NLP, YANS ○ IBIS, 統計連合⼤会 2

Slide 3

Slide 3 text

道具の紹介︓ Independent Component Analysis (ICA)

Slide 4

Slide 4 text

ICAは独⽴な軸を⾒つける変換 𝐗𝐁 = 𝐒 ⼊⼒の⾏列: (𝑛, 𝑑) 変換後の⾏列: (𝑛, 𝑑) 𝑑個の列が互いに独⽴変換⾏列: (𝑑, 𝑑) 4

Slide 5

Slide 5 text

ICAは独⽴な軸を⾒つける変換 𝐗𝐁 = 𝐒 ⼊⼒の⾏列: (𝑛, 𝑑) 変換⾏列: (𝑑, 𝑑) 𝐗 (⼊⼒) 𝐒 (出⼒) ⾳声 𝑑箇所のマイクが拾った⼈々の話し声 𝑛秒分 𝑑個に分離した話し声のデータ 𝑛秒分 5 変換後の⾏列: (𝑛, 𝑑) 𝑑個の列が互いに独⽴

Slide 6

Slide 6 text

ICAは独⽴な軸を⾒つける変換 𝐗 (⼊⼒) 𝐒 (出⼒) ⾳声 𝑑箇所のマイクが拾った⼈々の話し声 𝑛秒分 𝑑個に分離した話し声のデータ 𝑛秒分単語埋め込み 𝑑個の次元に分散して表現された 𝑛単語分の意味情報 𝑑個の独⽴な意味情報に分離された 𝑛単語の表現 (これから⾒ていきます) 𝐗𝐁 = 𝐒 ⼊⼒の⾏列: (𝑛, 𝑑) 変換⾏列: (𝑑, 𝑑) 6 変換後の⾏列: (𝑛, 𝑑) 𝑑個の列が互いに独⽴

Slide 7

Slide 7 text

単語埋め込みをICAで分析

Slide 8

Slide 8 text

単語ベクトルをヒートマップで可視化 l Skip-gram with Negative Samplingで学習した単語ベクトル l ヒートマップ ○ ⾏: 単語ベクトル ○ 列: 次元 (5/300) l 各要素の⼤⼩は解釈できない ○ 「分散」表現なので⾃然なこと 8

Slide 9

Slide 9 text

PCAをしても解釈性に変化なし 9

Slide 10

Slide 10 text

ICA後は各次元が持つ意味を解釈できる l 16軸: ⾷べ物 (dishes, …) l 26軸: ⾞ (cars, …) l 35軸: 映画 (film, …) l 34軸: イタリア (italian, …) l 56軸: ⽇本 (japanese, …) 10

Slide 11

Slide 11 text

独⽴成分は「尖って」いて解釈可能 l 2軸に沿った散布図 ○ イタリア軸と⾞軸 ○ ⽇本軸と映画軸 l 加法構成性 ○ Ferrari ≈ italian + cars ○ kurosawa ≈ japanese + film l 300次元よりも⼩さな部分空間で単語の意味を表現 11

Slide 12

Slide 12 text

ICAの結果の普遍性

Slide 13

Slide 13 text

まず、英語の埋め込みを可視化英語 13

Slide 14

Slide 14 text

ICA: 異なる⾔語の埋め込みで形と意味が共通 14

Slide 15

Slide 15 text

PCA: 共通の性質を⾒つけられない 15

Slide 16

Slide 16 text

ICA: モデルやドメインの違いを超えた普遍性 16

Slide 17

Slide 17 text

PCA: やはりうまくいかない 17

Slide 18

Slide 18 text

なぜPCAではなくICAがうまくいくのか

Slide 19

Slide 19 text

PCAが捉えきれない⾼次情報をICAは捉える 𝐒 = 𝐗𝐀𝐑 ICA が独⽴な軸を⾒つける⼿順 1. ⽩⾊化 (PCA): 各軸を無相関にする 2. 直交変換: 各軸の⾮ガウス性を最⼤化する 19

Slide 20

Slide 20 text

PCAが捉えきれない⾮ガウス性をICAは捉える ICA が独⽴な軸を⾒つける⼿順 1. ⽩⾊化 (PCA): 各軸を無相関にする 2. 直交変換: 各軸の⾮ガウス性を最⼤化する lどれだけガウス分布から逸脱しているか l例えば歪度や尖度で測定できる 𝐒 = 𝐗𝐀𝐑 20

Slide 21

Slide 21 text

PCAが捉えきれない⾮ガウス性をICAは捉える ICA = PCA + 直交変換 l PCA: 「尖った形状」を⾒つけられない l ICA: 「尖った形状」を⾒つけられる 𝐒 = 𝐗𝐀𝐑 21

Slide 22

Slide 22 text

まとめ

Slide 23

Slide 23 text

まとめ l ICAを使って埋め込みを分析した l わかったこと 1. 埋め込みの独⽴成分は「尖って」いて解釈可能 2. ⾔語・モデル・ドメインの違いを超えて普遍的 l PCAだと上⼿くいかない 23