Slide 9
Slide 9 text
文1が 個のサブワードからなる文とし、各サブワードの
contextualized embeddings を とする(文2も同様)
このとき、文の距離は、コスト行列 のもとで状態
から に移動する輸送距離とみなせる。
ただし、コスト行列は を満たす。(つまり、サ
ブワード埋め込みが遠いほどコストが大きい)
輸送距離とは、 をみたすような に対し
て で与えられるもの。これが最小となるとき最適輸送距
離 (earth mover's distance)と呼ばれる
をうまく決められるとうれしい
手法: 最適輸送と contextualized な文埋め込み
L
1
x
i
1
M ∈
CMD RL
×L
1 2
d =
1
L
1
1 1 d =
2
L
2
1 1
M
=
i,j
CMD 1 − cos(x
, x
)
i
1
j
2
T =
⊤1 d , T =
2 1 d1 T ∈ R
≥0
L
×L
1 2
T
M
∑
i,j i,j i,j
CMD
2
T
2: 2ページ前に紹介したスライド資料の数値例を見ると理解しやすいと思います 9/23