Slide 22
Slide 22 text
類似度計算の課題
n 特定の1件と似たものを探すならまだしも…
u 類似する論文のクラスタを作成しよう,と思ったら…
p 論文が100件あったら,100^2/2 回 位の類似度算出
p 1,000 なら 1,000^2 の規模,10,000 だったら…
n 分散表現を活用するとこの問題も対処できる
u そもそも,似たものは空間上で近くにある
p 類似度計算なしに,クラスタリング手法が適用可能
u 類似度計算をショートカットもできる
p 高次元ベクトル近傍探索 という技術との組み合わせ
• あらかじめ,空間的に近くにありそうなものを探す技術
p 100件なら100件全部見ずに,近くの数件と比較でOK
22