Slide 37
Slide 37 text
37
ベクトル検索
BERTなど事前学習⾔語モデル(エンコーダー)を利⽤して、
クエリと⽂書をベクトル空間(Embeddings)に変換する。
そして検索するときに、ベクトルの類似度を (コサイン類似度等で) 計算する。
ベクトル検索では、キーワード検索とナレッジグラフとは違い、⽂脈で潜在的な意味が取得できる。
クエリ
⽂書
ベクトル化器
(エンコーダー)
BERTなど
Embeddings
(ベクトル)
クエリベクトル
⽂書ベクトル
[0.12, 5.04, 0.02, 0.0, …, 2.34]
[1.02, 0.54, 0.12, 0.08, …, 1.34]
[0.02, 0.04, 1.12, 0.18, …, 1.76]
[0.16, 0.74, 1.82, 1.00, …, 1.42]
cos_similarity(クエリベクトル、⽂書ベクトル)