Slide 18
Slide 18 text
(脱線)ベクトル検索とは???
コンテンツを数値情報に変換し、コンテンツ同士の類似度を算出する検索方法。
以下のようなシーンでの検索ができる。
意味的または概念的な類似性 ("dog" と "canine" は概念的には似ているが言語的には異なる)
多言語コンテンツ (英語では “dog”、日本語では “犬")
複数のコンテンツ タイプ (プレーンテキストの “dog” と画像ファイル内の犬の写真)
※まだ精度に課題あり
検索対象 ベクトル値
文書1
文書2
文書3
文書4
[ -2, -1, 0, 1 ]
[ 2, 3, 4, 5 ]
[ 6, 7, 8, 9 ]
[ -2, 0, 4, 7 ]
XXXのYYYとは?
クエリ
[ 2, 3, 4, 6 ]
ベクトル値
最も近い類似度の検索対象
は文書2!!!