Slide 14
Slide 14 text
16
Cosmos DB for NoSQL ベクトル検索
アルゴリズム 説明 最大次元
Flat
(KNN)
格納されているすべてのデータ点との類似度を計算し、類似度に基
づいて結果を返却。データセットで最も類似度が高いベクトルを見
つけることが保証されている
505
Quantized Flat 量子化(圧縮)されたベクトルが格納されており、Flatよりも高速で
RUコストも低くなる。すべてのデータ点との類似度を計算するが、
Flatに比べるとベクトルが圧縮されているため、精度は100%よりも
わずかに下回る可能性あり
4096
DiskANN(Preview) 高い精度を維持しながら、最短の待機時間、最高のスループット、
最小のRUコストを実現する検索手法。Microsoft Researchによっ
て開発されており、Microsoft 365やBingの裏で使われている。Flat
やQuantized Flatよりも精度は低くなる傾向
4096
SELECT c.title, VectorDistance(c.contentVector, [1,2,3]) AS
SimilarityScore
FROM c
ORDER BY VectorDistance(c.contentVector, [1,2,3])
検索クエリ
検索手法
ベクトル ストア - Azure Cosmos DB for NoSQL | Microsoft Learn
24年5月のBuildで発表