rerank_test WHERE id = 100000; -[ RECORD 1 ]---------------------------------------------------------- id | 100000 data | ヴァージン・オーストラリア航空はいつから運航を開始したのですか? Time: 139.100 ms
FROM rerank_test WHERE id = 100000)) * -1 AS inner_product, data FROM rerank_test WHERE id < 100000 ORDER BY inner_product DESC LIMIT 5; -[ RECORD 1 ]-+--------------------------------------------------------------------------------------… id | 0 inner_product | 0.7999640703201294 data | ヴァージン・オーストラリア航空(Virgin Australia Airlines Pty Ltd)はオーストラリアを拠点とする… -[ RECORD 2 ]-+--------------------------------------------------------------------------------------… id | 3355 inner_product | 0.4171184301376343 data | N.V. Virgin Express S.A.は、ヴァージン・グループ内に誕生したベルギーの航空会社なのだ。ブリュッセ … -[ RECORD 3 ]-+--------------------------------------------------------------------------------------… id | 6819 inner_product | 0.2454237937927246 data | OA形は、ボールドウィン機関車製作所がニュージーランドのウェリントン&マナワツ鉄道( WMR)のために製作し… -[ RECORD 4 ]-+--------------------------------------------------------------------------------------… id | 1540 inner_product | 0.22488926351070404 data | 橋が架かる前、サンフランシスコと現在のマリン郡を結ぶ唯一の実用的な近道は、サンフランシスコ湾の一角を船 … -[ RECORD 5 ]-+--------------------------------------------------------------------------------------… id | 3120 inner_product | 0.22459137439727783 data | Oy Air Finlandは、フィンランドのヴァンターにあるヘルシンキ空港を本社・拠点とする航空会社で、休暇先 … Time: 173.794 ms
embedding FROM rerank_test WHERE id = 100000)) * -1 AS inner_product, data FROM rerank_test WHERE id < 100000 ORDER BY inner_product DESC LIMIT 5; -[ RECORD 1 ]-+--------------------------------------------------------------------------------------… id | 0 inner_product | 0.7999640703201294 data | ヴァージン・オーストラリア航空(Virgin Australia Airlines Pty Ltd)はオーストラリアを拠点とする… -[ RECORD 2 ]-+--------------------------------------------------------------------------------------… id | 3355 inner_product | 0.4171184301376343 data | N.V. Virgin Express S.A.は、ヴァージン・グループ内に誕生したベルギーの航空会社なのだ。ブリュッセ … -[ RECORD 3 ]-+--------------------------------------------------------------------------------------… id | 6819 inner_product | 0.2454237937927246 data | OA形は、ボールドウィン機関車製作所がニュージーランドのウェリントン&マナワツ鉄道( WMR)のために製作し… -[ RECORD 4 ]-+--------------------------------------------------------------------------------------… id | 1540 inner_product | 0.22488926351070404 data | 橋が架かる前、サンフランシスコと現在のマリン郡を結ぶ唯一の実用的な近道は、サンフランシスコ湾の一角を船 … -[ RECORD 5 ]-+--------------------------------------------------------------------------------------… id | 3120 inner_product | 0.22459137439727783 data | Oy Air Finlandは、フィンランドのヴァンターにあるヘルシンキ空港を本社・拠点とする航空会社で、休暇先 … Time: 175.982 ms インデックスなしのケースとほぼ変わらず(データ行数が少ないため?)
rerank_test_embedding_idx; DROP INDEX Time: 152.619 ms postgres=> CREATE INDEX ON rerank_test USING hnsw ((binary_quantize(embedding)::bit(1024)) bit_hamming_ops); CREATE INDEX Time: 3356.522 ms (00:03.357) インデックス作成所要時間が半分以下に
(SELECT embedding FROM rerank_test WHERE id = 100000)) * -1 AS inner_product, data FROM (SELECT * FROM rerank_test WHERE id < 100000 ORDER BY binary_quantize(embedding)::bit(1024) <~> (SELECT binary_quantize(embedding)::bit(1024) FROM rerank_test WHERE id = 100000) LIMIT 20) ORDER BY inner_product DESC LIMIT 5; -[ RECORD 1 ]-+--------------------------------------------------------------------------------------… id | 0 inner_product | 0.7999640703201294 data | ヴァージン・オーストラリア航空(Virgin Australia Airlines Pty Ltd)はオーストラリアを拠点とする… -[ RECORD 2 ]-+--------------------------------------------------------------------------------------… id | 3355 inner_product | 0.4171184301376343 data | N.V. Virgin Express S.A.は、ヴァージン・グループ内に誕生したベルギーの航空会社なのだ。ブリュッセ … -[ RECORD 3 ]-+--------------------------------------------------------------------------------------… id | 6819 inner_product | 0.2454237937927246 data | OA形は、ボールドウィン機関車製作所がニュージーランドのウェリントン&マナワツ鉄道( WMR)のために製作し… -[ RECORD 4 ]-+--------------------------------------------------------------------------------------… id | 1540 (中略) -[ RECORD 5 ]-+--------------------------------------------------------------------------------------… id | 3120 (中略) Time: 140.448 ms 少しだけ検索所要時間が短縮
binary_quantize(embedding)::bit(1024) FROM rerank_test WHERE id = 100000)) AS humming_distance, data FROM rerank_test WHERE id < 100000 ORDER BY humming_distance LIMIT 5; -[ RECORD 1 ]----+-----------------------------------------------------------------------------------… id | 0 humming_distance | 224 data | ヴァージン・オーストラリア航空(Virgin Australia Airlines Pty Ltd)はオーストラリアを拠点と… -[ RECORD 2 ]----+-----------------------------------------------------------------------------------… id | 3355 humming_distance | 385 data | N.V. Virgin Express S.A.は、ヴァージン・グループ内に誕生したベルギーの航空会社なのだ。ブリュ … -[ RECORD 3 ]----+-----------------------------------------------------------------------------------… id | 5003 humming_distance | 419 data | エアバスA380は、エアバス社が開発・製造した大型ワイドボディー旅客機なのだ。世界最大の旅客機であり … -[ RECORD 4 ]----+-----------------------------------------------------------------------------------… id | 65 humming_distance | 426 data | イギリス領ヴァージン諸島(BVI)、通称ヴァージン諸島は、カリブ海にあるイギリス海外領土で、プエルト … -[ RECORD 5 ]----+-----------------------------------------------------------------------------------… id | 5206 (中略) Time: 139.787 ms Re-rank 検索と順位が変化・検索所要時間の差はわずか
(embedding); CREATE INDEX 先ほどとは別環境なので所要時間は非表示・デフォルトで 1 ビットのインデックス (データ量が少なくメモリ上に全データがキャッシュされるせいか、同じ環境では pgvector のビット量子化インデックスのほうが速かった) postgres=# SELECT id, (embedding <#> (SELECT embedding FROM rerank_test WHERE id = 100000)) * -1 AS inner_product FROM (SELECT * FROM rerank_test WHERE id < 100000 ORDER BY embedding <=> (SELECT embedding FROM rerank_test WHERE id = 100000) LIMIT 20) ORDER BY inner_product DESC LIMIT 5; id | inner_product ------+--------------------- 0 | 0.7999640703201294 3355 | 0.4171184301376343 6819 | 0.2454237937927246 1540 | 0.22488926351070404 3120 | 0.22459137439727783 (5 rows) StreamingDiskANN インデックスは現時点でコサイン距離のみ対応