Slide 4
Slide 4 text
• ベクトルデータ型を定義する際にBINARY数値形式を指定可能
• パフォーマンスの向上やストレージ使用量を減らすことと引き換えに精度を多少犠牲にする数値形式
• メリット(FLOAT32とBINARYとを比較した場合)
• 距離計算が40倍高速に可能
• ストレージの使用量を32分の1に削減
• デメリット(FLOAT32とBINARYとを比較した場合)
• 精度が低くなる可能性があり、参考値としてFLOAT32に比べて90%程度の精度となる
• BINARYは次元値が0より大きければ1、次元値が0以下の場合0となり、この0,1の配列をバイト表現に変換したものを1
次元値のデータとして格納することになる
• INT8の場合 [25, 11, -99, -114, 13, -17, -59, 44]と表現される
• BINARYの場合 [1, 1, 0, 0, 1, 0, 0, 1]と表現される
この11001001をバイト表現すると201となり、BINARYとして格納されるのは[201, ~~~~~]となる
この数値の丸め込みが計算の高速化とストレージ使用料の削減に寄与する
バイナリ・ベクトル
Copyright © 2024, Oracle and/or its affiliates
4