Slide 18
Slide 18 text
カラムの統計情報を⽤いた最適化
● SQLのWHERE句で使われている条件を抽出
● =, >, <, <=, >=, IN
● 実際のデータを読まずに、カラムの統計情報から、ターゲットのデータが含まれないパーティションをスキップする
● 統計情報の例
● レコード数、nullの値の数、カラムのmin/max
● Bloom filter
■ カラムの値 x に複数のハッシュ関数h1(x), h2(x), …を適用した値を、ビットベクターにセットする
■ ある値xに対して、
● h1(x), h2(x)の全てのビットがセットされていてば、そのパーティションは該当レコードを含んでいるかもし
れない。
● false-positivesは許可するが、false-negativesは許可しない
● Spatial indexes (S2 Cell)
● 値の頻度ヒストグラム
18