Upgrade to Pro — share decks privately, control downloads, hide ads and more …

パフォーマンス改善の役に立つ 知っていてほしい Snowflake の仕様 2 選 / BU...

パフォーマンス改善の役に立つ 知っていてほしい Snowflake の仕様 2 選 / BUILD.local Tokyo: LEGEND OF DATA HEROES

BUILD.local Tokyo: LEGEND OF DATA HEROES - LT 資料: https://snowflakejapan.connpass.com/event/265331/

Yoshi Matsuzaki

November 22, 2022
Tweet

More Decks by Yoshi Matsuzaki

Other Decks in Technology

Transcript

  1. パフォーマンス改善の役に立つ 知っていてほしい Snowflake の仕様 2 選 Yoshi Matsuzaki - Principal

    Cloud Support Engineer @ Snowflake Nov 16, 2022 - BUILD.local Tokyo @ IDOL Omotesando
  2. Yoshi Matsuzaki Principal Cloud Support Engineer @ Snowflake • 日本のサポートエンジニア第

    1 号として 日本語サポートを立ち上げた者 • 前職は Amazon Aurora/RDS MySQL チームの データベースエンジニア • 静岡市在住 (フルリモート) • 好きな関数: GENERATOR 誰
  3. • 10,000 列 * 10,000 行 = 1 億値のテーブル •

    100 列 * 1,000,000 行 = 1 億値のテーブル 問題 1: カラム数が多いテーブルのメタデータ create or replace transient table t_wide (c1 int, c2 int, ... , c9999 int, c10000 int) as select seq4(), seq4(), ... , seq4(), seq4() from table(generator(rowcount => 10000)); create or replace transient table t_deep (c1 int, c2 int, ... , c99 int, c100 int) as select seq4(), seq4(), ... , seq4(), seq4() from table(generator(rowcount => 1000000));
  4. 問題 1: カラム数が多いテーブルのメタデータ use warehouse xsmall; select * from t_wide;

    -- コンパイル: 2 min 21 sec (141 sec) -- クエリ実行: 4.2 sec -- パーティション数: 6 select * from t_deep; -- コンパイル: 331 msec (0.3 sec) -- クエリ実行: 4.8 sec -- パーティション数: 2
  5. • 値の数や論理データ量は同じなのに… • コンパイル時間が 426 倍 • しかも 1/100 の行数なのにパーティション数は

    3 倍 • → 取得するメタデータが更に増える 問題 1: カラム数が多いテーブルのメタデータ
  6. • 各行がすべて同じ値を持つ 100 列 * 1 億行 のテーブル • 各列がすべて同じ値を持つ

    100 列 * 1 億行 のテーブル 問題 2: カラム数が多いテーブルの圧縮率 create or replace transient table t_row (c1 int, c2 int, ... , c99 int, c100 int) as select row_number() over (order by true) * 10000, row_number() over (order by true) * 10000, ... from table(generator(rowcount => 100000000)); create or replace transient table t_col (c1 int, c2 int, ... , c99 int, c100 int) as select 10000 * 1, 10000 * 2, ... , 10000 * 99, 10000 * 100 from table(generator(rowcount => 100000000));
  7. • 行方向が同じ値 ... 1,060.18 MB (約 1 GB) • 列方向が同じ値

    ... 5.63 MB • 約 188 倍の差 問題 2: カラム数が多いテーブルの圧縮率 select table_name, round(bytes/1024/1024, 2) bytes_mb from information_schema.tables where table_name in ('T_ROW', 'T_COL'); -- T_ROW 1060.18 -- T_COL 5.63
  8. • 圧縮率が下がる = 物理サイズが増える • ストレージコストが増える • 1 パーティションに格納できる行数が減る •

    = パーティション数が増える • = メタデータの数も増える 問題 2: カラム数が多いテーブルの圧縮率
  9. • できるだけ縦方向に長いテーブルにしよう • (sales_2022, sales_2021, ...) → (year, sales) •

    (sales_us, sales_jp, ...) → (country, sales) カラム数が多いテーブルは圧倒的に不利
  10. • この制約が問題になる例 • LATERAL FLATTEN による増幅 • データスキュー (データの偏り) 1

    つのパーティションをスキャンできるのは 1 つのサーバのみ
  11. • 100 要素の配列を持つ 1,000,000 行のテーブル • パーティション数は 1 例 1:

    LATERAL FLATTEN による増幅 create or replace transient table t (idx int, arr array) as select seq4(), (select array_agg(seq4()) from table(generator(rowcount => 100))) from table(generator(rowcount => 1000000)); explain select * from t1; -- partitionsTotal: 1
  12. • LATERAL FLATTEN で配列を展開して配列要素でソート • ランタイム上で行数が 100 * 1,000,000 =

    1 億行に • 290 秒 (4 分 50 秒) かかる 例 1: LATERAL FLATTEN による増幅 use warehouse large; select f.value from t, lateral flatten(arr) f order by f.value; -- 290 sec
  13. • LATERAL FLATTEN した結果をテーブルに格納 • パーティション数が 9 に増加 例 1:

    LATERAL FLATTEN による増幅 create or replace temporary table t_flattened (idx int, elem string) as select t.idx, f.value from t, lateral flatten(t.arr) f; -- 43 sec explain select * from t_flattened; -- partitionsTotal: 9
  14. • 展開済みテーブルを配列要素でソート • 290 秒 → 43 + 4.5 =

    47.5 秒に短縮 • SELECT ... ORDER BY だけで見ると 64 倍高速化 例 1: LATERAL FLATTEN による増幅 select elem from t_flattened order by elem; -- 4.5 sec
  15. • 英数字 1 文字が格納された 1 億行のテーブル 例 2: データスキュー create

    or replace transient table t_skew (s varchar) as select randstr(1, random()) s from table(generator(rowcount => 100000000)) order by s; explain select * from t_skew; -- partitionsTotal: 8 explain select * from t_skew where s >= 'r'; -- partitionsAssigned: 2 explain select * from t_skew where s >= 's'; -- partitionsAssigned: 1
  16. • 最後のパーティションだけ 'zz...zz' (100 文字) に上書き • 8 つのパーティション中 1

    つだけ 100 倍大きい状態 例 2: データスキュー update t_skew set s = repeat('z', 100) where s >= 'z'; explain select * from t_skew where s >= 's'; -- partitionsTotal: 8 -- partitionsAssigned: 1
  17. • 同じデータを空のテーブルに入れ直してみる • 64 - 8 = 56 パーティション分のデータが偏っている 例

    2: データスキュー create or replace transient table t_dist (s varchar) as select * from t_skew order by s; explain select * from t_dist; -- partitionsTotal: 64
  18. • サイズ依存で重くなる処理を実行してみる (REPEAT) • 結果書き出しの負荷を無視するために HASH_AGG 例 2: データスキュー use

    warehouse large; select hash_agg(repeat(s, 1000)) from t_skew; -- 5 min 32 sec select hash_agg(repeat(s, 1000)) from t_dist; -- 58.71 sec
  19. • スキューを直すだけで 5.6 倍高速化 • データスキューは並列度を下げてしまう • とりあえず直したい ... CTAS

    + ORDER BY • 継続的に回避したい ... 自動クラスタリング • すぐにデータは触れないけど改善したい場合は…? 例 2: データスキュー
  20. • 秘技: ORDER BY RANDOM() • ソート結果は各サーバに再分散される • スキューの影響 >

    追加されるソートの負荷 例 2: データスキュー select hash_agg(repeat(s, 1000)) from (select * from t_skew order by random()); -- 1 min 12 sec