1. Genie Space を作る サンプルテーブル samples.bakehouse.sales_transactions のみを追加した、シンプルな Genie Space を作成。今回は、2つの列について値ディクショナリが自動作成されました。 データの中身 データの中身 作成したGenie Space
Genie Space 作成時に実行された SQL を見てみる SELECT item.item AS value FROM ( SELECT explode(approx_top_k(`paymentMethod`, 1024)) AS item FROM ( SELECT `paymentMethod` FROM `samples`.`bakehouse`.`sales_transactions` LIMIT 100000 ) ) WHERE length(item.item) < 127
Genie Space 作成時に実行された SQL を見てみる SELECT item.item AS value FROM ( SELECT explode(approx_top_k(`paymentMethod`, 1024)) AS item FROM ( SELECT `paymentMethod` FROM `samples`.`bakehouse`.`sales_transactions` LIMIT 100000 ) ) WHERE length(item.item) < 127 ① 先頭10万件を抽出
Genie Space 作成時に実行された SQL を見てみる SELECT item.item AS value FROM ( SELECT explode(approx_top_k(`paymentMethod`, 1024)) AS item FROM ( SELECT `paymentMethod` FROM `samples`.`bakehouse`.`sales_transactions` LIMIT 100000 ) ) WHERE length(item.item) < 127 ① 先頭10万件を抽出 ② 出現頻度の高い 1024 件のユニーク値を抽出
Genie Space 作成時に実行された SQL を見てみる SELECT item.item AS value FROM ( SELECT explode(approx_top_k(`paymentMethod`, 1024)) AS item FROM ( SELECT `paymentMethod` FROM `samples`.`bakehouse`.`sales_transactions` LIMIT 100000 ) ) WHERE length(item.item) < 127 ① 先頭10万件を抽出 ② 出現頻度の高い 1024 件のユニーク値を抽出 ③ 文字列長が 127 を超えるものをフィルター