Slide 22
Slide 22 text
#Rtech スタディサプリでの BigQuery 移管と実践的活用術
データ基盤移管時のデータ検証作業のTips
➔ 細かい差分を確認するのに,
`except distinct` が便利
➔ このクエリを使用することで
テーブル td には存在するが bq には
存在しないレコード,
とその逆のレコードがわかる
課題3: データの不整合
WITH
in_td AS (
SELECT * FROM td
EXCEPT DISTINCT
SELECT * FROM bq
),
in_bq AS (
SELECT * FROM bq
EXCEPT DISTINCT
SELECT * from td
)
SELECT *, 'td' AS exist_in FROM in_td
UNION ALL
SELECT *, 'bq' AS exist_in FROM in_bq