ETL = embulk + cloudsdk ● DB/File→GCS へのInput 処理はembulk を採用 ○ 多種多様なデータソースに対応するinput プラグイン ○ Filter やgsub でクレンジング処理 / 型変換を記述 ● GCS → BigQuery にはcloudsdk(bq load) を採用 ○ 扱いが簡単、ハマりにくい Service B BigQuery Cloud Storage csv filter/gsub Service A BigQuery Service C BigQuery bq load bq query 型変換とクレンジング処 理が統一される Service A Service B Service C