Slide 14
Slide 14 text
14
🔥 ETLのT処理のツール依存性、肥大化、不透明性
● troccoなどのembulk以外のデータパイプライン
の導入によりT処理がembulkに依存している
● embulkのコードを読まないと T処理の内容が
把握できず、分析者からすると不透明な処理
である
● データウェアハウスなどを作り込む際に複雑な
加工をする必要がある
dbt Cloudの導入
💡 dbt Cloudの導入によるELTパイプラインの構築
● dbt Cloudを用いてembulkで行っていたT処理
を代替
● データパイプラインに用いているツールに依存
せずに、BigQueryに収集したデータに対して
様々な加工が可能に
● 加工を一箇所に集めることで、分析者に加工
情報を適切に伝えられるように期待
マスキングなどの加工処理
❌