que armazena dados em qualquer escala; • Dados brutos, em formato nativo, em uma visão não refinada dos dados; • Dados refinados, agrupados (parquet, avro) e processados. • Dados estruturados, semi-estruturados (JSON, CSV), não-estruturados (vídeos, áudio)
em formatos serializados (parquet, avro); • ELT em vez de ETL; • Consultas federadas entre GCS e BQ para carregar e transformar os dados em um único passo; • Use particionamento e clusterização; • Crie passos intermediários (raw, stage) antes de entregar os dados;