Slide 6
Slide 6 text
05. STORAGE
● S3 como source of truth.
● Parquet como formato de datos.
○ Formato columnar. Ideal para cargas analiticas.
○ Soportado por Hadoop, Spark, Redshift Spectrum y Athena.
● Snappy como formato de compresion
○ Parquet/Snappy: 200 GB -> 5GB.
● Lifecycle:
○ 90 dias -> S3-IA
○ 1 año -> Glacier
● Datos particionados por dia.