Slide 1

Slide 1 text

Airflow Data Workflow Management

Slide 2

Slide 2 text

O que é? Execução de workflow de dados Escritos em Python Forma de DAGs Criado pelo Airbnb Open Source (Apache License) Desenvolvido em Python Flask, SQLAlchemy, Jinja, etc Alternativa ao Luigi do Spotify

Slide 3

Slide 3 text

DAG Directed Acyclic Graphs Rede de jobs Possui agendamento próprio Código enxuto e fácil de entender quando criado

Slide 4

Slide 4 text

DAG Airflow - Backfill

Slide 5

Slide 5 text

DAG Airflow - Visualização de Grafos

Slide 6

Slide 6 text

DAG Airflow - Detalhes

Slide 7

Slide 7 text

Alguns processos feitos com Airflow Data warehousing: cleanse, organize, data quality check Growth analytics Experimentation: compute our A/B testing Email targeting Sessionization: compute clickstream Search: compute search ranking related metrics Data infrastructure maintenance: database scrapes, folder cleanup, applying data retention policies, … feitos pelo Airbnb

Slide 8

Slide 8 text

meucandidato.me

Slide 9

Slide 9 text

Blog: Telegram: Meetup: df.python.org.br @grupydf meetup.com/pt-BR/pythondf

Slide 10

Slide 10 text

Email: [email protected] Blog: Telegram/Github: @gilsondev Twitter: gilsondev.in @gilsonfilho Em que posso ajudar?