Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Manipulação e Tratamento de Dados com Pandas

Manipulação e Tratamento de Dados com Pandas

Apresentação realizada no Python Day 2019 FSA em 30/03, sobre a utilização da biblioteca Pandas, com base em exemplos práticos sobre dados reais da ANAC, Prouni e DF.

Link do código e visualização constam no slide.

Avatar for Eduardo Daltro

Eduardo Daltro

March 30, 2019
Tweet

More Decks by Eduardo Daltro

Other Decks in Technology

Transcript

  1. hello.py 1. import json 2. 3. x = { 4.

    "name": "eduardo daltro", 5. "instagram": "@daltroedu", 6. "skill": "data analysis", 7. "job": "gerenciagram" 8. } 9. 10. y = json.dumps(x) 11. 12. print(y)
  2. Sobre o Pandas Finalidade: coleta, preparação, análise e modelagem de

    dados; Benefícios: desempenho, produtividade e capacidade de colaboração; Plataforma: Jupyter Notebook; Leitura/gravação: CSV, TXT, Excel, SQL e HDF5; Ferramentas relacionadas: SciPy, NumPy, StatsModels, scikit-learn, matplotlib; Onde aprender: Pandas, TutorialsPoint, Python para Análise de Dados.
  3. Estruturas de Dados Series DataFrame Panel Python JavaScript Ruby C++

    Go SO Licença Lançamento Linux GNU GPLv2 17/09/1991 Windows Microsoft EULA 20/11/1985
  4. Overview Instalação: conda install pandas pip install pandas Importação: import

    pandas as pd DataFrame: data = [['João',32],['Marcos',25],['Luiz',34]] df = pd.DataFrame(data,columns=['Nome','Idade']) GitHub: daltroedu > https://github.com/daltroedu/pythonday/tree/master/2019
  5. Case #1: Gastos com Publicidade do DF 2018 > Entrada:

    Fonte: http://dados.gov.br/dataset/gastos-com-publicidade
  6. Case #2: PROUNI - Bolsas Concedidas 2018 > Entrada: Fonte:

    http://dados.gov.br/dataset/mec-prouni
  7. Case #3: ANAC - Voos para SSA 2018 > Entrada:

    Fonte: http://www.anac.gov.br/assuntos/dados-e-estatisticas/historico-de-voos