Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Introdução a Análise de Dados Usando Python

Introdução a Análise de Dados Usando Python

Palestra ministrada no Salesiano do dia 02/07/2018

João Maia

July 03, 2018
Tweet

More Decks by João Maia

Other Decks in Technology

Transcript

  1. Agenda • Introdução ao Python • Ferramentas de trabalho •

    Raspagem de dados ◦ ETL ◦ Bancos de dados SQL e NoSQL ◦ Redes sociais ◦ Crawlers • Visualização de dados • Análise de dados • Considerações finais
  2. Introdução ao Python Características gerais: • Linguagem multi paradigma (orientada

    a objeto, funcional, …) • Trabalha na forma de módulos • Tem o conceito de classes e exceptions • Tipagem dinâmica (type hints) • Portável (ARM, Windows, …) • Extensível (C, C++, Rust, …) • Simples
  3. Introdução ao Python Quem usa? • Google • Facebook •

    Netflix • Wine.com.br • Globo.com • B2W • … Mais empresas no Brasil: https://python.org.br/empresas/
  4. Introdução ao Python Recomendação de leitura e cursos: • Python

    Fluente por Luciano Ramalho http://a.co/5zNavU2 • Learn Python The Hard Way por Zed A. Shaw https://learnpythonthehardway.org/ • Python - Escreva seus primeiros programas por Felipe Cruz https://www.casadocodigo.com.br/products/livro-python-3 • Learn Python da Code Academy https://www.codecademy.com/learn/learn-python • Introdução à Ciência da Computação com Python Parte 1 https://pt.coursera.org/learn/ciencia-computacao-python-conceitos • Introdução à Ciência da Computação com Python Parte 2 https://pt.coursera.org/learn/ciencia-computacao-python-conceitos-2
  5. Visualização de dados Lista de boas práticas: • Saiba as

    perguntas que procura a resposta • Use os dados corretos • Conheça sua audiência • Tenha uma metodologia • Use visualizações simples • Crie engajamento com a audiência • Empodere sua audiência • Visualizações interativas
  6. Visualização de dados Livros: • Good Charts: The HBR Guide

    to Making Smarter, More Persuasive Data Visualizations por Scott Berinato • IPython Interactive Computing and Visualization Cookbook por Dr Cyrille Rossant e Cyrille Rossant • Python Data Visualization Cookbook por Igor Milovanovic • Storytelling with Data: A Data Visualization Guide for Business Professionals por Cole Nussbaumer Knaflic • Data Visualization with JavaScript por Stephen Thomas
  7. Análise de dados Médias: • Aritmética: somatória dos dados do

    espaço amostral dividido pelo tamanho do espaço amostral • Mediana: o ponto que divide o espaço amostral ao meio • Moda: o ponto que ocorre com mais frequência no espaço amostral
  8. Considerações finais Comunidades: • Dev-ES: http://devescom.herokuapp.com/ • Vix Data: https://www.meetup.com/Vix-Data-Meetup/

    • Data Hackers: http://invite.datahackers.com.br/ • Training Center: https://trainingcenter.io/ • AI Brasil: https://medium.com/brasil-ai
  9. Considerações finais Cursos online: • Udacity: https://br.udacity.com/ • DataCamp: https://www.datacamp.com/

    • Udemy: https://www.udemy.com/ • Data Science Academy: https://www.datascienceacademy.com.br/ • Coursera: https://www.coursera.org/
  10. Considerações finais Livros: • Data Science from Scratch por Joel

    Grus (O'Reilly Media) • The Elements of Statistical Learning por Hastie, Tibshirani and Friedman (Springer) • Machine Learning in Action por Peter Harrington (Manning) • How to Lie with Statistics por Darrell Huff, D. Huff e Irving Geis • Lean Analytics: Use Data to Build a Better Startup Faster por Alistair Croll e Benjamin Yoskovitz • Dados Demais!: Como Desenvolver Habilidades Analíticas para Resolver Problemas Complexos, Reduzir Riscos e Decidir Melhor por Thomas Davenport e Jo Ho-Kim • Estatística: O que é, para que serve, como funciona por Charles Wheelan • Moneyball: O homem que mudou o jogo por Michael Lewis