Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Iluminando o mar de dados: uma introdução a Pyt...
Search
Caaddss
November 10, 2018
Technology
0
85
Iluminando o mar de dados: uma introdução a Python para análise de dados
Workshop apresentado no Coda.BR - Conferência Brasileira de Jornalismo de dados
Caaddss
November 10, 2018
Tweet
Share
More Decks by Caaddss
See All by Caaddss
Data Science e Saúde
caaddss
1
74
PGConf.Brasil - 2019
caaddss
0
98
Machine Learning e as Tecnologias da Google
caaddss
0
61
Python Brasil - Como foi apresentar no maior evento de Python do país
caaddss
0
34
Go - Iniciando a jornada pelas trilhas do Google
caaddss
1
74
Mulher Negra e a Tecnologia da Informação
caaddss
0
80
Utilizando Python como ferramenta de ensino de pensamento computacional
caaddss
0
100
Other Decks in Technology
See All in Technology
なぜAI時代に 「イベント」を中心に考えるのか? / Why focus on "events" in the age of AI?
ytake
2
770
Wasmで社内ツールを作って配布しよう
askua
0
150
ファインディにおける Dataform ブランチ戦略
hiracky16
0
200
Tiptapで実現する堅牢で柔軟なエディター開発
kirik
1
140
AI エンジニアの立場からみた、AI コーディング時代の開発の品質向上の取り組みと妄想
soh9834
8
550
新規事業におけるAIリサーチの活用例
ranxxx
0
170
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
530
(HackFes)米国国防総省のDevSecOpsライフサイクルをAWSのセキュリティサービスとOSSで実現
syoshie
5
670
分散トレーシングによる コネクティッドカーのデータ処理見える化の試み
thatsdone
0
260
[TechNight #91] Oracle Database 最新パフォーマンス分析手法
oracle4engineer
PRO
2
110
AWS表彰プログラムとキャリアについて
naoki_0531
1
140
【CEDEC2025】現場を理解して実現!ゲーム開発を効率化するWebサービスの開発と、利用促進のための継続的な改善
cygames
PRO
0
210
Featured
See All Featured
Designing for Performance
lara
610
69k
A better future with KSS
kneath
238
17k
Git: the NoSQL Database
bkeepers
PRO
431
65k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
110
19k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Building Applications with DynamoDB
mza
95
6.5k
Building an army of robots
kneath
306
45k
Music & Morning Musume
bryan
46
6.7k
Producing Creativity
orderedlist
PRO
346
40k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
60k
Statistics for Hackers
jakevdp
799
220k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
Transcript
Iluminando o mar de dados Uma introdução a Python para
análise de dados por Caroline Dantas
Olá
DAtaset
Conjunto de dados tabulados Para cada ID temos diversas características
Python
Open Source Intuitiva Tempo de desenvolvimento + curto Alto nível
Variáveis Posição da memória RAM que pode ser associado a
uma informação. No momento da execução é criado, logo anteriormente a execução não existia. Temos algumas regras para atribuição.
Sintaxes e tipos ▪ Nome da variável = valor da
variável ▪ ❖ Int A = 2 ❖ Float B = 2.3 ❖ Complex C = 3+4j ❖ String Nome = “Caroline” ❖ Bool Chuva = False Frio = True
Operadores Básicos adição subtração divisão multiplicação potenciação resto de um
divisão + - / * ** %
Operações lógicas idêntico diferente maior que menor que maior igual
menor igual == != > < >= <=
e ou não and or not
funções ▪ Servem para repetir um procedimento diversas vezes, são
sub-rotinas ▪ Evita-se ter que reescrever o mesmo código diversas vezes bloco de código a ser executado
sintaxe def <nomedafunção>(parâmetros): bloco de código a ser executado Obs1:
se não houver parâmetros, deixa o () vazio Obs2: se a função tiver que retornar um valor, usa-se o return()
as ferramentas
INstalação https://www.anaconda.com/ Tem todos os pacotes Melhor forma de fazer
o controle de versão das bibliotecas
Jupyter
Para saber mais http://jupyter.org/ Versão online Documentação
pandas
Para saber mais https://pandas.pydata.org/ Documentação Tutorial
Matplotlib
Para saber mais https://matplotlib.org/ Documentação Exemplos Tutoriais
Overview
repositório de dados- tse
Candidatos
Ano de interesse
dados e Metadados Pasta zipada → dados por estado(geralmente) Informações
importantes sobre o dataset → Leiame.pdf Importante sempre ler esse arquivo
Colunas
Gráficos
análise Descritiva
Obrigada pela atenção carolinedantas.com/ @_caaddss