Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Iluminando o mar de dados: uma introdução a Pyt...
Search
Caaddss
November 10, 2018
Technology
0
76
Iluminando o mar de dados: uma introdução a Python para análise de dados
Workshop apresentado no Coda.BR - Conferência Brasileira de Jornalismo de dados
Caaddss
November 10, 2018
Tweet
Share
More Decks by Caaddss
See All by Caaddss
Data Science e Saúde
caaddss
1
65
PGConf.Brasil - 2019
caaddss
0
76
Machine Learning e as Tecnologias da Google
caaddss
0
57
Python Brasil - Como foi apresentar no maior evento de Python do país
caaddss
0
31
Go - Iniciando a jornada pelas trilhas do Google
caaddss
1
70
Mulher Negra e a Tecnologia da Informação
caaddss
0
72
Utilizando Python como ferramenta de ensino de pensamento computacional
caaddss
0
97
Other Decks in Technology
See All in Technology
All you need to know about InnoDB Primary Keys
lefred
0
120
偶然 × 行動で人生の可能性を広げよう / Serendipity × Action: Discover Your Possibilities
ar_tama
1
740
データの品質が低いと何が困るのか
kzykmyzw
6
1k
Bounded Context: Problem or Solution?
ewolff
1
210
WAF に頼りすぎない AWS WAF 運用術 meguro sec #1
izzii
0
460
生成AIの利活用を加速させるための取り組み「prAIrie-dog」/ Shibuya_AI_1
visional_engineering_and_design
1
140
20250208_OpenAIDeepResearchがやばいという話
doradora09
PRO
0
170
テストアーキテクチャ設計で実現する高品質で高スピードな開発の実践 / Test Architecture Design in Practice
ropqa
3
710
モノレポ開発のエラー、誰が見る?Datadog で実現する適切なトリアージとエスカレーション
biwashi
6
770
『AWS Distinguished Engineerに学ぶ リトライの技術』 #ARC403/Marc Brooker on Try again: The tools and techniques behind resilient systems
quiver
0
130
Datadog APM におけるトレース収集の流れ及び Retention Filters のはなし / datadog-apm-trace-retention-filters
k6s4i53rx
0
320
君も受託系GISエンジニアにならないか
sudataka
1
370
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Practical Orchestrator
shlominoach
186
10k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
20
2.4k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.4k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
240
Adopting Sorbet at Scale
ufuk
74
9.2k
The Cost Of JavaScript in 2023
addyosmani
47
7.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
Into the Great Unknown - MozCon
thekraken
35
1.6k
Code Reviewing Like a Champion
maltzj
521
39k
Transcript
Iluminando o mar de dados Uma introdução a Python para
análise de dados por Caroline Dantas
Olá
DAtaset
Conjunto de dados tabulados Para cada ID temos diversas características
Python
Open Source Intuitiva Tempo de desenvolvimento + curto Alto nível
Variáveis Posição da memória RAM que pode ser associado a
uma informação. No momento da execução é criado, logo anteriormente a execução não existia. Temos algumas regras para atribuição.
Sintaxes e tipos ▪ Nome da variável = valor da
variável ▪ ❖ Int A = 2 ❖ Float B = 2.3 ❖ Complex C = 3+4j ❖ String Nome = “Caroline” ❖ Bool Chuva = False Frio = True
Operadores Básicos adição subtração divisão multiplicação potenciação resto de um
divisão + - / * ** %
Operações lógicas idêntico diferente maior que menor que maior igual
menor igual == != > < >= <=
e ou não and or not
funções ▪ Servem para repetir um procedimento diversas vezes, são
sub-rotinas ▪ Evita-se ter que reescrever o mesmo código diversas vezes bloco de código a ser executado
sintaxe def <nomedafunção>(parâmetros): bloco de código a ser executado Obs1:
se não houver parâmetros, deixa o () vazio Obs2: se a função tiver que retornar um valor, usa-se o return()
as ferramentas
INstalação https://www.anaconda.com/ Tem todos os pacotes Melhor forma de fazer
o controle de versão das bibliotecas
Jupyter
Para saber mais http://jupyter.org/ Versão online Documentação
pandas
Para saber mais https://pandas.pydata.org/ Documentação Tutorial
Matplotlib
Para saber mais https://matplotlib.org/ Documentação Exemplos Tutoriais
Overview
repositório de dados- tse
Candidatos
Ano de interesse
dados e Metadados Pasta zipada → dados por estado(geralmente) Informações
importantes sobre o dataset → Leiame.pdf Importante sempre ler esse arquivo
Colunas
Gráficos
análise Descritiva
Obrigada pela atenção carolinedantas.com/ @_caaddss