Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Intro a Google Refine
Search
dcabo
May 25, 2013
0
640
Intro a Google Refine
dcabo
May 25, 2013
Tweet
Share
More Decks by dcabo
See All by dcabo
Open Data y Transparencia
dcabo
0
69
Mejorando el periodismo con Ruby
dcabo
0
590
Reutilización de datos y transparencia
dcabo
3
340
Preparando datos para su análisis
dcabo
0
550
Beyond FOIA (FOIA and Technology)
dcabo
1
84
Open Data y Transparencia
dcabo
0
190
¿Dónde van mis impuestos?
dcabo
3
230
Casos prácticos de la reutilización de datos públicos
dcabo
2
130
Against the Spanish odds (the techie side)
dcabo
3
260
Featured
See All Featured
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
116
20k
How to Ace a Technical Interview
jacobian
280
24k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Stop Working from a Prison Cell
hatefulcrawdad
272
21k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Documentation Writing (for coders)
carmenintech
75
5.1k
How to train your dragon (web standard)
notwaldorf
97
6.3k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
Navigating Team Friction
lara
190
15k
Transcript
Limpiando datos con Google Refine David Cabo (@dcabo)
[email protected]
Limpiando datos • Refine: Herramienta de exploración y limpieza de
datos • Proceso • 1. Obtener los datos • 2. Limpiarlos con Refine • 3. Analizarlos: Excel, Open Office, R...
¿Qué puede hacer? • Filtrar y agrupar datos por distintos
criterios • Aplicar transformaciones a los datos • Unir/partir columnas • Verificar con bases de datos externas:FreeBase, Open Corporates... • Clustering: limpieza basada en similitudes: corrección de erratas • ...