Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Intro a Google Refine
Search
dcabo
May 25, 2013
0
630
Intro a Google Refine
dcabo
May 25, 2013
Tweet
Share
More Decks by dcabo
See All by dcabo
Open Data y Transparencia
dcabo
0
69
Mejorando el periodismo con Ruby
dcabo
0
590
Reutilización de datos y transparencia
dcabo
3
330
Preparando datos para su análisis
dcabo
0
530
Beyond FOIA (FOIA and Technology)
dcabo
1
83
Open Data y Transparencia
dcabo
0
190
¿Dónde van mis impuestos?
dcabo
3
220
Casos prácticos de la reutilización de datos públicos
dcabo
2
130
Against the Spanish odds (the techie side)
dcabo
3
250
Featured
See All Featured
Statistics for Hackers
jakevdp
799
220k
Agile that works and the tools we love
rasmusluckow
329
21k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
20
1.3k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
A designer walks into a library…
pauljervisheath
207
24k
Gamification - CAS2011
davidbonilla
81
5.3k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
17
950
Practical Orchestrator
shlominoach
188
11k
Transcript
Limpiando datos con Google Refine David Cabo (@dcabo) david.cabo@gmail.com
Limpiando datos • Refine: Herramienta de exploración y limpieza de
datos • Proceso • 1. Obtener los datos • 2. Limpiarlos con Refine • 3. Analizarlos: Excel, Open Office, R...
¿Qué puede hacer? • Filtrar y agrupar datos por distintos
criterios • Aplicar transformaciones a los datos • Unir/partir columnas • Verificar con bases de datos externas:FreeBase, Open Corporates... • Clustering: limpieza basada en similitudes: corrección de erratas • ...