Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
Intro a Google Refine
dcabo
May 25, 2013
0
600
Intro a Google Refine
dcabo
May 25, 2013
Tweet
Share
More Decks by dcabo
See All by dcabo
Open Data y Transparencia
dcabo
0
45
Mejorando el periodismo con Ruby
dcabo
0
520
Reutilización de datos y transparencia
dcabo
3
180
Preparando datos para su análisis
dcabo
0
250
Beyond FOIA (FOIA and Technology)
dcabo
1
64
Open Data y Transparencia
dcabo
0
130
¿Dónde van mis impuestos?
dcabo
3
85
Casos prácticos de la reutilización de datos públicos
dcabo
2
110
Against the Spanish odds (the techie side)
dcabo
3
140
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
324
54k
The Straight Up "How To Draw Better" Workshop
denniskardys
225
120k
Art, The Web, and Tiny UX
lynnandtonic
280
17k
Making the Leap to Tech Lead
cromwellryan
113
6.9k
How to name files
jennybc
39
59k
A Philosophy of Restraint
colly
192
14k
The Art of Programming - Codeland 2020
erikaheidi
32
5.8k
How To Stay Up To Date on Web Technology
chriscoyier
780
250k
VelocityConf: Rendering Performance Case Studies
addyosmani
316
22k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
100
5.9k
Music & Morning Musume
bryan
35
4.1k
The Language of Interfaces
destraynor
148
20k
Transcript
Limpiando datos con Google Refine David Cabo (@dcabo) david.cabo@gmail.com
Limpiando datos • Refine: Herramienta de exploración y limpieza de
datos • Proceso • 1. Obtener los datos • 2. Limpiarlos con Refine • 3. Analizarlos: Excel, Open Office, R...
¿Qué puede hacer? • Filtrar y agrupar datos por distintos
criterios • Aplicar transformaciones a los datos • Unir/partir columnas • Verificar con bases de datos externas:FreeBase, Open Corporates... • Clustering: limpieza basada en similitudes: corrección de erratas • ...