Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Intro a Google Refine
Search
dcabo
May 25, 2013
0
630
Intro a Google Refine
dcabo
May 25, 2013
Tweet
Share
More Decks by dcabo
See All by dcabo
Open Data y Transparencia
dcabo
0
55
Mejorando el periodismo con Ruby
dcabo
0
570
Reutilización de datos y transparencia
dcabo
3
270
Preparando datos para su análisis
dcabo
0
380
Beyond FOIA (FOIA and Technology)
dcabo
1
72
Open Data y Transparencia
dcabo
0
170
¿Dónde van mis impuestos?
dcabo
3
120
Casos prácticos de la reutilización de datos públicos
dcabo
2
120
Against the Spanish odds (the techie side)
dcabo
3
190
Featured
See All Featured
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
20
1.8k
The Language of Interfaces
destraynor
151
23k
A better future with KSS
kneath
231
16k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
How to name files
jennybc
65
93k
Bash Introduction
62gerente
605
210k
Side Projects
sachag
451
41k
Fantastic passwords and where to find them - at NoRuKo
philnash
39
2.5k
Designing Experiences People Love
moore
136
23k
How To Stay Up To Date on Web Technology
chriscoyier
782
250k
GraphQLとの向き合い方2022年版
quramy
33
12k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
188
16k
Transcript
Limpiando datos con Google Refine David Cabo (@dcabo)
[email protected]
Limpiando datos • Refine: Herramienta de exploración y limpieza de
datos • Proceso • 1. Obtener los datos • 2. Limpiarlos con Refine • 3. Analizarlos: Excel, Open Office, R...
¿Qué puede hacer? • Filtrar y agrupar datos por distintos
criterios • Aplicar transformaciones a los datos • Unir/partir columnas • Verificar con bases de datos externas:FreeBase, Open Corporates... • Clustering: limpieza basada en similitudes: corrección de erratas • ...