Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Intro a Google Refine
Search
dcabo
May 25, 2013
0
640
Intro a Google Refine
dcabo
May 25, 2013
Tweet
Share
More Decks by dcabo
See All by dcabo
Open Data y Transparencia
dcabo
0
73
Mejorando el periodismo con Ruby
dcabo
0
590
Reutilización de datos y transparencia
dcabo
3
340
Preparando datos para su análisis
dcabo
0
620
Beyond FOIA (FOIA and Technology)
dcabo
1
88
Open Data y Transparencia
dcabo
0
200
¿Dónde van mis impuestos?
dcabo
3
250
Casos prácticos de la reutilización de datos públicos
dcabo
2
130
Against the Spanish odds (the techie side)
dcabo
3
270
Featured
See All Featured
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
490
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
150
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
170
How to train your dragon (web standard)
notwaldorf
97
6.6k
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Believing is Seeing
oripsolob
1
97
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Tell your own story through comics
letsgokoyo
1
870
30 Presentation Tips
portentint
PRO
1
260
Transcript
Limpiando datos con Google Refine David Cabo (@dcabo)
[email protected]
Limpiando datos • Refine: Herramienta de exploración y limpieza de
datos • Proceso • 1. Obtener los datos • 2. Limpiarlos con Refine • 3. Analizarlos: Excel, Open Office, R...
¿Qué puede hacer? • Filtrar y agrupar datos por distintos
criterios • Aplicar transformaciones a los datos • Unir/partir columnas • Verificar con bases de datos externas:FreeBase, Open Corporates... • Clustering: limpieza basada en similitudes: corrección de erratas • ...