Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PyLadiesMadrid: Py-Píldoras para tratar tu Open Data

PyLadiesMadrid: Py-Píldoras para tratar tu Open Data

El Open Data comprende tantas fuentes, formatos y contenidos que, en ocasiones, encontrar la forma de tratarlo puede ser complicado. Python ofrece miles de posibilidades que pueden hacerte la vida mucho más fácil. En esta charla te enseñaremos algunos ejemplos en los que puedes usar Python para que tratar datos abiertos nunca más sea un dolor.

Alicia Pérez Jiménez

June 06, 2018
Tweet

More Decks by Alicia Pérez Jiménez

Other Decks in Technology

Transcript

  1. 13 Algunos geocoders del mercado Open Source (basados en OSM)

    ▸ Nominatim ▸ Imposm De pago o con cuotas ▸ Google Maps ▸ Esri ▸ Bing Maps ▸ Carto ▸ Yahoo ▸ ...
  2. 15 ¿Por qué es complejo? Esquinas ▸ FUENCARRAL-PALMA ▸ J.M.EMPECINADO-RAMIREZ

    PRADO Abreviaturas ▸ PZ STO DOMINGO 7 ▸ CL GUSTAVO FDZ BALBUENA 27
  3. 16 ¿Por qué es complejo? Esquinas ▸ FUENCARRAL-PALMA ▸ J.M.EMPECINADO-RAMIREZ

    PRADO Abreviaturas ▸ PZ STO DOMINGO 7 ▸ CL GUSTAVO FDZ BALBUENA 27 Carreteras y puntos kilométricos ▸ M-30 NC K 14,200 CR3 ▸ AUTOV M-30 EX 12100
  4. 17 ¿Por qué es complejo? Esquinas ▸ FUENCARRAL-PALMA ▸ J.M.EMPECINADO-RAMIREZ

    PRADO Abreviaturas ▸ PZ STO DOMINGO 7 ▸ CL GUSTAVO FDZ BALBUENA 27 Carreteras y puntos kilométricos ▸ M-30 NC K 14,200 CR3 ▸ AUTOV M-30 EX 12100 ¿? ▸ PO DIRECCION 283
  5. 18 Múltiples resultados Ejemplo: CL JUAN BRAVO 23 [{ [...]

    'formatted_address': 'Calle Juan Bravo, 23, 40001 Segovia, Spain', 'geometry': {'location': {'lat': 40.9483001, 'lng': -4.1212002}}, [...] { [...] 'formatted_address': 'Calle Juan Bravo, 23, 13500 Puertollano, Cdad. Real, Spain', 'geometry': {'location': {'lat': 38.6844721, 'lng': -4.1067683}} [...] { [...] 'formatted_address': 'Calle Juan Bravo, 23, 28934 Móstoles, Madrid, Spain', 'geometry': {'location': {'lat': 40.321078, 'lng': -3.871188}} [...] ]
  6. 33 Imputación de valores nulos ¿Qué es? Sustitución de valores

    missing (no informados) por otros que estimamos (no reales). Hay muchas posibilidades, pero ninguna es la receta definitiva. Dependerá del caso.
  7. 34 Ejemplo Contaminación en Madrid Datos en el Portal de

    Datos Abiertos de Madrid. Precisión: 98%, pero a veces las máquinas fallan. Solución: Imputar datos faltantes