Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Ciencia de los Datos aplicada a políticas públicas

Ciencia de los Datos aplicada a políticas públicas

Jorge Saldivar

September 20, 2018
Tweet

More Decks by Jorge Saldivar

Other Decks in Technology

Transcript

  1. Ciencia de los datos aplicada a políticas públicas Ing. Jorge

    Saldivar Galli, Ph.D. Departamento de Electrónica e Informática Universidad Católica Nuestra Señora de la Asunción
  2. Ciencia de los Datos Matemática y Estadística Informática Aprendizaje Máquina

    Conocimiento del dominio/negocio Desarrollo de Software Investigación Tradicional Data Science Aplicaciones - Comercial (propaganda) - Entretenimiento (juegos, recomendación películas) - Industrial (logística) - Financiero (detección de fraudes) Políticas públicas, toma de decisiones??
  3. Mejorando la seguridad en lugares de trabajo por medio de

    inspecciones proactivas Ancil Crayton Fellow Sonia Mendizábal Fellow Emma Remy Fellow Surabhi Trivedi Fellow Joe Walsh Technical Mentor Mirian Lima Project Manager
  4. Mayoría de las inspecciones son reactivas Denuncia Ministerio del Trabajo

    Instalación inspeccionada Violación encontrada Violación de seguridad
  5. La propuesta es pasar de un efoque reactivo a uno

    proactivo Ministerio del Trabajo Identificar instalaciones donde podrían ocurrir violaciones de seguridad Instalación inspeccionada Violación prevenida
  6. dssg.uchicago.edu @datascifellows Data Science for Social Good 2018 Fuentes de

    datos 1.4 M inspeciones 2006-2016 (instalaciones) Taxes 2006-16 (600k empresas) Precio Comodities 2006-2016 OECD Estadísticas 2006-2016 Internas Externas
  7. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows Fuentes de

    datos Proceso Lista priorizada de instalaciones a inspeccionar Modelos de Machine Learning
  8. Llegar a 2 veces + instalaciones Llegar a 840K más

    instalaciones con potenciales violaciones de seguridad Se inspeccionan solo 450K instalaciones al año Alrededor de 4.5M instalaciones quedan sin inspección
  9. 2.000 instalaciones x mes 500 inspectores 36% violaciones encontradas Enfoque

    reactivo Enfoque proactivo 2.000 instalaciones x mes 500 inspectores 65% violaciones encontradas
  10. Detección temprana de diabetes para mejorar la salud pública Benjamin

    Ackerman Kaleigh Clary Jorge Saldivar William Wang Katy Dupre Adolfo De Unánue Rayid Ghani
  11. Guías de chequeo para la diabete 40-70 años de edad

    Índice de masa corporal ≥ 25 ✓ ✓
  12. Externo American Community Survey (ACS) Fuentes de Datos Demográficos Consultas

    Medicaciones Análisis Diagnósticos RES anónimos •  1.1 millón de pacientes •  24 centros de salud •  ~ 8 millones de consultas
  13. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows Datos Modelos

    de Machine Learning Riesgos de desarrollar diabetes en los próximos 3 años Consulta
  14. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows ¿Qué tan

    bien funcionan las guías de chequeo? 53% Porcentaje de visitas con chequeo Porcentaje de casos detectados
  15. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows ¿Qué tan

    bien funciona nuestro enfoque? 63% Porcentaje de visitas con chequeo Porcentaje de casos detectados
  16. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows 63% 53%

    15 ¿Qué tan bien funciona nuestro enfoque? Porcentaje de visitas con chequeo Porcentaje de casos detectados
  17. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows 63% 53%

    74% 15 25 ¿Qué tan bien funciona nuestro enfoque? Porcentaje de casos detectados Porcentaje de visitas con chequeo
  18. Conclusiones Generales •  Con pocos datos se puede tener un

    gran impacto •  Cambiar paradigmas: ◦  Detección temprana --> enfoque reactivo a proactivo --> prevención ◦  Optimización de recursos •  Implicancias éticas de la solución (imparcialidad, equidad)
  19. Reducir la descerción escolar por medio de identificación temprana Yago

    del Valle-Inclán Redondo Dhany Tjiptarto Ana Valdivia Adolfo De Unanue Mirian Lima
  20. Data Science for Social Good 2018 dssg.uchicago.edu @datascifellows Fuentes de

    datos Característica 2 Característica 1 Característica 3 Característica 4 Característica n..