Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Introducción a Ciencia de Datos: Un mundo de oportunidades para talento en computación

Introducción a Ciencia de Datos: Un mundo de oportunidades para talento en computación

Una de las áreas de investigación y aplicación que ha tenido un papel protagónico en la última década para el sector industria y otros campos científicos, es la Ciencia de los Datos. El tema se ha diversificado rápidamente en diferentes campos del saber, que han hecho de la Ciencia de Datos un campo de estudio marcadamente interdisciplinario. En esta charla se hará una introducción a los conceptos base de la disciplina, así como la delimitación de las líneas para diferenciar áreas de desarrollo, investigación y aplicación en la industria. Por ora parte,, se explorarán las oportunidades existentes para el talento en computación y la necesidad que se vive en sectores como la industria, por tener más acceso a este talento mediante una educación orientada a desarrollar competencias en diferentes ámbitos de la Ciencia de Datos.

Frans van Dunné

July 26, 2018
Tweet

More Decks by Frans van Dunné

Other Decks in Technology

Transcript

  1. Presentation Template Subtitle Introducción a Ciencia de Datos Un mundo

    de oportunidades para talento en computación COMPDES 26 de Julio, 2018 Frans van Dunné @fransvandunne
  2. Introducción • Estrategia e innovación basada en datos • Modelado

    de procesos y gestión de datos • Diseño e implementación de algoritmos y dataductos • Interoperabilidad de datos • Arquitecturas de microservicios • Industrias diversas (privado, gobiernos, ONG’s) Frans van Dunné, PhD Chief Data Officer @fransvandunne
  3. Mercado Big Data & Analitica LATAM 2017 USD 2.9 mil

    millones LATAM 2023 USD 8.5 mil millones Mercado Global 2017 : USD 21.2 mil millones Fuente: http://www.nearshoreamericas.com/infographic-latin-america-big-data-and-analytics-market/
  4. Ciencia de datos trae beneficios ... 17 - 49% mayor

    productividad al incrementar la usabilidad de datos en un 10% 11 - 42% mayor retorno sobre los activos (ROA) al incrementar el acceso a datos en un 10% 241% mayor rentabilidad (ROI) al usar big data para incrementar competitividad 1000% mayor rentabilidad (ROI) al desplegar análisis a lo largo de la organización 5-6% mejora de rendimiento para organizaciones con toma de decisiones con base en datos. … para competir a futuro Fuente: The 2015 Field Guide to Data Science
  5. Source: Matt Turck, Jim Hao & First Mark Capital Data

    Science Machine Learning SVM Cross validation Random forest R Studio Linear regression Logistic regression Hadoop Python Neural networks Deep learning K-means Statistical significance Boosting Algorithm xlsx Tableau
  6. Agenda Ciencia de Datos Ingenieros vs Científicos de Datos Big

    Data Aprendizaje Máquina Inteligencia Artificial
  7. Valor Dificultad Retrospección Comprensión Previsión Análisis Descriptivo ¿Qué Paso? Análisis

    Diagnóstico ¿Porqué Paso? Análisis Predictivo ¿Qué Pasará? Análisis Prescriptivo ¿Como lograrlo?
  8. Valor Dificultad Retrospección Análisis Descriptivo ¿Qué Paso? Análisis Diagnóstico ¿Porqué

    Paso? Análisis Predictivo ¿Qué Pasará? Análisis Prescriptivo ¿Como lograrlo? Comprensión Previsión
  9. Valor Dificultad Retrospección Análisis Descriptivo ¿Qué Paso? Análisis Diagnóstico ¿Porqué

    Paso? Análisis Predictivo ¿Qué Pasará? Análisis Prescriptivo ¿Como lograrlo? Comprensión Previsión
  10. Estadisticas Conocim iento del Negocio Ciencia de Com putación Ciencia

    de Datos Aprendizaje Máquina Infraestructura Despliegue Feature Engineering Parametrización Analisis Exploratorio Enriquecimiento de Datos Bases de Datos
  11. Ingeniería de Datos Ciencia de Datos Aprendizaje Máquina Infraestructura Despliegue

    Feature Engineering Parametrización Analisis Exploratorio Enriquecimiento de Datos Bases de Datos
  12. Definiciones Big Data Oracle Conjuntos de datos más grandes y

    más complejos, especialmente provenientes de fuentes nuevas Gartner Activos de información de alto volumen, alta velocidad y alto variedad Microsoft Datos que son valiosos pero, tradicionalmente, no eran práctico de almacenar y analizarlos McKinsey Conjuntos de datos cuyo tamaño va más allá de bases de datos comunes
  13. Fitbit Mobile Phone Data Apple Siri Web Page Clicks Licence

    Plates Images on Social Media Messages on Social Media ATM Transactions Images on Social Media Cellular Phone Towers Purchase History Phone GPS History Google Maps Waze History In Store RFID Tracking In Store Face Recognition Refrigerator Activity Google Nest Amazon Alexa Google Assistant Apple Watch Medical Records Cow Pedometers
  14. DATA Cuando tu proyecto BIG DATA no tiene tanto volumen,

    variedad o velocidad ... … ¿Cómo lo llamas?
  15. Big Data @ RStudio Hablamos de Big Data cuando: 1.

    datos no caben en la RAM del computador 2. el conducto entre la fuente y tu computador no permite una velocidad de transmisión adecuada Fuente: Edgar Ruiz 2018: http://www.datalatam.com/41/
  16. Entorno Modelo Aprendizaje Máquina Proceso de Aprendizaje (reconocer patrones) Modelo

    Entrenado Decición Datos de aprendizaje Ingestion Datos Datos Nuevos Usuarios Experto Proceso
  17. Inteligencia Artificial Entorno Agente (entidad con objetivos) Sensores (datos) Modelos

    (decisiones) Actuadores (acciones) Eventos tipo A Eventos tipo B Impacto tipo X Impacto tipo Y
  18. Inteligencia Artificial Entorno Agente (entidad con objetivos) Sensores (datos) Sensor

    Tipo A Sensor Tipo B Modelos (decisiones) Actuadores (acciones) Eventos tipo A Eventos tipo B Impacto tipo X Impacto tipo Y Modelo Entrenado Modelo Entrenado Acción Tipo X
  19. Inteligencia Artificial Entorno Agente (entidad con objetivos) Sensores (datos) Sensor

    Tipo A Sensor Tipo B Modelos (decisiones) Modelo Entrenado Modelo Entrenado Actuadores (acciones) Acción Tipo X Acción Tipo Y Eventos tipo A Eventos tipo B Impacto tipo X Impacto tipo Y Modelo Entrenado Modelo Entrenado Modelo Entrenado
  20. Inteligencia Artificial Entorno Agente (entidad con objetivos) Sensores (datos) Sensor

    Tipo A Sensor Tipo B Modelos (decisiones) Modelo Entrenado Modelo Entrenado Actuadores (acciones) Acción Tipo X Acción Tipo Y Eventos tipo A Eventos tipo B Impacto tipo X Impacto tipo Y Modelo Entrenado Modelo Entrenado Modelo Entrenado
  21. Entorno Inteligencia Artificial Agente (entidad con objetivos) Sensores (datos) Modelos

    (decisiones) Actuadores (acciones) Eventos Impactos Agente (entidad con objetivos) Sensores (datos) Modelos (decisiones) Actuadores (acciones) Agente (entidad con objetivos) Sensores (datos) Modelos (decisiones) Actuadores (acciones)
  22. Resumen Ciencia de Datos está creciendo en la región: •

    Academia • Industria • Ciencia Ciudadana Ciencia de Datos combina conocimiento de • Estadísticas • Computación • Negocio