Mineria de Datos

Mineria de Datos

Universidad de Guadalajara
Seminario internacional para potenciar la generación de conocimiento, 2019

B546a9b97d993392e4b22b74b99b91fe?s=128

Javier Gonzalez

November 13, 2019
Tweet

Transcript

  1. Dr. Javier Gonzalez-Sanchez javiergs@asu.edu www.javiergs.com Minería de Datos: introducción y

    herramientas
  2. Temas Datos Herramientas Minería

  3. Agenda 01 Conceptos 02 04 03 Ejemplo Notas Finales Herramienta:

    Eureqa
  4. Conceptos: Datos + Minería 01 Parte I

  5. Datos Valores para describir un objeto o evento ► hablemos

    de datos cuantitativos
  6. Minería

  7. Minería de Datos Datos Álgebra Lineal Respuestas (conocimiento)

  8. Álgebra Lineal

  9. Álgebra Lineal

  10. Álgebra Lineal

  11. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia?
  12. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia? 1 1 0 0 8 2 7 3 35 25 20 50 10 10 5 7
  13. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia? 1 1 0 0 1 8 2 7 3 4 35 25 20 50 18 10 10 5 7
  14. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia? 1 1 0 0 1 8 2 7 3 4 35 25 20 50 18 10 10 5 7
  15. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia? 1 1 0 0 1 8 2 7 3 4 35 25 20 50 18 10 10 5 7 10
  16. Necesitamos más datos

  17. Ejemplo ¿Calificación de La Charla? Edad ¿Cuántas horas dormiste ayer?

    ¿Tienes novio / novia? 1 1 0 0 1 8 2 7 3 4 35 25 20 50 18 10 10 5 7
  18. ¿Para Qué?

  19. ¿Para Qué? * Cómo influye la estatura del padre sobre

    la estatura del hijo. * Relacionar costumbres (sueño, alimentación, actividad física, etc.) con la probabilidad de adquirir una enfermedad específica. * Aproximar la calificación obtenida en una materia según el número de horas de estudio.
  20. Técnicas

  21. Eureqa by nutonian 02

  22. None
  23. None
  24. None
  25. None
  26. None
  27. Ejemplo Completo 03

  28. ¿Dónde Puedo Conseguir Datos para Jugar? http://lib.stat.cmu.edu/datasets/

  29. Pollution Dataset ¿Cuál es la relación entre contaminación y mortalidad?

  30. Pollution Dataset PREC Lluvia media anual en pulgadas JANT Temperatura

    promedio en Enero JULT Temperatura promedio en Julio OVR % de la población mayor a 65 años POPN Tamaño promedio de familia EDUC Años de escuela completados por los mayores de 22 años HOUS % de viviendas que cuentan con todos los servicios DENS Población por milla cuadrada WRK % con trabajo de oficina POOR % de familias con ingresos < $3000 dólares anuales HC Índice de contaminación por hidrocarburos NOX Índice de contaminación por monóxido de nitrógeno SOA Índice de contaminación por dióxido sulfúrico HUMID Promedio anual de humedad relativa a la 1 pm. MORT Tasa de mortalidad por cada 100,000
  31. None
  32. Pre-procesamiento Normalizar y Remover Valores atípicos

  33. None
  34. None
  35. None
  36. MORT = K + 10.07*HC + 0.000039*HC*PREC3 – 0.21*WRK*HC HC

    Índice de contaminación por hidrocarburos WRK % con trabajo de oficina PREC Lluvia media anual en pulgadas
  37. None
  38. Comentarios Finales 04 .

  39. None
  40. Más Herramientas

  41. Más Herramientas

  42. Más Herramientas Beginning to Weka Step by Step https://code.likeagirl.io/beginning-to-weka-step-by-step-93f6564d9f2

  43. www.javiergs.com javiergs@asu.edu ¡Gracias!