Upgrade to Pro — share decks privately, control downloads, hide ads and more …

08 Tus Resultados

xihh87
June 29, 2020
52

08 Tus Resultados

Octavo módulo de la primera edición del curso «Bioinformática Aplicada a Tu Proyecto».

xihh87

June 29, 2020
Tweet

Transcript

  1. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. 3
  2. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. 4
  3. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. • Explorar datos y presentarlos es diferente. 4
  4. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. • Explorar datos y presentarlos es diferente. • Mostrar los resultados de manera evidente (Fry 2008). 4
  5. El alumno que tenía resultados y gráficos pero no sabía

    interpretarlos. Figure 1: Un ejemplo de cómo podría fallar un algoritmo (Raykov et al. 2016). 5
  6. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. 6
  7. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). 6
  8. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. 6
  9. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. 6
  10. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. • Representar las conclusiones. 6
  11. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. • Representar las conclusiones. • Refinar detalles. 6
  12. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. 8
  13. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. • Datos completos (sin N/A). 8
  14. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. • Datos completos (sin N/A). • Algunos modelos requieren reescalar. 8
  15. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib 10
  16. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 10
  17. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 • Plot.ly 10
  18. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 • Plot.ly • D3.js 10
  19. Verificar que el experimento capture las características biológica de interés

    (Tarazona et al. 2015). Figure 2: La captura entre tratamientos debe ser similar. 14
  20. Verificar que el experimento capture las características biológica de interés

    (Tarazona et al. 2015). Figure 3: Cada muestra debe tener las características de interés. 15
  21. Capturar características al menor costo posible (Tarazona et al. 2015).

    Figure 4: Diseñar bien el experimento permite optimizar los recursos. 16
  22. Corregir efecto por tamaño de transcritos (Dillies et al. 2012)

    Figure 5: Diferencias en captura por tamaño de transcrito. 19
  23. Corregir efecto por tamaño de transcritos (Dillies et al. 2012)

    Figure 6: Efecto de tamaño de transcrito normalizado. 20
  24. 24

  25. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. 25
  26. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. • Variables correlacionadas. 25
  27. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. • Variables correlacionadas. • Las variables que correlacionan pueden agrupar las muestras. 25
  28. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. 26
  29. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. • Verificar el número de grupos. 26
  30. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. • Verificar el número de grupos. • Mismos individuos por grupo. 26
  31. El material de este módulo está basado en: Dillies, M.-A.,

    A. Rau, J. Aubert, C. Hennequet-Antier, M. Jeanmougin, N. Servant, C. Keime, et al. 2012. “A Comprehensive Evaluation of Normalization Methods for Illumina High-Throughput RNA Sequencing Data Analysis.” Briefings in Bioinformatics 14 (6): 671–83. https://doi.org/10.1093/bib/bbs046. Fry, Ben. 2008. Visualizing Data. Sebastopol, CA: O’Reilly Media, Inc. “Principal Component Analysis Essentials.” n.d. Accessed June 29, 2020. http://www.sthda.com/english/articles/31-principal-component-methods- in-r-practical-guide/112-pca-principal-component-analysis-essentials/. Raykov, Yordan P., Alexis Boukouvalas, Fahd Baig, and Max A. Little. 2016. “What to Do When K-Means Clustering Fails: A Simple yet Principled Alternative Algorithm.” PLOS ONE 11 (9): e0162259. https://doi.org/10.1371/journal.pone.0162259. 27