Upgrade to Pro — share decks privately, control downloads, hide ads and more …

08 Tus Resultados

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for xihh87 xihh87
June 29, 2020
59

08 Tus Resultados

Octavo módulo de la primera edición del curso «Bioinformática Aplicada a Tu Proyecto».

Avatar for xihh87

xihh87

June 29, 2020
Tweet

Transcript

  1. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. 3
  2. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. 4
  3. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. • Explorar datos y presentarlos es diferente. 4
  4. Hacemos gráficos para presentar los resultados porque una gran proporción

    de nuestro cerebro procesa estímulos visuales. • Por eso es mejor gráfica que tabla. • Explorar datos y presentarlos es diferente. • Mostrar los resultados de manera evidente (Fry 2008). 4
  5. El alumno que tenía resultados y gráficos pero no sabía

    interpretarlos. Figure 1: Un ejemplo de cómo podría fallar un algoritmo (Raykov et al. 2016). 5
  6. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. 6
  7. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). 6
  8. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. 6
  9. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. 6
  10. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. • Representar las conclusiones. 6
  11. Proceso para filtrar visualizar datos (Fry 2008): • Identificar la

    pregunta. • Adquirir los datos necesarios. • Limpiar datos: variables en columnas, registros en filas (Wickam 2014). • Seleccionar la información relevante para contestar la pregunta. • Analizar ese conjunto de datos para contestar la pregunta. • Representar las conclusiones. • Refinar detalles. 6
  12. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. 8
  13. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. • Datos completos (sin N/A). 8
  14. En el análisis descriptivo queremos verificar los datos y buscar

    correlaciones. • Buscar correlaciones. • Datos completos (sin N/A). • Algunos modelos requieren reescalar. 8
  15. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib 10
  16. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 10
  17. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 • Plot.ly 10
  18. En caso contrario hay varias bibliotecas que se pueden usar

    para graficar datos. • matplotlib • ggplot2 • Plot.ly • D3.js 10
  19. Verificar que el experimento capture las características biológica de interés

    (Tarazona et al. 2015). Figure 2: La captura entre tratamientos debe ser similar. 14
  20. Verificar que el experimento capture las características biológica de interés

    (Tarazona et al. 2015). Figure 3: Cada muestra debe tener las características de interés. 15
  21. Capturar características al menor costo posible (Tarazona et al. 2015).

    Figure 4: Diseñar bien el experimento permite optimizar los recursos. 16
  22. Corregir efecto por tamaño de transcritos (Dillies et al. 2012)

    Figure 5: Diferencias en captura por tamaño de transcrito. 19
  23. Corregir efecto por tamaño de transcritos (Dillies et al. 2012)

    Figure 6: Efecto de tamaño de transcrito normalizado. 20
  24. 24

  25. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. 25
  26. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. • Variables correlacionadas. 25
  27. Los PCA agrupan las variables que están correlacionadas en un

    autovector (“Principal Component Analysis Essentials” n.d.). • Es preferible reescalar. • Variables correlacionadas. • Las variables que correlacionan pueden agrupar las muestras. 25
  28. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. 26
  29. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. • Verificar el número de grupos. 26
  30. Los k-means separan en k-grupos incluso si no tienes un

    sólo grupo. • La elección de puntos iniciales importa. • Verificar el número de grupos. • Mismos individuos por grupo. 26
  31. El material de este módulo está basado en: Dillies, M.-A.,

    A. Rau, J. Aubert, C. Hennequet-Antier, M. Jeanmougin, N. Servant, C. Keime, et al. 2012. “A Comprehensive Evaluation of Normalization Methods for Illumina High-Throughput RNA Sequencing Data Analysis.” Briefings in Bioinformatics 14 (6): 671–83. https://doi.org/10.1093/bib/bbs046. Fry, Ben. 2008. Visualizing Data. Sebastopol, CA: O’Reilly Media, Inc. “Principal Component Analysis Essentials.” n.d. Accessed June 29, 2020. http://www.sthda.com/english/articles/31-principal-component-methods- in-r-practical-guide/112-pca-principal-component-analysis-essentials/. Raykov, Yordan P., Alexis Boukouvalas, Fahd Baig, and Max A. Little. 2016. “What to Do When K-Means Clustering Fails: A Simple yet Principled Alternative Algorithm.” PLOS ONE 11 (9): e0162259. https://doi.org/10.1371/journal.pone.0162259. 27