Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tu Experimento

xihh87
May 11, 2020
69

Tu Experimento

Segundo módulo de la primera edición del curso «Bioinformática Aplicada a Tu Proyecto».

xihh87

May 11, 2020
Tweet

Transcript

  1. Esa evaluación te ofrece mejores posibilidades de responder tu pregunta.

    Figure 1: ¿Quieres que tu investigación sea únicamente descriptiva? 4
  2. Quieres hacer un análisis de tu experimento, no una autopsia.

    Figure 2: Aquí yace un experimento con poco poder estadístico. 5
  3. La capacidad de tu experimento para obtener resultados verdaderos se

    llama poder estadístico (Herzog 2019). Figure 3: Representación gráfica del poder estadístico (Howell 2013) 6
  4. Cuando la diferencia entre los grupos aumenta el poder estadístico

    tam- bién. Figure 4: La diferencia entre grupos se llama «tamaño de efecto» (Howell 2013) 7
  5. Disminuir la variabilidad de las mediciones con el diseño experimental

    au- menta el poder estadístico. Figure 5: Disminuir la variabilidad aumenta la discriminabilidad (Howell 2013) 8
  6. Aumentar el tamaño de muestra disminuye la variabilidad de las

    mediciones y por eso aumenta el poder estadístico. Figure 6: Con más datos la medida de la muestra se acerca a la medida de la población (Herzog 2019) 9
  7. La capacidad del experimento para responder la pregunta depende de:

    • El tamaño de efecto. • El tamaño de muestra. 10
  8. La capacidad del experimento para responder la pregunta depende de:

    • El tamaño de efecto. • El tamaño de muestra. • La variabilidad de las medidas. 10
  9. Actividad 1: Definir qué efecto mínimo sería interesante para mi

    investi- gación. Ejemplos: • Dado que estudio una medicina que utilizan millones de personas, reducir en 1% los efectos colaterales traería beneficios. 11
  10. Actividad 1: Definir qué efecto mínimo sería interesante para mi

    investi- gación. Ejemplos: • Dado que estudio una medicina que utilizan millones de personas, reducir en 1% los efectos colaterales traería beneficios. • Dado que estoy alterando un gen regulador, esperaría diferencias de expresión de al menos 200% (Log Fold Change: 2). 11
  11. Los fenómenos biológicos son complejos (Sapolsky 2011): Figure 7: Relaciones

    entre factores explicativos de obesidad • Múltiples mecanismos de regulación. 12
  12. Los fenómenos biológicos son complejos (Sapolsky 2011): Figure 7: Relaciones

    entre factores explicativos de obesidad • Múltiples mecanismos de regulación. • Mecanismos de regulación redundantes. 12
  13. Los fenómenos biológicos son complejos (Sapolsky 2011): Figure 7: Relaciones

    entre factores explicativos de obesidad • Múltiples mecanismos de regulación. • Mecanismos de regulación redundantes. • Interrelaciones entre mecanismos de regulación. 12
  14. Los fenómenos biológicos son complejos (Sapolsky 2011): Figure 7: Relaciones

    entre factores explicativos de obesidad • Múltiples mecanismos de regulación. • Mecanismos de regulación redundantes. • Interrelaciones entre mecanismos de regulación. • Interacciones complejas con el medio. 12
  15. Los fenómenos biológicos son complejos (Sapolsky 2011): Figure 7: Relaciones

    entre factores explicativos de obesidad • Múltiples mecanismos de regulación. • Mecanismos de regulación redundantes. • Interrelaciones entre mecanismos de regulación. • Interacciones complejas con el medio. • Sapolsky recomienda leer Caos—Gleick (2011). 12
  16. Por esa complejidad, el modelo del error en biología es

    más complejo que el modelo tradicional (Herzog 2019) • El modelo tradicional tiene un factor determinístico y variabilidad de medida: = + 13
  17. Por esa complejidad, el modelo del error en biología es

    más complejo que el modelo tradicional (Herzog 2019) • El modelo tradicional tiene un factor determinístico y variabilidad de medida: = + • El modelo de error en biología debe tomar en cuenta la variabilidad del individuo: = + + 13
  18. Cuando el experimento no separa el efecto de cada variable

    existe «con- fusión» estadística. • Ocurre cuando no controlamos varios factores que afectan al experimento. 14
  19. Cuando el experimento no separa el efecto de cada variable

    existe «con- fusión» estadística. • Ocurre cuando no controlamos varios factores que afectan al experimento. • Ejemplo: Hacer los controles en un microarreglo y los casos en otro microarreglo. 14
  20. Cuando el experimento no separa el efecto de cada variable

    existe «con- fusión» estadística. • Ocurre cuando no controlamos varios factores que afectan al experimento. • Ejemplo: Hacer los controles en un microarreglo y los casos en otro microarreglo. • La estadística no puede solucionar la confusión. 14
  21. Cuando el experimento no separa el efecto de cada variable

    existe «con- fusión» estadística. • Ocurre cuando no controlamos varios factores que afectan al experimento. • Ejemplo: Hacer los controles en un microarreglo y los casos en otro microarreglo. • La estadística no puede solucionar la confusión. • Cuando el experimento toma en cuenta los factores y sus interacciones entonces la estadística puede separar los efectos. 14
  22. Cuando el experimento no separa el efecto de cada variable

    existe «con- fusión» estadística. • Ocurre cuando no controlamos varios factores que afectan al experimento. • Ejemplo: Hacer los controles en un microarreglo y los casos en otro microarreglo. • La estadística no puede solucionar la confusión. • Cuando el experimento toma en cuenta los factores y sus interacciones entonces la estadística puede separar los efectos. • Ejemplo: Diseñar el experimento para mezclar casos y controles entre los microarreglos que usaremos. 14
  23. Un buen experimento disminuye la variabilidad, elimina la confusión y

    tiene suficientes medidas para poder encontrar el efecto. • Un buen experimento es simple y tiene pocas variables. 15
  24. Un buen experimento disminuye la variabilidad, elimina la confusión y

    tiene suficientes medidas para poder encontrar el efecto. • Un buen experimento es simple y tiene pocas variables. • Un buen experimento separa los efectos de los factores y mide sus interacciones cuando es relevante. 15
  25. Un buen experimento disminuye la variabilidad, elimina la confusión y

    tiene suficientes medidas para poder encontrar el efecto. • Un buen experimento es simple y tiene pocas variables. • Un buen experimento separa los efectos de los factores y mide sus interacciones cuando es relevante. • Si no separas los efectos sólo puedes aspirar a un análisis descriptivo. 15
  26. Actividad 2: Enumerar a qué podría atribuirse la variabilidad de

    mi experi- mento que no se está controlando. Ejemplos: • La diversidad de la microbiota puede variar por: alimentación, exposición ambiental, antibióticos, hábitos, etc. 16
  27. Actividad 2: Enumerar a qué podría atribuirse la variabilidad de

    mi experi- mento que no se está controlando. Ejemplos: • La diversidad de la microbiota puede variar por: alimentación, exposición ambiental, antibióticos, hábitos, etc. • La expresión diferencial que puede variar por: diferencias individuales, ciclo circadiano, interacción ambiental, etc. 16
  28. Actividad 2: Enumerar a qué podría atribuirse la variabilidad de

    mi experi- mento que no se está controlando. Ejemplos: • La diversidad de la microbiota puede variar por: alimentación, exposición ambiental, antibióticos, hábitos, etc. • La expresión diferencial que puede variar por: diferencias individuales, ciclo circadiano, interacción ambiental, etc. • La respuesta al fármaco puede variar por: afinidad metabólica, presencia o ausencia de receptor, etc. 16
  29. Tenemos el sesgo cognitivo de creer que sabemos más de

    lo que sabemos en realidad porque no siempre necesitamos saber más. Figure 8: Las personas piensan que pueden dibujar bicicletas pero no pueden (McCombs 2007). 17
  30. Richard Feynman tenía un ejercicio para darse cuenta de qué

    cosas no sabía. The first principle is that you must not fool yourself and you are the easiest per- son to fool. 18
  31. Cada etapa del experimento es suceptible de agregar efectos indeseados.

    • No conocemos a priori el tamaño de esos efectos. 19
  32. Cada etapa del experimento es suceptible de agregar efectos indeseados.

    • No conocemos a priori el tamaño de esos efectos. • Pero otros experimentos y sus problemas han generado buenas prácticas. 19
  33. Cada etapa del experimento es suceptible de agregar efectos indeseados.

    • No conocemos a priori el tamaño de esos efectos. • Pero otros experimentos y sus problemas han generado buenas prácticas. • El análisis exploratorio de datos permite identificarlos. 19
  34. Cada etapa del experimento es suceptible de agregar efectos indeseados.

    • No conocemos a priori el tamaño de esos efectos. • Pero otros experimentos y sus problemas han generado buenas prácticas. • El análisis exploratorio de datos permite identificarlos. • Esos efectos definen el proceso de normalización, preproceso y algunas etapas del análisis. 19
  35. Actividad 3: Hacer el ejercicio de Feynman sobre cada etapa

    del experimento del módulo 1. • Sin consultar información, y para cada paso del experimento, escribir de la manera más sencilla posible: Imagina que se lo tienes que explicar a un niño. 20
  36. Actividad 3: Hacer el ejercicio de Feynman sobre cada etapa

    del experimento del módulo 1. • Sin consultar información, y para cada paso del experimento, escribir de la manera más sencilla posible: • ¿Por qué hacemos esto? ¿Cuál es el objetivo del proceso? Imagina que se lo tienes que explicar a un niño. 20
  37. Actividad 3: Hacer el ejercicio de Feynman sobre cada etapa

    del experimento del módulo 1. • Sin consultar información, y para cada paso del experimento, escribir de la manera más sencilla posible: • ¿Por qué hacemos esto? ¿Cuál es el objetivo del proceso? • ¿Cómo funciona este proceso? Imagina que se lo tienes que explicar a un niño. 20
  38. Ejemplo de ejercicio de Feynman Generar de bibliotecas • ¿Por

    qué hacemos esto? ¿Cuál es el objetivo del proceso? Un secuenciador Illumina sólo puede leer confiablemente hasta 150 pares de base por fragmento, aunque puede leer al derecho y al revés. El objetivo de este proceso es permitir que el secuenciador pueda identificar y leer la secuencia de cada muestra. 21
  39. Ejemplo de ejercicio de Feynman • ¿Cómo funciona este proceso?

    Se corta el DNA para que mida cerca de 300 pares de bases y pueda leerse (150 al derecho, 150 al revés). Se le agrega en los extremos secuencias complementarias a las de la placa del secuenciador para que se peguen (adaptadores) y una o dos secuencias únicas para identificar la muestra (índices). 22
  40. Actividad 4: Identifica los sesgos que podrían existir en las

    etapas experi- mentales. Ejemplo: Generar de bibliotecas de transcritos. • Al fragmentar los transcritos, los más largos tienen más pedazos y por lo tanto es más probable secuenciar fragmentos de transcritos largos que de transcritos cortos. 23
  41. Actividad 4: Identifica los sesgos que podrían existir en las

    etapas experi- mentales. Ejemplo: Generar de bibliotecas de transcritos. • Al fragmentar los transcritos, los más largos tienen más pedazos y por lo tanto es más probable secuenciar fragmentos de transcritos largos que de transcritos cortos. • (Por eso se normalizan los estudios de RNA-seq con los métodos RPM, RPKM, FPKM, TPM…) 23
  42. Actividad 4: Identifica los sesgos que podrían existir en las

    etapas experi- mentales. Ejemplo: Amplificar DNA en una biblioteca para agregar la misma concentración de DNA a la secuenciación • La polimerasa es más afín a algunos transcritos que a otros, por lo que algunos transcritos tendrán más copias que otros. 24
  43. Actividad 4: Identifica los sesgos que podrían existir en las

    etapas experi- mentales. Ejemplo: Amplificar DNA en una biblioteca para agregar la misma concentración de DNA a la secuenciación • La polimerasa es más afín a algunos transcritos que a otros, por lo que algunos transcritos tendrán más copias que otros. • (Por eso se marcan los duplicados en la búsqueda de variantes.) 24
  44. La información de este módulo se basa en: Gleick, James.

    2011. Chaos. Open Road Media. http://www.totalboox.com/book/id-6776504361602441523. Herzog, Michael. 2019. Understanding Statistics and Experimental Design: How to Not Lie with Statistics. New York, NY: Springer Berlin Heidelberg. Howell, David C. 2013. Statistical Methods for Psychology. 8th ed. Belmont, CA: Wadsworth Cengage Learning. McCombs, Molly. 2007. “Failures to Understand How Everyday Objects Work.” University of Liverpool. June 14, 2007. https://www.liverpool.ac.uk/~rlawson/PDF_Files/L-M&C-2006.pdf. Sapolsky, Robert. 2011. “21. Chaos and Reductionism.” February 1, 2011. https://www.youtube.com/watch?v=_njf8jwEGRo. 25