Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Tu Flujo de Trabajo

Avatar for xihh87 xihh87
May 25, 2020
63

Tu Flujo de Trabajo

Cuarto módulo de la primera edición del curso «Bioinformática Aplicada a Tu Proyecto».

Avatar for xihh87

xihh87

May 25, 2020
Tweet

Transcript

  1. La computadora donde hiciste el análisis dejó de funcionar y

    no se pueden recuperar los resultados. Figure 1: ¿Podrías hacer el análisis de nuevo? 4
  2. El revisor dos dice que necesitas otro experimento: Figure 2:

    Revisor dos mirándote con desdén • No tienes una bitácora. 5
  3. El revisor dos dice que necesitas otro experimento: Figure 2:

    Revisor dos mirándote con desdén • No tienes una bitácora. • No recuerdas cómo hiciste el análisis. 5
  4. El revisor dos dice que necesitas otro experimento: Figure 2:

    Revisor dos mirándote con desdén • No tienes una bitácora. • No recuerdas cómo hiciste el análisis. • Vuelves a correr como puedes. 5
  5. El revisor dos dice que necesitas otro experimento: Figure 2:

    Revisor dos mirándote con desdén • No tienes una bitácora. • No recuerdas cómo hiciste el análisis. • Vuelves a correr como puedes. • El análisis no coincide. 5
  6. Ambos son escenarios posibles que pueden ocurrirte y debes estar

    preparado para ellos: • Respalda tu trabajo. 6
  7. Ambos son escenarios posibles que pueden ocurrirte y debes estar

    preparado para ellos: • Respalda tu trabajo. • Respalda tus datos. 6
  8. Si inviertes tiempo en tu bitácora digital y automatización puedes

    ahorrarte esos problemas. • Un poco de disciplina ahorra mucho trabajo. 7
  9. Si inviertes tiempo en tu bitácora digital y automatización puedes

    ahorrarte esos problemas. • Un poco de disciplina ahorra mucho trabajo. • La diferencia de productividad se debe a los hábitos. 7
  10. Si inviertes tiempo en tu bitácora digital y automatización puedes

    ahorrarte esos problemas. • Un poco de disciplina ahorra mucho trabajo. • La diferencia de productividad se debe a los hábitos. • Siempre puedes replicar tu análisis. 7
  11. Cómo transformar los datos crudos de tu experimento en la

    información que contesta tu pregunta.
  12. Generalmente hay que armar un rompecabezas antes de poder analizar

    los datos. Los datos normalmente son: • Intensidad luminosa. • Cambio de pH. Queremos transformarlos a: • Secuencias de ADN. • Genomas / Genes / Transcritos. 8
  13. Antes de armar el rompecabezas debemos eliminar las piezas defectuosas

    (preproceso). • Identificar la naturaleza de los datos crudos. Figure 3: ¿Alguien notó que hay una mano en mis datos crudos? 9
  14. Antes de armar el rompecabezas debemos eliminar las piezas defectuosas

    (preproceso). • Identificar la naturaleza de los datos crudos. • Eliminar la información problemática. Figure 3: ¿Alguien notó que hay una mano en mis datos crudos? 9
  15. Antes de armar el rompecabezas debemos eliminar las piezas defectuosas

    (preproceso). • Identificar la naturaleza de los datos crudos. • Eliminar la información problemática. • Transformar los datos al formato requerido. Figure 3: ¿Alguien notó que hay una mano en mis datos crudos? 9
  16. Al armar el rompecabezas podemos darnos cuenta de nuevos problemas

    en la información si hacemos un análisis descriptivo: • Sesgos del experimento. 10
  17. Al armar el rompecabezas podemos darnos cuenta de nuevos problemas

    en la información si hacemos un análisis descriptivo: • Sesgos del experimento. • Datos faltantes. 10
  18. Al armar el rompecabezas podemos darnos cuenta de nuevos problemas

    en la información si hacemos un análisis descriptivo: • Sesgos del experimento. • Datos faltantes. • Muestras sin información relevante. 10
  19. Con los resultados del análisis descriptivo podemos: • Decidir la

    estrategia de normalización. • Seleccionar un método de análisis. 11
  20. Con los resultados del análisis descriptivo podemos: • Decidir la

    estrategia de normalización. • Seleccionar un método de análisis. • Verificar los supuestos del análisis. 11
  21. Con los resultados del análisis descriptivo podemos: • Decidir la

    estrategia de normalización. • Seleccionar un método de análisis. • Verificar los supuestos del análisis. • Sólo entonces podemos estar seguros de que el análisis es correcto. 11
  22. Actividad 1: Hacer un diagrama del flujo de trabajo bioinformático:

    Figure 4: Sin importar qué gestor de trabajo usemos, esta gráfica nos va a servir. • Identificar el objetivo al que queremos llegar. 12
  23. Actividad 1: Hacer un diagrama del flujo de trabajo bioinformático:

    Figure 4: Sin importar qué gestor de trabajo usemos, esta gráfica nos va a servir. • Identificar el objetivo al que queremos llegar. • Dividir el proceso en etapas. 12
  24. Actividad 1: Hacer un diagrama del flujo de trabajo bioinformático:

    Figure 4: Sin importar qué gestor de trabajo usemos, esta gráfica nos va a servir. • Identificar el objetivo al que queremos llegar. • Dividir el proceso en etapas. • Usar objetos en nodos y procesos en flechas. 12
  25. Actividad 1: Hacer un diagrama del flujo de trabajo bioinformático:

    Figure 4: Sin importar qué gestor de trabajo usemos, esta gráfica nos va a servir. • Identificar el objetivo al que queremos llegar. • Dividir el proceso en etapas. • Usar objetos en nodos y procesos en flechas. • Cada flecha es un script. 12
  26. Sin importar qué tan bien hecho esté el plan, siempre

    habrá errores en el desarrollo y cosas no consideradas que nos harán reprocesar (Osborne et al. 2014). Para minimizar problemas en el desarrollo de los proyectos: • Avanzar en pasos pequeños. 13
  27. Sin importar qué tan bien hecho esté el plan, siempre

    habrá errores en el desarrollo y cosas no consideradas que nos harán reprocesar (Osborne et al. 2014). Para minimizar problemas en el desarrollo de los proyectos: • Avanzar en pasos pequeños. • Validar que cada paso funciona antes de continuar. 13
  28. Sin importar qué tan bien hecho esté el plan, siempre

    habrá errores en el desarrollo y cosas no consideradas que nos harán reprocesar (Osborne et al. 2014). Para minimizar problemas en el desarrollo de los proyectos: • Avanzar en pasos pequeños. • Validar que cada paso funciona antes de continuar. • Tomar una foto del pequeño paso. 13
  29. El proceso que sigo para automatizar mi experimento es: •

    Probar los comandos a mano. • Generar scripts para ejecutar los comandos. 14
  30. El proceso que sigo para automatizar mi experimento es: •

    Probar los comandos a mano. • Generar scripts para ejecutar los comandos. • Automatizar la secuencia de los comandos. 14
  31. El proceso que sigo para automatizar mi experimento es: •

    Probar los comandos a mano. • Generar scripts para ejecutar los comandos. • Automatizar la secuencia de los comandos. • Integrar con un gestor de trabajos. 14
  32. Todos los comandos que vas a ejecutar más de una

    vez escríbelos en un script (Osborne et al. 2014) • Trabajar más ahora para trabajar menos en total. 15
  33. Todos los comandos que vas a ejecutar más de una

    vez escríbelos en un script (Osborne et al. 2014) • Trabajar más ahora para trabajar menos en total. • El script debe resolver una única tarea. 15
  34. Todos los comandos que vas a ejecutar más de una

    vez escríbelos en un script (Osborne et al. 2014) • Trabajar más ahora para trabajar menos en total. • El script debe resolver una única tarea. • Realizar los análisis siempre con un script. 15
  35. Pero no uses los scripts para controlar la secuencia. •

    Hay mejores herramientas para controlar el flujo de trabajo. Figure 5: Ejemplo de un script que crecerá en complejidad innecesariamente 16
  36. Una buena herramienta para controlar el flujo de trabajo puede

    rehacer el análisis cuando algo cambia. Figure 6: Si cambia A, se rehace el análisis automáticamente. 17
  37. Cuando usas comandos que piensas que no vas a volver

    a usar, regístralos en una bitácora (Osborne et al. 2014) • Git es un buen lugar. 18
  38. Cuando usas comandos que piensas que no vas a volver

    a usar, regístralos en una bitácora (Osborne et al. 2014) • Git es un buen lugar. • Lo vas a necesitar. 18
  39. Los criterios que uso para seleccionar la herramienta en cada

    etapa del análisis: • Aplica al análisis que estamos haciendo. 20
  40. Los criterios que uso para seleccionar la herramienta en cada

    etapa del análisis: • Aplica al análisis que estamos haciendo. • Es fácil de instalar. 20
  41. Los criterios que uso para seleccionar la herramienta en cada

    etapa del análisis: • Aplica al análisis que estamos haciendo. • Es fácil de instalar. • Tiene buena documentación. 20
  42. Los criterios que uso para seleccionar la herramienta en cada

    etapa del análisis: • Aplica al análisis que estamos haciendo. • Es fácil de instalar. • Tiene buena documentación. • Tiene soporte. 20
  43. Los criterios que uso para seleccionar la herramienta en cada

    etapa del análisis: • Aplica al análisis que estamos haciendo. • Es fácil de instalar. • Tiene buena documentación. • Tiene soporte. • Puedo usarla donde haré el análisis. 20
  44. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. 21
  45. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. • Artículo de la herramienta. 21
  46. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. • Artículo de la herramienta. • Objetivo de la herramienta. 21
  47. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. • Artículo de la herramienta. • Objetivo de la herramienta. • Buscar si tiene soporte en internet. 21
  48. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. • Artículo de la herramienta. • Objetivo de la herramienta. • Buscar si tiene soporte en internet. • Buscar si puede instalarse directamente. 21
  49. Actividad 2: Para la primera etapa de análisis hacer una

    lista de posibles herramientas. A partir de los artículos que leímos, rellenar el listado de herramientas: • Nombre de la herramienta. • Artículo de la herramienta. • Objetivo de la herramienta. • Buscar si tiene soporte en internet. • Buscar si puede instalarse directamente. • Buscar la documentación. 21
  50. El material de este módulo está basado en: Osborne, James

    M., Miguel O. Bernabeu, Maria Bruna, Ben Calderhead, Jonathan Cooper, Neil Dalchau, Sara-Jane Dunn, et al. 2014. “Ten Simple Rules for Effective Computational Research.” Edited by Philip E. Bourne. PLoS Computational Biology 10 (3): e1003506. https://doi.org/10.1371/journal.pcbi.1003506. 22