Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ciencia reproducible con R

ciencia reproducible con R

Andree Valle Campos

July 31, 2017
Tweet

More Decks by Andree Valle Campos

Other Decks in Science

Transcript

  1. Temario • Teoría – Ciencia Reproducible • ¿Qué? • ¿Por

    qué? • ¿Cómo? – Aplicaciones • Práctica – Rstudio → Git – Rmarkdown
  2. • Irreproducibility → default setting of all science • By

    following this starter tips, – if your work is wrong: nobody will be able to check it. – If it is correct: your will make everyone else do disproportionately more work than you to build upon it. • In either case you are the beneficiary.
  3. IRREPRODUCIBILIDAD • Top tips: – No reportar detalles. Ser abstracto

    (pseudo code, “custom scripts”). Déficit de software, tú eres el experto: tú eliges. No compartir código. • El más importante: – Para asegurar su irreproducibilidad, asegúrate que no puedas reproducirlo tú mismo! • Conjetura: – Un experimento irreproducible es equivalente a nunca haber sido llevado a cabo. • Mantra: – Luego de publicada la investigación, ¡la irrerpoducibilidad permite que las falsas observaciones obtengan longevidad!
  4. ¿Qué es? • Reproducibilidad: Texto + código + resultados (fig/tab)

    • ≠ Repetitividad: replicar resultados con nueva data • Transparencia, Trazabilidad y Completud de protocolo • Material y métodos → evaluar veracidad y robustez – Problema: descripción muy simplificada, – Más aún ante: • el incremento de datos y • la complejidad de análisis estadísticos
  5. ¿Qué es? • Construir puentes entre clickers y coders •

    Clickers: Excel/SPSS + GraphPad/PS + Word • Coders: R (Rmarkdown) o Python (iPython)
  6. ¿Por qué es necesario? • Pilar fundamental del método científico.

    • “Ningún estudio científico puede garantizar que sus resultados sean correctos, pero sí reproducibles” (Peng, 2011) • Contribuye a acelerar el progreso científico • Permite: – Detectar errores y Usar código pre-existente
  7. Beneficios → workflow reproducible • Uso de código permite la

    automatización • Fácil de corregir y regenerar resultados • Reducción drástica del riesgo de errores • Facilitan la colaboración • Registro exhaustivo del análisis → Facilita redacción • Sello de calidad. Aumenta aceptación e impacto • Ahorro de tiempo y esfuerzo.
  8. ¿Cómo hacerlo? • Construir puentes entre clickers y coders •

    Clickers: Excel/SPSS + GraphPad/PS + Word • Coders: R (Rmarkdown) o Python (iPython)
  9. Git • Ayuda a registrar el flujo de cambios en

    sofware • Permite: – Historial del proyecto. – “Viajar” en el tiempo. – Experimentar cambios. – back up del proyecto. – Colaborar en proyectos. • Memorizar verbos clave!
  10. Control de versiones • Ayuda a registrar el flujo de

    cambios en sofware • Aplicable con Git via terminal o Rstudio
  11. Organización de ficheros • Idealmente, seguir estructura de un paquete

    R • ficheros independientes + makefile + README
  12. Dependencias externas • devtools::session_info() • Print session information – R,

    – the OS, and • Print attached or loaded packages. – where a package was installed from.
  13. Sugerencias • Para cada clase: – Crear directorio, Organizar ficheros

    y Controlar versiones. • Generar reportes: – Clases, Proyectos, Grupos de estudio→ Análisis/Diagramas. • Generar documentos: – Proyecto e Informe de Tesis. Presentaciones → Bibliografía. • En clases de filogeografía: – Repetitividad → Reproducibilidad!
  14. Referencias • https://www.youtube.com/watch?v=s3JldKoA0zw • https://www.revistaecosistemas.net/index.php/ecosistemas/article/vie w/1178 • https://www.nature.com/articles/s41559-017-0160 • https://speakerdeck.com/alicebartlett/git-for-humans

    • https://explainxkcd.com/wiki/index.php/1597:_Git • http://r-pkgs.had.co.nz/git.html • rmarkdown.rstudio.com/authoring_pandoc_markdown.html • https://www.rstudio.com/resources/cheatsheets/ • http://trello.com/ • http://keep.google.com/ • https://www.sublimetext.com/ • https://www.youtube.com/watch?v=bLBKUbnLYTs
  15. Git

  16. Git

  17. Referencias • https://www.youtube.com/watch?v=s3JldKoA0zw • https://www.revistaecosistemas.net/index.php/ecosistemas/article/vie w/1178 • https://www.nature.com/articles/s41559-017-0160 • https://speakerdeck.com/alicebartlett/git-for-humans

    • https://explainxkcd.com/wiki/index.php/1597:_Git • http://r-pkgs.had.co.nz/git.html • rmarkdown.rstudio.com/authoring_pandoc_markdown.html • https://www.rstudio.com/resources/cheatsheets/ • http://trello.com/ • http://keep.google.com/ • https://www.sublimetext.com/ • https://www.youtube.com/watch?v=bLBKUbnLYTs