Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Genomeeting 2016 Mexico

Genomeeting 2016 Mexico

recount: facilitando el análisis de miles de muestras de RNA-seq

7382f7fe30561274624635116513ca37?s=128

Leonardo Collado-Torres

October 26, 2016
Tweet

Transcript

  1. recount: facilitando el análisis de miles de muestras de RNA-seq

    Leonardo Collado-Torres @fellgernon Genomeeting 2016
  2. Problema inicial: identificar regiones del genoma cuya expresión cambia a

    lo largo de la vida en los cerebros de los humanos
  3. Línea de investigación - annotation-agnostic - análisis reproducibles - datos

    accesibles - herramientas estadísticas para la comunidad genómica
  4. lecturas RNA-seq Genoma (ADN) Transcritos ARN (muchas posibles variantes) Midiendo

    expresión: RNA-seq Adaptado de @jtleek
  5. Genoma (ADN) Alineamiento de lecturas Adaptado de @jtleek Tipos de

    análisis comunes: • Conteo(genes, exones) • Ensamblado del transcriptoma
  6. Dificultades con conteo http://www-huber.embl.de/users/anders/HTSeq/doc/count.html

  7. Complicaciones del transcriptoma Frazee et al, Biostatistics, 2014

  8. Tamaño de proyectos ha aumentado 2009 (11) 2010 (46) 2011

    (121) 2012 (235) 2013 (408) 2014 (625) 2015 (548) 2016 (18) 7 8 9 10 11 12 Project size in base−pairs over the years log10 base−pairs per project https://jhubiostatistics.shinyapps.io/recount/
  9. Genoma (ADN) Lecturas alineadas Adaptado de @jtleek

  10. DER finder approach • Find contiguous base pairs with Differential

    Expression signal  DE Regions or DERs • Find nearest annotated feature
  11. Vector de covertura 2 6 0 11 6 Genoma (ADN)

    Covertura de lecturas Adaptado de @jtleek
  12. None
  13. None
  14. Identificando DERs del cerebro a través del desarrollo Fetal Infant

    Child Teen Adult 50+ 6 / grupo, N = 36 Datos iniciales Null: Alt: Modelos Resultados iniciales Jaffe et al, Nat. Neuroscience, 2015 50,650 DERs replicaron 63,135 DERs Resultados finales
  15. Jaffe et al, Nat. Neuroscience, 2015

  16. Gran cantidad de DERs fuera del transcriptoma conocido Jaffe et

    al, Nat. Neuroscience, 2015
  17. DERs asociadas a la edad no son específicas del DLPFC

    BrainSpan data Jaffe et al, Nat. Neuroscience, 2015
  18. Proportion of Cells Cambios de expresión podrían ser por un

    cambio de la población de células Jaffe et al, Nat. Neuroscience, 2015 Estimation method: Houseman et al, BMC Bioinformatics, 2012
  19. Chromatin immunoprecipitation seq. http://assets.illumina.com/content/dam/illumina-marketing/images/techniques/large/web-graphic-chipseq-workflow-large.jpg

  20. Análisis típico de ChIP-seq

  21. None
  22. Datos de ChIP-seq del cerebro EpiMap project

  23. Variación modelada H3K4me3 data: all regions with binding signal

  24. Differentially bound regions

  25. Collado-Torres et al, F1000Research, 2015 regionReport

  26. Collado-Torres et al, F1000Research, 2015 regionReport

  27. Collado-Torres et al, F1000Research, 2015 Reportes interactivos en formato HTML

  28. Collado-Torres et al, F1000Research, 2015 Reportes interactivos en formato HTML

  29. Adaptado de @BenLangmead

  30. Adaptado de @BenLangmead

  31. Adaptado de @BenLangmead

  32. Adaptado de @BenLangmead

  33. Adaptado de @BenLangmead

  34. Adaptado de @BenLangmead

  35. recount: desde el Internet https://jhubiostatistics.shinyapps.io/recount/

  36. http://bioconductor.org/packages/recount

  37. http://www.sciserver.org

  38. None
  39. None
  40. None
  41. None
  42. None
  43. bit.ly/recount-sciserver

  44. bit.ly/recount-sciserver

  45. bit.ly/recount-sciserver

  46. bit.ly/recount-sciserver

  47. bit.ly/recount-sciserver

  48. None
  49. Problema inicial: identificar regiones del genoma cuya expresión cambia a

    lo largo de la vida en los cerebros de los humanos 1. derfinder permite descubrir regions diferencialmente expresadas y pegadas 2. Identificamos regiones que cambian su expresión en el cerebro 3. Creamos herramientas para compartir reportes reproducibles 4. Vía recount se pueden usar estas herramientas para analizar 2,040 projectos públicos
  50. Agradecimientos Asesores Jeffrey Leek Andrew Jaffe Colaboradores Alyssa Frazee Abhinav

    Nellore Michael Love Ben Langmead Rafael Irizarry EpiMap project SciServer Apoyo NIH LIBD JHU-Biostats CONACyT México
  51. Referencías + software + código: @fellgernon • Collado-Torres, et al.

    Nucleic Acids Research (2016) doi: 10.1093/nar/gkw852 – http://bioconductor.org/packages/derfinder – http://leekgroup.github.io/derSupplement/ • Collado-Torres, et al. F1000Research (2015) doi:10.12688/f1000research.6379.1 - http://www.bioconductor.org/packages/regionReport - http://leekgroup.github.io/regionReportSupp/ • Collado-Torres and Nellore, et al. bioRxiv (2016) doi: 10.1101/068478 – http://bioconductor.org/packages/recount – https://jhubiostatistics.shinyapps.io/recount • Nellore, Collado-Torres, et al. Bioinformatics (2016) doi:10.1093/bioinformatics/btw575 - rail.bio •Nellore, …, Collado-Torres, et al. bioRxiv (2016) doi:10.1101/038224 -intropolis.rail.bio • Jaffe, Shin, Collado-Torres, et al. Nat. Neurosci. (2015) doi:10.1038/nn.3898 – https://github.com/lcolladotor/libd_n36 – https://github.com/leekgroup/enrichedRanges