$30 off During Our Annual Pro Sale. View Details »

Genomeeting 2016 Mexico

Genomeeting 2016 Mexico

recount: facilitando el análisis de miles de muestras de RNA-seq

Leonardo Collado-Torres

October 26, 2016
Tweet

More Decks by Leonardo Collado-Torres

Other Decks in Science

Transcript

  1. recount: facilitando el análisis de
    miles de muestras de RNA-seq
    Leonardo Collado-Torres
    @fellgernon
    Genomeeting 2016

    View Slide

  2. Problema inicial: identificar regiones del
    genoma cuya expresión cambia a lo largo de la
    vida en los cerebros de los humanos

    View Slide

  3. Línea de investigación
    - annotation-agnostic
    - análisis reproducibles
    - datos accesibles
    - herramientas estadísticas para la comunidad
    genómica

    View Slide

  4. lecturas
    RNA-seq
    Genoma
    (ADN)
    Transcritos ARN
    (muchas
    posibles
    variantes)
    Midiendo expresión: RNA-seq
    Adaptado de @jtleek

    View Slide

  5. Genoma
    (ADN)
    Alineamiento de lecturas
    Adaptado de @jtleek
    Tipos de análisis comunes:
    • Conteo(genes, exones)
    • Ensamblado del transcriptoma

    View Slide

  6. Dificultades con conteo
    http://www-huber.embl.de/users/anders/HTSeq/doc/count.html

    View Slide

  7. Complicaciones del transcriptoma
    Frazee et al, Biostatistics, 2014

    View Slide

  8. Tamaño de proyectos ha aumentado
    2009
    (11)
    2010
    (46)
    2011
    (121)
    2012
    (235)
    2013
    (408)
    2014
    (625)
    2015
    (548)
    2016
    (18)
    7
    8
    9
    10
    11
    12
    Project size in base−pairs over the years
    log10 base−pairs per project
    https://jhubiostatistics.shinyapps.io/recount/

    View Slide

  9. Genoma
    (ADN)
    Lecturas alineadas
    Adaptado de @jtleek

    View Slide

  10. DER finder approach
    • Find contiguous base pairs with
    Differential Expression signal  DE
    Regions or DERs
    • Find nearest annotated feature

    View Slide

  11. Vector de
    covertura
    2 6 0 11 6
    Genoma
    (ADN)
    Covertura de lecturas
    Adaptado de @jtleek

    View Slide

  12. View Slide

  13. View Slide

  14. Identificando DERs del cerebro a través
    del desarrollo
    Fetal Infant
    Child Teen
    Adult 50+
    6 / grupo, N = 36
    Datos iniciales
    Null:
    Alt:
    Modelos
    Resultados iniciales
    Jaffe et al, Nat. Neuroscience, 2015
    50,650 DERs replicaron
    63,135 DERs
    Resultados finales

    View Slide

  15. Jaffe et al, Nat. Neuroscience, 2015

    View Slide

  16. Gran cantidad de DERs fuera del
    transcriptoma conocido
    Jaffe et al, Nat. Neuroscience, 2015

    View Slide

  17. DERs asociadas a la edad no son específicas
    del DLPFC
    BrainSpan data
    Jaffe et al, Nat. Neuroscience, 2015

    View Slide

  18. Proportion of Cells
    Cambios de expresión podrían ser por un
    cambio de la población de células
    Jaffe et al, Nat. Neuroscience, 2015
    Estimation method: Houseman et al, BMC Bioinformatics, 2012

    View Slide

  19. Chromatin immunoprecipitation seq.
    http://assets.illumina.com/content/dam/illumina-marketing/images/techniques/large/web-graphic-chipseq-workflow-large.jpg

    View Slide

  20. Análisis típico de ChIP-seq

    View Slide

  21. View Slide

  22. Datos de ChIP-seq del cerebro
    EpiMap project

    View Slide

  23. Variación modelada
    H3K4me3 data: all regions with binding signal

    View Slide

  24. Differentially bound regions

    View Slide

  25. Collado-Torres et al, F1000Research, 2015
    regionReport

    View Slide

  26. Collado-Torres et al, F1000Research, 2015
    regionReport

    View Slide

  27. Collado-Torres et al, F1000Research, 2015
    Reportes interactivos en formato HTML

    View Slide

  28. Collado-Torres et al, F1000Research, 2015
    Reportes interactivos en formato HTML

    View Slide

  29. Adaptado de @BenLangmead

    View Slide

  30. Adaptado de @BenLangmead

    View Slide

  31. Adaptado de @BenLangmead

    View Slide

  32. Adaptado de @BenLangmead

    View Slide

  33. Adaptado de @BenLangmead

    View Slide

  34. Adaptado de @BenLangmead

    View Slide

  35. recount: desde el Internet
    https://jhubiostatistics.shinyapps.io/recount/

    View Slide

  36. http://bioconductor.org/packages/recount

    View Slide

  37. http://www.sciserver.org

    View Slide

  38. View Slide

  39. View Slide

  40. View Slide

  41. View Slide

  42. View Slide

  43. bit.ly/recount-sciserver

    View Slide

  44. bit.ly/recount-sciserver

    View Slide

  45. bit.ly/recount-sciserver

    View Slide

  46. bit.ly/recount-sciserver

    View Slide

  47. bit.ly/recount-sciserver

    View Slide

  48. View Slide

  49. Problema inicial: identificar regiones del
    genoma cuya expresión cambia a lo largo de la
    vida en los cerebros de los humanos
    1. derfinder permite descubrir regions
    diferencialmente expresadas y pegadas
    2. Identificamos regiones que cambian su
    expresión en el cerebro
    3. Creamos herramientas para compartir
    reportes reproducibles
    4. Vía recount se pueden usar estas
    herramientas para analizar 2,040 projectos
    públicos

    View Slide

  50. Agradecimientos
    Asesores
    Jeffrey Leek
    Andrew Jaffe
    Colaboradores
    Alyssa Frazee
    Abhinav Nellore
    Michael Love
    Ben Langmead
    Rafael Irizarry
    EpiMap project
    SciServer
    Apoyo
    NIH
    LIBD
    JHU-Biostats
    CONACyT México

    View Slide

  51. Referencías + software + código: @fellgernon
    • Collado-Torres, et al. Nucleic Acids Research (2016) doi: 10.1093/nar/gkw852
    – http://bioconductor.org/packages/derfinder
    – http://leekgroup.github.io/derSupplement/
    • Collado-Torres, et al. F1000Research (2015) doi:10.12688/f1000research.6379.1
    - http://www.bioconductor.org/packages/regionReport
    - http://leekgroup.github.io/regionReportSupp/
    • Collado-Torres and Nellore, et al. bioRxiv (2016) doi: 10.1101/068478
    – http://bioconductor.org/packages/recount
    – https://jhubiostatistics.shinyapps.io/recount
    • Nellore, Collado-Torres, et al. Bioinformatics (2016) doi:10.1093/bioinformatics/btw575
    - rail.bio
    •Nellore, …, Collado-Torres, et al. bioRxiv (2016) doi:10.1101/038224
    -intropolis.rail.bio
    • Jaffe, Shin, Collado-Torres, et al. Nat. Neurosci. (2015) doi:10.1038/nn.3898
    – https://github.com/lcolladotor/libd_n36
    – https://github.com/leekgroup/enrichedRanges

    View Slide