Slide 1

Slide 1 text

recount: facilitando el análisis de miles de muestras de RNA-seq Leonardo Collado-Torres @fellgernon Genomeeting 2016

Slide 2

Slide 2 text

Problema inicial: identificar regiones del genoma cuya expresión cambia a lo largo de la vida en los cerebros de los humanos

Slide 3

Slide 3 text

Línea de investigación - annotation-agnostic - análisis reproducibles - datos accesibles - herramientas estadísticas para la comunidad genómica

Slide 4

Slide 4 text

lecturas RNA-seq Genoma (ADN) Transcritos ARN (muchas posibles variantes) Midiendo expresión: RNA-seq Adaptado de @jtleek

Slide 5

Slide 5 text

Genoma (ADN) Alineamiento de lecturas Adaptado de @jtleek Tipos de análisis comunes: • Conteo(genes, exones) • Ensamblado del transcriptoma

Slide 6

Slide 6 text

Dificultades con conteo http://www-huber.embl.de/users/anders/HTSeq/doc/count.html

Slide 7

Slide 7 text

Complicaciones del transcriptoma Frazee et al, Biostatistics, 2014

Slide 8

Slide 8 text

Tamaño de proyectos ha aumentado 2009 (11) 2010 (46) 2011 (121) 2012 (235) 2013 (408) 2014 (625) 2015 (548) 2016 (18) 7 8 9 10 11 12 Project size in base−pairs over the years log10 base−pairs per project https://jhubiostatistics.shinyapps.io/recount/

Slide 9

Slide 9 text

Genoma (ADN) Lecturas alineadas Adaptado de @jtleek

Slide 10

Slide 10 text

DER finder approach • Find contiguous base pairs with Differential Expression signal  DE Regions or DERs • Find nearest annotated feature

Slide 11

Slide 11 text

Vector de covertura 2 6 0 11 6 Genoma (ADN) Covertura de lecturas Adaptado de @jtleek

Slide 12

Slide 12 text

No content

Slide 13

Slide 13 text

No content

Slide 14

Slide 14 text

Identificando DERs del cerebro a través del desarrollo Fetal Infant Child Teen Adult 50+ 6 / grupo, N = 36 Datos iniciales Null: Alt: Modelos Resultados iniciales Jaffe et al, Nat. Neuroscience, 2015 50,650 DERs replicaron 63,135 DERs Resultados finales

Slide 15

Slide 15 text

Jaffe et al, Nat. Neuroscience, 2015

Slide 16

Slide 16 text

Gran cantidad de DERs fuera del transcriptoma conocido Jaffe et al, Nat. Neuroscience, 2015

Slide 17

Slide 17 text

DERs asociadas a la edad no son específicas del DLPFC BrainSpan data Jaffe et al, Nat. Neuroscience, 2015

Slide 18

Slide 18 text

Proportion of Cells Cambios de expresión podrían ser por un cambio de la población de células Jaffe et al, Nat. Neuroscience, 2015 Estimation method: Houseman et al, BMC Bioinformatics, 2012

Slide 19

Slide 19 text

Chromatin immunoprecipitation seq. http://assets.illumina.com/content/dam/illumina-marketing/images/techniques/large/web-graphic-chipseq-workflow-large.jpg

Slide 20

Slide 20 text

Análisis típico de ChIP-seq

Slide 21

Slide 21 text

No content

Slide 22

Slide 22 text

Datos de ChIP-seq del cerebro EpiMap project

Slide 23

Slide 23 text

Variación modelada H3K4me3 data: all regions with binding signal

Slide 24

Slide 24 text

Differentially bound regions

Slide 25

Slide 25 text

Collado-Torres et al, F1000Research, 2015 regionReport

Slide 26

Slide 26 text

Collado-Torres et al, F1000Research, 2015 regionReport

Slide 27

Slide 27 text

Collado-Torres et al, F1000Research, 2015 Reportes interactivos en formato HTML

Slide 28

Slide 28 text

Collado-Torres et al, F1000Research, 2015 Reportes interactivos en formato HTML

Slide 29

Slide 29 text

Adaptado de @BenLangmead

Slide 30

Slide 30 text

Adaptado de @BenLangmead

Slide 31

Slide 31 text

Adaptado de @BenLangmead

Slide 32

Slide 32 text

Adaptado de @BenLangmead

Slide 33

Slide 33 text

Adaptado de @BenLangmead

Slide 34

Slide 34 text

Adaptado de @BenLangmead

Slide 35

Slide 35 text

recount: desde el Internet https://jhubiostatistics.shinyapps.io/recount/

Slide 36

Slide 36 text

http://bioconductor.org/packages/recount

Slide 37

Slide 37 text

http://www.sciserver.org

Slide 38

Slide 38 text

No content

Slide 39

Slide 39 text

No content

Slide 40

Slide 40 text

No content

Slide 41

Slide 41 text

No content

Slide 42

Slide 42 text

No content

Slide 43

Slide 43 text

bit.ly/recount-sciserver

Slide 44

Slide 44 text

bit.ly/recount-sciserver

Slide 45

Slide 45 text

bit.ly/recount-sciserver

Slide 46

Slide 46 text

bit.ly/recount-sciserver

Slide 47

Slide 47 text

bit.ly/recount-sciserver

Slide 48

Slide 48 text

No content

Slide 49

Slide 49 text

Problema inicial: identificar regiones del genoma cuya expresión cambia a lo largo de la vida en los cerebros de los humanos 1. derfinder permite descubrir regions diferencialmente expresadas y pegadas 2. Identificamos regiones que cambian su expresión en el cerebro 3. Creamos herramientas para compartir reportes reproducibles 4. Vía recount se pueden usar estas herramientas para analizar 2,040 projectos públicos

Slide 50

Slide 50 text

Agradecimientos Asesores Jeffrey Leek Andrew Jaffe Colaboradores Alyssa Frazee Abhinav Nellore Michael Love Ben Langmead Rafael Irizarry EpiMap project SciServer Apoyo NIH LIBD JHU-Biostats CONACyT México

Slide 51

Slide 51 text

Referencías + software + código: @fellgernon • Collado-Torres, et al. Nucleic Acids Research (2016) doi: 10.1093/nar/gkw852 – http://bioconductor.org/packages/derfinder – http://leekgroup.github.io/derSupplement/ • Collado-Torres, et al. F1000Research (2015) doi:10.12688/f1000research.6379.1 - http://www.bioconductor.org/packages/regionReport - http://leekgroup.github.io/regionReportSupp/ • Collado-Torres and Nellore, et al. bioRxiv (2016) doi: 10.1101/068478 – http://bioconductor.org/packages/recount – https://jhubiostatistics.shinyapps.io/recount • Nellore, Collado-Torres, et al. Bioinformatics (2016) doi:10.1093/bioinformatics/btw575 - rail.bio •Nellore, …, Collado-Torres, et al. bioRxiv (2016) doi:10.1101/038224 -intropolis.rail.bio • Jaffe, Shin, Collado-Torres, et al. Nat. Neurosci. (2015) doi:10.1038/nn.3898 – https://github.com/lcolladotor/libd_n36 – https://github.com/leekgroup/enrichedRanges