Slide 1

Slide 1 text

Bacteriófagos: analizando su diversidad Leonardo Collado Torres Sur Herrera Paredes Licenciatura en Ciencias Genómicas, UNAM Cuernavaca, México 4 de Diciembre de 2008

Slide 2

Slide 2 text

Índice l Introducción – Diversidad, problema, interés. l Uso de Codones l Análisis de clusters l Análisis de pares de fagos cercanos – Sensibilidad, sensitividad, red visual. l Lo que sigue…

Slide 3

Slide 3 text

Diversidad l Son los organismos más abundantes en la Tierra. l Metagenomas virales: más huérfanos (ORFans) que en cualquier otro conjunto de secuencias. l Genomas mosaicos. l Su clasificación taxonómica es por morfología. Tsk tsk.

Slide 4

Slide 4 text

Problema l No hay un elemento común entre fagos. ¡No hay equivalente al 16s ARNr! l ¿Y los genes de las cápsides? – Cápsides morfológicamente parecidas no son homólogas a nivel de amino ácidos. l ¿Tienen los fagos un origen monofilético? – Para hacer una clasificación filogenética la respuesta tendría que ser que sí. – Creemos que no es cierto.

Slide 5

Slide 5 text

Interés l Hacer una clasificación ecológica de los fagos. l Representar sus interacciones con los hospederos. l Previamente: contenido proteico l Este semestre nos enfocamos en frecuencias y uso de codones.

Slide 6

Slide 6 text

¿Por qué uso de codones? l Un fago usa la maquinaria del hospedero para traducirse. l Complementación de tRNAs con el hospedero. l Hay cierta correlación entre: – nivel de expresión y uso de codones (bact). – nivel de expresión y genes esenciales (bact). l En bacterias, hay una relación entre la filogenia de estas y el uso de codones.

Slide 7

Slide 7 text

Bacillus Subtilus Pseudomonas Aeruginosa Staphylococcus _aureus_N315 (2 replicones) Escherichia_col i_K12_substr__ MG1655

Slide 8

Slide 8 text

¿Cómo medir el uso de codones? l Métodos anteriores: – Una ji cuadrada dividida por la longitud del organismo. – CAI: depende de un grupo de secuencias nuclear. – SCCI (Carbone). – SCUO. l Desventajas – Te dan un valor de 0 a 1 para todo el organismo. – No puedes agrupar fagos con ellos. l Creamos y exploramos unos nuevos – Eliminamos errores en archivos Genome_Reviews.

Slide 9

Slide 9 text

Nubes de frecuencias de codones l Por cada fago, relativizamos el promedio de las frecuencias de los 64 codones.

Slide 10

Slide 10 text

… l Definimos “nubes” por fago – El centro es la media de cada codón: punto en 64 D. – El grosor de la nube es el promedio de las 64 desviaciones estándar. l Analizamos los pares de fagos que cayeron adentro de sus nubes. l Hicimos un clustering y analizamos los clusters resultantes.

Slide 11

Slide 11 text

Uso de codones: binario l Eliminamos los codones de paro, W y M. l Por fago, relativizamos los valores por amino ácido. l Al máximo(s) por aa le dimos el valor de 1, al resto 0. l No pudimos definir un grosor de la nube por fago, pero usamos uno general.

Slide 12

Slide 12 text

Grosor de las nubes

Slide 13

Slide 13 text

Frecuencia de codones

Slide 14

Slide 14 text

Análisis de clusters: frec. codones

Slide 15

Slide 15 text

Método binario

Slide 16

Slide 16 text

Análisis de clusters: método binario

Slide 17

Slide 17 text

Sensibilidad y sensitividad: frec. codones SDnum sameHost diffHost NA 0.5 160 1 8 1 511 12 103 1.5 987 55 500 2 1404 190 628 2.5 1739 724 939 3 2139 1773 1441

Slide 18

Slide 18 text

Cytoscape: pares cercanos (frec) Cercanos 0.5 Cercanos 1.5

Slide 19

Slide 19 text

Agrupados por género (0.5*MD) Genus 0.5

Slide 20

Slide 20 text

Agrupados por género (1*MD) Genus 1

Slide 21

Slide 21 text

Sensib. y sensit. con método binario DIST sameHost diffHost NA 0 700 172 438 1 700 172 438 2 1640 877 1434 3 1640 878 1434 4 2385 2743 2934 5 2397 2758 2959 6 3061 5845 4716 7 3063 5877 4752 8 3633 9779 6909 9 3637 9820 6941 10 3994 13949 9161 11 3995 13975 9169 12 4385 17978 12007 13 4386 18011 12016 14 5014 22440 15690 15 5014 22465 15699 16 5740 29018 20868 17 5742 29064 20887 18 6406 35773 26950 19 6410 35825 26981 20 6900 41688 32162

Slide 22

Slide 22 text

Pares cercanos: 0-1 dif binario Bin 0 dif

Slide 23

Slide 23 text

Género (0 dif) y pérdida de señal Genus bin 0 Bin 3 dif

Slide 24

Slide 24 text

Lo que sigue… l Usar los métodos a nivel de secuencias. – Hay que definir secuencias “no informativas” y filtrarlas. l Ver si eliminamos codones “no informativos”. l Checar la taxonomía** de los fagos en los grupos. l Hacer “nubes” irregulares en vez de las nubes esféricas.

Slide 25

Slide 25 text

Otras cosas l Explorar frecuencias de bi, tri, … amino ácidos en fagos y demás organismos. – ¿Hay una firma para los fagos? l Probar predicciones experimentalmente – Para aprender y probar rangos de infección de fagos (predicciones).