$30 off During Our Annual Pro Sale. View Details »

fagos2008

 fagos2008

Leonardo Collado-Torres

December 04, 2008
Tweet

More Decks by Leonardo Collado-Torres

Other Decks in Science

Transcript

  1. Bacteriófagos: analizando su
    diversidad
    Leonardo Collado Torres
    Sur Herrera Paredes
    Licenciatura en Ciencias
    Genómicas, UNAM
    Cuernavaca, México
    4 de Diciembre de 2008

    View Slide

  2. Índice
    l Introducción
    – Diversidad, problema, interés.
    l Uso de Codones
    l Análisis de clusters
    l Análisis de pares de fagos cercanos
    – Sensibilidad, sensitividad, red visual.
    l Lo que sigue…

    View Slide

  3. Diversidad
    l Son los organismos más abundantes en la
    Tierra.
    l Metagenomas virales: más huérfanos
    (ORFans) que en cualquier otro conjunto de
    secuencias.
    l Genomas mosaicos.
    l Su clasificación taxonómica es por
    morfología. Tsk tsk.

    View Slide

  4. Problema
    l No hay un elemento común entre fagos. ¡No
    hay equivalente al 16s ARNr!
    l ¿Y los genes de las cápsides?
    – Cápsides morfológicamente parecidas no son
    homólogas a nivel de amino ácidos.
    l ¿Tienen los fagos un origen monofilético?
    – Para hacer una clasificación filogenética la
    respuesta tendría que ser que sí.
    – Creemos que no es cierto.

    View Slide

  5. Interés
    l Hacer una clasificación ecológica de los
    fagos.
    l Representar sus interacciones con los
    hospederos.
    l Previamente: contenido proteico
    l Este semestre nos enfocamos en
    frecuencias y uso de codones.

    View Slide

  6. ¿Por qué uso de codones?
    l Un fago usa la maquinaria del hospedero para
    traducirse.
    l Complementación de tRNAs con el hospedero.
    l Hay cierta correlación entre:
    – nivel de expresión y uso de codones (bact).
    – nivel de expresión y genes esenciales (bact).
    l En bacterias, hay una relación entre la filogenia de
    estas y el uso de codones.

    View Slide

  7. Bacillus
    Subtilus
    Pseudomonas
    Aeruginosa
    Staphylococcus
    _aureus_N315
    (2 replicones)
    Escherichia_col
    i_K12_substr__
    MG1655

    View Slide

  8. ¿Cómo medir el uso de codones?
    l Métodos anteriores:
    – Una ji cuadrada dividida por la longitud del organismo.
    – CAI: depende de un grupo de secuencias nuclear.
    – SCCI (Carbone).
    – SCUO.
    l Desventajas
    – Te dan un valor de 0 a 1 para todo el organismo.
    – No puedes agrupar fagos con ellos.
    l Creamos y exploramos unos nuevos
    – Eliminamos errores en archivos Genome_Reviews.

    View Slide

  9. Nubes de frecuencias de codones
    l Por cada fago, relativizamos el promedio de las frecuencias de
    los 64 codones.

    View Slide


  10. l Definimos “nubes” por fago
    – El centro es la media de cada codón: punto en 64
    D.
    – El grosor de la nube es el promedio de las 64
    desviaciones estándar.
    l Analizamos los pares de fagos que cayeron
    adentro de sus nubes.
    l Hicimos un clustering y analizamos los
    clusters resultantes.

    View Slide

  11. Uso de codones: binario
    l Eliminamos los codones de paro, W y M.
    l Por fago, relativizamos los valores por amino
    ácido.
    l Al máximo(s) por aa le dimos el valor de 1, al
    resto 0.
    l No pudimos definir un grosor de la nube por
    fago, pero usamos uno general.

    View Slide

  12. Grosor de las nubes

    View Slide

  13. Frecuencia de codones

    View Slide

  14. Análisis de clusters: frec. codones

    View Slide

  15. Método binario

    View Slide

  16. Análisis de clusters: método binario

    View Slide

  17. Sensibilidad y sensitividad: frec.
    codones
    SDnum sameHost diffHost NA
    0.5 160 1 8
    1 511 12 103
    1.5 987 55 500
    2 1404 190 628
    2.5 1739 724 939
    3 2139 1773 1441

    View Slide

  18. Cytoscape: pares cercanos (frec)
    Cercanos 0.5
    Cercanos 1.5

    View Slide

  19. Agrupados por género (0.5*MD)
    Genus 0.5

    View Slide

  20. Agrupados por género (1*MD)
    Genus 1

    View Slide

  21. Sensib. y sensit. con método binario
    DIST sameHost diffHost NA
    0 700 172 438
    1 700 172 438
    2 1640 877 1434
    3 1640 878 1434
    4 2385 2743 2934
    5 2397 2758 2959
    6 3061 5845 4716
    7 3063 5877 4752
    8 3633 9779 6909
    9 3637 9820 6941
    10 3994 13949 9161
    11 3995 13975 9169
    12 4385 17978 12007
    13 4386 18011 12016
    14 5014 22440 15690
    15 5014 22465 15699
    16 5740 29018 20868
    17 5742 29064 20887
    18 6406 35773 26950
    19 6410 35825 26981
    20 6900 41688 32162

    View Slide

  22. Pares cercanos: 0-1 dif binario
    Bin 0 dif

    View Slide

  23. Género (0 dif) y pérdida de señal
    Genus bin 0
    Bin 3 dif

    View Slide

  24. Lo que sigue…
    l Usar los métodos a nivel de secuencias.
    – Hay que definir secuencias “no informativas” y
    filtrarlas.
    l Ver si eliminamos codones “no informativos”.
    l Checar la taxonomía** de los fagos en los
    grupos.
    l Hacer “nubes” irregulares en vez de las
    nubes esféricas.

    View Slide

  25. Otras cosas
    l Explorar frecuencias de bi, tri, … amino
    ácidos en fagos y demás organismos.
    – ¿Hay una firma para los fagos?
    l Probar predicciones experimentalmente
    – Para aprender y probar rangos de infección de
    fagos (predicciones).

    View Slide