La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos.

Presentaciones similares


Presentación del tema: "© Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos."— Transcripción de la presentación:

1 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos para probar y modificar funciones de proteínas concretas Identificación de nuevos miembros de una familia de proteínas Comparación múltiple de secuencias 12345678910 IYDGGAV-EAL IIYDGG---EAL IIIFEGGILVEAL IVFD-GILVQAV VYEGGAVVQAL ConsydGGA/IV/LVeAl Alineamiento múltiple = Tabla 2D

2 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Comparación múltiple de secuencias FHIT_HUMAN -----------MS-F RFGQHLIKP-SVVFL KTELSFALVNRKPVV PGHVLV... APH1_SCHPO -----------MPKQ LYFSKFPVG-SQVFY RTKLSAAFVNLKPIL PGHVLV... HNT2_YEAST MILSKTKKPKSMNKP IYFSKFLVT-EQVFY KSKYTYALVNLKPIV PGHVLI... Y866_METJA -----------MCIF CKIINGEIP-AKVVY EDEHVLAFLDINPRN KGHTLV... Un método de alineamiento múltiple verdadero, deber í a alinear todas las secuencias al mismo tiempo. Pero no existe un método computacional que pueda realizar esto en tiempo razonable

3 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Usando Prgramaci ó n din á mica en una matriz tridimensional Objetivo: encontrar el camino óptimo Cómo se resuelve un alineamiento múltiple de 3 secuencias?

4 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Complejidad del algoritmo de Programaci ó n Din á mica (PD) El número de comparaciones que el PS tiene debe realizar para llenar la matriz (sin usar heurísticas y excluyendo gaps) es el producto de las longitudes de las dos secuencias (N x M) La complejidad del algoritmo crece en forma exponencial con el número de secuencias Alinear dos secuencias de 300 nt implica realizar 300 x 300 = 90,000 comparaciones Alinear tres secuencias de 300 nt implica realizar 300 x 300 x 300 = 27,000,000 comparaciones!!

5 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Aproximaciones al algoritmo de Programaci ó n Din á mica Alinear todas las secuencias por pares Usar los scores para construir un árbol Alinear progresivamente (siguiendo el orden que sugiere el árbol) todas las secuencias para producir un Alineamiento Múltiple No es un verdadero Alineamiento Múltiple Las secuencias se alinean por pares

6 © Copyright Ebiointel,SL 2006 Alineamiento múltiple

7 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W Thompson J.D., Higgins D.G., Gibson T.J. (1994) "CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice."; Nucleic Acids Res. 22:4673-4680 Programa de alineamiento múltiple Alineamiento progresivo

8 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W Thompson J.D., Higgins D.G., Gibson T.J. (1994) "CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice."; Nucleic Acids Res. 22:4673-4680 Estrategia general Alineamiento rápido obtención de las mejores parejas análisis de clusters creación de un árbol guía Alineamiento múltiple se utiliza el árbol guía anterior optimización alineamiento de los pares más próximos introducción de gaps para mejorar el alineamiento alineamiento de las parejas optimización mediante inclusión de nuevos gaps

9 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Opciones Generales Clustal W YOUR EMAIL SEARCH TITLE CPU MODE clustalw_mp - multiprocessor SGI systems. clustalw - genérico (CPU simple) ALIGNMENT Permite realizar alineamientos completos utilizando algoritmos restrictivos que generan un árbol guía o algoritmos más rápidos. OUTPUT Formato del resultado (ALN, GCG, PHYLIP, PIR and GDE) OUTORDER Orden de las secuencias COLOR Muestra el alineamiento en colores (solo en formatos ALN or GCG) AVFPM ILW REDSmall (small+ hydrophobic (incl.aromatic -Y)) DEBLUEAcidic RHKMAGENT A Basic STYHC NGQ GREENHydroxyl + Amine + Basic - Q OthersGray Línea consenso " * " = residuos idénticos o conservados en todas las secuencias " : " = sustituciones conservadas ". " = sustituciones semi-conservadas.

10 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Opciones FAST PAIRWISE ALIGNMENT Opciones MULTIPLE ALIGNMENT KTUP Tamaño de la palabra WINDOW Tamaño de la ventana SCORE Valoración a considerar al calcular el apareamiento TOPDIAG Número de top diagonal que se integraran al calcular el apareamiento PAIRGAP Penalización de la abertura de gaps MATRIX GAPOPEN Penalización por la abertura de un gap ENDGAP Penalización por el cierre de un gap GAPEXT Penalización por la extensión de un gap GAPDIST Penalización por la separación de gaps

11 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W (EBI)

12 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Formato secuencias para Clustal W Formato FASTA >FOSB_HUMAN P53539 homo sapiens (human). fosb protein MFQAFPGDYDSGSRCSSSPSAESQYLSSVDSFGSPPTAAASQECAGLGEMPGSFVPTVT A ITTSQDLQWLVQPTLISSMAQSQGQPLASQPPVVDPYDMPGTSYSTPGMSGYSSGGASG S GGPSTSGTTSGPGPARPARARPRRPREETLTPEEEEKRRVRRERNKLAAAKCRNRRRELT DRLQAETDQLEEEKAELESEIAELQKEKERLEFVLVAHKPGCKIPYEEGPGPGPLAEVRD LPGSAPAKEDGFSWLLPPPPPPPLPFQTSQDAPPNLTASLFTHSEVQVLGDPFPVVNPSY TSSFVLTCPEVSAFAGAQRTSGSDQPSDPLNSPSLLAL >FOSB_MOUSE P13346 mus musculus (mouse). fosb protein. MFQAFPGDYDSGSRCSSSPSAESQYLSSVDSFGSPPTAAASQECAGLGEMPGSFVPTVT A ITTSQDLQWLVQPTLISSMAQSQGQPLASQPPAVDPYDMPGTSYSTPGLSAYSTGGASGS GGPSTSTTTSGPVSARPARARPRRPREETLTPEEEEKRRVRRERNKLAAAKCRNRRRELT DRLQAETDQLEEEKAELESEIAELQKEKERLEFVLVAHKPGCKIPYEEGPGPGPLAEVRD LPGSTSAKEDGFGWLLPPPPPPPLPFQSSRDAPPNLTASLFTHSEVQVLGDPFPVVSPSY TSSFVLTCPEVSAFAGAQRTSGSEQPSDPLNSPSLLAL Eliminar espacios entre secuencias

13 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados

14 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados JalView

15 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados Clustal W (.dnd)

16 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Árboles Phylodendron Phylogenetic tree printer

17 © Copyright Ebiointel,SL 2006 Alineamiento múltiple Práctica ClustalW - Primers Diseño primers Realizar una traducción reversa de los primers en la Sequence Manipulation Suite de la Univ de Alberta Mediante las tablas de uso de codones, disminuir la degeneración de los primers adaptándolos al uso del Microorganismo problematablas de uso de codones Comparación múltiple Abrir una sesión Clustal WClustal W Fija los parámetros e introduce las secuencias usando el archivo múltiple al que hemos añadido todas las secuencias a alinear. Ejecutar Clustal W Visualizar los resultados Identificar y almacenar les regiones conservadas (primers) Árboles Visualizar el archivo.dnd con Phylodendron (o TreeView local)Phylodendron Variar la topología del árbol enraizándolo a un outgroup arbitrario


Descargar ppt "© Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos."

Presentaciones similares


Anuncios Google