Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porEvita Florentino Modificado hace 10 años
1
Para qué nos sirve comparar secuencias? Para inferir la posible función de una proteína nueva. Para la secuenciación de fragmentos muy largos de ADN (ordenamiento de contigs). Para estudios filogenéticos.
2
...fácil para el hombre, difícil para la computadora.
3
MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM
4
MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM...fácil para la computadora, difícil para el hombre!
5
Alineamiento global r, s : cadenas originales r´, s´: cadenas aumentadas (con posibles gaps) Un alineamiento global de las cadenas r y s es un alineamiento tal que: long(r´) = long(s´) para cada posición i se cumple que, o bien s´[i] no es un espacio o bien r´[i] no es un espacio. Score Match = +1 Mismatch= -1 Espacio= -2 GA–CGGATTAG GATCGGAATAG r : s : Score(r,s) = 9 x 1 + 1 x (-1) + 1 x (-2) = 6 Similitud(r,s) = max Score (r,s) alig Una función de score es una función que confiere un valor a un alineamiento.
6
Para alinear s[1...i] con r[1...j] tenemos las siguientes alternativas: -alinear s[1...i] con r[1...j-1] y encolumnar un espacio con r[j] -alinear s[1...i-1] con r[1...j-1] y encolumnar s[i] con r[j] -alinear s[1...i-1] con r[1...j] y encolumnar s[i] con un espacio Sim(s[1...i], r[1...j] ) = max Sim(s[1...i], r[1...j-1]) - 2 Sim(s[1...i-1], r[1...j-1]) + score(s[i],r[j]) Sim(s[1...i-1], r[1...j]) - 2 En la matriz... M(i, j) = max M(i, j-1) - 2 M(i-1, j-1) + score(s[i],r[j]) M(i-1, j) - 2
7
-4-6-20 -31-2 0 -4 -2-3-6 -4-5-8 A A A C AGC Matriz de similitud para el alineamiento entre AAAC y AGC
8
Algoritmo para calcular la similitud entre dos cadenas Entrada: secuencias r y s Salida: similitud(r,s) Para i = 0 hasta long(r) hacer M[i,0] = i x score de un espacio Para j = 0 hasta long(s) hacer M[0,j] = j x score de un espacio Para i = 0 hasta long(r) hacer Para j = 0 hasta long(s) hacer M[i,j] = max de ( M[i-1] + Score de un espacio, M[i-1,j-1] + Score (s[i],r[j]), M[i,j-1] + Score de un espacio) Devolver M[long(r), long(s) ]
9
Alineamiento local Un alineamiento local de las cadenas r y s es un alineamiento global entre una subcadena de r con una subcadena de s. Para el alineamiento local la primera fila y la primera columna de la matriz de similitud M se inicializan con ceros. M(i, j) = max M(i, j-1) - 2 M(i-1, j-1) + score(s[i],r[j]) M(i-1, j) - 2 0
10
Gaps Función de penalización de gaps: w(k) = c + g.k (k = long. del gap) a[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con s[j] b[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con un espacio encolumnado con s[j] c[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con un espacio
11
a [i, j] = score(s[i],r[j]) + max a[i-1, j-1] b[i-1, j-1] c[i-1, j-1] b [i, j] = max a[i, j-1] – (c + g) b[i, j-1] – g c[i, j-1] – (c + g) c [i, j] = max a[i-1, j] – (c + g) b[i-1, j] – (c + g) c[i-1, j] – g Para 1 i long(r) y para 1 j long(s): a[0,0] = 0 a[i,0] = - para 1 i long(r) a[0,j] = - para 1 j long(s) b[i,0] = - para 1 i long(r) b[0,j] = -(c + g.j) para 1 j long(s) c[i,0] = -(c + g.j) para 1 i long(r) c[0,j] = - para 1 j long(s) Similitud(r,s) = max (a [m,n], b [m,n], c [m,n]) con m = long (r) n = long(s)
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.