Para qué nos sirve comparar secuencias? Para inferir la posible función de una proteína nueva. Para la secuenciación de fragmentos muy largos de ADN (ordenamiento.

Slides:



Advertisements
Presentaciones similares
Apuntes 2º Bachillerato C.T.
Advertisements

Tipos de matrices fila opuesta cuadrada nula triangular simétrica
Sesión 2 Programación Estructurada
Matrices y Determinantes
Un libro de Microsoft Excel es un archivo que contiene una o más hojas de cálculo (hoja de cálculo: documento principal que se utiliza en Excel para almacenar.
Unidad 6 Transporte y asignación
ALGORITMO DEL SIMPLEX Paso inicial Paso iterativo Prueba de optimalidad Fin SINO.
Alineamiento de Secuencias Biológicas
Programación dinámica (1)
Encuentra las 12 diferencias
La función BUSCAR devuelve un valor de un rango de una fila o una columna o de una matriz. Forma matricial: Buscar el valor especificado en la primera.
Cadenas de Caracteres y Emparejamiento de Patrones
2- SIMPLEX.
El algoritmo primal-dual
Clases 4 Pruebas de Hipótesis
Presentación Liceo: Francisco Del Rosario Sánchez. Nombre: Diana Eliza Cabrera De La Rosa, #7. Asignatura: Matemáticas. Profesor: Sócrates Orlando Peguero.
COMPUTACIÓN 2 Conceptos generales.
Especificación de Consultas M
ANALISIS MATEMÁTICO PARA ECONOMISTAS IV
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
Algoritmos.
En PDB hay estructuras experimentales de proteínas.
Práctica 1: Alineamientos Partimos de un archivo de datos que contiene 5 secuencias de mRNA asociado a la CFTR archivo de prácticas archivo de prácticas.
Divide y vencerás 1. Método general.
Matrices de Substitución PAM Y BLOSUM
Capitulo 3 Segmentación.
A esto se le llama ser eficaz Ordenamos y mejoramos la información: A esto se le llama ser eficaz Operamos con matrices Imagen de DieselDemon bajo licencia.
Procesamiento de Imágenes digitales
Alineamiento de dos secuencias
Ditribución del valor extremo Distribucion del maximo de N scores de matching de secuencias random independientes Si la probabilidad de este.
Periféricos de la Computadora Práctica 23. Periféricos de la Computadora Son dispositivos que le ayudan a la computadora a comunicarse con el exterior.
Parte I. Estructuras de Datos.
Problema de inclusión en una Curva Digital Por Orellana Muñoz, Alfonso Paz Vicente, Rafael Pérez Medina, Gerardo Rodríguez Naranjo.
Alineamiento de secuencias múltiples ¿ Por qué alinear simultáneamente varias secuencias? Un ejemplo claro de este caso sería comparar proteínas muy conservadas.
Matrices Departamento de Computación Escuela de Ingeniería de Sistemas
Matrices: conceptos generales
Multiplicación de matrices
ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005.
Algoritmos para alineamientos locales: FastA
Matrices de sustitución
Tema 11: Programación dinámica
Arreglos Computción.
Parte I. Estructuras de Datos.
Representación RUNS conversiones entre representaciones matriz binaria y secuencia Juan Manuel García Sánchez Pablo de la Torre Moreno.
Imágenes binarias Horn, Robot Vision
Las inserciones y deleciones se penalizan con un peso W Se construye una matriz H de n + 1 filas y m + 1 columnas. La secuencia de A se ubica en las filas.
Determinantes cálculo de determinantes
Matrices Prof. Flor Narciso Departamento de Computación
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Oscar F. Bedoya L. Fundamentos de análisis y diseño de algoritmos.
Unidad II Aplicaciones con Arreglos en Java y C++
Software El software permite comunicar al computador los problemas y hace posible que nos comunique las soluciones Los programas son el software del computador.
Determinantes cálculo de determinantes
Matrices rango de una matriz
MATRICES Y DETERMINANTES
@ Angel Prieto BenitoApuntes 2º Bachillerato C.S.1 MATEMÁTICAS A. CS II Tema II Matrices.
Arreglos: Vectores Prof. Flor Narciso Departamento de Computación Escuela de Ingeniería de Sistemas Facultad de Ingeniería Universidad de Los Andes.
Matrices.
DIALIGN DIagonal ALIGNments Marcelo Piriz Daiana Mir.
L ENGUAJE DE E SPECIFICACIÓN Algoritmos y Estructuras de Datos I Especificación – Práctica 4 AEDI Especificación – Práctica 4 1.
L ENGUAJE DE E SPECIFICACIÓN Algoritmos y Estructuras de Datos I Especificación – Práctica 2 AEDI Especificación – Práctica 2 1.
Búsqueda de ascensión de colinas (BLv)
Arreglos Matlab Dr. Pope ITD. Arrays (Vectores y Matrices) En matemáticas es necesario trabajar variables con subíndices. Por ejemplo a 1, a 2, a 3,....,
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
@ Angel Prieto BenitoApuntes 2º Bachillerato C.S.1 MATRICES U.D. 2 * 2º BCS.
Programación Dinámica  La programación dinámica se suele utilizar en problemas de optimización, donde una solución está formada por una serie de decisiones.
Matrices rango de una matriz
CI 43A Análisis de Sistemas de Transporte
TALLER Nº2: Modelo de Distribución de Viajes
GLOBAL GAP.
Transcripción de la presentación:

Para qué nos sirve comparar secuencias? Para inferir la posible función de una proteína nueva. Para la secuenciación de fragmentos muy largos de ADN (ordenamiento de contigs). Para estudios filogenéticos.

...fácil para el hombre, difícil para la computadora.

MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM

MSLFLGVRVRAEEAGARVQQNVPSGTDTGDPQSKPLGDWAAGTMDPESSIFIEDAIKYF KEKVSTQNLLLLTDNEAWNGFVAAAELPRNEADELRKALDNLARQMIMKDKNWHDKG QQYRNWFLKEFP RLKSKLEDNTRRLRALADGVQKVHKGTTIANVVSGSLSISSGILTLVG MGLAPFTEGGSLVLLEPGMELGITAALTGITSSTIDYGKKWWTQAQAHDLVIKSLDKLKE LLLPCIPLASTATRATPEQLRKCKFQQPWSKEKVSTQNLLLLTDNEAWNGFVAAAELPRN EADELRKALDNLARQMIMKDKNWHDKGQQYRNWFLKEFP RLKSKLEDNTRRLRALAD GVQKVHKGTTIANVVSGSLSISSGILTLVGMGLAPFTEGGSLVLLEPGMELGITAALTGITS STIDYGKKWWTQAQAHDLVIKSLDKLKEFLDCYHEKSD FPTYWIVIVGIINILSCTFF SITI YPTFNFGWNSPNALGY PQEPDEHIPL MEELQDDYEDMMEENLEQEEYEDPDIPESQMEEPAAHDTEATATDYHTTSHPGTHKVYVE LQELVMDEKNQELRWMEAARWVQLEENLGENGAWGRPHLSHLTFWSLLELRRVFTKGTV LLDLQETSLAGVANQLLDRFIFEDQIRPQDREELLRALLLKHSHAGELEALGGVKPAVLTRD PSQPLLPQHSSLETQLFCEQGDGGTEGHSPSGILEKI PPDSEATLVLVGRADFLEQPVLGFVR LQEAAELEAELPVPIRFLFVLLGPEAPHIDYTQLGRAAATLMS ERVFRIDAYM...fácil para la computadora, difícil para el hombre!

Alineamiento global r, s : cadenas originales r´, s´: cadenas aumentadas (con posibles gaps) Un alineamiento global de las cadenas r y s es un alineamiento tal que: long(r´) = long(s´) para cada posición i se cumple que, o bien s´[i] no es un espacio o bien r´[i] no es un espacio. Score Match = +1 Mismatch= -1 Espacio= -2 GA–CGGATTAG GATCGGAATAG r : s : Score(r,s) = 9 x x (-1) + 1 x (-2) = 6 Similitud(r,s) = max Score (r,s) alig Una función de score es una función que confiere un valor a un alineamiento.

Para alinear s[1...i] con r[1...j] tenemos las siguientes alternativas: -alinear s[1...i] con r[1...j-1] y encolumnar un espacio con r[j] -alinear s[1...i-1] con r[1...j-1] y encolumnar s[i] con r[j] -alinear s[1...i-1] con r[1...j] y encolumnar s[i] con un espacio Sim(s[1...i], r[1...j] ) = max Sim(s[1...i], r[1...j-1]) - 2 Sim(s[1...i-1], r[1...j-1]) + score(s[i],r[j]) Sim(s[1...i-1], r[1...j]) - 2 En la matriz... M(i, j) = max M(i, j-1) - 2 M(i-1, j-1) + score(s[i],r[j]) M(i-1, j) - 2

A A A C AGC Matriz de similitud para el alineamiento entre AAAC y AGC

Algoritmo para calcular la similitud entre dos cadenas Entrada: secuencias r y s Salida: similitud(r,s) Para i = 0 hasta long(r) hacer M[i,0] = i x score de un espacio Para j = 0 hasta long(s) hacer M[0,j] = j x score de un espacio Para i = 0 hasta long(r) hacer Para j = 0 hasta long(s) hacer M[i,j] = max de ( M[i-1] + Score de un espacio, M[i-1,j-1] + Score (s[i],r[j]), M[i,j-1] + Score de un espacio) Devolver M[long(r), long(s) ]

Alineamiento local Un alineamiento local de las cadenas r y s es un alineamiento global entre una subcadena de r con una subcadena de s. Para el alineamiento local la primera fila y la primera columna de la matriz de similitud M se inicializan con ceros. M(i, j) = max M(i, j-1) - 2 M(i-1, j-1) + score(s[i],r[j]) M(i-1, j) - 2 0

Gaps Función de penalización de gaps: w(k) = c + g.k (k = long. del gap) a[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con s[j] b[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con un espacio encolumnado con s[j] c[i,j] = máximo score de un alineamiento entre r[1...i] y s[1...j ] que termina con r[i] encolumnado con un espacio

a [i, j] = score(s[i],r[j]) + max a[i-1, j-1] b[i-1, j-1] c[i-1, j-1] b [i, j] = max a[i, j-1] – (c + g) b[i, j-1] – g c[i, j-1] – (c + g) c [i, j] = max a[i-1, j] – (c + g) b[i-1, j] – (c + g) c[i-1, j] – g Para 1  i  long(r) y para 1  j  long(s): a[0,0] = 0 a[i,0] = -  para 1  i  long(r) a[0,j] = -  para 1  j  long(s) b[i,0] = -  para 1  i  long(r) b[0,j] = -(c + g.j) para 1  j  long(s) c[i,0] = -(c + g.j) para 1  i  long(r) c[0,j] = -  para 1  j  long(s) Similitud(r,s) = max (a [m,n], b [m,n], c [m,n]) con m = long (r) n = long(s)