Alineamiento de Secuencias Biológicas

Slides:



Advertisements
Presentaciones similares
LOGARITMOS.
Advertisements

EL ROBOTICA DE Y ARTIFICIAL DEL INTELIGENCIA
Coordenadas en el espacio
Paso 1 Portada YO SOY EUROPEO Comisión Europea.
Análisis por Comparación de Pares
Jacqueline Chávez Cuzcano
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Matemática Financiera 1º ADEUtilización de la Función TIR en el cálculo del tanto efectivo 1 de 37 Cálculo de tantos efectivos Utilización de la función.
Aranda Fernández, Miguel Ángel García Redondo, Luis Miguel
4. ANÁLISIS FACTORIAL Introducción Modelo factorial ortogonal
Estados de Bloch En una red periodica las funciones de onda permitidas tienen la propiedad donde R es un vector de la red real Portanto   Donde la funcion.
4. Fonones: Vibraciones Cristalinas
Cuestiones y problemas
ANALISIS DE IMÁGENES A PARTIR DE LA PRESENTACIÓN DE ALGUNAS IMÁGENES, PEDIR A LOS NIÑOS QUE OBSERVEN LAS ILUSTRACIONES Y QUE DESCRIBAN EN SU CUADERNO LAS.
Aritmética del Computador Introducción a la Tecnología de la Información.
IBD Clase 7.
Hola, Maria. Hola, Juan. Vamos a contar.
Objetivo: Los estudiantes van a usar comparativos y superlativos para describir sus comidas y bebidas favoritas. PRÁCTICA: Escribe 3 oraciones (de 5+palabras)
Ecuaciones de Valor Absoluto y Desigualdades
Los números (1-10).
Procesamiento de cadenas
CLASE 1 SISTEMAS NUMÉRICOS Y CÓDIGOS
Razonamiento Cuantitativo
Recursión y Relaciones de Recurrencia
Unidad de competencia II Estadística descriptiva:
Los elementos invertibles de Z6 son 1 y 5
Investigación de Operaciones
Pulso de onda Ecuación de ondas v Movimiento sentido positivo de x
DESCRIPCION DE SISTEMAS
Coincidencia de imagen a través de cadena de triángulos
Factorización de Polinomios
Método para resolver colisiones
Operaciones sobre un árbol
Desigualdades Lineales y Compuestas
Curso de Programación 1 Plan 97
Comité Nacional de Información Bogotá, Octubre 24 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE.
3. Métodos de resolución Ecuaciones algebraicas lineales
PROGRAMACION DE ESTRUCTURAS DE DATOS
CONCEPTO DE MARCO LÓGICO
Máquinas con Vectores de Soporte - SVM
Programación dinámica (1)
DETERMINANTES DE UNA MATRIZ
Números enteros.
Tema 2 Orden de contacto Polinomios de Taylor Teorema de Taylor
Encuentra las 12 diferencias
¿Quién la hizo? Tienes que adivinar quién hizo cada obra de arte, basado en los apuntes que tomaste y las obras que vimos de los artistas.
V.Álvarez M.D. Frau J.R. Narro P. Reyes Matemática Discreta Tema 5: Coloración 1/24 Capítulo 5: Coloración Introducción. Coloración de vértices. Coloración.
Agrupamiento de relaciones no lineales entre expresiones de genes
La función BUSCAR devuelve un valor de un rango de una fila o una columna o de una matriz. Forma matricial: Buscar el valor especificado en la primera.
Inteligencia Artificial Resolver problemas mediante búsqueda
1. Tipos de dibujos 2. Escalas 3. Sistemas de representación
1 LAS OBLIGACIONES DE L. PLAZO PUEDEN TENER VARIAS MODALIDADES DE PAGO:
EDUCACIÓN PARA LOS PADRES
Almacenamiento y Recuperacion de Información TAD_ABB Ana Lilia Laureano Cruces Universidad Autónoma Metroplotiana.
Inteligencia Artificial Resolver problemas mediante búsqueda
Ordenación, Clasificación
Extracto del material disponible en Estrategias para la recolección de basura (Garbage Collection.
O (m × n).
MEJORAR LA TENCIÓN Actividades 3
Algoritmos de ordenación
La PD no es adecuada para buscar en BD
COMPUTACIÓN 2 Conceptos generales.
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005.
Las inserciones y deleciones se penalizan con un peso W Se construye una matriz H de n + 1 filas y m + 1 columnas. La secuencia de A se ubica en las filas.
Introducción a Excel Fórmulas
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
DIALIGN DIagonal ALIGNments Marcelo Piriz Daiana Mir.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
Alineamiento de secuencia de proteinas con HMM Sandra Cano.
Transcripción de la presentación:

Alineamiento de Secuencias Biológicas

Generalidades Bases Aminoácidos Proteinas Alineamiento de secuencias

El DNA y las proteínas son macromoléculas biológicas construidas como cadenas lineales de componentes químicos. En el caso del DNA estos componentes son los nucleótidos, de los cuales hay cuatro diferentes. Cada uno denotado por una de las letras A, C, G y T. Las proteínas están compuestas de 20 diversos aminoácidos (o de " residuos ") que serán denotados por 20 diferentes letras del alfabeto.

Nucleótidos A G C T/U DNA Adenina Guanina Citosina Tiamina RNA Guanine Cytosine Uracil

Aminoácidos One-letter code Three-letter-code Name 1 A Ala Alanine 2 C Cys Cysteine 3 D Asp Aspartic Acid 4 E Glu Glutamic Acid 5 F Phe Phenylalanine 6 G Gly Glycine 7 H His Histidine 8 I Ile Isoleucine 9 K Lys Lysine 10 L Leu Leucine 11 M Met Methionine 12 N Asn Asparagine 13 P Pro Proline 14 Q Gln Glutamine 15 R Arg Arginine 16 S Ser Serine 17 T Thr Threonine 18 V Val Valine 19 W Trp Tryptophan 20 Y Tyr Tyrosine

Alineamiento de Secuencias Comparar secuencias consiste en buscar todas las zonas de similitud significativa entre dos o más secuencias Sitios comunes: | ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC | | | | | | | | | | | | | | | | CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT desplazar una de las secuencias dos posiciones ATGCATGCATGCATGCATATATATATATATATATGCATGCATGCATGCATGC | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | CGATCGATCGATCGATATATATATATGCATATATATGCATGCATGCATGCAT

Alineamiento Global Algoritmo de Needleman-Wunsch Encuentra el alineamiento global de dos secuencias vía Programación Dinámica Inicialización Llenado de Matriz (scoring) Recuperación de la solución (Backtracking)

Recursión del alineamiento F(i, j)= max F(i-1, j-1)+s(i,j) F(i-1, j)-w F(i, j-1)-w w=Penalización Hueco S(i,j) Función de similitud

Recursión del alineamiento G A A T T C A G T T A (secuencia #1) G G A T C G A (secuencia #2) M = 11, longitud de la secuencia #1 y N = 7, longitud de la secuencia #2

Inicialización crear una matriz de M+1 columnas y N+1. La primera fìla y la primera columna son rellenadas con cero

Llenar Matriz (scoring) El llenado de la matriz corresponde a dar un valor a la intersección de las filas y las columnas, según el esquema de puntajes

Llenar Matriz (scoring)

Recuperación de la solución (Backtracking) Consiste en tomar la última coincidencia del alineamiento y comenzar a buscar el camino que maximice la función El máximo alineamiento es de 6 . El retroceso comienza en la posición M,J de la matriz en la posición donde se presenta el máximo puntaje del alineamiento. El algoritmo recorre los vecinos de la celda actual para identificar sus predecesores. Esto es mira los vecinos a la izquierda , el vecino diagonal y el vecino de arriba. Se marcan en rojo los posibles vecinos. En el ejemplo son todos iguales a 5 Si la posición inicial no tuviera coincidencia cualquiera de los vecinos son validos para comenzar a realizar el alineamiento Todos generan un alineamiento diferente, por lo tanto es importante analizar desde el punto de vista de los pesos el mejor camino y tomarlo

Recuperación de la solución (Backtracking) Se marcan en rojo los posibles vecinos. En el ejemplo son todos iguales a 5 Una vez determinado el màximo valor se comienza a subir por la diagonal de la matriz buscando el camino que maximiza la funciòn.

Recuperación de la solución (Backtracking) Al verificar los vecinos los valores posibles son 4 y 5. El valor que maximiza la función es MAX(4,4,5) = 5 El camino a tomar es el 5, para lo cual se debe de desplazar una columna a la izquierda del valor que se esta maximizando

Recuperación de la solución (Backtracking) Así sucesivamente se va recorriendo la matriz, siempre teniendo presente que cuando en un punto todos los puntajes son iguales y la penalización es igual, se puede tomar cualquier camino generando múltiples soluciones Alineamiento: G A A T T C A G T T A | | | | | | G G A _ T C _ G _ _ A  

Solución alternativa: Alineamiento: G _ A A T T C A G T T A | | | | | | G G _ A _ T C _ G _ _ A

Características Cualquier prefijo del alineamiento óptimo entre x y y es un alineamiento óptimo entre un prefijo x1...i de x y un prefijo y1...j de y F(i, j)=maximo puntaje de un alineamiento entre x1...i y y1...j F(n, m)=maximo puntaje de un alineamiento global entre x y y El valor F(i, j) depende solamente de los valores F(i-1, j-1), F(i-1, j) F(i, j -1)

un alineamiento óptimo entre x1...i y y1...j consiste de Un alineamiento óptimo entre x1 ... (i-1) y y1 ... (j-1) extendido con una coincidencia entre xi y yj; o Un alineamiento óptimo entre x1 ... (i-1) y y1 ... j extendido con una coincidencia entre xi y un hueco; o Un alineamiento óptimo entre x1 ... i y y1 ... (j-1) extendido con una coincidencia entre un hueco y yi

Cómo encontrar un alineamiento óptimo? Cuando se llena F(i, j), se almacena el rastro (Backtracking) B(i, j) desde (i, j) el BackTracking apunta a la celda que produjo el máximo puntaje: (i-1, j-1) o (i-1, j) o (i, j -1) Al terminar, se encuentra un alineamiento óptimo siguiendo el rastro desde (n, m) hasta (0, 0)

Needleman-Wunsch

Penalización: -0.5 para las no coincidencias