La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Alineamiento de secuencia de proteinas con HMM Sandra Cano.

Presentaciones similares


Presentación del tema: "Alineamiento de secuencia de proteinas con HMM Sandra Cano."— Transcripción de la presentación:

1 Alineamiento de secuencia de proteinas con HMM Sandra Cano

2 Que es alineamiento de secuencia ? Forma de representar y comparar dos o más cadenas para resaltar su zonas de similitud. Al determinar si una secuencia desconocida es similar, en algún sentido, a secuencias conocidas podremos identificarla y predecir su estructura y función Secuencias buscando los caracteres o patrones que aparezcan en el mismo orden en las secuencias. Alfabeto : a,c,d,e,f,g,hi,k,l,m,n,p,q,r,s,t,v,w,y

3 Que es un perfil? Un perfil es un conjunto de secuencias alineadas que comparten un dominio común. El problema reconocimiento de relaciones evolutivas de las proteínas.

4 Ejemplo de secuencias

5 Porque comparar secuencias? Para conocer la función de las proteinas. Para predecir la estructura 3D de las proteinas. Para determinar en que especies esta la proteina

6 Cual es el objetivo de la comparación? El objetivo es encontrar el alineamiento que con mayor probabilidad refleje qué cambios se han producido. Cuando dos secuencias son consideradas similares a un nivel significativo, significa que comparten propiedades biológicas como un origen evolutivo común, una estructura molecular similar y una función similar.

7 Ejemplos Ejemplo 1 ALRDFATHDDF SMTAEATHDSI ECDQAATHEAS A-T-H-[DE] Ejemplo 2 AGTVATVSC AGTSATHAC IGRCARGSC IGEMARLAC IGDYARWSC......... IGTVARVSC<= Ejemplo de secuencia consenso [AI]-G-x-x-A-[RT]-x-[AS]-C <= patrón

8 HMM Para perfiles han resultado de gran utilidad en estudios evolutivos o bioquimicos que toman com punto de partida un alineamiento multiple de secuencias (AMS o MSA) Permiten construir modelos (estadisticos) de familias de secuencias. Estos modelos pueden utilizarse para resolver problemas de clasificacion,alineamiento o busquedas de secuencias en base de datos.

9 HMM Sea ei(x) la probabilidad de observar x en la posición i. La probabilidad de una secuencia s = s1,..., sL bajo este modelo, W, (resp. La verosimilitud del modelo W dada una secuencia, s) será: No solemos puntuar directamente con las probabilidades sino más bien con (logaritmos) de la razón entre la verosimilitud del modelo dada la secuencia respecto la de un modelo nulo.

10 HMM Profile Sea una familia de secuencias O1,O2,...,Ok, probablemente relacionadas evolutivamente. Para cada posicion de la secuencia se definen 3 posibles estados :coincidencia, inserción y supresión A G – – – C O1 A G A G – C O2 A – C A C C O3 – G L V – C O4 + + – – – + –

11 HMM Profile Inserciones Alineadas El estado Ik inserta un residuo justo despues del estado de alineamiento Mk (no de Mk+1) Las secuencias pasan por los estados siguientes: O1 ⇒ M1 M2 M3 O2 ⇒ M1 M2 I2 I2 M3 O3 ⇒ M1? Se omite M2... Una supresión es una porción de la secuencia que “se salta” el alineamiento 3 y 4 El estado Dk salta el estado de alineamiento Mk es decir la columna alineada Mk.

12 HMM Profile Supresiones

13 HMM Profile – Modelo resultante El modelo resultante, integra todos los estados que hemos ido Introduciendo. Cada columna del alineamiento genera un estado de cada tipo

14 HMM Profile A G – – – C O1 M1M2M3 A G A G – C O2 M1M2 I2 I2M3 A – C A C C O3 M1 D2 I2 I2 I2M3 – G L V – C O4 D1M2 I2 I2M3 + + – – – + –

15 HMM Profile Estructura El alineamiento multiple consiste en las columnas marcadas con un ”+”. Se creara un modelo con tres estados de alineamiento y por lo tanto los mismos de supresion e insercion

16 HMM Profile - Contaje de emisiones Probabilidades de emision: Se estiman a partir del contaje del numero de emisiones. N(A|M1) = 3,N(Otros|M1) = 0, N(G|M2) = 3, N(Otros|M2) = 0, N(C|M3) = 4, N(Otros|M3) = 0. No aparecen estados de insercion I0, I1, I3. N(A|I2) = 2, N(C|I2) = 2, N(G|I2) = 1, N(L|I2) = 1, N(V |I2) = 1, N(Otros|I2) = 0.

17 HMM Profile - Contaje de transiciones Probabilidades de emision: Se estiman a partir del contaje del numero de transiciones. N(M1|B) = 3,N(D1|B) = 1, N(M2|M1) = 3, N(D2|M1) = 1, N(M3|M2) = 1, N(I2|M2) = 2, N(E|M3) = 3. N(I2|D2) = 1, N(I2|I2) = 4, N(M3|I2) = 3

18 HMM Profile – Clasificación de secuencias Para determinar si una secuencia O pertenece a una familia, calcularemos P(O|M): Algoritmo forward P(O|M) depende de la longitud: Utilizaremos una razon de probabilidades (verosimilitudes):

19 HMM Profile – Alineamiento a un modelo Para alinear una nueva secuencia tan solo se necesita la secuencia de estados a lo largo del modelo Pueden utilizarse dos opciones Algoritmo de viterbi: Dara el camino mas probable Algoritmo Forward/Backward: maximizara el numero de estados correctos Todo lo anterior presupone alineamientos globales. Es posible modificar los HMM para obtener alineamientos locales.

20 Programas para construir HMM HMMER Escrito por Sean Eddy y colegas en 1995. http://hmmer.janelia.org/ http://casp.rnet.missouri.edu/hmmeditor/ SAM http://compbio.soe.ucsc.edu/sam.html

21 Caracteristicas - HMMER HMMER es un implementación de perfiles HMM para el análisis de secuencias biológicas. Una secuencia se compara con un perfil HMM mediante la asignación de la secuencia de residuos a los estados en los HMM, y el puntaje resultante es una probabilidad de que la secuencia esté relacionada con el modelo dado. Los valores-e para la coincidencia se encuentran utilizando la probabilidad de la secuencia en comparación con un modelo.

22 Paquetes - HMMER Dos de estos son programas para buscar en bases de datos: hmmpfam Busca coincidencias para una secuencia de consulta dentro de una base de datos de HMM hmmsearch Busca coincidencias para un único perfil HMM dentro de una base de datos de secuencias Los otros programas incluidos en el paquete son: hmmalign Alinea secuencias a un modelo existente. hmmbuild Construye un modelo a partir de un alineamiento múltiple de secuencias hmmcalibrate Toma un HMM y determina empíricamente los parámetros que son utilizados para realizar búsquedas más sensibles, calculando puntajes de valor esperado (valor-e) más precisos. hmmconvert Convierte un archivo de modelo a diferentes formatos, incluyendo un formato binario compacto HMMER 2, y la emulación de “mejor esfuerzo” de perfiles GCG. hmmemit Emite secuencias de un perfil HMM probabilísticamente. hmmfetch Obtiene un único modelo de una base de datos HMM. hmmindex Indexa una base de datos HMM.

23 HMMER

24 Referencias Libro The ten Most Wanted Soluctions in Protein Bioingormatics. Discusión Problema 1 Articulo revista ScienceDirect : Sequence-based protein structure prediction using a reduced state-space hidden Markov model.2006 Articulo publicado por la UAM. Comparación de secuencias biológicas allgoritmica. Doctorado de bioinformatica. HMMER: Como utilizar la herramienta http://hmmer.janelia.org/.http://hmmer.janelia.org/ Articulo Internet: Como publicar herramientas para la construcción de Modelos Ocultos de Markov por: Rafael Carillo y Claudia Lara.


Descargar ppt "Alineamiento de secuencia de proteinas con HMM Sandra Cano."

Presentaciones similares


Anuncios Google