Matrices de sustitución

Slides:



Advertisements
Presentaciones similares
Santiago D. Costarelli – Darío G. Uberti Manassero
Advertisements

PSI-BLAST.
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
HOMOLOGY MODELLING Modelado por homologia o comparativo
Pronósticos, Series de Tiempo y Regresión
Bivariadas y Multivariadas
Reducción de datos Por Elizabeth León.
Encuentra las 12 diferencias
1 Modelos Cuantitativos Pronósticos PRONÓSTICO Predicción de lo que ocurrirá sobre la base de: 1. Identificación de tendencias a futuro sobre.
El sistema de puntuación
SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
APRENDIZAJE WIDROW- HOFF
ANOVA Modelo I: Comparación entre medias
DNA Mitocondrial (mtDNA) y Nature - volumen de enero de 1987
Analisis de ligamiento
T2.1 No linealidad geométrica por grandes desplazamientos y rotaciones
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
Representación de Señales y Ruido por medio de Series Ortogonales
Los HMM son modelos probabilísticos de una secuencia
Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies
Alineamientos de secuencias
UNIVERSIDAD DE CHILE, FACULTAD DE MEDICINA, ICBM, PROGRAMA DE GENETICA HUMANA ASIGNATURA “EVOLUCION” CARRERA DE MEDICINA II AÑO SEMINARIO 1: VIH-SIDA:
Distancia entre dos secuencias: Jukes - Cantor
ESTRUCTURA Y DENSIDAD ESTRUCTURA Y DENSIDAD.
Para construir un árbol filogenético se necesitan tres ingredientes básicos:
Matrices de Substitución PAM Y BLOSUM
Planetas confirmados por OGLE Pía Amigo Fuentes Profesor: Dante Minniti.
1 Metodología para Estimaciones de la Actividad Económica del Estado de Nuevo León Marzo 2005.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
UNIDAD 4 Clase 5.2 Tema: Determinantes
Planetas en Estrellas Binarias
RAZONES Y PROPORCIONES
Comparar secuencias = Obtener información
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Introducción al tema de la inflación y la tasa de interés
Inferencia Bayesiana de Filogenias Moleculares Tania Hernández.
PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
Evolución Microbiana y Sistemática
Multiplicación de matrices
Algoritmos para alineamientos locales: FastA
Análisis de correspondencia canónica (CCA)
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
Evidencias que respaldan la Evolución
1 Condiciones de extremo Proceso para derivar las condiciones De problema más simple a más complejo Progresión de problemas: Problema sin restricciones.
Las inserciones y deleciones se penalizan con un peso W Se construye una matriz H de n + 1 filas y m + 1 columnas. La secuencia de A se ubica en las filas.
Nieves Ábalos Serrano Mª Teresa Jiménez Ramírez
Hidden Markov Models Angélica Minaya Francesca Barletta Jeanette Velásquez Mónica Pajuelo Daniel Rueda.
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Genética de Poblaciones Equilibrio Hardy-Weinberg
Física Experimental IV Curso 2010 Experimento 12 Página-1 Departamento de Física Fac. Ciencias Exactas - UNLP Distribución de Poisson En cualquier serie.
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
Página Web
Matrices rango de una matriz
Congruencias y semejanzas de figuras planas
Tablas de Sobrevida y vida
EXPOSICION PÉPTIDOS Y PROTEÍNAS. TEMA 6 Danna García Paula Montenegro.
EXPOSICION PÉPTIDOS Y PROTEÍNAS. TEMA 6
Congruencias y semejanzas de figuras planas
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
Aspectos generales de la investigación educativa en el SNIT
FUNCIÓN DE PROBABILIDADES. ENTRE PROBABILIDADES Y FUNCIÓN HAY UNA ESTRECHA RELACIÓN…
COMPROMISOS DE LA CLASE
LO: SWBAT explain how protein shape is determined and differentiate between the different types of mutations. Objetivo: Explica como se determina la forma.
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
Estimación estadística
RECHAZO DE DATOS DE UNA SERIE
Curso de Excel Básico Sesión 5 1. Las Funciones Microsoft Excel
CÁLCULO DEL TIEMPO ESTÁNDAR O TIEMPO TIPO
LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.
Transcripción de la presentación:

Matrices de sustitución

Matrices PAM (Point-Accepted Mutation). Esta familia de matrices lista el cambio probable de un aminoácido por otro en secuencia de proteínas homologas durante la evolución. Cada matriz da el cambio esperado por un periodo dado. Una unidad PAM es una medida arbitraria de divergencia evolutiva en la que se asume que el 1% de los aminoácidos han cambiado entre dos proteínas. Los cambios que se observan entre proteínas homólogas son aquellos que no alteran seriamente la función de la proteína, es decir, son "aceptados" por la evolución.

Matrices PAM Dayhoff et al. (1978) uso multiples alineamientos (sin gaps) de ciertas regiones conservadas de proteinas cercanamente relacionadas (71 groups of proteins, all in all 1572 changes.) 71 trees with 1572 accepted mutations, sequences with >85% identity

Matriz PAM Estas secuencias similares fueron primero organizados en arboles filogeneticos.

Matriz PAM El numero de cambios de cada aminoácido en cada otro aminoácido fueron luego contados.

Calculo para obtener el Log odds score por cambios entre Phe y Try en una PAM 250

Calculamos la frecuencia de cambio de F x Y 0.0021. Calculamos los valores de PAM250. En PAM250 el valor de frecuencia de F x Y es 0.15. Para construir nuestra MDM. 0.15/0.04 =3.75 Log(3.75) = 0.57 0.57 x 10 =5.7

De la misma forma para Y x F. 0.20/0.03 = 6.7 Log(6.7) = 0.83 0.83 x 10 = 8.3 Calculamos el promedio de 5.7 y 8.3 = 7

MDM Mutation Data Matrix

Selección de PAM Objetivo.Detectar similaridad de secuencias. Premisa: El score de alineamiento sin gaps puede ser más alto, cuando se usa una matríz correcta Base. Homología de proteínas (Distancia evolutiva) PAM 1: 1 mutación cada 100aa PAM 200 : 25% similaridad PAM120 : 40% similaridad PAM80 : 50% similaridad PAM60 : 60% similaridad

BLOSUM (Blocks Amino Acid Substitution Matrices) Henikoff & Henikoff, 1992 Basada en bloques de más de 2000 patrones de aminoácidos conservados en aprox. 500proteínas. Matríz: Ferecuencia de cambio observada en un grando y diverso número de proteínas.

Diferencias PAM: Modelo evolutivo Basado en la extrapolación a partir de un corto periodo evolutivo. Errores en la PAM 1 son magnificados hacia la PAM 250. Asume que la tasa evolutiva es constante. Todos los residuos son iguales. BLOSUM: basado en secuencias conservadas cortas (bloques) Basado en run rango de periodos evolutivos Cada matríz es construida separadamente

Similaridades Derivadas de pequeños grupos de secuencias al azar. Requiren secuencias alineadas para su construcción. Dependen del alineamiento global sin gaps.