SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Slides:



Advertisements
Presentaciones similares
Sistema en Diferencias Finitas
Advertisements

Tema 4: Medidas de posición individual.
Estrategias Reconocer fragmentos de secuencia asociados a características funcionales o estructurales concretas Agrupar la secuencia en una familia y heredar.
CAE (computer aided engeneering)
PSI-BLAST.
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
DESCUBRIMIENTO Y DISEÑO DE DROGAS
LOCALIZACIÓN DEL PROYECTO
GESTIÓN DE LOS COSTOS DEL PROYECTO
ANÁLISIS EXPLORATORIO DE DATOS
en general, mínimos energéticos
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos
Clase # 8: Análisis Conformacional (II)
Reducción de datos Por Elizabeth León.
Alineamiento de Secuencias Biológicas
Programación dinámica (1)
Encuentra las 12 diferencias
Tests de permutaciones y tests de aleatorización
El sistema de puntuación
¿Cómo hacer más rentables nuestras decisiones?. Rentabilidad Monto de cada préstamo $ Costo Fijo Total $ Gastos Adm por crédito $ 130 Tasa.
EVALUACION DE SISTEMAS CONSTRUCTIVOS CONSTRUCCION III EVALUACION DE SISTEMAS CONSTRUCTIVOS CONSTRUCCION III
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
SISTEMAS DE INFORMACIÓN 2 SISTEMAS DE INFORMACIÓN 2.
La PD no es adecuada para buscar en BD
PROSPECCIÓN DE GENES CANDIDATOS PARA CARACTERES ASOCIADOS AL RENDIMIENTO EN TRIGO PAN Ramírez IA 1, AC Pontaroli 2 Introducción 1 FCA-UNMdP; 2 EEA Balcarce.
Profile HMMs Perfiles de Modelos ocultos de Markov
Análisis y Diseño de Algoritmos. Propiedades : f ( n )  O ( f ( n ) ) a ) O ( f ( n ) )  O ( g ( n ) )  f ( n )  g ( n )
NIVELES ESTRUCTURALES DE LAS PROTEINAS
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
En PDB hay estructuras experimentales de proteínas.
COGs Cluster of Orthologous Groups. Genes Ortólogos Comparten una gran similitud en secuencias. Pueden provenir de un ancestro común.
DESCUBRIMIENTO Y DISEÑO DE DROGAS
Matrices de Substitución PAM Y BLOSUM
MÉTODO DE PIXELES DE BORDE
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Alineamiento.
ESTRATEGIAS DE MERCADOTECNIA “Evaluación de un mercado potencial”
Predicción de Estructura 3D de Proteínas Reconocimiento de Plegamiento (threading) Florencio Pazos ALMA Bioinformatics, S. L.
PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
Evolución Microbiana y Sistemática
Algoritmos para alineamientos locales: FastA
Matrices de sustitución
Propuesta del algoritmo
1 Problemas de decisión Tipo particular de problemas de optimización Sistemas que evolucionan con el tiempo Se toman decisiones en momentos sucesivos de.
Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.
Bioinformática Introducción. Bioinformática Definición intuitiva Conjunto de herramientas informáticas que sugieren soluciones a problemas biológicos.
Nieves Ábalos Serrano Mª Teresa Jiménez Ramírez
Alineamiento local: búsqueda de homologías
Una Estructura en Cascada para Prediccion Lineal Adaptiva Presentado por: Guillermo Dalla Vecchia ) Martes 14 de Setiembre, 2003.
Investigación Algorítmica ChasquiSoft. Integrantes Contreras Ames, Roy Carlos Gaspar Calle, Ronald Urlich Ames, Rafael Paredes.
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Investigación Algorítmica ChasquiSoft. Integrantes Contreras Ames, Roy Carlos Gaspar Calle, Ronald Urlich Ames, Rafael Paredes.
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
Victoria Alejandra Montoya Expositora
Diseños Generales. 2 Propósito implícito del diseño experimental El propósito implícito de todo diseño experimental consiste en imponer restricciones.
Introducción a la Bioinformática
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
DISTRIBUCIÓN DE PLANTAS.
Diseño de Fármacos Virtual Screening Escuela de Química
Fundamentos de Computación
ANALISIS DE SISTEMAS PROFESOR HECTOR ARCIA.
Modelo de procesos de software
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
Alineamiento de secuencia de proteinas con HMM Sandra Cano.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
Predicción Estructural Modelling. ¿ Por que estudiar la estructura de las proteínas? Las proteínas juegan un papel funcional crucial en todos los procesos.
Transcripción de la presentación:

SELECCION DE “TEMPLATES” Y ALINEAMIENTO

Energía X Nativa

Búsqueda homólogos con estructura conocida Selección homólogos de interés (miembros más cercanos, criterios adicionales) Obtención del alineamiento de la secuencia con los homólogos Cálculo del modelo Contraste del modelo Experimentación “Feed-back” con el modelo

Búsqueda de homólogos de estructura conocida

SIMILITUD ENTRE SECUENCIAS INDICA SIMILITUD ENTRE ESTRUCTURAS Y FUNCION

HOMOLOGIA Y COMPARACION DE SECUENCIAS SIMILITUD ENTRE SECUENCIAS HOMOLOGIA (Mismo orígen evolutivo)

ALINEAMIENTO DE SECUENCIAS AGGVIIIQVG AGGVL-IQVG AGGVIIIQVGAGGVLIQVG

IMPORTANCIA ALINEAMIENTO Detección homólogos Construcción modelo estructural

Búsqueda de homólogos SECUENCIA INCOGNITA ATTVG...LMN BASE DE DATOS DE SECUENCIAS AGLM...WTKR TCGGLMN..HICG WRKCPGL...

COMPARACION SECUENCIAS Construir alineamiento óptimo Puntuar candidato

COMPARACION DE SECUENCIAS HOMOLOGIA ALTA:HOMOLOGIA ALTA: AWTRRATVHDGLMEDEFAA AWTRRATVHDGLCEDEFAA HOMOLOGIA BAJA: HOMOLOGIA BAJA: AWTRRAT AWTKLATAVVVFEGLCEDEWGG VHDGLMEDEFAA

Búsqueda de homólogos PUNTUACION SECUENCIAS BASE DATOS (Proteínas estructura conocida) LOCALIZACION CANDIDATO CON MAYOR PUNTUACION PREDICCION FUNCIONAL/ESTRUCTURAL POR ASOCIACION/”HERENCIA”

PROBLEMAS HABITUALES Solo hay familiares remotos: –BAJA SIMILITUD DE SECUENCIA –DIFICIL TENER BUENOS ALINEAMIENTOS

ALINEAMIENTO DE SECUENCIAS OBTENER EL ALINEAMIENTO OPTIMO NECESARIO: –METODO PARA PUNTUAR AMINOACIDOS COMPARADOS –METODO PARA CONSTRUIR LOS ALINEAMIENTOS

MATRIZ DE IDENTIDADES A C D...Y A C Y

NUMERO TOTAL DE ALINEAMIENTOS DOS SECUENCIAS DE LONGITUD N Y M: N + M N N = M =

HERRAMIENTAS BASICAS MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972) ALGORITMOS DE COMPARACION DE SECUENCIAS (Needleman & Wunsch, 1970).

MATRIZ DE DAYHOFF log(fij/qi.qj) PUNTUACION DE LOS AMINOACIDOS ALINEADOS fij: frecuencia de mutación de residuo i al j qi, qj: frecuencia de los residuos i, j

MATRIZ DE DAYHOFF REFLEJA LAS PROPIEDADES FISICO- QUIMICAS DE LOS AMINOACIDOS: propensidades de estructura secundaria hidrofobicidad volumen

MATRICES COMPARACION SECUENCIAS BLOSUM62 (Henikoff & Henikoff, 1992): derivada a partir de la comparación bloques de secuencias GONNET (Gonnet et al, 1992): alineamiento masivo de secuencias

ALGORITMO NEEDLEMAN & WUNSCH R G F Q R Y G Q R G F Q R Y G Q R_GFQ RYG_Q

GAPS (INSERCIONES/DELECIONES) LOCALIZADOS EN LOOPS

? Candidato

GAPS (INSERCIONES/DELECIONES) ESQUEMAS DE PUNTUACION: –DEPENDIENDO DE ESTRUCTURA 2a –VALOR CONSTANTE –FUNCION LINEAL go + n. gl

PROGRAMACION DINAMICA VENTAJAS: PROPORCIONA UN ALINEAMIENTO REPRODUCIBLE Y OPTIMO DESVENTAJAS: ES LENTO

METODOS SUBOPTIMOS 10 – 100 MAS RAPIDOS PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS BLAST, FASTA

BLAST BLAST (Altschul et al, 1990):  localiza pequeños fragmentos comunes  extenderlos hasta que la puntuación cae

BLAST RAPIDO,  segundos EXPLORAR GENBANK, PDB FILTROS BAJA COMPLEJIDAD INDICES DE FIABILIDAD

ESTADISTICA INDICE DE REFERENCIA: E: número de falsos positivos esperado Búsquedas esporádicas: 0.01 – Búsquedas masivas (anotación genoma) : 10 -6

LIMITES COMPARACION SECUENCIAS EXISTENCIA DE PARENTESCOS INDETECTABLESEXISTENCIA DE PARENTESCOS INDETECTABLES PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOSPREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOS

THE TWILIGHT ZONE IDENTIDAD INFERIOR AL 25 % SIMILITUD ESTRUCTURAL: HOMOLOGIA REMOTA Y ANALOGIA

THE TWILIGHT ZONE HOMOLOGIA REMOTA: ORIGEN EVOLUTIVO COMUN. E.G. HEMOGLOBINAS ANALOGIA: CONVERGENCIA ESTRUCTURAL. E.G. HEMOGLOBINA Y COLICINA

USO DE ALINEAMIENTOS MULTIPLES SIMILITUD BAJA, DOS SECUENCIAS:SIMILITUD BAJA, DOS SECUENCIAS: AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GLFTAIDMHFFGRKPACEEYFTLVVDGLCNCI SIMILITUD BAJA, SECUENCIASMULTIPLES: SIMILITUD BAJA, SECUENCIASMULTIPLES: MPL ALTTGIDMWTTAKRPDMDDYYTIIIPGLMNCI MPTL AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI TMPTL GVTTGLNMYFTARRPGLDEFYTLVLRTLCMCL TMPTL GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA MPTL AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI TMPTL GLFTALNMHFFGRKPACEEYFTLVVDGLCNCI

ALINEAMIENTOS MULTIPLES RESIDUOS CONSERVADOS: RELEVANTES PARA FUNCION O ESTRUCTURA PUNTUACION PONDERA LA CONSERVACION

PSI-BLAST BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES: –BUSQUEDA BASE DE DATOS –CONSTRUCCION POSITION-SPECIFIC SCORE –ITERAR

PSI-BLAST PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA PRIMERA BUSQUEDA BLAST DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)

THREADING/FOLD RECOGNITION ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS USO BASE DE DATOS ESTRUCTURAL DIFERENTE PUNTUACION CANDIDATOS

ATTWV....PRKSCT > CANDIDATO SELECCIONADO

COMPARACION SECUENCIA- ESTRUCTURA EVALUAR “EL GRADO DE AJUSTE DE LA SECUENCIA A LA ESTRUCTURA” UTILIZAR PROPIEDADES DIVERSAS: DISTANCIAS INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC

Selección templates: uso información adicional Proyecto: 2HNQ....HYTTWPDFGVP... CANDIDATO: 1YTS....HVGNWPDQTAV... Proyecto: 2HNQ.....HCSAGIGRS... CANDIDATO: 1YTS.....HSRAGVGRT YTS, 2HNQ: TIROSINA-FOSFATASA

SELECCION “TEMPLATES” Varios candidatos, similitudes bajas (30% - 35 %) Bibliografía: sólo SSAO en H.Polymorpha y E.coli con TPQ en orientación correcta (modelos previos erróneos).

RESTRICCIONES CENTRO ACTIVO

SELECCION “TEMPLATES” Preferible X-ray sobre NMR Uso información experimental (e.g. centro activo) Preferible sin ligandos unidos, o generar dos modelos Vigilar la presencia de contactos en el cristal Preferible nativo sobre mutante

EL ALINEAMIENTO

ALINEAMIENTOS SECUENCIA - CANDIDATO Entre candidatos estructurales

ALINEAMIENTO ENTRE CANDIDATOS Alineamientos estructurales, ya disponibles (HOMSTRAD), mediante software (SAP, Taylor & Orengo, 1989). Mejor pocos candidatos estructurales, y similares

ALINEAMIENTO TEMPLATES

ALINEAMIENTO SECUENCIAS- CANDIDATOS Relación entre similitud estructural y % identidad Límite inferior del modelado: 30 % Porcentaje diseño de fármacos: > 70 %.

Similitud secuencia - estructura Rms % Ident.

EL ALINEAMIENTO Baja similitud de secuencia => alineamiento baja calidad Número de resíduos alineados => limita calidad modelo (NW en GCG vs. BLAST)

Energía X Nativa

Energía X Nativa

Energía X Nativa

Energía X Nativa

Energía X Nativa

ALINEAMIENTO Y MODELADO Nativa Modelo

CALIDAD ALINEAMIENTO Uso de potenciales fuerza media (PROSA) Uso de propiedades composicionales (GCG) Análisis de propiedades locales

CALIDAD DEL ALINEAMIENTO Test globalTest global: comparar la secuencia con N pérmutas (N=1000). Calcular el Z-score resultante Si (alineamientos aas): Z > 15 Ideal 5 < Z <= % resíduos core bien alineados Z <= 5 Problemáticos

HHHHH HHHHHHHHHH-----HHHHHHHHHHHH HH LYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLAN LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTT EEEEEEE----EE----EEEEEEE-----EEEEEEEE-----EE----- Alineamiento: citrate synthase - transthyritin Z-score: 7.55

CALIDAD LOCAL Zonas mayor calidad: independientes de pequeños cambios en los parámetros del alineamiento (posible utilizando GCG) Zonas de mayor calidad: presentes en los alineamientos subóptimos

ALINEAMIENTOS SUBOPTIMOS Zonas comunes en los alineamientos subóptimos son las más fiables: alinear ALLIM vs. ALLM Sc. 7Sc.6 ALLIMALLIM ALL-MAL-LM

Alineamiento local Proyecto: 2HNQ....HYTTWPDFGVP... CANDIDATO: 1YTS....HVGNWPDQTAV... Proyecto: 2HNQ.....HCSAGIGRS... CANDIDATO: 1YTS.....HSRAGVGRT YTS, 2HNQ: TIROSINA-FOSFATASA

ALINEAMIENTO LOCAL Presencia de motivos PROSITE Adicionalmente: fijar estructura del motivo al construir el modelo.

ESTRATEGIA Utiliar siempre que sea posible: –Alineamientos estructurales para los templates (vigilar orígen: alineamientos sencillos o múltiples) –Alineamientos múltiples (e.g. Pfam) para alinear la secuencia a los templates –Análisis visual

Obtener alineamiento Pfam SSAO Obtener alineamiento HOMSTRAD 1spu, 1a2v de Pfam Eliminar 1spu, 1a2v de Pfam Alineamiento Homstrad con Pfam mediante CLUSTALW ALINEAMIENTO SSAO RATON CON LAS TEMPLATES

CONCLUSIONES: SENTIDO COMUN !! Analizar la calidad de los candidatos: ello decide el límite del modelado y del problema Examinar el alineamiento, y eventualmente generar varios modelos (buscar consistencia con datos experimentales)