Modelado por homología

Slides:



Advertisements
Presentaciones similares
PROTEÍNAS.
Advertisements

ANÁLISIS DE REQUERIMIENTOS
BLAST.
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
DESCUBRIMIENTO Y DISEÑO DE DROGAS
INTERACCIONES MACROMOLECULA - LIGANDO
AUTO-ORGANIZACIÓN Samuel Sanz Guzmán.
Predicción de la Estructura
FUNDAMENTOS DE LA ESTRUCTURA DE LAS PROTEINAS
pH=6 pH= Chairman: R. A. Marcus Speaker: Cyrus Levinthal Notes by: A. Rawitch Mossbauer Spectroscopy in Biological Systems:
pH=6 pH=2 El número de cadenas diferentes de longitud l que se pueden construir con n tipos de aminoácidos es: Una proteína típica.
Bioinformática estructural
MÉTODOS DE SIMULACIÓN Y ENERGÍAS LIBRES
Modelado por Homología: ¿Qué hacer con las secuencias de Proteínas?
Clase # 4 Campo de Fuerza Mecánico Molecular (II)
ESTRUCTURA TERCIARIA: PROTEÍNAS GLOBULARES
Estructuras Secundarias, Terciarias, Cuaternarias y Quinarias
Bases de datos en Bioinformática
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Unidad VIII: Química de Aminoácidos, péptidos y proteínas.
PATRICA ROJAS FIGUEROA BIOLOGÍA Y CIENCIAS
Detección de Secuencias Reguladoras en el Genoma
TEMA 4 ESTRUCTURA TRIDIMENSIONAL DE LAS PROTEINAS
TEMA 4 CONFORMACIÓN PROTEICA: DISPOSICIÓN ESPACIAL DE LOS ÁTOMOS DE UNA PROTEÍNA LA INFORMACIÓN QUE CONTIENE LA SECUENCIA DE AMINOÁCIDOS DICTA EL MODO.
Tema 7 ENZIMAS.
Proteínas II Sebastián Acuña Área Bioquímica.
AMINOACIDOS/ PROTEINAS
Diana Hermith Seminario de Investigación Grupo Destino Pontificia Universidad Javeriana, Cali 2008.
LAS PROTEÍNAS. Están formadas por : Carbono, Hidrógeno, Oxígeno, Nitrógeno, Azufre.
NIVELES ESTRUCTURALES DE LAS PROTEINAS
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
En PDB hay estructuras experimentales de proteínas.
1 Ideas previas Planteo de preguntas ¿En qué consiste? ¿Dónde ocurre? ¿Cómo se regula? Interacción con otras vías metabólicas Fosforilación Oxidativa.
DISEÑO DE SOFTWARE 1ª. Parte
Plegamiento de Proteínas
DESCUBRIMIENTO Y DISEÑO DE DROGAS
Proteinas.
Estructura de Proteinas Antonio Flores Giancarlo Alvarez 12 de setiembre de 2008.
Predicción de la estructura secundaria de ARN mFold
Estructura de proteínas. Catálisis enzimática Comunicación entre tejidos Generación y transmisión del impulso nervioso Permebilidad de membranas Control.
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Las proteinas vistas desde la Fisica:. Las proteinas son estructuras moleculares ‘diseñadas’ para realizar innumerables funciones dentro de las celulas:
Predicción de Estructura 3D de Proteínas Reconocimiento de Plegamiento (threading) Florencio Pazos ALMA Bioinformatics, S. L.
SIGLO XVII: Isaac Newton
Proteínas y ácidos nucleicos
R 1 │ + H 3 N –CH – C – O – + ║ O H2OH2O R 1 R 2 │ │ + H 3 N — CH — C — N — CH — COO — ║ O dipéptido + H R 2 │ HN –CH – C – O – │ ║ H O.
Matrices de sustitución
Bioinformática Predicción estructural y funcional Máster Biomedicina
Estructura tridimensional de proteínas globulares Estructura básica de los aminoácidos.
Bioinformática Introducción. Bioinformática Definición intuitiva Conjunto de herramientas informáticas que sugieren soluciones a problemas biológicos.
Identificación de Sistemas El problema de la Identificación de Sistemas.
 Funciones:  Sirven como componentes estructurales de las células y tejidos. Estructurales  Transportan y almacenan pequeñas moléculas. Transportadoras.
AMINO ÁCIDOS Y PROTEÍNAS
Profesora: Andrea Fuentes
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
Cap.3 Moléculas Biológicas
EXPOSICION PÉPTIDOS Y PROTEÍNAS. TEMA 6 Danna García Paula Montenegro.
EXPOSICION PÉPTIDOS Y PROTEÍNAS. TEMA 6
Otra variedad de biomoléculas
Biología: la vida en la Tierra
Bioquímica: Estructuración de proteínas. Estructuración de proteínas
Estructura de las Proteínas
Chapter 10 Membrane Channels S E C T I O N III Copyright 2008 by Saunders/Elsevier. All rights reserved. Illustrations by Graham Johnson Cell Biology,
Unidade 4 PROTEINAS. OBXECTIVOS DA UNIDADE Obxectivos 1. Determinar o concepto de proteína. 2. Clasificar correctamente as proteínas. 3. Analizar as características,
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Proteínas Estructura y función Estructura tridimencional
Alineamiento de secuencia de proteinas con HMM Sandra Cano.
PROSITE: Guía rápida Dirección URL de PROSITE.
Predicción Estructural Modelling. ¿ Por que estudiar la estructura de las proteínas? Las proteínas juegan un papel funcional crucial en todos los procesos.
Transcripción de la presentación:

Modelado por homología DETERMINACION DE LA ESTRUCTURA DE UNA PROTEINA MEDIANTE METODOS COMPUTACIONALES Modelado por homología Dra. Cristina Marino Buslje Septiembre 2006

Preedición de la estructura de una proteína Es una de las tareas mas significantes abordadas en la biología estructural computacional. Tiene por objeto determinar la estructura tridimensional de proteínas a partir de su secuencia de aminoácidos. En términos mas formales, es la predicción de la estructura terciaria por su estructura primaria. Dada la utilidad del conocimiento de la estructura de proteínas en tareas tan valiosas como el diseño de drogas, este es un campo altamente activo de investigación. Preedición de la estructura de una proteína 1i9b.pdb

El plegamiento de proteínas es esencial Secuencia Estructura Plegamiento Proteína desplegada Proteína plegada Forma casi única Precisamente ordenada Estable activa Altamente móvil inactiva Asociaciones especificas Reacciones especificas La función depende de la forma

1tc2.pdb

LAS PROTEINAS ESTAN FORMADAS POR DOMINIOS Dentro de una proteína, un dominio estructural (dominio) es un elemento que se estabiliza por si mismo y generalmente se pliega independientemente del resto de la proteína. Muchos dominios no son únicos de las proteínas producto de un gen o una familia de genes, sino que aparecen en una gran variedad de proteínas. Los dominios son frecuentemente nombrados según la función biológica en la que intervienen en la proteína donde aparecen predominantemente, por ejemplo, el "calcium-binding domain” de la calmodulina Dominio estructural

3583 proteínas contienen el dominio FN3

Asignación de dominios Hay zonas de baja complejidad? secuencia PPPQNNSSSSTP Hay zonas trans membrana? secuencia Hay homologías parciales? secuencia SH2 Cys rich Kinasa La predicción de estructura secundaria sugiere dominios? secuencia Región a helices Región hojas b

Jerarquía SCOPE. Ej: 1tc2 Superfamily: PRTase-like Root: scop Lineage: Root: scop Class: Alpha and beta proteins (a/b) Mainly parallel beta sheets (beta-alpha-beta units) Fold: PRTase-like core: 3 layers, a/b/a; mixed beta-sheet of 6 strands, order 321456; strand 3 is antiparallel to the rest Families: Phosphoribosyltransferases (PRTases) Phosphoribosylpyrophosphatesynthetase

Jerarquía CATH Ej: 1tc2 Clase Arquitectura (Fold) Topología (Superfamilia) Homologous superfamily Sequence family

Ejemplo 1TC2 comparativo (tomado del PDB-Beta)

Typos de Modelado “Homology modelling” “Fold recognition Modelling” “Ab initio”

“Comparative protein modelling (Homology Modelling)” Usa estructuras previamente resueltas como puntos de partida o moldes se basa en la razonable suposición de que dos proteínas homologas compartirán estructura similar

De novo “Ab initio” protein modelling Predecir la estructura de una proteína basándose solo en su secuencia. Las predicciones “ab initio” recaen en la hipótesis termodinámica del plegamiento, que postula que las estructuras nativas de una secuencia proteica, corresponde a un mínimo global de energía libre. Actualmente hay tres problemas principales a los que debe enfrentarse este campo de investigación que son básicamente: definir un sistema de “scoring” que diferencie estructuras nativas de las no nativas. definir un campo de fuerzas para el cual la estructura con mínima energía libre global coincida con la estructura que conocemos como “nativa”. El tiempo de computación necesario que requiere una cadena polipeptídica para recorrer todas las posibilidades conformacionales.

Pasos para el modelado por homologia (“homology modelling”) Busqueda de la proteína homologa (”molde” en general) Alineamiento Selección del modelo Refinamiento del modelo Validación del modelo

El proceso de modelado por homología es cíclico Secuencia Alineamiento Validación del modelo Construcción del modelo Hasta no obtener mejoras

Proceso de Modelado por homología Secuencia Datos experimentales Alineamiento múltiple de secuencias Búsqueda en bases de datos Asignación de dominios Homologo PDB Predicción de estructura secundaria NO Reconocimiento de plegamiento Análisis de la familia de plegamiento SI Homologo PDB Alineamiento de estructuras secundarias SI NO Modelado por homologia Alineamiento de la secuencia a las estructuras Predicción estructura terciaria Modelo 3D de la proteína Basado en Bob Rusell

Cosas a tener en cuenta para evaluar una predicción de plegamiento (Fold recognition): Correr mas de un programa de “Fold recognition” En lo posible, correrlo sobre mas de un homologo. Evaluar todas las salidas de un programa (no la primera) la solución puede estar entre las 10. Función de la proteína de estructura desconocida. Función de la proteína de estructura conocida. La familia de plegamiento “FOLD FAMILY”. Predicción de estructura secundaria.

Datos experimentales Tener todo dato experimental en mente a la hora de hacer un trabajo predictivo. Comprobar si la predicción concuerda con los resultados experimentales. En caso negativo, habrá que re plantearse lo hecho.

Datos experimentales pueden guiar el proceso de predicción ej: Puentes disulfuro, restringen las posiciones de las cisteinas en el espacio. Datos espectroscópicos. Dan información del contenido de estructura secundaria. Mutagénesis dirigida, da información a cerca de que residuos intervienen en el centro activo o lugares de unión. Conocimiento de lugares proteolíticos, modificaciones post-transduccionales, glucosilaciones, sugieren residuos accesibles. Sitios antigénicos. Etc.

Validación de modelos CUAL es el correcto???

Validación de modelos

Validación de modelos Procheck

Validación de modelos

Validación de modelos Verify3D

Validación de modelos Datos experimentales Procheck Verify3D Prosa II Errat WhatCheck ProQ …

Modelado de Loops El modelado de Loops constituye un problema de “homology Modelling” dentro de la proteína. Modelado “Knowledge based” (por homología) Modelado “ab initio” (loop building)

Clasificación de Loops http://sbi.imim.es/cgi-bin/archdb//loops.pl

Clasificación de Loops Numero de clases Vs. Longitud del loop en ArchDB Fernández Fuentes, Narcís. Tesis doctoral UAB 2004

Clasificación de Loops b-a 3.1.1 (2 cons GLY. 1 PH) b-b hairpin 5.1.1(1 cons GLY. 1 PH) Fernández Fuentes, Narcís. Tesis doctoral UAB 2004 a-b 4.1.1 (cons GLY PRO. 1 PH)

Modelado de Loops

Modelado de Loops

Modelado de Loops http://manaslu.aecom.yu.edu/loopred/ ej: Knowlege based http://manaslu.aecom.yu.edu/loopred/ http://www-cryst.bioc.cam.ac.uk/servers.html ej: By satisfaction of spatial restrains http://alto.compbio.ucsf.edu/modloop/

Errores mas frecuentes en modelos creados por “homology modelling” Mala elección del “template” Mal alineamiento entre el “template” y la proteína de estructura desconocida.

Mala elección del “template” Mal asignación 1hht RNAdep-RNAPol. Bacteriophage phi-6 1c2p RNAdep-RNAPol. HCV

Mala elección del “template” Mal asignación RHDV PV HCV Ribbon diagrams of RNA-dependent RNA polymerases shown from a similar vantage point

Mala elección del “template” Molde no adecuado HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 835 88.3%* Additional allowed regions [a,b,l,p] 102 10.8% Generously allowed regions [~a,~b,~l,~p] 5 0.5% Disallowed regions [XX] 4 0.4%* Non-glycine and non-proline residues 946 100.0% Glycine residues 58 Proline residues 54 Total number of residues 1062

Mala elección del “template” HCV Ramachandran Plot statistics Most favoured regions [A,B,L] 909 91.5% Additional allowed regions [a,b,l,p] 84 8.5% Generously allowed regions [~a,~b,~l,~p] 0 0.0% Disallowed regions [XX] 0 0.0% Non-glycine and non-proline residues 993 100.0% End-residues (excl. Gly and Pro) 8 Glycine residues 62 Proline residues 56 Total number of residues 1119

Alineamiento parcialmente erróneo 82-93

Alineamiento parcialmente erróneo Superposición molde modelo

Parcialmente mal alineamiento 1C2P unk

Modelado de Loops

Estudio Comparativo distintos softwares Para modelado por Homología 76% 52% 42% 39% 38% 24% 19% Akbar Nayeem. Et. Al. Protein Sci. 2006 15: 808-824

Estado del arte: CASP 6th Community Wide Experiment on the http://predictioncenter.org/casp6/Casp6.html 6th Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction Gaeta (Italy)      December 2004 Critical Assessment of Techniques for Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CA November 2006 (CASP7), 2006

Hosted By EMBL/EBI-MSD Group Estado del arte: CAPRI CAPRI: Critical Assessment of PRediction of Interactions CAPRI community wide experiment on the comparative evaluation of protein-protein docking for structure prediction Hosted By EMBL/EBI-MSD Group

EJEMPLO DE ESTUDIOS ESTRUCTURALES Utilidad de un modelo EJEMPLO DE ESTUDIOS ESTRUCTURALES

M. A. Marti i Renom et. Al Current Protocols in Bioinformatics (2003) 5.1.1-5.1.3

Construcción de estructuras supramoleculares IR

Construcción de estructuras supramoleculares IR ILGFR 1999

Identification of functional residues Residues with backbone dihedral angles in strained conformation. Clusters of charged residues. Cavities or clefts in the protein structure. Surface properties such as hydrophobicity, planarity, size or shape. Energetics of the protein structure. Surface mapping of phylogenetic information.

Búsqueda de “Patterns” en estructuras terciarias no-homologas, intento de asignar función

Trazado evolutivo de residuos

Trazado evolutivo de residuos Partición 1 Partición 2 Partición 7 Partición 8 Partición 9 Partición 10 Buried, Class-specific Buried, Conserved Exposed, Class-specific Exposed, Conserved

Trazado evolutivo de residuos

Trazado evolutivo de residuos C.Axel Innis et. Al. Protein Engineering, Vol. 13, No. 12, 839-847. 2000

Dilucidación del mecanismo de transducción de señal (Interacción Proteína-Proteína) II I II I II I I II 2tgi.pdb

Dilucidación del mecanismo de transducción de señal

Dilucidación del mecanismo de transducción de señal

Dilucidación del mecanismo de transducción de señal

Dilucidación del mecanismo de transducción de señal

Dilucidación del mecanismo de transducción de señal

Dilucidación del mecanismo de transducción de señal Parantu K. Shah, Cristina Marino Buslje, R. Sowdhamini Proteins: Structure, Function, and Genetics Volume 45, Issue 4. 2001

Ejemplo de “Docking” Automático Receptor de nicotina/ conotoxina

Diseño de drogas TcHPRT

Diseño de drogas TcHPRT Rigid superimposition on PRPP of: a) ALN ;b) OLP; c) PAM; d) RIS. Blue: N, Green: P, Grey: C, Red: O. Daniel Fernandez, et. al.

Diseño de drogas TcHPRT 3.9A

Diseño de drogas TcHPRT 2.39A

Explicación de datos experimentales y diseño de nuevos experimentos. * RNA-dependent RNA-polimerase Tacaribe virus * 1c2p.pdb 8.8 %identity

gracias por su atención 1e3p.pdb