En PDB hay estructuras experimentales de proteínas.

Slides:



Advertisements
Presentaciones similares
METODOS, TECNICAS E INSTRUMENTOS DE RECOLECCION DE DATOS
Advertisements

PSI-BLAST.
The Universal Protein Resource: UniProtKB.
MÉTODOS DE MEDICIÓN DE COSTOS.
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
DESCUBRIMIENTO Y DISEÑO DE DROGAS
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:23 PRESENTACION: BASE DE DATOS ALUMNAS: Velazquez Corona Elsa Ponciano Antonio.
Pronósticos, Series de Tiempo y Regresión
MATRIZ DE CHEQUEO DE PARIDAD
MÉTODO CIENTÍFICO.
en general, mínimos energéticos
Investigación Algorítmica
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos
Clase # 8: Análisis Conformacional (II)
Teoría de lenguajes y compiladores
Programas Son una serie o secuencia de instrucciones entendibles por los ordenadores que permiten la realización de las acciones o tareas para las que.
Utilizar el signo igual para escribir texto o un valor
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
TUTORIAL PDBSUM Proteína 3NVY
UNIVERSIDAD CATÓLICA DEL MAULE FACULTAD DE CIENCIAS DE LA INGENIERÍA ESCUELA DE INGENIERÍA CIVIL INFORMÁTICA PROFESOR GUÍA: HUGO ARAYA CARRASCO. ALUMNO.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
Biograma Introducir datos en una matriz. Elegir método para máximos y mínimos. Calcular los máximos y mínimos observados. Límites.
Cambios Conformacionales Mínimos Se asume que CatD y sus inhibidores sufren cambios conformacionales limitados similar a CatD y CatD-pepstatina. Para verificar:
Matrices Es una estructura homogénea, compuesta por varios elementos, todos del mismo tipo y almacenados consecutivamente en memoria A cada elemento se.
Prueba de Parcheo.
Modelamiento de Proteinas
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
DESCUBRIMIENTO Y DISEÑO DE DROGAS
3. Funciones discriminantes para la f.d.p normal.
(Organización y Manejo de Archivos)
Descripción de Contenidos con Wavelets Jaime Gaviria.
Combinación de Clasificadores
MUESTREO Y CONVERGENCIAS EN LOS CÁLCULOS DE ENERGÍA LIBRE DE LA INTERACCIÓN PROTEÍNA-LIGANDO. EL ENLACE DE LOS DERIVADOS DE LA TRIFENOXIPIRIDINA CON LA.
Datos: Estadística.
MUESTREO DE ACEPTACIÓN
 AUTOMATIZACION Y CONTROL  05. SISTEMAS DE MANUFACTURA AUTOMATIZADOS
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Diseño geodésico II II semestre, 2014
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Alineamiento.
Titular: Agustín Salvia
Muestreo y Convergencia en calculos de Energia Libre de Interacciones Proteina-Ligando: El enlace de la tripenoxipiridina derivado a factor Xa y tripsina.
Herramientas básicas.
Errores en Excel Durante la creación y desarrollo de modelos o plantillas realizadas en Excel es posible que introduzcamos algún dato o fórmula de manera.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
Clase # 10 (continuación) Simulación de Monte Carlo Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos.
Matrices de sustitución
Por fin llegamos al primer átomo !!!
Capítulo 1. Conceptos básicos de la Estadística
Hidden Markov Models Angélica Minaya Francesca Barletta Jeanette Velásquez Mónica Pajuelo Daniel Rueda.
COLEGIO DE BACHILLERES PLANTEL 13 XOCHIMILCO-TEPEPAN MATERIA:TIC EQUIPO:21 PRESENTACION: BASE DE DATOS ALUMNAS: Adán Millán Sánchez.
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.
Análisis de los Datos Cuantitativos
Estimación de proyectos de software
Método de mínimos cuadrados
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
1 Introducción de datos Modelo de presentación para adaptación y uso en el taller de formación para personal de la encuesta de precios y disponibilidad.
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Taller de investigación 1
Objetivos de la prueba Los objetivos principales de realizar una prueba son: Detectar un error. Tener un buen caso de prueba, es decir que tenga más probabilidad.
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
PROSITE: Guía rápida Dirección URL de PROSITE.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia METODOS ALEATORIOS.
Predicción Estructural Modelling. ¿ Por que estudiar la estructura de las proteínas? Las proteínas juegan un papel funcional crucial en todos los procesos.
Transcripción de la presentación:

En PDB hay 20 000 estructuras experimentales de proteínas. En Swiss-Prot y TrEMBL hay 850 000 secuencias protéicas. La información estructural no es de fácil acceso en muchas proteínas. Gran demanda por conocer la estructura con metodos computacionales que predicen la estructura protéica.

¿Porqué modelamos proteínas? Por ser “fácil”. Por lo difícil y trabajoso que es NMR y Rayos X. Porque puede generar modelos que tienen exactitud y calidad comparable con estructuras generadas por NMR y Rayos X.

MODELAMIENTO DE PROTEÍNAS POR HOMOLOGÍA

estrategias basadas en información de secuencia, Consiste en seleccionar homólogos por alineamiento estructural del banco de datos de secuencias usando: estrategias basadas en información de secuencia, información funcional, diferentes tipos de matrices de mutaciones. La construcción del modelo requiere por lo menos de un patrón (template) cuya secuencia sea significativamente similar a la secuencia problema.

PASOS A SEGUIR... Reconocimiento de un TEMPLATE. Alineamiento Secuencias Estructura Construcción del modelo Backbone Loops Cadenas laterales Refinamiento Evaluación

1) Selección del Template Se utiliza la librería Protein Data Bank. Si el template tiene regiones distintas del target, el proceso del modelo se cortaría en bloques independientes y separados. No se utilizan los modelos que sólo presentan los C, por tener una calidad estructural pobre. Se utilizan files: Probable estructura cuaternaria Indicadores empiricos de energía force field ANOLEA

2) Alineamiento Debe caer en la zona segura de modelamiento por homología; el porcentaje de identidad entre las secuencias se determina con un simple alineamiento usando programas como BLAST o FASTA.

Es muy dificil alinear dos secuencias que presentan identidad pobre, en este caso se utilizan otros homólogos. Generalmente se usan 5 templates y se alinean por bloque (algoritmo de mínimos cuadrados). Se calcula un alineamiento local de las secuencia target con el principal template seguido de un método heurístico para mejorar el alineamiento; tambien se optimizan inserciones y deleciones tomando como base la estructura del template.

3) Construyendo el modelo Backbone Loops Cadenas laterales Refinar el modelo

BACKBONE Para generar el núcleo del modelo, la posicion de los átomos del backbone son promediados en la estructura del template. Se observa la similitud con el target. Las coordenadas del template no se usan en las regiones de deleciones o inserciones generadas en el alienamiento. Para esta parte se ensamblan segmentos compatibles con los constructos vecinos usando en programa CSP.

LOOPS El mejor loop es seleccionado usando scores con force field, interacciones con formación de puentes de hidrógenos y los impedimentos estéricos. Si no hay un loop aceptable se flanquean los residuos y son incluidos en un fragmento reconstruido con mayor flexibilidad. También se utiliza una librería de loops de estructuras experimentales para encontrar el más compatible.

Cadenas laterales La reconstrucción se basa en la posición de las cargas de los residuos en su correspondiente template, se inicia por residuos conservados. Las posibles conformaciones de las cadenas laterales con selecionadas de la librería de rotámeros. Para seleccionar la conformación más apropiada se ven los scores de interacciones favorables y los no favorables.

Los residuos de superficie, tienen un porcentaje mucho menor (50%). En residuos de zonas del núcleo hidrofóbico, la predicción de exactitud debe ser alta (90%). Los residuos de superficie, tienen un porcentaje mucho menor (50%). RAZONES: La superficie tiene cadenas más flexibles y adoptan múltiples conformaciones. Las funciones de energía usadas en los scores de rotámeros son fácilmente obtenidas en zonas hidrofóbicas; en superficie las interacciones electrostáticas son menos exactas, que incluyen los ptes. de hidrógeno que formaría con el agua.

Refinar el modelo: Minimización de Energía Al colocar cadenas laterales, se debe corregir el backbone. GROMOS96 es el force field que evalúa las desviaciones introducidas por al algoritmo de modelamiento, es por esto que se realiza una minimización de energía; se evalúan los errores conformacionales del modelo.

4) EVALUACIÓN La exactitud del modelo puede variar significativamente dentro de diferentes regiones de la misma proteína: las regiones altamente conservadas del núcleo son mucho mas confiables que los loops variables o la superficie de la proteína.

Los errores de la proteina modelada depende de: Porcentaje de identidad en secuencia entre el template y el target: si es mas de 90% ; entre 50 y 90% es aceptable (presenta errores locales); menos del 25% el alineamiento es el gran problema. Número de errores en el template

Para estimar los errores, hay dos caminos diferentes: Calcular la energía basandose en force fiels, chequea si el tamaño de uniones y los ángulos de unión están en un rango aceptable. Determinar los índices de normalidad que describen que tanto se asemeja las características del modelo con las características de la estructura real. Basado en análisis de distancias interatómicas y sus contactos

En Swiss Model: Para evaluar el resultado de “first approach” se puede utilizar DeepView, ya que permite ajustes manuales del alineamiento que se verifican visualemtne. Para modificar proyectos, se debe volver a someterlo al servidor.

SWISS-MODEL

First approach mode Se requiere sólo de la secuencia de aminoácidos como dato. El servidor busca automáticamente los posibles templates, opcionalmente se puede especificar 5 templates, de ExPDB o de propios files. Se procede si se encuentra un template más del 25% de identidad con el target. La confiabilidad del modelo decrese cuando la identidad de secuencias es pequeña y si el target-template tiene menos del 50% de identidad, se requiere de un ajuste manual del alineamiento.

Alignment mode Se inicia colocando una secuencia para alinear, especificando cual es el target y cual es la proteina estructuralmente conocida.

Project mode Se submite el modelo optimizado manualmente al servidor; es un DeepView project file. Contiene las estructuras sobrepuestas del template y el alineamiento entre el target y los templates.

Modelando proteinas 0ligomérica

Deep-View-Swiss-PBDViewer Programa que tiene funciones integradas para la visualizacion, análisis y manipulación de proteínas en su secuencia y estructura. Se trabaja con PDB o ExPDB files que se bajan directamente del DeepView server.

Banco de datos donde se anotan los modelos de estructuras comparados en tres dimensiones que ha sido generado por el SWISS MODEL. Contiene 300000 modelos 3D, de secuencias del Swiss-Prot y TrEMBL.

Introducimos la secuencia problema. Partimos de una secuencia aminoacídica lineal, por ejemplo: >secuencia-problema MSKVPRNFRL LEELEKGEKG FGPESCSYGL ADSDDITMTK WNGTILGPPH SNHENRIYSL SIDCGPNYPD SPPKVTFISK INLPCVNPTT GEVQTDFHTL RDWKRAYTME TLLLDLRKEM ATPANKKLRQ PKEGETF Una vez que tenemos la secuencia que queremos analizar, debemos introducirla en el programa SWISS-MODEL a través de su servidor web, accesible en la red. En este servidor debemos introducir además de la secuencia, nuestra dirección de "mail", nuestro nombre, y un título para el proceso SWISS-MODEL (First Approach mode).

2) Recepción en nuestro mail de un mensaje confirmatorio. Si el proceso ha comenzado sin ningún problema recibiremos un mensaje por mail donde, a parte de otras informaciones, están recogidos la fecha, el título de la búsqueda y el código de identificación de nuestro proceso.

3) Recepción de un mail con los distintos procesos seguidos por SWISS-MODEL. El segundo mensaje que recibimos desde el servidor de mail presenta una descripción abreviada de los procesos seguidos por el programa SWISS-MODEL. En realidad el programa SWISS-MODEL es el resultado de un conjunto de subprocesos, o programas más pequeños, los cuales son aplicados de forma secuencial. Diferenciaremos cada uno de los pasos seguidos por SWISS-MODEL utilizando como referente el mail de procesos.

- SWISS-MODEL realiza una búsqueda por homología de secuencia en una base de datos de secuencias de estructura conocidas, el programa utilizado es "BLASTP2" y la base de datos consultada "ExNRL-3D". Los resultados se muestran ordenados por la puntuación P(N) del BLAST.

- Con el programa "SIM" Se seleccionan todos los "moldes" (estructuras 3D sobre las que nos basaremos para hacer nuestro modelo) con una identidad de secuencia superior al 25% y con una región alineada superior a 20 residuos. Adicionalmente, este programa detecta los posibles distintos dominios que debieran ser modelados a partir de moldes estructurales diferentes. Este proceso queda recogido del siguiente modo...

- En este paso se genera el fichero de entrada ("imput file") para el program "ProModII" el cual basándose en los moldes seleccionados (templates) de la base de datos "ExPDB" originará todos los modelos a partir de nuestra secuencia problema.

- Como último paso, mediante el programa "Gromos96", se optimiza/an el/los modelo/os basándose en un proceso de minimización de energía.

GRACIAS!