MODELLER A.Sali, R.Sánchez & A.Badretdinov U.Rockefeller M.Orozco 2002.

Slides:



Advertisements
Presentaciones similares
integridad referencial
Advertisements

PSI-BLAST.
Evaluaciones de Sistemas de Administración de la Seguridad SMSA
Estructuras de Información y Archivos
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
SQL Server Integration Services SSIS
en general, mínimos energéticos
MANEJO DE ARRAYS EN C.
KRIGING.
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
Clase # 8: Análisis Conformacional (II)
Cómo leer un artículo científico
ALGORÍTMICA Dpto. Ingeniería de Sistemas y Automática
Tema II Unidad de memoria. 2 Unidad de memoria 2.1 Definiciones y conceptos básicos Localización Capacidad Unidad de transferencia
Teoría de lenguajes y compiladores
Evaluación de Productos
Johanna Lizeth Rodríguez Lorena Fda. Chávarro Ramos
Entre los RESULTADOS y las RECOMENDACIONES
Definición Los Algoritmos Genéticos son métodos adaptativos que pueden usarse para resolver problemas de búsqueda y optimización. los Algoritmos Genéticos.
Tema 3. Optimización de Código
ING. CATALINA DONCEL GONZÁLEZ ING. MÓNICA LORENA TORRES VIVAS
Herramientas informáticas Hojas de cálculo
PROGRAMACION II.  Es un conjunto de datos no necesariamente del mismo tipo, los cuales se podrán manipular o realizar cualquier operación sobre cada.
Academia de Informática
M.C. Meliza Contreras González
Subconsultas Avanzadas
En PDB hay estructuras experimentales de proteínas.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Clase 10: Estructuras de datos y arreglos.
Computación Aplicada Facultad de Ingeniería Universidad Autónoma de Querétaro Ma. Teresa García Ramírez 1.
Modelamiento de Proteinas
Sesión 6: Campos de Markov
Sistema de archivos Sistemas operativos.
Tema 10.3: Asignación de Espacio No Contiguo. Tema 10.3: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.),
(Organización y Manejo de Archivos)
Ricardo Ayala Rodríguez Javier Sánchez Romero PREOGRAMACION E INTERNET
Colegio de Bachilleres Xochimilco Tepepan Plantel No. 13 Stone Chávez Mayra Fernanda Gabriela Pichardo Grupo: 308 Equipo: 22 1Stone Chávez Mayra Fernanda.
Asignación de Espacio No Contiguo
Unidad V: Estimación de
Capítulo 7 Gestión de memoria.
Medidas de Posición y Centralización Estadística E.S.O.
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Autora: Francisca Montañez Muñoz
Matrices de sustitución
Clase # 7: Análisis Conformacional (I)
Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
C OLEGIO DE B ACHILLERES N O.13 X OCHIMILCO, T EPEPAN C ARRASCO G ARCÍA L ORENA T ORRES H EREDIA C ARLA P ALMIRA G RUPO : 308 M ATUTINO E QUIPO : 12.
Permite darle formato a una cota, según nuestra conveniencia. COTA LINEAL Tanto horizontal como vertical. Podemos introducir la cota designándole los dos.
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
Diseño de una base de datos y elementos básicos Integrantes: López Ponce de León José Efrén Velazquez Martínez Brenda Equipo:10Grupo:307.
CONBINACION DE CORRESPONDENCIA
2.1 DEFINICIONES CARACTERÍSTICAS Y SUPOSICIONES.
HERRAMIENTAS OFIMÁTICAS M.S.C. IVETTE HERNÁNDEZ DÁVILA
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
SQL (Structured Query Language) Lenguaje orientado a bases de datos y sobre todo, al manejo de consultas; el objetivo principal de SQL es la realización.
Graficas en la pantalla 2D. Generalidades Para visualizar la gráfica correspondiente a una función de una variable o una ecuación de dos variables se.
Lic. Carla Aguirre Montalvo
Colegio de Bachilleres Plantel 13 Xochimilco - Tepepan
MIA - Grupo 5 Unidad 2.

INTEGRANTE: FLORES GODOY JUAN E. Grupo:308. Una tabla es una colección de datos sobre un tema específico, como productos o proveedores. Al usar una tabla.
INFERENCIA ESTADÍSTICA
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Bases de datos II Universidad del Cauca Ing. Wilson Ortega.
Métodos en Java. Estructura de un programa en Java ► La relación con la vida misma la podemos ver en el siguiente comentario: Imaginemos que dos clases.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
MUESTREO: DISEÑO Y PROCEDIMIENTOS
Transcripción de la presentación:

MODELLER A.Sali, R.Sánchez & A.Badretdinov U.Rockefeller M.Orozco 2002

INTRODUCCION

Que es Modeller Programa para obtener modelos 3-D a partir de homología. –Optimización de una función de densidad de probabilidad (pdf). –Emplea métodos de gradiente conjugado y dinámica molecular restringida. –Trabaja en espacio cartesiano. –El valor de la función de optimización sirve como primer scoring function del modelo.

Etapas básicas en el modelado Identificación homólogos Alineamiento Determinación restricciones Construcción modelo Refinado Validación

1. Determinar homólogos: El primer paso y uno de los más importantes es encontrar un(os) homólogo(s) de estructura conocida de la proteína problema. Esto implica: –Búsqueda de secuencias homólogas usando BLAST (PSIBLAST) o técnicas similares. –Cruzar los resultados con PDB para recuperar proteínas con estructura conocida. –En algunos casos hay que recurrir a programas de threading (ej. THREADER). –Es posible en algunos casos usar el comando SEQUENCE SEARCH de Modeller.

SEQUENCE_SEARCH Busca homólogos en una base de datos de secuencias de estructura conocida muy disimilares (menos de un 30% identidad): Un conjunto representativo del PDB Es una opción de un cierto riesgo al eliminar la riqueza que nos da tener alineamientos múltiples

2.1. Alineamiento: Inicio El proceso clave para construir un buen modelo. Las regiones alineadas (posibles templates y problema) MODELLER las considera equivalentes! –Se prepara un alineamiento (múltiple si es posible). –El alineamiento debe considerar aspectos estructurales. No solo de secuencia –Los alineamientos automáticos siempre han de editarse y mejorarse! –Muy útil saber que regiones van a estar más conservadas según los alineamientos –El alineamiento es siempre un proceso ITERATIVO

2.2. Alineamiento: Mejora Blast proporciona unos primeros alienamientos que pueden mejorarse con la información de CLUSTAL o HOMSTRAD. MODELLER incluye rutinas de alineamiento como ALIGN, ALIGN2D o MALIGN3D que pueden ayudar en el alineamiento y otras de verificación del alineamiento como CHECK_ALIGNMENT

2.3 Alineamiento: Selección del Template Los alineamientos finales se analizan para determinar cual será el template final –Se analizan los candidatos a template y se agrupan (clustering) por secuencia: ID_TABLE o COMPARE_SEQUENCES: construyen matrices de distancias entre secuencias PRINCIPAL_COMPONENTS o DENDOGRAM permiten agrupar y decidir cual(es) de todas las secuencias metidas en el alineamiento se usara(n) como TEMPLATES

3. Determinación de las restricciones Las regiones alineadas del TEMPLATE proporcionan un primer conjunto de restricciones que la secuencia modelo debe de respetar Se añaden muchas otras restricciones genéricas y otras propias del problema

4. Construcción del modelo MODELLER construye un modelo utilizando el TEMPLATE como molde. En él intenta: –superponer las regiones alineadas –evitar colisiones estéricas –respetar la estereoquímica del modelo. –Optimizar funciones estadística de situación de Aa en el interior de las proteínas.

5. Verificación del modelo MODELLER realiza internamente una evaluación del modelo y señalará errores graves en el mismo. No obstante, es conveniente verificar el modelo con programas externos como PROSA (M.Sipple) o PROCHECK (J.Thornton).

Modelado automático Precisa solo de la secuencia problema y de las coordenadas de los posibles TEMPLATES. Solo recomendable cuando la secuencia tiene más de un 50% de IDENTIDAD. Permite generar bases de datos masivas de posibles estructuras (MOD DBASE). En general NO es recomendable.

COMANDOS BASICOS DE MODELLER

Comandos de ejecución Ejectutar MODELLER: mod tutua (tutua: nombre del script de instrucciones) Longitud del output: OUTPUT_CONTROL = x y z t (variable = 1 da info 0 no la da) X: extensión output gral. Y= files abiertas. Z: warnings. T= errores

Comandos de topología (selección) READ_TOPOLOGY: lee el fichero topología de CHARMM 22. READ_PARAMETERS: lee los parámetros del FF. GENERATE_TOPOLOGY: genera topología del modelo. PATCH: Genera los ptes disulfuro definidos por el usuario. PATCH_DISULFIDES: Genera los ptes disulfuro según el TEMPLATE. MUTATE-MODEL: Substituye un residuo por otro en el modelo.

Comandos de manejo de coordenadas (selección)-1 READ_MODEL(2): lee coordenadas, nombres y tipos de átomos y residuos del modelo 1 o 2 WRITE_MODEL(2): escribe,... del modelo 1 o 2 BUILD_MODEL: genera coordenadas cartesianas (todas o las no definidas) para un modelo (INITIALIZE_XYZ=on,off) TRANSFER_XYZ: Copia las coordenadas del TEMPLATE al modelo PICK_ATOMS: Selecciona átomos (diversos criterios: sphere, segment, all residue or selected residues,...) para manipulación y los coloca en uno de los 3 SETS usados luego por: 1: pick_restraints, rotate_dihedrals, randomize_xyz y otros 2,3 make_restrains

Comandos de manejo de coordenadas (selección)-2 RANDOMIZE_XYZ: Asigna posiciones aleatorias a los átomos en SET1 del modelo. REORDER(2)_ATOMS: Reordena átomos (modelo o moldeo 2) dentro del residuo para que sigan el mismo orden que en la librería de topología. ROTATE_DIHEDRALS: cambia dihedros especificados del conjunto dado SET1 y les asigna valores random o optimizados. ORIENT_MODEL: centra y orienta un modelo respecto al origen de coordenadas ROTATE_MODEL: traslada y rota un modelo. WRITE_DATA: escribe datos del modelo: –Solvent accesibility –Lista de vecinos del residuo –Dihedros –Asignación de estructura secundaria –Curvatura de la cadena principal.

Comparación y alineamiento Formato del fichero de alineamientos (PIR) >P1;5fd1 identificador structureX:5fd1: 1 : : 10 : nombreprot: 1.9:0.12 AVFEDSEFGT >P1;1fdx Sequence:1fdx: 1 : : 8 : otronombre: 2.0: -1.0 AV--DADFGS Structurex: estructura cristal. 1, 10 residuos inicial, final, 1.9,0.2 datos cristal Sequence: solo se tiene secuencia

Comparación y alineamiento (selección)-1 READ_ALIGNMENT: Lee el fichero de alineamientos. READ_ALIGNMENT2: Lee un 2o fichero de alineamientos. CHECK_ALIGNMENT: Chequea el alineamiento de las estructuras de referencia y de estas con el problema. COLOR_ALN_MODEL: Colorea (4o campo pdb) una estructura en función de lo bien que esta alineada con una secuencia. SEQUENCE_TO_ALI: Copia una secuencia y estructura en un alineamiento como append (ADD_SEQUENCE=on) o generando file nueva WRITE_ALIGNMENT: Escribe alineamientos con mucha información adicional. DESCRIBE: Información sobre proteínas en el alineamiento.

Comparación y alineamiento (selección)-2 ID-TABLE: Calcula matrices de distancias entre los residuos de cada par de secuencias. Da como output el % identidad SEQUENCE_COMPARISON: Similar a la anterior, pero utiliza scores residuo-residuo. DENDOGRAM: Clustering de las secuencias en los alineamientos. PRINCIPAL_COMPONENTS: Similar a DENDOGRAM, pero con PC ALIGN: Alinea 2 secuencias (bloques) por alineamiento global o local. ALIGN2D: Alinea una secuencia (bloque) con una estructura (bloque). MALIGN: Alineamiento múltiple de secuencias. ALIGN3D: Alinea dos estructuras (estructuralmente) a partir del alineamiento por secuencia. MALIGN3D: Alineamiento estructural múltiple.

Comparación y alineamiento (selección)-3 SUPERPOSE: Dado un alineamiento superpone MODEL2 sobre MODEL. Se pueden seleccionar átomos, cutoff,.. COMPARE: Versión múltiple del comando anterior. EXPAND_ALIGNMENT: Añade modelos a un alineamiento ya existente. SEQUENCE_SEARCH: Búsqueda de secuencias similares a una problema en una base de datos

Restricciones Espaciales Punto clave en el proceso de modelado por MODELLER. El modelo propuesto por traslado de átomos se debe optimizar introduciendo restricciones en el mismo. Hay muchos tipos de restricciones unas estandard (ej. distancias de enlace) y otras definidas por el usuario.

Restricciones: Formato Un formato USER de restricciones sería: –R NH#:1:A CA:2:A –Esto diria: R: restricción –3: Función de restricción tipo Gaussian –1: (redundante en este caso) el numero de funciones usadas –1: Tipo de restricción: en este caso un enlace –1: grupo: definición más específica de la restricción, en este caso es un enlace normal harmónico. –2: Número de átomos involucrados en la restricción –2: Número de parámetros que definen la restricción –0: Parámetro dummy – y dicen la distancia óptima y la fuerza del enlace –El resto define que el enlace es entre el N y el Calfa residuo 2 cadena A.

Restricciones: Formato La definición de restricciones es después del alineamiento el tema más sutil del proceso. Se pueden introducir muchísimas restricciones empleando diversas funciones de penalización. Las restricciones siempre tienen que impedir que se llegue a modelos sin sentido químico. Es posible para el usuario desactivar restricciones químicas, pero esto es peligroso.

Restricciones (selección 1) MAKE_RESTRAINTS: Calcula y selecciona restrains. –RESTRAINT_TYPE: stero, enlace, ángulo, torsión,..., LJ, Coulomb,.., si está en hélice, en hoja, distribuciones concretas,,... –Los restrains stereo los coge de la base de datos de CHARMM. –A parte de los restrains químicos y conformacionales hay los de homología. Ej, 2 átomos dados están a x distancia en el TEMPLATE, tenderán a esta a la misma en modelo. Por ejemplo, la orientación de las cadenas laterales,... –En el caso de que no exista correspondencia se utilizan datos estadísticos de la librería interna.

Restricciones (selección)-2 DEFINE_SYMMETRY: Define que dos segmentos sean iguales en el proceso de optimización PICK_RESTRAINTS: Selecciona uno(s) o todos los restraints cargados por MAKE- RESTRAINTS CONDENSE_RESTRAINTS: Elimina restraints de memoria. ADD_RESTRAINT: Añade un restraint a la lista DELETE_RESTRAINT: Elimina un restraint específico. READ_RESTRAINTS: Este comando lee restraints de una file. Puede añadirlos a los ya existente, o reemplazar estos. WRITE_RESTRAINTS: Escribe los restraints

Optimización Una vez descritas las diferentes restricciones y un primer modelo (ej. transfiriendo coordenadas del TEMPLATE) debemos optimizar el modelo optimizando la función objetivo. Típicamente esto se consigue optimizando con un número creciente de restricciones. MODELLER incluye rutinas de optimización de gradiente y también de MD

Optimización (selección)-1 MAKE_SCHEDULE: Define el proceso de optimización. Se define p.ej el peso (máximo) de las diferentes restricciones. READ_SCHEDULE: Lee el fichero de Schedule. WRITE_SCHEDULE: Escribe la schedule en memoria. ENERGY: Evalúa un modelo en función de las violaciones de las restricciones. ENERGY_PROFILE: Da las energías (o violaciones) de las restricciones físicas. OPTIMIZE: Optimiza un modelo dados unos restraints. SWITCH_TRACE: Abre files para una serie de optimizaciones consecutivas

Keyword: OPTIMIZE Selección de método optimización: –Conjugate gradient –MD (simulated annealing) Selección de cutoffs de non-bonded Selección de valores de escalado Extensión de la MD o de la optimización,..

Scripts en MODELLER MODELLER contiene una serie de Scripts de defecto muy útiles para hacer cálculos tipo para no expertos. Estos Scripts son relativamente flexibles y permiten adaptar el trabajo a las necesidades del usuario. Comentaremos model

Script: model Leer alineamiento (típicamente pir) Generar un 1er modelo Generar restraints Optimizar modelo READ_ALIGNMENT CHECK_ALIGNMENT

Etapa 2a: 1er modelo + restraints GENERATE_TOPOLOGY PATCH_DISULFIDE Genera topología (CHARMM) Coloca S-S (homología por defecto) TRANSFER_XYZ Transfiere coordenadas de átomos equivalentes del TEMPLATE BUILD_MODEL Crea las coordenadas de los que faltan por topología CHARMM WRITE_MODEL Escribe (.ini) modelo inicial

Etapa 2b: 1er modelo + restraints WRITE_RESTRAINS MAKE_RESTRAINTS Genera restraints: stereoquímicos, Derivados de homología y espaciales i.e. (1)Restricciones de enlace (2) de ángulos de torsión según librerías de poblaciones, (3) de distancias entre residuos (i.e. restricciones homología) (4) contactos de VW, (5) definidas por el usuario (special_restraints).

Etapa 3a: optimización MAKE_SCHEDULE Define procedimiento de opt. de la función objetivo READ_MODEL Lee modelo inicial RANDOMIZE_XYZ Randomiza modelo añadiendo unos desplazamientos al azar

Etapa 3b: optimización READ_RESTRAINTS Lectura de los restraints PICK-RESTRAINTS Seleccionar restraints sobre átomos cercanos en la secuencia OPTIMIZE Optimizar por c.g. solo con los restraints seleccionados. Si se desea Refinar usando también SA ENERGY + WRITE_MODEL Calcular energía de restraints no Introducidos y escribir esto y el Modelo final.