La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ANALISIS CONFORMACIONAL Def.: estudio de las conformaciones moleculares y su influencia sobre las propiedades Desarrollo recienteBarton (1950) Apogeo de.

Presentaciones similares


Presentación del tema: "ANALISIS CONFORMACIONAL Def.: estudio de las conformaciones moleculares y su influencia sobre las propiedades Desarrollo recienteBarton (1950) Apogeo de."— Transcripción de la presentación:

1 ANALISIS CONFORMACIONAL Def.: estudio de las conformaciones moleculares y su influencia sobre las propiedades Desarrollo recienteBarton (1950) Apogeo de NMR, EI, X-ray Conformaciones arreglos atómicos espaciales interconvertibles por rotación alrededor de enlaces simples Búsqueda conformacional - identificación de las conformaciones preferidas por las moléculas en general, mínimos energéticos La búsqueda conformacional requiere algoritmos de generación de estructuras iniciales a optimizar

2 Análisis conformacional simulación (MD o MC) Pero …. MD y MC se utilizan en estrategias de búsqueda conformacional Es imposible encontrar todos los mínimos energéticos de una molécula - búsqueda del mínimo global? Métodos conformacionales 1) Sistemáticos 2) Construcción de modelos 3) Aleatorios 4) Algortimos genéticos 5) Geometría por distancia (distance geometry) 6) Dinámica molecular Modelos mecánicos pueden dar buenas aproximaciones en algunos casos!

3 1) Métodos sistemáticos Exploran el espacio conformacional realizando cambios regulares y predecibles sobre la estructura molecular Búsqueda en grilla (grid search) Procedimiento: 1) Identificación de ángulos torsionales rotables 2) Rotación sistemática de cada torsional usando un incremento fijo 3) Minimización de energía de cada conformación Ejemplo: análisis conformacional del dipéptido Ala-Ala Dos diedros a modificar ( y )

4 Gráfico de Ramachandran Los aa en proteínas adoptan valores restringidos de y Muchas conformaciones convergen al mismo mínimo Inconveniente: combinatorial explotion i = incremento en cada torsional N = número de torsionales Cantidad de conformaciones aumenta exponencialmente con torsionales

5 Árboles de búsqueda Se eliminan conf. previamente a la minimización energética Árbolnodos (estados) bordes (conectan nodos) Nodos: raíz, terminales, hijos y objetivos

6 Generación de nuevas conformaciones - backtracking Algoritmo depth-first search Desecho de conformaciones -control de energía -control geométrico (conformaciones pruned) Los sistemas cíclicos son problemáticos Se rompe el anillo para obtener una molécula pseudo-cíclica Se realizan controles adicionales (Ej: distancia entre átomos de cierre del anillo) Criterios a establecer en métodos sistemáticos -tamaño de la grilla -distancia no enlazante -cierre de anillo

7 2) Construcción de modelos Uso de bloques de construcción (building blocks) Se unen los bloques tridimensionales para formar las conf. Más eficiente - menos combinaciones de fragmentos Especificación automática o manual para unión de fragmentos Fuentes de fragmentos: -base de datos estructurales -otros métodos de análisis conformacional

8 Métodos aleatorios Enfoque opuesto al sistemático Generación de conformaciones al azar: -cambio de coordenadas cartesianas -cambio en diedros de torsión Selección de conformaciones en cada paso: -a partir de la anterior -aplicación de criterio Monte Carlo -a partir de la conformación de menor energía Cambios parciales o globales de diedros y coordenadas No existe un punto de finalización concreto finaliza al no obtener nuevas estructuras Corolario: se obtiene una misma estructura muchas veces

9 Métodos aleatorios y sistemáticos

10 4) Algoritmos genéticos Métodos basados en biología evolutiva Cada miembro de la población se codifica por un cromosoma arreglo lineal de bitsconformación La secuencia de bits (gen) codifica el valor de los torsionales Asignación de fitness para cada miembro

11 Algoritmo 1) Seteo de bits al azar en cada cromosoma (población inicial) 2) Decodificación de bits para obtener ángulos torsionales 3) Cálculo de fitness (energía interna) 4) Ciclo: generación de nueva población con operadores: a) reproducción b) entrecruzamiento (cross over) c) mutación Algoritmos sesgados se conservan miembros con más fitness 5) Geometría por distancia Descripción de conformaciones por distancias interatómicas (matrices aleatorias)

12 Sólo algunas combinaciones de distancias son válidas Procedimiento: 1) Cálculo de matriz con valores máximos y mínimos de distancias interatómicas 2) Asignación de valores de distancia al azar dentro de los límites 3) Conversión de matriz en coordenadas cartesianas (o internas) 4) Minimización de energía Criterios para definir los límites de distancias -datos cristalográficos o NMR (NOESY,COSY) -átomos involucrados -reglas geométricas -radios de van der waals

13 Triangle smoothing (suavizamiento triangular) Procedimiento para refinar el set inicial de topes de distancias Dos restricciones: a) u ac <= u ab + u bc u ac distancia máx. A-C u ab distancia máx. A-B u bc distancia máx. B-C b) l ac >= l ab –u bc l ac distancia mín. A-C l ab distancia mín A-B u bc distancia máx B-C Embedding (embebición) Transformación de matriz de distancias en coordenadas espaciales G ij = matriz métrica i = vector desde origen hasta i j = vector desde origen hasta j d xo = distancia entre origen y átomo x d ij = distancia entre átomo i y j

14 El origen de coordenadas es el centro de la molécula: La matriz G (simétrica) se puede representar como: diagonal de L 2 valores propios de G columnas de V vectores propios de G Las coordenadas atómicas se calculan como: Se deduce que: Se multiplica la raíz cuadrada de los eigen values por los eigen vectors

15 Funciones de penalización d ij > u ij l ij <= d ij <= u ij d ij < l ij d ij > u ij l ij <= d ij <= u ij d ij < l ij Otros tipos de restricciones: -centros quirales -grupos en el plano 6) Métodos de simulación -Dinámica Molecular (MD) - (simulated annealing) -Monte Carlo (MC)

16 Simulated annealing (SA) 1) Corridas MD a altas temperaturas (>2500° K) 2) Enfriamiento lento hasta 0 ° K luego del equilibrio Teóricamente se obtiene el mínimo absoluto En la práctica, se obtienen diferentes mínimos más representativos del espacio configuracional 4) Refinación geométrica (minimización de energía) 3) Poblamiento de estados de menor energía según distribución de Boltzmann

17 Refinamiento de estructuras cristalográficas combinación de SA y MD restringida Refinamiento de Cristalografía de rayos X Resolución de estructuras moleculares a partir de patrones de difracción Amplitud de radiación difractada proporcional a la densidad electrónica Relación entre densidad electrónica y el factor de estructura F

18 fase amplitud en cristalografía interesa derivar la distribución electrónica a partir del factor de estructura Problema central = determinación de las fases Para proteínas - reemplazo isomórfico múltiple: -Preparación de cristales en diferentes soluciones con metales pesados: mercurio, platino, plata. -Comparación de patrones de difracción de cristales nativos y derivados de átomos pesados Estimación de las fases

19 Se ajusta un modelo estructural al mapa de densidad electrónica Refinamiento del modelo obtención de la mejor estructura Se comparan las amplitudes de F calculadas y observadas (fact. R) Se alternan métodos de cuadrados mínimos con inspección visual - proceso complejo y trabajoso Para facilitar el proceso - uso de Mecánica Molecular: -Minimización de energía -MD restringida (SA) término de restricción S = factor de escala

20 Qué método de búsqueda conformacional usar? No hay ningún método óptimo en todos los aspectos Ejemplos: -explosión combinatoria en búsquedas sistemáticas -ausencia de punto final en búsquedas aleatorias -costo computacional (geometría por distancia y MD) En general, ningún método será capaz de encontrar todas las conformaciones de mínima energía de una molécula Bases de datos estructurales (BDE) Almacenan información cristalográfica (y NMR) para un gran número de moléculas. Tres grandes bases: -PDB (Protein Data Bank) -CSD (Cambridge Structural Database) -ISD (Inorganic Structural Database)

21 Aplicaciones de BDE CSD Comprensión de factores que influencian las conformaciones Estudio de formas de interacción entre moléculas Búsqueda de subestructuras en diferentes moléculas PDB Comprensión de principios determinantes del plegamiento Obtención de fragmentos pequeños para ajuste de modelos Limitaciones Sólo moléculas cristalizables Influencia de fuerzas de empaquetamiento en cristales (mol. peq.)

22 Ajuste molecular (Molecular Fitting) Orientación de dos o más conformaciones para superponer óptimamente los grupos funcionales de las mismas Búsqueda conformacional - control de conf. duplicadas Medida del ajuste (fit) Interesan las conformaciones que verifican min(RMSD) Variantes de fitting -Iterativo -Directo -Ajuste flexible (template forcing) -Rotación alrededor de enlaces simples -Restrained MD N = número de átomos d i = distancia de átomo i en ambas estructuras

23 Algoritmos de clustering y reconocimiento de patrones Selección de conformaciones representativas Análisis de cluster (cluster analysis) Requiere medir similitud entre pares de conformaciones: RMSD Distancia de ángulos torsionales: -Euclídea (camino en línea recta) w m,i =diedro m en conf. i N tor =cant. diedros -Manhattan (camino en grilla)

24 Métodos de vinculación (linkage methods) Procedimiento 1) Cálculo de distancia entre conformaciones (Existen tantos clusters como conformaciones) 2) Reducción en 1 del número de clusters (se unen los dos clusters más cercanos en uno sólo) 3) Repetición del paso 2 hasta el final 4) Elección de conf. representativa de cada cluster Criterios de finalización: -distancia entre los dos clusters más cercanos -mínimo número de clusters -reducción a un único cluster Tipos de métodos de vinculación: -Simple (single) -Promedio (average) -Completo (complete) algoritmos jerárquicos

25 Algoritmo Jarvis-Patrick (no jerárquico) Enfoque de vecinos más cercanos Dos conformaciones en el mismo cluster -Cada una está en la lista de vecinos (m) más cercanos de la otra -Poseen p (p

26 Algoritmo k-means (no jerárquico) Deben de conocerse a priori los k grupos en los cuales se separarán las medidas Procedimiento: 1) Definir la cantidad de clusters a generar (k) 2) Dividir al azar las conformaciones en k grupos iniciales (k medias al azar) 3) Calcular para cada grupo el centroide como el vector que representa la medida promedio del grupo 4) Reasignar las conformaciones a los centroides más próximos (según criterio de distancia) 5) Repetir los pasos 3 y 4 hasta que los centroides sean estables

27 Algoritmo k-means (no jerárquico) 1)2) 3)Iter (2-3)

28 Análisis de componentes principales Útiles para el análisis de clusters Reducen la dimensionalidad de un set de datos p i = componente principal iésimo c ij = coeficiente de variable x j = cantidad de variables Concepto de componente principal (PC) combinación lineal de variables:

29 Los datos tienen la máxima dispersión a lo largo del 1 er CP 1 er CP maximiza la varianza en los datos Variación total de los datos - todo el conjunto de PCs Generalmente, son suficiente los dos o tres primeros PCs Cálculo de PCs: Z = D T D Z = matriz varianza-covarianza D = matriz (v,s) s = cant. de valores v = cant. de variables Con los vectores propios de Z se calculan los PCs Valor propio mayor - primer componente principal, etc.

30 Contribución del PC iésimo a la varianza total: Ejemplo: conformaciones de anillo de ribosa (5 torsionales) PC1 + PC2 = 99% de varianza de datos


Descargar ppt "ANALISIS CONFORMACIONAL Def.: estudio de las conformaciones moleculares y su influencia sobre las propiedades Desarrollo recienteBarton (1950) Apogeo de."

Presentaciones similares


Anuncios Google