La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

MÉTODOS DE SIMULACIÓN Y ENERGÍAS LIBRES

Presentaciones similares


Presentación del tema: "MÉTODOS DE SIMULACIÓN Y ENERGÍAS LIBRES"— Transcripción de la presentación:

1 MÉTODOS DE SIMULACIÓN Y ENERGÍAS LIBRES
Energía libre  magnitud termodinámica más importante Helmholtz (A)  N, V y T ctes Gibbs (G)  N, P y T ctes N = cant. particulas V = volumen T = temperatura P = presión MD o MC estandar  Incapacidad de muestrear las zonas importantes del espacio conformacional La energía libre es una magnitud difícil de calcular utilizando métodos de simulación estándar La energía libre es considerada la magnitud termodinámica más importante. En efecto, gobierna la dirección de todas las reacciones químicas espontáneas y la posición del equilibrio químico. Asimismo, los procesos activados tienen asociada una barrera de energía libre que determina la velocidad del proceso. Por lo tanto, el conocimiento de la energía libre es crucial para entender los fenómenos químicos a nivel molecular como pueden ser el binding de un ligando en un receptor, la estabilidad de una proteína mutante, etc. Se expresa mediante la función de Helmholtz (A) o la función de Gibbs (G), según las condiciones. La mayoría de los experimentos se realizan bajo condiciones de temperatura y presión constante por lo que la función de Gibbs es la apropiada. La energía libre es una magnitud difícil de obtener para sistemas líquidos o macromoleculares donde la superficie energética presenta una gran cantidad de mínimos separados por barreras energéticas bajas. Además, los métodos convencionales de simulación MD o MC no pueden determinar de manera adecuada la energía libre ya que no son capaces de muestrear regiones del espacio de fase que hacen contribuciones importantes a la energía libre, es decir regiones de alta energía. Esto no es un problema para determinar la energía potencial (por ejemplo) puesto que para la energía potencial, las zonas de energía alta en la hiperficie conformacional no hacen aportes sustantivos al valor de la energía potencial global de la molécula. La expresión para la densidad de probabilidad se vio en clases anteriores H = Hamiltoniano, kB = cte. de Boltzmann, r = densidad de probabilidad

2 Cálculo de diferencias de energías libres
Los valores altos de energía contribuyen significativamente a la integral (término exponencial): Cálculo de diferencias de energías libres Cuatro métodos básicos: 1) perturbación termodinámica (FEP) 2) integración termodinámica (TI) 3) crecimiento lento (slow growth) 4) energía de interacción lineal (LIE) 1) Perturbación termodinámica Dos estados X e Y  Hx y Hy La diferencia de energía libre (DA) es: En el caso de la energía de potencial, la integral no incluye un término exponencial positivo con respecto a la energía de cada conformación, sino solamente un término lineal, que tiene mucho menos peso al combinarlo con la densidad de probabilidad de cada conformación. Se va a considerar un problema relacionado que es el cálculo de diferencias de energías libres entre dos estados, ej: etanol y etano tiol en agua. Para este tipo de cálculos, se han propuesto varios métodos diferentes, entre ellos: thermodynamic perturbation, thermodynamic integration, slow growth y linear interaction energy. La perturbación termodinámica fue originalmente propuesta por Zwanzig. Se le llama a menudo transformación “alquímica” porque supone la transformación de un único sistema a lo largo de etapas de simulación, del estado termodinámico inicial A al estado termodinámico final B. La transformación casi que con seguridad implicará la creación de átomos y eliminación de átomos. Como mínimo, supondrá la transformación de algunos átomos en otros. Considerar dos estados, X e Y con un número de partículas Nx y Ny. La diferencia de energía libre viene dada por el cociente entre las respectivas funciones de partición Qx y Qy.

3 Sustituyendo la expresión para Q:
Haciendo otras sustituciones se llega a: El subíndice 0 en la primera fórmula indica un promedio sobre el ensamblaje de configuraciones representativas del estado inicial X. Correspondientemente el subíndice 1 en la segunda fórmula indica un promedio sobre el estado Y. En la práctica, lo que se hace es definir Hy y Hx y entonces correr una simulación sobre el estado X obteniendo el promedio de ensamble del término exponencial exp((Hy – Hx)/kbT). De manera análoga se puede correr la simulación desde el estado Y y obtener el promedio de ensamblaje esta vez sobre exp((Hx – Hy)/kbT). Para cada configuración obtenida en la trayectoria se calcula el valor de energía de la misma tanto usando el hamiltoniano del estado de partida como el hamiltoniano del estado final. En el caso de la pareja etanol/etanotiol, si se parte del etanol, esto equivale a asignar al átomo de oxígeno los parámetros de energía potencial del átomo de azufre. Si la diferencia energética entre los dos estados no es muy pequeña, en particular, mayor a kbT, estos no se superpondrán en el espacio de fases, es decir, no se va a poder muestrear adecuadamente el espacio de fases de Y cuando se parte de X y viceversa. Como resultado, la diferencia de energía obtenida no será adecuada. En estos casos, la solución es considerar estados intermedios, más próximos en energía entre sí. = forward perturbation backward perturbation DA puede ser calculado a partir de simulaciones partiendo del estado X o del estado Y, y aplicando Hx y Hy Problema: si ambos estados no tienen energías muy cercanas  no se superponen en el espacio de fases Solución: introducción de estados intermediarios

4 Estado intermediario  H1 y A(1)
DA = A(Y) – A(X) = (A(Y) – A(1)) + (A(1) – A(X)) -- Este procedimiento se extiende para incluir diferentes estados intermediarios cuyos términos se cancelan en la ecuación Para poder aplicar el método eficientemente, se introduce un estado intermediario entre el inicial y el final de manera que el espacio configuracional accesible al mismo se superponga con los correspondientes a los estados reales. Dado que los términos intermedios en la ecuación se cancelan de manera de no afectar el resultado energético, se pueden introducir tantos estados intermediaros como se desee, de esa manera mejorando el resultado aunque evidentemente existe un costo de tiempo a pagar por la simulación.

5 forward sampling, backward sampling y double-wide sampling
Implementación Modificación de los términos adecuados en la ecuación de potencial (FF) usando parámetro de acoplamiento (l): (0-1)  H(x-y) Para un enlace: kl(l) = lkl(Y) + (1 – l)kl(X) l0(l) = ll0(Y) + (1 – l)l0(X) Procedimiento de simulación: Para cada valor de l escogido: -elección de parámetros adecuados (FF inicial) -equilibrado del sistema con FF inicial -cálculo de DA (lili+1) = Lo más común es utilizar una función de energía empírica (campo de fuerza) para describir las interacciones inter e intra moleculares. En nuestro ejemplo, en el sistema etanol/etanotiol. El campo de fuerza para el etanol va a diferir con respecto al del etanotiol en algunos términos de enlace, ángulos y diedros, en particular en los que involucran al átomo de oxígeno o al átomo de azufre. Lo mismo pasa con las interacciones de van der Waals y las cargas (en este caso quizás todas sean distintas). En la práctica, la relación entre los estados inicial, final e intermediaros se describe mediante un parámetro lambda (acoplamiento). Al cambiar lambda de 0 a 1 el hamiltoniano varía desde Hx a Hy. Los términos individuales del campo de fuerza se escriben como combinaciones lineales de los valores para X e Y. Para calcular energías libres en la práctica, se deben realizar varias simulaciones (tantas como valores de lambda se vayan a usar). En cada una, se utilizan los parámetros del campo de fuerza adecuados y luego que el sistema se equilibra se calcula la diferencia de energía entre estados intermediarios consecutivos. Luego, la energia libre total se obtiene a partir de la suma de las diferentes diferencias energéticas de cada simulación. DHi = Hi+1 - Hi Cálculo de DA (X  Y) a partir de las energías anteriores forward sampling, backward sampling y double-wide sampling

6 2) Integración termodinámica
El forward sampling supone que las simulaciones se realizan (en el sentido lambda 0 a lambda 1), colectando las diferencias Elambdai + 1 – Elambdai. También se puede realizar un backward sampling, donde la implementación es exactamente igual, sólo que las diferencias de energía se colectan en el sentido contrario, es decir, para cada simulación se obtiene la diferencia Elambdai – Elambdai + 1, pero siempre la simulación transcurre en el sentido lambda 0 a lambda 1. En cambio, en double-wide sampling, para cada simulación se obtienen dos diferencias, es decir Elambdai+1 – Elambdai y Elambdai – Elambdai -1. De esta manera, se pueden obtener más diferencias a partir de menos simulaciones. El principal problema de esto es que los valores de lambda utilizados para tener menos simulaciones no son tan parecidos entre sí y hay que tener cuidado con la superposición en el estado de fases. Otra desventaja es que no se pueden tener dos estimativos de la energía libre para todos los valores de lambda. Esto es porque en realidad, si se hace forward sampling por ejemplo, salvo los puntos extremos (lambda 0 y lambda 1) para cada valor de lambda se pueden determinar dos valores de energía. Estos dos valores deberían de ser iguales en teoría. Por ejemplo,el valor de Elambdai se puede obtener tanto al realizar la simulación para lambdai -1 como para lambdai. Otra forma de corroborar que el procedimiento es el adecuado, es comparar las curvas de energía versus lambda que se obtienen al hacer la simulación de lambda 0 a 1 y de lambda 1 a 0. La diferencia (histéresis) debería de ser mínima. Ver más adelante. Para calcular diferencias de energías libres usando la integración termodinámica, se asume que la función de energía libre es continua con respecto al parámetro de acoplamiento lambda. La fórmula se deduce a partir de la expresión para el procedimiento perturbativo. Se puede calcular el área bajo la curva de (deltaH/deltalambda) versus lambda en vez de calcular la integral. En la práctica, esto se lleva a cabo realizando una serie de simulaciones cada una correspondiente a un valor discreto de lambda entre 0 y 1. Para cada valor, se obtiene el promedio de ensamblado correspondiente para la expresión en la integral, ya sea analíticamente o por métodos de diferencia finita. Es decir, la integración termodinámica desde el punto de vista de la implementación es muy similar al FEP (perturbación termodinámica), lo que varía es como se calcula la energía libre. Una desventaja de TI con respecto a FEP es que el cálculo de energía libre en FEP es a partir de una expresión exacta mientras que en TI, si se aproxima la integral como el área bajo la curva, es un cálculo aproximado. En la práctica, se halla el área bajo la curva usando diferencia finita

7 Se obtienen energías libres en exceso con respecto a un gas ideal
3) Crecimiento lento Se deriva de la expresión para la perturbación termodinámica aplicando series de Taylor en el término exponencial: Se llega a: El método slow growth (crecimiento lento) se deriva a partir del desarrollo perturbativo, expresando la expresión como serie de Taylor. La diferencia es que se realiza una sola simulación en la cual, en steps sucesivos, se modifica el hamiltoniano dependiendo de lambda pero en este caso, los valores de lambda son muy similares, entonces hamiltonianos de pasos consecutivos son muy similares. Actualmente se desaconseja el uso de este método ya que sufre del fenómeno de “lag de Hamiltoniano”. El sistema no tiene tiempo de equilibrarse apropiadamente para un valor dado del parámetro de acoplamiento dado que la función de potencial cambia en cada paso. Esto no ocurre si el cambio en lambda es no continuo, es decir, se muestrea cada valor de lambda por espacio de un determinado número de time steps, es decir, se hace una dinámica para cada lambda, como se vio en FEP y TI. Los tres métodos de cálculo de diferencias de energías libres deberían dar el mismo resultado puesto que esta magnitud es función del estado y no del camino para llegar a este. Esto se verá un poco más adelante. Por otro lado, hay que notar que si bien el desarrollo teórico se basa en el hamiltoniano del sistema (energía total), en la práctica se usa solamente la energía potencial del sistema. De esta manera, la función de partición también se sustituye por la denominada integral de configuración (Z) y el resultado debe ser visualizado más bien como una energía libre en exceso en relación al gas ideal. El Hamiltoniano sufre pequeños cambios entre sucesivos pasos de la misma simulación (Hi+1~Hi) Para todos los métodos se usa la energía potencial en lugar de la energía total (H) - Se obtienen energías libres en exceso con respecto a un gas ideal

8 4) Energía de interacción lineal (LIE)
Específico para estudios de unión ligando-receptor No se realizan transformaciones irreales como en FEP La energía libre de unión se calcula a partir de las energías de interacción ligando-receptor: Aproximación de respuesta lineal electrostática: l = ligando s = solvente y receptor El método de energía de interacción lineal para el cálculo de energías libres utiliza simulaciones de DM (a veces MC) pero en contraste con los demás métodos, no introduce variaciones en el modelo empírico de energía potencial utilizado (campo de fuerza) y como se verá más adelante no involucra interconversiones no físicas o irreales del sistema. Se aplica fundamentalmente a la determinación de energías libres de unión de ligandos a receptores, tal como el método de ciclo termodinámico FEP que se discute en la diapositiva siguiente El método se basa en que a partir de solamente energías de interacción entre el ligando y el receptor se pueden estimar adecuadamente valores de energías libres de unión. Se distinguen dos contribuciones: electrostática y de van der waals. Por medio de la aproximación de respuesta lineal en teoría de campos eléctricos se llega a que la componente electrostática de energía libre se relaciona linealmente con el correspondiente potencial electrostático. De manera similar, a partir de resultados experimentales para energías libres de solvatación de moléculas apolares, la componente de van der waals de la energía libre es proporcional al potencial de van der waals. En este caso, el factor de proporción es a priori desconocido al contrario que para la componente electrostática donde se acepta un valor de 0.5. Para calcular la energía libre de unión de un ligando a un receptor, en la práctica se realizan dos simulaciones diferentes, una con el ligando aislado (en solvente) y otra incluyendo el complejo solvatado. Para cada una de las simulaciones, se obtienen promedios (ensamblado o temporales) para las energías de interacción electrostática y de van der waals y luego se obtienen las respectivas diferencias. La existencia de una incógnita (alfa en la ecuación) implica que el método se debe parametrizar usando información experimental. La ventaja fundamental de este método es su simpleza y su bajo costo computacional. Además permite el cálculo de energías libres de unión absolutas, algo que normalmente el resto de los métodos no hace. A partir de evidencias experimentales: Sustituyendo y desarrollando términos: un = ligando en complejo lib = ligando libre

9 enfoque perturbativo de ciclo termodinámico
Ciclos termodinámicos Problema: unión de dos ligandos (L1 y L2) a un sitio de unión (R) Afinidad de binding relativa (L2 – L1): DDG = DG2 – DG1 DG2 – DG1 = DG4 – DG3 (ciclo termodinámico) DG4 y DG3 no corresponden a procesos químicos en el laboratorio Son más fáciles de simular en una computadora  La diferencia de energía libre de binding se calcula “mutando” L1 en L2 en solución y en complejo con el receptor enfoque perturbativo de ciclo termodinámico Muchos procesos de interés para el bioinformático estructural involucran equilibrios entre moléculas que interactúan via fuerzas no covalentes. Un ejemplo son los procesos de unión de ligandos (inhibidores) a moléculas receptoras (enzimas) . En particular se puede estar interesado en calcular las diferencias de energías libres de unión entre dos ligandos a una misma molécula blanco (afinidad relativa de unión). En principio lo más directo sería calcular las diferencias de energía libre para cada una de las reacciones y luego obtener la diferencia entre las mismas. El problema es que el tipo de reacciones involucradas, de asociación, no son fáciles de simular por la dificultad en muestrear adecuadamente el espacio configuracional. Habría que considerar un potencial de fuerza media a lo largo de una “coordenada” de binding (ver más adelante). Por lo tanto, y aprovechando el resultado dado por el ciclo termodinámico, lo que se hace es calcular las diferencias de energía libre de las reacciones que completan el ciclo, es decir, la transformación de un ligando en otro tanto en vacío como en la enzima sin que esto realmente tenga un significado físico. En particular, esta estrategia funciona muy bien si los ligandos no son demasiado diferentes entre sí (estructura y cantidad de átomos similar). Otro ejemplo es el cálculo de coeficientes de partición relativos de ligandos entre dos solventes.

10 Problemas en el cálculo de energías libres
Errores en el campo de fuerza y/o tratamiento de interacciones Manejo de topologías de especies (FEP/TI) Inestabilidades en las simulaciones para l = 0 y l = 1 (end point catastrophe) (FEP/TI) Muestreo insuficiente del espacio de fases Soluciones: Simulaciones más largas -más tiempo (MD) -más iteraciones (MC) Uso de más de un método de cálculo (perturbación, integración) Perturbación en ambos sentidos (histeresis) Uso de potenciales soft-core Métodos de topología única o dual La catástrofe de punto extremo ocurre en las simulaciones de los extremos del intervalo de lambda, es decir, para lambda = 0 y lambda = 1. Esas simulaciones implican la aparición y desaparición de átomos, a medida que se empieza a pasar del estado inicial al estado final. Para las simulaciones cercanas a lamba = 0, aparecen átomos que no están presentes en el estado A pero sí están presentes en el estado B. Similarmente, para las simulaciones cercanas a lambda = 1 desaparecen átomos que estaban presentes en A pero no están presentes en B. Si esto no se tiene en cuenta, aparecerían singularidades (valores extremadamente grandes) en el valor de la energía potencial. La causa de esto es que por ejemplo cuando un átomo está desapareciendo, su potencial repulsivo de van der waals se hace cero, posibilitando que otro átomo pueda ocupar una zona del espacio muy cercana (rij tendiendo a cero entre ambos átomos), haciendo que la energía aumente desmesuradamente. Algo similar sucede para un átomo que comienza a aparecer. Para subsanar esto se utilizan los llamados soft-core potentials, en particular sobre el potencial de Lennard Jones (también sobre el potencial de Coulomb), que son funciones bastantes complicados y que dependen del parámetro lambda pero de forma no lineal. De esa forma la interacción de LJ no se hace infinita para valores extremos de lambda (rij = 0). Desafortunadamente, no existen recetas que garanticen el cubrimiento adecuado del espacio de fases. Lo que normalmente se hace es probar alternativas como realizar el cálculo con más de un método, aumentar la trayectoria en cada simulación particular o muestrear para más valores de lambda. También puede obtenerse una idea de los errores de las medidas realizando la simulación en ambas direcciones (forward y backward). Un aspecto importante es el manejo de la topología del sistema dado que están involucradas típicamente dos estados diferentes (etanol – acetaldehido, prolina-alanina, ver diapositiva siguiente). Se puede mantener dos topologías en todo momento, una correspondiente a cada estado discreto, sin que interactúen entre sí. La alternativa es tener una sola topología para todo el procedimiento incluyendo los estados inicial y final y usar átomos dummy cuando sea necesario. Ejemplo: en un sistema etanol –acetaldehído el átomo de H unido al oxígeno en el enol va a ser un dummy al llegar al estado de aldehído.

11 Topología dual (Alanina-Prolina)
En la variante dual de topologías para un cálculo FEP o TI, se conservan en todo momento todos los átomos de las dos especies a perturbar (en el ejemplo una prolina y una alanina), es decir, coexisten. En el archivo de topología se le indica al programa cuales van a ser los átomos que aparecen, cuales los que desaparecen y cuales los que se conservan. Son efectivamente dos topologías en una. Los átomos que corresponden a estados distintos nunca se “ven” entre ellos. En cambio, para la variante de topología única (o topología común a ambos estados), la topología en todo momento es la unión entre las dos topologías de los estados inicial y final. Se usan átomos “dummy” (ficticios) donde sea necesario. Los átomos dummy van a estar representando a los átomos que cambian entre un estado y otro y no interactúan con el resto. A veces la topología común corresponde a la topología del estado más complejo, si este incluye en cantidad de átomos al estado más simple. A medida que avanza la simulación, se van haciendo dummys los átomos que correspondan, de forma que no interactúen con el resto. La topología dual es la más utilizada. Topología única (formas Aldehído-enol en acetaldeído)

12 Cambios de energía libre en función de una coordenada
Umbrella sampling Cambios de energía libre en función de una coordenada Energía libre en la coordenada = potencial de fuerza media (PMF) El potencial se calcula para un camino físico El punto de mayor energía en la coordenada es el TS Umbrella sampling modifica la función de energía potencial: Además de los cambios de energía libre vistos hasta ahora (correspondientes a “mutaciones” químicas) se pueden estudiar cambios energéticos como función de una coordenada inter o intramolecular, ej: la distancia o ángulo entre átomos. Es decir se estudian cambios físicos concretos. La curva de energía libre a lo largo de la coordenada se conoce como potencial de fuerza media. En este contexto, el punto de mayor energía en la curva representa al estado de transición (si se mide la energía libre). El método de umbrella sampling (muestreo en paraguas) se desarrolló a los efectos de calcular potenciales de fuerza media utilizando simulaciones (MD o MC). De manera similar a los otros métodos de cálculo de energías libres, se trata de muestrar adecuadamente los estados desfavorables que en una simulación estandar no son visitados adecuadamente. Lo que se hace es modificar la función de energía potencial, agregando un término que depende de la configuración del sistema en un momento y la de equilibrio (que va a variar según el valor de la coordenada que se esté muestreando). Cuanto más alejado el sistema del valor estándar de la coordenada, más peso tendrá el factor extra y de esta manera, la simulación tenderá a muestrear zonas lejanas al valor de equilibrio estándar. Con la función original, se tendería a llevar al sistema siempre al valor estándar de la coordenada. Se efectúan varias simulaciones cada una con distintos valores en la coordenada que interesa estudiar, y para cada una, se obtiene el promedio de ensamblado para la energía libre (energía potencial). función de peso Para cada valor de la coordenada, se obtienen los promedios de ensamblado:


Descargar ppt "MÉTODOS DE SIMULACIÓN Y ENERGÍAS LIBRES"

Presentaciones similares


Anuncios Google