Curso: Química Computacional & Simulaciones
Modelamiento de proteínas y ácidos
nucleicos
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
•
Revisión de dinámica molécular (DM)
•
Pasos de una simulación de DM
•
Condiciones de periodicidad
•
Implicancias de las PBCs en las simulaciones
•
Pasos de una simulación de DM
Simulaciones de Mecánica Molecular
El problema del mínimo local y el mínimo global
Simulaciones de Mecánica Molecular
El problema del mínimo local y el mínimo global
Simulaciones de Mecánica Molecular
Dinámica Molecular
Halla las posiciones (x,y,z) de cada átomo en la molécula, integrando las
ecuaciones de movimiento
•
El cambio en la posición respecto del tiempo, nos dá la velocidad
•
Sigue las leyes de la mecánica clásica
•
•
La temperatura está definida por el promedio de la energía cinética
del sistema: U = 3/2 NkT; EK = ½ Nmv2
•
Durante la simulación se mantiene la distribución de velocidad de
Maxwell-Boltzmann
‘Forcefields’ para Mecánica Molecular
Forcefield estandar para simulaciones de MM
Simulaciones de Mecánica Molecular
Trayectorias de Dinámica Molecular y sus escalas de tiempo
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx pdb2gmx -f [Link] -o [Link] -water spce
[Link]
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx editconf -f 1AKI_processed.gro -o [Link] -c -d 1.0 -bt cubic
[Link]
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx solvate -cp 1AKI_newbox.gro -cs [Link] -o 1AKI_solv.gro -p [Link]
[Link]
[Link]
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
DOI: 10.3390/app10010144
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx grompp -f [Link] -c name_solv.gro -p [Link] -o [Link]
gmx genion -s [Link] -o name_solv_ions.gro -p [Link] -pname NA -nname CL -neutral
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx grompp -f [Link] -c 1AKI_solv_ions.gro -p [Link] -o [Link]
gmx mdrun -v -deffnm em
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx grompp -f [Link] -c [Link] -r [Link] -p [Link] -o [Link]
gmx mdrun -deffnm nvt
T0 = 0 K
Ts = 300K
Equilibrar solvente y iones alrededor del
soluto: NVT ~ constante
Simulaciones de Mecánica Molecular
¿Qué es PBC?
Periodic Boundary Conditions
●
Mayormente se intenta simular un sistema en una solución.
●
Al intentar simular una gota de agua, se evaporará.
●
Necesitamos un límite para mantener el agua y controlar la
temperatura, la presión y la densidad.
●
Las condiciones de periodicidad permite aproximar un sistema infinito
utilizando una pequeña parte (celda unitaria).
[Link]
Simulaciones de Mecánica Molecular
Periodic Boundary Conditions
●
La celda unitaria está rodeada por un número
infinito de copias en todas direcciones.
●
Si una partícula en una celda unitaria cruza el
límite, reaparece en el lado opuesto.
●
Cada molécula siempre interactúa con sus vecinas
aunque estén en lados opuestos del cuadro de
simulación.
●
Los artefactos causados por la simulación del
sistema aislado en el vacío se reemplaza por
artefactos de PBC que, en general, son mucho
menos graves.
[Link]
Simulaciones de Mecánica Molecular
Periodic Boundary Conditions
Caja periódica cúbica Caja octahédrica o Caja periódica triclínica
dodecahédrica
[Link]
Simulaciones de Mecánica Molecular
Periodic Boundary Conditions
Problemas en la elección de las cajas periódicas
●
Un sistema de simulación con soluto alargado
en caja cúbica o dodecaédrica tendrá una
gran cantidad de agua ubicada lejos del
soluto.
●
Considere usar una caja rectangular estrecha.
●
Se debe tener en cuenta la rotación de
macromoléculas alargadas y/o cambios
conformacionales.
[Link]
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx grompp -f [Link] -c [Link] -r [Link] -p [Link] -o [Link]
gmx mdrun -deffnm nvt
T0 = 0 K
Ts = 300K
Equilibrar solvente y iones alrededor del soluto
NVT ~ constante
Simulaciones de Mecánica Molecular
Flujo de una simulación de DM
gmx grompp -f [Link] -c [Link] -r [Link] -t [Link] -p [Link] -o [Link]
gmx mdrun -deffnm npt
NPT: a presión y temperatura constantes
Manteniendo las velocidades
Simulaciones de Mecánica Molecular
Etapa de producción de DM
gmx grompp -f [Link] -c [Link] -t [Link] -p [Link] -o md_0_1.tpr
gmx mdrun -deffnm md_0_1
gmx mdrun -deffnm md_0_1 -nb gpu
Preguntas?
Curso: Química Computacional & Simulaciones
Modelamiento de proteínas y ácidos
nucleicos
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
•
Por qué el modelamiento computacional de proteínas?
•
Modelamiento por homología
•
Modelamiento usando AlphaFold
•
Modelamiento de ácidos nucleicos
Por qué el modelamiento computacional de proteínas?
Estructuras depositadas en el Protein Data Bank
Por qué el modelamiento computacional de proteínas?
Estructuras depositadas en el Protein Data Bank
Secuencias conocidas de proteínas: ~ 200’000,000
Por qué el modelamiento computacional de proteínas?
Estructuras depositadas en el Protein Data Bank
Secuencias conocidas de proteínas: ~ 200’000,000
Por qué el modelamiento computacional de proteínas?
•
Caracterizar e identificar un gran número de secuencia de proteínas
descubiertas
•
Desarrollar un modelo estructural para una proteína para la cual no
hay un modelo experimental
•
Estudiar proteínas de membrana, que son difíciles de cristalizar,
proporcionando un alto grado de entendimiento de estas proteínas y
sus funciones
•
Diseño de fármacos, evaluación de mutaciones en las proteínas, y
entender la interacción proteína-lilgando, proteína-proteína, proteína-
ADN
Modelamiento por homología
•
Predice la estructura 3D de una secuencia de proteína (target),
basada en el alineamiento sobre una o más estructura de proteínas
(templates).
•
Si hay una alta identidad entre la secuencia ‘target’ y la secuencia
‘template’, se asume también similaridad estructural
•
Usualmente, se requiere al menos 30% de identidad para generar un
modelo útil
•
Como resultado se obtiene un modelo de resolución atómica de la
proteína/secuencia target
Modelamiento por homología
DOI: 10.1124/pr.112.007336
Modelamiento por homología
Pasos:
•
Identificación y alineamiento inicial con la secuencia/estructura
‘template’
•
•
Correción manual de alineamiento (si hace falta)
•
•
Generación del ‘backbone’
•
•
Modelamiento de los ‘loops’
•
•
Modelamiento de las cadenas laterales
•
•
Optimización y Validación del modelo
Modelamiento por homología
Identificación de template
•
Búsqueda de proteinas relacionadoas a nuestra proteína ‘target’ en bases
de datos de estructuras
•
La precisión del modelo a obtener depende de la selección de la proteína
‘template’
•
FASTA y BLAST del National Center for Biotechnology Information
(NCBI)
•
Se obtendrá un set de posibles ‘templates’
•
Después de un análisis de las regiones conservadas, se puede escoger el
‘template’ final
Modelamiento por homología
¿Dónde buscar ‘templates’?
Modelamiento por homología
¿Dónde buscar ‘templates’?
Sea la secuencia desconocida:
>sequencia_desconocida
STTEVVMENVTAFWEEGFGELLEKAKQNNNNRKTSNGDDSLSFSNLSLLGTPVLKDINFK
IERGQLLAVAGSTGAGKTSLLMMIMGELEPSEGKILHSGRISFCSQFSWIMPGTIKENII
GVSYDEYRYNSVIKACQLEEDISKFAEKDNIVLGEGGITLSEGQQAKISLARAVYKDADL
YLLDSPFGYLDVLTEKEIFESCVCKLMANKTRILVTSKMEHLKKADKILILHEGRRYFYG
TFSELQNLQPDFSSKLMGCDSFDQFSAERRNSILTETLRRFSLEGDAPVS
Modelamiento por homología
¿Dónde buscar ‘templates’?
Modelamiento por homología
Encontrando el ‘template’
Modelamiento por homología
Encontrando el ‘template’
Modelamiento por homología
Corrigiendo el alineamiento
‘Template’
Target
Modelamiento por homología
Construyendo el ‘backbone’
•
Una vez el alineamiento es el correcto, el backbone puede ser
creado. Precisión del modelo depende de la apropiada selección
del template
•
Las coordenadas del ‘backbone’ del ‘template’ son copiadas al
modelo ‘target’
•
Si las cadenas laterales son iguales, entonces se copia también
sus coordenadas
•
Solo se copian las coordenadas de los residuos que se encuentran
en el alineamiento
Modelamiento por homología
Construyendo ‘loops’ y cadenas laterales
Se usa como anclas los residuos en Se pueden usar librerias previamente
verde, más residuos insertados, más
largo es el ‘loop’
construidas, o modelarlas ab initio
Modelamiento por homología
Optimización del modelo
Debe realizarse un procedimiento de
minización de energía para ajustar la
posición relativa de los átomos, de tal
modo que la conformación sea la de
mínima energía.
Energía = Ecov + Enocov + Etorsión + Ebend
Modelamiento por homología
Validación del modelo
Se evalúa:
●
La exactitud de la estructura
●
Errores sobre las diferentes regiones
●
Parámetros estereoquímicos: longitus
de enlace, ángulos, etc
<
Modelamiento por homología
Herramientas para construir un modelo por homología
•
Modeller: Software desarrollado en Python y se ejecuta
mediante ‘scripts’ en Python
•
RosettaCM: similar a Modeller, ‘scripts’ en formato XML
•
•
SwissModel: Servidor de modelado por homología de
estructuras de proteínas totalmente automatizado:
[Link]
Modelamiento por homología
Swiss-Model
Modelamiento por homología
Swiss-Model
La secuencia que usamos para buscar ‘templates’ en el BLAST
>sequencia_desconocida
STTEVVMENVTAFWEEGFGELLEKAKQNNNNRKTSNGDDSLSFSNLSLLGTPVLKDINFK
IERGQLLAVAGSTGAGKTSLLMMIMGELEPSEGKILHSGRISFCSQFSWIMPGTIKENII
GVSYDEYRYNSVIKACQLEEDISKFAEKDNIVLGEGGITLSEGQQAKISLARAVYKDADL
YLLDSPFGYLDVLTEKEIFESCVCKLMANKTRILVTSKMEHLKKADKILILHEGRRYFYG
TFSELQNLQPDFSSKLMGCDSFDQFSAERRNSILTETLRRFSLEGDAPVS
Modelamiento por homología
Swiss-Model
Modelamiento por homología
Swiss-Model
Modelamiento por homología
Swiss-Model
Modelamiento por homología
Swiss-Model
Modelamiento por homología
Swiss-Model
Alphafold 2
[Link]
-a-solution-to-a-50-year-old-grand-challen
ge-in-biology
• El ‘input’ es la estructura primaria de la
proteína
• Use alineamiento múltiple de secuencias (MSA)
• Compara secuencias de diferentes organismos
• Análisis de co-evolución, preservando la
estructura
• Usa redes neuronales
• Explicación formal:
[Link]
yU
[Link]
scientific-discovery [Link]
Alphafold 2
Antes de iniciar cálculos para modelar una proteína, asegurarse que
no está en la base de datos
Alphafold 2
Se copia la secuencia en el buscador de AlphaFold
Alphafold 2
La proteína está en la base de datos
Alphafold 2
Hay un registro con las caracerísticas de la proteína
Alphafold 2
También con la estructura generada por el algoritmo
Modelando Ácidos Nucleicos
Primero modelo 3D de ácidos nucleicos
Modelando Ácidos Nucleicos
Modelando RNA
Modelando Ácidos Nucleicos
Modelando RNA
Modelando Ácidos Nucleicos
Modelando RNA
Modelando Ácidos Nucleicos
Modelando RNA
Modelando Ácidos Nucleicos
Modelando RNA
Modelando Ácidos Nucleicos
Modelando DNA
Lo más conveniente es realizar una simulación de dinámica
molecular (MD)
[Link] [Link]
Modelando Ácidos Nucleicos
Modelando DNA
●
AMBER ofrece una variedad de campos de fuerza (
[Link]
●
CHARMM simulaciones de dinámica y mecánica molecular, (
[Link]
●
NAMD (Dinámica Molecular a Nanoescala): software para
dinámica molecular ([Link]
●
GROMACS (Máquina GROningen para simulaciones químicas):
adecuado para diversas simulaciones biomoleculares, incluidos
ADN y ARN. ([Link]
[Link]
Preguntas?
>secuencia_desconocida
AAAGACATTGGCACCCTCTACCTAGTATTTGGTGCCTGAGCCGGAATAGTTGGTACAGCC
CTTAGCCTACTAATTCGGGCAGAGCTGGCCCAACCCGGCGCCCTTCTAGGTGATGACCA
AATTTACAACGTCATTGTAACTGCTCATGCCTTTGTAATAATTTTCTTTATAGTGATACCCAT
TATGATCGGGGGATTTGGAAACTGATTAATCCCACTAATAATTGGGGCACCAGACATAGCA
TTCCCACGAATAAATAACATAAGCTTCTGACTACTTCCCCCATCCTTCTTACTTCTGCTTGC
CTCGTCTGGGGTAGAAGCAGGAGCAGGAACAGGCTGAACTGTCTATCCTCCCCTCGCA
GGGAATCTAGCACACGCCGGAGCTTCTGTAGATCTAACTATTTTCTCCCTACATCTAGCAG
GGGTGTCATCCATCCTAGGAGCCATTAACTTTATTACAACCATCATCAACATAAAACCCCC
CTCTATCTCACAATATCAAACACCATTATTTGTATGATCAGTCCTAATTACAGCTGTACTTCT
TCTACTATCCCTCCCCGTCTTAGCCGCAGGCATTACAATGTTACTAACAGACCGAAACCTA
AATACTACATTCTTTGACCCAGCAGGAGGAGGAGACCCAATCCTTTATCAACACCTATTCT
GATTCTTTGGCCACC
Curso: Química Computacional & Simulaciones
Estructura de biopolímeros. Técnicas
experimentales y computacionales
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
•
Biopolímeros
•
Revisión de estructura de aminoácidos y proteínas
•
Estructura de ácidos nucleicos
•
Técnicas experimentales -> estructura de
biopolímeros
•
Técnicas computacionales para modelar biopolímeros
Biopolímeros
Un polímero es una macromolécula compuesta de unidades
estructurales repetidas y unidas mediante enlaces covalentes
Suelen ser complejas y diferente las pequeñas moléculas (small
compounds)
Los biopolímeros son polímeros producidos a partir de fuentes
naturales, ya sean sintetizados químicamente o biosintetizados por
organismos vivos.
Biopolímeros
De los muchos biopolímeros existentes, desde la perspectiva
molecular, nos enfocaremos en las proteínas y ácidos nucleicos
•
Cabello, plumas, uñas
•
Seda
Proteínas •
Colágeno
•
Huesos
DNA Almacenamiento de código genético
Vacunas
RNA
Biopolímeros
Proteínas
+
NH3-terminus
COO--terminus
Proteínas
¿Qué son las proteínas?
Proteínas
La estructura de la proteína depende de su secuencia de aminoácidos –
esto es, de las interacciones que esta permite
1ria: secuencia
2ria: interacciones
3ria:
locales
interacciones de
secuencias
lejanas 4ria: interacciones entre
subunidades
Métodos para la determinación de la
estructura 3D de proteínas:
• Métodos experimentales
• Cristalografía por rayos-X
• Resonancia Magnética Nuclear (NMR)
• Críomicroscopía electrónica (CryoEM)
• Métodos Computacionales
• Por homología
• Threading
• AlphaFold2
X-Ray Crystallography
protein
crystal
diffracte
d
incomi x-ray
ng
x-ray
detecto
goniometer
r
controls crystal diffraction pattern
orientation
Purified
Protein
Solve the Phase Problem
-MIR, MAD or MR
CryoEM Single-Particle
Analysis
Ácidos Nucleicos: ADN, ARN
Ácidos Nucleicos: ADN, ARN
ESTRUCTURA SECUNDARIA
DEL DNA
Las dos cadenas antiparalelas
forman una doble hélice de
giro hacia la derecha, girando
una vuelta completa cada 10
pares de bases.
Ácidos Nucleicos: ADN, ARN
MODELO DE DNA WATSON & CRICK
(1953)
[Link] cadenas antiparalelas
[Link] hacia fuera
[Link] hacia adentro
[Link] complementarias: Purina -
Pirimidina Adenina – Timina, Guanina –
Citosina
[Link] estabilizadoras: Puentes de
hidrógeno, Fuerzas hidrofóbicas,
Apilamiento de bases (stacking)
6. Una vuelta completa cada 10 bases
Ácidos Nucleicos: ADN, ARN
Ácido Ribonucleico
RNA es un polímero
de ribonucleotidos
enlazados vía un
enlace fosfodiester 3’-
5’
Ácidos Nucleicos: ADN, ARN
Estructura de ARN
DOI: 10.1371/[Link].1009291
Estructura de ARN
Se necesita mejores
algoritmos de
predicción para
estructuras de RNA
DOI: 10.1371/[Link].1002100
Métodos computacionales para prediccion de estructuras
Proteínas
•
Modelamiento por homología
•
•
Modelamiento por threading
•
•
AlphaFold2
•
•
Rosseta
Modelamiento por homología
DOI: 10.1124/pr.112.007336
[Link]
ploscompbiol/article?id=10.1371/
[Link].1007449
Modelamiento por homología
Modelamiento por homología
Modelamiento por ‘threading’
Características
•
Modelamiento por homología: alinea secuencia sobre secuencia
•
Modelamiento por threading: alinea secuencia sobre estructura
Claves:
•
En la naturaleza hay un número limitado de plegamientos
•
La preferencia de los aminoácidos por diferentes entornos según
su naturaleza, provee suficiente información para elegir los
plegamientos más probables
Modelamiento por ‘threading’
La proteína problema se alínea sobre una librería de ‘templates’
Se selecciona la estructura con el mejor alineamiento
por segmentos de la secuencia en los templates
Alphafold 2
[Link]
-a-solution-to-a-50-year-old-grand-challen
ge-in-biology
• Jumper, J., Evans, R., Pritzel, A. et
Highly accurate
al.
protein structure
prediction with
AlphaFold. Nature 596, 583–589
(2021).
[Link]
9-2
• Explicación formal:
[Link]
u1ocFyU
• Explicación pop:
[Link]
08
• [Link]
[Link] [Link]
scientific-discovery 03819-2
Alphafold 2
• Matrices de distancia para tres proteínas.
• Ejes X y Y: la secuencia de la proteína
• En cada fila/columna: Se analiza la distancia de
cada aminoácido con todos los demás.
• Cuanto más brillante es el píxel, más cerca está
el par (nota: la línea brillante de 45° es la
distancia cero de cada aminoácido consigo
mismo).
• Superior: matriz de distancias reales
determinadas experimentalmente
• Medio: matriz con el promedio de las
distribuciones de distancia predichas por
AlphaFold.
• Inferior: Los modelos 3D de AlphaFold
(azul) versus los datos de las coordenadas
reales (verde) de las mismas tres proteínas.
[Link]
Preguntas ?
Curso: Química Computacional & Simulaciones
Agua y modelos de solvatación
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
• Consideraciones sobre el modelamiento de H2O
•
Modelos continuos y explícitos
• Modelos de H2O para Mecánica Molecular
• Comparación de modelos de H2O
•
Consideraciones sobre el modelamiento de H2O
Entornos realistas son esenciales para una simulación precisa
químicas/bioquímicas
DOI: 10.3390/ijms24076785
• Modelos continuos de solvente (H2O)
•
Modelos discretos de solvente (H2O)
Consideraciones sobre el modelamiento de H2O
¿Cómo elegir que modelo es más conveniente para la
simulación?
?
DOI: 10.3390/app10010144
Modelos continuos y explícitos
Modelos continuos
•
Significativamente más rápido que los modelos explícitos.
•
No reproduce detalles microscópicos de la interfaz soluto-agua.
•
No genera las mismas conformaciones que los modelos explícitos
•
Útil para el cálculo de ΔG de unión o para ‘docking’ flexible
compuesto-proteína.
Modelos continuos y explícitos
Modelos explícitos
•
El solvente representa -usualmente- +80% de las partículas en la
simulación.
• Las interacciones H2O-H2O dominan el costo computacional
•
El modelo de agua debe ser rápido y preciso.
•
Los modelos explícitos son modelos empíricos derivados para
reproducir propiedades generales en una fase particular.
•
No hay modelo que reproduzca con precisión todas las propiedades
clave del agua.
•
La elección del modelo depende de las propiedades de interés
deseadas.
Modelos continuos y explícitos
Un buen modelo de agua debe reproducir fielmente seis
propiedades generales del agua:
• Constante dieléctrica estática, ϵ0
•
Coeficiente de autodifusión, D⃗
• Calor de vaporización, ΔHvap
• Capacidad calorífica isobárica, C⃗p
• Coeficiente de expansión térmica, αp
• Compresibilidad isotérmica, κT
Modelos de H2O
TIP3P (transferable intermolecular potential)
•
Tres partículas interactuando, correspondientes
a los átomos de la molécula de agua.
•
Sólo el átomo de oxígeno tiene parámetros de
Lennard-Jones.
•
Los modelos de 3 partículas soy muy usados
porque son eficientes computacionalmente
•
Geometría rígida que se asemeja mucho a la
molécula de agua real.
Modelos de H2O
SPC/E (simple point charge)
•
Ángulo tetraédrico más obtuso de 109,47°.
•
Agrega una corrección de polarización
promedio a la función de energía potencial.
•
Reproduce la constante de densidad y
difusión mejor que el modelo SPC original.
•
Geometría rígida que se asemeja mucho a
la molécula de agua real.
Modelos de H2O
Modelos: 3-cargas 4 puntos
TIP4P-Ew
•
La carga negativa no está centrada en el átomo
de oxígeno, sino desplazada hacia los átomos de
hidrógeno.
•
La posición de la carga se representa con el
cuarto átomo ‘dummy atom’.
•
‘dummy atom’ está cerca del oxígeno a lo largo
de la bisectriz del ángulo HOH.
•
Mejora en asociación/disociación comparado con
los modelos de 3 puntos-3cargas.
Modelos de H2O
Optimal Point Charges (OPC and OPC3)
•
Diseñado sin restricciones geométricas.
•
Reproduce considerablemente mejor las seis
propiedades generales del agua.
Modelos de H2O
Modelos: 4-cargas 5 puntos
TIP5P
•
La carga negativa no está centrada en el átomo
de oxígeno, sino desplazada hacia los átomos de
hidrógeno.
•
Tiene 02 ‘dummy atoms’.
•
El modelo TIP5P de 4 cargas y 5 puntos
predice una excelente estructura del agua,
pero poca energía de hidratación.
Modelos continuos y explícitos
Limitaciones de los modelos de H2O
•
Los primeros modelos usaban un ‘cutóff’ para las interacciones
electrostáticas, aplicados con un método electrostático completo
resulta en interacciones electrostáticas más fuertes produciendo
una mayor densidad.
•
La mayoría de los nuevos modelos intentan reproducir propiedades
específicas de una fase específica, esto a expensas de otras
propiedades.
•
El modelo TIP3P predice energías libres de hidratación de
pequeñas moléculas neutras con mayor precisión que el modelo
TIP4PEw.
Comparación de los modelos de H2O
DOI: 10.1021/[Link].1c00794
Comparación de los modelos de H2O
Número de moléculas H2O en la primera capa de sovatación
DOI: 10.1021/[Link].1c00794 DOI: 10.1038/s41467-023-40278-x
Comparación de los modelos de H2O
Tensión Superficial en la interface líquido-vapor
DOI: 10.1021/[Link].1c00794
Comparación de los modelos de H2O
Constante dieléctrica
DOI: 10.1021/[Link].1c00794
Comparación de los modelos de H2O
Coeficiente de autodifusión
DOI: 10.1021/[Link].1c00794
Comparación de los modelos de H2O
ΔG de solvatación del metano
DOI: 10.1021/[Link].1c00794 DOI: 10.1039/C7CP04152G
Comparación de los modelos de H2O
¿Cómo afecta a la simulación del ‘folding’ los diferentes modelos de H2O?
Chignolin: mini-proteína
GYDPETGTWG
DOI: 10.1021/ct1003687
Comparación de los modelos de H2O
¿Cómo afecta a la simulación del ‘folding’ los diferentes modelos de H2O?
DOI: 10.1021/ct1003687
Comparación de los modelos de H2O
¿Cómo afecta a la simulación del ‘folding’ los diferentes modelos de H2O?
DOI: 10.1021/ct1003687
Ejemplos de simulación de sistemas con H2O
[Link]
[Link]
[Link]
[Link]
[Link]
Preguntas?
Curso: Química Computacional & Simulaciones
Simulaciones de pequeñas moléculas
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
•
Pequeñas moléculas
•
Modelamiento & Simulación de moleculas pequeñas
•
La aproximación de Hartree-Fock
•
Calculando perfiles de energía
•
Aplicaciones del modelamiento ab initio de pequeñas
moleculas
Pequeñas moléculas
En el contexto químico, biológico, farmacológico
Una molécula pequeña (o metabolito) es un compuesto orgánico de bajo peso molecular,
normalmente involucrado en un proceso biológico como sustrato o producto. En un rango de
masa de 50 a 1500 daltons (Da).
European Molecular Biology Laboratory
El dalton una unidad de masa atómica que se define como la doceava
parte de la masa de un átomo de carbono-12 no enlazado y en reposo.
m( C) = 12 u.m = 12 Daltons
m(H) = 1.00783 u.m. = 1 Dalton
m(aspirina) = 180.16 u.m = 180.16 Daltons
Pequeñas moléculas
En el contexto químico, biológico, farmacológico
[Link]
[Link]
[Link]
Pequeñas moléculas
Ejemplos de ‘small molecules’
Modelamiento & Simulaciones de m.p.
Para que se simulan las pequeñas moleculas
•
Procesos químicos
•
Procesos biológicos
•
Ciencias de Materiales
•
Petroquímica, Biorremediación
Modelamiento & Simulaciones de m.p.
Ab initio: QM Software
•
Gaussian: Ab Initio, Semi-empirical, DFT
•
Spartan: Ab Initio, Semi-empirical, DFT
•
NWChem: Ab Initio, DFT, MD, QM/MM
•
Orca: DFT
•
MolPro: Ab initio
Modelamiento & Simulaciones de m.p.
Aplicables para:
•
Energías de orbitales moleculares
•
Energía de formación para una conformación específica
•
Momento dipolar
•
Energía de disociación de enlace
•
Geometría y energías de los estados de transición
Modelamiento & Simulaciones
Métodos basados en el Métodos ab initio
cálculo de la función de
onda Interacción de Configuraciones (CI)
Métodos
Hartree-Fock Teoría de Perturbaciones (MP2,
Semiempíricos
MP4, …etc)
Clusters Acoplados CCS, CCD,
CCDT,…etc
Teoría del Funcional de la Densidad
La aproximación de Hartree-Fock
Ecuación de Schrödinger
electrons nuclei electrons nuclei
ˆ 2 2 2 2 e2Z A
H i
2me
i A
2m A
A
i A
riA Dada la imposibilidad de resolver
electrons nuclei 2 Para muchos electrones, se usa,
e2 e Z AZ B
tipicamente, la aproximación de
rij R AB
i j A B Hartree-Fock
La ecuación de HF en su forma de términos orbitales para el elecrón 1
La aproximación de Hartree-Fock
Como se resuelve la ec. HF
Al cambiar la forma de la ec. de Hartree-Fock, convirtiendo los espín-orbitales,
ci(x) ,en orbitales espaciales, yi (r), e integrando las funciones de spin:
Ecuación de Hartree-Fock en
términos de orbitales.
{fm (r) m =1, 2,..., K}
Introducción de set de Calcular los orbitales moleculares de HF
se reduce a calcular el set
funciones básicas
de coeficientes de la expansión, Cmi.
La aproximación de Hartree-Fock
HF como método auto consistente
La aproximación de Hartree-Fock
Molécula H2 usando HF
H2 es el sitema molecular neutro más sencillo: 2 protones, 2 electrones
Usando HF la función de onda es:
La aproximación de Hartree-Fock
Molécula H2 usando HF
Alvaro Soza Marañon. 2016
Universidad de Cantabria
La aproximación de Hartree-Fock
Molécula H2 usando HF
Simulaciones de Mecánica Cuántica
Molécula H2 usando HF
DOI: 10.1103/PhysRevA.62.010501
La aproximación de Hartree-Fock
Molécula C3OH6 (acetona) usando HF
DOI:10.1039/ft9928802111
[Link]
Aplicaciones del modelamiento ab initio
¿Por qué realizar ab initio de moléculas pequeñas?
¿Cómo saber que parámetros
se usan en el ‘forcefield’?
Aplicaciones del modelamiento ab initio
¿Cómo se agrega al ‘forcefield’?
Forcefield: Amber99SB-
ILDN
De acuerdo al formato
Gromacs2022.
[Link]
Aplicaciones del modelamiento ab initio
¿Cómo se agrega al ‘forcefield’?
Aplicaciones del modelamiento ab initio
¿Cómo se agrega un compuesto nuevo al ‘forcefield’?
Aplicaciones del modelamiento ab initio
Simulación de DM proteína-ligando
Aplicaciones del modelamiento ab initio
¿Y cómo se agrega el H2O al ‘forcefield’?
[Link]
¿Preguntas?
Curso: Química Computacional & Simulaciones
‘Forcefields’ y modelamiento ab initio
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
Revisión Simulaciones usando Mecánica Cuantica
‘Forcefields’ y sus variaciones
Programas de simulación de Mecánica Molecular
‘Docking’ Molecular
Modelamiento ab initio
Simulaciones de Mecánica Cuántica
Modelamiento ab initio
Derivados directamente desde principios teóricos, sin la inclusión de datos
experimentales
Requieren más recursos de hardware que otros métodos
Calculan geometrías de equilibrio para una molécula, aproximaciones de
la función de onda Ψ del sistema, energía de reacciones químicas
H E
Se conoce las 3N variables espaciales Para ser calculado/aproximado
N: número de electrones Variaciones y pertubaciones
Simulaciones de Mecánica Cuántica
Modelamiento ab initio
electrons 2 nuclei 2 electrons nuclei 2
^ −ℏ 2 −ℏ 2 −e ZA
H= ∑ ∇i + ∑ ∇A + ∑ ❑ ∑
i 2 me A 2 mA i A r iA
electrons 2 nuclei 2
e e Z A ZB
+ ∑ +∑
i> j r ij A>B R AB
Energía cinética de los electrones y del núcleo
Interacción electrostática entre el núcleo y los
electrones
Interacción electrostática entre electrones
Interacción electrostática entre núcleos
Método frecuente de resolución: Hartree-Fock
DOI: 10.3390/molecules28062669
Simulaciones de Mecánica Cuántica
Modelamiento usando Density Functional Theory (DFT)
Se considera también una simulación ab initio, pero …..
No usa la ecuación de Schrodinger, sino que usa la densidad de electrones
Tres distintos tipos de cálculos DFT:
Local density approximation (LDA). El más rápido, aunque entrega
geometrías menos precisas
Gradient Corrected. Geometrías más precisas
Híbridos. Combinación de DFT y Hartree-Fock
DFT: -6139.46
HF: -6132.89
% Difference: 0.11% (units: a.u.)
Simulaciones de Mecánica Cuántica
Métodos semiempiricos
Usa datos experimentales para parametrizar las ecuaciones
Como en los métodos ab initio, se usa el Hamiltonian y la función de
onda
Parte de la ecuación es aproximada o eliminada
Resultados menos precisos que ab initio, pero mucho más rapidos
Las ecuaciones son parametrizadas para obtener resultados
específicos: Geometría, calor de formación, orbitales, etc
H E
Simulaciones de Mecánica Cuántica
Modelamiento Quantum Mechanics Molecular Mechanis QM/MM
Método híbrido que acopla mecánica molecular y mecánica
cuántica:
El sitio activo es tratado con aproximación QM:
Centro de reacción
Cálcula los estados excitados
Problemas estructurales (estados de transición)
El entorno es tratado con Mecánica molecular:
Estructura de la enzima
Modelo explícito del solvente
Simulaciones de Mecánica Cuántica
¿Qué pasa en la frontero entre la región QM y MM?
Átomos en la frontera están presentes en ambas cálculos
La región QM no requiere forcefields
De manera natural se construye la polarización
electrostática de la región QM
Algunos métodos usados para la región fronteriza pueden
causar problemas, e.g. el método ‘link atoms’
La mejor alternativa es usar pseudo átomos
Métodos basados en el Métodos ab initio
cálculo de la función de
onda Interacción de Configuraciones (CI)
Métodos
Hartree-Fock Teoría de Perturbaciones (MP2,
Semiempíricos
MP4, …etc)
Clusters Acoplados CCS, CCD,
CCDT,…etc
Teoría del Funcional de la Densidad
‘Forcefields’ para Mecánica Molecular
Forcefield estandar para simulaciones de MM
‘Forcefields’ para Mecánica Molecular
Forcefields existentes en el mercado
Gromos96: 43a1p, 53a6
Amber: ff99SB-ILDN, ff99SB*-ILDN, ff99SB, ff03, ff03*
Charmm: Charmm27, Charmm36, Charmm22
OPLS: AA/L
Trappe:
‘Forcefields’ para Mecánica Molecular
Comparando forcefields para calcular ΔG
[Link]
softsimu/6929028590
DOI: 10.1039/D1CP00215E
‘Forcefields’ para Mecánica Molecular
Programas para realizar simulaciones MM
Gromacs
Algoritmo de integración de las ecuaciones
Amber
Optimización del uso de CPU. GPU
Algoritmos de paralelización
Charmm
Algunos manejan más forcefields que otros
NAMD
Algunos solo usan su propio forcefield
LAMMPS
También está el tema de Open Source
‘Forcefields’ para Mecánica Molecular
Otros Software y otros usos de MM
[Link]
‘Forcefields’ para Mecánica Molecular
‘Docking’ molecular
Procedimiento para predecir la mejor orientación relativa (energéticamente hablando) entre
dos moléculas: Receptor - ligando
TAU Bioinformatics Unit
- Identification of Target Proteins
- Validation/Structural Analysis of Drug Candidates
‘Forcefields’ para Mecánica Molecular
‘Docking’ molecular
Modelo llave-cerradura
‘Forcefields’ para Mecánica Molecular
‘Docking’ molecular
Modelo llave-cerradura
‘Docking’ rígido
‘Docking’ flexible
Jacob, Red; 2012
Modelamiento & Simulaciones ab initio
Ab initio: Aplicaciones
Kanamicina: C18H36N4O11
DNA: GCCCGGGC:
Proteína:
Modelamiento & Simulaciones ab initio
Ab initio: QM Software
Gaussian: Ab Initio, Semi-empirical, DFT
Spartan: Ab Initio, Semi-empirical, DFT
NWChem: Ab Initio, DFT, MD, QM/MM
Orca: DFT
Modelamiento & Simulaciones ab initio
Ab initio/ de novo: Proteínas
A partir de la secuencia:
MGQPGNGSAFLLAPNGSHAPDHDVTQERDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTVTNYFITSLACADLVMGLAVVPFGAAHIL
MKMWTFGNFWCEFWTSIDVLCVTASIETLCVI AVDRYFAITSPFK
Retos:
Función de ‘Score’
Métodos para muestreos más eficientes
Ventajas:
Construcción de nuevos plegamientos
Ayuda a entender el proceso de plegamiento
Desventajas:
Funciona solo en secuencias cortas; monómeros
Costo computacional
Modelamiento & Simulaciones ab initio
Software para Ab initio/ de novo: Proteínas
Rosetta/Robetta AI
(web version)
MD Software (toma mucho tiempo)
AlphaFol2 AI
Preguntas?
Curso: Química Computacional & Simulaciones
Simulaciones de mecánica
molecular y mecánica cuántica
Wilfredo Evangelista Falcón. Ph.D
[Link]@[Link]
Contenido
Simulaciones de Mecánica Molecular
2da Ley de Newton
Trayectorias de Dinámica Molecular
Simulaciones de Mecánica Cuántica
Modelamiento ab initio
Simulaciones de Mecánica Molecular
Como siempre, antes de simular, pimero se debe trabajar ….
El Modelo
Simulaciones de Mecánica Molecular
Para establecer el modelo, que se necesita?
Qué características del objeto de estudio deseamos
examinar
Saber cuál es la pregunta se desea responder
Modelando moléculas y biomoléculas
Las moléculas no son estáticas, se encuentran
en constante movimiento
Poseen diferentes tipos de movimiento
En el caso de las proteínas, su plegamiento,
depende de las condiciones del entorno
Existe una relación crucial: Estructura - Función
Definiciones M. Molecular & M. Cuántica
Se le llama Mecánica Molecular al modelamiento y posterior
simulación de moléculas siguiendo las leyes de Newton, en
particular, la 2da Ley de Newton: Mecánica Clásica
Mecánica Cuántica se basa en la teoría electrónica de átomos y
moléculas, pudiendo utilizar métodos semi-empíricos y ab initio
para describir las moléculas
Simulaciones de Mecánica Molecular
La Ley de Hooke
[Link]
Simulaciones de Mecánica Molecular
(Schlick, 2010)
Simulaciones de Mecánica Molecular
¿Para que sirve la Ley de Hooke?
En la distancia de equilibrio, el resorte tiene una energía potencial igual a cero.
Al comprimirse o estirarse el resorte, la energía potencial aumenta en forma de una
función de parábola, esta curva se llama potencial armónico.
Simulaciones de Mecánica Molecular
¿Para que sirve la Ley de Hooke?
Entonces, la frecuencia de vibración está
relacionada con la constante de fuerza K
y la masa del cuerpo.
¿Qué sucede con la frecuencia si se incrementa la masa?
Simulaciones de Mecánica Molecular
En el caso de un par de átomos
unidos ‘idealmente’ por un resorte,
¿qué valores de energía puede
tomar E (energía del sistema)?
Qué sabes desde la mecánica cuántica sobre
esos valores de energía?
Simulaciones de Mecánica Molecular
Imperfecciones del modelo
Una molécula no es un oscilador
armónico
Cuando los átomos se acercan, se
repelen más que un resorte
Cuando la separación es mayor a cierto
valor, el enlace se rompe.
Por ello, en estos casos se modelo con
un potencial no armónico.
Simulaciones de Mecánica Molecular
La vibración de una
molécula, por ejemplo, H2O
se da en tres movimientos
simples, llamados modos
normales.
Moléculas no lineales tienen
3N – 6 modos normales;
siendo N el número de
átomos en la molécula.
Simulaciones de Mecánica Molecular
El pentano
C5H12 tiene 17 átomos, entonces tiene 45
modos de vibración.
¿Cómo simplificar el modelo? Se trata por separado cada grupo
funcional, cada metilo tiene los mimos
modos normales, sin importar a quien
esté unido.
Simulaciones de Mecánica Molecular
[Link]
Simulaciones de Mecánica Molecular
Interacciones enlazantes
(covalentes)
Interacciones no enlazantes (no
covalentes)
Simulaciones de Mecánica Molecular
El problema del mínimo local y el mínimo global
Simulaciones de Mecánica Molecular
El problema del mínimo local y el mínimo global
Simulaciones de Mecánica Molecular
Dinámica Molecular
Halla las posiciones (x,y,z) de cada átomo en la molécula, integrando las
ecuaciones de movimiento
El cambio en la posición respecto del tiempo, nos dá la velocidad
Sigue las leyes de la mecánica clásica
La temperatura está definida por el promedio de la energía cinética
del sistema: U = 3/2 NkT; EK = ½ Nmv2
Durante la simulación se mantiene la distribución de velocidad de
Simulaciones de Mecánica Molecular
Trayectorias de Dinámica Molecular y sus escalas de tiempo
Simulaciones de Mecánica Cuántica
Características
Basada en la solución de la ecuacion de Schrodinger: HΨ= EΨ
Bastante rigurosa y de uso universal
Es la mecánica de los componentes elementales de la materia
y de la energía, de las partículas elementales
Demasiado costosa computacionalmente
Se aplican solo a ciertos procesos/sistemas químicos o
Simulaciones de Mecánica Cuántica
Qué propone la M. Cuántica
El intercambio de energía entre átomos y partículas solo se produce
en cantidades discretas, en cuantos
Las ondas de luz, en ciertas circunstancias se comportan como
partículas (fotones)
Las partículas fundamentales, en ciertas circunstancias se comportan
como si fueran ondas
Es imposible saber la posición y la velocidad al mismo tiempo
Simulaciones de Mecánica Cuántica
Modelamiento ab initio
Derivados directamente desde principios teóricos, sin la inclusión de datos
experimentales
Requieren más recursos de hardware que otros métodos
Calculan geometrías de equilibrio para una molécula, aproximaciones de
la función de onda Ψ del sistema, energía de reacciones químicas
Simulaciones de Mecánica Cuántica
Modelamiento Quantum Mechanics Molecular Mechanis QM/MM
Método híbrido que acopla mecánica molecular y mecánica
cuántica:
El sitio activo es tratado con aproximación QM:
Centro de reacción
Cálcula los estados excitados
Problemas estructurales (estados de transición)
El entorno es tratado con Mecánica molecular:
Estructura de la enzima
Modelo explícito del solvente
Simulaciones de Mecánica Cuántica
¿Qué pasa en la frontero entre la región QM y MM?
Átomos en la frontera están presentes en ambas cálculos
La región QM no requiere forcefields
De manera natural se construye la polarización
electrostática de la región QM
Algunos métodos usados para la región fronteriza pueden
causar problemas, e.g. el método ‘link atoms’
La mejor alternativa es usar pseudo átomos
Universidad Peruana Cayetano Heredia
Facultad de Ciencias e Ingeniería
Introducción a Machine Learning
Gaussian Mixture Models
Considere los valores siguientes -1, 1, 0, -2, 2. También considere una distribución normal
con parámetros θ = { μ=0, σ=1 }1
Recuerde que la función de densidad de probabilidad de la distribución normal es:
recuerde que los parámetros son θ={σ, μ}
Calcule la verosimilitud (likelihood) del modelo y sus parámetros para los datos en cuestión.
Hagamos el proceso en pasos, (I) primero calculemos f(xi|θ) para los siguientes casos:
x f(x)
-1
-2
A continuación, (II) calcule L.
1
Corresponde a la distribución normal estándar