Relación Estructura-Actividad Cuantitativa
QSAR
Química Medicinal
Facultad de Farmacia y Bioquímica
U.B.A
Desarrollo de Fármacos
Cabeza de serie
Farmacomodulación
Farmacomodulación
Cualitativa SAR Cuantitativa QSAR Cuantitativa Docking
Orientativa Predictiva Predictiva
Finalidad
Explorar las propiedades de un cabeza de serie en relación a los siguientes
aspectos
1. Predecir la actividad de compuestos aún no sintetizados.
2. Diseñar compuestos con actividad óptima.
3. Estudiar mecanismos de acción.
4. Estudios de toxicidad (Con QSAR).
5. Complemento de otros estudios por correlación.
Optimización QSAR
Metodología general de trabajo
Cabeza de serie: Proveniente Criterio de selección: Establecer los
de una vía de hallazgo análogos a preparar y descriptores.
Síntesis de análogos: Familia de
compuestos con una característica
modificada.
Reselección de análogos en
caso de ser necesario
Prueba biológica: Ensayos de cada
uno de los análogos sintetizados.
Análisis matemático: Correlación
descriptor-actividad y análisis
Síntesis o selección de
estadístico:
candidatos a fármacos
Respuesta Biológica = ƒ(descriptores)
Optimización QSAR
Descriptores moleculares Correlación de Descriptores biológicos
teóricos o fisicoquímicos descriptores Experimentales
Ecuación matemática de correlación
Estadísticos: R2, Q2, S, Press
Siempre se llega a una ecuación de correlación que establece
equivalencia entre la variación de actividad biológica y el descriptor
molecular empleado
Actividad = m.X + b
Modelo matemático más simple
La actividad biológica varia linealmente con el
descriptor
Optimización QSAR
Los métodos de QSAR se definen por la calidad de los
descriptores que utiliza para la correlación
Extratermodinámico Free-Wilson / QSAR1D-2D QSAR3D
Descriptores fisicoquímicos: Descriptores moleculares: Descriptores moleculares y
Los modelos matemáticos no todos tienen sentido fisicoquímicos dependiendo
obtenidos se pueden fisicoquímico. La mayoría del programa 3D.
racionalizar con sentido topológicos y superficie.
fisicoquímico. Requiere el mapeo con
El modelo matemático grillas de potencial. Análisis
Es primer método de QSAR permite un análisis más complejo de
basado inicialmente en el topológico de propiedades. propiedades en 3D.
estudio de lipofilicidad de Muy circunscripto a la familia
fármacos de análogos. Requiere el manejo por
completo con software: Los
Generalmente los modelos Generalmente los modelos modelos resultan de aplicar
resultan de correlaciones resultan de correlaciones metodologías de regresión
lineales simples. lineales simples. mas complejas.
Optimización QSAR: El descriptor biológico
Ehrlich: ciertas características específicas de las células explicaban su
selectividad por los colorantes.
Langley: Hay sustancias con las cuales la atropina es capaz de unirse
siguiendo alguna ley que depende de la masa relativa de la atropina y la
afinidad por las sustancia.
Diana Biológica
Media la acción del fármaco
Determina la relación cuantitativa entre la droga y el efecto farmacológico
Optimización QSAR: El descriptor biológico
Naturaleza de las dianas biológicas...
Proteinas receptoras de hormonas, neurotransmisores o factores de
crecimiento: median el efecto de señales químicas endógenas
(bloqueante beta adrenérgico: Atenolol).
Enzimas: proteínas transportadoras y reguladoras de vías metabólicas
(inhibidores de la COX: ác. Acetilsalicílico)
Proteinas estructurales: extra o intracelulares (inhibidor de la
polimerizacion de tubulina: colchicina)
Optimización QSAR: El descriptor biológico
Optimización QSAR: El descriptor biológico
PROPIEDADES A LAS CUALES SE REFIEREN LOS DESCRIPTORES BIOLOGICOS
L+R LR
conceptual
1) unión 2) respuesta
+ Respuesta
AFINIDAD EFICACIA
Ensayos de unión con ligando
marcado radiactivamente
experimental
Ensayos de Concentración/Dosis Respuesta
Optimización QSAR: El descriptor biológico
In vitro
Bmax Número de sitios totales
Kd Constante de disociación
KA Constante de afinidad
Ki Constante de inhibición
IC50 Concentración inhibitoria 50
EC50 Concentración efectiva 50
CC50 Concentración citotóxica 50
pD2 -log[EC50]
Emax Máxima respuesta de un agonista
pA2 Logaritmo negativo de la concentración de antagonista
frente a la cual es necesario duplicar la concentración de
agonista para tener el mismo efecto
MAC Mínima concentración activa
Ex vivo/in vivo
MAD Mínima dosis activa
ID50 Dosis inhibitoria 50
ED50 Dosis efectiva 50
DL50 Dosis letal 50
Optimización QSAR: El descriptor biológico
1) Fenómeno de unión
Basado en las isotermas de adsorción de gases a metales inhertes de Langmuir
Bmax Free
UniónTotal = + k Free
Free + Kd
UniónInespecífica = k Free
Prácticamente insaturable e irreversible
Bmax Free
UniónEspecífica =
Free + Kd
Koff Saturable, reversible
Kd =
Kon
Kd determina afinidad
Optimización QSAR: El descriptor biológico
2) Proceso de respuesta
En sistemas controlados se puede describir la relación entre la concentración de
una droga y su efecto biológico mediante ecuaciones matemáticas simples.
Efecto max Droga EC50 determina potencia
Efecto =
Droga + EC 50
Optimización QSAR: El descriptor biológico
Protocolo para determinar EC50 de un compuesto con
propiedades antiproliferativas
Selección y plaqueo de células: depende del
objetivo del ensayo y debe ser puesta a punto
Tratamiento con el compuesto: Replicados. Tiempo
del tratamiento acorde al de duplicación celular.
Mínimo 6 concentraciones que abarquen, aprox. 5
unidades logarítmicas. Incluir los controles necesarios
(vehículo, positivo, negativo)
Determinación de la actividad: Conteo de células viables.
Luego de teñir las células no viables con una solución de
azul tripán al 0,4% contar en cámara de newbauver las
células no teñidas.
Análisis matemático: Graficar el % de inhibición del
crecimiento en función del logaritmo de la
concentración. Ajustar mediante regresión no lineal a
una curva sigmoidea.
Optimización QSAR: Descriptor fisicoquímico y molecular
Estéricos: RM, Es, PM, Vm
Fisicoquímico: De origen
experiemental, permite conceptualizar Electrónicos: pKa, σo, σp, σ*
en base a un modelo químico.
Lipofilicidad: logP, FR, Π
Volumen: Sterimol.
Molecular: De origen teórico, muchos Superficie: MSA, TPSA, RHSA.
permiten explicar modelos químicos y
extrapolarse al modelo biológico. Topologicos: Randic index.
Otros son de tipo paramétricos y
permiten análisis relacionados con la Distribución 3D: WHIM, GRAV, MOMI.
geometria y topología molecular
Cuánticos: Esquemas de cargas,
Potencial electrostático.
QSAR: Descriptores electrónicos
Constante de Hammet σ (sistemas aromáticos):
Fenilaceticos K’
O OH O O
KH
+ H2O + H3O
O OH O O
Kx
+ H2O + H3O
X X
Benzoicos K
σx = log (Kx / KH) = pKaH - pKaX
σ < 0 donadores Correlación de
σ > 0 atractores constantes de ρ log (Kx / KH) = log (K’X / K’H)
σ = 0 para el H disociación
ρ σx = log (K’X / K’H)
QSAR: Descriptores electrónicos
Constante de Taft σ* (sistemas alifáticos):
F H3C
++ OH O O
O O
CH3 F F
O OH O
R
El efecto electrónico del sustituyente
H3C O modifica la velocidad de hidrólisis
CH3
O
CH3 H3C
OH O
+ O O O
CH3 H 3C H 3C
O OH O
ρ σ*x = log (KR / Kmetilo)base - log (KR / Kmetilo)acido El efecto electrónico
predomina sobre el estérico
en medio básico
Componente gobernada por el Componente gobernada por el
efecto electrónico efecto estérico (despreciable)
QSAR: Descriptores electrónicos
pKa: Como quedó demostrado, depende de los sustituyentes.
RMN: Los corrimientos de señales se deben a la naturaleza
electrónica de los sustituyentes
IR: Las señales también se ven afectadas por la naturaleza
electrónica de los sustituyentes.
σx = rR + fF Sigma se puede descomponer como la combinación
lineal de 2 efectos electrónicos
R = Aporte por resonancia
F = Aporte por efecto inductivo
También tabulados
QSAR: Descriptores estéricos
Constante Es de Taft :
H2O
H OH
O CH3 O CH3 Cl
Cl Cl + C2H5OH
O
O O
H
El efecto estérico del sustituyente
H3C O CH3 H2O modifica la velocidad de hidrólisis
O
H H3C O CH3
H3C O CH3 H3C OH + C2H5OH
O
O H O
El efecto estérico predomina
Es = log (KX-COOEt / Kacetato de etilo)ácido sobre el electrónico en medio
ácido
Cuando Es << 0 aumenta el efecto estérico.
QSAR: Descriptores estéricos
Refractividad molar, Volumen molar y Peso molecular
n2 - 1 PM
Refractividad Molar: MR = .
n2 + 2 δ
PM
Volumen Molar: VM =
δ
Peso Molecular: Puede ser un indicador estérico. Sin embargo, como los otros
descriptores de ésta familia no caracterizan bien la distribución estérica.
Los descriptores moleculares estéricos, la mayoría provenientes de métodos que
parametrizan sustituyentes, suelen caracterizar mejor éste efecto.
QSAR: Descriptores lipofilicidad
logP, constante de sustituyentes hidrofóbicos
Lipofilicidad: Mide la tendencia de un compuesto X a formar enlaces hidrofóbicos.
Expresado como el logaritmo de P, es obtenido experimentalmente, como la partición
del compuesto X entre octanol y agua.
[Compuesto X]octanol
Log P Hay otras metodologías para obtener el Log P de
P=
[Compuesto X]agua un compuesto: HPLC-C8RP, TLC-RP
πx = log PX - log PH Constante de los sustituyentes hidrofobicos: es contitutiva y aditiva.
Permite hallar el log P de un compuesto de forma matemática con
cierta aproximación al valor real. Tiene valor predictivo.
logP es una propiedad global. En cambio πx puede ser utilizado
para analizar el aporte de un sustituyente en una posición
especifica de la molécula.
QSAR: Descriptores lipofilicidad
logP, hallado por HPLC
Se trabaja con columna RP-C8 y como fase móvil ACN/Agua en relación decreciente por corrida y
se extrapola al 100% de agua. No se puede trabajar con 100% de agua porque los tiempos de
retención son prohibitivos.
Curva de regresión ajustada DHP
log K
O
2.500
log Kw H3C O NH
2.200
log Kw
1.900 H3C N O
y = -0.0569x + 2.1817 H
1.600
1.300
1.000 log K = log ((tR – t0)/t0)
0.700
0.400
0.100
-0.200 0 10 20 30 40 50
-0.500 % ACN
-0.800
Analito eluye a los 55 min.
Analito eluye a los 5 min.
QSAR: Descriptores moleculares
MSA, TPSA, Sterimol y cuánticos
Molecular surface area
MSA
Describe la superficie total Superficie polar
molecular.
Superficie molecular total
Es la suma de la superficie
aportada por todos los átomos. De Probe teórica para
concepto estérico. determinar áreas
accesible por solvente
En combinación con otros
descriptores permite relacionar
areas con propiedades.
Topological polar surface area
TPSA
Describe aquellas areas accesibles
por solvente (agua)
Superficie de Van der Waals
Es la suma de la superficie
aportada por los átomos polares en
la molécula.
Util para estudiar farmacocinética
QSAR: Descriptores moleculares
MSA, TPSA, Sterimol y cuánticos
Sterimol
Util para estudiar el aporte
estérico un sustituyente
Requiere de la parametrización
vectorial del sustituyente a
estudiar
Se utilizan 6 vectores para
caracterizar el sustituyente (B1,
B2, B3, B4, B5 y L)
Cuánticos
Permiten estudiar zonas de las Se necesita resolver (o se aproxima) la
moléculas suceptibles a uniones
ecuación de Schrödinger
electrostáticas y centros de
reacción HΨ = EΨ
Calculo de energía de orbitales
frontera: HOMO y LUMO.
Luego se calculan propiedades
Esquemas de cargas atómicas:
Mulliken, RESP, Fukui.
QSAR: Métodos para la selección de análogos
Son metodologías con sentido estadístico para conducir la síntesis de los
análogos del cabeza de serie a estudiar.
Hay desarrolladas diferentes metodologías manuales como:
Clusters de Hansch, Método Simplex, Arbol de decisión de Topliss, Diagrama de
Craig.
¿Qué sustituyentes elijo?
R Cl
Cl
En el estudio de QSAR se busca correlación
Variabilidad estructural = Variabilidad respuesta biológica
Sustituyentes similares = Poca variabilidad estructural = Poca información = Mala
correlación
QSAR: Métodos para la selección de análogos
R Cl
Cl
En los ejes: Valores de descriptores
ortogonales entre sí.
QSAR: Método extratermodinámico
En la década del 60’ Hansch y Fujita desarrollaron un método para describir en
forma cuantitativa relaciones entre la actividad biológica y propiedades
fisicoquímicas.
Correlación lineal de energía libre
Inicialmente estudiaron series homólogas
utilizando como descriptor la lipofilicidad.
Para una serie homóloga de compuestos
generalmente se obtienen relaciones parabólicas
entre la lipofilia y la actividad biológica:
log (1/IC50) = -k1(log P)2 + k2(log P) + k3
QSAR: Método extratermodinámico
La ecuación de Hansch busca alcanzar una correlación estadísticamente
significativa entre la actividad biológica y ciertos parámetros fisicoquímicos de
una familia de compuestos.
A = ƒ (descriptores lipofilos) + ƒ (descriptores electrónicos) + ƒ (descriptores estéricos)
Ejemplo: log (1/C) = a.π + b.σ + [Link] + d
De lo cual se desprenden las siguientes consideraciones:
A) Selección de variables ortogonales entre sí. (El R2 de correlacion entre
descriptores bajo).
B) Justificación estadística de las variables independientes. (Cumple Prueba t).
C) Principio de parsimonia. (Para n similares).
D) Número significativo de compuestos. (Según el método de regresión, en este
caso n > 4).
E) La mejor correlación debe poder racionalizarse sobre la base de principios
fisicoquímicos.
QSAR
Los modelos lineales de regresión son los más aceptados
por su relativa sencillez: Método de mínimos cuadrados.
Lineal simple: Lineal multiparamétrica:
Variable cuantitativa explicada Y Variable cuantitativa explicada Y
Variable cuantitativa explicativa X Dos o más variables cuantitativas explicativas X
Y = αX + β Y = α1X1 + α2X2 + α3X3 + … + αnXn + β
Confirmación del análisis:
• Suma de cuadrados residual: Q
• Coeficiente de correlación: r o R2
• Desvio estandard: s2
• Suma de cuadrados de predicción: PRESS (mide la capacidad predictiva del modelo).
• Determinante de la matriz de correlaciones: DET (indica nivel de ortogonalidad)
• Test de Fisher: F (prueba de significación global).
• Test de Student: t (prueba de significación individual en la regresión multiple).
QSAR
Archivos con
coordenadas
atómicas Tablas con
descriptores
Modelos N Name
1 H
log (1/C) Sigma ALogp2 MLogP MGVolume TPSA VABC MW
5.921 0.00 6.274 2.23 1.625 3.24 191.769 217.043
R Cl Diseño por Búsqueda de
2 4-NO2 4.801 0.78 4.046 1.90 1.799 49.06 217.710 262.028
estructurales
3 3-NO2 4.018 0.71 1.324 1.90 1.799 6.48 220.347 262.028
4 4-CH3SO2 3.759 0.72 3.011 2.01 2.046 45.76 245.155 295.020
computadora descriptores
5 3-CH3SO2
6 4-(CH3)2NCO
4.119
4.836
0.63
0.36
3.011
3.531
2.01
2.34
2.046
2.163
45.76 245.155 295.020
23.55 260.808 288.080
N 7 3-(CH3)2NCO
8 4-CH3S
5.119
5.790
0.35
0.00
3.531
7.567
2.34
2.23
2.163
1.929
23.55 260.808 288.080
28.54 227.574 263.030
Síntesis y 9 4-CH3
10 3-CH3
11 4-CH3O
6.398
5.921
6.347
-0.17
-0.07
-0.27
8.710
8.710
4.025
2.34
2.34
2.23
1.766
1.766
1.824
3.24 209.065 231.058
3.24 209.065 231.058
12.47 217.856 247.053
Cl prueba de
12 3-CH3O
13 4-NH2
5.569
7.149
0.12
-0.66
4.025
1.711
2.23
2.12
1.824
1.724
12.47 217.856 247.053
29.26 202.766 232.053
14 3-NH2 6.420 -0.16 1.711 2.12 1.724 29.26 202.766 232.053
actividad
Cálculo de
correlación
Modelo n R2 Q2 Error
Modelo Selección Log (1/C) = 5.81 - 2.26xSigma 14 0.92 0.90 0.29
Log (1/C) = 0.025xAlogp2 - 2.22xSigma 14 0.92 0.91 0.30
QSAR Log (1/C) = 6.20*MGvolume – 0. 067*MW + 12.55 14 0.79 0.57 0.50
QSAR
N Name log (1/C) Sigma ALogp2 MLogP MGVolume TPSA VABC MW
1 H 5.921 0.00 6.274 2.23 1.625 3.24 191.769 217.043
2 4-NO2 4.801 0.78 4.046 1.90 1.799 49.06 217.710 262.028
3 3-NO2 4.018 0.71 1.324 1.90 1.799 6.48 220.347 262.028
4 4-CH3SO2 3.759 0.72 3.011 2.01 2.046 45.76 245.155 295.020
5 3-CH3SO2 4.119 0.63 3.011 2.01 2.046 45.76 245.155 295.020
6 4-(CH3)2NCO 4.836 0.36 3.531 2.34 2.163 23.55 260.808 288.080
7 3-(CH3)2NCO 5.119 0.35 3.531 2.34 2.163 23.55 260.808 288.080
8 4-CH3S 5.790 0.00 7.567 2.23 1.929 28.54 227.574 263.030
9 4-CH3 6.398 -0.17 8.710 2.34 1.766 3.24 209.065 231.058
10 3-CH3 5.921 -0.07 8.710 2.34 1.766 3.24 209.065 231.058
11 4-CH3O 6.347 -0.27 4.025 2.23 1.824 12.47 217.856 247.053
12 3-CH3O 5.569 0.12 4.025 2.23 1.824 12.47 217.856 247.053
13 4-NH2 7.149 -0.66 1.711 2.12 1.724 29.26 202.766 232.053
14 3-NH2 6.420 -0.16 1.711 2.12 1.724 29.26 202.766 232.053
Modelo n R2 Q2 Error
1 Log (1/C) = 5.81 - 2.26xSigma 14 0.92 0.90 0.29
2 Log (1/C) = 0.025xAlogp2 - 2.22xSigma + 5.71 14 0.92 0.91 0.30
3 Log (1/C) = 6.20xMGvolume - 0.067xMW + 12.55 14 0.79 0.57 0.50
4 Log (1/C) = 12.11 - 3.56xMGvolume 14 0.30 0.35 0.86
5 Log (1/C) = 13.30 - 0.031xMW 14 0.61 0.64 0.64
QSAR
Modelo n R2 Q2 Error
1 Log (1/C) = 5.81 - 2.26xSigma 14 0,92 0,90 0,29
2 Log (1/C) = 0.025xAlogp2 - 2.22xSigma + 5.71 14 0,92 0,91 0,30
3 Log (1/C) = 6.20xMGvolume - 0.067xMW + 12.55 14 0,79 0,57 0,50
4 Log (1/C) = 12.11 - 3.56xMGvolume 14 0,30 0,35 0,86
5 Log (1/C) = 13.30 - 0.031xMW 14 0,61 0,64 0,64
Todos los modelos son
comparativos
Modelo Regresión Ortogonalidad Prueba t Parsimonia Observaciones
1 Cumple No se calcula Cumple Cumple 14
2 Cumple Cumple No cumple Alogp2 No cumple 14
3 Aceptable No cumple No cumple No cumple 14
4 No cumple No se calcula Aceptable Cumple 14
5 Aceptable No se calcula Aceptable Cumple 14
QSAR
Los descriptores MW y MGVolume no son ortogonales
2.500
MGVolume = 0.0060xMW + 0.36
MGVolume MW 2
R = 0.86
1.625 217.043 2.000
1.799 262.028
1.799 262.028
2.046 295.020
MGVolume
1.500
2.046 295.020
2.163 288.080
2.163 288.080
1.000
1.929 263.030
1.766 231.058
1.766 231.058
1.824 247.053 0.500
1.824 247.053
1.724 232.053
1.724 232.053 0.000
0.00 50.00 100.00 150.00 200.00 250.00 300.00 350.00
MW
QSAR
Parsimonia: El descriptor AlogP2 no es un término relevante para la regresión.
Log (1/C) = 0.025xAlogp2 - 2.22xSigma + 5.71
Coeficientes Error típico Estadístico t Probabilidad
Intercepción 5.702196024 0.181696822 31.38302567 4.08238E-12
Sigma -2.225709403 0.197519198 -11.26831934 2.21478E-07
Alogp2 0.025241901 0.034632226 0.72885587 0.481320023
Observese los valores que adopta A igual coeficiente de regresión (R2)
Alogp2 y su constante de Se elige la más sencilla
proporcionalidad
Log (1/C) = 5.81 - 2.26xSigma
Coeficientes Error típico Estadístico t Probabilidad
Intercepción 5.818755313 0.084548451 68.82154881 5.88279E-17
Sigma -2.263065974 0.18699056 -12.10256804 4.39815E-08
QSAR
Grafico de correlación
5.81 - 2.26xSigma = Log (1/C)
N Name log (1/C)exp. Sigma log (1C)calc.
1 H 5.921 0.00 5.810 8.000
2
2 4-NO2 4.801 0.78 4.047 7.000 R = 0.9243
3 3-NO2 4.018 0.71 4.205
log(1/C) experimental
6.000
4 4-CH3SO2 3.759 0.72 4.183
5 3-CH3SO2 4.119 0.63 4.386 5.000
6 4-(CH 3)2NCO 4.836 0.36 4.996 4.000
7 3-(CH 3)2NCO 5.119 0.35 5.019 3.000
8 4-CH3S 5.790 0.00 5.810
2.000
9 4-CH3 6.398 -0.17 6.194
10 3-CH3 5.921 -0.07 5.968 1.000
11 4-CH3O 6.347 -0.27 6.420 0.000
12 3-CH3O 5.569 0.12 5.539 0.000 2.000 4.000 6.000 8.000
13 4-NH2 7.149 -0.66 7.302 log(1/C) calculado
14 3-NH2 6.420 -0.16 6.172
QSAR3D
Son metodologías que tienen en cuenta de forma explícita la forma
tridimensional de los ligandos
Uno de los primeros de éstos métodos es el CoMFA: Comparative Molecular Field Analysis.
Búsqueda de descriptores Cálculo de correlación
Realiza un mapa 3D de Los datos de actividad se correlacionan con
interacciones electrostáticas y los datos de interacción extraidos de los
estéricas de los ligandos utilizando mapas. Utiliza otra metodología de regresión:
una grilla de puntos extendida en PLS (Partial least squares) o cuadrados
XYZ para elaborar los mapas. mínimos parciales.
Modelo
CoMFA: Cramer et al, J. Am . Chem. Soc., 110, 5959 QSAR
(1988)
QSAR3D
CoMFA: Comparative Molecular Field Analysis.
Superficies interpoladas de los mapas electrostáticos y estéricos.
Los puntos que generan las superficies tienen información del ligando.
Docking
Son metodologías requieren la forma tridimensional de la diana biológica.
El estudio de interacción es directamente entre ligando-diana
Es una metodología que se usa principalmente para el diseño de nuevos
fármacos (obtención del prototipo)
Complejo ligando + proteína
Coordenadas atómicas XYZ
ligando y proteína
Parametrización y
asignación de cargas
atómicas
Programa de Docking
Docking
Como criterio de selección los programas de Docking dan información
de ranking para seleccionar las mejores conformaciones del ligando
Clusters de conformaciones
Docking
De los clusters de conformaciones se selecciona el de mejor ranking
Los modelos de interacción se confirman luego por dinámica molecular (MD)