Epidemiología – parte 2
Joaquin Baruch, DSV, PhD
Orientación Medicina Veterinaria
Facultad de Veterinaria
Temas para hoy
• Estimación de prevalencia y detección de enfermedad
• Estimación de proporciones
• Calculo de tamaño de muestra
• Evaluación de pruebas diagnosticas continuas
Estimación de Prevalencias (Distribución Normal)
pq
• Muestras grandes P p z n
• np > 15 y nq >15 (ó npq > 5)
= 1- nc
nc
-4 sd -3 sd -2 sd -1 sd media 1 sd 2 sd 3 sd 4 sd
Ejemplo: n=100 x(éxitos) 10 p= x/n = 0.1
Determinar el IC 95% para la Proporción Poblacional
npq=100 x 0.90 x 0.10 = 9 5 Aprox. Normal
0.475
nc = 0.95
-4 sd -3 sd -2 sd -1 sd media 1 sd 2 sd 3 sd 4 sd
-1.96 +1.96
n.c.=0.90 = 0.10 z=1,65
n.c.=0.95 = 0.05 z=1,96
n.c.=0.99 = 0.01 z=2,57
n.c.=0.95 = 0.05 z = 1.96
LCi = 0.1 1.96
0.1 0.9 100 0.0412
P (0.0412;0.1588)
LCs =
0.1 1.96 0.1 0.9 100 0.1588
Tamaño de muestra para estimación
de prevalencia (MAS)
ˆ ˆ
n PQ z d 2
Ejemplo: Pˆ 0.3 Qˆ 1 0.3 0.7 d = 0.01 (1%)
n.c.=0.95 z =1.96
n 0.3 0.7 1.96
0.01
2
8068
¿Cómo obtener P̂ si aún no se tomó la muestra?
1. Utilizar P histórica
2. Utilizar P de un muestreo anterior
3. Tomar una muestra piloto y calcular p
4. Suponer P = 0.5 (conduce a muestras más grandes de lo necesario)
n Pˆ Qˆ z d2
Ejemplo: enfermedades podales
De estudios anteriores se conoce que las enfermedades podales de los
ovinos en una región afectan el 20% (0.20) de los animales. Se quiere
actualizar la estimación de la proporción de animales afectados en la
región:
• Determinar el tamaño de la muestra para que el error en la estimación
no supere el 4% (0.04) a un nivel de confianza del 99% (0.99).
P=0,20; Q=1-P=0,80
• Se quiere determinar el tamaño de la muestra para que el
error en la estimación no supere el 4% (0.04) a un nivel de
confianza del 99% (0.99).
ˆ d
ˆ
n PQ z
2 z10,01/ 2 z0,995 2,575
2,5752 (0, 2)0,8
n 2
663, 06
0, 04
n 664
Tamaño de muestra para Detección
de enfermedad (MAS)
MAÑO DE MUESTRA NECESARIO
Tamaño de muestra para Detección de
RA DETECTAR LA PRESENCIA O AUSENCIA DE UNA ENFERMEDAD
enfermedad
TAMAÑO DE LA POBLACION 10.000 (MAS)Prev Aparente Sp
NIVEL DE CONFIANZA 95% -1,30103 50,40% 50%
SENSIBILIDAD 90% -0,30451832
Distribución
PREVALENCIABinomial p(x>0)=
ESPERADA – p(x=0) = 1 – [
1 1,00% (1-p)^n ]
TAMAÑO
n>=(log DE MUESTRA
0.05) / (log (1-p)(n) para probabilidad
327 detección
5 =0.95
(1 (1 )1 / D )( N 1 ( SeD 1))
n 2
Se
FORMULA SEGUN CANNON (2001)
Sense and sensitivity –designing surveys based on an imperfect test. Prev. Vet. Med. 49: 141-163
Ejemplo con epitools
Ejemplo con excel
Estudios de prevalencia
• Determinar la frecuencia y distribución de un agente infeccioso
• Frecuentemente por medición de anticuerpos
• Problema: falsos positivos y negativos
Propiedades de las pruebas
• Sensibilidad (Se)
Proporción de animales correctamente
• Especificidad (Esp) identificados por la prueba
• Exactitud
VP + VN
N
Selección de pruebas diagnósticas
Usar una prueba con alta Se cuando se quiere:
• Reducir el número de falsos negativos
•Evitar la introducción de una enfermedad
•Recordar la relación con el VPN (mejora con el aumento de Se)
Selección de pruebas diagnósticas
Usar una prueba con alta Esp cuando se quiere:
• Confirmar un diagnóstico presuntivo
• Evitar el sacrificio innecesario de animales (ojo: siempre considerar la Se de la prueba
confirmatoria – ver uso combinado de Pruebas)
•Recordar la relación con el VPP (mejora con el aumento de Esp)
Combinación de Pruebas
Frecuentemente se utilizan en:
Vigilancia
Programas de Control/Erradicación
Certificados sanitarios
Pruebas Múltiples:
Simultaneas
Secuenciales
Interpretación de Resultados
Serie
Paralelo
Pruebas en SERIE
Para considerar el diagnóstico como positivo, se requiere que ambos
resultados sean positivos (prueba confirmatoria).
El diseño en SERIE aumenta la ESPECIFICIDAD, disminuyendo la
proporción de FP (aumentando el VPP)
Pocos FP dado que el animal debe ser + a ambas pruebas
Pruebas en PARALELO
Para considerar el diagnóstico como positivo basta con
que alguno de los resultados sea positivo.
El diseño en PARALELO aumenta la SENSIBILIDAD,
disminuyendo la proporción de FN (aumenta el VPN)
Pocos FN dado que un animal - debe serlo en ambas pruebas
Independencia
Para considerar una prueba (T2) independiente de otra (T1), las
probabilidades de sus resultados no dependen del resultado que el animal
haya tenido la prueba T1
P(T2+|T1+|enf)= P(T2+|T1-|enf)
Ejemplo:
T1 con Se=0.90 aplicado a 100 animales infectados
10 FN, a ellos se realiza T2 que tiene Se=0.80, entonces si las pruebas son
INDEPENDIENTES esperamos encontrar 8 animales +
Se y Sp del esquema en serie independencia
+ Verdadero +
I Se2
N
F
E Falso -
1-Se2
C Se 1
T
Prueba detecta?
A
D
Falso -
O 1-Se1
p
S
Se_serie= (Se1*Se2)
Animal infectado?
1-p
1-Sp2
Falso +
+
1-Sp1
S Prueba detecta?
Sp2 Verdadero -
A
N
O Sp1
S
Verdadero -
Sp_serie= (Sp1+(1-Sp1)*Sp2)
Se y Sp del esquema en serie DEPENDIENTES
+ Verdadero +
I P(+2|+1)
N
F
E Falso -
1-P(+2|+1)
C Se 1
T
A Prueba detecta?
D
Falso -
O 1-Se1
p
S
Se_serie= Se1*P(+2|+1|E)
Animal infectado?
1-p
1-P(-2|+1) Falso +
+
1-Sp1
S
A Prueba detecta?
P(-2|+1) Verdadero -
N
O
S Sp1
Verdadero -
Sp_serie= 1-[(1-Sp1)*(1-P(-2|+1|S))]
Se y Sp del esquema en paralelo Independientes
I
N
F
+ Verdadero +
E
C
Se 1
+ Verdadero +
T Se 2
A Prueba detecta?
D Falso -
O 1-Se1 1-Se2
p
S
Se_paralelo= 1-[(1-Se1)*(1-Se2)]
Animal infectado?
1-p
1-Sp1 + Falso +
Sp_paralelo= Sp1*Sp2
Prueba detecta?
S
A
N
Sp1
1-Sp2 + Falso +
O
S
Sp2 Verdadero -
Se y Sp del esquema en paralelo DEPENDIENTES
I
N
+ Verdaderos +
F
E Se 1 +
C
T P(+2|-1)
Prueba 1 detecta?
A
D Falso -
A O 1-Se1
p 1-P(+2|-1)
N S
I Se_paralelo= [Se1+(1-Se1)*P(+2|-1|E)]
M
A Animal infectado?
L
E 1-p 1-Sp1
+
S Falso +
S Sp_paralelo= Sp1*P(-2|-1|S)
A Prueba 1 detecta?
N Falso +
O Sp1
S
1-P(-2|-1)
+
P(-2|-1) Verdadero -
Consideraciones
• Antes de interpretar un resultado:
• Conocer las características de la prueba
• Conocer la situación epidemiológica general a la que se enfrenta
• Aceptar que no existen pruebas 100% confiables
Cut-off (punto de corte)
Para un test con resultados continuos, es el valor que clasifica los individuos en T+ y T-
VN
VP
FN FP
cut-off
ROC análisis Receiver Operating Characteristic
Desarrollado en la década de 1950 (radar)
• Área médica en los 1960 (Zwig 1993) radiología
• Actualmente es la herramienta estándar para evaluación de la capacidad
discriminatoria de una prueba diagnóstica en la que se obtienen resultados
continuos.
ROC análisis evalúa el desempeño discriminatorio en términos de Se y (1-Sp)
para cada valor observado de la variable si se empleara como cut-off.
• El método más simple de construir la curva ROC es el que suele conocerse como empírico, que
consiste simplemente en representar todos los pares (1-especificidad, sensibilidad) para todos
los posibles valores de corte que se puedan considerar con la muestra particular de que
disponemos.
• Requiere una prueba de oro
AUC, el área bajo la curva ROC: es uno de los índices más
utilizados para resumir la “calidad” de la curva.
Área bajo la curva AUC
La mayor exactitud diagnóstica de una prueba se traduce en un:
• Desplazamiento "hacia arriba y a la izquierda" de la curva ROC. Esto sugiere que el área bajo
la curva ROC (AUC) se puede emplear como un índice conveniente de la exactitud global de la
prueba: la exactitud máxima correspondería a un valor de AUC de 1 y la mínima a uno de 0.5
(si fuera menor de 0.5 debería invertirse el criterio de positividad de la prueba).
• Cuando la curva ROC se genera por el método empírico, el área puede calcularse mediante la
regla trapezoidal, es decir, como la suma de las áreas de todos los rectángulos y trapecios que
se pueden formar bajo la curva.
• Estadísticamente, podemos testar Ho AUC=0.5 con el valor del estadístico de suma de rangos
de Wilcoxon, W
• Hanley y McNeil 1982 reportan un método de estimación del error estándar y brindan la
fórmula de cálculo para el estadístico W
La sensibilidad se evalúa en la población de casos, mientras que
la especificidad en la población de no casos
Disponiendo de los resultados de prueba, se hace variar el punto de corte
Calcular Sensibilidad y Especificidad para cada punto de corte y se grafica
Se elige el punto U cuya suma (1- Sens) + (1- Esp) sea mínima
(sin considerar prevalencias ni costos ni objetivos)
Minimizar (FP + FN) = (1-Sp)(1-P)+(1-Se)P
Costos: (1-Sp)(1-P)*CFP / (1-Se)P*CFN ~ 1
.
..
Punto de corte óptimo es el que hace
mínima la suma (1-S)+ (1-E)
1-S (1-S)+(1-E)
p.c S 1-E
65 0.08 0.015 0.935
70 0.15 0.031 0.88
1-E 75 0.28 0.09 0.81
80 0.45 0.22 0.77
85 0.66 0.40 0.74
90 0.80 0.65 0.85
95 0.90 0.80 0.90
Comparación de Pruebas
Concordancia entre dos Pruebas
Kappa
Expresa la proporción de concordancia eliminando el efecto del azar
• 1 indica coincidencia total
• 0 indica coincidencia igual al azar
Prueba 1
+ -
Prueba 2
+ a b a+b
- c d c+d
a+c b+b n
Proporción de Acuerdo Observado AcO= (a+d)/n
Proporción de Acuerdo Esperado AcE= [(a+c)*(a+b)/n+(b+d)*(c+d)/n]n
La diferencia entre el Acuerdo Observado y el Acuerdo Esperado (si fueran
independientes) es la concordancia observada no debido al azar: AcO-AcE
El valor máximo de concordancia posible no debido al azar es 1-AcE
Kappa = [AcO-AcE] / [1-AcE]
Po a d n
( a b)(a c ) ( c d )(b d )
Pe
n2
Po Pe
1 - Pe
Ejemplo
Prueba 1
+ - Pobs = 0.95081967
Prueba 2
+ 90 5 95 Pesp = 0.56490191 azar
- 10 200 210
100 205 305 kappa = 0.887
Po a d n
Po Pe
( a b)(a c ) ( c d )(b d ) 1 - Pe
Pe
n2
LIMITACIONES DEL ESTADÍSTICO KAPPA
El valor de kappa se ve afectado por la prevalencia
Kappa es un estadístico descriptivo útil, pero es inadecuado con fines de
predicción o inferencia
Kappa depende del número de categorías (más categorías , más difícil
clasificar, valores de kappa más bajos)
Para datos ordinales derivados de categorizar variables continuas, el valor
de kappa depende fuertemente de las manera que se hacen de las
categorías (generalmente arbitrarias).
El uso de la ponderación, aunque lógico y útil, introduce otro componente
de subjetividad
.
..
Contacto:
[email protected]