1.
Prueba de Mc Nemar y Binomial
Variable de respuesta nominal u ordinal.
La prueba de McNemar es apropiada para los diseños antes y después en los que
cada persona es usada como su propio control.
Corrección por continuidad (yates) 1934
Corrección por continuidad. Realizando la corrección por continuidad la prueba
llega a ser excelente. La corrección es necesaria porque se usa una distribución
continua para aproximar una distribución discreta. Cuando las frecuencias
esperadas son pequeñas la aproximación puede ser pobre. La corrección por
continuidad es un intento por remover esta fuente de error (Yates 1934)
(|𝐴 − 𝐷 | − 1)2
𝑋2 = → 𝑋12
(𝐴 + 𝐷 )
1.1 Procedimiento.
Paso 1. Se especifica la hipótesis nula y alterna.
Paso 2. Nivel de significancia.
Paso 3. Prueba estadística.
a) Se ordenan las frecuencias observadas en una tabla de 2x2.
b) Determinar las frecuencias esperadas de cambio: E = ½(A+D).
c) Prueba estadística:
Si Ei < 5, Utilizar la prueba binomial. n = A+D, y X es la menor de
las dos frecuencias observadas A o D.
Si Ei ≥ 5, Utilizar la prueba de MacNemar.
d) Se determina la probabilidad conforma Ho asociada con el valor
observado de X2 en la tabla C. La tabla presenta probabilidades para
dos colas.
Paso 4. Decisión
Se rechaza Hi: si 𝑝 ≤ 𝛼, o si 𝑋 2 > 𝑋𝑡2
1.2 Potencia eficiencia
Cuando la prueba de McNemar se usa con medidas nominales, el concepto de
potencia y eficiencia no tiene sentido puesto que no hay otra alternativa. Sin
embargo, cuando la medición y otros aspectos de los datos son tales que es
posible aplicar la prueba paramétrica t, tanto la prueba de McNenar como la
binomial tienen una potencia eficiencia de cerca del 95% para A+D=6, que
declina a medida que aumenta el tamaño de A+D hasta una eficiencia final
(asimtótica) de cerca del 63%.
1.3 Ejercicios resueltos manualmente y en R
Ejemplo: Se quiere probar si una nueva terapia física ayuda a disminuir el
dolor en un grupo de pacientes que sufrieron cierta lesión. Se aplicó una escala
que clasifica al paciente en si presenta un alto grado o bajo grado de dolor,
antes y después de la terapia. Fueron evaluados 20 pacientes y los datos se
presentan en la siguiente tabla donde 1 corresponde a alto grado de dolor y 0
a bajo grado.
Tabla 117. tabla de datos
Paciente Antes Después
1 1 1
2 1 0
3 1 1
4 1 0
5 0 0
6 0 0
7 1 1
8 0 0
9 1 1
10 0 0
11 1 1
12 0 0
13 0 0
14 1 0
15 1 0
16 0 1
17 1 1
18 0 1
19 0 0
20 1 0
Ho: La nueva terapia física no ayuda a disminuir el dolor
Ha: La nueva terapia física ayuda a disminuir el dolor
En código R
# Prueba de McNemar
# Ejemplo Efectos Psicologicos
dolor <-
c(1,1,1,1,0,0,1,0,1,0,1,0,0,1,1,0,1,0,0,1,1,0,1,0,0,0,1,0,0,1,1,0,0,0,0,1,1,1,0,0)
sujeto <-
c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2)
datos <- [Link](sujeto, dolor)
head(datos)
## sujeto dolor
## 1 1 1
## 2 1 1
## 3 1 1
## 4 1 1
## 5 1 0
## 6 1 0
antes = datos$dolor[datos$sujeto==1]
despues = datos$dolor[datos$sujeto==2]
datos <- [Link](antes, despues)
datos
## antes despues
## 1 1 1
## 2 1 0
## 3 1 1
## 4 1 0
## 5 0 0
## 6 0 0
## 7 1 1
## 8 0 0
## 9 1 0
## 10 0 1
## 11 1 1
## 12 0 0
## 13 0 0
## 14 1 0
## 15 1 0
## 16 0 1
## 17 1 1
## 18 0 1
## 19 0 0
## 20 1 0
Analisis grafico de los datos
par(mfrow=c(1,1))
plot(antes,type="b",pch=19,col="blue",xlab ="datos" )
lines(despues,type="b",pch=18,col="red",lty=2)
legend(x="topright",legend=c("antes", "despues"),
col=c("blue", "red"),lty=1:2,cex=0.8)
Figura 58. diagrama de línea
summary(datos)
## antes despues
## Min. :0.00 Min. :0.0
## 1st Qu. :0.00 1st Qu. :0.0
## Median :1.00 Median :0.0
## Mean :0.55 Mean :0.4
## 3rd Qu. :1.00 3rd Qu. :1.0
## Max. :1.00 Max. :1.0
# utilicice los minimos y maximos para graficar
# Diagrama de dispersión para datos emparejados
plot(antes,jitter(despues), # jitter offsets points so you can see them all
pch = 16, # shape of points
cex = 1.0, # size of points
xlim=c(0, 1), # limits of x axis
ylim=c(0, 1), # limits of y axis
xlab="antes",
ylab="despues"
)
abline(0,1, col="blue", lwd=2) # line with intercept of 0 and slope of 1
Figura 59. diagrama de dispersión
La trama nuestra casi por igual puntos por encima y debajo de la línea, los puntajes
serian similares
# grafico de barras para las diferencias
diferencias <- antes- despues
diferencias
## [1] 0 1 0 1 0 0 0 0 1 -1 0 0 0 1 1 -1 0 -1 0 1
barplot(diferencias, col="dark gray", xlab="datos",
ylab="Diferencias (antes - despues)")
Figura 60. de diferencias
Hay más puntajes después que antes
tabla <- table(antes,despues)
tabla
## despues
## antes 0 1
## 0 6 3
## 1 6 5
# Test Mc nemar
[Link](tabla)
## McNemar's Chi-squared test with continuity correction
## data: tabla
## McNemar's chi-squared = 0.44444, df = 1, p-value = 0.505
𝑝(0.505) > 𝛼(0.05), la prueba estadística es no significativa, no se rechaza Ho.
La nueva terapia física no ayuda a disminuir el dolor
# Test binomial
# utilice los resultados de la tabla
# x son los cambios en la tabla
[Link](x = 6, n = 6 + 3, p = 0.5 )
## Exact binomial test
##
## data: 6 and 6 + 3
## number of successes = 6, number of trials = 9, p-value = 0.5078
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
## 0.2992951 0.9251454
## sample estimates:
## probability of success
## 0.6666667
𝑝(0.5078) > 𝛼(0.05), la prueba estadística es no significativa, no se rechaza
Ho.
La nueva terapia física no ayuda a disminuir el dolor. La probabilidad de que
ocurra el evento (el suceso no sea igual a 0.5) es 0.66.
Ejemplo: Un psicólogo infantil está interesado en la iniciación de los niños en
los contactos sociales. Ha observado que los niños recién llegados a una
guardería suelen iniciar sus contactos personales con adultos, antes que con
otros niños. Predice que, con creciente familiaridad y experiencia, los niños
iniciarán cada vez más contactos sociales con otros niños y no con adultos.
Para probar esta hipótesis, observa 25 niños en su primer día en la guardería,
y clasifica su iniciación en los contactos sociales de acuerdo con que haya sido
con un adulto o con un niño. Observa a cada uno de los 25 niños después de
un mes, haciendo la misma clasificación. Los resultados son:
Tabla 118. Objetos de iniciación en el día treinta
Antes
+ -
Después + 4 =A 14 = A
- 4=D 3=C
Solución
1) Hipótesis estadística:
Ho: Para cualquiera de los niños que cambiaron, la probabilidad de que
desplace su objeto de iniciación de un adulto a un niño (PA) en igual a
la probabilidad de que cambie su objeto de iniciación de un niño a un
adulto (PD):
H1: Los niños muestran una tendencia significativa a cambiar su objeto de
iniciación de adultos a niños después de 30 días de experiencia en la
guardería..
2) Nivel de significancia: α = 0.05
3) Usando el procedimiento:
Es del tipo antes y después (muestras relacionadas), usa medición nominal
(clasificatoria).
n = 25; E = ½(14+4) = 9 entonces 9 > 5, además la clasificación está
en un cuadro de doble entrada. Utilizamos la prueba de Mac Nemar
2
(|𝐴 − 𝐷 | − 1)2 (|14 − 4| − 1)2
𝑋 = = = 4.5
(𝐴 + 𝐷 ) (14 + 4)
4) Región crítica: La tabla C muestra valores críticos y probabilidades para
X21 de dos colas.
Observando la tabla, la probabilidad de X2 para 4.5 con un grado de
libertad, está entre 3.84 y 5.41 con probabilidades de 0.05 y 0.02.
Interpolando p = 0.033. Entonces: p(0.033)< α(0.05). Se rechaza Ho.
Los niños muestran una tendencia significativa a cambiar su objeto de
iniciación de adultos a niños después de 30 días de experiencia en la
guardería al 5% de significancia.
en código R
# ejemplo: iniciacion
fila1 <- c(4, 14)
fila2 <- c(4, 3)
tabla <- [Link](rbind(fila1, fila2))
dimnames(tabla) = list(despues = c("+","-"),
antes = c("+","-"))
tabla
## antes
## despues + -
## + 4 14
## - 4 3
Los valores que cambian son 14 (de - a + ) y 4 (de + a -)
# Test Mc nemar
[Link](tabla)
## McNemar's Chi-squared test with continuity correction
##
## data: tabla
## McNemar's chi-squared = 4.5, df = 1, p-value = 0.03389
𝑝(0.02289) < 𝛼(0.05), la prueba estadística es significativa, se rechaza Ho. Los
niños muestran una tendencia significativa a cambiar su objeto de iniciación de
adultos a niños después de 30 días de experiencia en la guardería al 5% de
significancia.
# Test binomial
# utilice los resultados de la tabla
# x son los cambios en la tabla
[Link](x = 14, n = 14 + 4, p = 0.5 )
## Exact binomial test
##
## data: 14 and 14 + 4
## number of successes = 14, number of trials = 18, p-value = 0.03088
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
## 0.5236272 0.9359080
## sample estimates:
## probability of success
## 0.7777778
𝑝(0.03088) < 𝛼(0.05), la prueba estadística es significativa, se rechaza Ho.
Los niños muestran una tendencia significativa a cambiar su objeto de
iniciación de adultos a niños después de 30 días de experiencia en la guardería
al 5% de significancia. la probabilidad de que ocurra el suceso es 77.77% (la
probabilidad no es igual a 0.5).
1.4 Ejercicios:
1) Un bioquímico decide testear dos técnicas de laboratorio para diagnosticar
cierta enfermedad. Los resultados se clasifican como positivo cuando se
la detecta y negativo cuando el paciente aparenta estar sano. Se quiere
descubrir si hay asociación entre el carácter positivo-negativo y el
procedimiento de diagnóstico. Para ello se escoge 100 pacientes al azar y
se les aplica ambas técnicas. Los resultados se presentan como:
Tabla 121. frecuencia de resultados
Técnica A
Técnica B + -
+ 38 14
- 32 16
2) En un estudio sobre el castigo de los hijos. A un grupo de 20 padres de
familia se les hace la pregunta si deben castigar o no a sus hijos. Después
de algunas semanas se realiza un curso sobre las relaciones entre padres e
hijos al grupo de 20 padres seleccionados inicialmente, y se les hace la
misma pregunta. ¿Se puede considerar como significativo el cambio de
respuesta en los padres de familia?
Tabla 123. respuestas sobre castigo a hijos
Padre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Antes si si no no si no si no si si si no si si si no si no si si
Después no si no si no no si no no no si no no si no no si no no no
2. La prueba de Walsh.
Esta prueba requiere mediciones por lo menos de escala de intervalo.
Se utiliza cuando se está en condiciones de suponer que los puntajes en diferencia
observados en dos muestras relacionadas se tomaron de una población simétrica.
Las di ni siquiera tienen que provenir de la misma población o de poblaciones
normales. La prueba supone poblaciones simétricas de manera que la media
representa exactamente la tendencia central, y es igual a la mediana.
La Ho supone que los valores de di fueron tomados de una población de mediana
cero (o de un grupo de poblaciones de mediana común de cero). En una
distribución simétrica la media y la mediana coinciden. Para una prueba de dos
colas, H1 supone que μ1 ≠ de cero. Para una prueba de una cola, H1 puede ser bien
μ1>0, o bien μ1<0.
4.1 Procedimiento
Paso 1. Establecer la hipótesis nula y alterna
Paso 2. Elegir el nivel de significancia
Paso 3. Prueba estadística.
a) Se determina el puntaje de diferencia con signo (di) para cada par.
b) Se determina n, el número de pares igualados.
c) Se colocan las di en tamaños cada vez mayores, de d1 a dn, teniendo
en cuenta el signo. Así d1 es el valor negativo mayor de d y dn es el
valor positivo mayor de d.
d) La tabla H muestra valores críticos (n, número de parejas).
Paso 4.
En dos colas: Se acepta H1 si se cumple que ambas diferencias se cumplen.
En cola Izquierda: Se acepta H1 si max < 0
En cola derecha: Se acepta H1 si Min > 0
4.2 Potencia eficiencia
Cuando se compara con la prueba más poderosa, la paramétrica t, esta prueba
tiene potencia eficiencia del 95% para la mayoría de los valores de n y α. Su
potencia eficiencia es del 99% (n = 9 y α=0.01 una cola) sin bajar de 87.5% (n
=10 y α=0.06) una cola. (Walsh 1949)
4.3 Ejercicios resueltos
Ejemplo. En un estudio para inducir represión, se hizo aprender a 13 sujetos
10 silabas sin sentido con el fin de que asociaran un efecto negativo a 5 de ellas
(seleccionadas al azar de las 10) aplicándoles una descarga eléctrica al exponer
taquistoscópicamente cualquiera de las 5 silabas. Después de un lapso de 48
horas, los sujetos volvieron al laboratorio y se les pidió que recordaran la lista
de silabas sin sentido. Se predijo que recordarían más las silabas no
acompañadas de descargas que las acompañadas por ellas.
Tabla 126. Numero de silabas con descarga y sin ello recordadas después de
48 horas.
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13
Nro de silabas recordadas sin descarga 5 4 3 5 2 4 2 2 4 4 3 1 5
Nro de silabas recordadas con descarga 2 2 0 3 3 2 3 1 1 3 4 2 2
Solución
1) Hipótesis estadística.
Ho: μ = 0, La mediana de las diferencias entre el número de silabas
recordadas con y sin descarga es cero.
H1: μ > 0. La mediana de las diferencias es diferente de cero.
2) α = 0.047
3) Estadístico de contraste.
Tabla 127. Numero de silabas con descarga y sin ello recordadas después de 48
horas.
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13
Nro de silabas recordadas sin 5 4 3 5 2 4 2 2 4 4 3 1 5
descarga
2 2 0 3 3 2 3 1 1 3 4 2 2
Nro de silabas recordadas con
descarga
di 3 2 3 2 -1 2 -1 1 3 1 –1 –1 3
d10 d7 d11 d8 d1 d9 d2 d5 d12 d6 d3 d4 d13
n = 13; d más pequeña es -1. Existen 4: d1, d2, d3 y d4 = -1, d5 y d6 = 1; d7,
d8 y d9 = 2 ; d10, d11,d12 y d13 = 3
4) Decisión: para n = 13 (n ≤15)
Para μ1 >0 en α=0.047
Min [1/2(d1+d10), 1/2(d2+d9)] > 0
Min [1/2(-1 + 3), 1/2(-1 + 2)]
Min [1/2(2), 1/2(1)] = Min [1, 0.5]
El mínimo 0.5 > 0, se rechaza Ho. O se acepta H1. Se recordó un número
mayor de silabas sin descarga en grado significativo.
4.4 Ejercicios
1) Se realiza un estudio para determinar los efectos de poner fin a un bloqueo
renal en pacientes cuya función renal está deteriorada a causa de una
metástasis maligna avanzada de causa no urológica. Se mide la tensión
arterial de cada paciente antes y después de la operación. Se obtienen los
siguientes resultados:
Tabla 128. valores de la tensión arterial
Tensión arterial
Antes 150 132 130 116 107 100 101 96 90 78
Después 90 102 80 82 90 94 84 93 89 85
¿Se puede concluir que la intervención quirúrgica tiende a disminuir la
tensión arterial?
2) A 11 ratas tratadas crónicamente con alcohol se les midió la presión
sanguínea sistólica antes y después de 30 minutos de administrarles a todas
ellas una cantidad fija de etanol, obteniéndose los datos siguientes:
Tabla 129. Presión sanguínea sistólica
Antes 126 120 124 122 130 129 114 116 119 112 118
Después 119 116 117 122 127 122 110 120 112 110 111
¿Hay un descenso significativo de la presión sanguínea sistólica tras la
ingestión de etanol?
3. Prueba de aleatoriedad para pares igualados (prueba de
permutaciones).
Las pruebas de aleatoriedad no solamente tienen valor práctico, sino también un
valor heurístico pues ayudan a exponer la naturaleza fundamental de una prueba
no paramétrica.
Con esta prueba se puede obtener la probabilidad exacta conforme Ho asociada con
la ocurrencia de los datos observados sin necesidad de suposiciones acerca de la
normalidad ni homogeneidad de la varianza de las di. Son las más poderosas
técnicas no paramétricas y se utiliza para pares relacionados y necesita de una
medición numérica precisa (los puntajes tengan significado numérico, escala de
intervalo y n pequeño).
5.1 Procedimiento.
Paso 1. Se especifica la hipótesis nula y alterna.
Paso 2. Nivel de significancia.
Paso 3. Prueba estadística.
a) Se asigna a n el número de pares igualados.
b) Si n ≤ 12, se usa la prueba de aleatoriedad:
- Observar di con sus signos.
- Determinar el número de resultados posibles conforme a Ho para
2n.
- Determinar el número de resultados posibles de la región de rechazo.
α(2n).
Se identifica los resultados posibles de la región de rechazo
seleccionando aquellos con mayores valores de di. Para la prueba de
una cola, los resultados de la región de rechazo están todos en una
dirección (positiva o negativa) para una prueba de dos colas, la mitad
de los resultados de la región de rechazo son los que tiene los mayores
valores positivos de di y la otra mitad, los de mayores valores
negativos de di. Si el resultado está en la región de rechazo se rechaza
Ho.
Cuando n está entre 12 y 15 use la prueba de Wilcoxon.
c) si n > 25 y si las di muestran poca variación, además se cumple:
d2 max / Σd2i ≤ 5/2n; donde d2max es el cuadrado de la mayor
diferencia observada, entonces se espera que la Σdi se distribuyan
normalmente con media cero y varianza 1. La aproximación sería
𝑚𝑒𝑑𝑖𝑎 = 𝜇 = 0
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝜎 = √∑ 𝑑𝑖2
∑ 𝑑𝑖 − 𝜇
𝑍= → 𝑛(0,1)
𝜎
5.2 Potencia -eficiencia
Tiene una potencia eficiencia del 100%. Porque usa toda la información.
5.3 Ejercicios resueltos
Ejemplo. Tomemos el ejemplo de percepción social:
Tabla 133. Puntaje de capacidad de percepción social de los niños en el
"jardín de niños" y en la "casa".
Pareja a b c d e f g h
Puntaje de capacidad de percepción
Social del gemelo asignado al jardín 82 69 73 43 58 56 76 65
Puntaje de capacidad de percepción
Social del gemelo que permaneció en casa 63 42 74 37 51 43 80 62
Solución
1) Hipótesis estadística
Ho: La capacidad de percepción social de los niños asistentes al Jardín y
los niños que se quedaron en casa no difieren. Los dos tratamientos
son equivalentes y no hay diferencia en la percepción social en ambas
condiciones
H1: Los dos tratamientos no son equivalentes.
2) Nivel de significancia: α = 0.05
3) Distribución muestral: aleatoriedad por tener valor de n no demasiado
grande, las medidas satisfacen medidas de intervalo.
Tabla 134. Cálculos para el puntaje de capacidad de percepción social de
los niños en el "jardín de niños" y en la "casa".
Pareja a b c d e f g h
Puntaje de capacidad de percepción
Social del gemelo asignado al jardín 82 69 73 43 58 56 76 65
Puntaje de capacidad de percepción
Social del gemelo que permaneció en 63 42 74 37 51 43 80 62
casa
di 19 27 –1 6 7 13 -4 3
n = 8 número de pares. Puesto que no se predice dirección una prueba de
dos colas seria la apropiada.
n = 8; 28= 256 resultados posibles
Las diferencias fueron:
+19 +27 -1 +6 +7 +13 -4 +3 La suma es: Σdi= 70
La región de rechazo consiste en los 12 resultados más extremos
(0.05)(256) = 12.8. Los 12 resultados dentro de la región de rechazo serían
los 6 que producen la mayor sumatoria de di positivos y los 6 que producen
la mayor di negativa.
Tabla 135. 6 resultados positivos posibles más extremos para los valores
de di
orden Resultados posibles extremos Σdi
1) +19 +27 +1 +6 +7 +13 +4 +3 80
2) +19 +27 -1 +6 +7 +13 +4 +3 78
3) +19 +27 +1 +6 +7 +13 +4 -3 74
4) +19 +27 +1 +6 +7 +13 -4 +3 72
5) +19 +27 -1 +6 +7 +13 +4 -3 72
6) +19 +27 -1 +6 +7 +13 -4 +3 70
*
* Continúa hasta 256 combinaciones.
La Σdi= 70 y está dentro de los resultados posibles, se rechaza Ho
4) Decisión:
α(2n) = 0.05(28) = 0.05(256) = 12.8, se toma el entero. Resultados
posibles
Σdi extremo = 12/256 = 0.047
p = 0.047 < α=0.05 se rechaza Ho.
5.4 Ejercicios
1) Se realiza un estudio para determinar los efectos de poner fin a un bloqueo
renal en pacientes cuya función renal está deteriorada a causa de una
metástasis maligna avanzada de causa no urológica. Se mide la tensión
arterial de cada paciente antes y después de la operación. Se obtienen los
siguientes resultados:
Tabla 138. valores de tensión arterial antes y después del experimento
Tensión arterial
Antes 150 132 130 116 107 100 101 96 90 78
Después 90 102 80 82 90 94 84 93 89 85
¿Se puede concluir que la intervención quirúrgica tiende a disminuir la
tensión arterial?
2) A 11 ratas tratadas crónicamente con alcohol se les midió la presión
sanguínea sistólica antes y después de 30 minutos de administrarles a todas
ellas una cantidad fija de etanol, obteniéndose los datos siguientes:
Tabla 139. Presión sanguínea sistólica
Antes 126 120 124 122 130 129 114 116 119 112 118
Después 119 116 117 122 127 122 110 120 112 110 111
¿Hay un descenso significativo de la presión sanguínea sistólica tras la
ingestión de etanol?