1. Prueba del rango con signo de Wilcoxon.
Se la denomina también Prueba de rangos señalados y pares encontrados.
Necesita variables de respuesta ordinal.
1.1 Procedimiento:
Paso 1. Especificar la hipótesis nula y alterna.
Paso 2. Determinar el nivel de significancia.
Paso 3. Estadístico de contraste.
a) Para cada par igualado, se determina la diferencia entre los dos
puntajes (di). Si existe diferencias iguales a cero, se descarta del
análisis.
b) Se ordenan las diferencias (di) sin considerar el signo, asignando rango
1 al más pequeño, 2 al siguiente, y así sucesivamente. Con las di
empatadas diferentes de cero se obtiene rango promedio. Como regla:
la tabla G no deberá de usarse si más de una cuarta parte de los
resultados incluyen empates. En este caso la aproximación a la normal
corregida por empates será la más adecuada.
c) Se añade a cada rango el signo (+ o -) de la di.
d) Se determina n, el número total de di con signo.
e) Obtenga la suma de rangos negativos (W-) y rangos positivos (W+).
f) El procedimiento de obtener W depende de n.
Muestra pequeña.
Si n ≤ 25, se usa la Wilcoxon. La tabla G (adapta para una y dos colas)
contiene valores críticos de la distribución nula de Wc para todos los
valores de hasta cincuenta.
Muestra grande. Aproximación normal de W.
Si n > 25, se calcula el valor de Z, y se usa la tabla A.
Paso 4. Región crítica:
W es la suma menos frecuente de W+ y W+
n ≤ 25: Si W < Wc (valor crítico), Se rechaza Ho
n > 25: Si 𝒑 ≤ 𝜶 se rechaza Ho (la tabla A muestra valores para una cola,
para dos colas duplicar p)
1.2 Aproximación normal de W+. Muestras grandes
La suma de los rangos está distribuida en forma normal, con:
𝑛(𝑛 + 1)
𝑀𝑒𝑑𝑖𝑎 = 𝜇𝑤 =
4
𝑛(𝑛 + 1)(2𝑛 + 1)
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝜎𝑤 = √
24
El valor puntual de Z está dado por: (incluyendo la corrección por continuidad)
𝑊 (∓ 0.5) − 𝜇𝑤
𝑍= → 𝑛(0,1)
𝜎𝑤
Se resta 0.5 si los valores de W son mayores que la media.
Se suma 0.5 si los valores de W son menores que la media.
1.3 Empates en los resultados de diferencia en muestras grandes
En este caso es necesario modificar ligeramente la aproximación normal. Los
empates tienen el efecto de reducir la varianza de los valores posibles que
puede tomar W, aun cuando la media sigue siendo la misma. Para modificar la
varianza se necesita conocer el número de resultados de diferencia diferentes
(ignorando los signos) junto con el número de resultados empatados.
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
𝑛(𝑛 + 1)(2𝑛 + 1) 1
𝜎𝑤 = √ − ∑ 𝑡𝑖 (𝑡𝑖 − 1)(𝑡𝑖 + 1)
24 48
Comentario. - Tener cuidado en algunas aplicaciones ya que la prueba del
rango con signo puede llevar a conclusiones falsas, puesto que se supone que
los resultados de diferencia son comparables. Por ejemplo: en pruebas de
habilidad, a una persona puede aplicársele dos veces una prueba IQ. Un cambio
de 70 a 76 puede indicar una mejoría mayor que un cambio de 100 a 105. Un
cambio empatado en la diferencia de 70 a 75 y de 100 a 105 asumirá el mismo
rango. Si consideraciones como estas son importantes, se deberá usar de
preferencia la prueba del signo.
1.4 Potencia-eficiencia
Cuando las suposiciones de la prueba paramétrica t se satisfacen, la eficiencia
asintótica de la prueba de rangos señalados comparada con la t es de 3/π =
95.5%. Entonces 3/π es la proporción límite de tamaño de muestras necesarias
para que la prueba de Wilcoxon y t alcancen el mismo poder. Para muestras
pequeñas, la eficiencia se acerca al 95%.
1.5 Ejercicios resueltos manualmente y en R
Ejemplo. En un estudio de 10 sujetos sobre los efectos psicológicos de la
sugestión hipnótica reportaron los siguientes resultados.
Tabla 83. Datos hipotéticos y resultados del potencial cutáneo en milivolts
Sujeto 1 2 3 4 5 6 7 8 9 10
Temor X 57.6 10.5 23.1 23.6 11.9 54.6 21.0 20.3 22.1 21.3
Felicidad Y 53.6 09.7 22.7 19.6 13.8 47.1 13.6 23.6 18.6 17.1
Solución
1) Hipótesis estadística
Ho: La diferencia entre los dos resultados de cada sujeto proviene de una
población que es simétrica respecto a una mediana de cero. Las dos
emociones no tienen diferentes efectos psicológicos.
H1: La diferencia entre los dos resultados de cada sujeto proviene de una
población que es asimétrica respecto a una mediana diferente de cero.
Las dos emociones tienen diferentes efectos psicológicos.
2) Nivel de significancia α = 0.05
3) Usemos la prueba de Wilcoxon para muestras pequeñas.
Tabla 84. Resultados del potencial cutáneo en milivolts
Sujeto 1 2 3 4 5 6 7 8 9 10
X temor 57.6 10.5 23.1 23.6 11.9 54.6 21.0 20.3 22.1 21.3
Y Felicidad 53.6 9.7 22.7 19.6 13.8 47.1 13.6 23.6 18.6 17.1
di = X - Y 4.0 0.8 0.4 4.0 -1.9 7.5 7.4 -3.3 3.5 4.2
Rango de |Xi-Yi| 6.5 2 1 6.5 3 10 9 4 5 8
Rango con signo. +6.5 +2 +1 +6.5 -3 +10 +9 -4 +5 +8
Entonces: 𝑊−= 3 + 4 = 7. (La menor suma de rangos) y W+= 48
n = 10 (casos que presentaron diferencias diferentes a cero)
4) Con n=10, α=0.5 y dos colas, la tabla G muestra un valor crítico de 8.
𝑊(7) < 𝑊𝑐 (8), Se rechaza Ho.
La diferencia entre los dos resultados de cada sujeto proviene de una
población que es asimétrica respecto a una mediana diferente de cero. Las
dos emociones tienen diferentes efectos psicológicos.
En código R
# Ejemplo Efectos Psicologicos
puntaje <- c(57.6, 10.5, 23.1, 23.6, 11.9, 54.6, 21.0, 20.3, 22.1, 21.3,
53.6, 09.7, 22.7, 19.6, 13.8, 47.1, 13.6, 23.6, 18.6, 17.1)
sujeto <- c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2)
datos <- data.frame(sujeto, puntaje)
head(datos)
# sujeto puntaje
## 1 1 57.6
## 2 1 10.5
## 3 1 23.1
## 4 1 23.6
## 5 1 11.9
## 6 1 54.6
temor = datos$puntaje[datos$sujeto==1]
felicidad = datos$puntaje[datos$sujeto==2]
datos <- data.frame(temor, felicidad)
datos
## temor felicidad
## 1 57.6 53.6
## 2 10.5 9.7
## 3 23.1 22.7
## 4 23.6 19.6
## 5 11.9 13.8
## 6 54.6 47.1
## 7 21.0 13.6
## 8 20.3 23.6
## 9 22.1 18.6
## 10 21.3 17.1
#analisis grafico de los datos
par(mfrow=c(1,1))
plot(temor,type="b",pch=19,col="blue",xlab ="datos" )
lines(felicidad,type="b",pch=18,col="red",lty=2)
legend(x="topright",legend=c("temor", "felicidad"),
col=c("blue", "red"),lty=1:2,cex=0.8)
Figura 33. diagrama de líneas para los puntajes de temor y felicidad
La figura no muestra diferencias tan marcadas en las diferencias de los
puntajes entre temor y felicidad. Los puntajes más altos se presentan en los
sujetos 1 y 6.
summary(datos)
## temor felicidad
## Min. :10.50 Min. : 9.70
## 1st Qu. :20.48 1st Qu. :14.62
## Median :21.70 Median :19.10
## Mean :26.60 Mean :23.94
## 3rd Qu. :23.48 3rd Qu. :23.38
## Max. :57.60 Max. :53.60
Los valores promedio (26.60 a 23.94) y mediana (21.70 a 19.10) son
mayores en los efectos psicológicos de la sugestión hipnótica que causan
temor, así mismo como en puntajes mínimos y máximos.
# utlicice los minimos y maximos para graficar
# Diagrama de dispersion para datos emparejados
plot(temor,jitter(felicidad), # jitter offsets points so you can see them all
pch = 16, # shape of points
cex = 1.0, # size of points
xlim=c(10, 60), # limits of x axis
ylim=c(9, 55), # limits of y axis
xlab="temor",
ylab="felicidad" )
abline(0,1, col="blue", lwd=2) # line with intercept of 0 and slope of 1
Figura 34. Diagrama de dispersión para datos emparejados
En la trama la mayor cantidad de puntos caen por debajo y a la izquierda
de la línea, indican que los puntajes de temor son mayores a los puntajes
de felicidad. Existen dos puntajes altos pero igual los puntajes de temor
son mayores a los de felicidad.
# grafico de barras para las diferencias
diferencias <- temor-felicidad
diferencias
## [1] 4.0 0.8 0.4 4.0 -1.9 7.5 7.4 -3.3 3.5 4.2
barplot(diferencias, col="dark gray", xlab="datos",
ylab="Diferencias (temor - felicidad)")
Figura 35. diagrama de barras para observar la diferencia entre temor y felicidad
Las barras con valores mayores que cero, indican que los casos donde los
puntajes de temor son mayores a los puntajes de felicidad.
# observando la simetria de la diferencia
# Bar plot of differences
Diff.f = factor(diferencias)
XT = xtabs(~ Diff.f)
barplot(XT, col="dark gray",xlab="Differencia en el puntaje",
ylab="Frequencia")
Figura 36. gráfico de barras para observar la simetría de las diferencias
La distribución de las diferencias no parece ser simétrica. es útil ver las
medianas de cada grupo para determinar la importancia practica de las
diferencias.
Los resultados siguientes muestran los cálculos previos del valor y
probabilidad de la prueba estadística.
Prueba estadistica
rbind(temor,felicidad, diferencias)
## [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
## temor 57.6 10.5 23.1 23.6 11.9 54.6 21.0 20.3 22.1 21.3
## felicidad 53.6 9.7 22.7 19.6 13.8 47.1 13.6 23.6 18.6 17.1
## diferencias 4.0 0.8 0.4 4.0 -1.9 7.5 7.4 -3.3 3.5 4.2
# La funcion rank() de R calcula las posiciones automaticamente,
# solucionando las ligaduras en caso de que las haya.
rangosdiferencias <- rank(abs(diferencias[diferencias != 0]))
rangosdiferencias
# [1] 6.5 2.0 1.0 6.5 3.0 10.0 9.0 4.0 5.0 8.0
tabla <- data.frame(temor,felicidad, signo = sign(diferencias),
diferencia = abs(diferencias), rangos = rangosdiferencias)
tabla
## temor felicidad signo diferencia rangos
## 1 57.6 53.6 1 4.0 6.5
## 2 10. 5 9.7 1 0.8 2.0
## 3 23.1 22.7 1 0.4 1.0
## 4 23.6 19.6 1 4.0 6.5
## 5 11.9 13.8 -1 1.9 3.0
## 6 54.6 47.1 1 7.5 10.0
## 7 21.0 13.6 1 7.4 9.0
## 8 20.3 23.6 -1 3.3 4.0
## 9 22.1 18.6 1 3.5 5.0
## 10 21.3 17.1 1 4.2 8.0
sumaPositivos <- sum(tabla[tabla$signo == 1,"rangos"])
sumaNegativos <- sum(tabla[ tabla$signo == -1,"rangos"] )
w <- min(c( sumaPositivos, sumaNegativos ))
w
## [1] 7
M <- max(c( sumaPositivos, sumaNegativos ))
M
## [1] 48
library(coin)
library(exactRankTests) # recomendado
# wilcox.exact
wilcox.exact(temor, felicidad, paired = T, alternative = "two.sided",
exact = T, conf.int = 0.95)
## Exact Wilcoxon signed rank test
## data: temor and felicidad
## V = 48, p-value = 0.03516
## alternative hypothesis: true mu is not equal to 0
## 95 percent confidence interval:
## 0.1 5.7
## sample estimates:
## (pseudo)median
## 2.45
Mediana de las diferencias Cola p-value Intervalos de confianza
2.45 Dos colas 0.03516 0.1 - 5.7
La mediana de las diferencias es 2.45, que es confrontada con un valor de
cero o la hipótesis planteada, 𝑝(0.03516) < 𝛼 (0.05). La prueba
estadística es significativa al 5%, se rechaza Ho, es decir, la mediana de las
diferencias es diferente de cero o los puntajes de las dos emociones tienen
diferentes efectos psicológicos.
La diferencia mediana de los puntajes se presenta en el intervalo [0.1,5.7]
También puede usar el siguiente script, pero tengo en cuenta que usa la
prueba Z.
library(MASS)
wilcox.test(temor, felicidad, alternative = "two.sided", mu = 0,
paired=TRUE, exact=T, conf.int=0.95)
## Warning in wilcox.test.default(temor, felicidad, alternative =
## "two.sided", : cannot compute exact p-value with ties
## Wilcoxon signed rank test with continuity correction
## data: temor and felicidad
## V = 48, p-value = 0.04136
## alternative hypothesis: true location shift is not equal to 0
## 95 percent confidence interval:
## 0.100020 5.700039
## sample estimates:
## (pseudo)median
## 2.500008
El valor que presenta la librería MASS es corregida por continuidad (en
nuestro caso por ser datos pequeños debe ser usada la librería coin)
Ejemplo. Con numerosos empates y muestras grandes.
En un estudio para investigar si las oraciones activas y pasivas se procesan de
una manera diferente, se pide a 25 personas que lean un pasaje que contiene
una proporción igual de oraciones activas y pasivas y que recuerden después
el pasaje. El número de oraciones activas y pasivas que recordó correctamente
cada sujeto se muestra a continuación.
Tabla 89. Resultados de datos hipotéticos
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Activas 9 7 9 8 7 8 10 10 12 6 7 9 8 6 10 11 7 5 7 7 8 9 8 8 10
Pasivas 10 4 3 2 8 1 9 5 7 3 7 6 5 4 9 9 5 1 4 4 4 11 12 3 4
Solución
1) Hipótesis estadística.
Ho: Los resultados de diferencia provienen de una población que es
simétrica respecto a cero. No existe diferencia confiable entre el
recuerdo de las oraciones activas y pasivas de este pasaje.
H1: Los resultados de diferencia provienen de una población que es
asimétrica respecto a cero. Existe diferencia confiable entre el
recuerdo de las oraciones activas y pasivas de este pasaje.
2) Nivel de significancia: α = 0.05
3) Se decide usar una prueba de dos colas.
En los resultados podemos observar gran proporción de diferencias
empatadas, de manera que deberá usarse la aproximación normal
corregida para empates. Existe un resultado de diferencia cero, esta se
omite y la prueba se realiza con los 24 restantes, con n = 24 es probable
que la aproximación normal sea bastante precisa. En el ejemplo se puede
usar W-, ya que existen pocos resultados con valor negativo.
Tabla 90. Cálculos para la prueba.
Sujeto Activas Pasivas di =X-Y Rango Rango con signo
(X) (Y)
1 9 10 -1 2.5 -2.5
2 7 4 3 11.5 11.5
3 9 3 6 22 22
4 8 2 6 22 22
5 7 8 -1 2.5 -2.5
6 8 1 7 24 24
7 10 9 1 2.5 2.5
8 10 5 5 19 19
9 12 7 5 19 19
10 6 3 3 11.5 11.5
11 7 7 0 x x elimina
12 9 6 3 11.5 11.5
13 8 5 3 11.5 11.5
14 6 4 2 6.5 6.5
15 10 9 1 2.5 2.5
16 11 9 2 6.5 6.5
17 7 5 2 6.5 6.5
18 5 1 4 16 16
19 7 4 3 11.5 11.5
20 7 4 3 11.5 11.5
21 8 4 4 16 16
22 9 11 -2 6.5 -6.5
23 8 12 -4 16 -16
24 8 3 5 19 19
25 10 4 6 22 22
W- = 2.5 + 2.5 + 6.5 + 16 = 27.5
No se toma en cuenta los empates, n =24
𝑛(𝑛 + 1) 24(25)
𝑀𝑒𝑑𝑖𝑎 = 𝜇𝑤 = = = 150
4 4
Tabla 91. Valores empatados.
Valor de di empatada 1 2 3 4 5 6
Número de veces de resultados 4 4 6 3 3 3
empatados en ese valor, ti
𝑡𝑖 (𝑡𝑖 − 1)(𝑡𝑖 + 1) 60 60 210 24 24 24
𝑡1 (𝑡1 − 1)(𝑡1 + 1) = 4𝑥3𝑥5 = 60
𝑡2 (𝑡2 − 1)(𝑡2 + 1) = 4𝑥3𝑥5 = 60
𝑡3 (𝑡3 − 1)(𝑡3 + 1) = 6𝑥5𝑥7 = 210
𝑡4 (𝑡4 − 1)(𝑡4 + 1) = 3𝑥2𝑥4 = 24
𝑡5 (𝑡5 − 1)(𝑡5 + 1) = 3𝑥2𝑥4 = 24
𝑡6 (𝑡6 − 1)(𝑡6 + 1) = 3𝑥2𝑥4 = 24
∑ 𝑡𝑖 (𝑡𝑖 − 1)(𝑡𝑖 + 1) = 402
𝑛(𝑛 + 1)(2𝑛 + 1) 1
𝜎𝑤 = √ − ∑ 𝑡𝑖 (𝑡𝑖 − 1)(𝑡𝑖 + 1)
24 48
24(25)((2 ∗ 24) + 1)) 1
=√ − (402) = 34.88
24 48
Como W-(27.5) < µw(150) entonces se suma 0.5
𝑊 (∓ 0.5) − 𝜇𝑤 (27.5 + 0.5) − 150
𝑍= = = −3.4977
𝜎𝑤 34.88
4) Decisión:
Usando valor puntual: Zt = Z0.05/2 = Z0.025 = ±1.96
Los limites son -1.96 y 1.96; 𝑍 = −3.4977, cae fuera de la región critica,
se rechaza Ho
Usando probabilidades: Valor crítico de la tabla A, 𝑝(3.4977) =
0.0002346: Para dos colas: 2(0.0002346) = 0.00046929
Entonces: 𝑝(0.000469) < 𝛼 (0.05). Se rechaza Ho.
Los resultados de diferencia provienen de una población que es asimétrica
respecto a cero. Existe una diferencia confiable entre el recuerdo de las
oraciones activas y pasivas de este pasaje con un nivel 0.05. Los datos
sugieren que las oraciones activas son más fáciles de recordar que las
oraciones pasivas.
Código en R. Muestra grande
# Muestra grande
# Ejemplo oraciones activas y pasivas
numero <- c(9,7,9,8,7,8,10,10,12,6,7,9,8,6,10,11,7,5,7,7,8,9,8,8,10,
10,4,3,2,8,1,9,5,7,3,7,6,5,4,9,9,5,1,4,4,4,11,12,3,4)
sujeto <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,
2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2)
datos <- data.frame(sujeto, numero)
head(datos)
## sujeto numero
## 1 1 9
## 2 1 7
## 3 1 9
## 4 1 8
## 5 1 7
## 6 1 8
activas = datos$numero[datos$sujeto==1]
pasivas= datos$numero[datos$sujeto==2]
datos <- data.frame(activas, pasivas)
head(datos)
# activas pasivas
## 1 9 10
## 2 7 4
## 3 9 3
## 4 8 2
## 5 7 8
## 6 8 1
#analisis grafico de los datos
par(mfrow=c(1,1))
plot(pasivas,type="b",pch=19,col="red",xlab ="datos" )
lines(activas,type="b",pch=18,col="blue",lty=2)
legend(x="topright",legend=c("activas", "pasivas"),
col=c("blue", "red"),lty=1:2,cex=0.8)
Figura 45. diagrama de líneas
Se han obtenido mayores puntajes con las oraciones activas.
summary(datos)
## activas pasivas
## Min. : 5.00 Min. : 1.0
## 1st Qu. : 7.00 1st Qu. : 4.0
## Median : 8.00 Median : 5.0
## Mean : 8.24 Mean : 5.6
## 3rd Qu. : 9.00 3rd Qu. : 8.0
## Max. :12.00 Max. :12.0
En promedio, los sujetos recuerdan con mayor frecuencia las oraciones activas
# utlicice los minimos y maximos para graficar
# Diagrama de dispersión para datos emparejados
plot(activas,jitter(pasivas), # jitter offsets points so you can see them all
pch = 16, # shape of points
cex = 1.0, # size of points
xlim=c(5, 12), # limits of x axis
ylim=c(1, 12), # limits of y axis
xlab="activas",
ylab="pasivas"
)
abline(0,1, col="blue", lwd=2) # line with intercept of 0 and slope of 1
Figura 46. Diagrama de dispersión para datos emparejados
En la trama la mayor cantidad de puntos caen por debajo de la línea, indican que
los sujetos recuerdan más oraciones activas que pasivas.
# grafico de barras para las diferencias
diferencias <- activas-pasivas
diferencias
## [1] -1 3 6 6 -1 7 1 5 5 3 0 3 3 2 1 2 2 4 3 3 4 -2 -4 5 6
Figura 47. diagrama de barras para observar la diferencia entre los gemelos
Las barras con valores mayores a cero, indican los casos donde los puntajes de
oraciones activas son mayores a las oraciones pasivas.
# observando la simetria de la diferencia
# Bar plot of differences
Diff.f = factor(diferencias)
XT = xtabs(~ Diff.f)
barplot(XT, col="dark gray",xlab="Diferencia en el numero recordado",
ylab="Frecuencia")
Figura 48. gráfico de barras para observar la simetría de las diferencias
La distribución de las diferencias parece ser asimétrica.
# Prueba estadistica
diferencias <- c(activas-pasivas)
# La función rank() de R calcula las posiciones automáticamente,
# solucionando las ligaduras en caso de que las haya.
rangosdiferencias <- rank(abs(diferencias[diferencias != 0]))
rangosdiferencias
## [1] 2.5 11.5 22.0 22.0 2.5 24.0 2.5 19.0 19.0 11.5 11.5 11.5 6.5 2.5
## [15] 6.5 6.5 16.0 11.5 11.5 16.0 6.5 16.0 19.0 22.0
#eliminando empates (diferencias cero)
rangosdiferencias1 <- c(rangosdiferencias[1:10],0,rangosdiferencias[11:24])
rangosdiferencias1
## [1] 2.5 11.5 22.0 22.0 2.5 24.0 2.5 19.0 19.0 11.5 0.0 11.5 11.5 6.5
## [15] 2.5 6.5 6.5 16.0 11.5 11.5 16.0 6.5 16.0 19.0 22.0
tabla <- data.frame(activas,pasivas, signo = sign(diferencias),
diferencia = abs(diferencias), rangos = rangosdiferencias1)
tabla
# activas pasivas signo diferencia rangos
## 1 9 10 -1 1 2.5
## 2 7 4 1 3 11.5
## 3 9 3 1 6 22.0
## 4 8 2 1 6 22.0
## 5 7 8 -1 1 2.5
## 6 8 1 1 7 24.0
## 7 10 9 1 1 2.5
## 8 10 5 1 5 19.0
## 9 12 7 1 5 19.0
## 10 6 3 1 3 11.5
## 11 7 7 0 0 0.0
## 12 9 6 1 3 11.5
## 13 8 5 1 3 11.5
## 14 6 4 1 2 6.5
## 15 10 9 1 1 2.5
## 16 11 9 1 2 6.5
## 17 7 5 1 2 6.5
## 18 5 1 1 4 16.0
## 19 7 4 1 3 11.5
## 20 7 4 1 3 11.5
## 21 8 4 1 4 16.0
## 22 9 11 -1 2 6.5
## 23 8 12 -1 4 16.0
## 24 8 3 1 5 19.0
## 25 10 4 1 6 22.0
sumaPositivos <- sum(tabla[tabla$signo == 1,"rangos"])
sumaNegativos <- sum(tabla[ tabla$signo == -1,"rangos"] )
W <- min(c(sumaPositivos, sumaNegativos ))
W
## [1] 27.5
M <- max(c(sumaPositivos, sumaNegativos ))
M
## [1] 272.5
library(MASS) # recomendado
wilcox.test(activas,pasivas, alternative = "two.sided", mu = 0,
paired=TRUE, exact=T, conf.int=0.95)
# Wilcoxon signed rank test with continuity correction
##
## data: activas and pasivas
## V = 272.5, p-value = 0.0004693
## alternative hypothesis: true location shift is not equal to 0
## 95 percent confidence interval:
## 1.999966 4.000018
## sample estimates:
## (pseudo)median
## 2.999966
Mediana de las diferencias Cola p-value Intervalos de
confianza
2.999966 Dos colas 0.0004693 1.9999 - 4.0000
La mediana de las diferencias es 2.9999, que es confrontada con un valor
diferente a cero o la hipotesis planteada, 𝑝(0.0004693) < 𝛼(0.05). Se rechaza
Ho, es decir la mediana de las diferencias es menor de cero. Los resultados de
diferencia provienen de una población que es asimétrica respecto a cero. Existe
una diferencia confiable entre el recuerdo de las oraciones activas y pasivas de
este pasaje con un nivel 0.05. Los datos sugieren que las oraciones activas son
más fáciles de recordar que las oraciones pasivas.
La mediana de la diferencia estará entre 1.99 y 5.
1.6 Ejercicios propuestos
1) Los datos corresponden a dos lecturas de colesterol total (antes y después
de una comida) medidas a 8 pacientes varones de 45 a 55 años de edad.
¿hubo un incremento significativo en los niveles de colesterol después de
la comida?
Tabla 93. lecturas de colesterol total de 8 pacientes antes y después
paciente 1 2 3 4 5 6 7 8
Ayuno 180 210 195 220 210 190 225 215
Después 185 225 215 245 200 220 235 250
2) Un grupo de 20 personas "pasaditas" de peso se somete a un régimen
dietético durante 6 semanas. Los pesos de antes y después del régimen se
presentan a continuación.
Tabla 94. puntajes del régimen dietético antes y después del experimento
Peso (lb) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Antes 202 189 149 186 149 200 220 190 164 161 162 171 192 163 187 178 218 181 140 168
Después 204 177 154 169 140 200 214 189 167 150 155 172 183 158 184 192 210 166 143 164
Determine si el régimen dietético a que se sometieron estas personas fue
efectivo. Use 2.5% de significancia.
3) Una cadena de tiendas decide cambiar la presentación de ciertos
productos, especialmente su empaque, con el objeto de incrementar sus
ventas. Después de 3 meses obtenemos los resultados promedio de las
ventas (ya con nueva presentación) y los comparamos con las ventas
promedio tardías de los productos antes de cambiar la presentación, los
resultados fueron:
Tabla 95. promedio de ventas antes y después del experimento
Articulo 1 2 3 4 5 6 7 8 9 10 11 12
Prom Antes 130 110 92 87 67 112 76 90 63 117 210 250
ventas
Después 135 115 96 90 69 112 72 93 63 119 220 247
Determine si el cambio en la presentación de los productos influyó en el
volumen promedio de ventas. Use 5% de significancia.
4) Con los datos del problema anterior pruebe que la nueva presentación del
producto ayudo a incrementar el volumen promedio de ventas. Use 1% de
error
2. La prueba del signo
Esta prueba se basa en los signos (en lugar de cantidades) de las diferencias
observadas entre valores apareados. La independencia se resguarda si la unidad de
muestreo es el resultado de comparar a las parejas entre sí, en lugar de usar las
observaciones individuales. Cada pareja de datos debe ser independiente de las
otras, y la forma de lograrlo es seleccionando al azar al elegir los componentes de
las muestras. Una ventaja es que puede usarse cuando las observaciones pareadas
están simplemente ordenadas por rangos. No es necesaria la homogeneidad de las
varianzas, la forma de la distribución ni que las muestras sean extraídas de la
misma población. Su desventaja es que elimina mucha información pues la reduce
a una dicotomía. Otras ventajas son: la facilidad de aplicación, la reducción de
tiempo y costo para el investigador. Los supuestos básicos para aplicar este modelo
son:
- La variable subyacente en las determinaciones es continua;
- Los pares de muestras son independientes;
- La hipótesis nula es: los signos se distribuyen al azar alrededor de la
mediana.
2.1 Procedimiento I.
Paso 1. Especificar la hipótesis nula y alterna.
Paso 2. Determinar el nivel de significancia.
Paso 3. Estadístico de contraste.
a) Se determina el signo de la diferencia entre las parejas.
sí A>B se asigna el signo positivo “+"
sí A<B se asigna el signo negativo “-"
sí A=B se elimina la pareja correspondiente.
b) Se determina el valor de n, número de parejas, cuyas diferencias
exhiben un signo. n+: cantidad de signos positivos y n-: cantidad de
signos negativos. n = n(+) + n(-).
c) N = total de signos "+" + total de signos menos "-".
d) Denote con la letra r, el número de veces que se presenta el signo
menos frecuente.
e) Comparar r con los valores críticos (rc) tabulados de la tabla W.
Paso 4. Si r ≥ rc se rechaza Ho.
2.2 Procedimiento II.
Paso 1. Especificar la hipótesis nula y alterna.
Paso 2. Determinar el nivel de significancia.
Paso 3. Estadístico de contraste.
a) Se determina el signo de la diferencia entre las parejas.
Si A>B se asigna el signo positivo “+"
Si A<B se asigna el signo negativo “-"
Si A=B se elimina la pareja correspondiente.
b) Se determina el valor de n, n = total de signos "+" + total de signos
menos "-".
c) La probabilidad asociada de un valor tan extremo como el valor
observado de X depende del tamaño de n:
Muestra pequeña
Si n ≤ 25, se usa la prueba Binomial.
𝑛
𝑝 = ( ) 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
Muestra grande
Si n > 25, se calcula el valor de Z. La tabla A muestra las
probabilidades de una cola asociadas. Para una prueba de dos colas se
duplica el valor de p resultante de la tabla A.
Paso 4. En ambos casos, Si p ≤ α se rechaza Ho.
2.3 Muestras grandes.
Si n > 25 se usa la aproximación normal a la binomial para determinar Z, con
la debida corrección por continuidad. Como la Ho supone una igualdad entre
la cantidad de positivos y negativos, se toma p=q=0.5.
1
𝑀𝑒𝑑𝑖𝑎 = 𝜇 = 𝑛𝑝 = 𝑛
2
1
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝜎 = √𝑛𝑝𝑞 = √𝑛
2
1
𝑋 − 𝜇 𝑋 − 2𝑛
𝑍= = → 𝑛(0,1)
𝜎 1
𝑛
2√
Corrección por continuidad
1
(𝑋 ∓ 0.5) − 𝑛
𝑍= 2 → 𝑛(0,1)
1
𝑛
2√
Si X < ½n se suma (X + 0.5)
Si X > ½n se resta (X - 0.5)
2.4 Potencia- eficiencia
La potencia-eficiencia de la prueba está cerca del 95% para n=6, pero declina
a medida que el tamaño de muestra se incrementa hasta una eficiencia final
(asintótica) del 63%.
2.5 Ejercicios resueltos manualmente y en R
Ejercicios con el procedimiento II. Muestras pequeñas
Ejemplo. En un estudio para observar los efectos de la ausencia del padre sobre
el desarrollo de los hijos, se seleccionaron 17 matrimonios que habían sido
separados por la guerra y cuyo primer hijo nació durante la ausencia del padre.
Cada uno de los cónyuges fueron entrevistados individualmente y se les pidió
que examinaran diversos temas concernientes al hijo que había pasado su
primer año sin padre, como las relaciones disciplinarias de padre a hijo durante
los años que siguieron a su regreso. Las entrevistas fueron grabadas y
analizadas por un Psicólogo que conocía a las familias en cuanto al grado de
conocimiento exhibido por cada padre. La predicción suponía que la madre,
debido a una unión más prolongada y cercana con el niño y a una diversidad
de circunstancias, típicamente asociadas con la separación del padre a causa
de la guerra, tendría mayor conocimiento de las relaciones disciplinarias que
su esposo.
Tabla 101. Conocimiento de la disciplina paternal de los padres separados
por la guerra.
Pareja Padre Madre
Sr y Sra. Arnold 5 2
Sr y Sra Brown 5 3
Sr y Sra Burgan 5 3
Sr y Sra Ford 5 3
Sr y Sra Harlow 3 3
Sr y Sra Holman 2 3
Sr y Sra Irvin 5 3
Sr y Sra Marston 3 3
Sr y Sra Mathews 1 2
Sr y Sra Moore 5 3
Sr y Sra Osborne 5 2
Sr y Sra Snyder 5 2
Sr y Sra Soule 4 5
Sr y Sra Statler 5 2
Sr y Sra Wagner 5 5
Sr y Sra Wolf 5 3
Sr y Sra Wicoff 5 1
Una estimación de 1 representa gran conocimiento; una estimación de 5
representa poco o ningún conocimiento.
Solución
1) Hipótesis estadística
Ho: La mediana de las diferencias es cero; Las esposas separadas por la
guerra mostraron igual conocimiento acerca de las relaciones
disciplinarias de sus esposos con los hijos que habían nacido durante
la guerra.
H1: La mediana de las diferencias es positiva. Las esposas separadas por
la guerra mostraron mayor conocimiento acerca de las relaciones
disciplinarias de sus esposos con los hijos que habían nacido durante
la guerra.
2) Nivel de significancia: α = 0.05
3) La escala fue parcialmente ordenada, la diferencia de cada pareja se
expresa por un signo.
n: número de matrimonios separados por la guerra = 17 y como es pequeña
P=Q=0.5 (se espera que el número de signos – sea igual al de signos + se
usa la prueba Binomial.
Tabla 102. Cálculos para el Conocimiento de la disciplina paternal.
Pareja Conocimiento de la Dirección
disciplina paternal de la
Padre Madre diferencia Signo
Sr y Sra Arnold 5 2 > +
Sr y Sra Brown 5 3 > +
Sr y Sra Burgan 5 3 > +
Sr y Sra Ford 5 3 > +
Sr y Sra Harlow 3 3 = 0
Sr y Sra Holman 2 3 < -
Sr y Sra Irvin 5 3 > +
Sr y Sra Marston 3 3 = 0
Sr y Sra Mathews 1 2 < -
Sr y Sra Moore 5 3 > +
Sr y Sra Osborne 5 2 > +
Sr y Sra Snyder 5 2 > +
Sr y Sra Soule 4 5 < -
Sr y Sra Statler 5 2 > +
Sr y Sra Wagner 5 5 = 0
Sr y Sra Wolf 5 3 > +
Sr y Sra Wicoff 5 1 > +
Se elimina los empates
Según la tabla: número menor de signos = 3 (negativos)
n = número de pares igualados que mostraron diferencias: n = 14
La tabla D muestra para n = 14 y X ≤ 3, p=0.029 para una cola. Entonces
como p(0.029) < α(0.05), se rechaza Ho, aceptando H1.
En conclusión. Las esposas separadas por la guerra mostraron mayor
conocimiento que sus esposos acerca de las relaciones disciplinarias de los
hijos que habían nacido durante la guerra.
En código R
conocimiento <-
c(5,5,5,5,3,2,5,3,1,5,5,5,4,5,5,5,5,2,3,3,3,3,3,3,3,2,3,2,2,5,2,5,3,1)
tutor <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2)
Data <-data.frame(tutor,conocimiento)
# Check the data frame
library(psych)
headTail(Data)
## tutor conocimiento
## 1 1 5
## 2 1 5
## 3 1 5
## 4 1 5
## ... ... ...
## 31 2 2
## 32 2 5
## 33 2 3
## 34 2 1
str(Data)
## 'data.frame': 34 obs. of 2 variables:
## $ tutor : num 1 1 1 1 1 1 1 1 1 1 ...
## $ conocimiento: num 5 5 5 5 3 2 5 3 1 5 ...
Las variables tutor y conocimiento están como cuantitativas (num)
Es útil observar las medianas de cada grupo para determinar la importancia
practica de las diferencias
Summarize(conocimiento ~ tutor,
data = Data)
## tutor n mean sd min Q1 median Q3 max
## 1 1 17 4.294118 1.263166 1 4 5 5 5
## 2 2 17 2.823529 1.014599 1 2 3 3 5
La mediana del tutor 1 (median=5) es mayor que la mediana del tutor 2 (median
=3), así como las medias aritméticas (4.29 a 2.8).
# Diagrama de dispersión para datos emparejados
madre = Data$conocimiento[Data$tutor==1]
padre = Data$conocimiento[Data$tutor==2]
plot(madre, jitter(padre), # jitter offsets points so you can see them all
pch = 16, # shape of points
cex = 1.0, # size of points
xlim=c(1, 6), # limits of x axis
ylim=c(1, 6), # limits of y axis
xlab="madre",
ylab="padre"
)
abline(0,1, col="blue", lwd=2) # line with intercept of 0 and slope of 1
Figura 49. diagrama de dispersión
En la Trama, la mayor cantidad de puntos caen abajo y a la derecha de la línea
azul, indican los casos para los cuales el conocimiento de las madres es mayor que
el conocimiento de los padres.
# Bar plot of differences
Difference = madre - padre
barplot(Difference, # variable to plot
col="dark gray", # color of bars
xlab="Observation", # x-axis label
ylab="Difference (madre - padre)") # y-axis label
Figura 50. diagrama de barras para las diferencias.
Las barras con valores mayores que cero indican los casos donde el conocimiento
de la madre es mayor que la del padre
Se puede utilizar una gráfica de barras de diferencias emparejadas para ver si las
diferencias en las observaciones son simétricas.
# Bar plot of differences
Difference = madre - padre
Diff.f = factor(Difference)
XT = xtabs(~ Diff.f)
barplot(XT,
col="dark gray",
xlab="Differencia en el grado de conocimiento",
ylab="Frequencia")
Figura 51. diagrama de barras
La distribución parece ser simétrica, aunque vemos mayores valores a la izquierda
de la figura.
Prueba estadística
# Two-sample paired signed-rank test
library(BSDA)
SIGN.test(x = madre,y = padre,alternative = "greater", conf.level = 0.95)
## Dependent-samples Sign-Test
## data: madre and padre
## S = 11, p-value = 0.02869
## alternative hypothesis: true median difference is greater than 0
## 95 percent confidence interval:
## 0 Inf
## sample estimates:
## median of x-y
## 2
##
## Achieved and Interpolated Confidence Intervals:
##
## Conf.Level L.E.pt U.E.pt
## Lower Achieved CI 0.9283 0 Inf
## Interpolated CI 0.9500 0 Inf
## Upper Achieved CI 0.9755 0 Inf
resumen
Mediana de la diferencia Estadístico Cola P value Intervalo
2 11 derecha 0.02869 0 - inf
La mediana de las diferencias es 2, que es confrontada con un valor mayor a cero
o la hipotesis planteada, 𝑝(0.02869) < 𝛼(0.05). Se rechaza Ho, es decir la
mediana de las diferencias es mayor de cero. La prueba es significativa al 5%. Las
esposas separadas por la guerra mostraron mayor conocimiento que sus esposos
acerca de las relaciones disciplinarias de sus hijos que habían nacido durante la
guerra.
La mediana de la diferencia estará entre 0 e inf.
con datos como vectores
####### con datos como vectores
madre <- c(5,5,5,5,3,2,5,3,1,5,5,5,4,5,5,5,5)
padre <- c(2,3,3,3,3,3,3,3,2,3,2,2,5,2,5,3,1)
library(BSDA)
SIGN.test(madre,padre,alternative = "greater",conf.level = 0.95)
mismo resultado
## Dependent-samples Sign-Test
## data: madre and padre
## S = 11, p-value = 0.02869
## alternative hypothesis: true median difference is greater than 0
## 95 percent confidence interval:
## 0 Inf
## sample estimates:
## median of x-y
## 2
##
## Achieved and Interpolated Confidence Intervals:
##
## Conf.Level L.E.pt U.E.pt
## Lower Achieved CI 0.9283 0 Inf
## Interpolated CI 0.9500 0 Inf
## Upper Achieved CI 0.9755 0 Inf
Tamaño del efecto:
El tamaño del efecto varía entre -1 y 1. el uso es análogo a la r usada en la prueba
de Mann-Whitney y puede tener sentido
Bajo medio alto
r 0.10 ≤ 0.40 0.40 ≤ 0.60 ≥ 0.60
library(rcompanion)
wilcoxonPairedR(x = Data$conocimiento,
g = Data$tutor)
## r
## 0.679
El tamaño del efecto de la prueba estadística es alto
2.6 Ejercicios propuestos.
1) Para evaluar los dibujos presentados en un concurso infantil, se pide a los
concursantes que realicen dos dibujos. Se seleccionan al azar 17
profesores de dibujo para que evalúen los dibujos. A continuación, se
presentan los resultados en forma de rango, El rango 2 significa
preferencia.
Tabla 109. preferencia por los dibujos
Miembros del jurado
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Dibujo 1 2 2 1 2 2 1 2 2 1 2 1 1 2 1 2 2 2
Dibujo 2 1 1 2 1 2 2 1 1 2 1 2 2 1 2 1 1 1
Probar la significación de la diferencia, con un nivel del 1%.
2) Se hizo un experimento con estudiantes seleccionados al azar, para ver si
un entrenamiento previo, basado en la solución de rompecabezas,
contribuye para tener mejor rendimiento en el aprendizaje de la teoría de
conjuntos. Se aplicaron dos pruebas, antes y después del entrenamiento.
Tabla 110. puntajes del examen de teoría de conjuntos antes y después del
experimento.
Estudiante
Puntuación 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
20 21 22 23 24 25
Antes 40 60 70 80 38 68 65 75 52 71 83 40 60 70 80 38 68 65 75
52 71 83 79 39 49
Después 42 65 65 82 35 62 70 75 55 69 85 42 65 65 82 35 62 70 75
55 69 85 78 40 50
Determine si el entrenamiento previo ayuda a mejorar el aprendizaje de la
teoría de conjuntos.
3) Se desea comparar dos procedimientos de auditoría con 10 pares de
auditores. El número de cuentas auditadas por hora aparece en la siguiente
tabla:
Tabla 111. número de cuentas auditadas
Par de auditores
1 2 3 4 5 6 7 8 9 10
Procedimiento 1 109 100 77 69 59 69 87 88 88 91
Procedimiento 2 61 78 57 64 60 75 85 84 85 83
Pruebe si los dos procedimientos de auditoría son diferentes al 5% de error