Escuela de Posgrado
Maestría en Estadística Aplicada
Métodos Estadísticos
Mg Sc Jaime Carlos Porras Cerrón
David Cox
(1924-?)
1
Capítulo IV: Pruebas No Paramétricas
Pruebas de Hipótesis (Parte II)
1. Introducción
2. Prueba de hipótesis para una muestra relacionada
a. Prueba de Mc Nemar
b. Prueba de Signos
c. Prueba de Wilcoxon
3. Prueba de hipótesis para dos muestras independientes
a. Prueba de Wald Wolfowitz
b. Prueba de Kolmogorov-Smirnov
c. Prueba de Mann Whitney
d. Prueba de Mood
Las pruebas estadísticas de una sola muestra que
implican dos medidas o pares replicados (muestra
pareada o relacionda), se utiliza cuando el
investigador desea establecer si hay diferencia entre
dos tratamientos o si hubo un cambio en las
mediciones en situaciones temporales diferentes.
En el caso paramétrico se puede hacer uso de la
prueba t, sin embargo las pruebas no paramétricas
para muestras pareadas se pueden utilizar cuando:
No se cumplen los supuestos que exige la prueba
t.
Las diferencias entre los pares no se presentan
como una medida, sino mas bien como signos.
2
Por otro lado, en el caso de las pruebas estadísticas
para dos muestras independientes, estas se pueden
utilizar para comparar si provienen de dos
poblaciones distintas, presentan diferente medida
de posición o dispersión.
En las pruebas no paramétricas existen varias
alternativas dependiendo del objetivo del estudio.
Recordemos que en el caso paramétrico para
analizar la posición se puede hacer uso de la prueba
t, mientras que para la dispersión se puede hacer
uso de la prueba F. Sin embargo, estas pruebas
requieren el cumplimiento de la normalidad de
ambas muestras.
Aspectos Generales:
Esta prueba es adecuada para evaluar las variaciones en
una variable dicotómica antes y después de una
determinada circunstancia. Por ejemplo, si tenemos un
grupo de pacientes, algunos de ellos con un cierto grado
de dolor, podemos evaluar al principio dos posibles
respuestas, sí o no, después de aplicar un tratamiento se
puede estudiar si las diferencias observadas son
significativas.
Supuestos:
La muestra es seleccionada al azar.
Los datos están compuestos por n pares de sujetos
los cuales para análisis se puede representar en una
tabla de contingencia 2x2.
3
Procedimiento:
Los n datos se pueden presentar en una tabla 2x2 en la
siguiente forma:
Los casos que muestran cambios entre la primera y segunda
respuesta aparecen en las celdas B y C. Un individuo es
clasificado en la celda B si cambió de + a - . Es clasificado en
la celda C si cambió de – a +. Si no es observado ningún
cambio, va a la celda A (respuestas de + antes y después) o a
la celda D (respuestas de – antes y después).
Hipótesis:
H0: Los cambios observados en la muestra se deben al azar
H1: Los cambios observados en la muestra no se deben al azar
Prueba Estadística:
Muestra pequeña
r
B C B C n ( B C )
pvalor 2 0.5 0.5 r min( B, C )
i 0 i
Muestra grande
B C 1
2
pvalor P 21 cal
2
2 ~ 21 Pvalor= 1 – pchisq(Chical,1)
R: BC
En R se utiliza la función [Link].
4
Ejemplo
En un estudio de la depresión se tomaron los datos antes y
después del año de seguimiento con el fin de determinar si la
frecuencia de depresión ha variado. Los resultados del
estudio son: ANTES DESPUÉS ANTES DESPUÉS
depresión depresión no depresión depresión
depresión depresión no depresión depresión
depresión depresión no depresión depresión
depresión depresión no depresión depresión
no depresión depresión no depresión depresión
no depresión depresión depresión no depresión
depresión depresión depresión no depresión
no depresión depresión no depresión no depresión
depresión depresión no depresión no depresión
no depresión depresión no depresión no depresión
depresión depresión no depresión no depresión
depresión depresión no depresión no depresión
no depresión depresión no depresión no depresión
Realice la prueba de Mc Nemar, de sus conclusiones a un
nivel de significación de 0.05.
Ejemplo
H0: La frecuencia de depresión no ha variado
H1: La frecuencia de depresión ha variado
=0.05
Pvalor = 0.04331 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que la frecuencia de
depresión ha variado.
5
Aspectos Generales:
Esta prueba es el equivalente no paramétrico a la prueba de
comparación de medias con observaciones pareadas.
Un caso especial es para probar la hipótesis nula de que las
dos medianas de la población son iguales.
Si la hipótesis de que las dos poblaciones son de igual nivel
de magnitud es cierta, el número de signos (+) debería ser
aproximadamente igual al número de signos (-).
Supuestos:
La muestra es seleccionada al azar.
Los valores muestrales deben estar al menos en la
escala ordinal.
Procedimiento:
Se aplica un signo (+) a cada par de valores cuya medida en
la primera muestra es mayor que la medida en la segunda
muestra, y un signo (-) cuando ocurre lo contrario. Si un par de
medidas tiene el mismo valor, estos valores relacionados se
excluyen del análisis, con lo que el tamaño de muestra
efectivo se reduce.
Definir el tamaño de la muestra (n) definitivo.
Todo el procedimiento y criterio de decisión posterior es similar
al de la Prueba de Signos de una muestra debido a que en
este caso se sigue trabajando con una columna de signos que
es obtenida de la comparación de la primera con la segunda
muestra.
6
Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: MeD ≥ MeD0 H0: MeD = MeD0 H0: MeD MeD0
H1: MeD < MeD0 H1: MeD MeD0 H1: MeD > MeD0
R:
En R se utiliza la función [Link] del paquete BSDA
[Link](x, y, valor hipotético, alternativa)
x: Es el primer vector de datos.
y: Es el segundo vector de datos.
Ejemplo
A un grupo de consumidores compuesto por 14 individuos se
le pide calificar dos marcas de refresco de cola de acuerdo
con un sistema de evaluación por puntos basado en varios
criterios. Los puntajes son presentados en la tabla siguiente:
Miembro del Calificación (puntos asignados)
Grupo Marca 1 Marca 2
Realice la prueba de signos para 1 20 16
evaluar si existen diferencias 2
3
24
28
26
18
significativas en las dos marcas 4 24 17
5 20 20
de refrescos. De sus conclusiones 6 29 21
7 19 23
a un nivel de significación de 0.05. 8 27 22
9 20 23
10 30 20
11 18 18
12 28 21
13 26 17
14 24 26
7
Ejemplo
H 0 : Me1 Me2 H 0 : Me1 Me2 0 H 0 : MeD 0
H1 : Me1 Me2 H1 : Me1 Me2 0 H1 : MeD 0
=0.05
Pvalor = 0.387 > no se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para no rechazar H0.
Por lo tanto, no se puede afirmar que exista diferencia
entre las marcas de cola.
[Link](x,y, md=0,alternative=“not equal")
Aspectos Generales:
Al igual que la prueba de Signos para observaciones
pareadas, esta prueba es el equivalente no paramétrico a la
prueba de comparación de medias con observaciones
pareadas.
Dado que la prueba de Wilcoxon considera la magnitud de la
diferencia, es una prueba más sensible que la Prueba de
Signos.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalos.
La muestra es aleatoria.
Las diferencias provienen de una distribución simétrica.
8
Procedimiento:
Calcular la diferencia entre el primer y segundo grupo de
observaciones (o viceversa dependiendo de la prueba
alternativa de interés).
Obtener los rangos de las diferencias sin tomar en cuenta
el signo de las mismas (en valor absoluto). En caso de
existir empate se asigna un rango promedio a todas las
diferencias empatadas.
Todo el procedimiento y criterio de decisión posterior es
similar al de la Prueba de Wilcoxon de una muestra debido
a que en este caso se sigue trabajando con una columna
de diferencias.
Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: MeD ≥ MeD0 H0: MeD = MeD0 H0: MeD MeD0
H1: MeD < MeD0 H1: MeD MeD0 H1: MeD > MeD0
R:
En R se utiliza la función [Link].
[Link](x, y,valor hipotético, alternativa, paired=TRUE)
9
Ejemplo
Calificación
A un grupo de 17 empleados Antes Después
10 15
se le evaluó antes y después 8 10
de asistir a un programa de 5 10
14 15
capacitación . 15 25
Se desea verificar a un nivel 22
17
20
20
de significación de 0.05 si el 10 22
programa fue efectivo.
8 16
20 18
11 16
16 24
10 23
15 25
5 15
24 20
20 24
Ejemplo
H 0 : MeDe MeAn H 0 : MeDe MeAn 0 H 0 : MeD 0
H1 : MeDe MeAn H1 : MeDe MeAn 0 H1 : MeD 0
=0.05
Pvalor = 0.0012 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que el programa de
capacitación fue efectivo.
10
Aspectos Generales:
En algunos casos se podría tener interés no sólo investigar si
las observaciones generan signos positivos o negativos, si no
también si éstos aparecen en una secuencia aleatoria. El
método de Wald – Wolfowitz prueba si el número de rachas es
suficientemente pequeño o grande para que se rechace la
hipótesis nula de una distribución aleatoria de los signos.
Supuestos:
Las observaciones deben expresarse en al menos escala
de ordinal.
Las muestras son aleatorias e independientes.
Procedimiento:
Para aplicar la prueba a datos procedentes de dos
muestras independientes de tamaño n1 y n2 ordenamos los
valores de n=n1+n2 en tamaño creciente.
Se determina el número de rachas (R) o valores sucesivos
de una muestra en la secuencia ordenada.
Si la hipótesis nula es cierta, las observaciones de ambas
muestras aparecerán muy mezcladas, y en la secuencia
ordenada habrá un gran número de rachas, por el
contrario, si ambas poblaciones de origen difieren las
observaciones de cada muestra tenderán a aparecer
juntas y el número de rachas será pequeño.
11
Hipótesis:
H0: Las dos muestras proceden de la misma población o de dos
poblaciones con idéntica distribución
H1: Las dos muestras no proceden de la misma población o de
dos poblaciones con idéntica distribución
Prueba Estadística:
Para muestras grandes:
2n1n2 2n1n2 2n1n2 n1 n2
R 1 R2 1
n1 n2 n1 n2 n1 n2 1
2
R R
Z
R
Ejemplo
Los tiempos de procesamiento (en horas) de dos
sistemas distintos se presentan a continuación:
Sistema 1: 0.65, 0.31, 0.42 ,0.81, 0.12 ,0.91, 0.72, 0.41,
0.94, 0.61, 0.52, 0.21, 0.16, 0.74, 0.65 ,0.83, 0.44, 0.42,
0.56, 0.73
Sistema 2: 0.15, 0.94, 0.81, 0.72, 0.21 ,0.35 ,0.18 ,0.74,
0.73, 0.62, 0.85 0.91, 0.18 ,0.23 ,0.65.
Verifique si los tiempos de procesamiento de los dos
sistemas en estudio provienen de la misma distribución.
12
Ejemplo
H0: Los tiempos de procesamiento de los sistemas en estudio
provienen de la misma distribución.
H1: Los tiempos de procesamiento de los sistemas en estudio no
provienen de la misma distribución.
=0.05
Pvalor1 = 0.5 y Pvalor2 = 0.998 > no se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para no rechazar H0.
Por lo tanto, no se puede afirmar que los tiempos de
procesamientos de los sistemas en estudio no provienen
de la misma distribución.
Aspectos Generales:
Esta prueba es utilizada para contrastar la hipótesis nula de
que dos muestras independientes de tamaños n1 y n2
proceden de la misma población. El contraste se basa en las
diferencias entre las frecuencias relativas acumuladas hasta
los mismos puntos de corte correspondientes a las dos
muestras. Si H0 es cierta es de esperar que dichas diferencias
sean pequeñas.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalo.
Las muestras son aleatorias e independientes.
13
Procedimiento:
Obtener las distribuciones acumulativas de frecuencias
para cada muestra.
Calcular la diferencia entre las frecuencias de las dos
muestras para un mismo intervalo. La máxima diferencia
es probada en el test estadístico para verificar o no la
carencia de diferencia entre las dos medidas.
Los valores críticos se localizan conociendo el tamaño de
las dos muestras y , en la tabla de la prueba de
Kolmogorov - Smirnov para dos muestras. La hipótesis se
verifica si D < Dα
Hipótesis:
H0: Las dos muestras proceden de la misma población o de dos
poblaciones con idéntica distribución
H1: Las dos muestras no proceden de la misma población o de
dos poblaciones con idéntica distribución
Prueba Estadística:
Para muestras pequeñas: F1 X i F2 X i
De max
i n1 n2
Para muestras grandes:
R:
En R se utiliza la función [Link].
14
Ejemplo
Los tiempos de procesamiento (en horas) de dos
sistemas distintos se presentan a continuación:
Sistema 1: 0.65, 0.31, 0.42 ,0.81, 0.12 ,0.91, 0.72, 0.41,
0.94, 0.61, 0.52, 0.21, 0.16, 0.74, 0.65 ,0.83, 0.44, 0.42,
0.56, 0.73
Sistema 2: 0.15, 0.94, 0.81, 0.72, 0.21 ,0.35 ,0.18 ,0.74,
0.73, 0.62, 0.85, 0.91, 0.18 ,0.23 ,0.65.
Verifique si los tiempos de procesamiento de los dos
sistemas en estudio provienen de la misma distribución.
Ejemplo
H0: Los tiempos de procesamiento de los sistemas en estudio
provienen de la misma distribución.
H1: Los tiempos de procesamiento de los sistemas en estudio no
provienen de la misma distribución.
=0.05
Pvalor = 0.8828 > no se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para no rechazar H0.
Por lo tanto, no se puede afirmar que los tiempos de
procesamientos de los sistemas en estudio no provienen
de la misma distribución.
15
Aspectos Generales:
Esta prueba se basa en los rangos de las observaciones.
Evalúa un parámetro de posición de dos poblaciones
independientes.
Por lo tanto, es la alternativa no paramétrica a una prueba Z o
T de diferencia de medias de dos muestras independientes.
Supuestos:
Las observaciones deben expresarse en al menos escala
de ordinal.
Las muestras son aleatorias e independientes.
Si las poblaciones son diferentes, difieren sólo en lo que
respecta a sus medianas.
Procedimiento:
Combinar las dos muestras y se obtienen el rango de
todas las observaciones (de menor a mayor), teniendo
presente a cual muestra pertenece cada observación. Si
se tienen observaciones similares se asigna un rango
promedio (obtenido de las posiciones del rango para el
cual se establecieron).
Desarrollar la prueba estadística correspondiente según el
caso de tamaño de muestra.
R:
En R se utiliza la función [Link]
[Link](x, y, valor hipotético, alternativa)
En R también se puede utilizar la función [Link] del
paquete exactRankTests
16
Hipótesis:
Unilateral izquierda Bilateral Unilateral derecha
H0: Me1 Me2 ≥ Me0 H0: Me1 Me2 Me0 H0: Me1 Me2 Me0
H1: Me1 Me2 < Me0 H1: Me1 Me2 Me0 H1: Me1 Me2 Me0
Prueba Estadística:
Muestras pequeñas n1 20 ó n220
n1 es el número de observaciones de la
n1 (n1 1) muestra de interés y S es la suma de los
U S rangos asignados a las observaciones de la
2
muestra de la población de valores
correspondiente al grupo de interés.
Muestras Grandes n1 > 20 ó n2>20 n1 (n2 )
U
Z 2 ~ N(0,1)
n1 n2 (n1 n2 1)
12
Ejemplo
Expuestos No Expuestos
En un experimento diseñado para
14.4 17.4
estimar los efectos de la 14.2 16.2
inhalación prolongada de oxido de 13.8 17.1
cadmio, 15 animales de 16.5 17.5
laboratorio sirvieron de sujetos 14.1 15.0
para el experimento, mientras que 16.6 16.0
10 animales similares sirvieron de 15.9 16.9
15.6 15.0
controles. La variable de interés 14.1 16.3
fue el nivel de hemoglobina 15.3 16.8
después del experimento 15.7
Se desea saber si puede 16.7
13.7
concluirse que la inhalación
15.3
prolongada de óxido de cadmio 14.0
disminuye el nivel de
hemoglobina. Use =0.05.
17
Ejemplo
H 0 : Me1 Me2
H1 : Me1 Me2
=0.05
Pvalor = 0.003 < se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, se puede afirmar que la inhalación prolongada
de óxido de cadmio disminuye el nivel de hemoglobina.
Aspectos Generales:
En la inferencia paramétrica se usa el estadístico de prueba F
para comparar dispersiones de poblaciones normales. Acá
nos interesará comparar dos parámetros de dispersión
(amplitud, escala, variabilidad) con ayuda de dos muestras de
tamaños n1 y n2.
Esta prueba sirve para estudiar si existe diferencia en el grado
de dispersión o variabilidad de dos distribuciones.
Supuestos:
Las observaciones deben expresarse en al menos escala
de intervalo.
Las muestras son aleatorias e independientes.
Las dos poblaciones son idénticas (incluyendo medianas
iguales) excepto por una posible diferencia en dispersión.
18
Hipótesis: Sea un parámetro de dispersión
Unilateral izquierda Bilateral Unilateral derecha
H0: 1 ≥ 2 H0: 1 = 2 H0: 1 2
H1: 1 < 2 H1: 1 2 H1: 1 > 2
Prueba Estadística:
Muestras pequeñas
2 ri: Es el rango de la i-ésima
n
n 1
M ri
1
observación de la primera muestra
i 1 2
en el conjunto total de datos.
n=n1+n2
n1 (n 1)(n 1)
M
Z 12 ~N(0,1)
Muestras Grandes n1n2 (n 1)(n 2)(n 2)
180
Ejemplo
Expuestos No Expuestos
En un experimento diseñado para
14.4 17.4
estimar los efectos de la 14.2 16.2
inhalación prolongada de oxido de 13.8 17.1
cadmio, 15 animales de 16.5 17.5
laboratorio sirvieron de sujetos 14.1 15.0
para el experimento, mientras que 16.6 16.0
10 animales similares sirvieron de 15.9 16.9
15.6 15.0
controles. La variable de interés 14.1 16.3
fue el nivel de hemoglobina 15.3 16.8
después del experimento 15.7
Se desea saber si la dispersión 16.7
13.7
entre los dos grupos de datos es
15.3
diferente. Use =0.05. 14.0
19
Ejemplo
H 0 : 1 2
H1 : 1 2
=0.05
Pvalor = 0.6023 > se rechaza H0
Conclusión
Existe suficiente evidencia estadística a un nivel de
significación de 0.05, para rechazar H0.
Por lo tanto, no se puede afirmar que la dispersión en los
dos conjuntos de datos es diferente.
R:
En R se utiliza la función [Link]
[Link](x, y, alternativa)
Otras pruebas:
Ansari, Siegel, Moses, etc.
20