ESTADÍSTICA NO PARAMÉTRICA
ESTADÍSTICA NO PARAMÉTRICA
Acciones a tomar sobre los datos normales antes de optar por estas pruebas:
Revise y asegúrese de que los datos no siguen una distribución normal.
• Desarrollar una Prueba de normalidad. Para la prueba de Bartlet (P value <0.05)
• Revisar la información para detectar errores (tipográficos, etc.).
Investiguar los valores atípicos.
• Una muestra pequeña (n < 30) proveniente de un universo normal,
se mostrará algunas veces como anormal.
• Intentar transformar los datos. Las transformaciones comunes incluyen:
•- Raíz cuadrada de todos los datos
•- Logaritmo de todos los datos
•- Cuadrado de todos los datos
• Si la información es todavía anormal, entonces usar estas herramientas no paramétricas
Se utilizan cuando no interesa la forma de la distribución o los datos no son normales
• Desarrollar una Prueba de Corridas (para verificar que no existen sucesos
no aleatorios que puedan haber distorsionado la información)
Prueba de Hipótesis
Variables Atributos
No Normales Tablas de
Contingencia de
Varianzas Medianas
Variables Atributos
No Normales Tablas de
Contingencia de
Varianzas Medianas
Correlación
Correlación
Homogeneidad
Prueba de signos
de Varianzas
de Levene Wilcoxon
Normal
Mann-
Whitney Variancia Medias
Kruskal-
Chi Pruebas de t
Wallis
Prueba-F Muestra-1
Residuos
Prueba de Mood Muestra-2
Homogeneidad distribuidos
Friedman de la Variación ANOVA
de Bartlett Una vía normalmente
Dos vías
Correlación
Regresión
Se tienen las pruebas siguientes como más comunes:
Pruebas de normalidad o aleatioriedad de los datos
Pruebas de Varianzas
Homogeneidad de la varianza de Levene:
Compara dos o más varianzas de muestras de la misma población.
Pruebas no paramétricas para la medianas o medianas
Pruebas de la Mediana Ho: Mediana = 10
Prueba de signos: Prueba si el promedio de la mediana de la muestra
es igual a un valor conocido o a un valor a alcanzar.
Prueba Wilcoxon: Prueba si la mediana de la muestra es igual a un valor
conocido o a un valor hipotético.
Prueba de dos o más Medianas Ho: Mediana 1 = Mediana 2
Prueba Mann-Whitney: Prueba si dos medianas de muestras son iguales.
Comprueba el rango de dos muestras, por dif. entre dos medianas del universo.
Prueba Kruskal-Wallis: Prueba igualdad de dos o más medianas de muestras
Asume que todas las distribuciones tienen la misma forma.
Ho: Mediana 1 = Mediana 2 = Mediana 3 = mediana 4
Pruebas de dos Medianas
Prueba de la mediana de Mood: Otra prueba para más de dos medianas.
Prueba más firme para los valores atípicos contenidos en la inf.
Ho: Mediana 1 = Mediana 2 = Mediana 3 = mediana 4
Prueba de Friedman: Prueba si las medianas de las muestras, clasificadas
bajo dos categorías, son iguales.
Ho: Mediana 1 = Mediana 2 = Mediana 3 = mediana 4
Ho: Mediana de variable de bloqueo 1 = Mediana de variable de bloqueo 2 = …
Correlación: Prueba la relación lineal entre dos variables
2 Puebas de signos de la mediana
Ho: mediana = mediana hipotetizada versus Ha: mediana ≠ mediana hipotetizada
Ho: mediana = 115 Ha: mediana ≠ 115
Ejemplo: Se evaluan los índices de precios de 29 casas. Los datos históricos indican
que el índice ha sido de 115. Probar a un alfa de 0.10 si el índice se ha incrementado.
Nivel de confianza = 1 - alfa = 90%
File > Open worksheet > Exh_Stat.Mtw
Stat > Nonparametrics > 1-Sample Sign.
En Variables, seleccionar PriceIndex Confidence interval level 90
Seleccionar Test median y poner 115 en el cuadro
En Alternative, Seleccionar greater than. Click OK.
Los resultados son los siguientes:
Sign Test for Median: PriceIndex
Sign test of median = 115.0 versus > 115.0
N Below Equal Above P Median
PriceIndex 29 12 0 17 0.2291 144.0
Interpretación de resultados: Como el valor P de la prueba es >0.1 no hay
evidencia suficiente para rechazar Ho y la
mediana no es mayor a 115.
3 Prueba de una mediana de Wilcoxon
Ho: mediana = mediana hipotetizada versus Ha: mediana ≠ mediana hipotetizada
Ho: Mediana >/= 77 Ha: Mediana < 77
Se registran los resultados de examenes en ciencias para 9 estudiantes. Se quiere
probar si hay suficiente evidencia de que la mediana sea menor a 77 con alfa = 0.05.
Nivel de confianza = 1 - alfa = 95%
File > Open worksheet > Exh_Stat.Mtw
Stat > Nonparametrics > 1-Sample Wilcoxon
En Variables, seleccionar Achievement Confidence interval level 95
Seleccionar Test median y poner 77 en el cuadro
En Alternative, Seleccionar less Than. Click OK.
Los resultados son los siguientes:
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median < 77.00
N for Wilcoxon Estimated
N Test Statistic P Median
Achievement 9 8 19.5 0.610 77.50
Interpretación de resultados: Como el valor P de la prueba es >0.05 no hay
evidencia suficiente para rechazar Ho y la
mediana no es estadísticamentemenor a 77.
4 Prueba de igualdad de medianas de dos muestras de Mann Whitney
H0: h1 = h2 versus H1: h1 ≠ h2 , donde h es mediana de la población.
Se asume que las muestras provienen de dos poblaciones con la misma forma y varianza
Ejemplo: Se compara la presión diastólica de dos muestras extraidas de dos poblaciones
Se quiere probar a un 5% de nivel de significancia si hay diferencia entre las medianas.
Nivel de confianza = 1 - alfa = 95%
File > Open worksheet > Exh_Stat.Mtw
Stat > Nonparametrics > Mann-Whitney
En First Sample, sleccionar DBP1. En Second Sample, seleccionar DBP2. Click OK.
En Confidence level 95 y en Alternative, Seleccionar Not equal. Click OK.
Los resultados son los siguientes:
Mann-Whitney Test and CI: DBP1, DBP2
N Median
DBP1 8 69.50
DBP2 9 78.00
Point estimate for ETA1-ETA2 is -7.50
95.1 Percent CI for ETA1-ETA2 is (-18.00,4.00)
W = 60.0
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2685
The test is significant at 0.2679 (adjusted for ties)
Interpretación de resultados: Como el valor P de la prueba es >0.1 no hay
evidencia suficiente para rechazar Ho y las
medianas no son diferentes estadísticamente.
5 Prueba de igualdad de dos o más medianas de Kruskal Wallis
H0: Las medianas poblacionales son todas iguales vs H1: Al menos hay una diferente
Esta es una generalización de la prueba de Mann Whitney
Ho: Mediana Treatment 1= Mediana Treatment 2 = Mediana Treatment 3
Ha: Alguna es diferente de las demás
Ejemplo: Se quiere probar si el efecto de tres tratamientos diferentes influyen en el
crecimiento de bacterias a un 5% de nivel de significancia
Nivel de confianza = 1 - alfa = 95%
File > Open worksheet > Exh_Stat.Mtw
Stat > Nonparametrics > Kruskal-Wallis.
En Response, seleccionar Growth.
En Factor, seleccionar Treatment. Click OK.
Los resultados son los siguientes:
Kruskal-Wallis Test: Growth versus Treatment
Kruskal-Wallis Test on Growth
Treatment N Median Ave Rank Z
1 5 13.20 7.7 -0.45
2 5 12.90 4.3 -2.38
3 6 15.60 12.7 2.71
Overall 16 8.5
H = 8.63 DF = 2 P = 0.013
H = 8.64 DF = 2 P = 0.013 (adjusted for ties)
Interpretación de resultados:
Como el valor P de la prueba es < 0.05 hay evidencia suficiente para rechazar Ho y las
medianas son diferentes estadísticamente.
La mediana 3 difiere menos de la mediana general
Las medianas 1 y 2 tienen una mayor diferencia respecto a la mediana general.
6 Prueba de igualdad de dos o más medianas de Mood
Ho: Mediana ED 1= Mediana ED 2 = Mediana ED 3
Prueba similar a la anterior: Ha: Alguna es diferente de las demás
H0: h1 = h2 = h3, versus H1: no todas las h's son iguales con h's medianas poblacionales .
de OTIS para los tres niveles educacionales.
Ejemplo: Se mide la habilidad intelectual de 179 estudiantes en base al dibujo de figuras
después se aplica una prueba OTIS y se quiere probar si a un alfa de 5% hay diferencia
significativa entre el nivel de educación 0 - Preprofesionales 1 -Profesionales
2 - Preparatoria Nivel de confianza = 1 - alfa = 95%
File > Open worksheet > [Link]
Stat > Nonparametrics > Mood´s Median Test
En Response, seleccionar Otis.
En Factor, seleccionar ED. Click OK.
Los resultados son los siguientes:
7 Exp. aleatorizado bloqueado (equivale a ANOVA 2 vías) Prueba de Friedman
Ho: Los efectos de todos los tratamientos son cero
H1: Los efectos de los tratamientos difieren de cero
Ejemplo: Se quiere probar un tratamiento de drogas sobre la actividad enzimatica.
Se prueba con tres tratamientos en animales de diferentes granjas.
EnzymeActivity Therapy Litter Ho: Mediana Therapy 1= Mediana
0.15 1 1 Ha: Alguna es diferente de las de
0.26 1 2
0.23 1 3 Ho: Mediana Litter 1= Mediana Li
0.99 1 4 Ha: Alguno es diferente de los de
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4
Instrucciones de Minitab:
File > Open worksheet > EXH_STAT.MTW
Stat > Nonparametrics > Friedman.
En Response, seleccionar EnzymeActivity.
En Treatment, selecionar Therapy. En Blocks, seleccionar Litter. Click OK.
Los resultados son los siguientes:
Friedman Test: EnzymeActivity versus Therapy blocked by Litter
S = 2.38 DF = 2 P = 0.305
S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
Los valores P son mayores a 0.10
Sum por tanto no hay evidencia para
of decir que el efecto de los
Therapy N Est Median Ranks tratamientos sea diferente de cero
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
Para la teoría ver artículo Tablas de [Link] anexo
8 Tablas de Contingencia
La Tabla de contingencia es una prueba de independencia entre variables.
Ho: La variable de renglón es independiente de la variable de columna
Las proporciones en todas las columnas de cada renglón son iguales
Ha: La variable de renglón tiene dependencia de la variable de columna
Las proporciones en las columnas de cada renglón son diferentes
Ejemplo: Se tiene interés de probar si la afiliación política depende del sexo y del
partído político, para lo cual se encuestan a 100 personas.
Democrat Republican Other
Hombres 28 18 4
Mujeres 22 27 1
Las instrucciones son las siguientes:
File > Open worksheet Exh_Tabl.Mtw.
Stat > Tables > Chi-Square Test (Tabla en Worksheet).
En Columns que contiene la tabla, indicar Democrat, Republican y Other. Click OK.
Los resultados son los siguientes:
Chi-Square Test: Democrat, Republican, Other
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts
Democrat Republican Other Total
1 28 18 4 50
25.00 22.50 2.50 NOTA: Las frecuencias
0.360 0.900 0.900 esperadas deberían ser mayores
a 5.
2 22 27 1 50
25.00 22.50 2.50
0.360 0.900 0.900
Total 50 45 5 100
Chi-Sq = 4.320, DF = 2, P-Value = 0.115 El valor P es mayor a 0.05 y no
2 cells with expected counts less than 5. se rechaza Ho por tanto el tipo
de partido es independiente del
sexo de los votantes.
Ejercicios:
1. Los errores presentados en tres tipos de servicios cuando se prestan por tres regiones
se muestran a continuación, probar con una tabla de contingencia si los errores dependen
del tipo de servicio y región para un 95% de nivel de confianza.
Servicio Region A Region B Region C
1 27 12 8
2 41 22 9
3 42 14 10
Ho: Los errores NO dependen en cada región del tipo de servicio.
Ha: Los errores en cada región, dependen del tipo de servicio,
Con Minitab:
Stat > Tables > Chi square test (two way table in worksheet)
Columns containing the table Region A Region B Region C
OK
2. Probar a una alfa de 0.05 si los errores que se cometen al facturar
en diferentes ramos son similares. Nivel de confianza = 1 - alfa = 95%
Orden Farmacia Consumo Comput. Telecom.
Correcta 207 136 151 178
Incorrecta 3 4 9 12
1.45% 2.94% 5.96% 6.74%
Ho: El número de errores no depende del ramo industrial
Ha: El número de errores depende del ramo industrial
Con Minitab:
Stat > Tables > Chi square test (two way table in worksheet)
Columns containing the table Farmacia Consumo Comput. Telecom.
OK
estas pruebas:
n normal.
artlet (P value <0.05)
es incluyen:
erramientas no paramétricas
datos no son normales
xisten sucesos
formación)
e
ncia de
e
ncia de
ón
siduos
tribuidos
rmalmente
al a un valor
son iguales.
anas del universo.
nas de muestras
más de dos medianas.
dos en la inf.
muestras, clasificadas
de variable de bloqueo 2 = …
a ≠ mediana hipotetizada
atos históricos indican
ce se ha incrementado.
anza = 1 - alfa = 90% PriceIndex
0 144
50 145
56 150
72 180
80 201
80 210
80 220
99 240
101 290
110 309
110 320
110 325
eba es >0.1 no hay 120 400
Segun el p value, es mayor a 0.05 por lo tanto aceptamos la H0, lo que indica que l
mediana es igual o menor a 115
echazar Ho y la 140 500
507
Achievement
mediana hipotetizada 77
88
studiantes. Se quiere 85
or a 77 con alfa = 0.05. 74
anza = 1 - alfa = 95% 75
62
80
70
83
p value es > a 0.05, por lo tanto no se rechaza H0, lo que indica que la
mediana es igual o mayor a 77
eba es >0.05 no hay
echazar Ho y la
mentemenor a 77.
de Mann Whitney
DBP1 DBP2
de la población. 90 62
72 85
n la misma forma y varianza 61 78
66 66
traidas de dos poblaciones 81 80
encia entre las medianas. 69 91
anza = 1 - alfa = 95% 59 69
70 77
onar DBP2. Click OK.
l. Click OK.
p value es mayor a 0.05, por lo tanto se acepta Ho, lo que indica que
las medianas de ambos procesos son iguales
ificant at 0.2685
eba es >0.1 no hay
echazar Ho y las
es estadísticamente.
uskal Wallis
Growth Treatment
Al menos hay una diferente 15.1 1
13 1
reatment 3 16.2 3
14.9 1
rentes influyen en el 13.2 1
13.8 3
anza = 1 - alfa = 95% 13.1 2
13 2
12.9 2
11.9 1
El p value es menor a 0.05, por lo tanto rechazamos H0, lo que indic
que al menos una de las medianas es diferente
17 3
12.8 2
14.7 3
12 2
15 3
16.5 3
e para rechazar Ho y las
mediana general.
na ED 2 = Mediana ED 3 ED Otis ED Otis ED
e las demás 0 107 1 79 2
0 106 1 82 2
h's medianas poblacionales . 0 94 1 123 2
0 121 1 106 2
0 86 1 125 2
n base al dibujo de figuras 0 99 1 98 2
alfa de 5% hay diferencia 0 114 1 95 2
-Profesionales 0 100 1 129 2
anza = 1 - alfa = 95% 0 85 1 90 2
0 115 1 111 2
el p value es > a 0.05, entonces aceptamos H0, lo que indica que no hay diferencia entre las
medianas de los 3 niveles educativos
ueba de Friedman
ctividad enzimatica.
o: Mediana Therapy 1= Mediana Therapy 2 = Mediana Therapy 3
a: Alguna es diferente de las demás
o: Mediana Litter 1= Mediana Litter 2 = Mediana Litter 3
a: Alguno es diferente de los demás
el p value es mayor a o.o5, por lo tanto se acepta H0, lo que indica q
las 3 medianas son iguales
er. Click OK.
locked by Litter
son mayores a 0.10
ay evidencia para
ecto de los
ea diferente de cero
re variables.
son iguales
columna
ende del sexo y del
El p value es mayor a 0.05, por lo tanto aceptamos H0, lo que indica que el genero no
influye en la preferencia politica
an y Other. Click OK.
ected counts
OTA: Las frecuencias
peradas deberían ser mayores
valor P es mayor a 0.05 y no
rechaza Ho por tanto el tipo
e partido es independiente del
xo de los votantes.
e prestan por tres regiones
ncia si los errores dependen
el p value es mayor a o.05 por lo tanto aceptamos Ho, lo que indica que los errores
por tipo de servicio no dependen de la region
anza = 1 - alfa = 95%
p value es menor a 0.05, por lo tanto rechazamos H0, lo que indica que
los errores si dependen del ramo industrial
o aceptamos la H0, lo que indica que la
a H0, lo que indica que la
tanto se acepta Ho, lo que indica que
os son iguales
lo tanto rechazamos H0, lo que indica
nas es diferente
El valor p es mayor a 0.05, por lo tanto aceptamos H0, que indica qu
las medianas del tratamiento 1 y el tratamiento 3 son iguales
Otis
132
113
130
122
133
103
118
119
97
123
iferencia entre las
lo tanto se acepta H0, lo que indica que
e indica que el genero no
e indica que los errores
lo tanto aceptamos H0, que indica que
y el tratamiento 3 son iguales