ESTADÍSTICA
APLICADA A LA
INVESTIGACIÓN
EMPRESARIAL
Módulo I
Módulo 4: Pruebas no
probabilísticas
ÍNDICE
MÓDULO 4: PRUEBAS NO PROBABILISTICAS Pág.
I. PRUEBA DE KOLMOVOROV…………………………………………… 3
II. PRUEBA U-MANN WHITNEY. …………………………………………. 5
III. PRUEBA DE WILCOXON. ……………………………………………… 8
IV. PRUEBA DE KRUSHKAL WALLIS…………………………………….. 15
MÓDULO 4
PRUEBAS NO PARAMÉTRICAS
Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de
probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no
puede suponerse que los datos cumplen las condiciones de una prueba paramétrica
o cuando los datos se presentan en forma ordinal.
Las principales pruebas no paramétricas son:
PRUEBA NO PARAMÉTRICA
Prueba de Rachas
Prueba del Signo para una muestra.
Prueba de Wilcoxon para una muestra
Prueba del Signo para 2 muestras pareadas.
Prueba de Wilcoxon para 2 muestras
pareadas
Prueba U de Mann-Whitney.
Prueba de Kruskal-Wallis.
Prueba de Friedman
Coeficiente de Correlación por Rangos de
Spearman
Ventajas:
- El procedimiento es relativamente fácil de entender y de aplicar.
- Su uso es apropiado para muestras de tamaño mayor o igual que 25.
- No se afectan significativamente en presencia de observaciones atípicas.
- Si uno o más de los supuestos distribucionales en una prueba paramétrica no se
cumplen, la correspondiente prueba no paramétrica es más eficiente.
- Tienen un gran campo de aplicación.
3
Desventajas:
- Serán menos eficientes que el procedimiento paramétrico correspondiente cuando
se pueden aplicar ambos métodos. Es decir, si se puede utilizar una prueba
paramétrica y se usa una no paramétrica, entonces hay una pérdida de información.
- Son menos eficientes si las muestras son menores que 25
4.1 PRUEBA DE KOLMOGOROV
La prueba de Kolmogorov es una prueba de bondad de ajuste, es decir, del grado
en que la distribución observada difiere de otra distribución. Es una alternativa a la
prueba Chi Cuadrado de bondad de ajuste cuanto el número de datos es pequeño.
Esta prueba se utiliza para contrastar la hipótesis nula de que dos muestras
independientes de tamaños n1 y n2 proceden de la misma población. El contraste
se basa en las diferencias entre las frecuencias relativas acumuladas hasta los
mismos puntos de corte correspondientes a las dos muestras.
La hipótesis nula se rechaza cuando el valor del estadístico supera un cierto valor
crítico que se obtiene de una tabla de probabilidad.
Estadístico de contraste:
Dónde:
xi es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado
previamente de menor a mayor)
Fn (xi) es un estimador de la probabilidad de observar valores menores o iguales que
xi.
4
F (xi ) es la probabilidad de observar valores menores o iguales que xi cuando H 0 es
cierta.
Aplicación:
Para aplicar el estadístico, se sigue el siguiente procedimiento:
1. Se ordena la muestra
2. Para cada i = 1, 2,..., n, se calcula:
3.
Ejemplo
Aplicar la prueba de Kolmogorov – Smirnov, a nivel α = 0.1, para contrastar si puede
suponerse que los 10 datos, proceden de una distribución normal N(10.84, 3.5)
10.5, 8, 15, 12.1, 12.1, 4.1, 12.1, 8, 10.5, 16
5
1. Ordenados los datos de la muestra, construimos la tabla
con los valores Di
4. Conclusión: 0.161< 0.368, por tanto, no se rechaza que los
datos procedan de una distribución N(10.84; 3.5)
4.2 PRUEBA DE MANN WHITNEY
Esta prueba se usa cuando se quiere comparar dos poblaciones usando muestras
independientes, es decir es una prueba alterna a la prueba t para comparar dos
medias usando muestras independientes.
Es una prueba no paramétrica que mide las diferencias entre medias, asignando
rangos a cada grupo.
6
Hipótesis:
H0: La mediana de las dos poblaciones son iguales.
H1: La mediana de la primera población es menor (mayor o diferente) que la mediana
de la segunda población.
Estadístico de Prueba:
Donde:
n1: Número de elementos en la muestra 1.
n2: Número de elementos en la muestra 2.
R1: Suma de los rangos de los elementos en la muestra 1.
R2: Suma de los rangos de los elementos en la muestra 2.
Ejemplo
Se tomó una muestra de 10 damas y otra de 10 varones para determinar si las
mujeres tenían actitud más positiva que los varones frente a la preferencia de cierto
producto. Los puntajes en un cuestionario fueron: (mayor puntaje, actitud más
positiva).
¿La población de damas, tiene actitud más positiva que los varones frente a la
preferencia por cierto producto?
Solución:
a) H0: mediana de puntajes de las mujeres mediana de varones.
H1: mediana de puntajes de las mujeres > mediana de varones.
En otros términos:
H0: Las mujeres no tienen actitudes más positivas que los varones frente a la
preferencia por cierto producto.
H1: Las mujeres tienen actitudes más positivas que los varones frente a la
preferencia por cierto producto
b) Se elabora la tabla :
7
b) Suma de rangos (W)
W = suma de rangos.
W = 74,5
c) Cálculo de zW
Se busca en la tabla de Z
d) Valor de p Siendo la prueba unilateral:
p = 0,0104
e) Decisión y Conclusión:
Decisión: Siendo p = 0,0104 ( < 0,05), se rechaza la hipótesis nula.
8
Conclusión: Las mujeres tienen actitudes más positivas que los varones frente a
la preferencia de cierto producto. (p = 0,0104).
4.3 PRUEBA DE WILCOXON
Esta prueba se utiliza para probar hipótesis relativas a la mediana con un solo grupo
o con grupos pareados o dependientes en una población simétrica, la prueba de
Wilcoxon es un procedimiento que utiliza tanto la dirección (signo) como la magnitud.
Esta prueba considera que si la hipótesis nula fuera cierta, las diferencias negativas
No se requiere de ningún supuesto acerca de la forma de la distribución de la
población serían similares en cantidad y tamaño a las diferencias positivas.
Para un grupo:
Hipótesis:
H0 : La mediana poblacional es igual a un valor dado.
Ha : La mediana poblacional es menor (mayor o diferente) del valor dado.
Para dos grupos:
Hipótesis:
H0 : La diferencia es cero (no hay cambio).
H1 : La diferencia es menor (mayor o diferente) de cero.
Las hipótesis nula y alternativa se formulan respecto de la mediana de la población
ya sea para una prueba unilateral o bilateral. Se determina la diferencia entre cada
valor observado y el valor hipotético de la mediana, diferencia que, con el signo
aritmético que le corresponda, se designa como d : d = (X – Med0).
Si alguna diferencia es igual a cero, la observación asociada se excluye del análisis
y el tamaño de muestra efectivo se reduce. Los valores absolutos de las diferencias
se clasifican entonces de menor a mayor, asignándose el rango de 1 a la menor
diferencia absoluta. Cuando las diferencias absolutas son iguales, se asigna el rango
medio a los valores así relacionados.
Finalmente, se obtiene la suma de los rangos en forma separada para las diferencias
positivas y para las negativas. La menor de estas dos sumas es la estadística T de
Wilcoxon para una prueba bilateral.
9
En el caso de una prueba unilateral, la suma menor debe asociarse con la
direccionalidad de la hipótesis nula.
Para rechazar la hipótesis nula, el valor obtenido de T debe ser menor que el valor
crítico dado en la tabla.
Cuando n 25 y la hipótesis nula es cierta, la estadística T tiene una distribución
aproximadamente normal. La media y el error estándar asociados con esta
distribución de muestreo son, respectivamente:
𝑛(𝑛 + 1)
𝜇𝑇 =
4
𝑛(𝑛 + 1)(2𝑛 + 1)
𝜎𝑇 = √
24
Por lo tanto, en el caso de una muestra relativamente grande la prueba puede
realizarse usando la distribución normal de probabilidad y calculando la estadística
de prueba z, de la siguiente manera:
𝑇 − 𝜇𝑇
𝑧=
𝜎𝑇
Ejemplo:
Con el objeto de determinar su efecto en el rendimiento de la gasolina en millas por
galón en los automóviles de pasajeros, se prueban dos aditivos para la gasolina. A
continuación se presentan los resultados de esta prueba en 12 automóviles; en cada
automóvil se probaron los dos aditivos. Use = 0,5 y la prueba de Wilcoxon para
determinar si existe una diferencia significativa entre estos dos aditivos.
10
a) Se obtiene la diferencia de los dos aditivos:
b) Se obtiene el valor absoluto de cada una de las diferencias encontradas en
el cuadro anterior
11
c) Se ordenan los datos de menor a mayor, de la columna de valor absoluto.
12
d) Como ningún valor se repite, los rangos serán los mismos que los valores de
la posición en la que se encuentre el dato.
e) Colocamos los datos de los aditivos en su posición original, con lo que los
datos de la columna Rango quedan en las siguientes posiciones:
13
f) Para finalizar con las columnas de la tabla, necesitamos determinar las
columnas de Rangos positivos y los de Rango negativo.
g) Se obtiene la suma de los rangos positivos y los rangos negativos
14
h. Se resta el valor de la sumatoria de los rangos para obtener el valor de T.
70-8 = 62
i. Se plantean las hipótesis
H0: Las poblaciones son idénticas
Ha : Las poblaciones no son idénticas.
j. Determinar el valor de la media, la desviación estándar
Media µT = 0
Desviación estándar Z calculado
𝑛(𝑛+1)(2𝑛+1) 𝑇− 𝜇𝑇
σT = √ Z=
6 𝜎𝑇
12(12+1)((2. 12+1)+1) 62− 0
σT = √ Z=
6 25,5
(156)(25)
σT = √ Z = 2,43
6
σT = √650
σT = 25,5
k) Una vez obtenido el valor de z = 2,43. Procedemos a localizarlo en la tabla
El valor localizado en la tabla es 0,9925
Realizamos la resta 1- 0,9925 = 0,0075
Obtenemos p( z > 2,43 ) = 0,0075
15
Por lo tanto, el valor-p de la prueba para dos colas es 2*(0,0075) = 0,015; como
este valor es menor que α = 0,05, se rechaza H0
h) Con los resultados obtenidos se puede concluir:
Las dos poblaciones no son idénticas y existe una diferencia significativa entre
dos aditivos.
4.4 PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE DOS GRUPOS
INDEPENDIENTES
La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza
para diseños de clasificación simple. En este caso se comparan varios grupos pero
usando la mediana de cada uno de ellos, en lugar de las medias.
Ho: La mediana de las k poblaciones consideradas son iguales y
Ha: Al menos una de las poblaciones tiene mediana distinta a las otras.
Donde, n es el total de datos.
Si hay empates en los datos entonces, se aplica la siguiente modificación a H.
16
Se puede mostrar que si los tamaños de cada grupo son mayores que 5 entonces,
H se distribuye como una Ji-Cuadrado con, k-1 grados de libertad. Luego, la hipótesis
nula se rechaza si H > Ji-Cuadrado con, k-1.
Ejemplo
La manufacturera A recluta y contrata personal para su equipo gerencial en tres
escuelas diferentes. Se dispone de calificaciones de desempeño en muestras
independientes de cada una de las escuelas.
Se dispone de calificaciones de 7 empleados de la escuela A, 6 de la B y 7 de la C.
La calificación de cada gerente está en escala de 0 a 100. El límite superior es la
máxima nota.
Determinar si las tres escuelas son idénticas en cuanto a las evaluaciones de
desempeño.
Solución
Planteamiento de Hipótesis
Ho: Las poblaciones son idénticas en términos de las evaluaciones de desempeño.
Ha: Las dos poblaciones no son idénticas en términos de las evaluaciones de
desempeño.
17
Ordenar todos los datos en forma ascendente. Asignar rangos a los datos ordenados
Ubicar los rangos asignados de acuerdo a la clasificación original (escuelas)
Sumar las columnas de rangos. Usar la siguiente ecuación para el cálculo de W
15,5
15,5
Luego se reordenan por escuelas.
18
Se calcula el estadístico:
Regla de decisión
Si se rechaza H0
con K – 1 grfados de libertad (3–1)=2
Valor de la tabla : 5,4799147
El desempeño de los gerentes varía según la escuela a la que asistan. Considerando
que la escuela B presenta las menores calificaciones deberá tenerse precaución con
seleccionar personas de este lugar.
19
20