0% encontró este documento útil (0 votos)
77 vistas20 páginas

M4 Separata

Este documento presenta información sobre pruebas estadísticas no paramétricas. Brevemente describe cuatro pruebas principales: 1) la prueba de Kolmogorov, que contrasta si dos muestras provienen de la misma población; 2) la prueba U de Mann-Whitney, que compara las medianas de dos muestras independientes; 3) la prueba de Wilcoxon, que analiza la mediana dentro de una muestra o entre dos muestras pareadas; y 4) la prueba de Kruskal-Wallis, que compara más

Cargado por

carlos
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
77 vistas20 páginas

M4 Separata

Este documento presenta información sobre pruebas estadísticas no paramétricas. Brevemente describe cuatro pruebas principales: 1) la prueba de Kolmogorov, que contrasta si dos muestras provienen de la misma población; 2) la prueba U de Mann-Whitney, que compara las medianas de dos muestras independientes; 3) la prueba de Wilcoxon, que analiza la mediana dentro de una muestra o entre dos muestras pareadas; y 4) la prueba de Kruskal-Wallis, que compara más

Cargado por

carlos
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA

APLICADA A LA
INVESTIGACIÓN
EMPRESARIAL

Módulo I

Módulo 4: Pruebas no
probabilísticas
ÍNDICE

MÓDULO 4: PRUEBAS NO PROBABILISTICAS Pág.

I. PRUEBA DE KOLMOVOROV…………………………………………… 3
II. PRUEBA U-MANN WHITNEY. …………………………………………. 5
III. PRUEBA DE WILCOXON. ……………………………………………… 8
IV. PRUEBA DE KRUSHKAL WALLIS…………………………………….. 15
MÓDULO 4
PRUEBAS NO PARAMÉTRICAS

Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de


probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no
puede suponerse que los datos cumplen las condiciones de una prueba paramétrica
o cuando los datos se presentan en forma ordinal.
Las principales pruebas no paramétricas son:

PRUEBA NO PARAMÉTRICA
Prueba de Rachas
Prueba del Signo para una muestra.
Prueba de Wilcoxon para una muestra
Prueba del Signo para 2 muestras pareadas.
Prueba de Wilcoxon para 2 muestras
pareadas
Prueba U de Mann-Whitney.
Prueba de Kruskal-Wallis.
Prueba de Friedman
Coeficiente de Correlación por Rangos de
Spearman

Ventajas:
- El procedimiento es relativamente fácil de entender y de aplicar.
- Su uso es apropiado para muestras de tamaño mayor o igual que 25.
- No se afectan significativamente en presencia de observaciones atípicas.
- Si uno o más de los supuestos distribucionales en una prueba paramétrica no se
cumplen, la correspondiente prueba no paramétrica es más eficiente.
- Tienen un gran campo de aplicación.

3
Desventajas:
- Serán menos eficientes que el procedimiento paramétrico correspondiente cuando
se pueden aplicar ambos métodos. Es decir, si se puede utilizar una prueba
paramétrica y se usa una no paramétrica, entonces hay una pérdida de información.
- Son menos eficientes si las muestras son menores que 25

4.1 PRUEBA DE KOLMOGOROV


La prueba de Kolmogorov es una prueba de bondad de ajuste, es decir, del grado
en que la distribución observada difiere de otra distribución. Es una alternativa a la
prueba Chi Cuadrado de bondad de ajuste cuanto el número de datos es pequeño.
Esta prueba se utiliza para contrastar la hipótesis nula de que dos muestras
independientes de tamaños n1 y n2 proceden de la misma población. El contraste
se basa en las diferencias entre las frecuencias relativas acumuladas hasta los
mismos puntos de corte correspondientes a las dos muestras.
La hipótesis nula se rechaza cuando el valor del estadístico supera un cierto valor
crítico que se obtiene de una tabla de probabilidad.
Estadístico de contraste:

Dónde:
xi es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado
previamente de menor a mayor)
Fn (xi) es un estimador de la probabilidad de observar valores menores o iguales que
xi.

4
F (xi ) es la probabilidad de observar valores menores o iguales que xi cuando H 0 es
cierta.
Aplicación:
Para aplicar el estadístico, se sigue el siguiente procedimiento:

1. Se ordena la muestra
2. Para cada i = 1, 2,..., n, se calcula:

3.

Ejemplo
Aplicar la prueba de Kolmogorov – Smirnov, a nivel α = 0.1, para contrastar si puede
suponerse que los 10 datos, proceden de una distribución normal N(10.84, 3.5)

10.5, 8, 15, 12.1, 12.1, 4.1, 12.1, 8, 10.5, 16

5
1. Ordenados los datos de la muestra, construimos la tabla
con los valores Di

4. Conclusión: 0.161< 0.368, por tanto, no se rechaza que los


datos procedan de una distribución N(10.84; 3.5)

4.2 PRUEBA DE MANN WHITNEY

Esta prueba se usa cuando se quiere comparar dos poblaciones usando muestras
independientes, es decir es una prueba alterna a la prueba t para comparar dos
medias usando muestras independientes.
Es una prueba no paramétrica que mide las diferencias entre medias, asignando
rangos a cada grupo.

6
Hipótesis:
H0: La mediana de las dos poblaciones son iguales.
H1: La mediana de la primera población es menor (mayor o diferente) que la mediana
de la segunda población.
Estadístico de Prueba:

Donde:
n1: Número de elementos en la muestra 1.
n2: Número de elementos en la muestra 2.
R1: Suma de los rangos de los elementos en la muestra 1.
R2: Suma de los rangos de los elementos en la muestra 2.

Ejemplo
Se tomó una muestra de 10 damas y otra de 10 varones para determinar si las
mujeres tenían actitud más positiva que los varones frente a la preferencia de cierto
producto. Los puntajes en un cuestionario fueron: (mayor puntaje, actitud más
positiva).
¿La población de damas, tiene actitud más positiva que los varones frente a la
preferencia por cierto producto?

Solución:
a) H0: mediana de puntajes de las mujeres  mediana de varones.
H1: mediana de puntajes de las mujeres > mediana de varones.
En otros términos:
H0: Las mujeres no tienen actitudes más positivas que los varones frente a la
preferencia por cierto producto.
H1: Las mujeres tienen actitudes más positivas que los varones frente a la
preferencia por cierto producto
b) Se elabora la tabla :

7
b) Suma de rangos (W)
W = suma de rangos.
W = 74,5
c) Cálculo de zW

Se busca en la tabla de Z

d) Valor de p Siendo la prueba unilateral:


p = 0,0104

e) Decisión y Conclusión:
Decisión: Siendo p = 0,0104 ( < 0,05), se rechaza la hipótesis nula.

8
Conclusión: Las mujeres tienen actitudes más positivas que los varones frente a
la preferencia de cierto producto. (p = 0,0104).

4.3 PRUEBA DE WILCOXON


Esta prueba se utiliza para probar hipótesis relativas a la mediana con un solo grupo
o con grupos pareados o dependientes en una población simétrica, la prueba de
Wilcoxon es un procedimiento que utiliza tanto la dirección (signo) como la magnitud.
Esta prueba considera que si la hipótesis nula fuera cierta, las diferencias negativas
No se requiere de ningún supuesto acerca de la forma de la distribución de la
población serían similares en cantidad y tamaño a las diferencias positivas.
Para un grupo:
Hipótesis:
H0 : La mediana poblacional es igual a un valor dado.
Ha : La mediana poblacional es menor (mayor o diferente) del valor dado.

Para dos grupos:


Hipótesis:
H0 : La diferencia es cero (no hay cambio).
H1 : La diferencia es menor (mayor o diferente) de cero.
Las hipótesis nula y alternativa se formulan respecto de la mediana de la población
ya sea para una prueba unilateral o bilateral. Se determina la diferencia entre cada
valor observado y el valor hipotético de la mediana, diferencia que, con el signo
aritmético que le corresponda, se designa como d : d = (X – Med0).
Si alguna diferencia es igual a cero, la observación asociada se excluye del análisis
y el tamaño de muestra efectivo se reduce. Los valores absolutos de las diferencias
se clasifican entonces de menor a mayor, asignándose el rango de 1 a la menor
diferencia absoluta. Cuando las diferencias absolutas son iguales, se asigna el rango
medio a los valores así relacionados.
Finalmente, se obtiene la suma de los rangos en forma separada para las diferencias
positivas y para las negativas. La menor de estas dos sumas es la estadística T de
Wilcoxon para una prueba bilateral.

9
En el caso de una prueba unilateral, la suma menor debe asociarse con la
direccionalidad de la hipótesis nula.
Para rechazar la hipótesis nula, el valor obtenido de T debe ser menor que el valor
crítico dado en la tabla.
Cuando n  25 y la hipótesis nula es cierta, la estadística T tiene una distribución
aproximadamente normal. La media y el error estándar asociados con esta
distribución de muestreo son, respectivamente:

𝑛(𝑛 + 1)
𝜇𝑇 =
4

𝑛(𝑛 + 1)(2𝑛 + 1)
𝜎𝑇 = √
24
Por lo tanto, en el caso de una muestra relativamente grande la prueba puede
realizarse usando la distribución normal de probabilidad y calculando la estadística
de prueba z, de la siguiente manera:

𝑇 − 𝜇𝑇
𝑧=
𝜎𝑇
Ejemplo:
Con el objeto de determinar su efecto en el rendimiento de la gasolina en millas por
galón en los automóviles de pasajeros, se prueban dos aditivos para la gasolina. A
continuación se presentan los resultados de esta prueba en 12 automóviles; en cada
automóvil se probaron los dos aditivos. Use = 0,5 y la prueba de Wilcoxon para
determinar si existe una diferencia significativa entre estos dos aditivos.

10
a) Se obtiene la diferencia de los dos aditivos:

b) Se obtiene el valor absoluto de cada una de las diferencias encontradas en


el cuadro anterior

11
c) Se ordenan los datos de menor a mayor, de la columna de valor absoluto.

12
d) Como ningún valor se repite, los rangos serán los mismos que los valores de
la posición en la que se encuentre el dato.

e) Colocamos los datos de los aditivos en su posición original, con lo que los
datos de la columna Rango quedan en las siguientes posiciones:

13
f) Para finalizar con las columnas de la tabla, necesitamos determinar las
columnas de Rangos positivos y los de Rango negativo.

g) Se obtiene la suma de los rangos positivos y los rangos negativos

14
h. Se resta el valor de la sumatoria de los rangos para obtener el valor de T.

70-8 = 62
i. Se plantean las hipótesis
H0: Las poblaciones son idénticas
Ha : Las poblaciones no son idénticas.

j. Determinar el valor de la media, la desviación estándar

Media µT = 0

Desviación estándar Z calculado

𝑛(𝑛+1)(2𝑛+1) 𝑇− 𝜇𝑇
σT = √ Z=
6 𝜎𝑇

12(12+1)((2. 12+1)+1) 62− 0


σT = √ Z=
6 25,5

(156)(25)
σT = √ Z = 2,43
6

σT = √650

σT = 25,5

k) Una vez obtenido el valor de z = 2,43. Procedemos a localizarlo en la tabla


El valor localizado en la tabla es 0,9925
Realizamos la resta 1- 0,9925 = 0,0075
Obtenemos p( z > 2,43 ) = 0,0075

15
Por lo tanto, el valor-p de la prueba para dos colas es 2*(0,0075) = 0,015; como
este valor es menor que α = 0,05, se rechaza H0

h) Con los resultados obtenidos se puede concluir:


Las dos poblaciones no son idénticas y existe una diferencia significativa entre
dos aditivos.

4.4 PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE DOS GRUPOS


INDEPENDIENTES

La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza


para diseños de clasificación simple. En este caso se comparan varios grupos pero
usando la mediana de cada uno de ellos, en lugar de las medias.

Ho: La mediana de las k poblaciones consideradas son iguales y


Ha: Al menos una de las poblaciones tiene mediana distinta a las otras.

Donde, n es el total de datos.


Si hay empates en los datos entonces, se aplica la siguiente modificación a H.

16
Se puede mostrar que si los tamaños de cada grupo son mayores que 5 entonces,
H se distribuye como una Ji-Cuadrado con, k-1 grados de libertad. Luego, la hipótesis
nula se rechaza si H > Ji-Cuadrado con, k-1.

Ejemplo
La manufacturera A recluta y contrata personal para su equipo gerencial en tres
escuelas diferentes. Se dispone de calificaciones de desempeño en muestras
independientes de cada una de las escuelas.
Se dispone de calificaciones de 7 empleados de la escuela A, 6 de la B y 7 de la C.
La calificación de cada gerente está en escala de 0 a 100. El límite superior es la
máxima nota.

Determinar si las tres escuelas son idénticas en cuanto a las evaluaciones de


desempeño.

Solución
Planteamiento de Hipótesis
Ho: Las poblaciones son idénticas en términos de las evaluaciones de desempeño.
Ha: Las dos poblaciones no son idénticas en términos de las evaluaciones de
desempeño.

17
Ordenar todos los datos en forma ascendente. Asignar rangos a los datos ordenados
Ubicar los rangos asignados de acuerdo a la clasificación original (escuelas)
Sumar las columnas de rangos. Usar la siguiente ecuación para el cálculo de W

15,5
15,5

Luego se reordenan por escuelas.

18
Se calcula el estadístico:

Regla de decisión

Si se rechaza H0

con K – 1 grfados de libertad (3–1)=2

Valor de la tabla : 5,4799147


El desempeño de los gerentes varía según la escuela a la que asistan. Considerando
que la escuela B presenta las menores calificaciones deberá tenerse precaución con
seleccionar personas de este lugar.

19
20

También podría gustarte