1
Prueba de normalidad y homogeneidad
19 febrero 2025
Dr. Carlos Saúl Juárez Lugo
V-00
Uno de los requisitos para iniciar el análisis estadístico es el de calcular dos supuestos básicos: la
normalidad: las muestras con las que se trabaja proceden de poblaciones distribuidas normalmente; y
homocedasticidad u homogeneidad de varianzas: esas poblaciones normales poseen la misma varianza.
Estos procedimientos se encuentran en la función Explorar del programa SPSS®.
Estos procedimientos contrastan la hipótesis nula de que las muestras utilizadas han sido extraídas de
poblaciones normales (normalidad), y también la hipótesis de que los grupos definidos por la variable Factor
proceden de poblaciones con la misma varianza, y lo hace por medio de la prueba de Levene.
El procedimiento Explorar cuenta con un amplio abanico de opciones para identificar las características
de las principales variables en estudio. Es recomendable consultar el capítulo 11 “Análisis exploratorio. El
procedimiento Explorar” (pp. 261-278) del libro Análisis de datos con SPSS 13 base.
Se aplicó el instrumento ACRA-Mx que mide la frecuencia con la que los estudiantes universitarios
utilizan las estrategias de aprendizaje para realizar las actividades académicas. La medición se realiza por
medio de cinco opciones de respuesta 1 = Nunca, 2 = Casi nunca, 3 = Algunas veces, 4 = Bastantes veces, 5 =
Siempre. La escala ACRA-Mx está conformada por 4 subescalas: adquisición (Ad), Codificación (Co),
Recuperación (Re) y Apoyo (Ap), la sumatoria de las respuestas a cada ítem también nos da un puntaje total
llamado en la base ACRA. La muestra está conformada por 246 mujeres y 243 hombres para un total de 489
estudiantes universitarios de la zona norte del valle de México.
Prueba de normalidad
Utiliza el archivo 01-Normalidad y Homogeneidad [Link] que se encuentra en la carpeta con el
mismo nombre. Con la variable Promedio [Prom] realizaremos la demostración de la prueba de normalidad. El
procedimiento es el siguiente.
Analizar / Estadísticos descriptivos / Explorar
2
En la ventana Explorar seleccionamos de la lista de variables de la columna de la izquierda la variable
Promedio [Prom] y la desplazamos a Lista de dependientes:
Del botón Estadísticos, se abre una nueva ventana Explorar: Estadístico, en ella seleccionamos
Descriptivos y la opción Valores atípicos. Botón Continuar.
Del botón Gráficos, aparece una nueva ventana y seleccionamos Niveles de los factores juntos,
Histograma y Gráficos de normalidad con pruebas. Botón Continuar y en la ventana principal Aceptar.
3
En la ventana de Resultados observa que se despliega una gran cantidad de información en las tablas,
todas ellas hacen referencia a los descriptivos de la variable analizada. La tabla que nos interesa es la Prueba
de normalidad. Para interpretar los valores de la tabla consideramos lo siguiente:
a) La prueba de Kolmogórov-Smirnov (K-S) se recomienda emplear cuando el tamaño de muestra es
mayor de 30 participantes (n > 30).
b) La prueba de Shapiro-Wilk (SW) se recomienda emplear cuando el tamaño de muestra es menor a 30
participantes (n < 30).
c) El criterio de decisión para la prueba de hipótesis es el siguiente: localiza el valor del nivel crítico en la
tabla (Sig.) según la prueba que corresponda, en este caso K-S.
d) Si el nivel crítico (Sig.) es menor que el nivel de significación establecido por el investigador (p = 0.05),
se rechaza la hipótesis de normalidad [Sig < p].
e) Si el nivel crítico (Sig.) es mayor que el nivel de significación establecido por el investigador (p = 0.05),
se acepta la hipótesis de normalidad [Sig > p].
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico Gl Sig. Estadístico gl Sig.
Promedio 0.120 489 0.000 0.951 489 0.000
a. Corrección de significación de Lilliefors
Entonces, comparemos lo valores:
(El nivel crítico (Sig.) es menor que el nivel de significación establecido por el investigador (p = 0.05), se
rechaza la hipótesis de normalidad).
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad. Los datos muestrales de
0.000 < 0.05 la variable Promedio no proceden de poblaciones normales.
K-S = 0.120, p<0.000
La literatura especializada en análisis estadístico recomienda utilizar las gráficas de distribución. El
comando Explorar proporciona las gráficas Q-Q de normalidad, en ella se observa como la distribución de los
valores muestrales se asocian con valores teóricos, los puntos correspondientes a cada par se encuentran
agrupados en torno a la diagonal representada en el diagrama. Las desviaciones de los puntos de la diagonal
indican desviaciones de la normalidad.
4
Veamos ahora una segunda demostración. Realicemos el análisis utilizando la variable ACRA, el
procedimiento será el mismo, únicamente cambiamos la variable, mantenemos las mismas instrucciones en las
ventanas. El resultado es el siguiente.
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
ACRA 0.026 489 .200* 0.998 489 0.843
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se acepta la hipótesis de normalidad. Los datos muestrales de la
0.200 > 0.05 variable ACRA proceden de poblaciones normales.
K-S = 0.026, p<0.200
En la gráfica Q-Q de normalidad correspondiente podemos observar que la mayoría de los datos se
encuentra próximos a la recta, en comparación al ejercicio anterior.
5
Homogeneidad de varianza
En la siguiente demostración que ilustra el procedimiento e interpretación de la homogeneidad de
varianzas, vamos a utilizar una segunda variable en el procedimiento, la variable Sexo [sexo]. El
procedimiento Explorar requiere dos muestras en juego para comparar si el puntaje en la escala ACRA de las
muestras de hombres y mujeres proceden de la misma población, es decir tienen varianzas iguales.
Al procedimiento que ya conocemos agregaremos la variable Sexo que se coloca en Lista de factores.
6
Cuando seleccionamos el botón Gráficos, observamos en la venta que se activó la opción Dispersión
versus con prueba de Levene / No transformados, con estas indicaciones al programa, seleccionamos
Continuar y Aceptar.
En la ventana de Resultados observamos las siguientes tablas. Realizamos el mismo procedimiento de
interpretación para la variable Mujer y Hombre.
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Sexo Estadístico gl Sig. Estadístico gl Sig.
ACRA Mujer 0.031 246 .200* 0.994 246 0.413
Hombre 0.047 243 .200* 0.993 243 0.291
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sexo Sig. Sig. Establecido Decisión
critico (por nosotros)
Se acepta la hipótesis de normalidad para la muestra de
mujeres. Los datos muestrales de la variable ACRA
Mujer 0.200 > 0.05
proceden de poblaciones normales.
K-S = 0.031, p<0.200
Se acepta la hipótesis de normalidad para la muestra de
hombres. Los datos muestrales de la variable ACRA
Hombre 0.200 > 0.05
proceden de poblaciones normales.
K-S = 0.047, p<0.200
7
El programa SPSS® realiza el análisis estadístico de la variable ACRA a cada categoría de la variable
Sexo (mujer y hombre). Además, proporciona una nueva tabla titulada Prueba de homogeneidad de
varianza. Para su interpretación consideramos:
a) Si el valor del nivel crítico es menor que 0.05, debe rechazarse la hipótesis de homogeneidad.
b) Si el valor del nivel crítico es mayor que 0.05, debe aceptarse la hipótesis de homogeneidad.
Prueba de homogeneidad de varianza
Estadístico
de Levene gl1 gl2 Sig.
ACRA Se basa en la media 0.228 1 487 0.633
Se basa en la mediana 0.202 1 487 0.653
Se basa en la mediana 0.202 1 483.468 0.653
y con gl ajustado
Se basa en la media 0.218 1 487 0.641
recortada
Entonces, comparemos lo valores. Seleccionamos la fila Se basa en la media, pues son datos de un
nivel de medición de intervalo.
(El nivel crítico es mayor que 0.05, debe aceptarse la hipótesis de homogeneidad).
Sig. critico Sig. Establecido Decisión
(por nosotros)
La varianza de la variable ACRA es la misma en las dos
0.633 > 0.05 poblaciones definidas por la variable sexo.
Levene = 0.228, p<0.633
8
Ejercicios de práctica
Con el objetivo de ejercitar el procedimiento, realiza el análisis de normalidad y homogeneidad a las
cuatro subescalas adquisición (AD), Codificación (Co), Recuperación (Re) y Apoyo (Ap). Primero calcula la
normalidad con la muestra total (n = 489). Utiliza los siguientes cuadros para concentrar la información y tomar
una decisión.
Adquisición
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Adquisición 0.052 489 0.003 0.995 489 0.137
a. Corrección de significación de Lilliefors
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad. Los datos muestrales de
0.003 < 0.05 la variable Adquisición no proceden de poblaciones normales.
K-S = 0.052, p<0.003
Codificación
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Codificació 0.044 489 0.027 0.995 489 0.096
n
a. Corrección de significación de Lilliefors
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad. Los datos muestrales de
0.027 < 0.05 la variable Codificación no proceden de poblaciones normales.
K-S = 0.044, p<0.027
9
Recuperación
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Recuperació 0.040 489 0.057 0.996 489 0.200
n
a. Corrección de significación de Lilliefors
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se acepta la hipótesis de normalidad. Los datos muestrales de la
0.057 > 0.05 variable Recuperación proceden de poblaciones normales.
K-S = 0.040, p<0.057
Apoyo
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Apoyo 0.042 489 0.042 0.995 489 0.100
a. Corrección de significación de Lilliefors.
Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad. Los datos muestrales de
0.047 < 0.05 la variable Apoyo no proceden de poblaciones normales.
K-S = 0.042, p<0.042
10
Pruebas de normalidad y homogeneidad
En el siguiente ejercicio realiza el cálculo de la normalidad y la homogeneidad de varianzas para las
cuatro subescalas considerando la variable Sexo. Recuerda agregar la variable Sexo en la ventana Explorar /
Lista de factores. En la ventana Gráficos verifica que la opción No transformados se encuentre activa para
obtener el cálculo de la prueba de Levene.
Adquisición
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Sexo Estadístico gl Sig. Estadístico gl Sig.
Adquisición Mujer 0.058 246 0.042 0.994 246 0.371
*
Hombre 0.045 243 .200 0.994 243 0.500
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sexo Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad para
la muestra de mujeres. Los datos muestrales
Mujer 0.042 < 0.05 de la variable Adquisición no proceden de
poblaciones normales.
K-S = 0.058, p<0.042
Se acepta la hipótesis de normalidad para la
muestra de hombres. Los datos muestrales
Hombre 0.200 > 0.05 de la variable Adquisición proceden de
poblaciones normales.
K-S = 0.045, p<0.200
Homocedasticidad
Prueba de homogeneidad de varianza
Estadístico
de Levene gl1 gl2 Sig.
Adquisición Se basa en la 1.744 1 487 0.187
media
Sig. critico Sig. Establecido Decisión
(por nosotros)
La varianza de la variable Adquisición es la misma en las dos
0.187 > 0.05 poblaciones definidas por la variable sexo.
Levene = 1.744, p<0.187
11
Codificación
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Sexo Estadístico gl Sig. Estadístico Gl Sig.
Codificació Mujer 0.046 246 .200* 0.994 246 0.426
n Hombr 0.059 243 0.039 0.993 243 0.271
e
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sexo Sig. critico Sig. Establecido Decisión
(por nosotros)
Se acepta la hipótesis de normalidad para la
muestra de mujeres. Los datos muestrales
Mujer 0.200 > 0.05 de la variable Codificación proceden de
poblaciones normales.
K-S = 0.046, p<0.200
Se rechaza la hipótesis de normalidad para
la muestra de hombres. Los datos
Hombre 0.039 < 0.05 muestrales de la variable Codificación
proceden de poblaciones normales.
K-S = 0.059, p<0.039
Homocedasticidad
Prueba de homogeneidad de varianza
Estadístico
de Levene gl1 gl2 Sig.
Codificación Se basa en la 0.029 1 487 0.865
media
Sig. critico Sig. Establecido Decisión
(por nosotros)
La varianza de la variable Codificación es la misma en las dos
0.865 > 0.05 poblaciones definidas por la variable sexo.
Levene = 0.029, p<0.865
12
Recuperación
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Sexo Estadístico gl Sig. Estadístico gl Sig.
Recuperació Mujer 0.064 246 0.016 0.993 246 0.329
n Hombr 0.050 243 .200* 0.993 243 0.292
e
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sexo Sig. critico Sig. Establecido Decisión
(por nosotros)
Se rechaza la hipótesis de normalidad para
la muestra de mujeres. Los datos muestrales
Mujer 0.016 < 0.05 de la variable Recuperación no proceden de
poblaciones normales.
K-S = 0.064, p<0.016
Se acepta la hipótesis de normalidad para la
muestra de hombres. Los datos muestrales
Hombre 0.200 > 0.05 de la variable Recuperación proceden de
poblaciones normales.
K-S = 0.050, p<0.200
Homocedasticidad
Prueba de homogeneidad de varianza
Estadístico
de Levene gl1 gl2 Sig.
Recuperación Se basa en la 0.249 1 487 0.618
media
Sig. critico Sig. Establecido Decisión
(por nosotros)
La varianza de la variable Recuperación es la misma en las dos
0.618 > 0.05 poblaciones definidas por la variable sexo.
Levene = 0.249, p<0.618
13
Apoyo
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Sexo Estadístico gl Sig. Estadístico gl Sig.
Apoyo Mujer 0.050 246 .200* 0.994 246 0.445
Hombre 0.049 243 .200* 0.990 243 0.100
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Sexo Sig. critico Sig. Establecido Decisión
(por nosotros)
Se acepta la hipótesis de normalidad para la
muestra de mujeres. Los datos muestrales
Mujer 0.200 > 0.05 de la variable Apoyo proceden de
poblaciones normales.
K-S = 0.050, p<0.200
Se acepta la hipótesis de normalidad para la
muestra de hombres. Los datos muestrales
Hombre 0.200 > 0.05 de la variable Apoyo proceden de
poblaciones normales.
K-S = 0.049, p<0.200
Homocedasticidad
Prueba de homogeneidad de varianza
Estadístico
de Levene gl1 gl2 Sig.
Apoyo Se basa en la 0.755 1 487 0.385
media
Sig. critico Sig. Establecido Decisión
(por nosotros)
La varianza de la variable Apoyo es la misma en las dos
0.385 > 0.05 poblaciones definidas por la variable sexo.
Levene = 0.755, p<0.385