ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
FACULTAD DE CIENCIAS
CARRERA DE ESTADÍSTICA
CÁLCULO ACTUARIAL
Ing. Natalia Pérez
PRUEBAS DE
NORMALIDAD
Contraste Descriptivo
Prueba Gráfica
Prueba de Kolmogorov Smirnov
Prueba de Kolmogorov Smirnov con la corrección de Lilliefors
Prueba de Shapiro Wilk
Prueba de Anderson Darling
Pruebas de Normalidad
Existen varias maneras de inspeccionar la normalidad univariante de los datos, podemos comenzar
realizando una inspección visual de los mismos utilizando para ello el histograma, que nos permitirá
observar si la forma de la distribución es similar a la de la campana de Gauss (unimodal,
campaniforme, simétrica,...)
Otra opción es el diagrama de caja o el gráfico de probabilidad normal, donde la subjetividad genera
una interpretación visual, es decir al contrario de los contrastes de normalidad numéricos se concluye
con una “p“ de probabilidad objetiva.
Contraste descriptivo
Al tomar en cuenta los estadísticos descriptivos tenemos:
Donde: media, mediana y moda
En el caso de no existir normalidad se realiza transformaciones a la variable de acuerdo a la
siguiente escalera de transformaciones:
Pruebas de Normalidad
Si la distribución es ASIMÉTRICA POSITIVA: es conveniente utilizar
a. Raíces cuadradas
b. Logaritmo
La corrección de la asimetría positiva será aún mayor con los logaritmos.
Si la distribución es ASIMÉTRICA NEGATIVA: es conveniente utilizar
a. Exponenciación (Elevar al cuadrado o al cubo)
La corrección de los datos será mayor cuanto mayor es la exponenciación.
Para realizar el contraste descriptivo en SPSS
Los pasos son los siguiente:
Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos
Pruebas de Normalidad
Prueba Gráfica
Los gráficos ayudan al investigador a juzgar si sus datos proceden de una distribución normal, a
través del análisis de la asimetría de los mismos, por ejemplo, si los datos proceden de una
distribución normal cabe esperar que la distribución no tenga una fuerte asimetría y esta se puede
visualizar a través de un análisis visual de Histogramas, Diagramas de Caja, Gráficos Q – Q y
Gráficos P – P.
Diagrama de caja
Si nos focalizamos en el diagrama de caja para realizar una inspección visual encontraremos los
siguientes elementos importantes al momento de interpretar si un conjunto de datos cumple o no
con normalidad.
Pruebas de Normalidad
Existirá asimetría positiva si la mediana está más cerca de la parte inferior de la caja y asimetría
negativa si la mediana está más cerca de la parte superior de la caja, tomando en cuenta que
cuanto más larga sea la caja y los bigotes, el conjunto de datos contará con mayor variabilidad.
Para realizar el gráfico en SPSS
Los pasos son los siguiente:
Gráficos– Cuadros de diálogo antiguos – Diagrama de cajas – Simples – Resúmenes para
grupos de casos
Pruebas de Normalidad
Gráfico Q-Q PLOT
Un gráfico cuantil-cuantil permite observar cuan cerca está la distribución de un conjunto de datos
a alguna distribución ideal o comparar la distribución de dos conjuntos de datos. La forma del
gráfico debería ser idealmente una línea recta específica. Si interesa comparar con la distribución
Gaussiana se llama gráfico de probabilidad Normal.
Además, los gráficos de probabilidad normal también permiten conocer la causa de esa
desviación: si los puntos se disponen en forma de "U" o con alguna curvatura, ello se debe a que
la distribución es asimétrica, mientras que si se presentan en forma de "S" significará que la
distribución no es mesocúrtica.
Pasos para realizar el grafico Q-Q PLOT en Excel
1. Ordenar los datos de menor a mayor
2. Construir un valor , que va desde
Pruebas de Normalidad
3. Construya el valor , para
Si , entonces , por lo tanto,
Si , entonces , por lo tanto,
4. Calcule los cuantiles, valores
5. Construya un diagrama de dispersión
Para realizar el gráfico en SPSS
Los pasos son los siguientes:
Analizar – Estadísticos descriptivos – Gráficos Q-Q
Pruebas de Normalidad
Contraste de Kolmogorov Smirnov
Este contraste compara la función de distribución empírica muestral con la teórica de una
población normal, de manera que se rechazaría la hipótesis nula de normalidad cuando el valor
experimental del estadístico (que sería la mayor diferencia registrada entre ambas funciones) es
significativamente grande. Este contraste no resulta muy apropiado cuando el tamaño de
muestra es pequeño porque para ese tipo de muestras su potencia es baja y su contraste se
presenta de la siguiente forma:
Pruebas de Normalidad
Planteamiento de Hipótesis
Estadístico de Prueba
Pasos para realizar el contraste de Kolmogorov Smirnov en Excel
Para resolver este contraste es necesario estimar la media y la desviación típica a partir de los datos muestrales.
1. Columna 1: Se enumeran todos los valores de la variable estudiada
2. Columna 2: Se ordenan los valores (valores de la variable)de forma ascendente.
3. Columna 3: La función de distribución se calcula acumulando las equi - probabilidades individuales
mediante .
4. Columna 4: Estandarizar los valores mediante .
5. Columna 5: Se obtiene los valores de los coeficientes tabulados de .
6. Columna 6: Hallar la diferencia y valor absoluto de .
7. Columna 7: Hallar la diferencia y valor absoluto de .
8. Columna 8: Encontrar el valor máximo entre la Columna 6 y Columna 7
Pruebas de Normalidad
Región de Rechazo
Decisión
Para realizar el contraste en SPSS
Los pasos son los siguientes:
Analizar – Pruebas no paranéfricas – Una muestra – Comparar automáticamente datos
observados con el valor hipotetizado
Contraste de Kolmogorov Smirnov con la corrección de liliefors
Al realizar esta prueba se concluye que la mayoría de conjuntos de datos se ajustan a una
distribución normal; por lo que Lilliefors propone una corrección para la misma mediante una
nueva tabla de valores críticos, en donde los intervalos de aceptación de la prueba se reducen, su
código en SPSS es:
Analizar – Estadísticos descriptivos – Explorar - Gráficos – Gráficos de probabilidad
Pruebas de normalidad
normal
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico Gl Sig.
aceleración ,223 13 ,077 ,922 13 ,270
a. Corrección de la significación de Lilliefors
Pruebas de Normalidad
Contraste de Shapiro Wilks
Esta prueba mide el grado de ajuste a una recta de las observaciones de la muestra representadas
en un gráfico de probabilidad normal. Es el más adecuado cuando el tamaño de muestra es
pequeño (no superior a 50) y no requiere que los parámetros de la distribución estén
especificados baja y su contraste se presenta de la siguiente forma:
Planteamiento de Hipótesis
Estadístico de Prueba
El término siendo el valor de los coeficientes que se encuentran tabulados en la tabla A;
mientras que son las diferencias sucesivas que se obtienen al restar el primer valor al último
valor, el segundo al penúltimo .
Pruebas de Normalidad
Pasos para realizar el contraste de Shapiro Wilks en Excel
1. Columna 1: Se enumeran todos los valores de la variable estudiada .
2. Columna 2: Se ordenan los valores de la variable en forma ascendente .
3. Columna 3: Se ordenan los valores de la variable en forma descendente .
4. Columna 4: Se obtiene la diferencia .
5. Columna 5: Se obtiene los valores de los coeficientes tabulados .
6. Columna 6: Se calcula el producto .
Región de Rechazo
Decisión
Para realizar el contraste en SPSS
Los pasos son los siguientes:
Analizar – Estadísticos descriptivos – Explorar - Gráficos – Gráficos de
probabilidad Normal
Pruebas de Normalidad
Contraste de Anderson Darling
Esta prueba evalúa el ajuste a cualquier distribución de probabilidades mediante la comparación
entre una distribución empírica y una distribución teórica definida en la hipótesis nula.
Planteamiento de Hipótesis
Estadístico de Prueba
Donde n es el número de observaciones, F(Y) es la distribución de probabilidades acumulada
normal con media y varianza especificadas a partir de la muestra y son los datos obtenidos
en la muestra, ordenados ascendentemente.
Pasos para realizar el contraste de Anderson Darling en Excel
Para resolver este contraste es necesario estimar la media y la desviación típica a partir
de los datos muestrales.
Pruebas de Normalidad
1. Columna 1: Se enumeran todos los valores de la variable estudiada .
2. Columna 2: Se obtiene la diferencia
3. Columna 3: Se ordenan los valores de la variable en forma ascendente .
4. Columna 4: Se ordenan los valores de la variable en forma descendente .
5. Columna 5: Se obtiene el valor de la función teórica .
6. Columna 6: Se obtiene el valor de la función teórica .
7. Columna 7: Se obtiene la diferencia .
8. Columna 5: Se calcula el logaritmo natura .
9. Columna 6: Se calcula el logaritmo natural .
10. Columna 7: Se calcula la suma de:
.
Pruebas de Normalidad
Región de Rechazo
Esta prueba no dispone de tablas para todos los casos. A continuación se presenta los valores
críticos asociados a los posibles niveles de significancia al momento de contrastar
normalidad.
0.1 0.05 0.025 0.01
0.631 0.752 0.873 1.035
Para realizar el contraste en Minitab
Los pasos son los siguientes:
Estadísticas – Test de Normalidad – Anderson Darling