Pruebas de Bondad de Ajuste
16 51
9 54
22
3 27
10
8
43 43
12
Objetivos de la clase
• Determinar la fdp que puede representar a
un conjunto de datos
• Usar los criterios para seleccionar la fdp
adecuada.
• Prueba de bondad de ajuste Chi-
Cuadrado
• Prueba de bondad de ajuste K-S
1. Determinación de la función a usar
SIMULACIÓN DE SISTEMAS 3
Analizando los datos recolectados
1. Recolectar los datos.
2. Hallar los estadísticos máximo, mínimo y promedio.
3. Calcular la cantidad de intervalos de clase “K” y el “Ancho
de Clase”, usando la regla de STURGES.
Regla de STURGES:
K = 1 + 3.3 Log (n)
n: número de observaciones
K: número de intervalos
Ancho de clase =
(Max valor – Min valor) / k
SIMULACIÓN DE SISTEMAS 4
Creación de los intervalos de clase
• Se requiere K = 6 intervalos de clase y el ancho de
clase es igual a 8.5.
• Usaremos el ancho de clase para hallar cada intervalo,
cada intervalo de clase tiene un límite inferior y superior.
Límite Límite Frec.
Inferior Superior Obs.
1 1+8.5 = 9.5
9.5 9.5+8.5=18.0
18 18+8.5 =26.5
26.5 26.5 + 8.5 = 35.0
35.0 35.0 + 8.5 = 43.5
43.5 43.5 + 8.5 = 52.0
SIMULACIÓN DE SISTEMAS 5
Hallando la frecuencia observada
La frecuencia observada (FO) muestra cuántos datos se
encuentran dentro de cada intervalo.
Límite Límite Frecuenci
Inferior Superio a
r Observada
1 9.5 18
9.5 18.0 6
18 26.5 2
26.5 35.0 2
35.0 43.5 1
43.5 52.0 1
Total 30
SIMULACIÓN DE SISTEMAS 6
Graficando
El gráfico del histograma nos ayuda a analizar cómo se
distribuyen los datos y dónde están más concentrados.
Límite Límite Frecuenci 18
Inferior Superio a 16
r Observada 14
1 9.5 18 12
9.5 18.0 6 10
8
18 26.5 2
6
26.5 35.0 2 4
35.0 43.5 1 2
0
43.5 52.0 1 1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 -
26.5 35 43.5 52
Total 30
SIMULACIÓN DE SISTEMAS
7
Hallando el histograma en Excel
Office 2007: Herramientas / análisis de datos / histograma
Puedes revisar la siguiente guía en youtube (Office 2007):
http://www.youtube.com/watch?v=hjfn68RehEM
Haz clic en “archivo de datos” para obtener el archivo Excel con
los datos y halla el histograma.
SIMULACIÓN DE SISTEMAS
8
Planteando la hipótesis
Analizando las funciones Uniforme, Exponencial y Normal,
notamos que la exponencial es la que se ajusta al
histograma.
18
Uniforme Exponencial Normal 18 18
16
16 16
14
14 14
12
12 12
10
10 10
8
8 8
6
6 6
4
4 4
2
2 2
0
1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 - 0 0
1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 - 1 - 9.5 9.5 - 18 18 - 26.5 - 35 - 43.5 -
26.5 35 43.5 52
26.5 35 43.5 52 26.5 35 43.5 52
Por lo tanto, la hipótesis es:
Ho: Los datos tienen un comportamiento exponencial (11.53)
H1: Los datos NO tienen un comportamiento exponencial (11.53)
SIMULACIÓN DE SISTEMAS
9
Recordando la función exponencial
Casi siempre la función exponencial representa los tiempos
requeridos para la ejecución de una actividad o la prestación
de un servicio.
Esta función requiere de un parámetro que es el promedio.
Función de distribución de Función de distribución de
probabilidades probabilidades ACUMULADA
1 x x
f ( x) e F ( x) 1 e
Donde:
Promedio:
(para los 30 datos =11.53)
Varianza: 2
SIMULACIÓN DE SISTEMAS
10
2. Prueba de bondad Chi-Cuadrado
SIMULACIÓN DE SISTEMAS 11
Hallamos la probabilidad del intervalo
Límite Límite Frecuencia Frecuencia
P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE)
1 9.5 18 0.478 ( FOi FEi ) 2
FEi
9.5 18.0 6 0.229
18 26.5 2 0.109 P(1 x 9.5)
26.5 35.0 2 0.052 P( x 9.5) P( x 1)
35.0 43.5 1 0.025
[1 e 9.5 /11.53 ] [1 e 1/11.53 ]
43.5 52.0 1 0.012
0.561 0.083
Total 30
0.478
SIMULACIÓN DE SISTEMAS
12
Hallamos la frecuencia esperada
Límite Límite Frecuencia Frecuencia ( FOi FEi ) 2
P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE) FEi
=
1 9.5 18 0.478 14.35
0.478x30
9.5 18.0 6 0.229 6.86
18 26.5 2 0.109 3.28 0.229x30
26.5 35.0 2 0.052 1.57
35.0 43.5 1 0.025 0.75
43.5 52.0 1 0.012 0.36
Total 30
SIMULACIÓN DE SISTEMAS
13
Hallamos el valor Chi-cuadrado calculado
Límite Límite Frecuencia Frecuencia ( FOi FEi ) 2
P(Li <= X <= Ls)
Inferior Superior Observada (FO) Esperada (FE) FEi
1 9.5 18 0.478 14.35 0.93
9.5 18.0 6 14.35) 2
(180.229 6.86 0.11
18 26.5 2 14.35
0.109 3.28 0.50
26.5 35.0 2 0.052 1.57 0.12
35.0 43.5 1 0.025 0.75 0.08
43.5 52.0 1 0.012 0.36 1.14
La suma de esta columna es llamada
Total 30
“valor Chi-cuadrado calculado” 2.88
SIMULACIÓN DE SISTEMAS
14
Para un nivel de confianza del 90%
Nro. de intervalos
Nro. de parámetros estimados
• 2(teorico) = 2(90%, k - m- 1) = 2(90%, 6 - 1- 1 )
• 2(90%, 4) = 7.7794 Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp
Exponencial
• 2(calculado) < 2(teorico) Hi: Los datos NO se ajustan a una
fdp Exponencial
2.88 < 7.7794
˙
· · No se rechaza la hipotesis H0
Usando la tabla de distribución
Chi-cuadrado
Los grados de libertad = K – 1 – [cantidad parámetros de la función]
Los grados de libertad = 6 – 1 – 1 = 4
Supongamos un nivel alfa = 10%
Por lo tanto, el valor Chi-cuadrado = 7.7794
SIMULACIÓN DE SISTEMAS 16
Validación de la hipótesis
Recordemos que la hipótesis planteada es:
Ho: Los datos tienen un comportamiento exponencial (11.53)
H1: Los datos NO tienen un comportamiento exponencial (11.53)
Si el valor Chi-cuadrado (calculado) es menor que el Chi-cuadrado (de tabla)
No rechazamos la hipótesis Ho
El valor Chi-cuadrado (calculado) = 2.88
El valor Chi-cuadrado (de tabla) = 7.7794
Como 2.88 es menor que 7.7794, NO RECHAZAMOS la hipótesis Ho
Es decir los datos (los tiempos de la actividad) pueden ser representados por
una función EXPONENCIAL con promedio = 11.53
SIMULACIÓN DE SISTEMAS 17
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial
Graficar y plantear las hipótesis
25
20
15
10
0
0-3 3-6 6-9 9-12 12-15 15-18 m ay-18
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial
= 20 + 12
Hallar la Frecuencia Observada
= 20 + 12 + 7 Acumulada (FOA), sumando las
FO de cada intervalo
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial
Xi 6
n
= P(x <= 3) = 20 / 51 = 0.392
= P(x <= 6) = 32 / 51 = 0.627
Hallar la Probabilidad Observada
Acumulada (POA), dividiendo la
FOA entre el total de datos
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial
F ( x) 1 e x / 6 Xi 6
n
= P(x <= 3) = 1 – e –(3/6) = 0.392
= P(x <= 6) = 1 – e –(6/6) = 0.627
Hallar la Probabilidad Esperada
Acumulada (PEA), usando la
función planteada en el hipotesis.
Prueba Kolmogorov Smirnov
Se tiene las siguientes hipótesis:
Ho: Los datos se ajustan a una fdp Exponencial
Hi: Los datos NO se ajustan a una fdp Exponencial
Hallar la diferencia
en valor absoluto y
seleccionar el mayor
Como:
Máxima Diferencia < D(5%,51)
·˙· No se rechaza la hipótesis H0
Prueba Kolmogorov Smirnov
Grados de libertad = cant. de datos = 51
Alfa = 5%
Valor KS = 1.36/raiz(n) = 0.19