INFORME DE LABORATORIO No3
INFORME DE LABORATORIO No3
ESTADÍSTICA INDUSTRIAL
Datos Enumerativos
Métodos No Paramétricos
Serie de Tiempo
UNIVERSIDAD NACIONAL MAYOR DE SAN
MARCOS
(Universidad del Perú, DECANA DE AMÉRICA)
LIMA – PERU
1
ÍNDICE
Contenido
I. DATOS ENUMERATIVOS...................................................................................................................... 3
1.1 Prueba de bondad de ajuste ....................................................................................................................... 3
1.2 Prueba de independencia ......................................................................................................................... 12
1.3 Prueba de bondad para probar la normalidad y Poisson ......................................................................... 18
II. MÉTODOS NO PARAMÉTRICOS ...................................................................................................... 28
2.1 Prueba de signo ....................................................................................................................................... 28
2.2 Prueba de Kruskall Wallis ....................................................................................................................... 33
2.3 Prueba de rango con signo de Wilcoxon ................................................................................................. 37
2.4 Prueba de Mann Whitney Wilconxon ..................................................................................................... 42
2.5 Correlación de rangos.............................................................................................................................. 48
III. SERIES DE TIEMPO ............................................................................................................................. 52
2
I. DATOS ENUMERATIVOS
1.1 Prueba de bondad de ajuste
Número de
Hora
Accidentes
8 a 9 A.M. 6
9 a 10 A.M. 6
10 a 11 A.M. 20
11 a 12 P.M. 8
1 a 2 P.M. 7
2 a 3 P.M. 8
3 a 4 P.M. 19
4 a 5 P.M. 6
SOLUCIÓN:
𝑖𝑖) 𝛼 = 0.01
𝑖𝑖𝑖) 𝜒 2
3
𝑣) 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑒𝑙 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜
(𝒇𝒐 − 𝒇𝒆 )𝟐
Hora 𝒇𝒐 𝒇𝒆 𝒇𝒐 − 𝒇𝒆 (𝒇𝒐 − 𝒇𝒆 )𝟐
𝒇𝒆
8 a 9 A.M. 6 10 -4 16 1.6
9 a 10 A.M. 6 10 -4 16 1.6
10 a 11 A.M. 20 10 10 100 10
11 a 12 P.M. 8 10 -2 4 0.4
1 a 2 P.M. 7 10 -3 9 0.9
2 a 3 P.M. 8 10 -2 4 0.4
3 a 4 P.M. 19 10 9 81 8.1
4 a 5 P.M. 6 10 -4 16 1.6
2
(𝒇𝒐 − 𝒇𝒆 )𝟐
𝜒 = ∑[ ]
𝒇𝒆
𝜒 2 = 24.6
𝜒 2 ∈ 𝑅. 𝐶. ⇒ 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻0 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
MINITAB:
4
2. La American Bankers Association recoge datos sobre el uso de tarjetas de crédito, tarjetas de
débito, efectivo y cheques personales en el pago de compras en tienda (The Wall Street Journal,
16 de diciembre de 2003). En 1999, los datos encontrados fueron los siguientes:
En una muestra tomada en el 2003, en 220 compras en tienda se encontró que en 46 se usó
tarjeta de crédito, en 67 se usó tarjeta de débito, en 33 se usó un cheque personal y en 74 se
pagó en efectivo. Con α = 0.01 ¿puede concluir que, en este periodo de cuatro años, de 1999 a
2003, ha habido un cambio en la manera en que los clientes pagan sus compras en las tiendas?
SOLUCIÓN:
5
IV. Formular una regla de decisión:
V. Calcular el estadístico:
𝑥 2 = 12.20
Xk ∈ R.C ⟶ Se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
INTERPRETACIÓN: Se puede concluir que, en estos cuatro años, sí ha habido un
cambio en la manera en que los clientes pagan sus compras en las
tiendas.
MINITAB:
6
3. El departamento de tarjetas de crédito bancarias del Carolina Bank sabe por su larga
experiencia, que 5% de los tarjetahabientes han tenido algunos estudios de bachillerato, 15%
han terminado dicho nivel escolar, 25% han tenido ciertos estudios universitarios, y 55% han
concluido la instrucción en universidad. De los 500 tarjetahabientes que fueron reportados por
falta de pago en este mes, 50 tenían estudios de bachillerato, 100 terminaron tal nivel escolar,
190 tenían preparación universitaria y 160 concluyeron la instrucción en la universidad. ¿Se
puede concluir que la distribución de tarjetahabientes que no han pagado sus cuentas es
diferente de la de los demás? Aplique el nivel de significancia 0.01.
SOLUCIÓN:
𝑖𝑖) 𝛼 = 0.01
𝑖𝑖𝑖) 𝜒 2
7
𝑣) 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑒𝑙 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜
Nivel (𝒇𝒐 − 𝒇𝒆 )𝟐
𝒇𝒐 𝒇𝒆 𝒇𝒐 − 𝒇𝒆 (𝒇𝒐 − 𝒇𝒆 )𝟐
Educativo 𝒇𝒆
Bachillerato incompleto 50 25 25 625 25
Bachillerato completo 100 75 25 625 8.33
Universidad incompleta 190 125 65 4225 33.8
Universidad completa 160 275 -115 13225 48.09
(𝒇𝒐 − 𝒇𝒆 )𝟐
𝜒2 = ∑ [ ]
𝒇𝒆
𝜒 2 = 115.22
𝜒 2 ∈ 𝑅. 𝐶. ⇒ 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻0 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
MINITAB:
8
4. Se tira un dado 30 veces y los números del 1 al 6 se aparecen como se muestra en la siguiente
distribución de frecuencias. Al nivel de significancia de 0.1. ¿Puede concluirse que el dado es
“Legal”?
Resultado Frecuencia
1 3
2 6
3 2
4 3
5 9
6 7
1) Ho: Las frecuencias observadas y las frecuencias esperadas son iguales en la repetición de
los resultados de cada número del dado.
Ha: Las frecuencias observadas y las frecuencias esperadas son diferentes en la repetición
de los resultados de cada número del dado.
2) α =0.1
3) x2
4)
Gráfica de distribución
Chi-cuadrada; df=5
0.16
0.14
0.12
0.10
Densidad
0.08
0.06
0.04
0.02
0.1
0.00
0 9.236
X
9
5) Prueba Chi-cuadrada de bondad de ajuste para conteos observados en variable: Repetición
de frecuencia en el dado.
(𝑓𝑜 − 𝑓𝑒 )2
𝑥2 = ∑ [ ] = 7.6
𝑓𝑒
𝑥 2 ∈ 𝑅𝑎 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑎
Conclusión: “Las frecuencias observadas y las frecuencias esperadas son iguales en la
repetición de los resultados de cada número del dado.”
Razonamiento: “Si las frecuencias observadas y las frecuencias esperadas son iguales
en la repetición de los resultados de cada número del dado, es decir, la diferencia en las
frecuencias observadas de mi muestra se debe al azar, entonces, se dirá que el dado es
‘Legal’. “
Respuesta: El dado es LEGAL
5. El propietario de un servicio comercial de pedidos por correo desearía comparar sus ventas con
la distribución geográfica de la población. De acuerdo con la oficina del censo de Estados
Unidos, 21% de la población vive en el noreste, 24% en el oriente medio, 35% en el sur y 20%
en el oeste. A continuación, se presenta una clasificación de una muestra de 400 pedidos
seleccionados al azar de los enviados el mes anterior.
Al nivel de significancia de 0.01, ¿La distribución de pedidos refleja la población?
Bibliografía: Lind – Marchal - Mason (2004), Estadística para Administración y Economía,
11va ed.
10
4)
Gráfica de distribución
Chi-cuadrada; df=3
0.25
0.20
0.15
Densidad
0.10
0.05
0.01
0.00
0 11.34
X
(𝑓𝑜 − 𝑓𝑒 )2
𝑥2 = ∑ [ ] = 5.933
𝑓𝑒
𝑥 2 ∈ 𝑅𝑎 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑎
11
1.2 Prueba de independencia
1. Una de las preguntas a los suscriptores de BusinessWeek fue, “En sus viajes de negocios de
los últimos 12 meses, ¿qué tipo de boleto de avión ha comprado?” Los datos obtenidos se
presentan en la tabla de contingencia siguiente.
Use α = 0.05 y pruebe la independencia entre tipo de vuelo y tipo de boleto. ¿Cuál es la
conclusión?
Bibliografía: Anderson-Sweeny-Williams 2008, Estadística para administración y economía,
10a ed.
Solución:
I. Plantear la hipótesis nula y la alternativa:
Ho: No existe relación entre el tipo de vuelo y el tipo de boleto.
Ha: Sí existe relación entre el tipo de vuelo y el tipo de boleto.
12
V. Calcular el estadístico:
51 ∗ 642 51 ∗ 278
𝑓𝑒11 = = 35.59 𝑓𝑒12 = = 15.41
920 920
2
(29 − 35.59)2 (95 − 150.73)2 (518 − 455.68)2
𝑥 = + +
35.59 150.73 455.68
MINITAB:
13
2. Un estudio del Public Interest Research Group (PIRG) del estado de Washington indica que
46% de los estudiantes universitarios de tiempo completo trabaja 25 o más horas por semana.
El estudio del PIRG proporciona datos sobre los efectos del trabajo en las calificaciones USA
Today, 17 de abril de 2002). En este estudio, de 200 estudiantes que conformaban la muestra,
90 trabajaban 1-15 horas por semana, 60 trabajaban 16-24 horas por semana y 50 trabajaban
25-34 horas por semana. A continuación, se presentan las cantidades muestrales de estudiantes
que indicaron que su trabajo tenía un efecto positivo, ningún efecto o un efecto negativo sobre
sus calificaciones.
Realice una prueba de independencia para determinar si el efecto sobre las calificaciones es
independiente de las horas trabajadas por semana. Use α = 0.05. ¿Cuál es el valor-p y cuál es
su conclusión?
SOLUCIÓN:
𝑖𝑖) 𝛼 = 0.05
𝑖𝑖𝑖) 𝜒 2
14
EFECTO SOBRE LAS CALIFICACIONES
HORAS TRABAJADAS Positivo Ninguno Negativo Total
POR SEMANA 𝒇𝒐 𝒇𝒆 𝒇𝒐 𝒇𝒆 𝒇𝒐 𝒇𝒆 𝒇𝒐 𝒇𝒆
1 – 15 horas 26 23.85 50 43.20 14 22.95 90 90
16 – 24 horas 16 15.90 27 28.80 17 15.30 60 60
25 – 34 horas 11 13.25 19 24.00 20 12.75 50 50
Total 53 53 96 96 51 51 200 200
(𝒇𝒐 − 𝒇𝒆 )𝟐
𝜒2 = ∑ [ ]
𝒇𝒆
𝜒 2 = 10.6026
𝜒 2 ∈ 𝑅. 𝐶. ⇒ 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻0 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
MINITAB:
15
3. Visa Card USA estudió la frecuencia con que los consumidores de diversos rangos de edades
usan tarjetas plásticas (de crédito o de débito) al pagar sus compras (Associated Press, 16 de
enero de 2006). A continuación, se presentan los datos muéstrales de 300 clientes divididos en
cuatro grupos de edades.
Grupo de
18–24 25–34 35–44 45 y más
edad
Plástico 21 27 27 36
Forma de
Efectivo o
Pago 21 36 42 90
cheque
SOLUCIÓN:
1) Ho: No existe relación entre el método de pago y el grupo de edad.
Ha: Existe relación entre el método de pago y el grupo de edad.
2) α =0.05
3) x2
4) gl = (4-1)(2-1)=3
Gráfica de distribución
Chi-cuadrada; df=3
0.25
0.20
0.15
Densidad
0.10
0.05
0.05
0.00
0 7.815
X
16
5) Prueba Chi-cuadrada: 18–24; 25–34; 35–44; 45 y más
𝑥 2 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
“Existe relación entre el método de pago y el grupo de edad.”
b) Notamos que la relación entre método de pago y edad es más fuerte entre desde los 45 años a
más con plástico (contribución al chi-cuadrado de 2.4919), los jóvenes de 18 a 24 años también
relacionan moderadamente su edad con éste método de pago (1.918) y notamos que de 25 a 44
años no es tan relacionado la edad con el uso de dinero plástico ya que dan poca contribución.
c) Las empresas como Visa, Mastercard y Discover pueden orientar más su mercado a los sectores
jóvenes y a partir de los 45 años a más, con temas que vivan en su edad. Por ejemplo, temas
publicitarios con temática juvenil (casa nueva, auto nuevo, etc.) o temática para personas de 45
años a más (jubilación, seguros de vida, etc.), ya que se conoce que hay relación de método de
pago con edad más pronunciadamente en estos dos intervalos de edades.
17
1.3 Prueba de bondad para probar la normalidad y Poisson
1. Se informa que las comisiones sobre las ventas de autos nuevos, tienen como promedio $1
500 por mes, con una desviación estándar de $300. Una muestra de 500 agentes o
representantes de ventas en la región noroeste de Estados Unidos, indicó la siguiente
distribución de las comisiones. A nivel de significancia 0.01, ¿se puede concluir que la
población está distribuida normalmente?
Comisión Frecuencia
(dólares)
Menos que 900 9
900 a 1200 63
1200 a 1500 165
1500 a 1800 180
1800 a 2100 71
2100 o más 12
TOTAL 500
SOLUCIÓN:
𝑖𝑖) 𝛼 = 0.01
𝑖𝑖𝑖) 𝜒 2
18
𝑣) 𝐶á𝑙𝑐𝑢𝑙𝑜 𝑑𝑒𝑙 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜
Comisión
Valor z Área 𝒇𝒆
(dólares)
Menos que 900 -2 0.0228 11.40
900 a 1200 -2 a -1 0.1359 67.95
1200 a 1500 -1 a 0 0.3413 170.65
1500 a 1800 0a1 0.3413 170.65
1800 a 2100 1a2 0.1359 67.95
2100 o más 2 0.0228 11.40
TOTAL 500 1.0000 500.00
Comisión (𝒇𝒐 − 𝒇𝒆 )𝟐
𝒇𝒐 𝒇𝒆 𝒇𝒐 − 𝒇𝒆 (𝒇𝒐 − 𝒇𝒆 )𝟐
(dólares) 𝒇𝒆
Menos que 900 9 11.40 -2.40 5.76 0.5052
900 a 1200 63 67.95 -4.95 24.50 0.3606
1200 a 1500 165 170.65 -5.65 31.92 0.1870
1500 a 1800 180 170.65 9.35 87.42 0.5123
1800 a 2100 71 67.95 3.05 9.30 0.1369
2100 o más 12 11.40 0.60 0.35 0.0307
TOTAL 500 500.00 1.7327
𝜒 2 = 1.7327
𝜒 2 ∈ 𝑅. 𝐴. ⇒ 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻0 𝑦 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑎
MINITAB:
19
2. El fabricante de una terminal de computadora informa en su material de publicidad que la
duración media de tal dispositivo, según uso normal, es de 6 años, con una desviación estándar
de 1.4 años, suponga que son los valores de la población. Una muestra de 90 unidades vendidas
hace 10 años, mostró la siguiente distribución de las duraciones. Al nivel de significancia de
0.05 ¿Puede el fabricante concluir que tales tiempos están distribuidos normalmente?
Bibliografía: Lind – Marchal - Mason (2004), Estadística para Administración y Economía,
11va ed.
Hasta 4 años 7
4a5 14
5a6 25
6a7 22
7a8 16
8 a mayor 6
2) 0.05
3) Estadístico X2
4) Definir una regla de decisión
Gráfica de distribución
Chi-cuadrada; df=5
0.16
0.14
0.12
0.10
Densidad
0.08
0.06
0.04
0.02
0.05
0.00
0 11.07
X
20
5) Calcular el estadístico
𝑥−𝑢
𝑧=
𝜎
(𝑓𝑜 − 𝑓𝑒 )2
𝑥2 = ∑ [ ] = 0.507
𝑓𝑒
𝑥 2 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
21
3. El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene
una distribución de Poisson. Use α=0.10 y los datos siguientes para probar esta suposición.
SOLUCIÓN:
𝑖𝑖) 𝛼 = 0.01
𝑖𝑖𝑖) 𝜒 2
𝜇= 2
22
Número de
Probabilidad
llamadas por 𝒇𝒆
de Poisson
minuto
0 0.1353 13.53
1 0.2706 27.06
2 0.2706 27.06
3 0.1804 18.04
4 0.0902 9.02
5 0.0360 3.60
6 o más 0.0169 1.69
Total 1.0000 100.00
Número de (𝒇𝒐 − 𝒇𝒆 )𝟐
llamadas por 𝒇𝒐 𝒇𝒆 𝒇𝒐 − 𝒇𝒆 (𝒇𝒐 − 𝒇𝒆 )𝟐
minuto 𝒇𝒆
0 15 13.53 1.47 2.1609 0.1597
1 31 27.06 3.94 15.5236 0.5736
2 20 27.06 -7.06 49.8436 1.8419
3 15 18.04 -3.04 9.2416 0.5123
4 13 9.02 3.98 15.8404 1.7561
5 o más 6 5.29 0.71 0.5041 0.0953
Total 100 100.00 4.9389
𝜒 2 = 4.9389
𝜒 2 ∈ 𝑅. 𝐴. ⇒ 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻0 𝑦 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑎
MINITAB:
23
4. La American Bankers Association recoge datos sobre el uso de tarjetas de crédito, tarjetas de
débito, efectivo y cheques personales en el pago de compras en tienda (The Wall Street Journal,
16 de diciembre de 2003). En 1999, los datos encontrados fueron los siguientes:
En una muestra tomada en el 2003, en 220 compras en tienda se encontró que en 46 se usó
tarjeta de crédito, en 67 se usó tarjeta de débito, en 33 se usó un cheque personal y en 74 se
pagó en efectivo.
a. Con α =0.01 ¿puede concluir que en este periodo de cuatro años, de 1999 a 2003, ha habido
un cambio en la manera en que los clientes pagan sus compras en las tiendas? ¿Cuál es el valor-
p?
b. A partir de los datos muestrales del 2003, calcule el porcentaje de uso de cada método de
pago. ¿Cuál parece haber sido el principal o los principales cambios ocurridos en este periodo
de cuatro años?
c. En 2003, ¿qué porcentaje de los pagos se hicieron con tarjeta (tarjeta de crédito o débito)?
Bibliografía: Anderson-Sweeny-Williams 2008, Estadística para administración y economía,
10a ed.
SOLUCIÓN:
Ho: Las proporciones de las poblaciones son: PA =0.22 PB =0.21 PC =0.18 PD =0.39
Ha: Las proporciones de las poblaciones no son: PA =0.22 PB =0.21 PC =0.18 PD =0.39
2) α =0.05
3) x2
4)
Gráfica de distribución
Chi-cuadrada; df=3
0.25
0.20
0.15
Densidad
0.10
0.05
0.01
0.00
0 11.34
X
24
5) Prueba Chi-cuadrada de bondad de ajuste para conteos observados en variable: Mu
(𝑓𝑜 − 𝑓𝑒 )2
𝑥2 = ∑ [ ] = 12.2064
𝑓𝑒
𝑥 2 ∈ 𝑅𝐶 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
CONCLUSIÓN:
“Ha habido un cambio en el periodo de 4 años, de 1999 a 2003 en la manera en que los clientes
pagan sus compras en las tiendas.”
b) A partir de los datos muestrales del 2003, calcule el porcentaje de uso de cada método de
pago. ¿Cuál parece haber sido el principal o los principales cambios ocurridos en este periodo
de cuatro años?
Porcentaje 2003
Porcentaje
Compras en tienda Muestra 2003 respecto al total
1999
(220)
Tarjeta de crédito 0.22 46 0.209091
Tarjeta de débito 0.21 67 0.304545
Cheque personal 0.18 33 0.150000
Efectivo 0.39 74 0.336364
“El principal cambio ha ocurrido en el uso de tarjetas de crédito en el que vemos un aumento
de 21% a 30.45% y esto se refleja también en la gráfica de contribución al chi- cuadrado.”
d) En el 2003 los pagos hechos por tarjeta fueron de 0.209 hecho por la tarjeta de crédito, 0.305
hecho por la tarjeta de débito lo que nos da un total de 0.514, es decir 51,4 %.
25
5. Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene
una distribución de Poisson. A continuación, se presentan los datos de una muestra de 80 días
del año anterior. ¿Estos datos apoyan la creencia de que el número de accidentes por día tiene
una distribución de Poisson? Use α = 0.05.
26
V. Calcular el estadístico:
0 ∗ 34 1 ∗ 25 2 ∗ 11 3 ∗ 7 4 ∗ 3
𝑥̅ = + + + + =1
80 80 80 80 80
Como hay dos celdas (40%) con valores menores de 5 en las frecuencias esperadas,
se juntan categorías:
N de días (fo) Prob. fe
accidentes
0 34 0.3679 29.432
1 25 0.3679 29.432
2 11 0.1839 14.712
de 3 a 4 10 0.0803 6.424
MINITAB:
27
II. MÉTODOS NO PARAMÉTRICOS
2.1 Prueba de signo
Emplee α = 0.05 y pruebe si existe alguna diferencia significativa en las preferencias por
estas dos marcas. Un signo más indica preferencia por la marca A sobre la marca B.
Bibliografía: Anderson-Sweeny-Williams 2008, Estadística para administración y economía,
10a ed.
SOLUCIÓN:
I. Plantear la hipótesis nula y la alternativa:
Ho: 𝑝 = 0.5 (No existe diferencia significativa en las preferencias por estas dos
marcas)
Ha: 𝑝 ≠ 0.5 (Sí existe diferencia significativa en las preferencias por estas dos
marcas)
28
V. Calcular el estadístico:
Nº de signos positivos = 7
Nº de signos negativos = 3
No hay cambio = 0
𝑛 = 10
0 0.001
1 0.01
2 0.044
3 0.117
4 0.205
5 0.246
6 0.205
7 0.117
8 0.044
9 0.01
0.001
MINITAB
29
2. Calorie Watchers tiene desayunos, comidas y cenas bajas en calorías. Si usted se une al club,
recibe dos alimentos empacados al día. Calorie Watchers afirma que usted puede comer todo
lo que quiera en su tercera comida y aun así perderá al menos cinco libras el primer mes. Los
miembros del club se pesan antes de comenzar el programa y de nuevo al cabo del primer mes.
Las experiencias de una muestra aleatoria de 11 se muestran en la tabla. Lo que interesa saber
es si los miembros perdieron peso como resultado del programa de Calorie Watchers.
a) Formule H0 y H1.
b) Con un nivel de significancia de 0.05, ¿cuál es su regla de decisión?
c) ¿Cuál es su conclusión respecto del programa de Calorie Watchers?
SOLUCIÓN:
1) 𝐻0 : 𝑃 ≤ 0.5 (no hay pérdida de peso como resultado del programa de Calorie Watchers
en los miembros del club)
𝐻𝑎 : 𝑃 > 0.5 (Si hay pérdida de peso como resultado del programa de Calorie Watchers
en los miembros del club)
2) 𝛼 = 0.05
3) Distribución binomial
n=n-1(sin cambio)=10, numero de éxitos=9
4) Regla de decisión
30
Gráfica de prob
0.25
0.20
0.15
prob
0.10
0.05
0.00
0 1 2 3 4 5 6 7 8 9 10
num_exitos
NÚMERO
PROBABILIDAD PROBABILIDAD
DE
DE ÉXITO ACUMULADA
ÉXITOS
0 0.001
1 0.010
2 0.044
3 0.117
4 0.205
5 0.246
6 0.205
7 0.117
8 0.044 0.055
9 0.010 0.011
10 0.001 0.001
31
3. Una muestra de 45 hombres con sobrepeso participo en un programa de ejercicio. Al término
del programa, 32 redujeron peso. Con un nivel de significancia de 0.05, .es posible concluir
que el programa es eficaz?
SOLUCIÓN:
1) 𝐻0 : 𝑃 ≤ 0.5
𝐻𝑎 : 𝑃 > 0.5
2) 𝛼 = 0.05
3) Muestra grande usamos distribución normal Z
4) Regla de decisión
Gráfica de distribución
Normal, Media=0, [Link].=1
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
0 1.645
X
Si 𝑍 ∈
𝑅𝐶 entonces rechazamos Ho y aceptamos Ha.
5) Calculo del estadístico.
N=45
Media=0.5n=22.5
32
2.2 Prueba de Kruskall Wallis
1. Los dulces más vendidos tienen muchas calorías. Los datos siguientes muestran el contenido
de calorías en muestras de M&M, Kit Kat y Milky Way II. Pruebe si hay una diferencia
significativa en el contenido de calorías de estos tres dulces. Emplee como nivel de
significancia 0.05, ¿cuál es su conclusión?
33
V. Calcular el estadístico:
MINITAB
34
2. La revista Condé Nast Traveler realiza cada año un estudio para evaluar los 80 principales
barcos cruceros del mundo (Condé Nast Traveler, febrero de 2006). A continuación se dan las
evaluaciones dadas a los cruceros de una muestra de las líneas Holland America, Princess y
RoyalCaribbean; la evaluación máxima es 100. Use la prueba de Kruskal-Wallis con α = 0.05
para determinar si hay diferencia significativa en las evaluaciones de los barcos de las tres
líneas.
Bibliografía: Anderson – Sweeney - Williams (2008), Estadística para administración y
Holland America Princess Royal Caribbean
SOLUCIÓN:
1)
2)𝛼 = 0.05
3) X2, H
4)
Gráfica de distribución
Chi-cuadrada; df=2
0.5
0.4
Densidad
0.3
0.2
0.1
0.05
0.0
0 5.991
X
35
5) Calculo del estadístico
H=4.19
𝐻 = 4.19
𝐻 ∈ 𝑅𝑎 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑜 𝑦 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑎
“No hay diferencia significativa en las evaluaciones de los barcos de las tres
líneas.”
36
2.3 Prueba de rango con signo de Wilcoxon
1. Dos servicios nocturnos de paquetería fueron probados; se formaron dos muestras idénticas, de
manera que a los dos servicios de paquetería se les notificara al mismo tiempo que se requerían
sus servicios. A continuación, se presentan los tiempos requeridos en cada entrega. ¿Estos datos
sugieren que existe diferencia entre los tiempos que requiere cada uno de estos servicios? Use
un nivel de significancia de 0.05.
SOLUCIÓN:
37
IV. Formular una regla de decisión:
V. Calcular el estadístico:
11 ∗ 12 ∗ 23
𝜎𝑡 = √ = 22.49
6
−22 − 0
𝑧= = −0.978
22.49
Zk ∈ R.A ⟶ Se acepta la hipótesis nula y se rechaza la hipótesis alternativa.
INTERPRETACIÓN: Se concluye que no existe diferencia entre los tiempos que
requiere cada uno de estos servicios.
38
2. Como parte de una investigación de mercado que tenía por objeto evaluar la efectividad de una
campaña de publicidad, se seleccionaron 10 ciudades para una prueba de mercado. Las ventas
en dólares en cada una de estas ciudades, en la semana anterior a la campaña, se registraron.
Después, se realizó la campaña durante dos semanas y se registraron las ventas que hubo en la
primera semana, inmediatamente después de la campaña.
SOLUCIÓN:
1)
Ho: Las poblaciones son idénticas con respecto a las ventas
Ha: Las poblaciones son diferentes con respecto a las ventas
2) α = 0.05
39
4)
Gráfica de distribución
Normal; Media=0; [Link].=1
0.4
Densidad 0.3
0.2
0.1
0.025 0.025
0.0
-1.960 0 1.960
X
5)
Ventas Ventas
RANGEO
antes de después
Ciudad DIF /DIF/ RANGEO CON
la de la
SIGNO
campaña campaña
Kansas
130 160 -30 30 10 -10
City
Dayton 100 105 -5 5 2.5 -2.5
Cincinnat
120 140 -20 20 9 -9
i
Columbu
95 90 5 5 2.5 2.5
s
Clevelan
140 130 10 10 4.5 4.5
d
Indianap
80 82 -2 2 1 -1
olis
40
𝑛(𝑛 + 1)(2𝑛 + 1)
𝜎𝜏 = √
6
10(11)(21)
𝜎𝜏 = √
6
𝜎𝜏 = 19.62
𝜇0 = 0
𝑇 − 𝜇0
𝑍𝐾 =
𝜎𝜏
−32 − 0
𝑍𝐾 =
19.62
𝑍𝐾 = −1.63
𝑍𝐾 ∈ 𝑅𝑎 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑜 𝑦 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑎
CONCLUSIÓN:
“Las poblaciones son idénticas con respecto a las ventas”
“Concluyo que la campaña publicitaria no ha tenido el suficiente impacto para incrementar mis
ventas”
41
2.4 Prueba de Mann Whitney Wilconxon
1. Los números de delitos por día reportados a la policía durante el verano y el invierno son los
siguientes. Use 0.05, como nivel de significancia, para determinar si existe una diferencia
significativa entre verano e invierno, en términos del número de crímenes reportados.
42
V. Calcular el estadístico:
𝑛1 = 10
𝑛2 = 10
𝑇𝑣 = 10(10 + 10 + 1) − 79
𝑇𝑣 = 131
MINITAB:
43
2. Para probar el efecto de dos aditivos sobre el rendimiento de la gasolina, siete automóviles usan
el aditivo 1 y nueve el aditivo 2. En los datos siguientes se presenta el rendimiento en millas
por galón obtenido con cada uno de los aditivos. Use 𝛼 = 0.05 y la prueba de MWW para
determinar si existe diferencia significativa en el efecto que tienen los 2 aditivos sobre el
rendimiento.
Bibliografía: Anderson – Sweeney - Williams (2008), Estadística para administración y
economía, 10a ed.
Aditivo 1 Aditivo 2
17.3 18.7
18.4 17.8
19.1 21.3
16.7 21.0
18.2 22.1
18.6 18.7
17.5 19.8
20.7
20.2
SOLUCION:
1. Ho : Las 2 poblaciones son idénticas con respecto al efecto que tienen los 2 aditivos sobre
el rendimiento
Ha: Las 2 poblaciones no son idénticas con respecto al efecto que tienen los 2 aditivos sobre
el rendimiento
2. 𝛼 = 0.05
3. MWW <10
4. Definir RA y RC
TL (0.05,7,9) = 41
TU=7 × (7 + 9 + 1) − 41 = 78
RC RC
RA
TL= 41 TU= 78
44
5. Calculo del estadístico
Aditivo 2
Aditivo 1
18.7 8.5
17.3 2
17.8 4
18.4 6
21.3 15
19.1 10
21.0 14
16.7 1
22.1 16
18.2 5
18.7 8.5
18.6 7
19.8 11
17.5 3
20.7 13
20.2 12
Tk =34
𝑇𝑘 ∈ RC → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑜 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
Se puede concluir que las 2 poblaciones no son idénticas con respecto al efecto que producen
los 2 aditivos sobre el rendimiento
3. Los hornos de microondas de una determinada marca se venden en Dallas y en San Antonio.
Los precios de presentan a continuación. Use 0.05 como nivel de significancia y pruebe si los
precios en Dallas y en San Antonio son los mismos.
45
SOLUCION:
1. Ho: Las poblaciones DALLAS y SAN ANTONIO son idénticas en términos de precios de
microondas.
Ha: Las poblaciones DALLAS y SAN ANTONIO no son idénticas en términos de precios
de microondas.
2. 𝛼 = 0.05
3. MWW ≥10
4. Definir RA y RC
1
𝜇𝑡 = ×10× 24 = 120
2
1
𝜎𝑡 = √ × 10 × 13 × 24 = 16.12
12
46
DALLAS SAN ANTONIO
489 23 451 17
485 22 479 21
439 13 475 20
436 12 429 7
420 4 434 10
TK=116
116 − 120
𝑍𝑘 = = −0,24
16.12
𝑍𝑘 ∈ RA → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑙𝑎 𝐻𝑎 𝑦 𝑎𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑜
Se concluye las poblaciones DALLAS y SAN ANTONIO son idénticas en términos de número de
crímenes reportados
47
2.5 Correlación de rangos
1. En un estudio realizado por Harris Interactive, Inc. se evaluaron las principales empresas de
Internet y se evaluó también su reputación. En la lista siguiente se muestra el ranking de 10
empresas de Internet en relación, por un lado, con su reputación y, por otro, con el porcentaje
de entrevistados que dijeron estar dispuestos a comprar acciones de esa empresa.
Solución:
A)
6 ∗ 54
𝑟𝑠 = 1 −
10(100 − 1)
𝑟𝑠 = 0.67
48
B)
V. Calcular el estadístico:
𝑢𝑟𝑠 = 0
1
𝜎𝑟𝑠 = √ = 0.33
10 − 1
0.67 − 0
𝑧= = 2.03
0.33
49
2. A continuación, se presenta el ranking de una muestra de golfistas profesionales respecto a
“driving distance” y “putting” ¿Cuál es la correlación por rangos entre “driving distance” y
“putting”?
Como nivel de significancia emplee α =0.10.
Bibliografía: Anderson-Sweeny-Williams 2008, Estadística para administración y economía,
10a ed.
SOLUCIÓN:
1)
Ho: p=0
Ha: p ≠0
2) α = 0.1
3) Z distribución normal
4)
Gráfica de distribución
Normal; Media=0; [Link].=1
0.4
0.3
Densidad
0.2
0.1
0.05 0.05
0.0
-1.645 0 1.645
X
50
5)
Golfista Driving
Putting di di2
profesional Distance
Fred Couples 1 5 -4 16
David Duval 5 6 -1 1
Ernie Els 4 10 -6 36
Nick Faldo 9 2 7 49
Tom Lehman 6 7 -1 1
Justin Leonard 10 3 7 49
Davis Love III 2 8 -6 36
Phil Mickelson 3 9 -6 36
Greg Norman 7 4 3 9
Mark O’Meara 8 1 7 49
∑ 282
∑ 𝑑𝑖 2
𝑟𝑠 = 1 − 6 ∗ [ ]
𝑛(𝑛2 − 1)
282
𝑟𝑠 = 1 − 6 ∗ [ ]
10(102 − 1)
𝑟𝑠 = −0.7
𝑢𝑟𝑠 = 0
1
𝜎𝑟𝑠 = √
𝑛−1
𝜎𝑟𝑠 = 0.33
𝑟𝑠 − 𝜇𝑟𝑠
𝑍=
𝜎𝑟𝑠
−0.7 − 0
𝑍= = −2.149
0.33
𝑍𝑘 ∈ 𝑅𝑐 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑜 𝑦 𝐴𝑐𝑒𝑝𝑡𝑜 𝑙𝑎 𝐻𝑎
51
III. SERIES DE TIEMPO
1. En la tabla siguiente se dan las cifras correspondientes a los últimos siete años, de asistencia
promedio a los juegos de futbol, en casa, de una universidad. Obtenga la ecuación para el
componente de tendencia lineal de esta serie de tiempo.
SOLUCIÓN:
t asistencia t2 ty
(y)
1 28000 1 28000
2 30000 4 60000
3 31500 9 94500
4 30400 16 121600
5 30500 25 152500
6 32200 36 193200
7 30800 49 215600
28 213400 140 865400
7 ∗ 865400 − 213400 ∗ 28
𝑏= = 421
7 ∗ 140 − 282
213400 28
𝑎= − 421 ∗ = 28800
7 7
𝑦 = 28800 + 421𝑡
52
MINITAB:
53
2. Se tiene los datos históricos del valor medio de las acciones de la empresa ALICORP S.A.A.
en la Bolsa de Valores de Lima (BVL) desde abril hasta mayo del 2017. Defina cuál es el mejor
modelo de tendencia que se podría ajustar. Si la tendencia de los últimos días se mantiene, ¿Es
conveniente invertir en las acciones de esta empresa?
54
SOLUCIÓN:
Tenemos la serie de tiempo del valor promedio del precio de acciones de ALICORP S.A.A.
7.90
7.85
ALICORP S.A.A.
7.80
7.75
7.70
7.65
7.60
4 8 12 16 20 24 28 32 36 40
Índice
Medidas de exactitud
7.85 MAPE 0.792755
ALICORP S.A.A.
MAD 0.061650
7.80 MSD 0.005187
7.75
7.70
7.65
7.60
4 8 12 16 20 24 28 32 36 40
Índice
55
Analizamos la tendencia Cuadrática:
Medidas de exactitud
7.85 MAPE 0.717798
ALICORP S.A.A.
MAD 0.055780
7.80 MSD 0.004266
7.75
7.70
7.65
7.60
4 8 12 16 20 24 28 32 36 40
Índice
Medidas de exactitud
7.85 MAPE 0.793180
ALICORP S.A.A.
MAD 0.061687
7.80 MSD 0.005204
7.75
7.70
7.65
7.60
4 8 12 16 20 24 28 32 36 40
Índice
56
Notamos que los MAD (Desviación Media Absoluta) es menor en:
TENDENCIA MAD
LINEAL 0.061650
CUADRATICA 0.055780
EXPONENCIAL 0.061687
MAPE 0.717798
7.80 MAD 0.055780
MSD 0.004266
7.75
7.70
7.65
7.60
4 8 12 16 20 24 28 32 36 40 44
Índice
“El valor actual de la acción para hoy 1/06/2017 es de 7.92, si la comprara para el día 2/06/2017
es de 7.82514 y bajaría en los siguientes días. Desde el punto de vista estadístico mediante la
proyección cuadrática, no me es conveniente invertir en esta acción”
57
3. A continuación, se dan las tasas de interés de bonos corporativos triple A en 12 meses
consecutivos.
9.5 9.3 9.4 9.6 9.8 9.7 9.8 10.5 9.9 9.7 9.6 9.6
a. Desarrolle promedios móviles de tres y cuatro meses para esta serie de tiempo. ¿Cuál de
los dos promedios proporciona el mejor pronóstico? Explique.
b. ¿Cuál es el pronóstico del promedio móvil para el mes próximo?
SOLUCIÓN:
a) Promedio móvil para tres meses
PROMEDIO MOVIL
Pronóstico
Tasa
promedio
Mes de
móvil orden
interés
3
1 9.5 -
2 9.3 9.4
3 9.4 9.433333333
4 9.6 9.6
5 9.8 9.7
6 9.7 9.766666667
7 9.8 10
8 10.5 10.06666667
9 9.9 10.03333333
10 9.7 9.733333333
11 9.6 9.633333333
12 9.6 -
58
Promedio móvil para cuatro meses
Pronóstico
Tasa de
Mes promedio móvil
interés
orden 4
1 9.5 -
2 9.3 -
9.45
3 9.4
9.525
4 9.6
9.625
5 9.8
9.725
6 9.7
9.95
7 9.8
9.975
8 10.5
9.975
9 9.9
9.925
10 9.7
9.7
11 9.6 -
12 9.6 -
El que representa el mejor pronóstico es el promedio móvil para 3 meses ya que presenta el
MAD de menor valor por lo tanto es mejor su pronóstico.
b. ¿Cuál es el pronóstico del promedio móvil para el mes próximo?
59
4. Los datos siguientes son los valores del índice Commodity Futures Index en 10 semanas: 7.35, 7.40,
7.55, 7.56, 7.60, 7.52, 7.52, 7.70, 7.62 y 7.55.
a. Dé los valores que se obtienen con el método de suavizamiento exponencial con α = 0.2.
b. Proporcione los valores que se obtienen con el método de suavizamiento exponencial con α
= 0.3.
c. ¿Cuál de los dos modelos anteriores proporciona mejores pronósticos? Dé el pronóstico para
la semana 11
SOLUCIÓN:
a.- Los valores que obtenemos en EXCEL con el método de suavizamiento con α = 0.2
es:
ALPHA 0.2
PRONOSTICO DE
Error del
Codificado VALOR DE LA SERIE SUAVIZACIAMIENTO
Pronostico
DE TIEMPO EXPONENCIAL
T Yt Fe
1 7.35 7.3500 0.0000
2 7.4 7.3500 0.0500
3 7.55 7.3600 0.1900
4 7.56 7.3980 0.1620
5 7.6 7.4304 0.1696
6 7.52 7.4643 0.0557
7 7.52 7.4755 0.0445
8 7.7 7.4844 0.2156
9 7.62 7.5275 0.0925
10 7.55 7.5460 0.0040
11 7.5468
60
Gráfica de suavización para VALOR DE LA SERIE DE TIEMPO
Método exponencial simple
Variable
7.7
A ctual
A justes
Medidas de exactitud
MA PE 1.04515
MA D 0.07887
7.5 MSD 0.00940
7.4
7.3
1 2 3 4 5 6 7 8 9 10
Índice
b.- Los valores que obtenemos en EXCEL con el método de suavizamiento con α = 0.3 son:
ALPHA 0.3
PRONOSTICO DE
Error del
VALOR DE LA SERIE SUAVIZACIAMIENTO
Pronostico
DE TIEMPO EXPONENCIAL
T Yt Fe
1 7.35 7.3500 0.0000
2 7.4 7.3500 0.0500
3 7.55 7.3650 0.1850
4 7.56 7.4205 0.1395
5 7.6 7.4624 0.1377
6 7.52 7.5036 0.0164
7 7.52 7.5086 0.0114
8 7.7 7.5120 0.1880
9 7.62 7.5684 0.0516
10 7.55 7.5839 -0.0339
11 7.5737
61
El proceso usado es el siguiente:
𝐹1 = 𝑌1
𝐹2 = 𝛼 ∗ 𝑌1 + (1 − 𝛼) ∗ 𝐹1
𝐹3 = 𝛼 ∗ 𝑌2 + (1 − 𝛼) ∗ 𝐹3
𝐹4 = 𝛼 ∗ 𝑌3 + (1 − 𝛼) ∗ 𝐹4
Y así sucesivamente: hasta pronosticar el valor 11 que nos da: 7.5737
Constante de suavización
7.6 Alfa 0.3
Medidas de exactitud
MAPE 1.02990
MAD 0.07771
7.5 MSD 0.00900
7.4
7.3
1 2 3 4 5 6 7 8 9 10
Índice
ALPHA ALPHA
0.2 0.3
0.0000 0.0000
0.0500 0.0500
0.1900 0.1850
0.1620 0.1395
0.1696 0.1377
0.0557 0.0164
0.0445 0.0114
0.2156 0.1880
0.0925 0.0516
0.0040 -0.0339
0.9840 0.7457
∑ ∑
Como podemos ver el que tiene menor error es con el suavizamiento con α = 0.3. Por lo cual la
mejor aproximación será para un T 11 de 5.5737
62