0% encontró este documento útil (0 votos)
74 vistas51 páginas

Cuestionario de Estadística: Regresión y Pruebas

Cargado por

jsandrade5
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
74 vistas51 páginas

Cuestionario de Estadística: Regresión y Pruebas

Cargado por

jsandrade5
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

INGENIERÍA MECATRÓNICA

ASIGNATURA:

ESTADÍSTICA

TEMA:

CUESTIONARIO N° 03.

UNIDAD III.

ALUMNO:

• Alejandro Andrade

DOCENTE:

ING. CESAR OLOVACHE M.

NRC: 13544

LATACUNGA 28/08/2024
Cuestionario No. 03
UNIDAD III:
MODELOS DE REGRESIÓN Y PRUEBAS NO PARAMÉTRICAS
1. Durante las primeras 13 semanas de la temporada de televisión, se
registraron las audiencias de sábado por la noche, de 8:00pm a 9:00pm,
como sigue: ABC 29%, CBS 28%, NBC 25% y otros 18%. Dos
semanas después, una muestra de 300 hogares arrojó los siguientes
resultados de audiencia: ABC 95 hogares, CBS 70 hogares, NBC 89
hogares y otros 46 hogares. ¿Han cambiado las proporciones de
telespectadores?
Paso 1: Formular las hipótesis

• Hipótesis nula (H0 ): Las proporciones de telespectadores no


han cambi- ado.
• Hipótesis alternativa (Ha ): Las proporciones de telespectadores
han cam- biado.

Paso 2: Calcular las frecuencias esperadas

Frecuencia esperada ABC = 0.29 × 300 =


87
Frecuencia esperada CBS = 0.28 × 300 =
84
Frecuencia esperada NBC = 0.25 × 300 =
75
Frecuencia esperada Otros = 0.18 × 300 =
54
Paso 3: Calcular el estad´ıstico Chi-cuadrado
Σ (Oi −
χ =
2
Ei)2

Ei

El valor calculado de χ2 es aproximadamente 3.459 con un valor p de 0.326. Como


p > 0.05, no rechazamos la hipótesis nula, lo que sugiere que no hay evidencia
suficiente para afirmar que las proporciones de telespectadores han cambiado.

2
2. La empresa m&m, fabricantes de los chocolates, patrocinó una encuesta
nacional en la que más de 10 millones de personas indicaron su preferencia para
un color nuevo. El conteo de esta encuesta dio como resultado el reemplazo del
color chocolate por un nuevo color azul, la distribución de chocolates es como
sigue:

Café Amarillo Rojo Naranja Verde Azul


30% 20% 20% 10% 10% 10%

Empresa M&M
35%

30%

25%

20%

15%

10%

5%

0%
Café Amarillo Rojo Naranja Verde Azul

Porcentaje Columna1 Columna2

𝐻0: 𝑝𝐴 = 0.30, 𝑝𝐵 = 0.20, 𝑝𝑐 = 0.20, 𝑝𝐷 = 0.10, 𝑝𝐸 = 0.10 𝑦 𝑝𝑓 = 0.10

3. En un estudio que apreció en una revista se usaron muestras de bolsas de 1 lb


para determinar si eran válidos los porcentajes publicados. Se obtuvieron los
siguientes resultados con una muestra de 506 chocolates.

3
¿Estos datos respaldan lo que publicó la empresa

𝐻𝑜: 𝑝𝐶𝑎𝑓𝑒 = 0. 30, 𝑝𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑜 = 0. 20, 𝑝𝑅𝑜𝑗𝑜 = 0. 20, 𝑝𝑁𝑎𝑟𝑎𝑛𝑗𝑎 = 0. 10, 𝑝𝑉𝑒𝑟𝑑𝑒
= 0. 10, 𝑝𝐴𝑧𝑢𝑙 = 0. 10
𝐻𝑜: 𝑝𝐶𝑎𝑓𝑒 ≠ 0. 30, 𝑝𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑜 ≠ 0. 20, 𝑝𝑅𝑜𝑗𝑜 ≠ 0. 20, 𝑝𝑁𝑎𝑟𝑎𝑛𝑗𝑎 ≠ 0. 10, 𝑝𝑉𝑒𝑟𝑑𝑒
≠ 0. 10, 𝑝𝐴𝑧𝑢𝑙 ≠ 0. 10

𝑦2:
𝑦2 = (0.3)(506) = 151.8
𝑦2 = (0.2)(506) = 101.2
𝑦2 = (0.2)(506) = 101.2
𝑦2 = (0.1)(506) = 50.6
𝑦2 = (0.1)(506) = 50.6

∑(𝑦1 − 𝑦2)2
𝑋𝐶2 = = 29.5138
𝑦2
𝑔𝑙 = (6 − 1)(2 − 1) = 5
∝= 5%
𝑋𝑇2 = 11.07

𝑋𝐶2 > 𝑋𝑇2


𝐴𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝐻1: 𝐿𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑟𝑒𝑠𝑝𝑎𝑙𝑑𝑎𝑛 𝑙𝑜 𝑝𝑢𝑏𝑙𝑖𝑐𝑎𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎 𝑒𝑚𝑝𝑟𝑒𝑠𝑎.

4
4. Una de las preguntas del estudio de suscriptores fue: “Al hacer inversiones,
¿emplea usted empresas de correduría de servicio completo o minoristas?” Los
resultados de la encuesta indicaron que 264 encuestados emplean sólo empresas
de servicio completo, 255 emplean sólo empresas minoristas con descuento y 229
emplean ambas clases de empresas. Use un nivel de significancia de 10% y
determine si hay tres diferentes preferencias entre las tres operaciones de
servicio
1) 𝐻𝑜: 𝑁𝑜 ℎ𝑎𝑦 𝑡𝑟𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑡𝑟𝑒𝑠 𝑜𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒
𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜 𝐻𝑖: 𝑆𝑖 ℎ𝑎𝑦 𝑡𝑟𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑡𝑟𝑒𝑠
𝑜𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜

2) Frecuencias observadas

Si No
Servicio Completo 264 26 290
Empresas minoristas con 255 35 290
descuentos
Ambas empresas 229 26 255
748 87 835

3) Frecuencias estimadas
Si No
Servicio completo 259.7844 30.2156
Empresas minoristas con 259.7844 30.2156
descuentos
Ambas empresas 228.4311 26.5689

4) Obtención 𝑿𝒄 𝟐
𝒇𝒊 − 𝒇𝒆 (𝒇𝒊 − 𝒇𝒆)𝟐 (𝒇𝒊 − 𝒇𝒆)𝟐⁄
𝒇𝒆
Servicio completo – Si 4.2156 17.7713 0.0684
Empresas minoristas con -4.7844 22.8905 0.0881
descuentos – Si
Ambas empresas – Si 0.5689 0.3236 0.0014
Servicio completo – No -4.2156 17.7713 0.5881

5
Empresas minoristas con 4.7844 22.8905 0.7576
descuentos – No
Ambas empresas - No -0.5689 0.3236 0.0122
Total 1.5158

(𝒇𝒊−𝒇𝒆)𝟐
8) 𝑿𝒄 𝟐 = ∑ = 𝟏. 𝟓𝟏𝟓𝟖
𝒇𝒆

9) 𝒈𝒍 = (𝟑 − 𝟏)(𝟐 − 𝟏) = 𝟐
∝= 𝟏𝟎%
𝒙𝑻 𝟐 = 𝟒. 𝟔𝟏
10) 𝒙𝒄 𝟐 < 𝒙𝑻 𝟐 se acepta 𝑯𝟎
11) No hay tres diferentes preferencias entre las tres operaciones de servicio
25. Tres cadenas de supermercados del área de Denver, Colorado, afirman tener
los precios más bajos. Como parte de un estudio de investigación sobre la
publicidad de los supermercados, el Denver Daily News realizó un estudio.
Primero seleccionó una muestra aleatoria de nueve artículos. Luego, verificó el
precio de cada artículo

La hipótesis que se quiere probar es:


𝐻0 = 𝑢1 = 𝑢2 = 𝑢3
𝐻1 = 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒s

6
Recordar que la hipótesis nula 𝐻𝑂 es rechazada al nivel de significancia 𝖺 cuando es
verdadero que:
𝑓 > 𝑓𝑎[𝑘 − 1, 𝑘(𝑛 − 1)]
Comparando:
12.66>3.70 Verdadero
Conclusión: Se rechaza 𝐻𝑂 y se concluye que las medias de los grupos son diferentes,
por lo tanto, el tipo de experiencia si es significativa.
5. Se reconoce que las actividades negativas son un método efectivo de persuasión
en la publicidad. Un estudio que apareció en una revista informó los resultados
de un análisis de contenido en anuncios con actitud de culpa en 24 revistas. La
cantidad de anuncios con actitudes de culpa, que aparecieron en ellas, es la
siguiente:

Tipo de revista Cantidad de anuncios


Noticias y opinión 20
Editorial general 15
Orientadas a la familia 30
Negocios y financieras 22
Orientadas hacia la
16
mujer
Afroamericanos 12
Total 115

Pruebe, con un nivel de significancia de 10% si hay una diferencia en la proporción


de anuncios con actitudes de culpa que se publican en las 6 clases de revistas.
𝑯𝟎 : Las proporciones de anuncios con actitudes de culpa son iguales en todas las categorías de revist
𝑯𝟏 : Al menos una de las proporciones de anuncios con actitudes de culpa es diferente.

7
Cálculo de frecuencias esperadas:
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑶𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂𝒔
𝑬=
𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒕𝒆𝒈𝒐𝒓í𝒂𝒔
𝟏𝟏𝟓
𝑬= = 𝟏𝟗. 𝟏𝟔𝟕
𝟔
(𝟐𝟎 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟏 = = 𝟎. 𝟎𝟑𝟔
𝟏𝟗. 𝟏𝟕
(𝟏𝟓 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟐 = = 𝟎. 𝟗𝟎𝟕
𝟏𝟗. 𝟏𝟕
(𝟑𝟎 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟑 = = 𝟔. 𝟏𝟏𝟖
𝟏𝟗. 𝟏𝟕
(𝟐𝟐 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟒 = = 𝟎. 𝟒𝟏𝟕
𝟏𝟗. 𝟏𝟕
(𝟏𝟔 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟓 = = 𝟎. 𝟓𝟐𝟓
𝟏𝟗. 𝟏𝟕
𝒙𝟐𝑪𝑨𝑳 = 𝟎. 𝟎𝟑𝟔 + 𝟎. 𝟗𝟎𝟕 + 𝟔. 𝟏𝟏𝟖 + 𝟎. 𝟒𝟏𝟕 + 𝟎. 𝟓𝟐𝟓 = 𝟏𝟎. 𝟔𝟖𝟕
Grados de Libertad:
𝑵𝑪 = 𝟗𝟎%
𝜶 = 𝟏𝟎% = 𝟎. 𝟏
𝒈𝑳 = 𝒌 − 𝟏 = 𝟔 − 𝟏 = 𝟓

𝒙𝟐𝑻 = 𝟗. 𝟐𝟒

𝒙𝟐𝑪𝑨𝑳 > 𝒙𝟐𝑻


𝟏𝟎. 𝟔𝟖𝟕 > 𝟗. 𝟐𝟒
∴ 𝑺𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝒍𝒂 𝒉𝒊𝒑ó𝒕𝒆𝒔𝒊𝒔 𝒏𝒖𝒍𝒂. 𝑬𝒔𝒕𝒐 𝒏𝒐𝒔 𝒅𝒊𝒄𝒆 𝒒𝒖𝒆 𝒉𝒂𝒚 𝒖𝒏𝒂 𝒅𝒊𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒔𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒗𝒂 𝒆𝒏 𝒍𝒂
𝒅𝒆 𝒂𝒏𝒖𝒏𝒄𝒊𝒐𝒔 𝒄𝒐𝒏 𝒂𝒄𝒕𝒊𝒕𝒖𝒅𝒆𝒔 𝒅𝒆 𝒄𝒖𝒍𝒑𝒂 𝒆𝒏𝒕𝒓𝒆 𝒍𝒂𝒔 𝒅𝒊𝒇𝒆𝒓𝒆𝒏𝒕𝒆𝒔 𝒕𝒊𝒑𝒐 𝒅𝒆 𝒓𝒆𝒗𝒊𝒔𝒕𝒂𝒔.

6. A continuación, se presentan las preferencias de grupos de consumidores hacia


tres aparadores de tienda.

8
Pruebe si hay alguna diferencia de preferencias hacia los tres aparadores
• 𝑯𝟎 : 𝑳𝒂 𝒑𝒓𝒆𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆 𝒄𝒐𝒏𝒔𝒖𝒎𝒊𝒅𝒐𝒓𝒆𝒔 𝒆𝒔 𝒍𝒂 𝒎𝒊𝒔𝒎𝒂 𝒑𝒂𝒓𝒂 𝒄𝒂𝒅𝒂
𝒂𝒑𝒂𝒓𝒂𝒅𝒐𝒓.
• 𝑯𝟏 : 𝑳𝒂 𝒑𝒓𝒆𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆 𝒍𝒐𝒔 𝒄𝒐𝒏𝒔𝒖𝒎𝒊𝒅𝒐𝒓𝒆𝒔 𝒏𝒐 𝒆𝒔 𝒍𝒂 𝒎𝒊𝒔𝒎𝒂 𝒑𝒂𝒓𝒂 𝒄𝒂𝒅𝒂
𝒂𝒑𝒂𝒓𝒂𝒅𝒐𝒓.

Nivel de significación de la prueba: 0,05


(𝐹0 − 𝐹𝑒 )2
𝑥𝑐2 = ∑
𝐹𝐸
Regiones críticas y criterios de decisión:

Si 𝑥𝑐2 , es mayor que 5,991: se rechaza 𝐻𝑜


Cálculos
Aparador Fo Fe (𝑭𝟎 − 𝑭𝒆 )𝟐
𝑭𝑬
A 43 45 0,0889
B 53 45 1,4222
C 39 45 0,8000
TOTAL 135 135 2,3111

(𝐹0 − 𝐹𝑒 )2
𝑥𝑐2 = ∑ = 2,3111
𝐹𝐸

9
Conclusión
• Como 𝑥𝑐2 es menor que 5,9915 acepto 𝐻𝑜
• Bajo un nivel de significación del 5% no podemos afirmar que las preferencias de
los consumidores a los aparadores A, B y C son las mismas.

7. ¿Qué también sirven a sus clientes las aerolíneas? En un estudio se observaron las
siguientes evaluaciones por parte de los clientes, 3% excelente, 28% bueno, 45%
regular y 24% malo. En un estudio de seguimiento del servicio que ofrecen las
compañías telefónicas, suponga que en una muestra de 400 adultos se encontró
que las evaluaciones fueron las siguientes: 24 le dieron la calificación de excelente,
124 bueno, 172 regular y 80 malo. Pruebe con un nivel de significancia de 1%. ¿La
distribución de las evaluaciones de los clientes para las compañías telefónicas
difieren de la distribución de las evaluaciones de los clientes de las aerolíneas?

Formular las hipótesis

𝐻0 : La distribución de las evaluaciones de los clientes para las compañías telefónicas es la


misma que la distribución de las evaluaciones de los clientes de las aerolíneas.

𝐻1 : La distribución de las evaluaciones de los clientes para las compañías telefónicas


difiere de la distribución de las evaluaciones de los clientes de las aerolíneas

Datos:

𝑎 = 𝟏% → 𝟎, 𝟎𝟏
𝒇 𝒉𝒊𝒑 𝒇𝒊 𝒆𝒊 𝟐

Excelente 24 12 12

3%
Bueno 28% 124 112 1.2857

Regular 172 180 0.3555

45%

10
Malo 24% 80 96 2,6666

TOTAL 16,3078

(𝑘 − 1) = 𝑥 2

(4 − 1) = 16,3078

3 = 16,3078

𝑥 2 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜

𝛼 = 1% → 0,01

𝑥 2 = 11,34

1𝟔, 𝟑𝟎𝟕𝟖 < 𝟏𝟏, 𝟑𝟒 →∴ 𝑹𝒆𝒄𝒉𝒂𝒛𝒐 𝑯𝒐

Conclusión: Dado que el resultado sobre pasa el punto crítico, se puede concluir que se
rechaza la hipótesis nula y se acepta la hipótesis alternativa; además que las distribuciones
de las evaluaciones de los clientes para las compañías telefónicas se difieren de la
distribución de las evaluaciones de los clientes de aerolíneas.

11
8. Para establecer cuotas de ventas, el gerente de mercadotecnia supone que los
potenciales de pedidos son iguales para cada uno de cuatro territorios de ventas.
Una muestra de 200 ventas, que vemos en la tabla siguiente, indica las cantidades
de pedidos en los territorios. ¿Debe rechazarse la hipótesis del gerente?

Territorios de ventas
I II III IV
60 45 59 36

ANALISIS DE VARIANZAS ANOVA


𝑦 𝑥1 𝑥2 𝑥21 𝑥22 𝑥1 ∗ 𝑥1 ∗ 𝑥2 ∗ 𝑦
𝑥2 𝑦
34 30 23 900,00 529,00 690,00 1020,00 782,00
24 31 28 961,00 784,00 868,00 744,00 672,00
36 34 28 1156,00 784,00 952,00 1224,00 1008,00
39 23 30 529,00 900,00 690,00 897,00 1170,00
32 27 31 729,00 961,00 837,00 864,00 992,00
165 145 140 4275,00 3958,00 4037,00 4749,00 4624,00

Sumatoria de los
cuadrados
Totales
𝑦 𝑥1 𝑥2 𝑦𝑖 − ̅𝑦 𝑆𝐶𝑇 = (𝑦𝑖
− 𝑦̅)
34 30 23 1,00 1,00
24 31 28 -9,00 81,00
36 34 28 3,00 9,00
39 23 30 6,00 36,00
32 27 31 -1,00 1,00
165 145 140 128,00

12
el valor de Sumatoria de los
y cuadrados del
estimado error
̂𝑦 𝑦−
𝑦 𝑆𝐶𝐸 = (𝑦

6047,06 -6013,06 36156890,56
4178,34 -4154,34 17258540,84
4386,48 -4350,48 18926676,23
2848,06 -2809,06 7890818,08
2737,96 -2705,96 7322219,52
87555145,23

TABLA DE ANOVA
Fuente de Suma Grados Cuadrado 𝐹𝐶𝐴𝐿 𝐹𝑇𝐴𝐵 𝑜
Variabilid de de s Medios
𝐹𝐶𝑅
ad Cuadra liberta
dos d
Regresión 87546920,9 2 43773460,4
1 6 4,50 4,26
Error 87555145,2 9 9728349,47
3
Total 128,00 11

21. Jacob Lee es un viajero frecuente entre Los Ángeles y San Francisco. El mes
pasado, anotó los tiempos de vuelo en tres aerolíneas distintas. Los resultados son:

13
a) Utilice el nivel de significancia de 0.05 y el proceso de prueba de hipótesis de
cinco pasos para comprobar si existen diferencias entre los tiempos medios de
vuelo de las tres aerolíneas.

ANÁLISIS DE VARIANZAS DE UN FACTOR


RESUMEN
GRUPOS CUENTA SUMA PROMEDIO VARIANZA
Goust 14 707 50,5 19,9615385
Jet Red 14 729 52,0714286 14,6868132
Cloudtran 7 390 55,7142857 36,5714286

ANÁLISIS DE VALOR
VARIANZA SUMA GL PROMEDI F PROBABILIDA CRÍTICO
O D
Origen de las 127,114286 2 63,557142 3,0362124 0,06203418 3,29453681
variaciones 9 1 6
Entre grupos 669,857143 32 20,933035
7
Dentro de los grupos

Total 796,971429 34

NIVEL DE FACTOR RESPUESTA


TIEMPOS DE
AEROLINEAS VUELO RESIDUOS
1 51 0,5

14
1 51 0,5
1 52 1,5
1 42 -8,5
1 51 0,5
1 57 6,5
1 47 -3,5
1 47 -3,5
1 50 -0,5
1 60 9,5
1 54 3,5
1 49 -1,5
1 48 -2,5
1 48 -2,5
2 50 -2,07142857
2 53 0,92857143
2 52 -0,07142857
2 62 9,92857143
2 53 9,92857143
2 49 -3,07142857
2 50 -2,07142857
2 49 -3,07142857
2 58 5,92857143
2 54 1,92857143
2 51 -1,07142857
2 49 -3,07142857
2 49 -3,07142857
2 50 -2,07142857
3 52 -3,71428571
3 55 -0,71428571
3 60 4,28571429
3 64 8,28571429
3 61 5,28571429
3 49 -6,71428571
3 49 -6,71428571
9. El 7% de inversionistas de fondos de ahorros valoran como "muy seguras" a las
acciones corporativas, 58% las define como "algo seguras", 24% como "no muy
seguras", 4% como "definitivamente inseguras" y 7% no tienen opinión
definida. En una encuesta se preguntó a 529 inversionistas de fondos de ahorro
cómo creen que es la seguridad de los bonos corporativos. Se obtuvieron las
respuestas siguientes:

15
Concepto De Proporción
Seguridad
Muy Seguras 0.07 48 37.03 10.97 120.3409 3.2498
Algo Seguras 0.58 323 306.82 16.18 261.7924 0.8532
No Muy Seguras 0.24 79 126.96 - 2300.1616 18.1172
47.96
Definitivamente 0.07 16 37.03 - 442.2609 11.9433
Inseguras 21.03
Sin Opinión Definida 0.04 63 21.16 41.84 1750.5856 82.7309
Total 1 529 116.8945

Prueba de hipótesis
𝐻𝑜: 𝐻𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑛𝑐𝑒𝑝𝑡𝑜𝑠 𝑑𝑒
𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑.
𝐻1: 𝑁𝑜 ℎ𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑛𝑐𝑒𝑝𝑡𝑜𝑠 𝑑𝑒
𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑.
Grados de libertad:
𝑔𝐿 = 𝑘 − 1
𝑔𝐿 = 5 − 1 = 4
Significancia α= 5%.

16
Determinar 𝑥𝑇2 =?
𝑥𝑇2 = 7.49
Determinar el estadístico calculados 𝑥𝐶2 =?
(𝐹𝑂 − 𝐹𝐸)2
𝑥𝐶2 = ∑
𝐹𝐸
𝑥𝐶2 = 116.8945
𝑥𝐶2 > 𝑥𝑇2
∴𝑅𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑂
La hipótesis nula se rechaza ya que el Chi-cuadrado calculado (116.89) supera al crítico
(9.49), indicando diferencias significativas en la percepción de seguridad de los
inversionistas
10. Se desea abrir un parque público. Se ha pedido a una muestra de 140 personas
decir que día preferirían visitarlo. A continuación, vemos los resultados.

Entre semana Sábado Domingo Día feriado


20 20 40 60

Para establecer un plan de personal. ¿debe suponer el gerente que habrá la misma
cantidad de visitantes todos los días? Base su conclusión en una prueba estadística
con a=0.05.

𝑺𝒐𝒍𝒖𝒄𝒊ó𝒏:
𝐻𝑜 ∶ 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑠𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
𝐻1 ∶ 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑠𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.

17
Grados de libertad:
𝒈𝑳 = 𝒌 − 𝟏
𝑔𝐿 = 4 − 1 = 3
𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝛼 = 5%.
𝐷𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟 𝑥𝑇2 = ?
𝑥𝑇2 = 7,81
𝐷𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟 𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑥𝐶2

𝑁𝑜 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑠𝑒𝑟á 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
11. A una autoridad regional de transporte colectivo le preocupa el número de
pasajeros en una de las rutas de autobús. Al definir la ruta se creía que el
número de pasajeros era el mismo de lunes a viernes. Con los datos de la tabla
siguiente pruebe, con a = 0.05 si es correcta la hipótesis de la autoridad.

𝐻𝑜 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑠𝑎𝑗𝑒𝑟𝑜𝑠 𝑛𝑜 𝑒𝑠 𝑒𝑙 𝑚𝑖𝑠𝑚𝑜 𝑑𝑒 𝑙𝑢𝑛𝑒𝑠 𝑎 𝑣𝑖𝑒𝑟𝑛𝑒𝑠.


𝐻1 : 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑠𝑎𝑗𝑒𝑟𝑜𝑠 𝑒𝑠 𝑒𝑙 𝑚𝑖𝑠𝑚𝑜 𝑑𝑒 𝑙𝑢𝑛𝑒𝑠 𝑎 𝑣𝑖𝑒𝑟𝑛𝑒𝑠.

18
𝛼 = 0.05

La frecuencia esperada por celda es de 18.

𝑔𝐿 = 4 − 1 = 3 → 𝑝 = 0.114

0.114 > 0.05

Se rechaza Ho, por ende se acepta H1 y se entiende con un nivel de confianza del 95%,
que el número de pasajeros es el mismo de lunes a viernes.

12. . Los resultados de la Encuesta anual de satisfacción en el trabajo, indicaron que


28% de los gerentes de sistemas de información está muy satisfecho con su
trabajo, 46% medianamente satisfecho, 12% no está satisfecho ni insatisfecho,
10% está medianamente insatisfecho y 4% está muy insatisfecho. Suponga que
en una muestra de 500 programadores se obtuvieron los siguientes resultados.

CATEGORIA CANTIDAD
Muy satisfactorio 105

19
Medianamente satisfactorio 235
Ni satisfechos Ni insatisfechos 55
Medianamente insatisfechos 90
Muy insatisfechos 15

Haga una prueba con a = 0.05 para determinar si la satisfacción de los programadores es
diferente de la de los gerentes de sistemas de información.
Usamos la prueba de PRUEBA U DE MANN - WHITNEY
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2

∑ 𝑅1 = 28

∑ 𝑅1 = 27

PRUEBA U DE MANN - WHITNEY


Programadores Gerentes MUESTRA MUESTRA JERARQUIA JERARQUIA
n 𝑥 𝑦 JERARQUIA
UNICA ORDENADA 𝑅1 𝑅2
Muy satisfactorio 105 140 105 15 1 1 7 8
Medianamente satisfactorio 235 230 235 20 2 2 10 9
Ni satisfechos Ni insatisfechos 55 60 55 50 3 3 4 5
Medianamente insatisfechos 90 50 90 55 4 4 6 3
Muy insatisfechos 15 20 15 60 5 5 1 2
140 90 6 6 28 27
230 105 7 7
60 140 8 8
50 230 9 9
20 235 10 10

∑ 𝑅1 = 28

∑ 𝑅1 = 27

𝑛1 = 5
𝑛2 = 5

20
5 ∗ (5 + 1)
𝑈1 = 5 ∗ 5 + − 28 = 12
2
5 ∗ (5 + 1)
𝑈2 = 5 ∗ 5 + − 27 = 13
2
𝑈𝐶𝐴𝐿 = 12
𝛼 = 0.025

𝑈𝑇𝐴𝐵 = 2
𝑈𝐶𝐴𝐿 > 𝑈𝑇𝐴𝐵
Se rechaza H0
Se acepta 𝐻1 : 𝜇1 ≠ 𝜇2 . La satisfacción de los programadores SI es diferente de la de los
gerentes de sistemas de información.

13. Una muestra de partes suministró los datos de la siguiente tabla de contingencias
acerca de la calidad de parte y de turno en que fue producida.

21
Use a = 0.05 y pruebe la hipótesis de que la calidad de las partes es independiente del
turno en que fueron producidas. ¿Cuál es su conclusión?
Requerimos saber si realizar la prueba del Chi cuadrado, en donde se tiene:
Frecuencia observada 𝑂
La frecuencia esperada 𝐸
𝐹𝑖𝑙𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 ∗ 𝐶𝑜𝑙𝑢𝑚𝑛𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 (𝐸 − 𝑂 )2
𝐸 = = 𝑋2
𝑆𝑢𝑚𝑎 𝑇𝑜𝑡𝑎𝑙 𝐸
𝑔𝐿 = (𝑁°𝑑𝑒𝑓𝑖𝑙𝑎𝑠 − 1) ∗ (𝑁°𝑑𝑒𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1)
𝑔𝐿 = (3 − 1) ∗ (2 − 1) = 2

𝑋𝑡𝑎𝑏 = 5.9915

22
(400 ∗ 829)
𝐸1,1 = = 368.444
900
(400 ∗ 71)
𝐸1,2 = = 31.556
900
(300 ∗ 829)
𝐸2,1 = = 276.333
900
(300 ∗ 71)
𝐸2,2 = = 23.667
900
(200 ∗ 829)
𝐸1,1 = = 3184.222
900
(200 ∗ 71)
𝐸1,1 = = 15.778
900

23
(𝐹𝑜 − 𝐹𝑒)2 (368 − 368.444)2 (32 − 31556)2 (285 − 276.333)2
𝑋𝑐𝑎𝑙 = ∑ = + + +
𝐹𝑒 368.444 31.556 276.333
(15 − 23.667)2 (176 + 184.222)2 (24 − 15.778)2
+ + = 8.1041
23.667 184.222 15.778

𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜 𝑦 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻 𝑖 ∴ 𝑙𝑎 𝑐𝑎𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎𝑠 𝑝𝑎𝑟𝑡𝑒𝑠 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒𝑙


𝑡𝑢𝑟𝑛𝑜 𝑒𝑛 𝑒𝑙 𝑞𝑢𝑒 𝑓𝑢𝑒𝑟𝑜𝑛 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑎.

14. Los siguientes datos corresponden a la altura (pulgadas) y peso (libras) de


nadadoras:

24
Si la altura de una nadadora es 63 pulgadas, ¿cuál sería el peso que usted le estimaría?
Estimación por Regresión lineal simple:

REGRESION LINEAL SIMPLE - MINIMOS CUADRADOS


Regresion Lineal Simple Minimos Cuadrados
xi yi 𝑥 ∗ 𝑦 𝑥2 𝑥 −𝑥 𝑦 − 𝑦 (𝑥 −𝑥 )(𝑦 −𝑦 ) (𝑥 −𝑥 )2 (𝑦 −𝑦 ) 2
68 132 8976 4624 3,0000 15,0000 45,0000 9,0000 225,0000
64 108 6912 4096 -1,0000 -9,0000 9,0000 1,0000 81,0000
62 102 6324 3844 -3,0000 -15,0000 45,0000 9,0000 225,0000
65 115 7475 4225 0,0000 -2,0000 0,0000 0,0000 4,0000
66 128 8448 4356 1,0000 11,0000 11,0000 1,0000 121,0000
∑ 325,0000 585,0000 38135,0000 21145,0000 110,0000 20,0000 656,0000
𝑥 = 65,0000 𝑦 =117,0000 |
5

Regresion lineal
∑𝑥 ∑𝑦 Regresion lineal
∑ 𝑥𝑦 −
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
2 (∑ 𝑥)2 𝑦 = 𝑚𝑥 + 𝑏
∑𝑥 − 𝑥= 63
𝑛
𝑚 = 5,5000 𝑏 =-240,5000 𝑦 = 5,5000 X -240,5000 𝑦= 106

∑𝑥∑𝑦 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥𝑦 −
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
( ∑ 𝑥)2
∑ 𝑥2 − 𝑦 = 5.5 𝑥 − 240.5
𝑛 𝑏 = 117 − 5.5*65
325 ∗ 585 𝑏 = −240.5
38135 − 𝑦 = 5.5 ∗ 63 − 240.5
𝑚= 5
(325)2
21145 − 𝑦 = 106
5

𝑚 = 5.5

25
𝐸𝑙 𝑝𝑒𝑠𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎 𝑛𝑎𝑑𝑎𝑑𝑜𝑟𝑎 𝑑𝑒 63 𝑝𝑢𝑙𝑔𝑎𝑑𝑎𝑠 𝑒𝑠 𝑑𝑒 106 𝑙𝑖𝑏𝑟𝑎𝑠.

15. Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de
publicidad (en millones de dólares) para 7 marcas participantes de refrescos.

Prediga las ventas para una marca que gaste 70 millones de dólares en publicidad.
Estimación por Regresión lineal simple:

REGRESION LINEAL SIMPLE - MINIMOS CUADRADOS


Regresion Lineal Simple Minimos Cuadrados
xi yi 𝑥 ∗ 𝑦 𝑥2 𝑥 −𝑥 𝑦 − 𝑦 (𝑥 −𝑥 )(𝑦 −𝑦 ) (𝑥 −𝑥 )2 (𝑦 −𝑦 ) 2
131,30 1929,20 253304 17240 71,2143 1077,9571 76765,9480 5071,4745 1161991,6018
92,40 1384,60 127937 8538 32,3143 533,3571 17235,0551 1044,2131 284469,8418
60,40 811,40 49009 3648 0,3143 -39,8429 -12,5220 0,0988 1587,4533
55,70 541,50 30162 3102 -4,3857 -309,7429 1358,4437 19,2345 95940,6376
40,20 536,90 21583 1616 -19,8857 -314,3429 6250,9322 395,4416 98811,4318
29,00 535,60 15532 841 -31,0857 -315,6429 9811,9837 966,3216 99630,4133
11,60 219,50 2546 135 -48,4857 -631,7429 30630,5037 2350,8645 399099,0376
∑ 420,6000 5958,7000 500073,0900 35119,7000 142040,3443 9847,6486 2141530,4171
𝑥 = 60,0857 𝑦 =851,2429
7

26
𝑏 = 𝑦 − m𝑥
𝑏 = 851.2429 𝑥 − 14.4238 ∗ 60.0857

𝑏 = −15.4204

Regresion lineal
∑𝑥 ∑𝑦
∑ 𝑥𝑦 − Regresion lineal
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
( ∑ 𝑥)2 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥2 − 𝑥=
𝑛 70
𝑚 = 14,4238 𝑏 = -15,4204 𝑦 = 14,4238 X -15,4204 𝑦 = 994,2444

∑𝑥∑𝑦 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥𝑦 −
𝑚= 𝑛
( ∑ 𝑥)2
∑ 𝑥2 − 𝑦 = 14.4238 𝑥 − 15.4204
𝑛
420.6 ∗ 5958.7 𝑦 = 14.4238 ∗ 70 − 15.4204
500073.09 −
𝑚= 7
(420.6)2 𝑦 = 994.2444
35119.7 −
7

𝑚 = 14.4238

𝑙𝑎𝑠 𝑣𝑒𝑛𝑡𝑎𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎𝑠 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎 𝑚𝑎𝑟𝑐𝑎 𝑞𝑢𝑒 𝑔𝑎𝑠𝑡𝑒 70 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑑𝑜𝑙𝑎𝑟𝑒𝑠 𝑒𝑛 𝑝𝑢𝑏𝑙𝑖𝑐𝑖𝑑𝑎𝑑 𝑒𝑠 𝑑𝑒 994.2444

16. En una revista aparecieron datos sobre el desempeño de las aerolíneas


estadounidenses. A continuación, vemos los datos sobre el porcentaje de vuelos que
llegan puntuales y la cantidad de quejas por 100 000 pasajeros.

¿Cuál es la cantidad entintada de quejas por 100 000 pasajeros, si el porcentaje de vuelos
puntuales es de 80 porciento?
Regulación lineal simple

27
𝑦 = 𝑚𝑥 + 𝑏
(666.60)(7.18)
522.7710 −
𝑚= 9 = −0.0698
(666.60)2
49502.26 − 9
𝑏 = 0.7978 − (−0.0698)(7406670 = 5.9643
𝑦 = −0.0698𝑥 + 5.9643
Mínimos cuadrados
129.42
𝑆𝑥2 = = 14.38
9
0.8192
𝑆𝑦2 = = 0.0910
9
−9.0277
𝑆𝑥𝑦 = = −1.0031
9
−1.0031
𝑏= = −0.0698
14.38
𝑎 = 0.7978 + (−0.00698)(74.0667) = −4.3721
𝑦 = −4.3721 − 0.0698𝑥
Cuando x=100
𝑦 = −0.0698(100 − 74.0667) + 0.7978 = −1.0112
Límites de predicción o estimación

1 (𝑥 − 𝑥 )2
𝐿𝑠⁄ = 𝑦 ± 𝑡𝑛−2 𝑆𝑥𝑦 √1 + +
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛

1 (100 − 74.0667)2
𝐿𝑠⁄ = −1.0112 ± (1.4149)(0.1451)√1 + +
9 (666.60)2
49502.26 − 9

𝐿𝑠 = −0.4957
𝐿𝑠 = −1.5267
Error estándar de Estimación

28
2
2
𝑆𝑦𝑥
𝑆𝑥𝑦 = 𝑆𝑦2 − 2
𝑆𝑥

2
1.0062
𝑆𝑥𝑦 = 0.0910 − = 0.0210
14.38
𝑆𝑦𝑥 = √0.0210 = 0.144

Correlación de dos variables


129.42
𝑆𝑥2 = = 14.38
9
−9.0277
𝑆𝑥𝑦 = = −1.0031
9
2
𝑆𝑥𝑦 = (−1.0031) = 1.0062

𝑆𝑦2 =0.0910
1.0062
𝑅2 = = 0.7687
(14.38)(0.0910)
𝐿𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑞𝑢𝑒 𝑒𝑥𝑖𝑠𝑡𝑒 𝑒𝑛𝑡𝑟𝑒 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑝𝑢𝑛𝑡𝑢𝑎𝑙𝑖𝑑𝑎𝑑 𝑦 𝑞𝑢𝑒𝑗𝑎𝑠 𝑒𝑠 𝑅𝑒𝑔𝑢𝑙𝑎r
0.6 < 0.7687 < 0.8
17. Los siguientes índices se utilizan como medidas del movimiento global en el
mercado de acciones. El índice DJIA se basa en los movimientos de precios de 30
compañías grandes; el S&P 500 es un índice compuesto de 500 acciones. Algunos
opinan que el índice S&P 500 es una mejor medida del desempeño del mercado
accionario debido a que tiene una base más amplia. A continuación, se dan los
precios de cierre para los Indices DJIA y S&P 500 durante 10 semanas, empezando
el 11 de febrero de 2000.

29
Suponga que el precio de cierre para el DJIA es 11000. Estime el precio de cierre para el
índice S&P 500.
Mínimos cuadrados:

𝑦 = 670.8775 + 0.0785(1100)
𝑦 = 579300.5625
18. La empresa Nielsen Media Research reúne datos que muestran qué publicistas
obtienen la mayor difusión durante las horas estelares de transmisión en 6 redes
televisivas. A continuación se presentan los datos de la cantidad de familias
espectadoras, en millones. y la cantidad de veces que salió el anuncio al aire durante
la semana del 28 de abril al 4 de mayo de 1997 (USA Today, 5 de mayo de 1997).

30
¿Cuál es la cantidad estimada de familias espectadoras si un anuncio sale 15 veces al aire
en una semana?
Regresion Lineal Simple
𝑥 𝑦 𝑥 𝑦 𝑥2
28 191.7 5367.6000 784.0000
20 174.6 3492.0000 400.0000
14 161.3 2258.2000 196.0000
16 161.1 2577.6000 256.0000
16 147.7 2363.2000 256.0000
16 146.3 2340.8000 256.0000
11 138.2 1520.2000 121.0000
= 121.0000 1120.9000 19919.6000 2269.0000
𝑥 = 17.2857 𝑦 =160.1286

𝑛= 7

31
𝛴𝑥𝛴𝑦 121 ∗ 1120.9
Σ𝑥𝑦 − 19919.6 −
𝑚= 𝑛 7
( 𝛴𝑥 ) 2 = 121 2 = 3.0662
2
𝛴𝑥 − 𝑛 2269 − 7

𝛴𝑦 𝛴𝑥 1120.9 121
𝑏= −𝑚∗ = − 3.0662 ∗ = 107.1271
𝑛 𝑛 7 7

𝑦 = 𝑚𝑥 + 𝑏 = 3.0662𝑥 + 107.1271

𝑦 = 3.0662 ∗ 15 + 107.1271 = 153.1201

𝑃𝑜𝑟 𝑒𝑛𝑑𝑒, 𝑎𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑞𝑢𝑒 ℎ𝑎 𝑠𝑎𝑙𝑖𝑑𝑜 𝑒𝑙 𝑎𝑛𝑢𝑛𝑐𝑖𝑜 15 𝑣𝑒𝑐𝑒𝑠 𝑎𝑙 𝑎𝑖𝑟𝑒, 𝑜𝑏𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 ℎ𝑎
𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜 𝑎 153.1201 𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑐𝑡𝑎𝑑𝑜𝑟𝑎𝑠. 𝑇𝑜𝑚𝑎𝑛𝑑𝑜 𝑒𝑛 𝑐𝑢𝑒𝑛𝑡𝑎 𝑞𝑢𝑒 𝑅2
= 0.8197 𝑠𝑒
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑟𝑎𝑛𝑔𝑜 𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒 (0.8 < 𝑅2 < 0.9)

[Link] gerente de ventas reunió los siguientes datos relacionados con las ventas
anuales y en años de experiencia.
X: Años de experiencia.
Y: Ventas anuales en miles de pesos.

32
Determinar el intervalo de predicción para un vendedor con 9 años de experiencia se tiene:

𝑇𝑎 1 ( 𝑥 − 𝑥 )2
𝑦𝑝 = 𝑦 ± ( (𝑛 − 2)) ∙ 𝑆𝑒 ∙ √1 + + − 𝑛(𝑥)2 )
2 𝑛 Σ𝑥 2

Sustituyendo:

1 (9 − 7)2
𝑦𝑝 = 108 ± 2,306 ∙ 4,61 (√1 + + )
10 632 − 10(7)2

108 − 11,291 ≤ 𝑦𝑝 ≤ 108 + 11,291


96,709 ≤ 𝑦𝑝 ≤ 119,291
Se puede asegurar con un nivel de confianza del 95% que las ventas pronosticadas de un
vendedor con 9 años de experiencia están entre 96.71 y 119.3 miles pesos anuales.

20. PC World publicó las evaluaciones para las 15 computadoras portátiles más
vendidas. La puntuación de desempeño es una medida de qué tan rápido una PC
corre una combinación de aplicaciones de negocios en comparación con una
máquina de referencia. Por ejemplo, una PC con una puntuación de desempeño de
200 es dos veces más rápida que la máquina de referencia. Se utilizó una escala de
100 puntos para asignar una evaluación global a cada computadora portátil que se
probó en el estudio. Una puntuación de 90 o más es excepcional, en tanto que una de
más de 70 está arriba del promedio. A continuación, se muestran las puntuaciones
de desempeño y las evaluaciones globales para las 15 computadoras portátiles.

33
Estime la evaluación global para una nueva PC que tiene una puntuación de desempeño
de 225.
𝑝𝑢𝑛𝑡𝑢𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 2752
𝑃𝐹 = ∑ = = 183.46
15 15
𝑝𝑢𝑛𝑡𝑢𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 1177
𝐹=∑ = = 78.46
15 15
RegresiónLINEAL SIMPLE---MINIMOS CUADRADOS
LINEAL SIMPLE MINIMOSCUADRADOS
(𝑥 − 𝑥 )(𝑦 − 𝑦 ) 2
n 𝑋1 1 𝑥 ∗ 𝑦1 𝑥2 𝑥 −𝑥 𝑦 −𝑦 𝑥 −𝑥 𝑦 −𝑦 2
1 115 67 7705,0000 13225,0000 -68,4667 -11,4667 785,0844 4687,6844 131,4844
2 191 78 14898,0000 36481,0000 7,5333 -0,4667 -3,5156 56,7511 0,2178
3 153 79 12087,0000 23409,0000 -30,4667 0,5333 -16,2489 928,2178 0,2844
4 194 80 15520,0000 37636,0000 10,5333 1,5333 16,1511 110,9511 2,3511
5 236 84 19824,0000 55696,0000 52,5333 5,5333 290,6844 2759,7511 30,6178
6 184 76 13984,0000 33856,0000 0,5333 -2,4667 -1,3156 0,2844 6,0844
7 184 77 14168,0000 33856,0000 0,5333 -1,4667 -0,7822 0,2844 2,1511
8 216 92 19872,0000 46656,0000 32,5333 13,5333 440,2844 1058,4178 183,1511
9 185 83 15355,0000 34225,0000 1,5333 4,5333 6,9511 2,3511 20,5511
10 183 78 14274,0000 33489,0000 -0,4667 -0,4667 0,2178 0,2178 0,2178
11 189 77 14553,0000 35721,0000 5,5333 -1,4667 -8,1156 30,6178 2,1511
12 202 78 15756,0000 40804,0000 18,5333 -0,4667 -8,6489 343,4844 0,2178
13 192 78 14976,0000 36864,0000 8,5333 -0,4667 -3,9822 72,8178 0,2178
14 141 73 10293,0000 19881,0000 -42,4667 -5,4667 232,1511 1803,4178 29,8844
15 187 77 14399,0000 34969,0000 3,5333 -1,4667 -5,1822 12,4844 2,1511
∑= 2752,0000 1177,0000 217664,0000 516768,0000 1723,7333 11867,7333 411,7333
𝑥 =183,4667 𝑦 = 78,4667

Usando la ecuación y = 0.1452x + 51.819, la evaluación global estimada para una PC con
una puntuación de desempeño de 225 es aproximadamente 84.49.
21. Jacob Lee es un viajero frecuente entre Los Ángeles y San Francisco. El mes
pasado, anotó los tiempos de vuelo en tres aerolíneas distintas. Los resultados son:

34
b) Utilice el nivel de significancia de 0.05 y el proceso de prueba de hipótesis de
cinco pasos para comprobar si existen diferencias entre los tiempos medios de
vuelo de las tres aerolíneas.

ANÁLISIS DE VARIANZAS DE UN FACTOR


RESUMEN
GRUPOS CUENTA SUMA PROMEDIO VARIANZA
Goust 14 707 50,5 19,9615385
Jet Red 14 729 52,0714286 14,6868132
Cloudtran 7 390 55,7142857 36,5714286

ANÁLISIS DE VALOR
VARIANZA SUMA GL PROMEDI F PROBABILIDA CRÍTICO
O D
Origen de las 127,114286 2 63,557142 3,0362124 0,06203418 3,29453681
variaciones 9 1 6
Entre grupos 669,857143 32 20,933035
7
Dentro de los grupos

Total 796,971429 34

35
NIVEL DE FACTOR RESPUESTA
TIEMPOS DE
AEROLINEAS VUELO RESIDUOS
1 51 0,5
1 51 0,5
1 52 1,5
1 42 -8,5
1 51 0,5
1 57 6,5
1 47 -3,5
1 47 -3,5
1 50 -0,5
1 60 9,5
1 54 3,5
1 49 -1,5
1 48 -2,5
1 48 -2,5
2 50 -2,07142857
2 53 0,92857143
2 52 -0,07142857
2 62 9,92857143
2 53 9,92857143
2 49 -3,07142857
2 50 -2,07142857
2 49 -3,07142857
2 58 5,92857143
2 54 1,92857143
2 51 -1,07142857
2 49 -3,07142857
2 49 -3,07142857
2 50 -2,07142857
3 52 -3,71428571
3 55 -0,71428571
3 60 4,28571429
3 64 8,28571429
3 61 5,28571429
3 49 -6,71428571
3 49 -6,71428571

36
22. En un estudio del efecto de los comerciales de televisión sobre los niños de 12
años se midió el tiempo de su atención, en segundos. Los comerciales fueron de
ropa, alimentos y juguetes. Con un nivel de significancia de 0.05, ¿hay alguna
diferencia entre los lapsos de atención promedio de los niños con respecto a los
diversos comerciales? ¿Existen diferencias significativas entre pares de promedios?

Ropa Alimentos Juguetes


26 45 60
21 48 51
43 43 43
35 53 54
28 47 63
31 42 53
17 34 48
31 43 58
20 57 47
47 51
44 51
54

Planteo hipótesis.
𝐻0 : 𝑢1 = 𝑢2 = 𝑢3
𝐻1 : 𝑢1 ≠ 𝑢2 ≠ 𝑢3

Grupos Cuenta Suma Promedio Varianza


Ropa 9 252 28 66,25
Alimento 11 557 46,42 38,27
Juguetes 12 579 52,64 34,65

37
𝑶𝒓𝒊𝒈𝒆𝒏 𝑺𝑺 𝒈. 𝒍 𝑴𝑺 𝑭𝒐 𝒑− 𝑭 𝒄𝒓𝒊𝒕𝒊𝒄𝒐
𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 𝒗𝒂𝒍𝒐𝒓
Entre Grupos 3182,04 2 1591,02 35,56 0,0000 3,33

Dentro de los gr. 1297,46 29 44,74

Total 4479,50 31

23.-En el área de Columbus, Georgia, hay cuatro restaurantes McBurger. En la


siguiente tabla se muestran los números de hamburguesas que vendió cada uno de
ellos en cada una de las últimas seis semanas. A un nivel de significancia de 0.05 y
cuando se considera el factor de la semana, ¿hay alguna diferencia entre los números
medios que vendieron los cuatro restaurantes?

a) ¿Hay alguna diferencia entre las medias de tratamiento?

𝐻𝑜 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇6

𝐻𝐴 : El promedio de hamburguesas vendidas en las 6 semanas no es igual

RESUMEN METRO INTERESTELAR UNIVERSIDAD RIO


CUENTA 6 6 6 6
SUMA 1443 1380 1810 1215
PROMEDIO 240,5 230 301,67 202,50
VARIANZA 14543,1 2070 696,67 777,5

RESUMEN 1 2 3 4 5 6

38
CUENTA 4 4 4 4 4 4
SUMA 794 1024 1250 830 905 1045
PROMEDIO 198,5 256 312,50 207,50 226,25 261,25
VARIANZA 7289 3170,67 6691,67 7941,67 1880,58 1872,92

No se rechaza 𝐻𝑜 si F<2,90

Se rechaza 𝐻𝑜 si F>2,90

F=1,93 < 3,84 por lo tanto, no se rechaza 𝐻𝑜

b) ¿Hay alguna diferencia entre las medias de bloqueo?

ORIGEN DE GRADOS PROMEDIO D V.C


SUMA DE
LAS DE ELOS F PARA
CUADRADOS
VARIACIONES LIBERTAD CUADRADOS F
FILAS 35402,83 5 7080,57 1,93 2,90
COLUMNAS 31533,00 3 10511,00 2,86 3,29
ERROR 55033,50 15 3668,90
TOTALES 121969,33 23

Con el 95% del nivel de confianza, el tiempo promedio de las hamburguesas vendidas en
las 6 semanas es igual

39
Con el 95% del nivel de confianza, el promedio de hamburguesas que venden los 4
restaurantes son iguales.

24. El concesionario Martin Motors tiene tres automóviles de la misma marca y


modelo. El director desea comparar el consumo de combustible de ellos (designados
automóviles A, B y C) con cuatro tipos de gasolina. En cada prueba se puso un galón
de gasolina al tanque vacío de los automóviles y se condujeron hasta que se agotó.
En la siguiente tabla se muestra el número de millas que se recorrieron en cada
prueba. Realice la prueba de hipótesis.

Tipos de gasolina Distancia (millas)


Automóvil Automóvil B Automóvil C
A
Regular 22.4 20.8 21.5
Súper regular 17.0 19.4 20.7
Sin plomo 19.2 20.2 21.2
Premium sin 20.3 18.6 20.4
plomo

40
Por lo tanto, no se encontraron diferencias significativas en la distancia recorrida que se
le pueda atribuir al tipo de gasolina utilizado o al automóvil en específico.
Bajo las condiciones de esta prueba, ni el tipo de gasolina, ni las diferencias entre los
automóviles afectan de forma significativa el rendimiento en términos de las millas
recorridas por galón de combustible.

41
25. Tres cadenas de supermercados del área de Denver, Colorado, afirman tener los
precios más bajos. Como parte de un estudio de investigación sobre la publicidad de
los supermercados, el Denver Daily News realizó un estudio. Primero seleccionó una
muestra aleatoria de nueve artículos. Luego, verificó el precio de cada artículo

La hipótesis que se quiere probar es:


𝐻0 = 𝑢1 = 𝑢2 = 𝑢3
𝐻1 = 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒s

Recordar que la hipótesis nula 𝐻𝑂 es rechazada al nivel de significancia 𝖺 cuando es


verdadero que:
𝑓 > 𝑓𝑎[𝑘 − 1, 𝑘(𝑛 − 1)]
Comparando:
12.66>3.70 Verdadero
Conclusión: Se rechaza 𝐻𝑂 y se concluye que las medias de los grupos son diferentes,
por lo tanto, el tipo de experiencia si es significativa.

42
[Link] estudiar el efecto de la temperatura en el rendimiento de un proceso
químico, se produjeron cinco lotes con cada uno de los tres tratamientos. Los
resultados se presentan a continuación. Dé la tabla para el análisis de varianza. Use
α= 0.05 para probar si la temperatura afecta el rendimiento medio del proceso.
𝐻𝑜: 𝑡1 = 𝑡2 = 𝑡3
𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑟𝑒𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
𝛼 = 5% = 0.05
𝐾−1 = 3−1 = 2
𝑛 − 𝑘 = 15 − 3 = 12

(450)2
𝑆𝑆𝑡𝑜𝑡𝑎𝑙 = 13806 − = 306
15
𝑆𝑆𝑇 = 13570 − 13500 = 70
𝑆𝑆𝐸 = 306 − 70 = 236

43
Se acepta la Ho, ya que el valor de F es menor a 3.885, por lo tanto, se concluye que no
hay diferencia significativa en el rendimiento por la influencia y varianza de las
temperaturas.

44
27. En una auditoría los auditores tienen que dar opiniones acerca de diversos
aspectos con base en sus propias experiencias directas, indirectas o en una
combinación de ambas. En un estudio se pidió a auditores que dieran su opinión
acerca de la frecuencia con que se presentan errores en una auditoría. Suponga que
se obtuvieron los resultados que se presentan a continuación; valores bajos indican
opiniones más acertadas. Use α = 0.05 para determinar si el tipo de experiencia en
que se basa la opinión afecta la calidad de la misma.

Directa Indirecta Combinación


17 16.6 25.2
18.5 22.2 24
15.8 20.5 21.5
18.2 18.3 26.8
20.2 24.2 27.5
16 19.8 25.8
13.3 21.2 24.2

La hipótesis que se quiere probar es:

𝐻𝑂 = 𝜇1 = 𝜇2 = 𝜇3

45
𝐻1 = 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

Recordar que la hipótesis nula 𝐻𝑂 es rechazada al nivel de significancia 𝖺 cuando es


verdadero.

Comparando:

12,65 > 3,55 𝑉𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜

Conclusión: Se rechaza 𝐻𝑂 y se concluye que las medias de los grupos son diferentes,
por lo tanto, el tipo de experiencia si es significativa.

46
[Link] la publicidad de tres pinturas se dice que tienen el mismo tiempo de
secado. Para verificar esto, se prueban cinco muestras de cada una de las
pinturas. Se registra el tiempo en minutos necesario para que el secado sea
suficiente para la aplicación de una segunda mano. Los datos obtenidos son los
siguientes. Con α = 0.05 como nivel de significancia, realice una prueba para
determinar si la media de los tiempos de secado es la misma en todas las
pinturas.

Pintura 1 Pintura 2 Pintura 3 Pintura 4


128 144 133 150
137 133 143 142
135 147 137 135
124 146 136 140
141 130 131 153
Paso 1: Formular las hipótesis
Hipótesis nula (H0 ): Las medias de los tiempos de secado de las pinturas son
iguales.
Hipótesis alternativa (Ha ): Al menos una de las medias es diferente.
Paso 2: Calcular la media de cada grupo

Paso 3: Calcular la media general

Paso 4: Calcular la Suma de Cuadrados Entre Grupos (SSB) y


Dentro de Grupos (SSW)
SSB = n (Media Pintura 1−Media general)2+n (Media Pintura 2−Media
general)2+. . .
Σ
SSW = (valor − media del grupo)2
Paso 5: Calcular el estadístico F

47
Resultado:
El valor de F calculado es aproximadamente 2.471 con un valor p de 0.099. Como
p > 0.05, no rechazamos la hipótesis nula, lo que indica que no hay evidencia
suficiente para afirmar que los tiempos de secado de las pinturas son diferentes.

48
[Link] conocida revista de automovilismo tomo tres de los mejores automóviles
medianos fabricados en Estados Unidos, los probó y los comparó en relación
con varios criterios. En una prueba sobre rendimiento de la gasolina, se probaron
cinco automóviles de cada marca en un recorrido de 500 millas, los datos de
rendimiento, en millas por galón de gasolina, se presentan a contin- uación.
Use α = 0.05 para probar si la diferencia en el rendimiento medio, en millas por
galón, entre los tres automóviles es significativa.

Automóvil Automóvil Automóvil


A B C
19 19 24
21 20 26
20 21 25
20 22 23
19 21 27
Paso 1: Formular las hipótesis
Hipótesis nula (H0 ): Las medias de rendimiento de los automóviles son iguales.
Hipótesis alternativa (Ha ): Al menos una de las medias es diferente.
Paso 2: Calcular la media de cada grupo

Paso 3: Calcular la media general

Paso 4: Calcular la Suma de Cuadrados Entre Grupos (SSB) y Dentro


de Grupos (SSW)
Paso 5: Calcular el estadístico F
El valor de F calculado es aproximadamente 26.133 con un valor p de 0.0000424.
Como p < 0.05, rechazamos la hipótesis nula, lo que sugiere que hay diferencias
significativas en el rendimiento medio (en millas por galón) en- tres los tres
automóviles.

49
30. Un comerciante de automóviles realiza una prueba para determinar si la
cantidad de tiempo en minutos que se necesita para una afinación de motor depende
de si se emplea un analizador computarizado o un analizador electrónico. Los datos
obtenidos son los siguientes. Use 𝜶 = 𝟎. 𝟎𝟓 y realice una prueba para determinar si
existe diferencia significativa entre los tratamientos.

Desarrollo:

Grafica:

50
51

También podría gustarte