Cuestionario de Estadística: Regresión y Pruebas
Cuestionario de Estadística: Regresión y Pruebas
ASIGNATURA:
ESTADÍSTICA
TEMA:
CUESTIONARIO N° 03.
UNIDAD III.
ALUMNO:
• Alejandro Andrade
DOCENTE:
NRC: 13544
LATACUNGA 28/08/2024
Cuestionario No. 03
UNIDAD III:
MODELOS DE REGRESIÓN Y PRUEBAS NO PARAMÉTRICAS
1. Durante las primeras 13 semanas de la temporada de televisión, se
registraron las audiencias de sábado por la noche, de 8:00pm a 9:00pm,
como sigue: ABC 29%, CBS 28%, NBC 25% y otros 18%. Dos
semanas después, una muestra de 300 hogares arrojó los siguientes
resultados de audiencia: ABC 95 hogares, CBS 70 hogares, NBC 89
hogares y otros 46 hogares. ¿Han cambiado las proporciones de
telespectadores?
Paso 1: Formular las hipótesis
Ei
2
2. La empresa m&m, fabricantes de los chocolates, patrocinó una encuesta
nacional en la que más de 10 millones de personas indicaron su preferencia para
un color nuevo. El conteo de esta encuesta dio como resultado el reemplazo del
color chocolate por un nuevo color azul, la distribución de chocolates es como
sigue:
Empresa M&M
35%
30%
25%
20%
15%
10%
5%
0%
Café Amarillo Rojo Naranja Verde Azul
3
¿Estos datos respaldan lo que publicó la empresa
𝐻𝑜: 𝑝𝐶𝑎𝑓𝑒 = 0. 30, 𝑝𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑜 = 0. 20, 𝑝𝑅𝑜𝑗𝑜 = 0. 20, 𝑝𝑁𝑎𝑟𝑎𝑛𝑗𝑎 = 0. 10, 𝑝𝑉𝑒𝑟𝑑𝑒
= 0. 10, 𝑝𝐴𝑧𝑢𝑙 = 0. 10
𝐻𝑜: 𝑝𝐶𝑎𝑓𝑒 ≠ 0. 30, 𝑝𝐴𝑚𝑎𝑟𝑖𝑙𝑙𝑜 ≠ 0. 20, 𝑝𝑅𝑜𝑗𝑜 ≠ 0. 20, 𝑝𝑁𝑎𝑟𝑎𝑛𝑗𝑎 ≠ 0. 10, 𝑝𝑉𝑒𝑟𝑑𝑒
≠ 0. 10, 𝑝𝐴𝑧𝑢𝑙 ≠ 0. 10
𝑦2:
𝑦2 = (0.3)(506) = 151.8
𝑦2 = (0.2)(506) = 101.2
𝑦2 = (0.2)(506) = 101.2
𝑦2 = (0.1)(506) = 50.6
𝑦2 = (0.1)(506) = 50.6
∑(𝑦1 − 𝑦2)2
𝑋𝐶2 = = 29.5138
𝑦2
𝑔𝑙 = (6 − 1)(2 − 1) = 5
∝= 5%
𝑋𝑇2 = 11.07
4
4. Una de las preguntas del estudio de suscriptores fue: “Al hacer inversiones,
¿emplea usted empresas de correduría de servicio completo o minoristas?” Los
resultados de la encuesta indicaron que 264 encuestados emplean sólo empresas
de servicio completo, 255 emplean sólo empresas minoristas con descuento y 229
emplean ambas clases de empresas. Use un nivel de significancia de 10% y
determine si hay tres diferentes preferencias entre las tres operaciones de
servicio
1) 𝐻𝑜: 𝑁𝑜 ℎ𝑎𝑦 𝑡𝑟𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑡𝑟𝑒𝑠 𝑜𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒
𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜 𝐻𝑖: 𝑆𝑖 ℎ𝑎𝑦 𝑡𝑟𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 𝑝𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑡𝑟𝑒𝑠
𝑜𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜
2) Frecuencias observadas
Si No
Servicio Completo 264 26 290
Empresas minoristas con 255 35 290
descuentos
Ambas empresas 229 26 255
748 87 835
3) Frecuencias estimadas
Si No
Servicio completo 259.7844 30.2156
Empresas minoristas con 259.7844 30.2156
descuentos
Ambas empresas 228.4311 26.5689
4) Obtención 𝑿𝒄 𝟐
𝒇𝒊 − 𝒇𝒆 (𝒇𝒊 − 𝒇𝒆)𝟐 (𝒇𝒊 − 𝒇𝒆)𝟐⁄
𝒇𝒆
Servicio completo – Si 4.2156 17.7713 0.0684
Empresas minoristas con -4.7844 22.8905 0.0881
descuentos – Si
Ambas empresas – Si 0.5689 0.3236 0.0014
Servicio completo – No -4.2156 17.7713 0.5881
5
Empresas minoristas con 4.7844 22.8905 0.7576
descuentos – No
Ambas empresas - No -0.5689 0.3236 0.0122
Total 1.5158
(𝒇𝒊−𝒇𝒆)𝟐
8) 𝑿𝒄 𝟐 = ∑ = 𝟏. 𝟓𝟏𝟓𝟖
𝒇𝒆
9) 𝒈𝒍 = (𝟑 − 𝟏)(𝟐 − 𝟏) = 𝟐
∝= 𝟏𝟎%
𝒙𝑻 𝟐 = 𝟒. 𝟔𝟏
10) 𝒙𝒄 𝟐 < 𝒙𝑻 𝟐 se acepta 𝑯𝟎
11) No hay tres diferentes preferencias entre las tres operaciones de servicio
25. Tres cadenas de supermercados del área de Denver, Colorado, afirman tener
los precios más bajos. Como parte de un estudio de investigación sobre la
publicidad de los supermercados, el Denver Daily News realizó un estudio.
Primero seleccionó una muestra aleatoria de nueve artículos. Luego, verificó el
precio de cada artículo
6
Recordar que la hipótesis nula 𝐻𝑂 es rechazada al nivel de significancia 𝖺 cuando es
verdadero que:
𝑓 > 𝑓𝑎[𝑘 − 1, 𝑘(𝑛 − 1)]
Comparando:
12.66>3.70 Verdadero
Conclusión: Se rechaza 𝐻𝑂 y se concluye que las medias de los grupos son diferentes,
por lo tanto, el tipo de experiencia si es significativa.
5. Se reconoce que las actividades negativas son un método efectivo de persuasión
en la publicidad. Un estudio que apareció en una revista informó los resultados
de un análisis de contenido en anuncios con actitud de culpa en 24 revistas. La
cantidad de anuncios con actitudes de culpa, que aparecieron en ellas, es la
siguiente:
7
Cálculo de frecuencias esperadas:
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑶𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂𝒔
𝑬=
𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒕𝒆𝒈𝒐𝒓í𝒂𝒔
𝟏𝟏𝟓
𝑬= = 𝟏𝟗. 𝟏𝟔𝟕
𝟔
(𝟐𝟎 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟏 = = 𝟎. 𝟎𝟑𝟔
𝟏𝟗. 𝟏𝟕
(𝟏𝟓 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟐 = = 𝟎. 𝟗𝟎𝟕
𝟏𝟗. 𝟏𝟕
(𝟑𝟎 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟑 = = 𝟔. 𝟏𝟏𝟖
𝟏𝟗. 𝟏𝟕
(𝟐𝟐 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟒 = = 𝟎. 𝟒𝟏𝟕
𝟏𝟗. 𝟏𝟕
(𝟏𝟔 − 𝟏𝟗. 𝟏𝟕)𝟐
𝑶𝟓 = = 𝟎. 𝟓𝟐𝟓
𝟏𝟗. 𝟏𝟕
𝒙𝟐𝑪𝑨𝑳 = 𝟎. 𝟎𝟑𝟔 + 𝟎. 𝟗𝟎𝟕 + 𝟔. 𝟏𝟏𝟖 + 𝟎. 𝟒𝟏𝟕 + 𝟎. 𝟓𝟐𝟓 = 𝟏𝟎. 𝟔𝟖𝟕
Grados de Libertad:
𝑵𝑪 = 𝟗𝟎%
𝜶 = 𝟏𝟎% = 𝟎. 𝟏
𝒈𝑳 = 𝒌 − 𝟏 = 𝟔 − 𝟏 = 𝟓
𝒙𝟐𝑻 = 𝟗. 𝟐𝟒
8
Pruebe si hay alguna diferencia de preferencias hacia los tres aparadores
• 𝑯𝟎 : 𝑳𝒂 𝒑𝒓𝒆𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆 𝒄𝒐𝒏𝒔𝒖𝒎𝒊𝒅𝒐𝒓𝒆𝒔 𝒆𝒔 𝒍𝒂 𝒎𝒊𝒔𝒎𝒂 𝒑𝒂𝒓𝒂 𝒄𝒂𝒅𝒂
𝒂𝒑𝒂𝒓𝒂𝒅𝒐𝒓.
• 𝑯𝟏 : 𝑳𝒂 𝒑𝒓𝒆𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆 𝒍𝒐𝒔 𝒄𝒐𝒏𝒔𝒖𝒎𝒊𝒅𝒐𝒓𝒆𝒔 𝒏𝒐 𝒆𝒔 𝒍𝒂 𝒎𝒊𝒔𝒎𝒂 𝒑𝒂𝒓𝒂 𝒄𝒂𝒅𝒂
𝒂𝒑𝒂𝒓𝒂𝒅𝒐𝒓.
(𝐹0 − 𝐹𝑒 )2
𝑥𝑐2 = ∑ = 2,3111
𝐹𝐸
9
Conclusión
• Como 𝑥𝑐2 es menor que 5,9915 acepto 𝐻𝑜
• Bajo un nivel de significación del 5% no podemos afirmar que las preferencias de
los consumidores a los aparadores A, B y C son las mismas.
7. ¿Qué también sirven a sus clientes las aerolíneas? En un estudio se observaron las
siguientes evaluaciones por parte de los clientes, 3% excelente, 28% bueno, 45%
regular y 24% malo. En un estudio de seguimiento del servicio que ofrecen las
compañías telefónicas, suponga que en una muestra de 400 adultos se encontró
que las evaluaciones fueron las siguientes: 24 le dieron la calificación de excelente,
124 bueno, 172 regular y 80 malo. Pruebe con un nivel de significancia de 1%. ¿La
distribución de las evaluaciones de los clientes para las compañías telefónicas
difieren de la distribución de las evaluaciones de los clientes de las aerolíneas?
Datos:
𝑎 = 𝟏% → 𝟎, 𝟎𝟏
𝒇 𝒉𝒊𝒑 𝒇𝒊 𝒆𝒊 𝟐
Excelente 24 12 12
3%
Bueno 28% 124 112 1.2857
45%
10
Malo 24% 80 96 2,6666
TOTAL 16,3078
(𝑘 − 1) = 𝑥 2
(4 − 1) = 16,3078
3 = 16,3078
𝑥 2 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜
𝛼 = 1% → 0,01
𝑥 2 = 11,34
Conclusión: Dado que el resultado sobre pasa el punto crítico, se puede concluir que se
rechaza la hipótesis nula y se acepta la hipótesis alternativa; además que las distribuciones
de las evaluaciones de los clientes para las compañías telefónicas se difieren de la
distribución de las evaluaciones de los clientes de aerolíneas.
11
8. Para establecer cuotas de ventas, el gerente de mercadotecnia supone que los
potenciales de pedidos son iguales para cada uno de cuatro territorios de ventas.
Una muestra de 200 ventas, que vemos en la tabla siguiente, indica las cantidades
de pedidos en los territorios. ¿Debe rechazarse la hipótesis del gerente?
Territorios de ventas
I II III IV
60 45 59 36
Sumatoria de los
cuadrados
Totales
𝑦 𝑥1 𝑥2 𝑦𝑖 − ̅𝑦 𝑆𝐶𝑇 = (𝑦𝑖
− 𝑦̅)
34 30 23 1,00 1,00
24 31 28 -9,00 81,00
36 34 28 3,00 9,00
39 23 30 6,00 36,00
32 27 31 -1,00 1,00
165 145 140 128,00
12
el valor de Sumatoria de los
y cuadrados del
estimado error
̂𝑦 𝑦−
𝑦 𝑆𝐶𝐸 = (𝑦
−
6047,06 -6013,06 36156890,56
4178,34 -4154,34 17258540,84
4386,48 -4350,48 18926676,23
2848,06 -2809,06 7890818,08
2737,96 -2705,96 7322219,52
87555145,23
TABLA DE ANOVA
Fuente de Suma Grados Cuadrado 𝐹𝐶𝐴𝐿 𝐹𝑇𝐴𝐵 𝑜
Variabilid de de s Medios
𝐹𝐶𝑅
ad Cuadra liberta
dos d
Regresión 87546920,9 2 43773460,4
1 6 4,50 4,26
Error 87555145,2 9 9728349,47
3
Total 128,00 11
21. Jacob Lee es un viajero frecuente entre Los Ángeles y San Francisco. El mes
pasado, anotó los tiempos de vuelo en tres aerolíneas distintas. Los resultados son:
13
a) Utilice el nivel de significancia de 0.05 y el proceso de prueba de hipótesis de
cinco pasos para comprobar si existen diferencias entre los tiempos medios de
vuelo de las tres aerolíneas.
ANÁLISIS DE VALOR
VARIANZA SUMA GL PROMEDI F PROBABILIDA CRÍTICO
O D
Origen de las 127,114286 2 63,557142 3,0362124 0,06203418 3,29453681
variaciones 9 1 6
Entre grupos 669,857143 32 20,933035
7
Dentro de los grupos
Total 796,971429 34
14
1 51 0,5
1 52 1,5
1 42 -8,5
1 51 0,5
1 57 6,5
1 47 -3,5
1 47 -3,5
1 50 -0,5
1 60 9,5
1 54 3,5
1 49 -1,5
1 48 -2,5
1 48 -2,5
2 50 -2,07142857
2 53 0,92857143
2 52 -0,07142857
2 62 9,92857143
2 53 9,92857143
2 49 -3,07142857
2 50 -2,07142857
2 49 -3,07142857
2 58 5,92857143
2 54 1,92857143
2 51 -1,07142857
2 49 -3,07142857
2 49 -3,07142857
2 50 -2,07142857
3 52 -3,71428571
3 55 -0,71428571
3 60 4,28571429
3 64 8,28571429
3 61 5,28571429
3 49 -6,71428571
3 49 -6,71428571
9. El 7% de inversionistas de fondos de ahorros valoran como "muy seguras" a las
acciones corporativas, 58% las define como "algo seguras", 24% como "no muy
seguras", 4% como "definitivamente inseguras" y 7% no tienen opinión
definida. En una encuesta se preguntó a 529 inversionistas de fondos de ahorro
cómo creen que es la seguridad de los bonos corporativos. Se obtuvieron las
respuestas siguientes:
15
Concepto De Proporción
Seguridad
Muy Seguras 0.07 48 37.03 10.97 120.3409 3.2498
Algo Seguras 0.58 323 306.82 16.18 261.7924 0.8532
No Muy Seguras 0.24 79 126.96 - 2300.1616 18.1172
47.96
Definitivamente 0.07 16 37.03 - 442.2609 11.9433
Inseguras 21.03
Sin Opinión Definida 0.04 63 21.16 41.84 1750.5856 82.7309
Total 1 529 116.8945
Prueba de hipótesis
𝐻𝑜: 𝐻𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑛𝑐𝑒𝑝𝑡𝑜𝑠 𝑑𝑒
𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑.
𝐻1: 𝑁𝑜 ℎ𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑛𝑐𝑒𝑝𝑡𝑜𝑠 𝑑𝑒
𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑.
Grados de libertad:
𝑔𝐿 = 𝑘 − 1
𝑔𝐿 = 5 − 1 = 4
Significancia α= 5%.
16
Determinar 𝑥𝑇2 =?
𝑥𝑇2 = 7.49
Determinar el estadístico calculados 𝑥𝐶2 =?
(𝐹𝑂 − 𝐹𝐸)2
𝑥𝐶2 = ∑
𝐹𝐸
𝑥𝐶2 = 116.8945
𝑥𝐶2 > 𝑥𝑇2
∴𝑅𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑂
La hipótesis nula se rechaza ya que el Chi-cuadrado calculado (116.89) supera al crítico
(9.49), indicando diferencias significativas en la percepción de seguridad de los
inversionistas
10. Se desea abrir un parque público. Se ha pedido a una muestra de 140 personas
decir que día preferirían visitarlo. A continuación, vemos los resultados.
Para establecer un plan de personal. ¿debe suponer el gerente que habrá la misma
cantidad de visitantes todos los días? Base su conclusión en una prueba estadística
con a=0.05.
𝑺𝒐𝒍𝒖𝒄𝒊ó𝒏:
𝐻𝑜 ∶ 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑠𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
𝐻1 ∶ 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑠𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
17
Grados de libertad:
𝒈𝑳 = 𝒌 − 𝟏
𝑔𝐿 = 4 − 1 = 3
𝑆𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 𝛼 = 5%.
𝐷𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟 𝑥𝑇2 = ?
𝑥𝑇2 = 7,81
𝐷𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟 𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑥𝐶2
𝑁𝑜 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑖𝑠𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑠𝑒𝑟á 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑒𝑛 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
11. A una autoridad regional de transporte colectivo le preocupa el número de
pasajeros en una de las rutas de autobús. Al definir la ruta se creía que el
número de pasajeros era el mismo de lunes a viernes. Con los datos de la tabla
siguiente pruebe, con a = 0.05 si es correcta la hipótesis de la autoridad.
18
𝛼 = 0.05
𝑔𝐿 = 4 − 1 = 3 → 𝑝 = 0.114
Se rechaza Ho, por ende se acepta H1 y se entiende con un nivel de confianza del 95%,
que el número de pasajeros es el mismo de lunes a viernes.
CATEGORIA CANTIDAD
Muy satisfactorio 105
19
Medianamente satisfactorio 235
Ni satisfechos Ni insatisfechos 55
Medianamente insatisfechos 90
Muy insatisfechos 15
Haga una prueba con a = 0.05 para determinar si la satisfacción de los programadores es
diferente de la de los gerentes de sistemas de información.
Usamos la prueba de PRUEBA U DE MANN - WHITNEY
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
∑ 𝑅1 = 28
∑ 𝑅1 = 27
∑ 𝑅1 = 28
∑ 𝑅1 = 27
𝑛1 = 5
𝑛2 = 5
20
5 ∗ (5 + 1)
𝑈1 = 5 ∗ 5 + − 28 = 12
2
5 ∗ (5 + 1)
𝑈2 = 5 ∗ 5 + − 27 = 13
2
𝑈𝐶𝐴𝐿 = 12
𝛼 = 0.025
𝑈𝑇𝐴𝐵 = 2
𝑈𝐶𝐴𝐿 > 𝑈𝑇𝐴𝐵
Se rechaza H0
Se acepta 𝐻1 : 𝜇1 ≠ 𝜇2 . La satisfacción de los programadores SI es diferente de la de los
gerentes de sistemas de información.
13. Una muestra de partes suministró los datos de la siguiente tabla de contingencias
acerca de la calidad de parte y de turno en que fue producida.
21
Use a = 0.05 y pruebe la hipótesis de que la calidad de las partes es independiente del
turno en que fueron producidas. ¿Cuál es su conclusión?
Requerimos saber si realizar la prueba del Chi cuadrado, en donde se tiene:
Frecuencia observada 𝑂
La frecuencia esperada 𝐸
𝐹𝑖𝑙𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 ∗ 𝐶𝑜𝑙𝑢𝑚𝑛𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠 (𝐸 − 𝑂 )2
𝐸 = = 𝑋2
𝑆𝑢𝑚𝑎 𝑇𝑜𝑡𝑎𝑙 𝐸
𝑔𝐿 = (𝑁°𝑑𝑒𝑓𝑖𝑙𝑎𝑠 − 1) ∗ (𝑁°𝑑𝑒𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1)
𝑔𝐿 = (3 − 1) ∗ (2 − 1) = 2
𝑋𝑡𝑎𝑏 = 5.9915
22
(400 ∗ 829)
𝐸1,1 = = 368.444
900
(400 ∗ 71)
𝐸1,2 = = 31.556
900
(300 ∗ 829)
𝐸2,1 = = 276.333
900
(300 ∗ 71)
𝐸2,2 = = 23.667
900
(200 ∗ 829)
𝐸1,1 = = 3184.222
900
(200 ∗ 71)
𝐸1,1 = = 15.778
900
23
(𝐹𝑜 − 𝐹𝑒)2 (368 − 368.444)2 (32 − 31556)2 (285 − 276.333)2
𝑋𝑐𝑎𝑙 = ∑ = + + +
𝐹𝑒 368.444 31.556 276.333
(15 − 23.667)2 (176 + 184.222)2 (24 − 15.778)2
+ + = 8.1041
23.667 184.222 15.778
24
Si la altura de una nadadora es 63 pulgadas, ¿cuál sería el peso que usted le estimaría?
Estimación por Regresión lineal simple:
Regresion lineal
∑𝑥 ∑𝑦 Regresion lineal
∑ 𝑥𝑦 −
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
2 (∑ 𝑥)2 𝑦 = 𝑚𝑥 + 𝑏
∑𝑥 − 𝑥= 63
𝑛
𝑚 = 5,5000 𝑏 =-240,5000 𝑦 = 5,5000 X -240,5000 𝑦= 106
∑𝑥∑𝑦 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥𝑦 −
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
( ∑ 𝑥)2
∑ 𝑥2 − 𝑦 = 5.5 𝑥 − 240.5
𝑛 𝑏 = 117 − 5.5*65
325 ∗ 585 𝑏 = −240.5
38135 − 𝑦 = 5.5 ∗ 63 − 240.5
𝑚= 5
(325)2
21145 − 𝑦 = 106
5
𝑚 = 5.5
25
𝐸𝑙 𝑝𝑒𝑠𝑜 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎 𝑛𝑎𝑑𝑎𝑑𝑜𝑟𝑎 𝑑𝑒 63 𝑝𝑢𝑙𝑔𝑎𝑑𝑎𝑠 𝑒𝑠 𝑑𝑒 106 𝑙𝑖𝑏𝑟𝑎𝑠.
15. Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de
publicidad (en millones de dólares) para 7 marcas participantes de refrescos.
Prediga las ventas para una marca que gaste 70 millones de dólares en publicidad.
Estimación por Regresión lineal simple:
26
𝑏 = 𝑦 − m𝑥
𝑏 = 851.2429 𝑥 − 14.4238 ∗ 60.0857
𝑏 = −15.4204
Regresion lineal
∑𝑥 ∑𝑦
∑ 𝑥𝑦 − Regresion lineal
𝑚= 𝑛 𝑏 = 𝑦 − m𝑥
( ∑ 𝑥)2 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥2 − 𝑥=
𝑛 70
𝑚 = 14,4238 𝑏 = -15,4204 𝑦 = 14,4238 X -15,4204 𝑦 = 994,2444
∑𝑥∑𝑦 𝑦 = 𝑚𝑥 + 𝑏
∑ 𝑥𝑦 −
𝑚= 𝑛
( ∑ 𝑥)2
∑ 𝑥2 − 𝑦 = 14.4238 𝑥 − 15.4204
𝑛
420.6 ∗ 5958.7 𝑦 = 14.4238 ∗ 70 − 15.4204
500073.09 −
𝑚= 7
(420.6)2 𝑦 = 994.2444
35119.7 −
7
𝑚 = 14.4238
𝑙𝑎𝑠 𝑣𝑒𝑛𝑡𝑎𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎𝑠 𝑝𝑎𝑟𝑎 𝑢𝑛𝑎 𝑚𝑎𝑟𝑐𝑎 𝑞𝑢𝑒 𝑔𝑎𝑠𝑡𝑒 70 𝑚𝑖𝑙𝑙𝑜𝑛𝑒𝑠 𝑑𝑒 𝑑𝑜𝑙𝑎𝑟𝑒𝑠 𝑒𝑛 𝑝𝑢𝑏𝑙𝑖𝑐𝑖𝑑𝑎𝑑 𝑒𝑠 𝑑𝑒 994.2444
¿Cuál es la cantidad entintada de quejas por 100 000 pasajeros, si el porcentaje de vuelos
puntuales es de 80 porciento?
Regulación lineal simple
27
𝑦 = 𝑚𝑥 + 𝑏
(666.60)(7.18)
522.7710 −
𝑚= 9 = −0.0698
(666.60)2
49502.26 − 9
𝑏 = 0.7978 − (−0.0698)(7406670 = 5.9643
𝑦 = −0.0698𝑥 + 5.9643
Mínimos cuadrados
129.42
𝑆𝑥2 = = 14.38
9
0.8192
𝑆𝑦2 = = 0.0910
9
−9.0277
𝑆𝑥𝑦 = = −1.0031
9
−1.0031
𝑏= = −0.0698
14.38
𝑎 = 0.7978 + (−0.00698)(74.0667) = −4.3721
𝑦 = −4.3721 − 0.0698𝑥
Cuando x=100
𝑦 = −0.0698(100 − 74.0667) + 0.7978 = −1.0112
Límites de predicción o estimación
1 (𝑥 − 𝑥 )2
𝐿𝑠⁄ = 𝑦 ± 𝑡𝑛−2 𝑆𝑥𝑦 √1 + +
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛
1 (100 − 74.0667)2
𝐿𝑠⁄ = −1.0112 ± (1.4149)(0.1451)√1 + +
9 (666.60)2
49502.26 − 9
𝐿𝑠 = −0.4957
𝐿𝑠 = −1.5267
Error estándar de Estimación
28
2
2
𝑆𝑦𝑥
𝑆𝑥𝑦 = 𝑆𝑦2 − 2
𝑆𝑥
2
1.0062
𝑆𝑥𝑦 = 0.0910 − = 0.0210
14.38
𝑆𝑦𝑥 = √0.0210 = 0.144
𝑆𝑦2 =0.0910
1.0062
𝑅2 = = 0.7687
(14.38)(0.0910)
𝐿𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑞𝑢𝑒 𝑒𝑥𝑖𝑠𝑡𝑒 𝑒𝑛𝑡𝑟𝑒 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑝𝑢𝑛𝑡𝑢𝑎𝑙𝑖𝑑𝑎𝑑 𝑦 𝑞𝑢𝑒𝑗𝑎𝑠 𝑒𝑠 𝑅𝑒𝑔𝑢𝑙𝑎r
0.6 < 0.7687 < 0.8
17. Los siguientes índices se utilizan como medidas del movimiento global en el
mercado de acciones. El índice DJIA se basa en los movimientos de precios de 30
compañías grandes; el S&P 500 es un índice compuesto de 500 acciones. Algunos
opinan que el índice S&P 500 es una mejor medida del desempeño del mercado
accionario debido a que tiene una base más amplia. A continuación, se dan los
precios de cierre para los Indices DJIA y S&P 500 durante 10 semanas, empezando
el 11 de febrero de 2000.
29
Suponga que el precio de cierre para el DJIA es 11000. Estime el precio de cierre para el
índice S&P 500.
Mínimos cuadrados:
𝑦 = 670.8775 + 0.0785(1100)
𝑦 = 579300.5625
18. La empresa Nielsen Media Research reúne datos que muestran qué publicistas
obtienen la mayor difusión durante las horas estelares de transmisión en 6 redes
televisivas. A continuación se presentan los datos de la cantidad de familias
espectadoras, en millones. y la cantidad de veces que salió el anuncio al aire durante
la semana del 28 de abril al 4 de mayo de 1997 (USA Today, 5 de mayo de 1997).
30
¿Cuál es la cantidad estimada de familias espectadoras si un anuncio sale 15 veces al aire
en una semana?
Regresion Lineal Simple
𝑥 𝑦 𝑥 𝑦 𝑥2
28 191.7 5367.6000 784.0000
20 174.6 3492.0000 400.0000
14 161.3 2258.2000 196.0000
16 161.1 2577.6000 256.0000
16 147.7 2363.2000 256.0000
16 146.3 2340.8000 256.0000
11 138.2 1520.2000 121.0000
= 121.0000 1120.9000 19919.6000 2269.0000
𝑥 = 17.2857 𝑦 =160.1286
𝑛= 7
31
𝛴𝑥𝛴𝑦 121 ∗ 1120.9
Σ𝑥𝑦 − 19919.6 −
𝑚= 𝑛 7
( 𝛴𝑥 ) 2 = 121 2 = 3.0662
2
𝛴𝑥 − 𝑛 2269 − 7
𝛴𝑦 𝛴𝑥 1120.9 121
𝑏= −𝑚∗ = − 3.0662 ∗ = 107.1271
𝑛 𝑛 7 7
𝑦 = 𝑚𝑥 + 𝑏 = 3.0662𝑥 + 107.1271
𝑃𝑜𝑟 𝑒𝑛𝑑𝑒, 𝑎𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑞𝑢𝑒 ℎ𝑎 𝑠𝑎𝑙𝑖𝑑𝑜 𝑒𝑙 𝑎𝑛𝑢𝑛𝑐𝑖𝑜 15 𝑣𝑒𝑐𝑒𝑠 𝑎𝑙 𝑎𝑖𝑟𝑒, 𝑜𝑏𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 ℎ𝑎
𝑎𝑙𝑐𝑎𝑛𝑧𝑎𝑑𝑜 𝑎 153.1201 𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑐𝑡𝑎𝑑𝑜𝑟𝑎𝑠. 𝑇𝑜𝑚𝑎𝑛𝑑𝑜 𝑒𝑛 𝑐𝑢𝑒𝑛𝑡𝑎 𝑞𝑢𝑒 𝑅2
= 0.8197 𝑠𝑒
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑛 𝑒𝑙 𝑟𝑎𝑛𝑔𝑜 𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒 (0.8 < 𝑅2 < 0.9)
[Link] gerente de ventas reunió los siguientes datos relacionados con las ventas
anuales y en años de experiencia.
X: Años de experiencia.
Y: Ventas anuales en miles de pesos.
32
Determinar el intervalo de predicción para un vendedor con 9 años de experiencia se tiene:
𝑇𝑎 1 ( 𝑥 − 𝑥 )2
𝑦𝑝 = 𝑦 ± ( (𝑛 − 2)) ∙ 𝑆𝑒 ∙ √1 + + − 𝑛(𝑥)2 )
2 𝑛 Σ𝑥 2
Sustituyendo:
1 (9 − 7)2
𝑦𝑝 = 108 ± 2,306 ∙ 4,61 (√1 + + )
10 632 − 10(7)2
20. PC World publicó las evaluaciones para las 15 computadoras portátiles más
vendidas. La puntuación de desempeño es una medida de qué tan rápido una PC
corre una combinación de aplicaciones de negocios en comparación con una
máquina de referencia. Por ejemplo, una PC con una puntuación de desempeño de
200 es dos veces más rápida que la máquina de referencia. Se utilizó una escala de
100 puntos para asignar una evaluación global a cada computadora portátil que se
probó en el estudio. Una puntuación de 90 o más es excepcional, en tanto que una de
más de 70 está arriba del promedio. A continuación, se muestran las puntuaciones
de desempeño y las evaluaciones globales para las 15 computadoras portátiles.
33
Estime la evaluación global para una nueva PC que tiene una puntuación de desempeño
de 225.
𝑝𝑢𝑛𝑡𝑢𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 2752
𝑃𝐹 = ∑ = = 183.46
15 15
𝑝𝑢𝑛𝑡𝑢𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 1177
𝐹=∑ = = 78.46
15 15
RegresiónLINEAL SIMPLE---MINIMOS CUADRADOS
LINEAL SIMPLE MINIMOSCUADRADOS
(𝑥 − 𝑥 )(𝑦 − 𝑦 ) 2
n 𝑋1 1 𝑥 ∗ 𝑦1 𝑥2 𝑥 −𝑥 𝑦 −𝑦 𝑥 −𝑥 𝑦 −𝑦 2
1 115 67 7705,0000 13225,0000 -68,4667 -11,4667 785,0844 4687,6844 131,4844
2 191 78 14898,0000 36481,0000 7,5333 -0,4667 -3,5156 56,7511 0,2178
3 153 79 12087,0000 23409,0000 -30,4667 0,5333 -16,2489 928,2178 0,2844
4 194 80 15520,0000 37636,0000 10,5333 1,5333 16,1511 110,9511 2,3511
5 236 84 19824,0000 55696,0000 52,5333 5,5333 290,6844 2759,7511 30,6178
6 184 76 13984,0000 33856,0000 0,5333 -2,4667 -1,3156 0,2844 6,0844
7 184 77 14168,0000 33856,0000 0,5333 -1,4667 -0,7822 0,2844 2,1511
8 216 92 19872,0000 46656,0000 32,5333 13,5333 440,2844 1058,4178 183,1511
9 185 83 15355,0000 34225,0000 1,5333 4,5333 6,9511 2,3511 20,5511
10 183 78 14274,0000 33489,0000 -0,4667 -0,4667 0,2178 0,2178 0,2178
11 189 77 14553,0000 35721,0000 5,5333 -1,4667 -8,1156 30,6178 2,1511
12 202 78 15756,0000 40804,0000 18,5333 -0,4667 -8,6489 343,4844 0,2178
13 192 78 14976,0000 36864,0000 8,5333 -0,4667 -3,9822 72,8178 0,2178
14 141 73 10293,0000 19881,0000 -42,4667 -5,4667 232,1511 1803,4178 29,8844
15 187 77 14399,0000 34969,0000 3,5333 -1,4667 -5,1822 12,4844 2,1511
∑= 2752,0000 1177,0000 217664,0000 516768,0000 1723,7333 11867,7333 411,7333
𝑥 =183,4667 𝑦 = 78,4667
Usando la ecuación y = 0.1452x + 51.819, la evaluación global estimada para una PC con
una puntuación de desempeño de 225 es aproximadamente 84.49.
21. Jacob Lee es un viajero frecuente entre Los Ángeles y San Francisco. El mes
pasado, anotó los tiempos de vuelo en tres aerolíneas distintas. Los resultados son:
34
b) Utilice el nivel de significancia de 0.05 y el proceso de prueba de hipótesis de
cinco pasos para comprobar si existen diferencias entre los tiempos medios de
vuelo de las tres aerolíneas.
ANÁLISIS DE VALOR
VARIANZA SUMA GL PROMEDI F PROBABILIDA CRÍTICO
O D
Origen de las 127,114286 2 63,557142 3,0362124 0,06203418 3,29453681
variaciones 9 1 6
Entre grupos 669,857143 32 20,933035
7
Dentro de los grupos
Total 796,971429 34
35
NIVEL DE FACTOR RESPUESTA
TIEMPOS DE
AEROLINEAS VUELO RESIDUOS
1 51 0,5
1 51 0,5
1 52 1,5
1 42 -8,5
1 51 0,5
1 57 6,5
1 47 -3,5
1 47 -3,5
1 50 -0,5
1 60 9,5
1 54 3,5
1 49 -1,5
1 48 -2,5
1 48 -2,5
2 50 -2,07142857
2 53 0,92857143
2 52 -0,07142857
2 62 9,92857143
2 53 9,92857143
2 49 -3,07142857
2 50 -2,07142857
2 49 -3,07142857
2 58 5,92857143
2 54 1,92857143
2 51 -1,07142857
2 49 -3,07142857
2 49 -3,07142857
2 50 -2,07142857
3 52 -3,71428571
3 55 -0,71428571
3 60 4,28571429
3 64 8,28571429
3 61 5,28571429
3 49 -6,71428571
3 49 -6,71428571
36
22. En un estudio del efecto de los comerciales de televisión sobre los niños de 12
años se midió el tiempo de su atención, en segundos. Los comerciales fueron de
ropa, alimentos y juguetes. Con un nivel de significancia de 0.05, ¿hay alguna
diferencia entre los lapsos de atención promedio de los niños con respecto a los
diversos comerciales? ¿Existen diferencias significativas entre pares de promedios?
Planteo hipótesis.
𝐻0 : 𝑢1 = 𝑢2 = 𝑢3
𝐻1 : 𝑢1 ≠ 𝑢2 ≠ 𝑢3
37
𝑶𝒓𝒊𝒈𝒆𝒏 𝑺𝑺 𝒈. 𝒍 𝑴𝑺 𝑭𝒐 𝒑− 𝑭 𝒄𝒓𝒊𝒕𝒊𝒄𝒐
𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 𝒗𝒂𝒍𝒐𝒓
Entre Grupos 3182,04 2 1591,02 35,56 0,0000 3,33
Total 4479,50 31
𝐻𝑜 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇6
RESUMEN 1 2 3 4 5 6
38
CUENTA 4 4 4 4 4 4
SUMA 794 1024 1250 830 905 1045
PROMEDIO 198,5 256 312,50 207,50 226,25 261,25
VARIANZA 7289 3170,67 6691,67 7941,67 1880,58 1872,92
No se rechaza 𝐻𝑜 si F<2,90
Se rechaza 𝐻𝑜 si F>2,90
Con el 95% del nivel de confianza, el tiempo promedio de las hamburguesas vendidas en
las 6 semanas es igual
39
Con el 95% del nivel de confianza, el promedio de hamburguesas que venden los 4
restaurantes son iguales.
40
Por lo tanto, no se encontraron diferencias significativas en la distancia recorrida que se
le pueda atribuir al tipo de gasolina utilizado o al automóvil en específico.
Bajo las condiciones de esta prueba, ni el tipo de gasolina, ni las diferencias entre los
automóviles afectan de forma significativa el rendimiento en términos de las millas
recorridas por galón de combustible.
41
25. Tres cadenas de supermercados del área de Denver, Colorado, afirman tener los
precios más bajos. Como parte de un estudio de investigación sobre la publicidad de
los supermercados, el Denver Daily News realizó un estudio. Primero seleccionó una
muestra aleatoria de nueve artículos. Luego, verificó el precio de cada artículo
42
[Link] estudiar el efecto de la temperatura en el rendimiento de un proceso
químico, se produjeron cinco lotes con cada uno de los tres tratamientos. Los
resultados se presentan a continuación. Dé la tabla para el análisis de varianza. Use
α= 0.05 para probar si la temperatura afecta el rendimiento medio del proceso.
𝐻𝑜: 𝑡1 = 𝑡2 = 𝑡3
𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑟𝑒𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
𝛼 = 5% = 0.05
𝐾−1 = 3−1 = 2
𝑛 − 𝑘 = 15 − 3 = 12
(450)2
𝑆𝑆𝑡𝑜𝑡𝑎𝑙 = 13806 − = 306
15
𝑆𝑆𝑇 = 13570 − 13500 = 70
𝑆𝑆𝐸 = 306 − 70 = 236
43
Se acepta la Ho, ya que el valor de F es menor a 3.885, por lo tanto, se concluye que no
hay diferencia significativa en el rendimiento por la influencia y varianza de las
temperaturas.
44
27. En una auditoría los auditores tienen que dar opiniones acerca de diversos
aspectos con base en sus propias experiencias directas, indirectas o en una
combinación de ambas. En un estudio se pidió a auditores que dieran su opinión
acerca de la frecuencia con que se presentan errores en una auditoría. Suponga que
se obtuvieron los resultados que se presentan a continuación; valores bajos indican
opiniones más acertadas. Use α = 0.05 para determinar si el tipo de experiencia en
que se basa la opinión afecta la calidad de la misma.
𝐻𝑂 = 𝜇1 = 𝜇2 = 𝜇3
45
𝐻1 = 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Comparando:
Conclusión: Se rechaza 𝐻𝑂 y se concluye que las medias de los grupos son diferentes,
por lo tanto, el tipo de experiencia si es significativa.
46
[Link] la publicidad de tres pinturas se dice que tienen el mismo tiempo de
secado. Para verificar esto, se prueban cinco muestras de cada una de las
pinturas. Se registra el tiempo en minutos necesario para que el secado sea
suficiente para la aplicación de una segunda mano. Los datos obtenidos son los
siguientes. Con α = 0.05 como nivel de significancia, realice una prueba para
determinar si la media de los tiempos de secado es la misma en todas las
pinturas.
47
Resultado:
El valor de F calculado es aproximadamente 2.471 con un valor p de 0.099. Como
p > 0.05, no rechazamos la hipótesis nula, lo que indica que no hay evidencia
suficiente para afirmar que los tiempos de secado de las pinturas son diferentes.
48
[Link] conocida revista de automovilismo tomo tres de los mejores automóviles
medianos fabricados en Estados Unidos, los probó y los comparó en relación
con varios criterios. En una prueba sobre rendimiento de la gasolina, se probaron
cinco automóviles de cada marca en un recorrido de 500 millas, los datos de
rendimiento, en millas por galón de gasolina, se presentan a contin- uación.
Use α = 0.05 para probar si la diferencia en el rendimiento medio, en millas por
galón, entre los tres automóviles es significativa.
49
30. Un comerciante de automóviles realiza una prueba para determinar si la
cantidad de tiempo en minutos que se necesita para una afinación de motor depende
de si se emplea un analizador computarizado o un analizador electrónico. Los datos
obtenidos son los siguientes. Use 𝜶 = 𝟎. 𝟎𝟓 y realice una prueba para determinar si
existe diferencia significativa entre los tratamientos.
Desarrollo:
Grafica:
50
51