ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof.
JULIA MARCANO /2023
Ejercicio 11.9 - Walpole. Un comerciante minorista realizó un estudio para determinar la relación que hay entre
los gastos semanales de publicidad y las ventas.
Costo de 40 20 25 20 30 50 40 20 50 40 25 50
publicidad
($)
Ventas ($) 385 400 395 365 475 440 490 420 560 525 480 510
a) Elabore un diagrama de dispersión.
b) Calcule la ecuación de la recta de regresión para pronosticar las ventas semanales a partir de los gastos
de publicidad.
c) Estime las ventas semanales si los costos de publicidad son de $35.
d) Grafique los residuales en comparación con los costos de publicidad.
DESARROLLO
Parte a: Elabore un diagrama de dispersión.
X: Costo de publicidad ($) Y: Ventas ($)
Ventas ($) vs Costos de publicidad ($)
600
500
400
Ventas ($)
300
200
100
0
0 10 20 30 40 50 60
Costo de publicidad ($)
Parte b: Calcule la ecuación de la recta de regresión para pronosticar las ventas semanales a partir de los gastos
de publicidad.
La ecuación de regresión es:
𝑉𝑒𝑛𝑡𝑎𝑠($) = 𝛽0 + 𝛽1 ∗ 𝐶𝑜𝑠𝑡𝑜𝑠 𝑑𝑒 𝑝𝑢𝑏𝑙𝑖𝑐𝑖𝑑𝑎𝑑($)
Hay que estimar los parámetros de la regresión 𝛽0 y 𝛽1 . Por lo tanto, se requiere calcular lo siguiente:
∑𝑛𝑖 𝑥𝑖 , ∑𝑛𝑖 𝑦𝑖 , ∑𝑛𝑖 𝑥𝑖 𝑦𝑖 y ∑𝑛𝑖 𝑥𝑖2 .
En la tabla siguiente se obtienen los valores y se sustituyen en la ecuación de los parámetros.
X: Costo de publicidad ($) Y: Ventas ($)
1
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
Representación Matemática
Datos X Y X*Y X2
1 40 385 15400 1600
2 20 400 8000 400
3 25 395 9875 625
4 20 365 7300 400
5 30 475 14250 900
6 50 440 22000 2500
7 40 490 19600 1600
8 20 420 8400 400
9 50 560 28000 2500
10 40 525 21000 1600
11 25 480 12000 625
12 50 510 25500 2500
∑ 𝑋𝑖 = 4210 ∑ 𝑌𝑖 = 5445 ∑ 𝑋𝑖 𝑌𝑖 = 191325 ∑ 𝑋𝑖2 = 15650
∑𝑛𝑖 𝑦𝑖 ∑𝑛𝑖 𝑥𝑖
∑𝑛𝑖 𝑥𝑖 𝑦𝑖 − 191325 − (5445 ∗ 410⁄12)
𝛽̂1 = 𝑛 = = 3.22
𝑛 2 ∑𝑛𝑖 𝑥𝑖 ∑𝑛𝑖 𝑥𝑖 15950 − (4210 ∗ 410⁄ )
∑𝑖 𝑥𝑖 − 12
𝑛
∑𝑛𝑖 𝑦𝑖 ∑𝑛𝑖 𝑥𝑖 5445 4210 ∗ 4210
𝛽̂0 = − 𝛽̂1 = − 3.22 ∗ = 343.7
𝑛 𝑛 12 12
La ecuación de regresión estimada es:
𝑉𝑒𝑛𝑡𝑎𝑠($) = 343.7 + 3.22 ∗ 𝐶𝑜𝑠𝑡𝑜𝑠 𝑑𝑒 𝑝𝑢𝑏𝑙𝑖𝑐𝑖𝑑𝑎𝑑($)
El modelo de regresión es:
𝑉𝑒𝑛𝑡𝑎𝑠($) = 343.7 + 3.22 ∗ 𝐶𝑜𝑠𝑡𝑜𝑠 𝑑𝑒 𝑝𝑢𝑏𝑙𝑖𝑐𝑖𝑑𝑎𝑑($) + 𝜖
𝑌̂ = 343.7 + 3.22𝑋 + 𝜖
Interpretación:
El valor de 𝛽̂1 = 3.22 indica el incremento de las ventas promedio en dólares, por cada unidad de aumento en los
costos de publicidad en dólares.
El valor de 𝛽̂0 = 343.7, representa las ventas en dólares en la semana.
Parte c: Estime las ventas semanales si los costos de publicidad son de $35.
Con costos de publicidad de $35 las ventas son
𝑉𝑒𝑛𝑡𝑎𝑠($) = 343.7($) + 3.22 ∗ 35($) = 456.43
𝑌̂ = 343.7 + 3.22 ∗ 35 = 456.43
2
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
Parte d: Grafique los residuales en comparación con los costos de publicidad. Comente sus resultados.
Los residuales o errores se obtienen aplicando la siguiente ecuación:
𝑒 = 𝑌𝑖 − 𝑌̂𝑖
Donde:
𝑌: 𝑣𝑒𝑛𝑡𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 (𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑠)
𝑌̂: 𝑣𝑒𝑛𝑡𝑎𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎𝑠 𝑐𝑜𝑛 𝑙𝑎 𝑒𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑎 𝑐𝑎𝑑𝑎 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑋
Se grafica los residuales con
𝑒 = 𝑌𝑖 − 𝑌̂𝑖
Datos X Y 𝑌̂
1 40 385 472.54 -87.54
2 20 400 408.12 -8.12
3 25 395 424.23 -29.23
4 20 365 408.12 -43.12
5 30 475 440.33 34.67
6 50 440 504.75 -64.75
7 40 490 472.54 17.46
8 20 420 408.12 11.88
9 50 560 504.75 55.25
10 40 525 472.54 52.46
11 25 480 424.23 55.77
12 50 510 504.75 5.25
∑ 𝑋𝑖 = 4210 ∑ 𝑌𝑖 = 5445 ∑ 𝑋𝑖 𝑌𝑖 = 5445 ∑ 𝑒𝑖 = 0
Para X = 40, el valor de 𝑌̂ es:
𝑌̂ = 343.7 + 3.22 ∗ 40 = 472.54
Se grafica las ventas estimadas con los residuales:
Residuales y los costos de publicidad semanal
100.00
50.00
ei
0.00
0 10 20 30 40 50 60
-50.00
-100.00
Costos de Publicidad
3
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
Residuales y las ventas semanales
100.00
50.00
ei 0.00
0 10 20 30 40 50 60
-50.00
-100.00
Y estimado
Diagrama de dispersión con la ecuación de regresión:
Ventas ($) vs Costos de publicidad ($)
600
500
400
Ventas ($)
300
200
100 y = 3.2208x + 343.71
0
0 10 20 30 40 50 60
Costo de publicidad ($)
Una aplicación importante del análisis de regresión en la contaduría es la estimación de costos. Partiendo de
datos sobre volumen de producción y costos, y empleando el método de mínimos cuadrados para desarrollar
una ecuación de regresión estimada que relacione ambos datos, un contador puede calcular los costos
correspondientes a un determinado volumen de producción. Considere la siguiente muestra de datos sobre
volumen de producción y costo total de una operación de manufactura.
Volumen de Producción 400 450 550 600 700 750
(unidades)
Costo total ($) 4000 5000 5400 5900 6400 7000
a) Utilice estos datos para desarrollar la ecuación de regresión estimada útil a efecto de pronosticar los
costos totales dado un volumen de producción determinado.
b) ¿Cuál es el costo variable por unidad producida?
c) Calcule el coeficiente de determinación.
d) ¿Qué porcentaje de la variación en los costos totales puede ser explicada por el volumen de producción?
e) Realice el análisis de varianza, e interprete el resultado. Con un nivel de significación de 0.05.
4
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
DESARROLLO
Parte a: Desarrollar la ecuación de regresión estimada útil a efecto de pronosticar los costos totales dado un
volumen de producción determinado.
La ecuación de regresión es:
𝐶𝑜𝑠𝑡𝑜 𝑡𝑜𝑡𝑎𝑙($) = 𝛽0 + 𝛽1 ∗ 𝑉𝑜𝑙𝑢𝑚𝑒𝑛 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛(𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠)
Hay que estimar los parámetros de la regresión 𝛽0 y 𝛽1 . Por lo tanto, se requiere calcular lo siguiente:
∑𝑛𝑖 𝑥𝑖 , ∑𝑛𝑖 𝑦𝑖 , ∑𝑛𝑖 𝑥𝑖 𝑦𝑖 y ∑𝑛𝑖 𝑥𝑖2 .
En la tabla siguiente se obtienen los valores y se sustituyen en la ecuación de los parámetros.
X: Costo de publicidad ($) Y: Ventas ($)
Representación Matemática
Datos X Y X*Y X2 Y2
1 400 4,000 1,600,000 160,000 16000000
2 450 5,000 2,250,000 202,500 25000000
3 550 5,400 2,970,000 302,500 29160000
4 600 5,900 3,540,000 360,000 34810000
5 700 6,400 4,480,000 490,000 40960000
6 750 7,000 5,250,000 562,500 49000000
∑ 𝑋𝑖 = 3,450 ∑ 𝑌𝑖 = 33,700 ∑ 𝑋𝑖 𝑌𝑖 = 20,090,000 ∑ 𝑋𝑖2 = 15,650 ∑ 𝑌𝑖2
= 194930000
∑𝑛𝑖 𝑦𝑖 ∑𝑛𝑖 𝑥𝑖
∑𝑛𝑖 𝑥𝑖 𝑦𝑖 − 20090000 − (33700 ∗ 3450⁄6)
𝛽̂1 = 𝑛 = = 7.60
𝑛 2 ∑𝑛𝑖 𝑥𝑖 ∑𝑛𝑖 𝑥𝑖 15950 − (3450 ∗ 3450⁄ )
∑𝑖 𝑥𝑖 − 6
𝑛
∑𝑛𝑖 𝑦𝑖 ∑𝑛𝑖 𝑥𝑖 33700 3450 ∗ 3450
𝛽̂0 = − 𝛽̂1 = − 7.60 ∗ = 1246.67
𝑛 𝑛 6 6
La ecuación de regresión estimada es:
𝐶𝑜𝑠𝑡𝑜 𝑡𝑜𝑡𝑎𝑙($) = 1246.67 + 7.60 ∗ 𝑉𝑜𝑙𝑢𝑚𝑒𝑛 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛(𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠)
El modelo de regresión es:
𝐶𝑜𝑠𝑡𝑜 𝑡𝑜𝑡𝑎𝑙($) = 1246.67 + 7.60 ∗ 𝑉𝑜𝑙𝑢𝑚𝑒𝑛 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛(𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠) + 𝜖
𝑌̂ = 1246.67 + 7.60𝑋 + 𝜖
Interpretación:
El valor de 𝛽̂1 = 7.60 indica el incremento de los costos total promedio en dólares, por cada unidad de aumento
en el volumen de producción.
5
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
El valor de 𝛽̂0 = 1246.67, representa el costo total en dólares de lo fabricado mensual.
Parte b: ¿Cuál es el costo variable por unidad producida?
El valor de 𝛽̂1 = 7.60 indica el costo variable en dólares, por cada unidad producida.
Parte c: Calcule el coeficiente de determinación (𝑟 2 ).
𝑆𝐶𝑅
𝑟2 =
𝑆𝐶𝑇
1 𝑛
∑𝑛𝑖 𝑥𝑖 𝑦𝑖 − (∑𝑖 𝑥𝑖 )(∑𝑛𝑖 𝑦𝑖 )
𝑟𝑥𝑦 = 𝑛
√∑𝑛𝑖 𝑥𝑖2 − 1 (∑𝑛𝑖 𝑥𝑖 ) √∑𝑛𝑖 𝑦𝑖2 − 1 (∑𝑛𝑖 𝑦𝑖 )
2 2
𝑛 𝑛
De la tabla anterior se obtienen los datos
3450 ∗ 33700
20090000 − ( 6 )
𝑟𝑥𝑦 = = 0.9791
2 2
√2077500 − (3450) √194930000 − (33700)
6 6
𝑟 2 = (0.97912)2 = 0,9587
Parte d: ¿Qué porcentaje de la variación en los costos totales puede ser explicada por el volumen de producción?
r2 = 0,9587 indica que el 95.87% de la variación en los costos totales puede ser explicada por el volumen de
producción.
Parte e. Realice el análisis de varianza, e interprete el resultado. Con un nivel de significación de 0.05.
Las hipótesis para probar si es:
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
El estadístico de prueba es:
𝑆𝑆𝑅⁄
𝐹= 1 = 𝑀𝑆𝑅
𝑆𝑆𝐸⁄ 𝑀𝑆𝐸
𝑛−2
H0 debe rechazarse si 𝐹 > 𝐹𝛼,1,𝑛−2 (𝐹 > 𝐹0.05,1,5 = 7.71)
Fuente de Suma de cuadrados Grados de Media de F
variación libertad cuadrados
Regresión 𝑆𝑆𝑅 = 𝛽̂1 𝑆𝑥𝑦 1 𝑆𝑆𝑅 𝑀𝑆𝑅
𝑀𝑆𝑅 = 𝐹=
1 𝑀𝑆𝐸
Error 𝑆𝑆𝐸 = 𝑆𝑦𝑦 − 𝛽̂1 𝑆𝑥𝑦 n-2 𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑛−2
Total 𝑆𝑦𝑦 n-1
6
ESTADÍSTICA II EJERCICIOS DE REGRESIÓN LINEAL Prof. JULIA MARCANO /2023
Los cálculos se resumen en la siguiente tabla de Análisis de varianza:
Fuente de Suma de Grados de Media de cuadrados F
variación cuadrados libertad
Regresión 1 5415000.00 𝑀𝑆𝑅 5415000.00
𝑀𝑆𝑅 = 𝐹= =
1 𝑀𝑆𝐸 58333.33
5415000.00 = 5415000.00 = 92.829
Error n-2 = 4 233333.33 p-valor= 6,48 E-04
𝑀𝑆𝐸 =
5
233333.33 = 58333.33
Total 5648333.33 n-1= 4
∑𝑛𝑖 𝑦𝑖 33700
𝑌̅ = = = 5616.67
𝑛 6
Datos X (Volum produc) Y (Costo total) 𝑌̂ (𝑦𝑖 − 𝑦̂𝑖 )2 (𝑦̂𝑖 − 𝑦̅)2
1 400 4000 4286.67 82177.78 1768900.00
2 450 5000 4666.67 111111.11 902500.00
3 550 5400 5426.67 711.11 36100.00
4 600 5900 5806.67 8711.11 36100.00
5 700 6400 6566.67 27777.78 902500.00
6 750 7000 6946.67 2844.44 1768900.00
400 4000 4286.67 82177.78 1768900.00
𝑛
∑ 𝑦𝑖 = 33700
𝑖
∑𝑛𝑖(𝑦̂𝑖 − 𝑦̅)2 = 5415000 ∑𝑛𝑖(𝑦𝑖 − 𝑦̂𝑖 )2 = 233333.33 ∑𝑛𝑖(𝑦𝑖 − 𝑦̅)2 = 5648333.33
Conclusión: Se rechaza H0, porque Fcal > F(0,05; 1, 5) (92.829>7.71). Es decir, no existe evidencia
suficiente para aceptarla. Se concluye que existe relación entre el costo total y el volumen de
producción.