ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
Paralelo: 04 Periodo: I PAO
Materia: Estadística II
Práctica: Regresión Lineal Múltiple
Fecha: 30 de julio del 2022 Duración 60
: minutos
Ejemplo: Una compañía quiere programar la producción para el resto del año y necesita un
pronóstico de las ventas totales. En sus registros tienen un millón de dólares, las ventas
realizadas y los gastos de publicidad e insumos de sus productos de los últimos 10 meses
como se muestra en la siguiente tabla:
------------------------------------------------------------------------------------------------------------
ventas<-c(333, 310, 311, 290,342,348,327,275, 311,298)
publicidad<-c(55,59,69,65,71,67,76,59,77,64)
insumos<-c(96,84,74,66,91,86,78,66,67,75)
tabla <-data.frame(ventas,publicidad,insumos)
tabla
ventas publicidad insumos
1 333 55 96
2 310 59 84
3 311 69 74
4 290 65 66
5 342 71 91
6 348 67 86
7 327 76 78
8 275 59 66
9 311 77 67
10 298 64 75
--------------------------------------------------------------------------------------------------------------
Comandos para el análisis del Modelo:
lm() # sirve para estimar los coeficientes del modelo de regresión lineal
summary() #proporciona detalles del contenido del modelo
confint (modelo, level=0.95)# Intervalo de confianza para los objetos de clase "lm" se
utilizan las fórmulas directas basadas en valores t
modelo <-lm(ventas~ publicidad + insumos, data=tabla)
modelo
Call:
lm(formula = ventas ~ publicidad + insumos, data = tabla)
Coefficients:
(Intercept) publicidad insumos
37.307 1.717 2.088
summary(modelo)
Call:
lm(formula = ventas ~ publicidad + insumos, data = tabla)
Residuals:
Min 1Q Median 3Q Max
-7.2625 -3.9535 -0.3904 1.3542 16.0477
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 37.3067 34.2845 1.088 0.3126
publicidad 1.7175 0.3555 4.831 0.0019 **
insumos 2.0881 0.2431 8.590 5.77e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 7.468 on 7 degrees of freedom
Multiple R-squared: 0.9196, Adjusted R-squared: 0.8966
F-statistic: 40.03 on 2 and 7 DF, p-value: 0.0001475
confint(modelo, level=0.95)
2.5 % 97.5 %
(Intercept) -43.7633303 118.376773
publicidad 0.8767425 2.558180
insumos 1.5133169 2.662861
#Calcular los residuos#
ei <- ventas - fitted(modelo)
ei
1 2 3 4 5 6 7
0.77639 -4.03638 0.66988 3.24444 -7.26254 0.04774 -3.704693
8 9 10
-1.4507882 1.5468207 -5.83089
----------------------------------------------------------------------------------------------------------------
El modelo predictivo ^y =¿ 37.30+1.7171 x 1+2.088 x 2
Contraste de hipótesis general de todos los parámetros:
H 0 : β 0=β 1=β 2=…=β k =0
H 1 : βk ≠ 0 para al menos una k
Tabla de Análisis de la Varianza
Fuente de Grados de Suma
Media Cuadrática Estadístico de prueba
variación libertad (g.l.) cuadrática
SCR= MCR=¿ MCR
F o= =¿40.03
Regresión 2 MCR*2 F o∗MCE=¿2232.5 MCE
4465.03 1 P valor= 0.0001475
SCE=
Error MCE*7 2
7 MCE=S =¿55.771 -
(residual)
390.40
SCT=
Total 9 - -
4855.43
Con un 95% de confianza, se rechaza Ho, ya que su P_valor= 0.0001475 < 0.05.
Por lo tanto, existe algún parámetro del modelo que es diferente de cero.
Contraste de hipótesis por cada parámetro:
H 0 : β 0=0
H 1 : β0 ≠ 0
H 0 : β 1=0
H 1 : β1 ≠ 0
H 0 : β 2=0
H 1 : β2 ≠ 0
Predicció Coeficiente EP (T) Valor P Resultado prueba
n
Constante β 0=¿ 37.30 1.088 0.3126 No se rechaza H0
Publicidad β 1=¿ 1.717 4.831 0.0019 Se rechaza H0
Insumos β 2=¿ 2.088 8.590 5.77e- Se rechaza H0
05
Intervalos de confianza
IC I-inf I-Sup
β0 -43.7633303 118.376773
β1 0.8767425 2.558180
β2 1.5133169 2.662861
Residuos
(Valor (Valor
Observ. Publicidad Insumos Residuos
observado) estimado)
1 55 96 333 332.22361 0.77639
2 59 84 310 314.03638 -4.03638
3 69 74 311 310.33012 0.66988
4 65 66 290 286.75556 3.24444
5 71 91 342 349.26254 -7.26254
6 67 86 348 347.95226 0.04774
7 76 78 327 330.704693 -3.704693
8 59 66 275 276.450788 -1.4507882
9 77 67 311 310.453179 0.5468207
10 64 75 298 303.83089 -5.83089
PRACTICA ASINCRÓNICA
EJERCICIO:
Considere los datos de la siguiente tabla:
y X1 X2 X3
480 50 71 92
472 66 68 91
580 90 75 89
548 120 74 88
602 130 76 92
632 144 78 95
600 160 75 88
592 168 73 87
534 150 72 89
552 120 75 92
576 80 81
100
522 76 69 90
a) Verifique la correlación entre las variables. (5 puntos)
La correlación que tienen las variables se presenta con el siguiente modelo predictivo:
b) Determine los parámetros relacionado al modelo de regresión lineal múltiple. (5 puntos)
c) Elabore el IC. al 98% para los parámetros β 0, β 1 , β 2 y β 3 estimados anteriormente y
concluya sobre los resultados. (15 puntos, donde el 80% corresponden a las conclusiones)
d) probar si al menos una variable independiente contribuye significativamente al modelo,
utilice un nivel de significancia de 0.05, concluya al respecto (utilice la tabla ANOVA y el
estadístico F asociado al contraste de hipótesis). (15 puntos, donde el 80% corresponden a
las conclusiones)
e) En el modelo planteado, realizar la prueba para los parámetros β i, i = 0, 1, 2, 3 al nivel del
95% y concluya al respecto. (10 puntos, donde el 80% corresponden a las conclusiones)
f) Calcular el coeficiente de determinación y también el ajustado, concluir sobre los
resultados. (15 puntos, donde el 80% corresponden a las conclusiones)
g) Verifique los supuestos relacionados a los residuos y concluya sobre estos. (10 puntos)
h) Con todos los resultados obtenidos, Indique si es un buen modelo, justifique su respuesta.
(25 puntos).