INSTITUTO TECNOLÓGICO
SUPERIOR DE MISANTLA
INGENIERÍA EN GESTIÓN EMPRESARIAL
“ESTADISTICA INFERENCIAL II”
UNIDAD II REGRESION LINEAL MULTIPLE
ANALISIS DEL CASO DE ESTUDIO SOBRE
REGRESIÓN LINEAL MULTIPLE.
REGRESIÓN LINEAL MULTIPLE
ASESOR: DRA. YODAIRA BORROTO PENTON
PRESENTA:
GARCIA MENDOZA YARENI
MISANTLA, VERACRUZ A 16 DE MARZO DEL 2020
Generar todas las ecuaciones de regresión de Y con los valores
independiente X (hacer una tabla)
Ecuación SCT SCR R2 R2 Aju. S PRESS R2Pred
^y =b0+b1X1 Y= 2691.67 15.29 0.57% 0.00% 9.29164 2944.81 0.00%
110.6 + 0.060 x1
^y = b0+b2X2 Y= 2691.7 2423.2 90.03 89.70% 2.94278 297.918 88.93%
105.063+1.0027 x2 %
^y =b0+b3X3 Y= 2691.67 85.39 3.17% 0.05% 9.16917 2860.41 0.00%
120.56-0.141 x3
^y =b0+b4X4 Y=118.52-0.303 x4 2991.7 425.3 15.80 13.09% 8.55032 10207.7 0.00%
%
^y =b0+b1X1+b2X2 Y=103.30+0.0172 2691.67 2424.46 90.07 89.41% 2.98446 20.5091 23.81%
x1+1.0014 x2 %
^y =b0+b1X1+b3X3 Y=114.1+0.063 x1- 2691.67 102.00 3.79% 0.00% 9.29098 2891.44 0.00%
0.142 x3
^y =b0+b1X1+b4X4 Y=109.6+0.087 x1- 2691.67 456.80 16.97 11.44% 8.63109 10744.5 0.00%
0.310 x4 %
^y =b0+b2X2+b3X3 Y=104.64+1.0066 2691.67 2424.03 90.06 89.39% 2.98683 320.591 88.09%
x2+0.0142 x3 %
^y =b0+b2X2+b4X4 Y=105.34+0.9903 2691.67 2425.25 90.10 89.44% 2.98005 303.316 88.73%
x2-0.0228 x4 %
^y =b0+b1X1+b2X2 Y=102.94+0.0168 2691.67 24.25.22 90.10 89.08% 3.03113 2164.82 19.57%
+b3X3 x1+1.0052 x2+0.01 %
37 x3
^y =b0+b1X1+b2X2 Y=103.32+0.0200 2691.67 2426.90 90.16 89.15% 3.02156 2175.60 19.17%
%
+b4X4 x1+0.9876 x2-
0.0251 x4
^y =b0+b2X2+b3X3 Y=104.83+0.9937 2691.67 24.26.59 90.15 89.13% 3.03334 331.887 87.67%
%
+b4X4 x2+0.0184 x3-
0.0259 x4
^y =b0+b1X1+b2X2 Y=102.84+0.0198x 2691.67 2428.21 90.21 88.81% 3.06743 2353.36 12.57%
+b3X3+b4X4 1+0.9909x2+0.018 %
1x3-0.0282x4
Verificar el cumplimiento de los requisitos de la regresión Para la mejor
ecuación de regresión
ECUACION Y= 105.063+1.0027 x2
Normalidad de los residuos: en conclusión, si sigue una distribución normal en
los residuos.
PRUEBA DE HIPÓTESIS PARA LA NORMALIDAD DE LOS RESIDUOS
H0: Los residuos siguen una distribución normal.
H1: Los residuos no siguen una distribución normal.
n= 33 ; ɑ= 0.05
Nivel de confianza
(1- ɑ) *100
1-0.05*100= 95= 95%
Nivel de significación
ɑ= 0.05= 5%
Estadístico de prueba
AD= 1.236
Valor D= 0.005 Significación estadística de la prueba
RD: Región critica H0 si la significación estadística de la prueba que se está
analizando es menor o igual al nivel de significancia se rechaza H0.
RC= 0.648 > 0.05 No se cumple la región, entonces no hay suficiente evidencia
para rechazar la hipótesis nula, por lo que se rechaza H0.
Conclusión: Si se cumple el requisito de normalidad con una probabilidad de
error del 5%.
Varianza constante en los residuos: en conclusión, se distribuyen
aleatoriamente alrededor del cero, por lo que no sigue un patrón de
comportamiento.
Independencia de residuos: Sí hay independencia porque los puntos no
demuestran un patrón estable de variabilidad.
Prueba de Durbin Watson
H0: ρ=0 Los residuos son independientes.
H1: ρ ≠ 0Los residuos no son independientes.
n= 10; ɑ= 0.05
Nivel de confianza
(1- ɑ) *100
1-0.05*100= 95= 95%
Nivel de significación
ɑ= 0.05= 5%
Estadígrafo de prueba
n 2
∑ ( e i −e i−1)
d= i=2 n e i= y i− ^yi
∑ e2i
Estadígrafo: i=1 = 1.03034 siendo
Regla de decisión
Región critica du: 1.991
Región de aceptación dL: 0.994
Conclusión: Como dL= 0.994 < D=1.03034 < du=1.991 sí hay independencia
porque los puntos no demuestran un patrón estable de variabilidad
Realizar la prueba de hipótesis para comprobar si la regresión es o no
significativa.
PRUBA DE HIPOTESIS PARA LA MEJOR ECUACION
Y=105.063+1.0027 x2
H0: B1=0
H1: B1 ≠0.
n= 33
Nivel de confianza
(1- ɑ) *100
1-0.05*100= 95= 95%
Nivel de significación
Nivel de confianza: 5%
CMR 2423.2
Estadígrafo: F=
CME
= 8.6612 = 279.776
n
2
SCT= Y’y- n ý = Syy=∑ ¿¿ ) 2= 2691.7
i=1
SCR= b’x’y-n ý 2 = 2423.2
SCE=SCT-SCR= 268.5
TABLA ANVA
FV SC GL CM F
Regresión 2423.2 1 2423.2 279.776
Error 268.5 31 8.6612
Total 2691.7 32
Región Critica
279.776 ˃ 4.14
F Fisher: F0.05;4;5= 4.14
Como 279.776 ˃ 4.14 se cumple la Región Critica, por lo tanto, se rechaza H0.
Conclusión: La regresión si es significativa porque “y” depende de “x”, con una
probabilidad de haber rechazado H0 del 5%.
Calidad de ajuste
S= √CME=¿ ¿ √ 8.6612 = 2.94
SCR 2423.2
R ²= ∗¿ 100= ∗¿100 = 96..03% Es buena para estimar porque la
SCT 2691.7
variabilidad es poca para poder hacerlo.
Seleccione la mejor ecuación de regresión teniendo en cuenta todos los
estadígrafos calculados anteriormente.
Nota: Color amarillo indica en cada uno de los cálculos cual es la mejor
Ecuación SCT SCR R2 R2 Aju. S PRESS R2Pred
^y =b0+b1X1 Y= 2691.67 15.29 0.57% 0.00% 9.29164 2944.81 0.00%
110.6 + 0.060 x1
^y = b0+b2X2 Y= 2691.7 2423.2 90.03 89.70% 2.94278 297.918 88.93%
105.063+1.0027 x2 %
^y =b0+b3X3 Y= 2691.67 85.39 3.17% 0.05% 9.16917 2860.41 0.00%
120.56-0.141 x3
^y =b0+b4X4 Y=118.52-0.303 x4 2991.7 425.3 15.80 13.09% 8.55032 10207.7 0.00%
%
^y =b0+b1X1+b2X2 Y=103.30+0.0172 2691.67 2424.46 90.07 89.41% 2.98446 20.5091 23.81%
x1+1.0014 x2 %
^y =b0+b1X1+b3X3 Y=114.1+0.063 x1- 2691.67 102.00 3.79% 0.00% 9.29098 2891.44 0.00%
0.142 x3
^y =b0+b1X1+b4X4 Y=109.6+0.087 x1- 2691.67 456.80 16.97 11.44% 8.63109 10744.5 0.00%
0.310 x4 %
^y =b0+b2X2+b3X3 Y=104.64+1.0066 2691.67 2424.03 90.06 89.39% 2.98683 320.591 88.09%
x2+0.0142 x3 %
^y =b0+b2X2+b4X4 Y=105.34+0.9903 2691.67 2425.25 90.10 89.44% 2.98005 303.316 88.73%
x2-0.0228 x4 %
^y =b0+b1X1+b2X2 Y=102.94+0.0168 2691.67 24.25.22 90.10 89.08% 3.03113 2164.82 19.57%
+b3X3 x1+1.0052 x2+0.01 %
37 x3
^y =b0+b1X1+b2X2 Y=103.32+0.0200 2691.67 2426.90 90.16 89.15% 3.02156 2175.60 19.17%
%
+b4X4 x1+0.9876 x2-
0.0251 x4
^y =b0+b2X2+b3X3 Y=104.83+0.9937 2691.67 24.26.59 90.15 89.13% 3.03334 331.887 87.67%
%
+b4X4 x2+0.0184 x3-
0.0259 x4
^y =b0+b1X1+b2X2 Y=102.84+0.0198x 2691.67 2428.21 90.21 88.81% 3.06743 2353.36 12.57%
+b3X3+b4X4 1+0.9909x2+0.018 %
1x3-0.0282x4
Conclusión: La ecuación de regresión Y= 105.063+1.0027 x2 es la mejor,
tomando en cuenta cada uno de los cálculos, además la regresión es significativa
porque Y depende de X.
En el artículo menciona que también una manera de darnos cuenta cual es la
mejor ecuación para pronosticar el nivel dinámico de los acuíferos de los pozos de
Celaya es mediante los parámetros de regresión obtenidos en el ANOVA (Análisis
de Varianza) indica un comportamiento normal, para ello debemos identificar el
menor cuadrado medio del error. Con ello nos damos cuenta que de cualquier
manera se comprueba que es la mejor ecuación.
Ecuación CME
Y= 110.6 + 0.060 x1 86.33
Y= 105.063+1.0027 x2 8.66
Y= 120.56-0.141 x3 84.07
Y=118.52-0.303 x4 73.11
Y=103.30+0.0172 x1+1.0014 x2 8.91
Y=114.1+0.063 x1-0.142 x3 86.32
Y=109.6+0.087 x1-0.310 x4 74.50
Y=104.64+1.0066 x2+0.0142 x3 8.92
Y=105.34+0.9903 x2-0.0228 x4 8.88
Y=102.94+0.0168 x1+1.0052 x2+0. 9.19
0137 x3
Y=103.32+0.0200 x1+0.9876 x2 9.13
-0.0251 x4
Y=104.83+0.9937 x2+0.0184 x3 9.14
-0.0259 x4
Y=102.84+0.0198x1+0.9909x2+0.0 9.41
181x3-0.0282x4