Variables Dummy
Variables Dummy
la economía peruana”
2024-II
1) Consumer Reports examino ampliamente y presento las evaluaciones de 24
caminadoras. A cada caminadora se le dio una calificación general que se basaba
principalmente en su facilidad de uso; ergonomía, gama de ejercicio y calidad. En
general, una mejor calificación corresponde a un mejor funcionamiento. En la
información a continuación se presenta el precio, la evaluación de la calidad y la
puntuación general de las 24 caminadoras (Consumer Reports, febrero de 2006).
24 46100 7 14
10537000
x x=
t
46100 0 18100 25400
7 18100 7 0
14 25400 0 14
1837 65.660
x y=
t
3606200 ^β = 0.002
573 10.210
1061 5.925
Interpretaciones
(𝛽1 = 0.002):
A medida que aumenta en unas 100 unidades monetarias el precio de las
variable
(𝛽2 = 10.210):
(𝛽2 = 5.925):
En este caso, la relación con la calificación muy bueno, lo que significa que un
24 46100
10537000
46100
x x=
t
0
0.261030049 -0.000114202
¿ ¿= -0.000114202 0.000000059
1837 67.6762
x y=
t
3606200 ^β = 0.0046
Interpretaciones
(𝛽1 = 0.00046):
variable
ANÁLISIS DE VARIANZA
GL SC CM Fcal F tab
Regresión 1 358.2899 358.290 17.608 4.301
Residuos 22 447.6684 20.349
Total 23 805.9583
PRUEBA DE HIPOTESIS:
H 0 :B 0=B2=0
estudiando.
anterior.
a) REALIZAR MATRICIALMENTE EL CONTRASTE DE
SIGNIFICACION INDIVIDUAL.
2 141413−141103.9904
σ = =15.4505
24−4
H1 βi≠ 0 α 0.05
Ttab 2.0859
β2 0.0023 = 1.8845 Tcal 1.8845 < Ttab=2.0859
0.0012 no es significativo
β3 10.210 = 2.9697 Tcal 2.9697 > Ttab=2.0859
3.4379 sí es significativo
Decisión:
T 2
SCT=Y Y −n y
SCT=141413−24∗5858.6267=496.9487
T T 2
SCR=B x y−n y
SCR=141103.9403−24∗5858.6267=0.4639
SCE=SCT−SCR=0.5113−0.4639=0.0473
PRUEBA DE HIPOTESIS:
H 0 :B 1=B 2=B 3=B4 =0
estudiando.
2 SCR
R=
SCT
2 496.949
R= =0.616590 61.659 %
805.95833
Condición.
R>
(2n− p )
K
∗f 1−α ; k; n− p
2
=R sig
1+ (
n−p )
K
∗f 1−α ;k ;n− p
2
R =0.61659>
( 24−4 )
3
∗3.0983
=R
2
=0.3172
1+ (
24−4 )
sig
3
∗3.0983
Por lo tanto
2 2
R =0.61659> R sig =0. 3172
Decisión
El R2es significativo, por lo tanto, es apto para la predicción.
Caminadora buena
65.65972
x0 β 1 2000 0 0 * 0.00232 = 70.2911
10.20966
5.92464
Caminadora muy buena
65.65972
x0 β 1 2000 0 1 * 0.00232 = 76.2158
10.20966
5.92464
Interpretación
n 2.4162
A= = =0.0523
( )
n 3/ 2 3
∑e
2
2
( 12.8754 )
i=1
n
(∑ )
n
e4
i=1
n 367.4443
k= = =2. 2165
( )
2
n 2
( 12.8754 )
∑ e2
i=1
n
Datos:
𝛼 =5% JB = 0.6248
Entonces como:
Decisión:
Con un nivel de significancia del 95% se acepta la hipótesis nula: por lo tanto, la
normal.
e e t−1 ¿¿¿ e
2
3.4151 11.6627
5.3107 3.4151 3.5933 28.2031
-0.5849 5.3107 34.7581 0.3422
-2.9744 -0.5849 5.7094 8.8468
-0.1955 -2.9744 7.7220 0.0382
0.4992 -0.1955 0.4826 0.2492
-3.8165 0.4992 18.6254 14.5657
3.4052 -3.8165 52.1534 11.5955
-6.9946 3.4052 108.1569 48.9248
-3.2895 -6.9946 13.7280 10.8207
-5.5948 -3.2895 5.3143 31.3015
3.6571 -5.5948 85.5964 13.3741
5.3948 3.6571 3.0197 29.1039
6.7105 5.3948 1.7311 45.0309
4.2474 6.7105 6.0671 18.0401
-0.5211 4.2474 22.7379 0.2715
-0.2895 -0.5211 0.0536 0.0838
0.0999 -0.2895 0.1517 0.0100
-1.3632 0.0999 2.1408 1.8583
-2.2895 -1.3632 0.8580 5.2418
2.0246 -2.2895 18.6111 4.0989
-4.8263 2.0246 46.9351 23.2936
-0.9754 -4.8263 14.8296 0.9515
-1.0491 -0.9754 0.0054 1.1007
suma 452.9810 309.0096
n
1
∑ ( et −e t−1 )2
D W = i=1 n
∑ e2
i=1
452.9810
D W= =1.4659
309.0096
Planteamiento de la Hipótesis:
Datos: α =1 % k =4 𝐷𝑊=1.4659
Decisión
la Ho, por tanto, los datos son independientes, es decir no existe autocorrelación
en las variables.
1
VIF= 2
1−R
VARIABLES PRECIO ESCELENTE MUY BUENO
2
R 0.3916 0.7364 0.6519
VIF 1.6436 3.7936 2.8727
Decisión:
los valores VIF son menores a 10; por lo tanto, las variables no presentan
multicolinealidad.
proporcionó datos sobre la relación que tienen la edad, la presión sanguínea y el fumar
sobre el riesgo de sufrir un infarto. Los datos que se dan a continuación se obtuvieron
por 100) de que el paciente sufra un infarto en los próximos 10 años. Para fumar, defina
fumadora.
1 57 152 0 12
1 67 163 0 24
1 58 155 0 13
1 56
86 177 1
28
1 59 196 0
51
1 76 189 1
18
1 56 155 1 31
1 78 120 0 37
1 80 135 1 Y= 15
X= 1 78 98 0 22
1 72 152 0 36
1 70 173 1 15
1 67 135 1 48
1 15
77 209 1
36
1 60 199 0
8
34
3
37
1 82 119 1
1 66 166 0
1 80 125 1
1 62 117 0
1 59 207 1
20 1390 3142 10
T
X X= 1390 98366 216522 733
3142 216522 513838 1624
10 733 1624 10
539 -91.3340
T
X Y= 39220 β = 1.0703
88251 0.2511
368 8.9040
b) ¿Es el fumar un factor significativo para el riesgo de infarto? Explique. Use α = 0.05.
Realizar matricialmente el contraste de significación individual.
T
Y Y −β X Y
T T
2 18717−18183.718
2
σ = σ =
n−p 20−4
n= 20
p= 4
YT Y = 18717
T T
β X Y= 18183.718
σ2 = 33.3301
σ= 5.7732
Un error estándar de 5.77 indica que el modelo estimado presenta una baja
variabilidad en los datos, por lo que resultará ser confiable y preciso para realizar
predicciones.
2 T −1
Var−Cov ( β )=σ ( X X )
H0: βi = 0
H1: βi ≠ 0
n= 20
p= 4
GL= 16
α= 0.05
c) ¿Cuál es la probabilidad de que Art Apeen sufra un infarto en los próximos 10 años,
si tiene 68 años, fuma y su presión sanguínea es 175? ¿Qué recomendará a este
paciente?
Riesgo de sufrir infarto = -91.33 + 1.07 Edad + 0.25 Presión + 8.90 Fumar + u
Riesgo de sufrir infarto = -91.33 + 1.07 (68) + 0.25 (175) + 8.90 (1)
1 -91.3340
X0 = 68 β= 1.0703
175 0.2511
1 8.9040
Ŷ = X0T β = 34.2907
H0: β1 = β2 = β3 = β4 = 0
H1: Al menos un βi ≠ 0
α= 0.05
(valor p)
FV GL SC CM F Sig. F
Regresión 3 3657.6683 1219.2228 36.5802 0.000000216
Error 16 533.2817 33.3301
Total 19 4190.95 220.5763
Ftab = F1-α, k, n - p
FTab = 3.2389
CONCLUSIÓN: Con un nivel de confianza del 95% hay evidencia suficiente para
rechazar la hipótesis nula, con esto se concluye que el modelo de regresión es
significativo y, por lo tanto, es válido su uso para hacer pronósticos.
Las variables independientes en conjunto tienen un efecto significativo sobre el riesgo
de sufrir un infarto.
e) significación del coeficiente de determinación
2
R =SCR / SCT
2 3657.6683
R=
4190.95
R2 = 0.8728
Este valor nos indica que el 87.28% de la variabilidad en el riesgo de sufrir un infarto es
explicada por las variables incluidas en el modelo. Es decir, este modelo es capaz de
Esto significa que el modelo se ajusta bien a los datos y que las variables regresoras
2
R correg=1− ( CME
CMT )
2 33.3301
R corregido=1−
220.5763
R2 correg = 0.8489
esta variabilidad. Asimismo, indica que modelo tendrá muy buena precisión en la
mediante las variables explicativas incluidas en el modelo, lo que sugiere que hay otros
factores o variables que podrían estar influyendo en el riesgo de sufrir un infarto y que
SIGNIFICACIÓN DEL R2
k
∗F
n− p Tab
R2 > =R2 es significativo
k
1+ ∗F
n− p Tab
FTab = 3.2389
R2 > 0.6073
1.6073
e e2 e3 e4
4.1618 17.3203 72.0832 299.9934
2.6966 7.2715 19.6079 52.8740
3.3382 11.1437 37.2000 124.1814
1.9410 3.7675 7.3128 14.1943
6.9740 48.6363 339.1885 2365.4920
4.6316 21.4517 99.3555 460.1744
1.5749 2.4802 3.9059 6.1512
8.7188 76.0180 662.7879 5778.7343
-0.0920 0.0085 -0.0008 0.0001
-1.7576 3.0892 -5.4297 9.5433
-1.8934 3.5849 -6.7875 12.8513
0.0708 0.0050 0.0004 0.0000
-8.1775 66.8716 -546.8427 4471.8085
-4.4602 19.8930 -88.7261 395.7326
-7.8496 61.6159 -483.6590 3796.5198
0.7845 0.6154 0.4828 0.3787
-12.9863 168.6441 -2190.0644 28440.8464
-0.5813 0.3379 -0.1964 0.1141
-1.4025 1.9669 -2.7586 3.8688
4.3082 18.5602 79.9601 344.4801
promedio 26.6641 -100.1290 2328.8969
HIPÓTESIS DE LA PRUEBA
Ho: La distribución de los errores de los datos se aproximan a una normal
H1: La distribución de los errores de los datos no se aproximan a una normal
α= 0.05
n= 20
GL 16
Asimetría (A) -0.7272
Kurtosis (K) 3.2756
X2Tab 26.2962
JB = 1.8262
DECISIÓN: Se acepta la Ho, por lo tanto, la distribución de los errores de los datos
se ajusta a una distribución normal.
e e2 (e - e-1)2
4.1618 17.3203
2.6966 7.2715 2.1468
3.3382 11.1437 0.4117
1.9410 3.7675 1.9522
6.9740 48.6363 25.3307
4.6316 21.4517 5.4867
1.5749 2.4802 9.3437
8.7188 76.0180 51.0364
-0.0920 0.0085 77.6300
-1.7576 3.0892 2.7744
-1.8934 3.5849 0.0184
0.0708 0.0050 3.8579
-8.1775 66.8716 68.0342
-4.4602 19.8930 13.8186
-7.8496 61.6159 11.4882
0.7845 0.6154 74.5470
-12.9863 168.6441 189.6346
-0.5813 0.3379 153.8853
-1.4025 1.9669 0.6744
4.3082 18.5602 32.6112
Σ= 533.2817 724.6826
HIPÓTESIS DE LA PRUEBA
d= 724.683 d= 1.3589
533.282
DECISIÓN: Se acepta la Ho, por lo tanto, existe evidencia estadística de que los
residuos son independientes, es decir no existe autocorrelación entre los errores.
MATRIZ DE CORRELACIONES