0% encontró este documento útil (0 votos)
30 vistas23 páginas

Variables Dummy

El documento presenta un análisis estadístico sobre la relación entre el precio y la calificación de caminadoras, utilizando modelos de regresión lineal y variables dummy. Se concluye que el modelo lineal simple es el más significativo para predecir la calificación, destacando que un aumento en el precio incrementa la calificación de las máquinas. Además, se examina la normalidad de los errores y se evalúa la significación de los coeficientes del modelo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
30 vistas23 páginas

Variables Dummy

El documento presenta un análisis estadístico sobre la relación entre el precio y la calificación de caminadoras, utilizando modelos de regresión lineal y variables dummy. Se concluye que el modelo lineal simple es el más significativo para predecir la calificación, destacando que un aumento en el precio incrementa la calificación de las máquinas. Además, se examina la normalidad de los errores y se evalúa la significación de los coeficientes del modelo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

“Año de la recuperación y consolidación de

la economía peruana”

FACULTAD DE CIENCIAS ECONÓMICAS


ESCUELA PROFESIONAL DE ECONOMÍA.
Asignatura:
Modelos estadísticos lineales.
TEMA:
Variables Dummy
AUTOR:
Ramos Flores Juan Carlos.
Docente:
DR. Blas Pérez Juan Santiago
Carrera:
Economía VI
Tumbes-Perú

2024-II
1) Consumer Reports examino ampliamente y presento las evaluaciones de 24
caminadoras. A cada caminadora se le dio una calificación general que se basaba
principalmente en su facilidad de uso; ergonomía, gama de ejercicio y calidad. En
general, una mejor calificación corresponde a un mejor funcionamiento. En la
información a continuación se presenta el precio, la evaluación de la calidad y la
puntuación general de las 24 caminadoras (Consumer Reports, febrero de 2006).

Precio Calidad Calificación


2900 Excelente 86
3500 Muy buena 85
2900 Excelente 82
3500 Excelente 81
2300 Excelente 81
2000 Excelente 81
3000 Excelente 79
1300 Muy buena 78
3200 Muy buena 72
1600 Muy buena 72
1300 Muy buena 69
1500 Excelente 83
2600 Muy buena 83
1600 Muy buena 82
1800 Muy buena 80
1700 Muy buena 75
1600 Muy buena 75
1000 Muy buena 74
1200 Muy buena 73
1600 Muy buena 73
1000 Bueno 70
1400 Muy buena 70
1000 Buena 67
600 Buena 66
a) Matricialmente encontrar el mejor modelo que se ajuste mejor a los datos
de la información.
Solución:
muy
calificación precio excelente bueno
86 1 2900 1 0
85 1 3500 0 1
82 1 2900 1 0
81 1 3500 1 0
81 1 2300 1 0
81 1 2000 1 0
79 1 3000 1 0
78 1 1300 0 1
72 1 3200 0 1
72 1 1600 0 1
69 1 1300 0 1
83 1 1500 1 0
83 1 2600 0 1
82 1 1600 0 1
80 1 1800 0 1
75 1 1700 0 1
75 1 1600 0 1
74 1 1000 0 1
73 1 1200 0 1
73 1 1600 0 1
70 1 1000 0 0
70 1 1400 0 1
67 1 1000 0 0
66 1 600 0 0

24 46100 7 14
10537000
x x=
t
46100 0 18100 25400
7 18100 7 0
14 25400 0 14

0.4067 -0.0001 -0.1877 -0.2531


¿ ¿= -0.0001 0.0000 -0.0002 -0.0001
-0.1877 -0.0002 0.7650 0.4925
-0.2531 -0.0001 0.4925 0.4925

1837 65.660
x y=
t
3606200 ^β = 0.002
573 10.210
1061 5.925

Interpretaciones

(𝛽1 = 0.002):
A medida que aumenta en unas 100 unidades monetarias el precio de las

maquinas, su calificación aumenta en 0. [Link] constantes la demás

variable

(𝛽2 = 10.210):

En este caso, la relación con la calificación excelente, lo que significa que un

cambio en la calificación de las maquinas tiene 10.21% de ser evaluada como

muy buena manteniendo constantes las demás variables.

(𝛽2 = 5.925):

En este caso, la relación con la calificación muy bueno, lo que significa que un

cambio en la calificación de las maquinas tiene 5.925% de ser evaluada como

buena manteniendo constantes las demás variables.

Modelo de regresión múltiple:

^.=65.660+0.002 precio +10.210∗excelete +5.925∗muybuena+e


califi i

Regresión lineal simple


calificación precio
86 1 2900
85 1 3500
82 1 2900
81 1 3500
81 1 2300
81 1 2000
79 1 3000
78 1 1300
72 1 3200
72 1 1600
69 1 1300
83 1 1500
83 1 2600
82 1 1600
80 1 1800
75 1 1700
75 1 1600
74 1 1000
73 1 1200
73 1 1600
70 1 1000
70 1 1400
67 1 1000
66 1 600

24 46100
10537000
46100
x x=
t
0

0.261030049 -0.000114202
¿ ¿= -0.000114202 0.000000059

1837 67.6762
x y=
t
3606200 ^β = 0.0046

Interpretaciones

(𝛽1 = 0.00046):

A medida que aumenta en unas 100 unidades monetarias el precio de las

maquinas, su calificación aumenta en 0. [Link] constantes la demás

variable

ANÁLISIS DE VARIANZA
GL SC CM Fcal F tab
Regresión 1 358.2899 358.290 17.608 4.301
Residuos 22 447.6684 20.349
Total 23 805.9583

PRUEBA DE HIPOTESIS:
H 0 :B 0=B2=0

H 1 : Al menos una de las Bi ≠ 0


Decisión:

Como el Fcal =17.608 > Ftab=4.301 Se rechaza H0 y se acepta H1. Por lo

tanto, se concluye que el modelo es significativamente y se puede seguirse

estudiando.

Se puede concluir que el modelo mas apto y mas significativo es el modelo

lineal simple ya que presenta un mayor calculado con respecto al modelo

anterior.
a) REALIZAR MATRICIALMENTE EL CONTRASTE DE
SIGNIFICACION INDIVIDUAL.

Construir la matriz Var-Cov(β)


y y− ^β x y
t t T
2
σ =
n− p
t
y y=141413
1837
^β t x T y 65.6597 0.0023 10.2097 5.9246 * 3606200 = 141103.9904
573
1061

2 141413−141103.9904
σ = =15.4505
24−4

0.4067 -0.0001 -0.1877 -0.2531


15.4505 -0.0001 0.0000 -0.0002 -0.0001
-0.1877 -0.0002 0.7650 0.4925
-0.2531 -0.0001 0.4925 0.4925

6.28431 -0.00131 -2.90056 -3.91008


Var- cov -0.00131 0.00000 -0.00260 -0.00143
-2.90056 -0.00260 11.81949 7.60989
-3.91008 -0.00143 7.60989 7.60968

Var ( B0) 6.284308 0( B0) 2.50685218


Var ( B2) 0.000002 0( B2) 0.0012288
Var ( B3) 11.819491 0( B3) 3.43794864
Var ( B4 ) 7.609683 0( B4 ) 2.7585653
Evaluación individualmente
Planteamos las hipótesis
H0 β i=0

H1 βi≠ 0 α 0.05

Ttab 2.0859
β2 0.0023 = 1.8845 Tcal 1.8845 < Ttab=2.0859
0.0012 no es significativo
β3 10.210 = 2.9697 Tcal 2.9697 > Ttab=2.0859
3.4379 sí es significativo

β3 5.9246 = 2.1477 Tcal 2.1477 > Ttab=2.0859


2.7585653 Si es significativo

Decisión:

Por lo tanto, se concluye que β 3 y β 4 : las variables dummy de calificación si

son significativos y si influirán en el modelo.

b) contraste de significación conjunta.


Con los datos hallados matricialmente anterior reemplazamos:
y y=141413 β^ x y=1411 03.9403. n=20 y =5858.6267
t t T 2

T 2
SCT=Y Y −n y

SCT=141413−24∗5858.6267=496.9487
T T 2
SCR=B x y−n y

SCR=141103.9403−24∗5858.6267=0.4639

SCE=SCT−SCR=0.5113−0.4639=0.0473

Análisis conjunto del modelo múltiple


ANÁLISIS DE VARIANZA
GL SC CM Fcal F tab
Regresión 3 496.949 165.650 10.721 3.0983
Residuos 20 309.010 15.450
Total 23 805.9583

PRUEBA DE HIPOTESIS:
H 0 :B 1=B 2=B 3=B4 =0

H 1 : Al menos una de las Bi ≠ 0


Decisión:
Como el Fcal =10.721 > Ftab=3.0983 Se rechaza H0 y se acepta H1. Por lo

tanto, se concluye que el modelo es significativamente y se puede seguirse

estudiando.

c) significación del coeficiente de determinación.


Con los datos anteriores encontrar el coeficiente de determinación

2 SCR
R=
SCT

2 496.949
R= =0.616590 61.659 %
805.95833

Condición.

R>
(2n− p )
K
∗f 1−α ; k; n− p
2
=R sig
1+ (
n−p )
K
∗f 1−α ;k ;n− p

2
R =0.61659>
( 24−4 )
3
∗3.0983
=R
2
=0.3172
1+ (
24−4 )
sig
3
∗3.0983

Por lo tanto
2 2
R =0.61659> R sig =0. 3172

Decisión
El R2es significativo, por lo tanto, es apto para la predicción.

d) Estime la calificación general dada una caminadora cuyo precio es 2000 y


que como evaluación de su calidad obtuvo buena. ¿Cuánto varia esta
estimación si la evaluación de la calidad es muy buena?

Caminadora buena

65.65972
x0 β 1 2000 0 0 * 0.00232 = 70.2911
10.20966
5.92464
Caminadora muy buena

65.65972
x0 β 1 2000 0 1 * 0.00232 = 76.2158
10.20966
5.92464

Interpretación

Entonces, se puede analizar que cuando se hay un cambio en la calidad de la

caminado teniendo el mismo precio de compra hay una variación en la

calificación de aproximadamente 6 puntos en la calificación.

e) Pruebe la normalidad de los errores


2 3 4
e e e e
11.6627 39.8287 136.0174 11.6627
28.2031 149.7770 795.4145 28.2031
0.3422 -0.2001 0.1171 0.3422
8.8468 -26.3137 78.2666 8.8468
0.0382 -0.0075 0.0015 0.0382
0.2492 0.1244 0.0621 0.2492
14.5657 -55.5903 212.1608 14.5657
11.5955 39.4854 134.4566 11.5955
48.9248 -342.2110 2393.6384 48.9248
10.8207 -35.5947 117.0886 10.8207
31.3015 -175.1251 979.7859 31.3015
13.3741 48.9098 178.8658 13.3741
29.1039 157.0094 847.0341 29.1039
45.0309 302.1805 2027.7854 45.0309
18.0401 76.6231 325.4463 18.0401
0.2715 -0.1415 0.0737 0.2715
0.0838 -0.0243 0.0070 0.0838
0.0100 0.0010 0.0001 0.0100
1.8583 -2.5333 3.4534 1.8583
5.2418 -12.0010 27.4761 5.2418
4.0989 8.2985 16.8009 4.0989
23.2936 -112.4232 542.5935 23.2936
0.9515 -0.9281 0.9053 0.9515
1.1007 -1.1548 1.2115 1.1007
promedio 12.8754 2.4162 367.4443

Coeficiente de asimetría y curtosis:


(∑ )
n
e3
i=1

n 2.4162
A= = =0.0523

( )
n 3/ 2 3

∑e
2
2
( 12.8754 )
i=1
n

(∑ )
n
e4
i=1

n 367.4443
k= = =2. 2165

( )
2
n 2
( 12.8754 )
∑ e2
i=1
n

Prueba de Jaquer - Bera


JB=N ¿
JB=10 ¿
Prueba de hipótesis:
H0: La distribución de los errores de los datos se aproximan a una normal.

H1: La distribución de los errores de los datos no se aproximan a una normal.

Datos:
𝛼 =5% JB = 0.6248

Entonces como:

JB = 0.6248 < x 2tab =9.4877

Decisión:

Con un nivel de significancia del 95% se acepta la hipótesis nula: por lo tanto, la

distribución de los errores de la información se aproxima a una distribución

normal.

Tiene autocorrelación la información

e e t−1 ¿¿¿ e
2

3.4151 11.6627
5.3107 3.4151 3.5933 28.2031
-0.5849 5.3107 34.7581 0.3422
-2.9744 -0.5849 5.7094 8.8468
-0.1955 -2.9744 7.7220 0.0382
0.4992 -0.1955 0.4826 0.2492
-3.8165 0.4992 18.6254 14.5657
3.4052 -3.8165 52.1534 11.5955
-6.9946 3.4052 108.1569 48.9248
-3.2895 -6.9946 13.7280 10.8207
-5.5948 -3.2895 5.3143 31.3015
3.6571 -5.5948 85.5964 13.3741
5.3948 3.6571 3.0197 29.1039
6.7105 5.3948 1.7311 45.0309
4.2474 6.7105 6.0671 18.0401
-0.5211 4.2474 22.7379 0.2715
-0.2895 -0.5211 0.0536 0.0838
0.0999 -0.2895 0.1517 0.0100
-1.3632 0.0999 2.1408 1.8583
-2.2895 -1.3632 0.8580 5.2418
2.0246 -2.2895 18.6111 4.0989
-4.8263 2.0246 46.9351 23.2936
-0.9754 -4.8263 14.8296 0.9515
-1.0491 -0.9754 0.0054 1.1007
suma 452.9810 309.0096
n
1
∑ ( et −e t−1 )2
D W = i=1 n

∑ e2
i=1

452.9810
D W= =1.4659
309.0096

Planteamiento de la Hipótesis:

H0: 𝑝 = 0 No existe Autocorrelación en las variables.

H1: 𝑝 > 0 existe Autocorrelación en las variables.

Datos: α =1 % k =4 𝐷𝑊=1.4659

Puntos Críticos: D l=0.805 , Du=1. 527

0.805 1.527 2.534 3.195


1.4659

Decisión

Por lo tanto, el valor de DW = 1.4659, se encuentra en la región de aceptación de

la Ho, por tanto, los datos son independientes, es decir no existe autocorrelación

en las variables.

f) Utilizando VIF pruebe la colinealidad


Cuando el precio es la variable dependiente

Cuando la variable dummy excelente es la variable dependiente


Cuando la variable dummy excelente es la variable dependiente

Factor de inflación de la varianza:

1
VIF= 2
1−R
VARIABLES PRECIO ESCELENTE MUY BUENO
2
R 0.3916 0.7364 0.6519
VIF 1.6436 3.7936 2.8727

Decisión:
los valores VIF son menores a 10; por lo tanto, las variables no presentan

multicolinealidad.

2) Un estudio realizado a lo largo de 10 años por la American Heart Association

proporcionó datos sobre la relación que tienen la edad, la presión sanguínea y el fumar
sobre el riesgo de sufrir un infarto. Los datos que se dan a continuación se obtuvieron

como parte de este estudio. El riesgo se interpreta como la probabilidad (multiplicada

por 100) de que el paciente sufra un infarto en los próximos 10 años. Para fumar, defina

una variable ficticia que tome el valor 1 si la persona es fumadora y el valor 0 si no es

fumadora.

Riesgo Edad Presión Fumador


12 57 152 No
24 67 163 No
13 58 155 No
56 86 177 Si
28 59 196 No
51 76 189 Si
18 56 155 Si
31 78 120 No
37 80 135 Si
15 78 98 No
22 72 152 No
36 70 173 Si
15 67 135 Si
48 77 209 Si
15 60 199 No
36 82 119 Si
8 66 166 No
34 80 125 Si
3 62 117 No
37 59 207 Si

a) Obtenga la ecuación de regresión estimada que relaciona el riesgo de infarto con la


edad, la presión sanguínea y el fumar o no fumar.

1 57 152 0 12
1 67 163 0 24
1 58 155 0 13
1 56
86 177 1
28
1 59 196 0
51
1 76 189 1
18
1 56 155 1 31
1 78 120 0 37
1 80 135 1 Y= 15
X= 1 78 98 0 22
1 72 152 0 36
1 70 173 1 15
1 67 135 1 48
1 15
77 209 1
36
1 60 199 0
8
34
3
37
1 82 119 1
1 66 166 0
1 80 125 1
1 62 117 0
1 59 207 1

20 1390 3142 10
T
X X= 1390 98366 216522 733
3142 216522 513838 1624
10 733 1624 10

6.95106 -0.06837 -0.01554 0.58436


(XT X)-1 = -0.06837 0.00082 0.00009 -0.00725
-0.01554 0.00009 0.00006 -0.00137
0.58436 -0.00725 -0.00137 0.26964

539 -91.3340
T
X Y= 39220 β = 1.0703
88251 0.2511
368 8.9040

Modelo Regresión lineal múltiple:

^y = -91.33 + 1.07 Edad + 0.25 Presión + 8.90 Fumar + u

INTERPRETACIÓN DE LOS COEFICIENTES

 β1 = Por cada año de incremento de la edad, el riesgo de sufrir un infarto aumenta


en 1.07 unidades, asumiendo que la presión sanguínea y el hábito de fumar se
mantienen constantes.

 β2 =Por cada unidad de aumento en la presión sanguínea, el riesgo de sufrir infarto


aumenta en 0.25 unidades, manteniendo constantes la edad y el hábito de fumar.

 β3 =Si una persona es fumadora, en comparación con un no fumador, el riesgo de


sufrir infarto aumenta en 8.90 unidades, manteniendo constantes la edad y la
presión sanguínea.

b) ¿Es el fumar un factor significativo para el riesgo de infarto? Explique. Use α = 0.05.
Realizar matricialmente el contraste de significación individual.

VARIANZA ESTÁNDAR DE LA ESTIMACIÓN

T
Y Y −β X Y
T T
2 18717−18183.718
2
σ = σ =
n−p 20−4

n= 20
p= 4
YT Y = 18717
T T
β X Y= 18183.718

σ2 = 33.3301

σ= 5.7732

 Un error estándar de 5.77 indica que el modelo estimado presenta una baja

variabilidad en los datos, por lo que resultará ser confiable y preciso para realizar

predicciones.

2 T −1
Var−Cov ( β )=σ ( X X )

231.6795 -2.2789 -0.5179 19.4768


Var - Cov = -2.2789 0.0274 0.0031 -0.2418
-0.5179 0.0031 0.0021 -0.0456
19.4768 -0.2418 -0.0456 8.9871

σ2 (β0) = 231.6795 σ (β0) = 15.2210


2
σ (β1) = 0.0274 σ (β1) = 0.1656
2
σ (β2) = 0.0021 σ (β2) = 0.0453
2
σ (β3) = 8.9871 σ (β3) = 2.9978

CONTRASTE DE SIGNIFICACIÓN INDIVIDUAL

H0: βi = 0
H1: βi ≠ 0

n= 20
p= 4
GL= 16
α= 0.05

Estadístico del contraste: bi−β i


T Cal=
σ (b i)
Si: p - valor > α se acepta la ho
Si: p - valor < α se rechaza la ho

bi SE bi Tcal p - valúe Decisión Conclusión


EDAD 1.0703 0.1656 6.4620 0.0000078 Se rechaza la H0 es significativo
PRESIÓN
0.2511 0.0453 5.5403 0.0000448 Se rechaza la H0 es significativo
SANGUÍNEA
HÁBITO DE
8.9040 2.9978 2.9701 0.0090240 Se rechaza la H0 es significativo
FUMAR

En base al análisis de significación individual del modelo podemos concluir:

 La edad es un factor de riesgo significativo, ya que, a mayor edad, mayor es el riesgo


de sufrir un infarto.
 La presión sanguínea también es un factor de riesgo significativo, debido a que un
aumento en la presión sanguínea se asocia con un mayor riesgo de infarto.
 Fumar incrementa considerablemente el riesgo de sufrir infarto. Ser fumador se asocia
con un aumento significativo en el riesgo de sufrir un infarto, en comparación con los
no fumadores.

c) ¿Cuál es la probabilidad de que Art Apeen sufra un infarto en los próximos 10 años,
si tiene 68 años, fuma y su presión sanguínea es 175? ¿Qué recomendará a este
paciente?

Riesgo de sufrir infarto = -91.33 + 1.07 Edad + 0.25 Presión + 8.90 Fumar + u

Riesgo de sufrir infarto = -91.33 + 1.07 (68) + 0.25 (175) + 8.90 (1)

1 -91.3340
X0 = 68 β= 1.0703
175 0.2511
1 8.9040
Ŷ = X0T β = 34.2907

Riesgo de sufrir infarto = 34.29 %

 La probabilidad de que el paciente sufra un infarto en los próximos 10 años, es del


34.29%, considerando su edad, presión arterial y que es fumador.
Es importante que este paciente discuta este resultado con su médico, ya que
representa un riesgo elevado que debe tomarse muy en serio.

 El médico le recomendaría un cambio en su estilo de vida por uno más saludable,


como dejar de fumar ya que es uno de los principales factores de riesgo para
enfermedades cardíacas, controlar su presión regularmente incluso tomar algunos
medicamentos de ser necesario para mantener su presión estable, llevar una dieta
saludable, realizar actividad física regularmente, controlar el estrés, dormir lo
suficiente y realizar chequeos médicos cada cierto tiempo para monitorear el estado
de salud del paciente.

d) contraste de significación conjunta.

ANOVA (CONTRASTE DE SIGNIFICANCIA GENERAL)

H0: β1 = β2 = β3 = β4 = 0

H1: Al menos un βi ≠ 0

α= 0.05

(valor p)
FV GL SC CM F Sig. F
Regresión 3 3657.6683 1219.2228 36.5802 0.000000216
Error 16 533.2817 33.3301
Total 19 4190.95 220.5763

Ftab = F1-α, k, n - p

FTab = 3.2389

 DECISIÓN: Se rechaza la Ho.

 CONCLUSIÓN: Con un nivel de confianza del 95% hay evidencia suficiente para
rechazar la hipótesis nula, con esto se concluye que el modelo de regresión es
significativo y, por lo tanto, es válido su uso para hacer pronósticos.
Las variables independientes en conjunto tienen un efecto significativo sobre el riesgo
de sufrir un infarto.
e) significación del coeficiente de determinación

COEFICIENTE DE DETERMINACIÓN (R2)

2
R =SCR / SCT

2 3657.6683
R=
4190.95

R2 = 0.8728

 Este valor nos indica que el 87.28% de la variabilidad en el riesgo de sufrir un infarto es

explicada por las variables incluidas en el modelo. Es decir, este modelo es capaz de

predecir el riesgo de sufrir un infarto con una precisión del 87.28%.

Esto significa que el modelo se ajusta bien a los datos y que las variables regresoras

incluidas en este son relevantes para explicar a la variable dependiente.

COEFICIENTE DE DETERMINACIÓN CORREGIDO (R2 correg)

2
R correg=1− ( CME
CMT )

2 33.3301
R corregido=1−
220.5763

R2 correg = 0.8489

 Este coeficiente nos indica que, después de considerar el número de variables

explicativas en el modelo, el 84.89% de la variabilidad en el riesgo de sufrir un infarto

es explicado por las variables predictoras que contribuyen significativamente a explicar

esta variabilidad. Asimismo, indica que modelo tendrá muy buena precisión en la

predicción. A pesar de ello, hay un 15.11% de la variabilidad que no se explica

mediante las variables explicativas incluidas en el modelo, lo que sugiere que hay otros
factores o variables que podrían estar influyendo en el riesgo de sufrir un infarto y que

no se están considerado, también podría deberse a la aleatoriedad de los datos.

SIGNIFICACIÓN DEL R2

k
∗F
n− p Tab
R2 > =R2 es significativo
k
1+ ∗F
n− p Tab

FTab = 3.2389

R2 > 0.6073
1.6073

0.8728 > 0.3778

 El R2 es significativo, por lo que el modelo es apto para la predicción.

f) Pruebe la normalidad de los errores.

e e2 e3 e4
4.1618 17.3203 72.0832 299.9934
2.6966 7.2715 19.6079 52.8740
3.3382 11.1437 37.2000 124.1814
1.9410 3.7675 7.3128 14.1943
6.9740 48.6363 339.1885 2365.4920
4.6316 21.4517 99.3555 460.1744
1.5749 2.4802 3.9059 6.1512
8.7188 76.0180 662.7879 5778.7343
-0.0920 0.0085 -0.0008 0.0001
-1.7576 3.0892 -5.4297 9.5433
-1.8934 3.5849 -6.7875 12.8513
0.0708 0.0050 0.0004 0.0000
-8.1775 66.8716 -546.8427 4471.8085
-4.4602 19.8930 -88.7261 395.7326
-7.8496 61.6159 -483.6590 3796.5198
0.7845 0.6154 0.4828 0.3787
-12.9863 168.6441 -2190.0644 28440.8464
-0.5813 0.3379 -0.1964 0.1141
-1.4025 1.9669 -2.7586 3.8688
4.3082 18.5602 79.9601 344.4801
promedio 26.6641 -100.1290 2328.8969

HIPÓTESIS DE LA PRUEBA
 Ho: La distribución de los errores de los datos se aproximan a una normal
 H1: La distribución de los errores de los datos no se aproximan a una normal

α= 0.05
n= 20
GL 16
Asimetría (A) -0.7272
Kurtosis (K) 3.2756
X2Tab 26.2962

JB = 1.8262

 DECISIÓN: Se acepta la Ho, por lo tanto, la distribución de los errores de los datos
se ajusta a una distribución normal.

g) Pruebe si tiene autocorrelación

e e2 (e - e-1)2
4.1618 17.3203
2.6966 7.2715 2.1468
3.3382 11.1437 0.4117
1.9410 3.7675 1.9522
6.9740 48.6363 25.3307
4.6316 21.4517 5.4867
1.5749 2.4802 9.3437
8.7188 76.0180 51.0364
-0.0920 0.0085 77.6300
-1.7576 3.0892 2.7744
-1.8934 3.5849 0.0184
0.0708 0.0050 3.8579
-8.1775 66.8716 68.0342
-4.4602 19.8930 13.8186
-7.8496 61.6159 11.4882
0.7845 0.6154 74.5470
-12.9863 168.6441 189.6346
-0.5813 0.3379 153.8853
-1.4025 1.9669 0.6744
4.3082 18.5602 32.6112
Σ= 533.2817 724.6826

HIPÓTESIS DE LA PRUEBA

 Ho: ρ = 0, Indica ausencia de autocorrelación, no existe correlación entre los residuos.


 H1: ρ ≠ 0, Indica presencia de autocorrelación (positiva o negativa), existe correlación
entre los residuos.

d= 724.683 d= 1.3589
533.282

 DECISIÓN: Se acepta la Ho, por lo tanto, existe evidencia estadística de que los
residuos son independientes, es decir no existe autocorrelación entre los errores.

h) Utilizando VIF pruebe la colinealidad.

MATRIZ DE CORRELACIONES

Riesgo Edad Presión Fumador


Riesgo 1
Edad 0.6477 1
Presión 0.3882 -0.3095 1
Fumador 0.6804 0.4050 0.1666 1

 En base al análisis de los coeficientes de correlación, se puede observar que no hay


evidencia que indique que haya problemas de multicolinealidad. Pero para tener
una mayor certeza y descartar algún problema relacionado a esto, analizaremos la
multicolinealidad entre las variables independientes a través del Factor de
Inflación de la Varianza.
1
VIF= 2
1−Ri

Si: VIF > 10 hay multicolinealidad en la variable

Variable Modelo de Evaluación R2i VIF


EDAD (X1) β1X1 = β0 + β2X2 + β3X3 + u 0.3101 1.4496
PRESIÓN SANGUÍNEA (X2) β2X2 = β0 + β1X1 + β3X3 + u 0.1977 1.2465
HÁBITO DE FUMAR (X3) β3X3 = β0 + β1X1 + β2X2 + u 0.2583 1.3482

 CONCLUSIÓN: Existe evidencia estadística de que no existen problemas de


multicolinealidad entre las variables explicativas.

También podría gustarte