Prueba de ejercicio 1
a) Utilice todos los datos para estimar los coeficientes a y b en un modelo de
regresión simple, donde el gasto es la variable dependiente y la edad es el
factor explicativo. Calcula también el error estándar y el valor t de b.
Con el programa Stata se procedió a calcular los coeficientes a y b respectivamente,
así también como los valores de t de b. A continuación, se muestra la tabla:
Source SS df MS Number of obs = 26
F(1, 24) = 12.24
Model 314.927546 1 314.927546 Prob > F = 0.0019
Residual 617.7263 24 25.7385958 R-squared = 0.3377
Adj R-squared = 0.3101
Total 932.653846 25 37.3061538 Root MSE = 5.0733
Expenditures Coef. Std. Err. t P>|t| [95% Conf. Interval]
Age -.3335961 .0953692 -3.50 0.002 -.5304284 -.1367638
_cons 114.2411 3.882078 29.43 0.000 106.2289 122.2533
Resultados:
𝑎 = 114.2411
𝑏 = −0.3335961
𝑠𝑒(𝑎) = 3.8820
𝑠𝑒(𝑏) = 0.0953692
𝑒𝑥𝑝 = 114.24 − 0.33(𝑎𝑔𝑒)
b) Haga el diagrama de dispersión de gatos contra la edad y agregue la línea
de regresión 𝑦 = 𝑎 + 𝑏𝑥 de la parte (a) en este diagrama ¿Qué conclusión
sacas del diagrama?
110
105
100
95
90
10 20 30 40 50 60
Age
Expenditures Fitted values
Bueno podríamos considerar bajos los supuestos de la regresión simple que la
variable x y 𝑦 no cumplen el supuesto de linealidad por ende tampoco cumple la
colinealidad, además que con las supuestos anteriores no obedecería a una
distribución normal.
c) Parece que hay dos conjuntos de observaciones en el diagrama de
dispersión, uno para clientes de años o más y otro para clientes de menor de
cuarenta años. Dividida la muestra en estos dos grupos y para cada grupo,
calcule los coeficientes de a y b y determine el error estándar y t valor de b
Source SS df MS Number of obs = 13
F(1, 11) = 19.90
Model 26.4520086 1 26.4520086 Prob > F = 0.0010
Residual 14.6249145 11 1.32953768 R-squared = 0.6440
Adj R-squared = 0.6116
Total 41.0769231 12 3.42307692 Root MSE = 1.1531
Expenditures Coef. Std. Err. t P>|t| [95% Conf. Interval]
Age .1979713 .0443837 4.46 0.001 .1002835 .2956591
_cons 100.2323 1.415896 70.79 0.000 97.11591 103.3486
Al parecer se observa que para aquellos individuos menores de 40 años el
coeficiente nos indica que a medida que la edad aumenta los gastos también los
hacen en 0.2%, la probabilidad de predicción de b es de un 64% sobre los gastos,
así que es significativo.
Source SS df MS Number of obs = 13
F(1, 11) = 0.55
Model 8.08969651 1 8.08969651 Prob > F = 0.4736
Residual 161.602611 11 14.6911465 R-squared = 0.0477
Adj R-squared = -0.0389
Total 169.692308 12 14.1410256 Root MSE = 3.8329
Expenditures Coef. Std. Err. t P>|t| [95% Conf. Interval]
Age .1464708 .1973844 0.74 0.474 -.2879693 .580911
_cons 88.87189 9.458464 9.40 0.000 68.05395 109.6898
Para el grupo de las personas mayores de 40 años, observamos que tenemos un 𝑟 2
muy bajo e incluso su 𝐹 no ayuda en la predicción del modelo para el grupo de edad
separado, así que podemos decir que para aquellos individuos la edad no es un
predictor de sus gastos si no estaría motivados por otros factores.
d) Bueno principalmente podemos discutir sobre el diagrama de dispersión de
este modelo sencillo, que no cumple los supuestos de linealidad y de
distribución normal, como resultado observamos que el modelo al correr
una regresión simple en Stata, su resultado fue negativo. Apoya a la
observación realizadas por ustedes que hay dos grupos divididos por edades
donde sus gastos varían. Es un modelo sencillo que abarca un análisis muy
didáctico.