UC3M.
Examen Final de Econometría, 2018/19 27/06/2019
EXAMEN EXTRAORDINARIO DE ECONOMETRÍA
Conteste cada pregunta en un cuadernillo diferente en dos horas y media.
Todas las cuestiones (a) ; (b) ; etc., tienen la misma puntuación.
1. Un modelo para estimar los efectos del tabaquismo en el ingreso anual (quizás a través de ausencias
laborales debido a enfermedades o efectos sobre la productividad) es
2
log(income) = 0 + 1 cigs + 2 educ + 3 age + 4 age + u1 (1)
donde cigs es el número de cigarrillos que se consumen al día, en promedio, y educ (años de
educación) y age (edad) se suponen exógenas.
Para re‡ejar el hecho de que el consumo de cigarrillos podría estar determinado conjuntamente
con los ingresos, se especi…ca una ecuación de demanda de cigarrillos,
2
cigs = 0 + 1 log(income) + 2 educ + 3 age + 4 age + 5 log(cigpric) + 6 restaurn + u2 ; (2)
donde cigpric es el precio de una cajetilla de cigarrillos (en centavos) y restaurn es una variable
binaria igual a la unidad si la persona vive en un estado cuyos restaurantes restringen el consumo
de tabaco, y se supone que éstas son variables exógenas al individuo.
(a) ¿Cómo se interpretan 1 y 1 ? ¿Qué signos se esperarían para 5 y 6 ? ¿Bajo qué supuestos
estarían las ecuaciones (1) y (2) identi…cadas, si es posible que lo estén?
(b) Realize los contrastes que sean factibles para comprobar las dos condiciones para la identi-
…cación de las ecuaciones (1) y (2) dada la información en la Tabla 1. Comente cualquier
supuesto adicional que se utilize.
(c) Compare la estimación de la ecuación de ingreso mediante MCO y mediante MC2E. ¿Qué
conclusiones puede extraer? Proporcione una estimación de la variación esperada en los
ingresos de un aumento del consumo de tabaco en un cigarrillo al día. ¿Podría realizar un
contraste válido con la información proporcionada para determinar si la variación es negativa?
1
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
Table 1: Tabla de Regresiones
(1) (2) (3) (4) (5) (6)
Var. dependiente: log(income) cigs cigs log(income) hatu2 hatu2
cigs 0.00173
(0.00143)
educ 0.0604 -0.450 -0.472 0.0397 -0.000301 -1.15e-10
(0.00745) (0.156) (0.156) (0.0115) (0.0103) (0.0103)
age 0.0577 0.823 0.824 0.0938 -0.000269 -3.60e-10
(0.00920) (0.136) (0.137) (0.0172) (0.0115) (0.0116)
age2 -0.000631 -0.00959 -0.00958 -0.00105 0.00000214 3.17e-12
(0.0000984) (0.00144) (0.00146) (0.000197) (0.000123) (0.000124)
log(cigpric) -0.351 0.439
(6.027) (0.392)
restaurn -2.736 -0.0145
(1.001) (0.0675)
hatcigs -0.0421
(0.0188)
Constante 7.795 1.580 -0.332 7.781 -1.784 1.05e-08
(0.208) (25.19) (3.226) (0.208) (1.668) (0.259)
Observaciones 807 807 807 807 807 807
R2 0.165 0.071 0.044 0.169 0.002 0.001
Errores estándar en paréntesis. Todas las regresiones están ajustadas por MCO.
hatcigs son las predicciones de cigs en la regresión de la columna (2).
hatu2 son los residuos del ajuste MC2E de la función de demanda, ecuación (2), usando lcigpric y restaurn como
instrumentos para cigs
2. Se desea estimar un modelo de probabilidad lineal para estudiar los determinantes que llevan a la
subscripción de un plan de pensiones,
2
pp = 0 + 1 log (income) + 2 age + 3 age + 4 male + 5 married + 6 male married + u; (3)
donde pp = 1 si el individuo ha subscrito un plan y 0 en caso contrario, income es el ingreso anual,
age la edad en años, married es una variable binaria indicando si el individuo está casado y male
una variable binaria indicando si el individuo es un hombre. El modelo (3) se ha estimado con
una muestra de 9275 individuos y los resultados están resumidos en la Tabla 2, junto con los de
otros modelos relacionados.
(a) Interprete el coe…ciente 1 en (3) y proporcione un intervalo de con…anza al 95% para el
efecto sobre pp de un aumento de los ingresos del 10%.
(b) Determine si la probabilidad de subscribir un plan de pensiones de un hombre soltero es
diferente a la de una mujer soltera usando el modelo (3). ¿Cuál es la diferencia estimada
entre dicha probabilidad para un hombre y una mujer, ambos casados?
(c) Explique por qué con la información proporcionada no es posible llevar a cabo un contraste
de hipótesis válido acerca de si la probabilidad de subscribir un plan de pensiones depende
del género y estado civil del individuo.
(d) Finalmente, se decide estimar modelos diferentes para hombres y para mujeres incluyendo
como variables explicativas log (income) ; age; age2 y married: Proporcione la ecuación esti-
mada para los hombres usando los resultados de la columna (3).
2
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
Table 2: Tabla de Regresiones
(1) (2) (3)
Variable dependiente: pp pp pp
log(income) 0.229 0.217 0.231
(0.00838) (0.00765) (0.00948)
age 0.0137 0.0142 0.0158
(0.00347) (0.00346) (0.00394)
age2 -0.000160 -0.000165 -0.000181
(0.0000398) (0.0000397) (0.0000448)
male -0.0151 0.197
(0.0143) (0.177)
married -0.0360 -0.0374
(0.0116) (0.0118)
male*married -0.00875 -0.00145
(0.0244) (0.0258)
log(income) male -0.0112
(0.0203)
age*male -0.00761
(0.00867)
age2 *male 0.0000747
(0.000102)
Constante -0.774 -0.770 -0.830
(0.0723) (0.0718) (0.0824)
Observaciones 9275 9275 9275
R2 0.084 0.083 0.084
Errores estándar robustos en paréntesis
Todas las regresiones están ajustadas por MCO
3
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
3. Suponga que el modelo verdadero que se desea estimar para explicar los resultados de un examen
es
T estscorei = 0 + 1 STR i + 2 E ort i + ui
donde STR es una variable continua que aumenta cuando el tamaño de la clase aumenta. E ort
es una variable continua que aumenta cuando el estudiante pone más esfuerzo. Finalmente, el
error u incluye todos los otros factores que se supone están incorrelados con las otras variables
explicativas del modelo. Suponga que 1 > 0 y 2 > 0; Cov(STR; E ort) > 0; Cov(STR; u) = 0,
Cov(E ort; u) = 0.
Sin embargo, el económetra estima la siguiente especi…cación,
T estscorei = 0 + 1 STR i + ei : (4)
(a) Discuta si la estimación MCO de 1 en (4) está sesgada o no para 1, y si es así, cuál es el
signo del sesgo.
(b) Imagine que en lugar de E ort se observa un indicador de la asistencia a clase, CAi ; para el
que se sabe que Cov(CA; E ort) > 0; por lo que se cumple que
E ort i = 0 + 1 CAi + vi ; Cov (CA; v) = 0; 1 > 0:
También se sabe que
Cov (STR; v) = 0:
Interprete esta condición.
(c) ¿Cuál sería el signo esperado de 3 en el siguiente modelo de regresión?
T estscorei = 0 + 1 STR i + 3 CAi + wi
¿Cree que el estimador MCO de 1 sería sesgado o insesgado para 1? ¿Por qué?
ALGUNOS VALORES CRÍTICOS: Z0:90 = 1:282; Z0:95 = 1:645; Z0:975 = 1:96; 22;0:95 = 5:99;
2 2 2 2 2 2
2;0:975 = 7:378; 3;0:95 = 7:815; 3;0:975 = 9:348; 4;0:95 = 9:488; 4;0:975 = 11:143; 5;0:95 =
2 2 2 2 2
11:071; 5;0:975 = 12:833; 6;0:95 = 12:592; 6;0:975 = 14:449; donde P (Z Z ) = y P m m; =
; Z está distribuida como una normal estándar con media cero y varianza uno, y 2m como una
chi-cuadrado con m grados de libertad.
4
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
EXAMEN EXTRAORDINARIO DE ECONOMETRÍA
SOLUCIONES
1. Un modelo para estimar los efectos del tabaquismo en el ingreso anual (quizás a través de ausencias
laborales debido a enfermedades o efectos sobre la productividad) es
2
log(income) = 0 + 1 cigs + 2 educ + 3 age + 4 age + u1 (5)
donde cigs es el número de cigarrillos que se consumen al día, en promedio, y educ (años de
educación) y age (edad) se suponen exógenas.
Para re‡ejar el hecho de que el consumo de cigarrillos podría estar determinado conjuntamente
con los ingresos, se especi…ca una ecuación de demanda de cigarrillos,
2
cigs = 0 + 1 log(income) + 2 educ + 3 age + 4 age + 5 log(cigpric) + 6 restaurn + u2 ; (6)
donde cigpric es el precio de una cajetilla de cigarrillos (en centavos) y restaurn es una variable
binaria igual a la unidad si la persona vive en un estado cuyos restaurantes restringen el consumo
de tabaco, y se supone que éstas son variables exógenas al individuo.
(a) ¿Cómo se interpretan 1 y 1?
[15%] 1 : si se consume un cigarrillo más al día, el ingreso anual se incrementa (aproximada-
mente) en un 100 1 % en promedio, todo lo demás igual.
[15%] 1 : si se incrementa el ingreso en un 1%; la demanda de cigarrillos aumenta (aproxi-
madamente) en 1 =100 unidades (cigarrillos) en promedio, todo lo demás igual.
[20%] ¿Qué signos se esperarían para 5 y 6?
5 debería ser negativo (si aumenta el precio, la demanda de cigarrillos baja) y 6 debería
ser negativo (si hay restricciones al consumo, la demanda de cigarrillos debería bajar, todo
lo demás igual).
¿Bajo qué supuestos estarían las ecuaciones (5) y (6) identi…cadas, si es posible que lo estén?
[30%] La ecuación (5) está identi…cada si los dos posibles instrumentos, log(cigpric) y
restaurn; son exógenos en esa ecuación, es decir, se cumple que
(exog)
H0 : Cov (log (cigpric) ; u1 ) = 0 y Cov (restaurn; u1 ) = 0;
y si al menos uno de ellos es relevante, es decir, si en la forma reducida de cigs;
2
cigs = 0 + 1 educ + 2 age + 3 age + 4 log(cigpric) + 5 restaurn +v
la hipótesis nula
(no rel)
H0 : 4 = 5 =0
es falsa, por lo que
(no rel)
H1 : 4 6= 0 y/o 5 6= 0
es cierta.
[20%] La ecuación (6) no puede estar identi…cada porque no hay instrumentos exógenos que
puedan usarse para el regresor endógeno log(income) :
(b) Realize los contrastes que sean factibles para comprobar las dos condiciones para la identi…-
cación de las ecuaciones (5) y (6) dada la información en la Tabla 1. Comente cualquier
supuesto adicional que se utilize.
(exog)
[50%] Para contrastar H0 en contra de
(exog)
H1 : Cov (log (cigpric) ; u1 ) 6= 0 y/o Cov (restaurn; u1 ) 6= 0
5
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
podemos emplear el contraste de sobre-identi…cación de Hansen/Sargan, que se basa en el
estádístico F para contrastar la hipótesis
H0 : 4 = 5 =0
en contra de
H1 : 4 6= 0 y/o 5 6= 0
en la regresión de los residuos MC2E sobre todas las variables exógenas,
2
u
^2 = 0 + 1 educ + 2 age + 3 age + 4 log(cigpric) + 5 restaurn + e:
Para ello podemos construir el estadístico F sólo válido para homocedasticidad (que es un
supuesto adicional), comparando las columnas (5) = modelo no restringido y (6) = modelo
restringido,
2 2
Rno res Rres n kno res 1 0:002 0:001 807 5 1
F = 2
= = 0:401 3
1 Rno res m 1 0:002 2
donde kno res = 5 es el número de regresores en la ecuación no restringida y m = 2 es igual
al número de restricciones (igual al número de instrumentos) y el estadístico J;
J = mF = 2 0:401 3 = 0:8026:
Dado el número de regresores endógenos, k = 1, se compara J con el valor crítico de una
2 2
m k = 1 ; donde m k = 1 es el grado de sobreidenti…cación, que al nivel de signi…cación
del 5% es igual a 3.86. Por lo tanto el estadístico J no es signi…cativo al 5%, y no podemos
rechazar la hipótesis nula de exogeneidad.
[50%] Para contrastar la hipótesis nula
(no rel)
H0 : 4 = 5 =0
en contra de
(no rel)
H1 : 4 6= 0 y/o 5 6= 0
usamos también un estadístico F sólo válido para homocedasticidad, comparando las colum-
nas (2) = modelo no restringido y (3) = modelo restringido,
2 2
Rno res Rres n kno res 1 0:071 0:044 807 5 1
F = 2
= = 11:640;
1 Rno res q 1 0:071 2
donde kno res = 5 es el número de regresores en la ecuación no restringida y q = 2 es igual al
número de restricciones (igual al número de instrumentos) y comparando el valor de F con el
valor crítico de una 2q =2 = 22 =2; que al nivel de signi…cación del 5% es igual a 5.99/2 3.00,
(no rel)
el estadístico F es signi…cativo, rechazando H0 y concluyendo que los instrumentos son
relevantes, y además F > 10, por lo que podemos a…rmar que los instrumentos no son débiles.
(c) Compare la estimación de la ecuación de ingreso mediante MCO y mediante MC2E. ¿Qué
conclusiones puede extraer?
[40%] La estimación MCO (columna 1) y la estimación MC2E (columna 4, segunda etapa de
MC2E) de la ecuación de ingreso dan resultados muy diferentes: el coe…ciente estimado para
cigs cambia de signo (0.00173 y 0:0421; respectivamente), por lo que podemos sospechar
que la estimación MCO es inconsistente por un problema de endogeneidad de cigs en esa
ecuación.
6
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
Proporcione una estimación de la variación esperada en los ingresos de un aumento del
consumo de tabaco en un 1 cigarrillo al día.
[30%] Si cigs = 1; entonces los ingresos aumentarían en un 100 ( 0:0421) % en promedio,
es decir bajarían en un 4,2%, usando la estimación MC2E.
¿Podría realizar un contraste válido con la información proporcionada para determinar si la
variación es negativa?
[30%] No, porque los errores estándar de la estimación de la segunda etapa de MC2E
obtenidos por MCO en la columna (4) reemplazando cigs por hatcigs no son válidos al
no tener en cuenta los efectos de la primera etapa (se deberían usar e.e. especí…cos).
7
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
2. Se desea estimar un modelo de probabilidad lineal para estudiar los determinantes que llevan a la
subscripción de un plan de pensiones,
2
pp = 0 + 1 log (income) + 2 age + 3 age + 4 male + 5 married + 6 male married + u; (7)
donde pp = 1 si el individuo ha subscrito un plan y 0 en caso contrario, income es el ingreso
anual, age la edad en años, married es una variable binaria indicando si el individuo está casado
y male una variable binaria indicando si el individuo es un hombre. El modelo (7) se ha estimado
con una muestra de 9275 individuos y los resultados están resumidos en la Tabla 2, junto con los
de otros modelos relacionados.
(a) Interprete el coe…ciente 1 en (7) y proporcione un intervalo de con…anza al 95% para el
efecto sobre pp de un aumento de los ingresos del 10%.
[50%] Si el ingreso aumenta en un 1%, la probabilidad de que el individuo subscriba un
plan de pensiones aumenta en aproximadamente en 1 =100 (o en 1 puntos porcentuales si
expresamos la probabilidad en tanto por cien) todo lo demás igual.
[50%] Intervalo de con…anza al 95%, usando los resultados de la columna (1)
10 ^ 1 =100 1:96s:e: 10 ^ 1 =100 = ^ =10
1 1:96s:e: ^ 1 =10
0:229=10 1:96 0:00838=10 : [0:0213; 0:0245]
(b) Determine si la probabilidad de subscribir un plan de pensiones de un hombre soltero es
diferente a la de una mujer soltera usando el modelo (7).
[50%] Comparando
Pr ( pp = 1j hombre soltero) = Pr ( pp = 1j male = 1; married = 0; age; income)
2
= 0 + 1 log (income) + 2 age + 3 age + 4
Pr ( pp = 1j mujer soltera) = Pr ( pp = 1j male = 0; married = 0; age; income)
2
= 0 + 1 log (income) + 2 age + 3 age
tomando los demás factores como …jos, el contraste buscado es
H0 : 4 =0
H1 : 4 6= 0
que se realiza mediante un estadístico t usando los errores estándar robustos de los resultados
de la columna (1)
^ 0:0151
4
t= = = 1: 055 9
e:e: ^ 0:0143
4
por lo que no podemos rechazar H0 a los niveles habituales de signi…catividad: no se rechaza
que las dos probabilidades son iguales.
¿Cuál es la diferencia estimada entre dicha probabilidad para un hombre y una mujer, ambos
casados?
[50%] Las probabilidades tomando como …jos los demás factores son
Pr ( pp = 1j hombre casado) = Pr ( pp = 1j male = 1; married = 1; age; income)
2
= 0 + 1 log (income) + 2 age + 3 age + 4 + 5 + 6
8
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
Pr ( pp = 1j mujer casada) = Pr ( pp = 1j male = 0; married = 1; age; income)
2
= 0 + 1 log (income) + 2 age + 3 age + 5;
por lo que usando las estimaciones de la columna (1)
c ( pp = 1j hombre casado)
Pr c ( pp = 1j mujer casada)
Pr = ^ +^
4 6
= 0:0151 0:00875
= 0:023 85
un hombre casado tiene una probabilidad 0.02385 menor de subscribir un plan que una mujer
casada, todo lo demás igual.
(c) Explique por qué con la información proporcionada no es posible llevar a cabo un contraste
de hipótesis válido acerca de si la probabilidad de subscribir un plan de pensiones depende del
género y estado civil del individuo.
Porque aunque se podría calcular el valor del estadístico F sólo válido para homocedasticidad
para contrastar
H0 : 4 = 5 = 6 = 0
comparando los R2 de las columnas (1) y (2) ; este contraste no es válido para el modelo
lineal de probabilidad porque los errores de este modelo siempre son hetorocedásticos y
necesitaríamos en su lugar un estadístico F robusto para hacer un contraste válido.
(d) Finalmente, se decide estimar modelos diferentes para hombres y para mujeres incluyendo
como variables explicativas log (income) ; age; age2 y married: Proporcione la ecuación esti-
mada para los hombres usando los resultados de la columna (3).
La probabilidad es
c ( pp = 1j hombre)
Pr c ( pp = 1j male = 1; age; married; income)
= Pr
= ( 0:830 + 0:197) + (0:231 0:0112) log (income)
+ (0:0158 0:00761) age + ( 0:000181 + 0:0000747) age2
+ ( 0:0374 0:00145) married
= 0:633 + 0:219 8 log (income)
4
+0:008 19age 1:063 10 age2 0:038 85married
9
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
3. Suponga que el modelo verdadero que se desea estimar para explicar los resultados de un examen
es
T estscorei = 0 + 1 STR i + 2 E ort i + ui
donde STR es una variable continua que aumenta cuando el tamaño de la clase aumenta. E ort
es una variable continua que aumenta cuando el estudiante pone más esfuerzo. Finalmente, el
error u incluye todos los otros factores que se supone están incorrelados con las otras variables
explicativas del modelo. Suponga que 1 > 0 y 2 > 0; Cov (STR; E ort) > 0; Cov (STR; u) = 0,
Cov (E ort; u) = 0.
Sin embargo, el económetra estima la siguiente especi…cación,
T estscorei = 0 + 1 STR i + ei : (8)
(a) Discuta si la estimación MCO de 1 en (8) está sesgada o no para 1, y si es así, cuál es el
signo del sesgo.
[50%] Se debe comprobar si se cumplen las dos condiciones para sesgo por Variables Omitidas
(VO):
- Cov(STR; E ort) 6= 0 (en realidad > 0).
- Cov (E ort; e) 6= 0; que es cierta porque comparando la ecuación estimada (8) con la
verdadera tenemos que
ei = 2 E ort i + ui
y podemos calcular Cov (E ort; e) = 2 V ar (E ort) > 0 porque 2 > 0, y por tanto la
estimación MCO de 1 estará sesgada para 1 :
También podemos comprobar que
Cov (ei ; STR i ) = Cov ( 2E ort i + ui ; STR i )
= 2 Cov (E ort i ; STR i ) + Cov (ui ; STR i )
= 2 Cov (E ort i ; STR i ) > 0;
por lo que no se cumple el supuesto 1 de MCO:
[50%] El sesgo de estimación es
Cov (ei ; STR i ) Cov (E ort i ; STR i )
Sesgo (^ 1 ) = E ( ^ 1 j X) 1 = 2 > 0;
Var (STR i ) Var (STR i )
es decir ^ 1 sobreestima sistemáticamente el valor verdadero de 1:
(b) Imagine que en lugar de E ort se observa un indicador de la asistencia a clase, CAi ; para
el que se sabe que Cov (CA; E ort) > 0; por lo que se cumple que
E ort i = 0 + 1 CAi + vi ; Cov (CA; v) = 0; 1 > 0:
También se sabe que
Cov (STR; v) = 0:
Interprete esta condición.
La incorrelación entre STR y v indica que la parte de E ort que no puede explicar CA;
tampoco está correlada con STR; es decir que STR no es una variable omitida en la regresión
de E ort sobre CA; y el error de reemplazar E ort por CA no estará relacionado con STR (
lo que convierte a CA en una variable de control válida para reemplazar la variable omitida
E ort y poder estimar el valor verdadero del coe…ciente de STR).
10
UC3M. Examen Final de Econometría, 2018/19 27/06/2019
(c) ¿Cuál sería el signo esperado de 3 en el siguiente modelo de regresión?
T estscorei = 0 + 1 STR i + 3 CAi + wi
[30%] En esta regresión el coe…ciente 3 va a capturar la correlación del error ei = 2 E ort i +
ui con CAi ; por lo que esperaríamos que su signo sea el de Cov( 2 E ort i ; CAi ) = 2 Cov(E ort i ; CAi ) >
0; ya que en principio CA no está omitida el modelo verdadero y por tanto Cov(CA; u) = 0:
¿Cree que el estimador MCO de 1 sería sesgado o insesgado para 1? ¿Por qué?
[30%] Usando el modelo verdadero y sustituyendo la ecuación de E ort en términos de CA;
T estscorei = 0 + 1 STR i + 2E ort i + ui
= 0 + 1 STR i + 2 ( 0 + 1 CAi + vi ) + ui
= ( 0 + 2 0) + 1 STR i + 1 CAi + ( 2 vi + ui );
| {z } |{z} | 2{z } | {z }
= 0 = 1 = 3 =wi
[40%] donde el error wi = 2 vi + ui está incorrelado con STR i (porque Cov(STR; u) = 0 y
Cov(STR; v) = 0) y también esperamos que esté incorrelado con CAi porque Cov(CA; v) = 0
y porque podemos suponer que Cov(CA; u) = 0 ya que CA no es una variable omitida en
el modelo verdadero. En ese caso el modelo satisface los supuestos del modelo de regresión
múltiple con la correspondiente de…nición de los coe…cientes, y el estimador MCO de 1
estimaría consistentemente sin sesgo el coe…ciente 1 de STR en el modelo original, mientras
que 3 = 2 1 = (+) (+) > 0 como habíamos anticipado.
11