Examen (130 minutos)
Métodos cuantitativos I, Verano 2021
1 Demostración (35 puntos, SE PUEDE HACER A MANUE-
SCRITA)
• (20 puntos) Demuestre que cuando se cumple el supuesto S1 de MCO, también
se cumple el supuesto de tendencias paralelas de diferencias en diferencias. Pero
que lo inverso no es cierto.
Respuesta:
Para probar lo que nos piden, podemos ocupar un modelo simple. Supongamos
que tenemos lo siguiente:
Yi = β0 + β1 · Ti + Ui
Donde Ti es igual a 1 para personas que reciben cierto tratamiento e igual a 0 para
personas que no. El supuesto 1 nos dice que la esperanza condicional del error va a
ser igual a 0: E(Ui |Ti ) = 0. Dado que esto se cumple tanto si Ti es igual a 1 como
si Ti es igual a 0, se cumple lo siguiente:
E(Ui |Ti = 1) − E(Ui |Ti = 0) = 0 − 0 = 0
El supuesto de tendencias paralelas, por otra parte, indica que la diferencia en
variables no observables (que están en el término de error) es constante en el tiempo.
Entonces, dado que si se cumple el supuesto 1 esta diferencia siempre es 0, se
cumple el supuesto de tendencias paralelas. Sin embargo, que se cumpla el supuesto
de tendencias paralelas no necesariamente implica que se cumpla el supuesto 1.
Para ver por qué, supongamos que tenemos lo siguiente, donde a y b son números
distintos de cero:
E(Ui |Ti = 1) − E(Ui |Ti = 0) = a − b
Si lo anterior se mantiene constante en el tiempo, se estarı́a cumpliendo el supuesto
de tendencias paralelas, pero claramente no se estarı́a cumpliendo el supuesto 1,
ya que éste requiere que E(Ui |Ti = 1) = E(Ui |Ti = 0) = 0.
1
• (15 puntos) Sea un modelo Yi = β0 + β1 Xi + Ui , tal que X es una variable que
toma dos valores, 0 y 1. La distribución condicional de U es N (0, 1) cuando X = 0
y N (0, 2) cuando X = 1. Dada esta información, derive la distribución (condicional
en Xi ) de β̂1 −a , bajo la hipótesis nula de que β1 = a.
ES(β̂1 )
Respuesta:
PN PN
(Xi −X̄)Yi (Xi −X̄)Ui
Recordemos que β̂1 = Pi=1
N 2
. Por ello, β̂1 = β1 + Pi=1
N 2
. Entonces
i=1 (Xi −X̄) i=1 (Xi −X̄)
β̂1 , condicional en X, es una combinación lineal de las variables aleatorias Ui . A su
vez, dada la distribución condicional de U , es directo ver que E(Ui |Xi ) = 0. Por
ende, E(β̂1 |Xi ) = β1 .
Por otro lado, nótese que condicional en X, U es una combinación lineal de dos
normales: U = (1 − Xi ) ∗ N (0, 1) + Xi ∗ N (0, 2). Por ello, condicional en X, U sigue
una distribución normal. Ası́, como –condicional en X– β̂1 es una combinación
lineal de normales, entonces también sigue una distribución normal.
Entonces, condicional en los X y bajo la hipótesis nula (en que E(β̂1 |Xi ) = β1 = a),
β̂1 −a
es una variable aleatoria que se construye a partir de una normal a la cual
ES(β̂1 )
se le resta su media y se le divide por su desviación estándar. Es decir, es una
variable aleatoria que sigue una distribución N (0, 1).
2
2 Pregunta cortas de desarrollo (15 puntos, TIPEAR EN
COMPUTADOR)
A continuación, se le presenta el resultado de una estimación por MCO de un modelo en
que la variable dependiente son las notas en segundo básico (entre 1 y 7) y las variables
explicativas son una dummy hombre, los años de escolaridad de la madre, el promedio
del simce de matemática del colegio. Sin embargo, la tabla presenta tres inconsistencias:
números que son inconsistentes con los otros números de la tabla (números que no pueden
ser ciertos dado la teorı́a econométrica), los que fueron alterados para efectos de esta
pregunta. Describa cada uno de estas inconsistencias (5 puntos por cada una).
Coeficiente Error estándar t-test P-value Intervalo de confianza al 95%
Hombre .0970662 .0120452 -8.06 0.000 -.1206806 -.0734518
Educ de la madre .0538568 .0192982 2.79 0.005 .0160232 .0916904
SIMCE mat Col .0016909 .0002414 1.38 0.000 .0012175 .0021642
Constante 4.045597 .0585258 69.13 0.000 -3.930859 4.160335
Respuesta:
La primera inconsistencia es el valor del coeficiente de “Hombre”. Esto se podı́a notar
fácilmente al fijarnos en el valor del test t y en el intervalo de confianza al 95%. El valor
correcto del coeficiente es -0.0970662. Al hacer este cambio, todos los valores de la fila
para “Hombre” son consistentes entre sı́.
La segunda inconsistencia es el valor del test t para “SIMCE mat Col”. Al dividir
el coeficiente por el error estándar, nos da un valor de 7.005. Esto se podı́a notar al
comparar el valor del test t que nos dan con el p-value, ya que sabemos que si el test t
es menor en valor absoluto que 1.64 el p-value va a ser mayor a 0.1. Al cambiar el test t
por el valor correcto todos los valores de la fila para esta variable son consistentes entre sı́.
La tercera inconsistencia es el lı́mite inferior del intervalo de confianza para la con-
stante. Esto se podı́a notar ya que el intervalo de confianza al 95% no puede contener
0 si el p-value es tan bajo. También se podı́a haber calculado el lı́mite inferior cor-
recto (4.045597 − 1.96 ∗ 0.0585258), que es 3.930859. Al reemplazar el valor que nos dan
por el valor correcto todos los valores de la fila para la constante son consistentes entre sı́.
3
3 Pregunta cortas de desarrollo (30 puntos, TIPEAR EN
COMPUTADOR)
• (15 puntos) Explique en no más de media página, y en palabras simples, por qué
el intervalo de confianza es más informativo que un test de hipótesis cuya hipótesis
nula es H0 : β = 0.
Respuesta:
Lo único que nos dice un test de hipótesis para H0 : β = 0 es si se rechaza la
hipótesis nula a cierto nivel de significancia, mientras que un intervalo de confianza
nos da un rango de valores que no podrı́an ser rechazados a un nivel de significancia
dado. Por lo tanto, es posible evaluar un rango de valores en lugar de evaluar solo un
valor dado. Un intervalo de confianza también nos permite analizar la precisión de
nuestras estimaciones. Por ejemplo, un intervalo de confianza muy ancho indicarı́a
que la precisión de nuestra estimación probablemente no es tan alta. Al presentar
sólo el test de hipótesis, se pierde la posibilidad de examinar esto. Es decir, un
intervalo de confianza nos permite hacer un análisis más profundo de la precisión
de nuestra estimación que un test de hipótesis.
• (15 puntos) Explique en no más de media página, y en palabras simples, por qué
la estimación de regresión discontinua puede ser interpretada como una estimación
de variable instrumental.
Respuesta:
La regresión discontinua se basa en que existe una variable (la running variable),
tal que al pasar un umbral de esa variable existe un salto discreto (o una caı́da) en
la probabilidad de tratamiento, y que quienes están marginalmente arriba de este
umbral son estadı́sticamente iguales en sus no observables respecto a quienes están
marginalmente abajo. Ası́, uno puede construir una variable discreta que toma uno
si se está arriba del umbral y cero si se está abajo. Tal variable funcionará como
una variable instrumental en la medida que se ocupen datos cercanos al umbral
(pues en tal caso este instrumento no correlacionará con los errores). De hecho,
tanto un estimador de VI (con una dummy como instrumento) como un estimador
RD pueden formularse como un estimador de Wald.
4
4 Pregunta de desarrollo (40 puntos, TIPEAR EN COM-
PUTADOR)
En Chile el salario por hora de las mujeres es un 20% más bajo que el de los hombres.
Diferencia que porcentualmente se hace más grande a medida que aumentan los años de
escolaridad. Asumiendo como ciertos estos dos antecedentes, dos economistas discuten
respecto a las implicancias de esta evidencia. La economista A, señala que, si uno
toma estos dos antecedentes, debe concluir que existe una discriminación en el mercado
laboral por el sólo hecho de ser mujer. Ya que, si fuera simplemente una correlación, no
deberı́a pasar que la diferencia salarial siga presente, al controlar por nivel educacional.
La economista B, en cambio, señala que la evidencia presentada no es suficiente para
afirmar que existe discriminación, pues aun controlando por educación, puede haber
otras variables omitidas relevantes.
• (20 puntos) Señale cuál de las dos economistas tiene razón. Base su análisis en
los contenidos del curso, es decir mezcle teorı́a económica con teorı́a estadı́stica.
Respuesta: La economista A tiene razón en que el hecho de que controlando por
educación el efecto persista, es un indicio de que el efecto negativo encontrado de
mujer sobre salarios es evidencia causal y, por ende, un signo de discriminación.
Sin embargo, la economista B también tiene un punto. Por ejemplo, uno de los
determinantes del salario es la experiencia laboral y es probable que las mujeres
tengan en promedio menor experiencia laboral. Ası́, ésta serı́a una variable omitida
que, al estar negativamente correlacionada con mujer, sesgarı́a las estimación a la
baja (haciendo más negativo el efecto mujer).
Extra pauta: Al respecto vale la pena una aclaración normativa, esta menor
experiencia no es en promedio responsabilidad de las mujeres, ya que en gran
medida se debe a ellas asumen (injustificadamente) un rol mucho más intensivo en
las labores de cuidado, en particular, las asociadas a la crianza de hijas e hijos.
Por ello, una posible postura normativa es también llamarle dicriminación al pago
salarial menor producto de una menor experiencia que se deriva de las labores de
cuidad. En cualquier caso, es importante considerarla como una forma distinta de
discriminación, ya que su solución implica otro tipo de polı́ticas.
• (20 puntos) Como la respuesta a la pregunta anterior es debatible, olvı́dese por
un momento de la información que existe y describa cuál serı́a un escenario ideal
para testear discriminación en contra de las mujeres. Ideal, en términos de los
datos y de la estrategia empı́rica que uno podrı́a implementar.
Respuesta: Esta pregunta tiene muchas respuestas satisfactorias posibles (lo que
voy a evaluar es la creatividad y el uso de contenidos del curso al momento de
contestar esta pregunta). En la literatura al respecto encontramos el siguiente
experimento: mandar CVs ficticios a ofertas laborales, tal que tales CV sean en
promedio iguales en todo (experiencia laboral, nivel educacional, etc.), salvo en el
5
género. Ası́, si hay una tasa de entrevistas solicitadas distinta dependiendo de si
se es mujer u hombre, no pueda estar explicado por una variable omitida. Esta
diferente tasa de respuesta no es lo mismo que una diferencia de salario, una vez
contratada(o), pero serı́a un fuerte indicio de discriminación en el mercado laboral.