Pontificia Universidad Católica de Chile
Departamento de Ingenierı́a Industrial y de Sistemas
ICS2563 - Econometrı́a Aplicada 2024’1
Profesor: Patricio Domı́nguez
Ayudante: Juliette Gramatges (
[email protected])
Guı́a VI
29 de mayo del 2024
1. Repaso
1.1. Sesgo de Endogeneidad
Como ya sabemos, uno de los principales problemas de validéz interna que se tiene al estimar
a través del método MCO, por ejemplo una regresión simple del tipo Yi = α+ρsi +ϵi (1), es el
sesgo de endogenidad, por ejemplo, producido por una variable relevante omitida. Este sesgo
se puede generar se generar ya sea por: (i) la variable independiente está correlacionada con
alguna variable no observada, y (ii) porque dicha variable no incluida está correlacionada con
la variable dependiente. Por lo tanto, la variable no omitida (digamos A) está relacionada
con el error, y por ende el supuesto básico del MCO no se cumple (Cov(Xi , ϵi ) ̸= 0).
Donde ahora nuestra regresión en (1) Yi = α + δSi + γA + ϵi (2), sin embargo A sigue siendo
algo no observado, por ende nuestra regresión se mantiene como Yi = α + δsi + γA + ηi (3),
donde ηi = γA + ϵi , y por lo tanto Si es endógena. Al intentar estimar δ, sabemos:
Cov(Yi , Si )
δ̂ =
V ar(Si )
E[Yi Si ] − E[Yi ]E[Si ]
=
V ar(Si )
E[αSi + δSi2 + γASi + ϵi Si ] − E[α + δSi + γA + ϵi ]E[Si ]
=
V ar(Si )
2 2
δ[Si + δE[Si ] + γE[ASi ] − γE[Si ][A] + E[ϵSi ] − E[S]E[ϵi ]]
=
V ar(Si )
Cov(A, Si )
=δ+γ
V ar(Si )
Por lo que, al omitir una variable relevante, nuestro δ̂ puede estar sobre o sub estimado,
dependiento de ls valores de γ, Cov(Si , A) y V ar(Si ).
1.2. Variables Instrumentales
El método de variables instrumentales es una alternativa para calcular la regresión Yi =
α+δsi +γA+ϵi , donde la variable se sospecha Si endógena. Para ello, este método utiliza una
variable o “ı̀nstrumento“ exógeno, Z. Donde podemos estimar δ con esta nueva herramienta,
como:
Cov(Yi , Zi ) = Cov(α + δSi + ϵi , Zi ) = δCov(Si , Zi ) + Cov(ϵi , Zi )
Cov(Yi , Zi ) Cov(ϵi , Zi )
δ= −
Cov(Yi , Zi ) Cov(Yi , Zi )
Por ende, para que nuestro δ sea consistente, es necesario que se cumplan los siguientes
supuestos:
1. Relevancia: Cov(Yi , Zi ) ̸= 0 Este supuesto implica que dado que queremos utilizar
al instrumento Zi para representar a nuestra variable de interés Si , dichas variables
deben estar fuertemente correlacionadas. Una manera de evaluar si está condiciónes se
satisface es llevar a cabo una regresión del tipo: Yi = α + δZi + ϵi , y llevar a cabo una
prueba de hipótesis (por ejemplo, estadı́stico F).
2. Exogeneidad o restricciones de exclusión: Cov(ϵi , Zi )) = 0 Implica que nuestro
instrumento no está correlacionado con el error ϵi , el cual incluye las variables no
observadas. Este supuesto también implica que el instrumento es exógeno y no se
correlaciona con la variable dependiente Yi , es decir, que sea tan bueno como aleatorio.
Pero... ¿Cómo calculamos δ en la práctica? Se sugiere hacer dos regresiones:
Yi = α0 + α1 Zi + µi
Si = βo + β0 Zi + ηi
En este caso: δ̂ = αβ11 El modelo de variables instrumentales puede incluir otras variables de
control, las cuales no deben estar correlacionadas ni con la variable independiente de inetrés
ni con el error.
Yi = β0 + β1 x1 + ... + βk xk + µi
En este caso: δ̂ = αβ11 . Nos interesa en efecto de x1 sobre Y1 . Hasta ahora, obtenemos un
estimador sesgado de β1 con MCO, por lo que incluimos un instrumento Z para x1 .
xi = η0 + η1 x2 + · · · + ηk xk + πZi + νi
Yi = β0 + β(η0 + η1 x2 + · · · + ηk xk + πZi + νi ) + βk xk + µi
Yi = ϕ0 + ϕ2 x2 + ... + ϕk xk + θZi + ωi
θ
En este caso, podemos obtener β1 igual a π
Supongamos que ahora queremos calcular un modelo sobreidentificado, esto es, cuyas varables
endogéneas poseen más de un instrumento (Z1 , Z2 ). Para ello, existe una manera de agrupar
2
la información de manera eficiente para producir un solo estimador, el método de 2SLS. Este
método lleva a cabo la estimación en dos etapas:
1. La primera etapa esta relacionada con el supuesto de relevancia. Consiste en utilizar
los instrumentos para predecir el valor de la variable de interés x1 . Mediante el modelo
con variables instrumentales y variables exógenas:
xi = η0 + ϕ1 Z1 + ϕ2 Z2 + η2 x2 + · · · + ηk xk + µi
Para evaluar si los intrumentos son relevantes aplicamos una prueba de hipótesis.
Luego, tenemos la estimación:
x̂i = ηˆ0 + ϕˆ1 Z1 + ϕˆ2 Z2 + ηˆ2 x2 + · · · + ηˆk xk
2. La segunda etapa se relaciona con el supuesto de exogeneidad de los instrumentos,
para ası́ derivar estimadores insesgados de los coeficientes. Utilizamos x̂i para estimar
β̂i insesgado usando MCO en:
Yi = β0 + β1 x̂i + β2 x2 + · · · + βk xk + ωi
hFinalmente, podemos obtener:
i β2SLS
h = (X̂ ′ X̂)−1 (X̂Y ). iAcá X̂ = Z Π̂, donde Π̂′ =
η̂0 ϕ̂1 ϕ̂2 η̂2 . . . η̂k y Z ′ = 1 Z1 Z2 x2 . . . xk .
1.3. Efectos Heterogéneos
Hasta ahora hemos asumido efectos homogéneos (constantes para cada individuo), lo que
lleva a ATE = TOT (efecto promedio del tratamiento es igual al efecto sen los tratados). Sin
embargo, esto no siempre se cumple, existe otro tipo de sesgo que no estamos considerando. Y
es que para el mismo tratmiento, los individuos pueden tener respuestas únicas (Yi1 −Yi0 = δi ),
a esto le llamamos efectos heterogéneos del tratamiento. Para que un RCT identifique un
ATE, requiere que hay cumplimiento perfecto (del contrario, se asoma el sesgo de selección).
Por lo que surgen nuevas preguntas: ¿Qué estimamos con los instrumentos cuando tenemos
efectos heterogéneos? ¿Bajo qué supuestos el instrumento identifica el efecto causal, habiendo
efectos heterogéneos? Para empezar, se identifican los siguientes subgrupos en base a su
respuesta al tratamiento:
Compliers: si se les asigna el tratamiento, lo reciben (Di1 = 1 Di0 = 0)
Difiers: si se les asigna el tratamiento, no lo reciben (Di1 = 0 Di0 = 0, 1)
Never Takers: independiente de la asignación del tratamiento, siempre lo reciben (Di1 =
1 Di0 = 1.
Always Takers: independiente de la asignación del tratamiento, nunca lo reciben (Di1 =
0 Di0 = 0.
3
Tenemos las nuevas variables binarias, Di , que representan el estado del tratamiento, en
función del instrumento, tal que Di = Di0 + (Di1 − Di0 )Z1 .
Entonces, para trabajar con variables instrumentales (Y (Z, D) ahora se refiere al valor
potencial del resultado para un individuo especı́fico, dado un conjunto de valores para
las variables instrumentales “z“ y del tratamiento “d“), asumiendo efectos heterogéneos,
debemos considerar 4 supuestos:
1. Independencia Yi (Di1 ), Yi (Di0 ), D1 , D0 ⊥ Zi : el instrumento es exógeno “as good as
random assignment“. Supone que la variable instrumental es independiente de los
resultados potenciales y de las asignaciones de tratamiento potenciales. Este supuesto
es suficiente para decir:
E[Yi |Zi = 1] − E[Yi |Zi = 0] = E[Yi (1, Di1 )|Zi = 1] − E[Yi (0, Di0 )|Zi = 0]
= E[Yi (1, Di1 )] − E[Yi (0, Di0 )]
Además, independencia implica que la primera etapa mide el efecto causal de Z en D:
∆ = E[Di |Zi = 1] − E[Di |Zi = 0] = E[Di1 |Zi = 1] − E[Di0 |Zi = 0] = E[Di1 − Di0 ]
2. Primera etapa: Los diseños de variables instrumentales (IV) requieren que Z esté
correlacionado con la variable endógena de manera que E[Di1 − Di0 ] ̸= 0. Es decir,
Z debe tener algún efecto estadı́sticamente significativo en la probabilidad promedio
de recibir el tratamiento.
3. Restricción de exclusión Yi (Di , 0) = Yi (Di , 0) para Di = 0, 1: establece que cualquier
efecto de Z sobre Y debe ser a través del efecto de Z sobre D. En otras palabras, Y (D, Z)
es solamente función de D.
E[Yi |Zi = 1] − E[Yi |Zi = 0]
= E[Yi (1, Di1 )] − E[Yi (0, Di0 )] *Por Independencia
= E[(Di1 − Di0 )(Yi1 − Yi0 )] *Por Equivalencia
Como sabemos, Di1 − Di0 solo puede tomar valores -1, 0, 1 (el individuo recibe o no el
tratamiento). Entonces, el efecto causal del instrumento:
E[Yi |Zi = 1] − E[Yi |Zi = 0]
kP [Di1 − Di0 = k]E[(Di1 − Di0 )(Yi1 − Yi0 ) = k]
X
=
k=−1,0,1
Esto deja en claro que las personas que no responden al instrumento, es decir, aquellas
para las cuales (k = 0), no contribuyen a la identificación. Es decir, no podemos estimar un
efecto causal para la población que no cambió su comportamiento en respuesta al instrumento
4
(’Always takers’ y ’Never takers’). Entonces, el problema de calcular el efecto causal realmente
radica en que el efecto del tratamiento para aquellos que cambian de no participación a
participación cuando Z cambia de 0 a 1 (’Compliers’) puede ser cancelado por el efecto del
tratamiento de aquellos que cambian de participación a no participación cuando Z cambia
de 0 a 1 (’Difiers’).
E[Yi |Zi = 1] − E[Yi |Zi = 0]
= P [Di1 − Di0 = 1]E[(Di1 − Di0 )(Yi1 − Yi0 ) = 1]
− P [Di1 − Di0 = −1] + E[(Di1 − Di0 )(Yi1 − Yi0 ) = −1] (1)
¿Cómo podemos avanzar? El enfoque menos restrictivo es asumir “monotonı́a“.
4. Monotonicidad (Di1 sea mayor a Di0 ): requiere que la variable instrumental opere en
la misma dirección en todas las unidades individuales. En otras palabras, aunque el
instrumento puede no tener efecto en algunas personas, todas las personas que son
afectadas lo son en la misma dirección (P [Di1 − Di0 = −1] = 0) y E[Di1 − Di0 ] =
1 · P [Di1 − Di0 = 1]. No hay ’Difiers’.
Finalmente, asumir los 4 supuestos, implica que el efecto ITT es igual a:
E[Yi |Zi = 1] − E[Yi |Zi = 0]
= P [Di1 − Di0 = 1]E[(Yi1 − Yi0 )(Di1 − Di0 ) = 1]
= P [Di1 − Di0 = 1]E[(Yi1 − Yi0 )|Di1 − Di0 = 1]
E[Yi |Zi = 1]−E[Yi |Zi = 0] : es el efecto causal del instrumento en la variable de interés (ITT).
Si tomamos el efecto causal del instrumento en el tratamiento, E[Di|Zi = 1]–E[Di|Zi = 0],
la división entre ambos nos da el estimador Wald o estimador IV (LATE).
E[Yi |Zi = 1] − E[Yi |Zi = 0]
βˆIV =
E[Di |Zi = 1] − E[Di |Zi = 0]
= E[(Yi1 − Yi0 )|Di1 − Di0 = 1]
El estimador IV, identifica el efecto causal promedio para la población que cambió su
estado de tratamiento de acuerdo con el cambio en el valor del instrumento. Finalmente,
podemos usar variables instrumentales tratar modelos con variables endogénicas y efectos
heterogeneos. Angrist e Imbens denominaron este efecto causal como el efecto promedio local
del tratamiento (LATE).
1. Preguntas
Pregunta 1
Explique la diferencia entre los efectos homogeneos y heterogeneos.
5
En los efectos homogenemos, el efecto de la variable independiente sobre la dependiente
es igual en todas las observaciones. Los efectos heterogeneos, por el contrario, indica que
el efecto de las variables independientes sobre la variable dependiente puede variar en las
observaciones
Pregunta 2
Supongamos que estás analizando el efecto de una capacitación en habilidades de negocios
(tratamiento) en los ingresos de las personas. El problema es que la asistencia a esta capacitación
puede estar correlacionada con caracterı́sticas no observadas (como la motivación de las
personas) que también afectan los ingresos. Para superar este problema, decides utilizar
una variable instrumental: una invitación aleatoria a la capacitación (esta es una variable
aleatoria). Estos son los datos:
Invitados al curso de capacitación:
Asistieron e incrementaron sus ingresos: 60 personas
Asistieron pero no incrementaron sus ingresos: 20 personas
No asistieron e incrementaron sus ingresos: 5 personas
No asistieron y no incrementaron sus ingresos: 15 personas
No invitados al curso de capacitación:
Asistieron e incrementaron sus ingresos: 10 personas
Asistieron pero no incrementaron sus ingresos: 10 personas
No asistieron e incrementaron sus ingresos: 40 personas
No asistieron y no incrementaron sus ingresos: 40 personas
1. ¿Por qué una regresión MCO podrı́a producir un estimador sesgado? Por enunciado:
dado que puede haber una variable omitida correlacionada a las variables explicativas.
2. ¿Puedes argumentar en base a los principios vistos en clases que la invitación a la
capacitación es un instrumento válido en este contexto?Primero, podemos decir que se
cumple el supuesto de relevancia en el contexto, dado que la invitación está claramente
relacionada a la capacitación Cov(zi , Di ) ̸= 0. Por otro lado, se cumple el supuesto
de exogeneidad, dado que por enunciado sabemos que la invitación es una variable
aleatoria, por consecuencia Cov(zi , ϵi ) = 0. Por ende, es un instrumento válido.
3. Indica cuál serı́a el modelo a estimar y las etapas del proceso de estimación.
La primera etapa: Di = α + ρzi + ωi
La segunda etapa: Yi = γ + βzDi + µi
Reemplazando, obtenemos el modelo a estimar : Yi = α + β(αρzi + ωi ) + µ = α + βα +
βρzi + βωi
6
Donde podemos resumir los siguientes términos: βα = κ + βρ = ζ βωi + µi = ϵi .
Recordemos que Yi es una variable binaria que vale 1 si la observación i subió sus
ingresos (0 si no), Di indica si asistió a la capacitación (0 si no ası́stió).
4. ¿Cuál es la intención de tratar (ITT), es decir, el efecto de recibir una invitación a la
capacitación en los ingresos?.
Invitados al curso de capacitación: (zi = 1)
Asistieron e incrementaron sus ingresos: 60 personas (Di = 1 Yi = 1)
Asistieron pero no incrementaron sus ingresos: 20 personas (Di = 1 Yi = 0)
No asistieron e incrementaron sus ingresos: 5 personas (Di = 0 Yi = 1)
No asistieron y no incrementaron sus ingresos: 15 personas (Di = 0 Yi = 0)
No invitados al curso de capacitación: (zi = 0)
Asistieron e incrementaron sus ingresos: 10 personas (Di = 1 Yi = 1)
Asistieron pero no incrementaron sus ingresos: 10 personas (Di = 1 Yi = 0)
No asistieron e incrementaron sus ingresos: 40 personas (Di = 0 Yi = 1)
No asistieron y no incrementaron sus ingresos: 40 personas (Di = 0 Yi = 0)
E[Yi |zi =1]−E[Yi |zi =0] IT T
Sabemos que β = E[Di |zi =1−E[Di |zi =0]
= ComplienceRate
60 · 1 + 20 · 0 + 5 · 1 + 15 · 0
E[Yi |zi = 1] = = 0,65
60 + 20 + 5 + 15
10 · 1 + 10 · 0 + 40 · 1 + 40 · 0
E[Yi |zi = 0] = = 0,5
10 + 10 + 40 + 40
ITT = 0.65 - 0.5 = 0.15
5. ¿Cuál es el efecto de la primera etapa, es decir, el efecto de recibir una invitación a la
capacitación en la asistencia a la misma?
Buscamos el complience rate (efecto de la asignación de tratamiento sobre la recepción)
60 · 1 + 20 · 1 + 5 · 0 + 15 · 0
E[Di |zi = 1] = = 0,8
60 + 20 + 5 + 15
10 · 1 + 10 · 1 + 40 · 0 + 40 · 0
E[Di |zi = 0] = = 0,2
10 + 10 + 40 + 40
Compliance rate = 0.8 - 0.2 = 0.6
7
6. Con la información disponible. Puede identificar quienes son ’Compliers’, ’Difiers’,
’Always takers’ y ’Never takers’?
La información no es suficiente. Por ejemplo, sabemos que el grupo que recibe tratamiento
son ’Always takers’ y ’Compliers’, sin embargo no podemos identificar quienes pertenecen
a un grupo y otro. Lo mismo para quienes no reciben tratamiento. Esto se debe a
que solo podemos observar uno de los estados del mundo posible, nuestro problema
fundamental.
7. Suponiendo que el cumplimiento es monótono (es decir, nadie se comporta de manera
contraria a la intención)¿Cuál es el Efecto del Tratamiento Local Promedio (LATE),
es decir, el efecto de la capacitación en los ingresos para el subgrupo de compliers?
IT T 0,15
LAT E = CR
= 0,6
= 0,25
8. Tomando el valor obtenido de LATE. ¿Es válido este valor? Hint: use en el argumento
su respuesta en el inciso 6)
Pese a que no tenemos certeza a qué grupo pertenece cada individio (’Compliers’,
’Difiers’, ’Always takers’ y ’Never takers’), el estimador LATE es internamente válido
para el grupo de compliers, bajo los supuestos. Es decir, los compliers son los únicos
que aportan variación relevante al calcular el estimador.
Pregunta 3
Considere el siguiente modelo:
yi = α + ρsi + ϵi
Donde se sospecha si una variable endógeno.
a. ¿Cuáles son los supuestos que se deben cumplir para que zi efectivamente sea un buen
instrumento de X?
Z debe cumplir con dos supuestos. En primer lugar, debe cumplir con el supuesto de exclusión,
el cual implica que Cov(zi , ϵ) = 0. Este supuesto se debe argumentar en base a la información
proporcianda. Por otro lado, también debe cumplir con el supuesto de relevancia, que quiere
decir que la variable Z explica en gran parte X (se puede ocupar un test F para ver relevancia
en la primera etapa).
b. Sea zi es un instrumento válido. Usando esperanza condicional, demuestre el estimador
IV.
E[yi |z = 1] = α + ρE[si |zi = 1]
E[yi |z = 0] = α + ρE[si |zi = 0]
8
Restando ambas y despejando ρ:
E[yi |z = 1] − E[yi |z = 0]
ρ=
E[si |z = 1] − E[si |z = 0]
c. Sea zi un instrumento binario válido. ¿Cómo interpretarı́a el numerador y el denominador
del estimador IV?
Note que como zi es binaria, entonces el numerador es el coeficiente (no el intercepto) de
una regresión entre yi y zi . Un argumento válido aplica para el denominador, reemplazando
yi por si . Es mas, el numerador es el ITT y el denominador es la diferencia de la compliance
rate
Pregunta 4
Considere el siguiente modelo de regresión:
yi = α′ Xi + ρsi + νi ∀i = 1, . . . , n
donde si es endógena y Xi son un conjunto de covariables exógenas. Defina el instrumento
zi para si , y z̃i como los residuos de una regresión entre zi y Xi . Pruebe que
Cov(yi , z̃i )
ρ̂ =
Cov(si , z̃i )
Sean z̃i los residuos de una regresión entre zi y Xi . Tomemos la covarianza respecto a z̃i en
el modelo. Para i ∈ {1, 2, . . . , n},
Cov(yi , z̃i ) = Cov(α′ Xi + ρsi + νi , z̃i )
= α′ Cov(Xi , z̃i ) + ρCov(si , z̃i ) + Cov(νi , z̃i )
Note que como z̃i son los residuos de una regresión entre zi y Xi , entonces por construcción
las variables aleatorias son no correlacionadas (Cov(Xi , z̃i ) = 0). A su vez, como νi es un
ruido aleatorio, no está correlacionado con ninguna variable aleatoria, particularmente con
zi (Cov(νi , z̃i ) = 0). Luego, se cumple:
Cov(yi , z̃i ) = ρCov(si , z̃i )
De donde sale rápidamente la estimación de ρ pedida.
9
Pregunta 5
Sea Z un vector que contiene k instrumentos. Considere el modelo
y = Xβ + ϵ
donde X representa a una variable endógena y supondremos n observaciones, para obtener
una expresión de β2SLS que dependa únicamente de y, X y Z.
Según 2SLS tenemos X̂ = Z Π̂. Pero sabemos que Pˆi es MCO, luego
X̂ = Z(Z ′ Z)−1 Z ′ X
Reemplazando en la definición de β2SLS , es decir, en (X̂ ′ X̂)−1 (X̂y).
−1
β2SLS = (Z(Z ′ Z)−1 Z ′ X ∗ )′ Z(Z ′ Z)−1 Z ′ X ∗ (Z(Z ′ Z)−1 Z ′ X ∗ )′ y
′ ′
= (X ∗ Z(Z ′ Z)−1 Z ′ X ∗ )−1 X ∗ Z(Z ′ Z)−1 Z ′ y
Pregunta 6
Considere un modelo modelo sobreidentificado, y Z como matriz de variables intrumentales.
Ahora, imagine que se cumplen las condiciones. Derive el estimador de variable instrumental
(βIV ). ¿De qué rango debe ser la matriz Z?
Podemos premultiplicar el modelo propuesto por la matriz de instrumentos Z ′ :
Z ′ y = Z ′ Xβ + Z ′ ϵ
Con esto, el beta estimado es:
βIV = (Z ′ X)−1 Z ′ y
Para poder realizar esto, la matriz Z ′ debe ser del mismo rango que X, es decir, debe ser de
rango K, con K siendo el número de variables.
Pregunta 7
6. Suponga que usted quiere estimar el efecto de la asistencia a clases en el rendimiento
académico de los estudiantes. Un modelo básico serı́a el siguiente:
nota examen = β0 + β1 asistencia + β2 nota examen pasado + ϵ (8)
Donde nota examen es la nota de los estudiantes en el examen (del 1 al 7), asistencia
es el número de clases asistidas (de 0 a 12) y nota examen pasado es la nota de los
estudiantes en el examen del año anterior.
10
(a) Sea dist la distancia desde la residencia de los estudiantes al lugar donde se realizan
las clases. ¿Usted cree que dist está correlacionado con el error ϵ?
(b) Al estimar los coeficientes de la ecuación (8) por MCO, ¿cree Ud. que la estimación
podrı́a estar sesgada?
(c) Asumiendo que dist y ϵ no están correlacionados. ¿Qué otro supuesto debe cumplir
dist para ser una variable instrumental válida para asistencia? ¿dist cumple con
este supuesto? Argumente.
a. Ejemplo de Argumento: Si el lugar donde se realizan las clases está ubicado en una zona
particular de la ciudad y en esa zona viven personas con más recursos podrı́a haber
un canal que relacione distancia con calificación que no esté mediado por la asistencia,
luego no se cumplirı́a la restricción de exclusión. Ahora, si el nivel socioeconómico no
tuviese relación con la distancia, luego probablemente no existirı́a correlación entre dist
y ϵ.
b. Quienes asisten lo podrı́an hacer con mayor frecuencia porque necesitan reforzar contenidos
y, por lo tanto, podrı́an estar negativamente seleccionados.
c. Relevancia, es decir, Cov(dist, asistencia) ̸= 0. Vivir lejos del lugar de clases probablemente
afecta a la asistencia, por lo que deberı́a ser un instrumento relevante (esto se puede
testear viendo la significancia de dist en la regresión: asistencia = β0 + β1 dist + ν o
analizando el estadı́stico F en caso de incluir covariables a la anterior regresión).
Pregunta 8
Demuestre que, ocupando como instrumento la aleatorización, el ToT (efecto en los tratados)
se puede descomponer como la ponderación entre el efecto en los always takers y el efecto
en los compliers. ¿A qué corresponderı́a el efecto de los no tratados?
Note que
E[Y1i − Y0i |Di = 1] = E[Y1i − Y0i |D0i = 1]P [D0i = 1|Di = 1]
+ E[Y1i − Y0i |D1i ≥ D0i ]P [D1i ≥ D0i , Zi = 1|Di = 1]
con:
P [D0i = 1|Di = 1] + P [D1i ≥ D0i , Zi = 1|Di = 1] = 1
Esto naturalmente es por la ley de probabilidades totales. Por otra parte, note que el efecto
en los no tratados:
E[Y1i − Y0i |Di = 0] = E[Y1i − Y0i |D0i = 0]P [D0i = 0|Di = 0]
+ E[Y1i − Y0i |D1i ≥ D0i ]P [D1i ≥ D0i , Zi = 0|Di = 0]
11
Con:
P [D0i = 0|Di = 0] + P [D1i ≥ D0i , Zi = 0|Di = 0] = 1
Referencias
[1] Scott Cunningham. (s.f.). difference-in-differences. Causal Inference The Mixtape.
Recuperado de https://mixtape.scunning.com/07-instrumental_variables#
heterogeneous-treatment-effects.
[2] Ejercicios de la gúia de variables instrumentales 2023-02, material de Felipe Valdés.
Ejercicios de Ayudantı́a de variables instrumentales 2023-01, material de Florencia
Sciaraffia.
[3] Estractos del resumen recuperado de: https://bookdown.org/viclzrz/notasmicro/
variables-instrumentales.html
12