0% encontró este documento útil (0 votos)
67 vistas4 páginas

Pontificia Universidad Católica Del Perú Facultad de Ciencias Sociales CICLO 2025-1 Econometría Intermedia: Micro Práctica Dirigida #3

emtria
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
67 vistas4 páginas

Pontificia Universidad Católica Del Perú Facultad de Ciencias Sociales CICLO 2025-1 Econometría Intermedia: Micro Práctica Dirigida #3

emtria
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ

FACULTAD DE CIENCIAS SOCIALES


CICLO 2025-1
Econometría Intermedia: Micro

Práctica Dirigida Nº 3

Profesor: José María Rentería [email protected]


Jefes de Práctica: Diego Quispe [email protected]
Luis M. Chirichigno [email protected]

Objetivos de la PD3:
• Comprender las características y supuestos de los modelos binarios logit y probit
binomial; y aprender a aplicar ambos métodos en Stata
• Entender la diferencia entre la asignación aleatoria del tratamiento y el uso efectivo
del tratamiento

Al final de la PD3 el estudiante será capaz de:


• Estimar correctamente los modelos binarios logit y probit binomial en Stata,
interpretar los resultados y evaluar la bondad de ajuste
• Interpretar las diferencias entre los análisis de datos experimentales
_________________________________________________________________________

LOGIT Y PROBIT BINOMIAL

El 15 de abril de 1912, el transatlántico Royal Mail Ship Titanic, considerado el barco más
grande y lujoso de su época, se hundió después de chocar con un iceberg en su viaje
inaugural desde Southampton, Inglaterra, hacia Nueva York. Este desastre marítimo causó
la muerte de más de 1,500 personas, convirtiéndose en una tragedia que conmocionó al
mundo. A pesar de haber pasado más de un siglo desde aquel fatídico suceso, el interés
público por el Titanic sigue vigente.

The British Board of Trade, durante su investigación del hundimiento, recolectó datos sobre
la composición de los pasajeros a bordo del trasatántlico. Se ha establecido que existía una
marcada estratificación social en el barco, con una clara división entre pasajeros de primera,
segunda y tercera clase. Esta diferencia de clases se reflejó en las tasas de supervivencia. A
pesar de que se aplicó la conocida política de "mujeres y niños primero", los pasajeros de
tercera clase tuvieron menos oportunidades de ser rescatados en comparación con aquellos
de clases superiores.
La base de datos titanic_m.dta1 permite analizar diversos aspectos, como la
distribución de género, edades y tasas de supervivencia entre las diferentes clases de
pasajeros. Asimismo, nos brinda la oportunidad de comprender mejor las circunstancias
que rodearon la tragedia y cómo las políticas y condiciones a bordo afectaron a los pasajeros
en situaciones de emergencia. Esta base contiene información de 714 pasajeros del Titanic.
Las variables que la conforman son:

– survived: =1 si sobrevivió, 0 en caso contrario


– class: =1 si viajó en 1era, 2 si viajó en 2da, 3 si viajó en 3ra clase
– sex: =1 si es mujer, 0 si es hombre
– age: edad del individuo en años

La ecuación propuesta es:

survived𝑖 = 𝛽0 + 𝛽1 class𝑖 + 𝛽2 age𝑖 + 𝛽3 sex𝑖 + 𝑢𝑖

1. Mostrar los principales estadísticos descriptivos de las variables. Luego, presente los
estadísticos separando por la clase en la cual viajó la persona.
2. Utilizando el modelo de probabilidad lineal (MPL), estime la probabilidad de
supervivencia.
3. Identifique si el MPL está prediciendo adecuadamente las probabilidades de que la
persona sobreviva.
4. Reestime el modelo mediante un logit y probit. Compare estos resultados con la
estimación MPL.
5. Halle e interprete la razón de probabilidades (Odds ratio).
6. Halle e interprete el efecto marginal en el promedio de las variables en X.
7. Halle e interprete el efecto marginal promedio. ¿Cuál es la diferencia entre ambos?
8. Grafique los efectos marginales.
9. Calcule y grafique la probabilidad de sobrevivir según sexo diferenciado por la
clase en la cual viajaban.
10. Calcule y grafique la probabilidad de sobrevivir según edad diferenciando por la
clase en la cual viajaban.
11. Calcule el Pseudo - R2 de McFadden, el Ratio de Verosimilitud y la Correcta
Clasificación.

ESTUDIOS EXPERIMENTALES

12. Defina qué es la aleatorización, ejemplifique e indique cuáles serían los problemas
de un estudio que la emplee incorrectamente.

1
La base de datos pertenece a Encyclopedia Titanica y se puede descargar en https://www.encyclopedia-
titanica.org/
Ejemplo tomado de Glennerster y Takavarasha (2018)2:

13. Este ejercicio se busca estimar el impacto de un programa educativo en la región de


Uttar Pradesh en India bajo distintos métodos.3 El programa se denomina “Learn-
to-Read” (L2R) y desarrolla metodologías de enseñanza para mejorar habilidades de
lectoescritura, y que buscan incluir miembros voluntarios de las organizaciones
locales para que distintos actores se involucren en el proceso de enseñanza-
aprendizaje.

En la base de datos “LearnToRead”, las variables relevantes para el análisis son:


- freeclasses: toma el valor de 1 si el niño toma clases gratuitas, 0 en caso
contrario
- readlevel_base: nivel de lectura del niño en una escala del 0-5, antes de la
intervención
- readlevel_mid: nivel de lectura del niño en una escala del 0-5, luego de la
intervención

Para comenzar el análisis, realice lo siguiente:

a. Primero analizaremos el impacto del programa L2R usando la asignación


original al grupo de tratamiento. El tratamiento consiste en introducir un
módulo de clases adicionales voluntarias enfocado en habilidades de lectura
que incluye la participación de organizaciones locales. Las variables de
interés son:

- treatment: =1 si el niño es asignado aleatoriamente al tratamiento, 0 en caso


contrario
- readlevel_base: nivel de lectura del niño en una escala del 0-5, antes de la
intervención (línea de base)
- readlevel_mid: nivel de lectura del niño en una escala del 0-5, luego de la
intervención
- panchayatid: identificador de cada municipio

i. Estime la diferencia promedio de los niveles de lectura promedio


entre el grupo de tratamiento y el grupo de comparación. ¿Qué
parámetro se obtiene si las personas respetaron la asignación inicial?
ii. Estime la diferencia en los niveles finales de lectura considerando
solo a el nivel previo de lectura del estudiante como variable de
control.
iii. Agregue todos los controles a la estimación.

2
Glennerster, R. y Takavarasha, K. (2014). Running Randomized Evaluations: A Practical Guide. New Jersey:
Princeton University Press. Link de descarga: http://runningres.com/exercises (Módulo 2.2).
3
El caso en cuestión puede encontrarlo aquí: https://bit.ly/3zJ54jv
b. ¿Hay alguna relación entre el uso del tratamiento con el resto de las
variables de control?
c. Ahora, considere la base de datos en donde se tiene información sobre si las
personas tomaron o no el tratamiento de clases gratuitas. Los investigadores
encontraron que hubo contaminación, es decir, individuos asignados al
grupo de control recibieron o se vieron afectados por el tratamiento. Ahora
estimaremos el ATT (Average Treatment Effect of Treated). Tomamos en
cuenta el siguiente conjunto de variables de control:

▪ Seleccione el siguiente conjunto de variables de control:


readlevel_base, age, sex, standard,
schooltype_govt, schooltype_private,
schooltype_ngo, schooltype_madrassa,
literate.

i. Justifique por qué sería pertinente estimar el ATT. Calcule la relación


entre tener o no clases gratuitas versus la prueba final sin tomar en
cuenta los controles. Recuerde clusterizar los errores a nivel de
municipios (panchayatid)
ii. Tome la misma regresión del ítem anterior, pero esta vez use el nivel
de lectura previo como variable de control.
iii. Agregue el total de controles a la regresión. ¿Cuáles son los
potenciales problemas con este tipo de evaluaciones?

También podría gustarte