Extensiones Econométricas- Examen Parcial
Economı́a - Extensiones Econométricas Edinson Tolentino
USMP, Departamento de Economı́a Semestre 2021-2
Examen Parcial , 23 de septiembre de 2021
Pautas
Tener encuenta las siguientes pautas:
1. Fecha de entrega: 30 de setiembre 2021 , hasta las 11pm
2. Responda cada sub-pregunta de las preguntas elegidas
3. Responder dado el desarrollo de cada pregunta y subpregunta ( imagenes, tablas y/o
cuadros, etc).
4. Se le pide que realice el siguiente procedimiento de envio (los dos):
a) Formato de documento: Remitir la información de su examen (PDF) número
de grupo EP-EE-Numero de grupo
b) Correo: remitir el correo con el asunto EP-EE al correo:
[email protected] 5. La exposición debe considerar un maximo de 8 slides (PPT), responderá preguntas (3
planteadas por el profesor ) y algunas selecionadas de los estudiantes (mı́nimo dos de
ellas).
6. La nota final considera las respuestas de su informe a la pregunta asignada al grupo,
ası́ como la exposición y respuestas a las preguntas planteadas
1
Preguntas
1. Un investigador estima una ecuación logarı́tmica del salario utilizando datos transver-
sales que comprenden 1,431 personas que trabajan en la provincia china de Shandong
en 2010. Se especifica la siguiente relación:
log(wage)i = α+β1 f emalei +β2 agei +β3 agesquared+β4 higheri +β5 middlei +β6 f reemeali +µi
Donde µi es el termino de error i = 1, · · · , 1431. La variable dependiente es el logaritno
natural mensual. Las variables independientes son: una variable dummy para el género
del individuo, que es igual a 1 si es mujer y 0 en caso contrario (female); la edad del
individuo medida en años (age) y su cuadrado (age squared); dos variables dummys que
capturan el nivel de educación del individuo, donde higher es igual a 1 si el individuo
tiene educación superior (y 0 en caso contrario) y middle es igual a 1 si el individuo tiene
educación media (y 0 en caso contrario) con el grupo base en estimación menor o nula
educación; una variable ficticia para determinar si el individuo recibe o no una comida
gratis en su lugar de trabajo (free meal). Las estimaciones de MCO se proporcionan
en la siguiente tabla con los errores estándar entre parentesis.
Variables OLS estimates
Constant 4.4229
(0.1340)
female -0.2046
(0.0294)
Age 0.0920
(0.0087)
age squared -0.0011
(0.0001)
higher 0.1318
(0.0463)
middle 0.0246
(0.0339)
free meal -0.3112
(0.0312)
Sample Size 1431
Adjusted-R2 0.3481
a) Los residuos de MCO se recuperan del modelo de regresión anterior y se elevan al
cuadrado. A continuación, se hace una regresión de los residuos al cuadrado sobre
el logaritmo de los salarios mensuales previstos. La suma de cuadrados residual
y explicada de esta regresión auxiliar es 846.13 y 0.17 respectivamente. Utilice
esta información para realizar una prueba de heterocedasticidad con un nivel de
significancia del 5 %, especificando claramente los grados de libertad de la prueba.
2
Interprete el valor de la prueba. ¿Cuáles son las implicaciones de su hallazgo? ¿En
qué circunstancias podrı́a preferirse este tipo de prueba a una prueba de Cook-
Weisberg?
b) Interprete con precisión la estimación puntual de MCO para β1 . Con un nivel de
significancia de 0.05, realice una prueba t para la siguiente hipótesis:
Ho : β1 = −0,22 vs Ha : β1 not = −0,22
¿Qué concluyes? Determine el valor de la prueba F para esta prueba.
c) Determine e interprete con precisión el efecto marginal de la age sobre el logaritmo
de los salarios mensuales a los 30 años. Utilice un nivel de significancia de 0.05
para determinar si el efecto marginal obtenido a esta edad en particular es igual a
0.03. ¿Qué concluyes? La submatriz de la matriz de varianza-covarianza de MCO
correspondiente a los coeficientes estimados para β2 y β3 viene dada por:
d ) ¿A qué edad se maximizan los salarios mensuales logarátmicos en este caso? Uti-
lice un nivel de significancia de 0.05 para determinar si el punto de inflexión es
estadı́sticamente diferente de 40. Formule claramente las hipótesis nula y alterna-
tiva bajo prueba. ¿Qué concluyes?
3
2. Un economista utiliza un modelo probit ordenado para estimar los determinantes de
los niveles de satisfacción del estandar de vida para una muestra de 502 productores de
té de Ruanda en 2016. La variable dependiente observable (y) se codifica como 1 si el
productor de té no está satisfecho con niveles de vida actuales, 2 si el productor de té
no está ni satisfecho ni insatisfecho con los niveles de vida actuales, y 3 si el productor
de té está satisfecho con los niveles de vida actuales. El número de agricultores en la
categorı́a no satisfecho es 157, el número en la categorı́a ni satisfecho ni insatisfecho es
139 y el número en la categorı́a satisfecho es 206. Las variables explicativas del modelo
de regresión comprenden: una variable dummy para saber si el agricultor es o no hombre
(Male); una variable continua que captura la edad en a nos del agricultor (Age); una
variable dummy para determinar si el agricultor sufrió o no una lesión relacionada
con la granja en el último año (Injury); una variable dummy para determinar si el
agricultor recibio capacitación en el cultivo de té en el último año (Training); y una
variable continua para el tamaño de la tierra del agricultor medida en hectareas (Land).
El modelo de variable dependiente latente subyacente se expresa como:
yi = β1 M alei + β2 Agei + β3 Injuryi + β4 T rainingi + β5 Landi + µi
Donde µ ≈ N (0, 1) y donde yi∗ es la variable latente dependiente
Se obtienen las siguientes estimaciones de máxima verosimilitud probit ordenadas (con
errores estándar asintóticos entre parentesis):
Variables Estimates
Male 0.270
(0.109)
Age -0.005
(0.003)
Injury -0.289
(0.146)
Training 0.340
(0.119)
Land 0.184
(0.058)
θb1 -0.385
(0.166)
θ2
b 0.367
(0.166)
Sample Size 502
Log-Likelihood -524.9
a) Explique por qué se utilizó un modelo probit ordenado en lugar de un modelo
logit multinomial (MNL) en este caso. Suponga que el modelo probit ordenado se
volvió a estimar sin incluir ninguna de las cinco variables explicativas anteriores,
¿cuál será el valor estimado obtenido de θb1 y θb2
4
b) Explique por qué aquı́ no se incluyó un término constante en el modelo probit
ordenado. Si se hubiera incluido ese término, ¿cuál serı́a su valor?
c) La probabilidad de que un productor de té de Ruanda esté satisfecho con su nivel
de vida actual se define para este modelo probit ordenado como:
prob [yi = 3] = 1 − Φ(θ2 − zi )
Donde zi = β1 M alei + β2 Agei + β3 Injuryi + β4 T rainingi + β5 Landi + µi y donde
Φ(.) denota el operador de la función de distribución acumulativa normal estándar
(CDF). Utilice la información anterior para derivar la expresión del efecto margi-
nal de Land para la categorı́a satisfecho. Si se calcula que el valor promedio de la
muestra para el ı́ndice z es 0.31, calcule e interprete con precisión el efecto mar-
ginal de la variable Land para esta categorı́a. ¿Cuál es el efecto de un cambio de
un cuarto de hectárea en el tamaño de la tierra en el resultado de esta categorı́a?
¿Puede determinar a partir de las estimaciones probit ordenadas el signo de los
efectos marginales correspondientes para las otras dos categorı́as de resultados en
este caso? Explique su respuesta y demuéstrelo de manera aproximada usando un
diagrama apropiado.
d ) La probabilidad de que un productor de té de Ruanda esté no satisfecho con su
nivel de vida actual se define para este modelo probit ordenado como:
prob [yi = 1] = 1 − Φ(θ1 − zi )
Calcular e interpretar con precisión el impacto de una Infury relacionada con la
granja sufrida en el último año sobre la probabilidad de estar no satisfecho con
los estándares de vida actuales para un agricultor de 40 años, que no ha recibido
capacitación en cultivo de té en los últimos años, y cuyas propiedades son de 0,4
de hectárea. Si el efecto de impacto para el mismo individuo estilizado para la
categorı́a ni satisfecho ni insatisfecho se calcula en 0.011, determine el efecto de
impacto correspondiente para la categorı́a satisfecho. Interprete con precisión este
efecto.
5
3. Un investigador busca investigar los determinantes de la duración de las huelgas en
Ghana entre 1980 y 2004. El número total de huelgas durante este periodo fue de 495.
La siguiente tabla define las variables utilizadas en el análisis empı́rico:
Variables definición
Duration La cantidad de dı́as que duró la huelga
lworkers Logaritmo natural del numero de trabajadores involucrado
wage dummy == 1, si la huelga estuvo relacionada con el salarios; == 0 otro casos
solid dummy == 1, si la huelga es solidaria; == 0 otro casos
cond dummy == 1, si la huelga esta relacionado con condiciones de trabajo; == 0 otro caso
other dummy == 1, si la huelga esta relacionado con otros factores; == 0 otro casos
private dummy == 1, si la huelga fue en el privado; == 0 otro casos
a) ¿Cuál es el tiempo de salida (quiebre) que se está modelando en este caso parti-
cular? ¿Cuál es la distinción entre observaciones censuradas y no censuradas en
este tipo de aplicación? ¿Cuántas observaciones están realmente censuradas en
este caso? Se sabe a partir de los datos brutos que 186 huelgas se completaron al
final del dı́a uno de la huelga, 108 al final del dı́a dos de la huelga y 54 al final del
dı́a tres de la huelga. Utilice esta información para calcular las tasas de riesgo de
Kaplan-Meier para estos tres dı́as. Proporcione una interpretación precisa para
cada una de estas tres estimaciones.
b) El investigador realiza la estimacion del modelo Weibull proporcional de hazard
(PH) dada la siguiente forma:
θ(Xi , t) = exp(β0 +β1 lworkersi +β2 wagei +β3 solidi +β4 otheri +β5 private)(αtα−1 )
Donde i es la i − esima huelga y t es el tiempo. Las estimaciones para el modelo
de regresión de riesgos proporcionales (PH) de Weibull se informan: en la primera
columna de la siguiente tabla:
6
Variables Weibull (PH) Cox (PH)
Constant -1.639
(0.225)
lworkers -0.060 -0.050
(0.032) (0.038)
wage 0.023 0.040
(0.032) (0.121)
solid 0.512 0.354
(0.198) (0.197)
other 0.254 0.177
(0.137) (0.136)
private 0.507 0.350
(0.098) (0.098)
α
b 0.954
(0.029)
Sample Size 495 495
Log-(L) -746.9
Partial Log-(L) -2560.6
¿Por qué el modelo de Weibull estimado aquı́ se denomina modelo de riesgos
proporcionales?. Interprete con precisión las estimaciones del modelo de Weibull
para β1 y β5 en este caso. Sobre la base de las estimaciones, ¿cuál de los cuatro
tipos de huelga (es decir, wage, solid, other o cond) reporta la duración promedio
más corta de la huelga?
c) Utilice un nivel de significancia de 0.05 para probar la siguiente proposición:
Ho : log(α) = 0 vs Ha : log(α) < 0
¿Qué es esta prueba? ¿Qué concluye del resultado de su prueba? ¿En qué circuns-
tancias la estimación de α podrı́a tener un sesgo a la baja? ¿Por qué el sesgo a la
baja podrı́a ser un problema aquı́?
d ) El modelo de peligro de huelga se vuelve a estimar como un modelo de riesgos pro-
porcionales (PH) de Cox y las estimaciones se encuentran en la segunda columna
de la tabla que se indica en la parte (b) anterior. Comente las diferencias en las
estimaciones entre los dos modelos de riesgo. ¿Cuáles son las ventajas del modelo
Cox PH sobre el modelo Weibull PH? ¿Cuáles son sus posibles desventajas?
7
Grupos1
1. Grupos 1
Chamochumbi Becerra, Jennifer
Cruz Bautista, Ana
Flores León, Valeria
Martinez Gamboa, Carlos
2. Grupos 2
Arroyo Velasco, Karla
Menor Terán, Paulo
Orosco Vidarte, Sofı́a
Palacios Rueda, Gianfranco
Pérez Garatea, Kattina
Ramı́rez Quintana, Patrick
3. Grupos 3
Leyli Di Garcia Alarcon
Muñoz Velasquez, Juan
Cubas aguilar Manuel
Diego Morales
Saul Alarcon
4. Grupos 4
Seir Magdiel Leguia Talaverano
Betsi Rupay Serrano
Javier Delgado Delgado
Dayan Montes Sanchez
5. Grupos 5
Diego Abrahamson Calderón Cervantes
Entonces los grupos cotejados tiene el detalle las siguientes preguntas a desarrollar: Grupo
1 (pregunta 1) , grupo 2 (pregunta 3) , grupo 3 (pregunta 3), grupo 4 (pregunta 2), grupo 5
(pregunta 1).
1
La conformación de grupos , fecha máxima de entrega de grupos hasta el dia 17 de setiembre