0% encontró este documento útil (0 votos)
1K vistas8 páginas

Practica #2

Este documento presenta varios ejercicios de econometría que involucran el uso de datos reales para estimar modelos de regresión múltiple y analizar los resultados. Los ejercicios cubren temas como la interpretación de coeficientes, la presencia de sesgo, y la importancia de incluir variables de control relevantes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
1K vistas8 páginas

Practica #2

Este documento presenta varios ejercicios de econometría que involucran el uso de datos reales para estimar modelos de regresión múltiple y analizar los resultados. Los ejercicios cubren temas como la interpretación de coeficientes, la presencia de sesgo, y la importancia de incluir variables de control relevantes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Ingeniería Comercial

Econometría I
COM – 05223
Práctica Nº 2
2.1 Utilizando la base de datos GPA2.WF1 de 4,137 alumnos universitarios, se estimó la
ecuación siguiente de MCO:

Donde, colgpa es el promedio de calificaciones que se mide sobre una escala de cuatro
puntos, hsperc es el percentil en la clase de bachillerato que se gradua (definida de manera
que, por ejemplo, hsperc = 5 significa el 5% superior de la clase), y sat son los puntajes
combinados en matemáticas y habilidades verbales en la prueba de logro de los alumnos.
i) ¿Por qué es lógico que el coeficiente en hsperc sea negativo?
ii) ¿Cuál es el promedio de calificaciones universitario predicho cuando hsperc = 20 y sat =
1,050?
iii) Suponga que dos graduados de bachillerato, A y B, se gradúan en el mismo percentil de
bachillerato, pero el puntaje SAT del estudiante A es 140 puntos más alto
(aproximadamente una desviación estándar en la muestra). ¿Cuál es la diferencia predicha
en el promedio de calificaciones universitario para estos dos alumnos? ¿Es grande la
diferencia?
iv) Manteniendo hsperc constante, ¿que diferencia en las puntuaciones SAT conduce a una
diferencia estimada colgpa de .50, o medio punto de puntuación? Comente su respuesta.

2.2 Los datos en el archivo WAGE2.WF1 sobre trabajadores hombres se utilizan para
estimar la ecuación siguiente:
educ = 10.36 - .094 sibs + .131 meduc + .210 feduc
n = 722, R2 = .214,
Donde, educ es años de escolaridad, sibs es número de hermanos, meduc es años de
escolaridad de la madre y feduc años de escolaridad del padre.
i) ¿Tiene sibs el efecto esperado? Explique. Manteniendo constantes meduc y
feduc ¿cuánto tiene que aumentar sibs para tener una reducción de un año en
los años de educación predichos? (Aquí es aceptable una respuesta en números
no enteros.)
Para reducir un año de educación predicha tendría que tener 11hermanos
ii) Explique la interpretación del coeficiente de meduc.
iii) Suponga que el hombre A no tiene hermanos, y que su madre y su padre tienen cada
uno 12 años de escolaridad. El hombre B no tiene hermanos y su madre y su padre tienen
cada uno 16 años de escolaridad. ¿Cuál es la diferencia entre B y A en años predichos de
escolaridad?.

2.3 El siguiente modelo es una versión simplificada del modelo de regresión múltiple
utilizado por Biddle y Hamermesh (1990) para estudiar el intercambio entre tiempo
dedicado al sueño y dedicado al trabajo, así como ver otros factores que afectan el sueño:
sleep = β0 + β1totwrk + β2educ + β3age + u,
donde sleep y totwrk (trabajo total) se miden en minutos por semana y educ y age se miden
en años.
i) Si los adultos intercambian sueño por trabajo, ¿cuál es el signo de β 1?
ii) ¿Qué signos cree que tendran β2 y β3?
iii) Utilizando los datos del archivo SLEEP75.WF1, la ecuación estimada es
sleep = 3,638.25 + .148 totwrk + 11.13 educ + 2.20 age
n = 706, R2 = .113.
Si una persona trabaja cinco horas más a la semana, ¿cuántos minutos se predice que
disminuya sleep? ¿Es este un intercambio grande?
iv) Analice el signo y la magnitud del coeficiente estimado para educ.
v) ¿Diria que totwrk, educ y age explican gran parte de la variación en sleep? ¿Qué otros
factores podrian afectar el tiempo dedicado al sueño? ¿Es probable que esten
correlacionados con totwrk?

2.4 El sueldo inicial medio para los recién graduados de la Facultad de Derecho se
determina mediante
log(salary) = β0 + β1LSAT + β2GPA + β3log(libvol) + β4log(cost)+ β5rank + u,

Donde LSAT es la media del puntaje del grupo de graduados, GPA es la media del (promedio
general) del grupo, libvol es el número de volúmenes en la biblioteca de la Facultad de
Derecho, cost es el costo anual por asistir a dicha facultad y rank es una clasificación de las
escuelas de derecho (siendo rank = 1 la mejor).
i) Explique por qué se espera β5 = 0.
ii) ¿Qué signos espera para los otros parámetros de pendiente? Justifique sus respuestas.
iii) Utilizando los datos del archivo LAWSCH85.WF1, la ecuación estimada es
log(salary) = 8.34 + .0047 LSAT + .248 GPA + .095 log(libvol) + .038 log(cost) - .0033 rank
n = 136, R2 = .842.
¿Cuál es la diferencia ceteris paribus predicha en sueldo entre escuelas cuya media en el
GPA difiera por un punto? (Responda en términos porcentuales.)
iv) Interprete el coeficiente de la variable log(libvol).
v) ¿Diría que es preferible asistir a una Facultad de Derecho con ranking más alto? En
términos de sueldo inicial predicho, ¿Cuánto vale una diferencia de 20 en el ranking?

2.5 En un estudio que relaciona el promedio de puntaje en las calificaciones universitarias


con el tiempo utilizado en diversas actividades, usted distribuye una encuesta entre varios
alumnos. A los alumnos se les pregunta cuantas horas utilizan a la semana en cuatro
actividades: estudiar, dormir, trabajar y diversión. Toda actividad que realicen se ubica en
una de las cuatro categorías, de modo que para cada alumno la suma de horas en las cuatro
actividades debe ser 168.
i) En el modelo
GPA = β0 + β1study + β2sleep + β3work + β4leisure + u,
¿Tiene sentido mantener constantes sleep, work y leisure, y variar study?
ii) Explique por qué este modelo viola el supuesto de variable independiente constante y
colinealidad perfecta entre variables explicativas.
iii) ¿Cómo podría reformular el modelo para que sus parámetros tuvieran una
interpretación útil y se satisfaga el supuesto anterior?

2.6 Considere un modelo de regresión múltiple que contiene tres variables independientes,
y sin tomar en cuenta el supuesto de heterocedasticidad.:
y = β0 + β1x1 + β2x2 + β3x3 + u.
Le interesa calcular la suma de los parámetros de x1 y x2; llame a esto θ1 = β1 + β2.
𝜃̂1= 𝛽̂ 1 + 𝛽̂ 2 es un estimador insesgado de θ1.
ii) Determine Var(𝜃̂1) en términos de Var(𝛽̂1), Var(𝛽̂2), y de Corr(𝛽̂1, 𝛽̂2).

2.7 ¿Qué de lo siguiente puede causar que los estimadores MCO sean sesgados?
i) La heterocedasticidad.
ii) La omisión de una variable importante.
iii) Un coeficiente de correlación muestral de .95 entre dos variables independientes
incluidas en el modelo.

2.8 Suponga que la productividad promedio de los trabajadores de las empresas


manufactureras (avgprod) depende de dos factores, el promedio de horas de capacitación
(avgtrain) y la habilidad promedio de los trabajadores (avgabil):
avgprod = β0 + β1avgtrain + β2avgabil + u.

Asuma que esta ecuación satisface los supuestos de Gauss-Markov. Si se han otorgado
subvenciones a las empresas cuyos trabajadores tienen habilidades inferiores al promedio,
de manera que avgtrain y avgabil están correlacionadas de manera negativa, ¿Cuál es el
sesgo probable en 𝛽̂1 que se obtiene de la regresión simple de avgprod sobre avgtrain?

2.9 La siguiente ecuación describe la media del precio de la vivienda en una comunidad en
términos de cantidad de contaminación (nox por oxido nitroso) y del número promedio de
habitaciones en las casas de la comunidad (rooms):
log(price) = β0 + β1log(nox) + β2rooms + u.
i) ¿Cuales son los signos probables de β 1 y β2? ¿Cuál es la interpretación de β1? Explique.
ii) ¿Por qué podría nox [o con mas precisión, log(nox)] y rooms estar correlacionados de
manera negativa? Si es este el caso, ¿produce la regresión simple de log(price) sobre
log(nox) un estimador de β1 con sesgo hacia arriba o hacia abajo?
iii) Utilizando los datos del archivo HPRICE2.WF1, se estimaron las siguientes ecuaciones:
log(price) = 11.71 + 1.043 log(nox), n = 506, R2 = .264.
log(price) = 9.23 + .718 log(nox) + .306 rooms, n = 506, R2 = .514.

¿Las estimaciones de la elasticidad de price con respecto a nox de las regresiones simple y
múltiple tienen la relación de lo que usted hubiera predicho, dada su respuesta en el inciso
ii)? ¿Quiere esto decir que -.718 está en definitiva más cerca de la verdadera elasticidad
que -.043?

2.10 Suponga que está interesado en calcular la relación ceteris paribus entre y y x 1. Para
tal propósito, puede allegarse datos sobre dos variables de control, x 2 y x3. (Para mayor
concreción, puede pensar en y como el puntaje de examen final, en x1 como la asistencia
a clases, en x como el GPA acumulado hasta el semestre previo, y en x 3 como el puntaje de
los exámenes de admisión SAT o ACT.) Sea 𝛽̃1 la estimación de la regresión simple de y
sobre x1 y sea 𝛽̂ 1 el estimado de la regresión múltiple de y sobre x1, x2, x3.
i) Si x1 está altamente correlacionada con x2 y x3 en la muestra, y x2 y x3 tienen efectos
parciales grandes sobre y, ¿esperaría que 𝛽̃1 y 𝛽̂1 sean similares o muy diferentes? Explique.
ii) Si x1 casi no está correlacionada con x2 y x3, pero x2 y x3 están fuertemente
correlacionadas 𝛽̃1y 𝛽̂1 tenderán a ser similares o muy diferentes? Explique.
iii) Si x1 está fuertemente correlacionada con x2 y x3, y x2 y x3 tienen efectos parciales
pequeños sobre y, ¿esperaría que ee(𝛽̃1) o ee( 𝛽̂1) fueran mas pequeños? Explique.
iv) Si x1 casi no está correlacionada con x2 y x3, x2 y x3 tienen efectos parciales grandes sobre
y, y x2 y x3 están fuertemente correlacionadas, ¿esperaría que ee(𝛽̃1) o ee(𝛽̂1) fueran más
pequeños? Explique.

EJERCICIOS EN COMPUTADORA

2.11 Un problema de interés para los funcionarios de salud (y para otros) es determinar los
efectos que el fumar durante el embarazo tiene sobre la salud infantil. Una medida de la
salud infantil es el peso al nacer; un peso demasiado bajo puede ubicar al niño en riesgo de
contraer varias enfermedades. Ya que es probable que otros factores que afectan el peso
al nacer estén correlacionados con fumar, deben considerarse. Por ejemplo, un nivel de
ingresos más alto en general da como resultado el acceso a mejores cuidados prenatales y
a una mejor nutrición de la madre.
Una ecuación que reconoce estos factores es:

i) ¿Cuál es el signo más probable para β 2?


ii) ¿Cree que cigs y faminc estén correlacionados? Explique por que la correlación puede
ser positiva o negativa.
iii) Ahora, calcule la ecuación con y sin faminc utilizando los datos del archivo BWGHT. WF1.
De los resultados en forma de ecuación incluyendo el tamaño de la muestra y la Rcuadrada.
Explique sus resultados enfocándose en si el añadir faminc modifica de manera sustancial
el efecto esperado de cigs sobre bwght.

2.12 Utilice los datos del archivo HPRICE1.WF1 para estimar el modelo

donde price es el precio de casas dado en miles de dólares.


i) Escriba los resultados en forma de ecuación.
ii) ¿Cuál es el incremento en precio estimado para una casa con una habitación (bdrms)
mas, manteniendo constante la superficie en pies cuadrados (sqrft)?
iii) ¿Cuál es el incremento en precio estimado para una casa con una habitacion adicional
de 140 pies cuadrados? Compare esto con su respuesta al inciso (ii).
iv) ¿Que porcentaje de la variacion en el precio se explica por la extension en pies
cuadrados y el numero de habitaciones?
v) La primera casa en la muestra tiene sqrft = 2,438 y bdrms = 4. Determine el precio de
venta estimado para esta casa con la linea de regresion de MCO.
vi) El precio de venta de la primera casa en la muestra fue $300,000 (asi que price = 300).
Determine el residual para esta casa. ¿Sugiere esto que el comprador pago de mas o de
menos por la casa?

2.13 El archivo CEOSAL2.WF1 contiene datos de 177 CEO (directores generales) y puede
utilizarse para examinar los efectos del desempeño de la empresa sobre el sueldo de los
CEO.
i) Estime un modelo que relacione el sueldo anual (salary) con las ventas de la empresa
(sales) y el precio de mercado (mktval). Use el tipo de modelo que tiene elasticidad
constante para ambas variables independientes. Escriba los resultados en forma de
ecuación.
ii) Añada profits (utilidades de la empresa) al modelo del inciso (i). ¿Por qué esta variable
no puede incluirse en forma logarítmica? ¿Diría usted que estas variables de desempeño
de la empresa explican la mayor parte de la variación en sueldos de los CEO?
iii) Añada la variable ceoten (antigüedad del CEO en el puesto) al modelo del inciso (ii).
¿Cuál es el rendimiento porcentual estimado por un año más de permanencia del CEO en
la empresa, manteniendo constantes los otros factores?
iv) Encuentre el coeficiente de correlación muestral entre las variables log(mktval) y profits.
¿Estas variables están fuertemente correlacionadas? ¿Qué indica esto sobre los
estimadores de MCO?

2.14 Para este ejercicio, utilice los datos del archivo ATTEND.WF1.
i) Obtenga los valores mínimo, máximo y promedio para las variables atndrte, priGPA, y
ACT (porcentaje de asistencia a clases, calificación promedio general acumulada,
calificación en el examen de admisión a la universidad, respectivamente).
ii) Estime el modelo

y escriba los resultados en forma de ecuación. Interprete el intercepto. ¿Tiene un


significado útil?
iii) Analice los coeficientes de pendiente estimados. ¿Hay alguna sorpresa?
iv) ¿Cuál es el atndrte si priGPA = 3.65 y ACT = 20? ¿Qué piensa de este resultado? ¿Hay
alumnos en la muestra con estos valores de las variables explicativas?
v) Si el alumno A tiene priGPA = 3.1 y ACT = 21 y el alumno B tiene priGPA = 2.1 y ACT = 26,
¿cuál es la diferencia predicha en sus tasas de asistencia?

2.15 Confirme la interpretación de descuento de los efectos parciales de las estimaciones


de MCO, haciendo de manera explícita tal descuento para el ejemplo 3.2. del texto de
Wooldridge. Esto requiere primero regresar educ sobre exper y tenure y guardando los
residuales, 𝑟̂ 1. Después, regrese log(wage) sobre 𝑟̂ 1. Compare el coeficiente de 𝑟̂ 1 con el
coeficiente de educ en la regresión de log(wage) sobre educ, exper y tenure.

2.16 Para este problema, utilice los datos del archivo WAGE2.WF1. Como de costumbre,
asegúrese de que todas las regresiones que siguen contengan un intercepto.
i) Corra una regresión simple de IQ sobre educ para obtener el coeficiente de pendiente,
por ejemplo, 𝛿̃1.
ii) Corra la regresión simple de log(wage) sobre educ y obtenga el coeficiente de pendiente,
𝛽̃1.
iii) Corra la regresión múltiple de log(wage) sobre educ e IQ y obtenga los coeficientes de
pendiente, 𝛽̂1 y 𝛽̂2, respectivamente.
iv) Verifique que 𝛽̃1 = 𝛽̂1+𝛽̂2𝛿̃1.

2.17 Utilice los datos del archivo MEAP93.WF1 para responder esta pregunta.
i) Estime el modelo:
y dé los resultados en la forma usual, incluyendo el tamaño de la muestra y la R-cuadrada.
¿Son los signos de los coeficientes de pendiente los que usted esperaba? Explique.
ii) ¿Qué piensa del intercepto estimado en el inciso i)? en particular, ¿tiene sentido igualar
a cero las dos variables explicativas? [Sugerencia: recuerde que log(1)=0.]
iii) Ahora corra la regresión simple de math10 sobre log(expend) y compare el coeficiente
de pendiente con la estimación obtenida en el inciso i). ¿Es ahora el efecto estimado de los
gastos por estudiante mayor o menor que en el inciso i)?
iv) Determine la correlación entre lexpend = log(expend) y lnchprg. ¿Le parece razonable el
signo?
v) Use el inciso iv) para explicar sus hallazgos del inciso iii).

2.18 Utilice la base de datos DISCRIM.WF1 para responder esta pregunta. Hay datos sobre
los precios de diversos artículos de restaurantes de comida rápida situados en zonas con
distinto código postal, así como características de la población residente en dicho código,
pertenecientes a Nueva Jersey y Pennsylvania. La idea es ver si los restaurantes de comida
rápida tienen precios más altos en áreas con mayor concentración de población
afroestadounidense.
i) Determine los valores promedio, en la muestra, de prpblck (proporción de
afroestadounidenses) y de income (ingreso familiar medio), junto con sus desviaciones
estándar. ¿Cuáles son las unidades de prpblck y de income?
ii) Considere un modelo para explicar el precio de las bebidas refrescantes, psoda, en
términos de la proporción de población afroestadounidense y de ingreso medio:

Estime este modelo mediante MCO y dé los resultados en forma de ecuación incluyendo el
tamaño de la muestra y la R-cuadrada (No use notación científica al dar las estimaciones).
Interprete el coeficiente de prpblck. ¿Considera que es grande desde el punto de vista
económico?
iii) Compare la estimación del inciso ii) con la estimación mediante regresión simple de
psoda sobre prpblck. ¿Es el efecto de la discriminación mayor o menor cuando se controla
el ingreso?
iv) Un modelo con una elasticidad constante del precio respecto al ingreso puede ser más
apropiado. Proporcione las estimaciones del modelo

Si prpblck aumenta en .20 (20 puntos porcentuales), ¿cuál es el cambio porcentual


estimado para psoda? (Sugerencia: la respuesta es [Link], usted tiene que dar las “xx”.)
v) Agregue ahora la variable prppov (proporción de personas en pobreza) a la regresión del
inciso iv). ¿Qué pasa con 𝛽̂prpblck?
vi) Encuentre la correlación entre log(income) y prppov. ¿Es aproximadamente lo que
esperaba?
vii) Evalúe la afirmación siguiente: “como log(income) y prppov están fuertemente
correlacionadas, no tiene caso que estén en la misma regresión”.

2.19 Use los datos del archivo CHARITY.WF1 para responder a las preguntas siguientes:
i) Estime la ecuación
mediante MCO y dé el resultado en la forma usual, incluyendo el tamaño de la muestra y
la R-cuadrada. Compare la R-cuadrada con la de la regresión simple en la que se omite
giftlast (monto de la donación más reciente) y propresp (tasa de respuesta). (Vea el
ejercicio (1.7).
ii) Interprete el coeficiente de mailsyear. ¿Es mayor o menor que el coeficiente
correspondiente en la regresión simple?
iii) Interprete el coeficiente de propresp. Tenga cuidado con las unidades de medición de
propresp.
iv) Ahora agregue a la ecuacion la variable avggift. ¿Qué pasa con el efecto estimado de
mailsyear?
v) ¿Qué ha pasado con el coeficiente de giftlast en la ecuacion del inciso iv)? ¿Qué cree que
este pasando?

Guías para respuestas.


2.1 (i) hsperc esta definido de tal forma que cuanto menor es, menor será la estadía de
los estudiantes en secundaria. Manteniendo todo lo demás igual cuando peor sera la
estadía de los estudiantes en secundaria, menor será su GPA esperado.
(ii) colgpa=2676
(iii) A tendrá una puntación más alta en un 0.207
2.2 i) Δsibs = 1/.094≈ 10.6.
ii) Si la madre tiene cuatro años más de educación se espera que el hijo tenga medio
año (.524) más de educación. Mantenidendo sibs y feduc constantes.
iii) la diferencia en educación entre A y B se estima en 1.364.
2.3 i) relación negativa
iii) toma en cuenta que totwrk está en minutos. Entonces se espera una disminución
en sleep de 44.4 minutos. Para una semana una reducción en 45 minutos no es
significativa.
2.4 iii) 24.8%
2.11 (i) la probabilidad de β2 > 0, significa que cuanto más aumenta el ingreso aumentará
la nutrición de las madres y tendrán acceso a un mejor cuidado prenatal.
(ii) Por un lado, un cumento en el ingreso genrealmente aumenta el cunsumo de un
bien, y cigs y faminc podrían estar positivamente correlacionados. Por otro lado, los
ingresos de las familias son mayores también para las familias con mayor educación, y
más eduación y consumo de cigarrillos tienden a estar negativamente corelacionados.
La correlación muestral entre cigs y faminc es −.173, indicando correlación negativa.
(iii) Las regresiones sin y con faminc son:
bwght = 119.77 −.514 cigs, n = 1388, R2=0.023
y bwght= 116.97- .463cigs + .093faminc, n=1388, R2=0.030
El efecto de fumar cigarrillos es estrechamente menor cuando faminc se agrega a la
regresión, pero la diferencia no es muy alta. Esto se debe al hecho de que cigs y famic
no están muy correlacionados y el coeficiente de faminc es muy pequeño. (La variable
faminc está medida en miles, entonces un incremento en el ingreso de $10,000 más
aumentará la predicción del peso al nacer por solo 0.93 onzas.

2.12 (i) price=-19.32+.128sqrft +15.20bdrms, n=88, R2 =0.632


(ii) manteniendo pies cuadrados constante, Δprice= 15.20 Δbdrms, entonces el precio
aumenta 15.20, que significa $15,200.
(iii) Ahora Δprice= .128 Δsqrft + 15.20 Δbdrms = .128(140) + 15.20 = 33.12, o $33,120.
Esto significa ………. Con respecto de (ii).
(iv) 63.2%.
(v) Precio predecido es 353.544, o $353,544.
(vi) Compara los resultados del inciso (v), con los basados solo en pies cúbicos y
número de cuartos, esto nos sugiere ….. también existen otras variables que afectan
el precio sobre los cuales no tenemos control.
2.13 (i) log(salary)=4.62 +.162log(sales)+.107log(mktval), n = 177, R2=.299
(ii) log(salary)=4.69+ .161log(sales)+ .098log(mktval).000036profits, n = 177, R 2=.299
(iii) log(salary)=4.56+ .162log(sales)+ .102log(mktval)+ .000029profits+ .012ceoten,
n=2177, R2=.318. esto significa…..
(iv) correlación muestral entre log(mktval) y profits es 0.78, el cual ……

2.14 (i)

Variable Promedio Mínimo Máximos

atndrte 81.71 6.25 100


priGPA 2.59 .86 3.93
ACT 22.51 13 32

(ii) atndrte=75.70 + 17.26priGPA - 1.72ACT, n = 680, R2 = .291.


Signfica ….
(iv) atndrte = 75.70 + 17.267(3.65) – 1.72(20) ≈ 104.3.
(v) = 25.86.

2.15 educ = 13.57 − .074 exper + .048 tenure + 𝑟̂ 1 ; n = 526, R2 = .101.


log(wage)=1.62 + .092 𝑟̂ 1 , n = 526, R2 = .207.

También podría gustarte