Universidad Carlos III de Madrid
Econometrı́a
Regresión Lineal Múltiple: Inferencia I
Hoja de Ejercicios 6
1. Explique cómo se contrasta la hipótesis de que β1 = 0 en el modelo de regresión múltiple Yi = β0 + β1 X1i +
β2 X2i + Ui . Explique cómo se contrastarı́a la hipótesis nula de que β2 = 0. Explique cómo contrastarı́a la
hipótesis conjunta de que β1 = 0 y β2 = 0. ¿Por qué el resultado de los dos primeros contrastes no implica el
resultado de este último?
Los siguientes resultados se han obtenido utilizando los datos de 1998 de la Encuesta Actualizada de Población
(CPS). La base de datos consta de información sobre 4.000 trabajadores a tiempo completo durante todo el
año. El mayor grado educativo alcanzado por cada trabajador es o bien un diploma de escuela secundaria o
bien un tı́tulo de licenciatura. El rango de edades de los trabajadores oscila entre los 25 y los 34 años. La base
de datos asimismo contiene información sobre la región del paı́s donde reside la persona, el estado civil y el
número de hijos:
IMH : ingresos medios por hora (en dólares de 1998).
Universidad = variable binaria (1 si es titulado en universidad, 0 si titulado escuela secundaria).
Femenino = variable binaria (1 si es mujer, 0 si hombre)
Edad = edad (en años)
Noreste = variable binaria (1 si Región = Noreste, 0 en caso contrario)
Centro-Oeste = variable binaria (1 si Región = Centro-Oeste, 0 en caso contrario)
Sur = variable binaria (1 si Región = Sur, 0 en caso contrario)
Oeste = variable binaria (1 si Región = Oeste, 0 en caso contrario)
Variable Dependiente: ingresos salariales medios por hora (AHE)
Regresor (1) (2) (3)
Universidad (X1 ) 5, 46 5, 48 5, 44
(0,21) (0,21) (0,21)
Femenino (X2 ) −2, 64 −2, 62 −2, 62
(0,20) (0,20) (0,20)
Edad (X3 ) 0, 29 0, 29
(0,04) (0,04)
Noreste (X4 ) 0, 69
(0,30)
Centro-Oeste (X5 ) 0, 60
(0,28)
Sur (X6 ) −0, 27
(0,26)
Constante 12, 69 4, 40 3, 75
(0,14) (1,05) (1,06)
Estadı́sticos de Resumen
SCR 6,27 6,22 6,21
R2 0,176 0,190 0,194
n 4.000 4.000 4.000
Estadı́stico F para los efectos regionales = 0 6,10
2. Añadir ” ∗ ” (5%) y ”**” (1%) a la tabla para indicar la significación estadı́stica de los coeficientes.
3. Utilizando los resultados de la regresión de la columna (1):
(a) ¿Es estadı́sticamente significativa la diferencia estimada por esta regresión entre los ingresos salariales
de los graduados universitarios y los graduados en enseñanza secundaria al nivel del 5%? Construya un
intervalo de confianza la 95% para esta diferencia.
1
(b) ¿Es estadı́sticamente significativa la diferencia estimada por esta regresión entre los ingresos salariales de
hombres y mujeres al nivel del 5%? Construya un intervalo de confianza la 95% para esta diferencia.
4. Utilizando los resultados de la regresión de la columna (2):
(a) ¿Es la edad un factor importante de los ingresos salariales? Utilize un contraste estadı́stico apropiado y/o
un intervalo de confianza para explicar la respuesta.
(b) Sally es una graduada universitaria de 29 años de edad. Betsy es una mujer de 34 años de edad graduada en
la universidad. Construya un intervalo de confianza al 95% para la diferencia esperada entre sus ingresos
salariales.
5. Utilizando los resultados de la regresión de la columna (3):
(a) ¿Parece que existan diferencias regionales importantes? Utilice un contraste de hipótesis adecuado para
explicar la respuesta.
(b) Juanita es una mujer de 28 años graduada universitaria de la región Sur. Molly es una mujer graduada
universitaria de la región Oeste de 28 años. Jennifer es una mujer graduada universitaria de la región
Centro-Oeste de la misma edad.
(i) Construya un intervalo de confianza al 95% para la diferencia entre los ingresos esperados de Juanita
y de Molly.
(ii) Explique cómo se construirı́a un intervalo de confianza al 95% para la diferencia entre los ingresos
esperados entre Juanita y Jennifer (Pista: ¿Qué ocurrirı́a si se incluyera la variable Oeste y se excluyera
de la regresión la variable Centro-Oeste?)
6. La regresión mostrada en la columna (2) se estima de nuevo con datos de 1992 esta vez (4,000 observaciones
seleccionadas al azar de la CPS de Marzo de 1993, convertidas a dólares de 1998 utilizando el ı́ndice de precios
al consumo). Los resultados son:
AHE
d = 0, 77 + 5, 29 U niversidad − 2, 59 F emenino + 0, 40 Edad,
(0,98) (0,20) (0,18) (0,03)
2
SCR = 5, 85, R̄ = 0, 21.
Comparando esta regresión con la regresión de 1998 que se muestra en la columna (2), ¿hubo un cambio
estadı́sticamente significativo en el coeficiente de la variable Universidad ?
7. Comente la siguiente afirmación: ”En todas las regresiones, el coeficiente de la variable Femenino es nega-
tivo, grande y estadı́sticamente significativo. Esto proporciona una potente evidencia estadı́stica acerca de la
existencia de discriminación por género en el mercado laboral de [Link]”.
8. Añadiendo los errores estándar, la regresión de la Hoja 4 queda como sigue
Precio
d = 119, 2 + 0, 485DORM + 23, 4 Baño + 0, 156CT am + 0, 002 P T am
(23,9) (2,61) (8,94) (0,011) (0,00048)
+0, 090Edad − 48, 8 P obre,
(0,311) (10,5)
2
R̄ = 0, 72, SCR = 41, 5
(a) ¿Es el coeficiente de la variable DORM estadı́stica y significativamente distinto de cero?
(b) Por lo general las viviendas de 5 dormitorios se venden por una cuantı́a mucho mayor que las viviendas
de dos dormitorios. ¿Es ésto compatible con la respuesta en (a) y en general con la regresión?
(c) Un propietario de una vivienda compra un solar adyacente de 2.000 pies cuadrados. Construya un intervalo
de confianza al 99% para la variación en el valor de su casa.
(d) La superficie del solar se mide en pies cuadrados. ¿Cree que podrı́a resultar más apropiada otra escala?
¿Por qué?
(e) El estadı́stico F una vez omitidas las variables DOR y Edad de la regresión es F = 0, 08. ¿Son los
coeficientes de las variables DORM y Edad estadı́sticamente distintos de cero a un nivel del 10%?
2
9. Considérese el modelo de regresión Yi = β0 + β1 X1i + β2 X2i + Ui . Transforme la regresión de modo que se
pueda utilizar un estadı́stico t para contrastar:
(a) β1 = β2 .
(b) β1 + aβ2 = 0, donde a es una constante.
(c) β1 + β2 = 1. (Pista: debe redefinirse la variable dependiente de la regresión).
10. Utilizando la base de datos TeachingRatings, realice los siguientes ejercicios:
(a) Realice una regresión de la variable Course Eval sobre la variable que mide la belleza del profesor
(Beauty). Construya un intervalo de confianza al 95% para el efecto de la variable Beauty sobre la
variable Course Eval.
(b) Considérese las distintas variables de control de la base de datos. ¿Cuáles cree que deben ser incluidas en
la regresión? Utilizando una tabla, examine la robustez del intervalo de confianza construido en (a). ¿Cuál
es un intervalo de confianza razonable para el efecto de la variable Beauty sobre la variable Course Eval?
11. Utilizando la base de datos CollegeDistance conteste a las siguientes preguntas:
(a) Un grupo de defensa de la educación sostiene que, en promedio, los años universitarios completados por
una persona se incrementarı́an en aproximadamente 0,15 años si la distancia a la universidad más cercana
se redujera en 20 millas. Realice una regresión de los años de universidad completados (ED) sobre la
distancia a la universidad más cercana (Dist). ¿Es consistente la afirmación de los grupos defensa de la
educación con la estimación de la regresión? Explique su respuesta.
(b) Otros factores explican asimismo a los años de formación que una persona completa. ¿Cambia el efecto
estimado de la distancia sobre los años de universidad completados si se controla por estos factores?
Para responder a esta pregunta, construya una tabla, incluyendo una especificación sencilla (como la de
(a)), una especificación base (que incluya un conjunto de variables de control importantes), y algunas
modificaciones de la especificación base. Analice cómo el efecto estimado de la variable Dist sobre la
variable ED varı́a entre las distintas especificaciones.
(c) Se ha argumentado que, controlando por otros factores, los negros y los hispanos completan más cursos
universitarios que los blancos. ¿Es este resultado congruente con las regresiones planteadas en la parte
(b)?
SOLUCIONES:
3. a) 5, 46 ± 1, 96 × 0, 21; b) Sı́, −2, 64 ± 1, 96 × 0, 20.
4. a) Sı́, 0, 29 ± 1, 96 × 0, 04; b) ($1, 06, $1, 84) .
5. a) Sı́, los efectos regionales son significativos al 1%; b) i) −0, 27 ± 1, 96 × 0, 26, ii) La diferencia esperada entre
Juanita y Jenifer es (X5,Juanita − X5,Jennifer ) × β5 + (X5,Juanita − X5,Jennifer ) × β6 = −β5 + β6 . Un intervalo de
confianza al 95% podrı́a ser construido fácilmente omitiendo Centro-Oeste de la regresión y reemplazándolo
con X5 = Oeste. En esta nueva regresión el coeficiente de South mide la diferencia entre los salarios de Sur y
Centro-Oeste y el intervalo de confianza al 95% se computa directamente.
6. t = 0, 6552
8. a) t = 0, 485; c) (1.520$, 6.480$) ; e) No.