Ejercicios Extra Econometría (ADE)
Primer Conjunto de ejercicios (Temas 1 al 7)
Problema 1: En los EE.UU el Norte y el Sur son muy diferentes. A continuación se muestra la distribu-
cion de la probabilidad conjunta de afiliación política (R=Republicano, I=Independiente y D=Demócrata)
para una ciudad del Norte y una ciudad del Sur.
Afiliación Política (AP)
R I D
Sur 0,24 0,04 0,12
Norte 0,18 0,12 0,30
(A) ¿Cuál es la probabilidad de seleccionar a un republicano dado que cogemos una Ciudad del norte?.
Muestra su cálculo.
(B) ¿Son la afiliación política y la región de residencia variables aleatorias estadísticamente indepen-
dientes? Explica.
(C) Asigna los valores R =0, I =2 y D =5 a la afiliación política (AP). Es decir, si un ciudadano es
seleccionado al azar, la variable AP puede tomar los valores 0, 2 y 5. Busca la esperanza matemática de la
variable aleatoria AP.
(D) Encuentra el valor esperado de X = 2AP + 2AP 2 donde AP es la variable aleatoria de afiliación
política.
Problema 2: El director general de una empresa de ingeniería quiere saber si la experiencia de un
artista técnico influye en la calidad de su trabajo. Se elige una muestra aleatoria de 24 artistas y sus años
de experiencia laboral y calificación de calidad (evaluados por sus supervisores). La experiencia laboral
(EXPER) se mide en años y la calificación de calidad (RATING) toma un valor de 1 a 7, siendo 7=excelente
y 1=bajo rendimiento. Se propone el modelo simple de regresión RAT IN G = β1 + β2 EXP ER + e. Las
estimaciones por mínimos cuadrados del modelo, y los errores estándares de las estimaciones son:
RAT
d IN G = 3,204 + 0,076 EXP ER
(se) (0,709) (0,044)
(A) Haz el gráfico de la función de regresión estimada. Interpreta el coeficiente de EXPER.
(B) Construye un intervalo de confianza del 95 % para β2 , la pendiente de la relación entre calificación
de calidad (RATING) y experiencia (EXPER). ¿De qué estás 95 % seguro?
(C) Prueba la hipótesis nula de que β2 es cero contra la alternativa que no lo es usando una prueba
bilateral con el nivel de significación de α = 0,05. ¿Qué concluyes?
(D) Prueba la hipótesis nula de que β2 es cero contra la alternativa unilateral que es positivo con el nivel
de significanción α = 0,05. ¿Qué concluyes?
(E) Para la prueba de la parte (C), el p-valor es 0.0982. Si elegimos la probabilidad del error de tipo I
α = 0,05 podemos rechazar la hipótesis nula, o no, basándonos únicamente en una inspección de p-valor?
Muestra, en un diagrama, cómo se calcula el p-valor.
Problema 3: Supón que estás estimando un modelo de regresión lineal simple.
1
1. Si multiplicas todos los valores de x por 20, pero no por los valores de y, que sucede con los valores
de los parámetros β0 y β1 ? ¿Qué sucede con las estimaciones de mínimos cuadrados b0 y b1 ? ¿Qué
sucede con la varianza del término de error?
2. Supón que estás estimando un modelo de regresión lineal simple. Si multiplicas todos los valores de y
por 50, pero no los valores de x, que sucede con los valores de los parámetros β0 y β1 ? ¿Qué sucede
con las estimaciones de mínimos cuadrados b0 y b1 ?¿Qué sucede con la varianza del término de error?
Problema 4. Esta pregunta se refiere al valor de las casas en las ciudades que rodean Boston. El
resultado está en la siguiente tabla. Las variables se definen de la siguiente manera:
VALOR = el valor mediano de las viviendas ocupadas por sus propietarios en miles de euros
CRIME = tasa de delincuencia per cápita
NITOX = concentración de óxido nítrico (partes por millón)
HABITACIONES = número medio de habitaciones por vivienda
AGE = proporción de unidades ocupadas por el propietario construidas antes de 1940
DIST = distancia ponderada a cinco centros de empleo de Boston
ACCESO = índice de accesibilidad a las autopistas radiales
TAX = tasa de impuesto a la propiedad de valor completo por 10,000 €
PTRATIO = proporción alumno-docente por ciudad
Variable Dependiente: VALUE
Observaciones incluidas: 506
Variable Coeficiente Eror Est. t-Statistics Probabilidad
C 28.4067 5.3659 5.2939 0.0000
CRIME -0.1834 0.0365 -5.0275 0.0000
NITOX -22.8109 4.1607 -5.4824 0.0000
ROOMS 6.3715 0.3924 16.2378 0.0000
AGE -0.0478 0.0141 -3.3861 0.0008
DIST -1.3353 0.2001 -6.6714 0.0000
ACCESS 0.2723 0.0723 3.7673 0.0002
TAX -0.0126 0.0038 -3.3399 0.00009
PTRATIO -1.1768 0.1394 -8.4409 0.0000
1. Informa brevemente cómo cada una de las variables influye en el valor de un hogar.
2. Halla estimaciones de intervalos del 95 % para los coeficientes de CRIME y ACCESS.
3. Haz la prueba de la hipótesis de que el aumento del número de habitaciones por 1, aumenta el valor
de una casa por 7.000€.
4. Prueba como una hipótesis alternativa H1 de que la reducción de la proporción alumno-profesor por
10 aumentará el valor de una casa en más de 10,000€.
Problema 5. En el problema 4 fue estimada una ecuación para la valoración de los hogares en las ciudades
circundantes a Boston. Reestimando esa ecuación con los errores estándar de White nos da los siguientes
2
resultados.
Variable Dependiente: VALUE
Observaciones incluidas: 506
Los errores estándar consistentes
con la heterosedasticidad
Variable Coeficiente Eror Est. t-Statistics Probabilidad
C 28.407 7.380 5.2939 0.0000
CRIME -0.183 0.035 -5.0275 0.0000
NITOX -22.811 4.360 -5.4824 0.0000
ROOMS 6.372 0.665 16.2378 0.0000
AGE -0.048 0.011 -3.3861 0.0000
DIST -1.335 0.190 -6.6714 0.0000
ACCESS 0.272 0.075 3.7673 0.0000
TAX -0.013 0.003 -3.3399 0.0000
PTRATIO -1.177 0.124 -8.4409 0.0000
2
R = 0,657 SCR=14,652.22 SCT=42,716.29
1. Para los coeficientes de CRIME, ROOMS, AGE y TAXES, compara los intervalos de confianza de
95 % obtenidos utilizando los errores estándar del ejercicio 4 con los proporcionados en este problema.
2. ¿Crees que es probable que la heteroscedasticidad sea un problema?
3. ¿Qué inferencias engañosas son probables si se utilizan errores estándares incorrectos?
Problema 6. Se está llevando a cabo un estudio sobre los determinantes de los niveles de salud de la
población española. Para ello se han recogido datos mediante muestreo aleatorio de 45.000 pacientes en
diferentes momentos del tiempo, en el año 2005 (antes de la crisis) y en el 2009 (durante la crisis). Advierte
que los pacientes en ambos momentos del tiempo no tienen porque ser los mismos, dado que ambas muestras
son aleatorias. El modelo a estimar es el siguiente:
niveldesalud = β0 edad+α0 +α1 M ujer+α2 Estrés+α3 T abaco+α4 Deporte+δ0 Año2009 +δ1 Año2009 M ujer+
δ2 Año2009 Estrés + δ3 Año2009 T abaco + δ4 Año2009 Deporte + ε
Las variables, Mujer, Estrés, Tabaco, Deporte y Año son variables dicotómicas que toman valor 1 si
eres mujer, si padeces de Estrés, si consumes Tabaco, si haces Deporte y si los datos son del año 2009. La
variable edad es una variable continua. Considerando esto responde a las siguientes preguntas:
1. Indica qué tipo de datos son y qué tipo de modelo se está utilizando para medir los determinantes de
la salud.
2. Interpreta el modelo y los coeficientes y comenta cuales son los signos esperados de cada una de las
variables sin interaccionar. Indica si es el caso, ¿de cuál de estas variables no sabriamos a priori su
signo
3. Indica cuál sería el modelo base descontando el efecto de la edad y comenta que nos indica δ0 .
4. ¿Cómo podríamos saber si el Tabaco afecta de forma diferente a mujeres y a hombres? Considera
también el efecto en ambos periodos.