Heterocedasticidad en Econometría: Claves y Métodos
Heterocedasticidad en Econometría: Claves y Métodos
Econometría
Heterocedasticidad
Índice
Esquema 3
Ideas clave 4
9.1. Introducción y objetivos 4
9.2. El concepto de heterocedasticidad 5
9.3. Consecuencias sobre el estimador MCO 9
9.4. Métodos para detectar la heterocedasticidad 11
9.5. Inferencia robusta a heterocedasticidad tras
estimar por MCO 16
9.6. Heterocedasticidad en regresiones con series
temporales 20
© Universidad Internacional de La Rioja (UNIR)
A fondo 31
Test 32
© Universidad Internacional de La Rioja (UNIR)
Heterocedasticidad
Definición: Incumplimiento del supuesto 5 del MRLG en la parte que afecta a la varianza de los residuos. En este caso, no es posible
asumir que los errores de nuestro modelo tienen una varianza constante; por tanto:
𝑉𝑉𝑉𝑉𝑝𝑝 𝑢𝑢𝑖𝑖 𝑥𝑥1𝑖𝑖 , … , 𝑥𝑥𝑘𝑘𝑖𝑖 = 𝜎𝜎𝑖𝑖2 , 𝑝𝑝𝑉𝑉𝑝𝑝𝑉𝑉 𝑝𝑝 = 1, … , 𝑁𝑁
Contraste de White
Contrastes de
heterocedasticidad
Estadístico: 𝐿𝐿𝐿𝐿 = 𝑛𝑛 · 𝑅𝑅𝑒𝑒2 ~𝑎𝑎 𝜒𝜒𝑘𝑘2 , 𝑏𝑏𝑉𝑉𝑗𝑗𝐶𝐶 𝐻𝐻0
2
Rechazamos la hipótesis nula (homocedasticidad) para un nivel de significación 𝛼𝛼 % si: 𝐿𝐿𝐿𝐿 > 𝜒𝜒𝑘𝑘,𝛼𝛼
Econometría
Esquema
Tema 9. Esquema
3
Ideas clave
Recordamos, antes de comenzar con este tema, que el MRL clásico fue construido
sobre unos supuestos los cuales deberían cumplirse para asegurar que el modelo
pudiese ser estimado y que sus estimaciones en base al estimador MCO cumpliesen
unas propiedades estadísticas deseables, dando así lugar a la obtención de lo que
denominamos el estimador ELIO.
Este caso es bastante realista para la mayoría de conjunto de datos, pues dado un
conjunto de N individuos es razonable suponer que la dispersión existente entre
estos y el valor estimado no va a mantener una magnitud constante. En la primera
sección veremos ejemplos de estos tipos de datos y mostraremos gráficamente qué
es esto de la no varianza constante.
Dado que se estará incumpliendo un supuesto del modelo de regresión lineal clásico
deberemos revisar su estimación y aprender a estimar el modelo considerando ahora
el problema de heterocedasticidad para que sigamos obteniendo estimaciones
eficientes. También deberemos aprender a detectar este problema en nuestro
© Universidad Internacional de La Rioja (UNIR)
Econometría
4
Tema 9. Ideas clave
Por tanto, los objetivos de este tema son:
Econometría
5
Tema 9. Ideas clave
Figura 1. Representación de un conjunto de datos con y sin heterocedasticidad.
Fuente: [Link]
Por otro lado, las varianzas de los residuos de ambos conjuntos de datos presentan
la misma dispersión (figura 2):
Econometría
6
Tema 9. Ideas clave
Ejemplo
Econometría
7
Tema 9. Ideas clave
Figura 4. Gráfico de los residuos contra el tamaño (sqft).
Ahora se tiene que 𝑉𝑉𝑉𝑉𝑉𝑉(𝑢𝑢𝑖𝑖 |𝑥𝑥1𝑖𝑖 , … , 𝑥𝑥𝑘𝑘𝑘𝑘 ) = 𝜎𝜎𝑖𝑖2 , 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑖𝑖 = 1, … , 𝑁𝑁. La varianza del error
es diferente según la observación i que esté siendo considerada. De este modo, y
recurriendo a la forma matricial, la matriz de varianzas y covarianzas del error del
modelo quedaría del siguiente modo:
𝜎𝜎12
0 𝜎𝜎22
𝑉𝑉𝑉𝑉𝑉𝑉(𝑢𝑢|𝑋𝑋) = ⎛ ⎞
⋮ ⋮ ⋱
⎝0 0 … 𝜎𝜎𝑁𝑁2 ⎠
Econometría
8
Tema 9. Ideas clave
Causas de la heterocedasticidad
En primer lugar, hay que destacar que muchos fenómenos son por su propia
naturaleza heterocedásticos. Por ejemplo, variables como el gasto, la renta, el
ahorro, los beneficios empresariales, etc., comparten una distribución
heterocedástica.
1. La incorrecta especificación del modelo. Puede ser por omisión de variables o por
con la matriz de varianzas y covarianzas del error, pero el supuesto básico 4 se sigue
satisfaciendo: 𝐸𝐸[𝑢𝑢|X] = 0.
Por tanto, el modelo puede ser estimado por MCO y va a seguir siendo insesgado.
¿Dónde está por tanto el problema? En la estimación de la varianza de MCO. Dado
Econometría
9
Tema 9. Ideas clave
que no es posible predeterminar la varianza de los errores para todas las
observaciones de forma constante ya que no se cumple que 𝑉𝑉𝑉𝑉𝑉𝑉(𝑢𝑢|𝑋𝑋) = 𝜎𝜎 2 no
puede ser empleado el estimador de 𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽̂ �.
Sin embargo, 𝑅𝑅 2 y 𝑅𝑅� 2 no van a cambiar y van a seguir siendo válidos, y es posible
estimar el modelo por MCO (tal y como hemos indicado anteriormente), pero dicho
modelo y sus estimaciones MCO no podrán ser empleadas para realizar inferencias
(intervalos de confianza, predicción por intervalos y contraste de hipótesis).
Las propiedades estadísticas del estimador MCO se ven afectadas del siguiente modo:
Econometría
10
Tema 9. Ideas clave
¿Qué ha ocurrido? El teorema de Gauss Markov establece que bajo los cinco
supuestos básicos del MRL el estimador MCO es el estimador lineal e insesgado de
menor varianza de entre todos los estimadores lineales e insesgados. Aunque no
vimos con detalle la demostración de este teorema, el supuesto de homocedasticidad
es clave en la demostración, por ello, cuando no se satisface homocedasticidad no se
puede aplicar el teorema de Gauss Markov.
Econometría
11
Tema 9. Ideas clave
realizaremos una nueva estimación de nuestro modelo esta vez con una estimación
de las varianzas de los estimadores robustas a la presencia de heterocedasticidad.
El contraste de Breush-Pagan
Por lo tanto, la hipótesis nula establece que el valor esperado de 𝑢𝑢𝑖𝑖2 no tiene ninguna
relación con las observaciones, mientras que en la hipótesis alternativa sí que existe
alguna relación del valor esperado con las observaciones. Bajo la hipótesis
alternativa, no conocemos la relación exacta entre el valor esperado de 𝑢𝑢𝑖𝑖2 y las
variables regresoras, pero lo podemos expresar mediante la expresión:
Si se cumplen los supuestos básicos del MRL con este modelo donde la variable
dependiente es el error al cuadrado, tendremos que:
Econometría
12
Tema 9. Ideas clave
Utilizando esta expresión podemos reescribir el contraste de hipótesis sobre
heterocedasticidad en función de los parámetros 𝛼𝛼𝑖𝑖 :
Observa que no incluimos el intercepto en la hipótesis nula. Dado que solo nos
interesa contrastar que la varianza del error no está relacionada con las variables
regresoras, solo van a intervenir los coeficientes de las variables regresoras. Bajo la
hipótesis nula 𝐸𝐸(𝑢𝑢𝑖𝑖2 �𝑋𝑋) = 𝛼𝛼0 = 𝜎𝜎 2 , con lo que 𝛼𝛼0 representa la varianza del error
bajo homocedasticidad.
El MRL definido para 𝑒𝑒𝑖𝑖2 se asume que satisface los supuestos básicos del MRL y el
supuesto de normalidad.
Econometría
13
Tema 9. Ideas clave
El estadístico de contraste para detectar heterocedasticidad se construye como:
2
𝐿𝐿𝐿𝐿 > 𝜒𝜒𝑘𝑘,𝛼𝛼
Ejemplo
Econometría
14
Tema 9. Ideas clave
Ahora estimamos el siguiente modelo:
2
Rechazamos la hipótesis nula de homocedasticidad al 5 % si 𝐵𝐵𝐵𝐵 > 𝜒𝜒3,0.05 .
2
Calculamos 𝜒𝜒3,0.05 con Gretl:
2
𝜒𝜒3,0.05 = 7,815
Econometría
15
Tema 9. Ideas clave
El contraste de White
𝑘𝑘 𝑘𝑘 𝑘𝑘
2
𝑢𝑢�𝑖𝑖 = � 𝛾𝛾𝑗𝑗 · 𝑋𝑋𝑗𝑗𝑗𝑗 + � 𝛿𝛿𝑗𝑗 · 𝑋𝑋𝑗𝑗𝑗𝑗2 + � � 𝜃𝜃𝑗𝑗 · 𝑋𝑋𝑗𝑗𝑗𝑗 · 𝑋𝑋𝑞𝑞𝑞𝑞 + 𝜀𝜀𝑖𝑖
𝑗𝑗=1 𝑗𝑗=1 𝑗𝑗=1 𝑞𝑞<𝑗𝑗
Gretl realiza este contraste, introduce por tanto en la estimación del coeficiente de
determinación a utilizar en el estadístico de contraste los regresores considerados en
la ecuación anterior, de los errores al cuadrado.
Econometría
16
Tema 9. Ideas clave
Vimos que el problema se encuentra en que la varianza del término de error ha sido
modificada no siendo esta constante para todas las observaciones, y no pudiéndose
además utilizar una formulación estándar ya que ahora ésta dependerá del tipo de
heterocedasticidad que exista en cada caso. Por ello la varianza del estimador MCO
ya no es válida para realizar inferencias.
2 𝑁𝑁
∑𝑁𝑁
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )𝑢𝑢𝑖𝑖 1
𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽̂𝑀𝑀𝑀𝑀𝑀𝑀 � = 𝑉𝑉𝑉𝑉𝑉𝑉 � 𝑁𝑁 � = � 𝑁𝑁 � �(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2 𝑉𝑉𝑎𝑎𝑎𝑎(𝑢𝑢𝑖𝑖 )
∑𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) 2 ∑𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2
𝑖𝑖=1
𝜎𝜎 2 𝜎𝜎 2
𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽̂𝑀𝑀𝑀𝑀𝑀𝑀 � = =
∑𝑁𝑁
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )
2 𝑆𝑆𝑆𝑆𝐶𝐶𝑋𝑋
© Universidad Internacional de La Rioja (UNIR)
Econometría
17
Tema 9. Ideas clave
Sin embargo, cuando el modelo presenta heterocedasticidad la varianza no puede
ser simplificada teniendo que utilizar la expresión siguiente en todo caso:
∑𝑁𝑁 2 2
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) 𝜎𝜎𝑖𝑖
𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽̂𝑀𝑀𝑀𝑀𝑀𝑀 � =
𝑆𝑆𝑆𝑆𝑇𝑇𝑋𝑋2
Necesitamos pues estimar esto cuando hay heterocedasticidad y para ello White
(1980) propuesto utilizar los residuos de la estimación de y sobre X y calcular la
estimación de la varianza de 𝛽𝛽̂𝑀𝑀𝑀𝑀𝑀𝑀 como sigue:
� ∑𝑁𝑁 2 2
𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) 𝑒𝑒𝑖𝑖
̂
𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽𝑀𝑀𝑀𝑀𝑀𝑀 � =
𝑆𝑆𝑆𝑆𝑇𝑇𝑋𝑋2
¿Qué ocurre en el caso de los modelos de regresión múltiple? Tal y como ya vimoslo
que debemos hacer es regresar cada variable independiente sobre todas las demás
para obtener la varianza estimada de cada beta MCO, ahora lo que haremos será
utilizar los residuos de estas estimaciones. De modo que la expresión de la varianza
a utilizar será:
© Universidad Internacional de La Rioja (UNIR)
∑𝑁𝑁 2 2
𝑖𝑖=1 𝑟𝑟̂𝑖𝑖𝑖𝑖 𝑒𝑒𝑖𝑖
𝑉𝑉𝑉𝑉𝑉𝑉�𝛽𝛽̂𝑀𝑀𝑀𝑀𝑀𝑀 � =
𝑆𝑆𝑆𝑆𝑇𝑇𝑗𝑗2
Donde 𝑟𝑟̂𝑖𝑖𝑖𝑖 denota el i-ésimo residuo de regresar 𝑥𝑥𝑗𝑗 sobre todos los demás regresores
del modelo. Y STC es la suma de los cuadrados de los residuos de esta regresión.
Econometría
18
Tema 9. Ideas clave
Debe tenerse en cuenta que los errores estándar robustos a heterocedasticidad son
siempre mayores que los errores estándar habituales.
Vamos a comentar en esta sección sin mucho detalle que existen otros métodos
anteriores al desarrollo de los estadísticos robustos a la heterocedasticidad después
de estimar por MCO. Estos métodos consisten en modelizar el tipo de
heterocedasticidad existente (conocida o no la forma funcional de la misma en la
varianza del término de error) y estimar el modelo en su forma correcta, una vez la
heterocedasticidad ha sido eliminada.
Econometría
19
Tema 9. Ideas clave
9.6. Heterocedasticidad en regresiones con series
temporales
Econometría
20
Tema 9. Ideas clave
9.7. Actividades resueltas de Gretl para practicar
Haciendo uso de datos de los últimos 60 años obtiene el siguiente output de Gretl:
Nota: recuerda que Gretl trabaja con el criterio anglosajón de separación de miles
por lo que si reproduces estos resultados en Gretl deberás tenerlo en cuenta.
Econometría
21
Tema 9. Ideas clave
El gerente de la empresa está muy contento con los resultados obtenidos, pues
avalan la posición de que incrementos en el precio del producto producen caídas en
las ventas de este. No obstante, recuerda que cuando estudió su profesor le explicó
que había veces en que las estimaciones MCO no eran las mejores posibles,
concretamente, uno de los problemas que podían presentarse era la presencia de
heterocedasticidad. Para comprobar si se cumple la homocedasticidad realiza
haciendo uso de Gretl dos contrastes:
Contraste de Breush-Pagan:
Econometría
22
Tema 9. Ideas clave
X2_X3 −0,0491247 0,0622571 −0,7891 0,4335
sq_logpibper 0,0237825 0,0324972 0,7318 0,4674
R-cuadrado = 0,492453
Se pide:
a) Estimar el modelo anterior por MCO sin tener en cuenta la posible presencia
de hetoroscedasticidad.
b) Mostrar por métodos gráficos la posible presencia de heterocedasticidad.
c) Realizar el contraste de heterocedasticidad para detectar la presencia de esta.
d) En función del resultado obtenido en el apartado anterior, obtén los errores
estándar necesarios para poder realizar inferencias en el modelo.
© Universidad Internacional de La Rioja (UNIR)
Econometría
23
Tema 9. Ideas clave
Solución actividad Gretl 1
Estima el modelo anterior por MCO sin tener en cuenta la posible presencia de
hetoroscedasticidad
Econometría
24
Tema 9. Ideas clave
Además, en el siguiente gráfico realizamos una representación de los residuos contra
sqft lo que parece dejar todavía más evidencia de la presencia de heterocedasticidad
y de cómo esta está siendo provocada por esta variable.
Econometría
25
Tema 9. Ideas clave
Realizar el contraste de heterocedasticidad para detectar la presencia de esta
R-cuadrado = 0.499654
Econometría
26
Tema 9. Ideas clave
Coeficiente Desv. Típica Estadístico t valor p
const −474.933 97.2803 −4.882 <0.0001 ***
age 7.71880 4.24048 1.820 0.0701 *
sqft 0.267217 0.0238242 11.22 <0.0001 ***
Contraste de heterocedasticidad
library(lmtest)
© Universidad Internacional de La Rioja (UNIR)
Econometría
27
Tema 9. Ideas clave
𝐻𝐻0 : ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
𝐻𝐻1 : ℎ𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
bptest(mod1)
data: mod1
BP = 18.873, df = 2, p-value = 7.978e-05
Dado que el pvalor asociado al contraste es menor a 0.01, se rechaza la hipótesis nula
con un 99 % de confianza. Es decir, se rechaza que los errores son homocedásticos.
En este contexto, se deben estimar los parámetros del modelo mediante estimación
robusta. Para ello, se van a usar dos librerías que, como sabes, debes instalar antes
de ejecutarlas:
library(faraway)
library(MASS)
Una vez que se han cargado las librerías, se especifica de nuevo el modelo usando la
función rlm() en lugar de lm():
Coefficients:
Value Std. Error t value
(Intercept) 3.0068 0.1340 22.4404
x1 -0.5316 0.0431 -12.3323
Econometría
28
Tema 9. Ideas clave
x2 0.6632 0.0511 12.9905
log(𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐) = 𝛽𝛽0 + 𝛽𝛽1 log(𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) + 𝛽𝛽2 log(𝑃𝑃𝑃𝑃𝑃𝑃) + 𝛽𝛽3 ley2005 + 𝛽𝛽3 ley2010
ln (𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐) = 𝛽𝛽0 + 𝛽𝛽1 ln (𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝)𝑖𝑖 + 𝛽𝛽2 ln (𝑃𝑃𝑃𝑃𝑃𝑃)𝑖𝑖 + 𝛽𝛽3 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴í𝑎𝑎𝑖𝑖 + 𝛽𝛽4 𝐶𝐶á𝑑𝑑𝑑𝑑𝑑𝑑𝑖𝑖
+ 𝛽𝛽5 𝐶𝐶ó𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑖𝑖 + ⋯ + 𝛽𝛽48 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑖𝑖 + 𝑢𝑢𝑖𝑖
bptest(mod2)
data: mod2
BP = 6.3934, df = 4, p-value = 0.1716
bptest(mod2)
© Universidad Internacional de La Rioja (UNIR)
data: mod3
BP = 223.62, df = 48, p-value < 2.2e-16
Econometría
29
Tema 9. Ideas clave
Como se puede comprobar, en el modelo 2, no se puede rechazar que los errores
sean homocedásticos, por lo que la estimación por MCO aporta la estimación
insesgada de menor varianza. Sin embargo, se deben estimar los parámetros del
modelo 3 mediante estimación robusta, puesto que se rechaza que los errores sean
homocedásticos en ese caso.
Econometría
30
Tema 9. Ideas clave
A fondo
Análisis de datos: Un enfoque econométrico
Accede a las bases de datos a través del aula virtual o desde la siguiente dirección
web:
[Link]
© Universidad Internacional de La Rioja (UNIR)
Econometría
31
Tema 9. A fondo
Test
1. Una empresa dedicada a la fabricación y venta de labores de tabaco en España
pretende explicar el comportamiento de las ventas (en cajetillas) a través de la
presencia que tiene el producto en el mercado de venta automática (en número
de teclas) y de su categoría de precio (low, middle, premium). Para ello, estima
mediante el procedimiento de mínimos cuadrados ordinarios el siguiente modelo:
Econometría
32
Tema 9. Test
2. Una empresa dedicada a la fabricación y venta de labores de tabaco en España
pretende explicar el comportamiento de las ventas (en cajetillas) a través de la
presencia que tiene el producto en el mercado de venta automática (en número
de teclas) y de su categoría de precio (low, middle, premium). Para ello, estima
mediante el procedimiento de mínimos cuadrados ordinarios el siguiente modelo:
Econometría
33
Tema 9. Test
4. Si hay indicios de que un MRL presenta heterocedasticidad, pero es estimado por
MCO como si se cumpliera homocedasticidad entonces:
A. Los errores estándar de los coeficientes estimados serán mayores que los
verdaderos.
B. Los errores estándar de los coeficientes estimados serán menores que los
verdaderos.
C. No se puede saber si los errores estándar de los coeficientes estimados serán
menores o mayores que los verdaderos.
D. Ninguna de las anteriores es correcta.
Econometría
34
Tema 9. Test
7. La representación gráfica de los residuos de un modelo que incumple el supuesto
básico de homocedasticidad:
A. Pone manifiesto irregularidades en la dispersión de los errores.
B. Muestra una estructura estable y homogénea.
C. Es un gráfico en el que la distancia entre el punto y la media siempre es la
misma.
D. Ninguna de las anteriores es correcta.
Econometría
35
Tema 9. Test