Heterocedasticidad en Modelos Lineales
Heterocedasticidad en Modelos Lineales
Heterocedasticidad
11.1. Introduccion
En el modelo lineal general
Y
i
=
1
+
2
X
2i
+ +
k
X
ki
+u
i
, i = 1, . . . , n
hemos supuesto que E(u
i
) = 0, E(u
2
i
) =
2
u
y E(u
i
u
j
) = 0 i = j. El supuesto de homo-
cedasticidad o varianza de los errores constante, E(u
2
i
) =
2
u
, es difcil de justicar en
algunas situaciones, especialmente cuando utilizamos datos de secci on cruzada. Veamos
algunos ejemplos.
Ejemplo 18 (Datos de seccion cruzada). Si disponemos de observaciones sobre gasto
en consumo Y
i
y renta X
i
para distintas familias, la ecuaci on de regresi on simple
Y
i
=
1
+
2
X
i
+u
i
(i = 1, . . . , n)
postula, con
2
> 0, que el gasto en consumo esperado para la i-esima familia es una
funci on creciente de la renta
E(Y
i
) =
1
+
2
X
i
Adem as, la ecuaci on postula que el gasto en consumo esperado ser a el mismo para todas
las familias con la misma renta X
i
. Sin embargo, sabemos que no todas las familias
que tienen la misma renta realizan el mismo consumo, algunas gastan m as y otras gas-
tan menos. El error aleatorio u
i
recoge las discrepancias entre el consumo relizado y
el consumo esperado, u
i
= Y
i
E(Y
i
). Cuanto mayores sean estas discrepancias, tanto
mayor ser a la varianza del error. Ahora bien, las familias con una renta muy baja gastan
pr acticamente toda su renta, por lo que presentan un gasto en consumo muy similar y
la varianza del error es peque na. En cambio, las familias con una renta alta tendr an un
gasto en consumo muy dispar, por lo que la varianza del error ser a mayor. En conse-
cuencia, el termino de error en este modelo es heteroced astico porque su varianza vara
con la renta. El gr aco 18 representa esta forma de heterocedasticidad. Un argumento
similar se aplica en el an alisis de la relaci on entre dividendos Y
i
y benecios X
i
em-
presariales. La varianza de la variable dividendos ser a mayor en el grupo de empresas
grandes que en el grupo de empresas peque nas.
Ejemplo 19 (Datos agregados). En la ecuaci on de regresi on
Y
ij
=
1
+
2
X
ij
+u
ij
i = 1, . . . , N; j = 1, . . . , n
i
en donde E(u
ij
) = 0, E(u
2
ij
) =
2
u
y E(u
ij
u
kl
) = 0 i = k, j = l, podemos demostrar que
la ecuaci on de regresi on
Y
i.
=
1
+
2
X
i.
+ u
i.
i = 1, . . . , N
151
152 11.1. Introduccion
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
-10 -5 0 5 10
f
(
u
i
)
ui
Renta baja
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
-10 -5 0 5 10
f
(
u
i
)
ui
Renta alta
Figura 1: Errores heteroced asticos
presenta heterocedasticidad, siendo
Y
i.
=
n
i
j=1
Y
ij
n
i
X
i.
=
n
i
j=1
X
ij
n
i
u
i.
=
n
i
j=1
u
ij
n
i
El doble subndice de la ecuaci on podra representar a una persona j que reside en
una provincia i, o bien a una empresa j de una industria i. El n umero de personas de
la provincia i (o de empresas de la industria i) en la muestra es n
i
.
Vamos a obtener las propiedades estadsticas del termino de error u
i.
:
Media
E( u
i.
) = E
n
i
j=1
u
ij
n
i
n
i
j=1
E(u
ij
)
n
i
= 0
Varianza
E( u
i.
)
2
= E
n
i
j=1
u
ij
n
i
2
= E
n
i
j=1
u
2
ij
+
n
i
j=l
u
ij
u
il
n
2
i
n
i
j=1
E(u
2
ij
) +
n
i
j=l
E(u
ij
u
il
)
n
2
i
=
2
u
n
i
Covarianza
E( u
i.
u
k.
) = E
n
i
j=1
u
ij
n
k
l=1
u
kl
n
2
i
= E
n
i
j=1
n
k
l=1
u
ij
u
kl
n
2
i
n
i
j=1
n
k
l=1
E(u
ij
u
kl
)
n
2
i
= 0
Vemos que, en la ecuaci on de regresi on con datos per c apita, el termino de error es
heteroced astico: su varianza vara inversamente con el n umero de observaciones usadas
para calcular la media E( u
i.
)
2
=
2
u
/n
i
.
Estos dos ejemplos ilustran las dos situaciones m as comunes en que podemos en-
contrar peturbaciones heteroced asticas con datos de secci on cruzada: (1) cuando las
observaciones de la variable dependiente pueden dividirse en grupos dependientes de la
varianza local y (2) cuando trabajamos con datos agrupados o datos per c apita. Muchas
series temporales tambien presentan heterocedasticidad, pero pueden transformarse en
homocedasticas con la transformaci on logartmica: si la varianza local de Y
t
aumenta
linealmente con la media local de Y
t
, entonces la serie log(Y
t
) suele ser homoced astica.
Definici on 87. El modelo lineal general correctamente especicado presenta het-
erocedasticidad pura cuando los errores tienen distinta varianza, E(u
2
i
) =
2
i
(el
subndice de
2
i
indica que la varianza cambia con la observaci on i).
La heterocedasticidad impura viene causada por un error de especicaci on de-
bido a la omision de variable dependiente. Por ejemplo, si la variable Y depende de X
2
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 153
y X
3
Y
i
=
1
+
2
X
2i
+
3
X
3i
+u
i
, u
i
N(0,
2
u
)
y erroneamente especicamos la relaci on
Y
i
=
1
+
2
X
2i
+e
i
entonces el error e
i
=
3
X
3i
+u
i
presentar a heterocedasticidad
E(e
i
)
2
=
2
u
+
2
3
X
2
3i
Observaci on 65. La distinci on entre heterocedasticidad pura e impura es importante
para determinar c omo solucionar el problema. En el segundo caso, el tratamiento con-
siste en incluir la variable omitida.
En un modelo de regresion con heterocedasticidad pura, la matriz de varianzas y
covarianzas de los errores tiene la forma
(11.1) E(uu
) =
2
1
0 . . . 0
0
2
2
. . . 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 . . .
2
n
que contiene n parametros desconocidos. De aqu, el n umero total de par ametros del
modelo, n + k, es mayor que el n umero de observaciones, n, por lo que no es posible la
estimaci on conjunta de los mismos.
Tradicionalmente, para resolver este problema se ha supuesto que la varianza del
error depende de alguna variable conocida. Por ejemplo, en la relaci on entre consumo y
renta parece razonable pensar que la varianza del error es funci on de la renta, de modo
que podemos especicar E(u
2
i
) =
2
u
X
i
; y en el modelo con datos medios, E( u
i.
)
2
=
2
u
/n
i
. De esta forma, conseguimos reducir el n umero de par ametros desconocidos de
n +k a k + 1, siendo ahora posible la estimaci on del modelo.
Es conveniente escribir la matriz de varianzas y covarianzas (11.1) como
(11.2) E(uu
) =
2
u
1
0 . . . 0
0
2
. . . 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 . . .
n
=
2
u
2
i
=
1
+
2
X
2i
+
3
X
3i
+
4
X
2
2i
+
5
X
2
3i
+
6
X
2
i
X
3i
y las hipotesis a contrastar son
H
0
:
2
= =
p
= 0
H
1
:
i
= 0 para alg un i = 2, . . . , p
Bajo H
0
, la varianza del error es constante
2
i
=
1
; bajo H
1
, hay heterocedasticidad
del tipo
2
i
=
1
+
2
X
2i
+
3
X
3i
+
4
X
2
2i
+
5
X
2
3i
+
6
X
2
i
X
3i
La regresion auxiliar incluye como variables explicativas todas las variables explica-
tivas del modelo de interes, sus cuadrados y los productos cruzados, siempre que tales
variables no sean redundantes, es decir, no aparezcan ya en la ecuaci on de regresi on. Por
ejemplo, si X
2i
es una variable cticia tomando los valores 0 y 1, entonces X
2
2i
= X
2i
y
se dice que X
2
2i
es redundante.
En resumen, algunas ventajas del test de White son:
1. es un test general,
2. es un test constructivo, nos sugiere una forma de heterocedasticidad si se rec-
haza H
0
,
3. es muy simple de aplicar.
y como inconvenientes
1. la ecuacion de regresion auxiliar puede incluir muchas variables explicativas,
k(k + 1)/2.
2. la ecuaci on de regresion auxiliar no est a exenta de los errores de especicaci on
de cualquier regresion,
3. es un contraste asintotico, v alido para muestras muy grandes.
[Link]. El contraste de Breush-Pagan/Godfrey, BPG. Godfrey (1978) considera
el modelo de regresion m ultiple
Y
i
=
1
+
2
X
2i
+ +
k
X
ki
+u
i
, i = 1, . . . , n
con heterocedasticidad del tipo
2
i
= e
(
1
+
2
Z
2i
++pZ
pi
)
Esta ecuacion indica que la varianza
2
i
es funci on exponencial de una combinaci on lineal
de variables conocidas. En la pr actica, las variables Z
j
(j = 2, . . . , p) coinciden con las
variables explicativas X
j
(j = 1, . . . , k).
Breusch y Pagan (1979) consideran una forma m as general de heterocedasticidad
2
i
= h(
1
+
2
Z
2i
+ +
p
Z
pi
)
donde h es una funcion no especicada.
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 157
Las hipotesis a contrastar son
H
0
:
2
= =
p
= 0 (homocedasticidad)
H
1
:
i
= 0 para alg un i = 2, . . . , p (heterocedasticidad)
Los pasos para realizar el contraste son los siguientes:
1. Estimar por mnimos cuadrados la ecuaci on de regresi on de interes obtener los
residuos u
i
, y calcular
2
u
=
n
i=1
u
2
i
/n
2. Estimar por mnimos cuadrados la ecuaci on de regresi on auxiliar
u
i
u
2
=
1
+
2
Z
2i
+ +
p
Z
pi
+e
i
y calcular la suma de cuadros explicada, SCE.
3. Calcular el estadstico de contraste SCE/2, que sigue bajo H
0
(y suponiendo
normalidad) una distribuci on Chi-cuadrado con p 1 grados de libertad.
4. La hipotesis H
0
se rechaza al nivel de signicacion , si SCE/2 > c, donde c
es el valor crtico para el cual Prob(
2
p1
> c) =
Un procedimiento equivalente es el siguiente
1. Estimar por mnimos cuadrados la ecuaci on de regresi on de interes obtener los
residuos u
i
.
2. Estimar por mnimos cuadrados la ecuaci on de regresi on auxiliar
u
2
i
=
1
+
2
Z
2i
+ +
p
Z
pi
+e
i
y calcular el coeciente de determinaci on, R
2
.
3. Calcular el estadstico de contraste nR
2
, que sigue bajo H
0
(y suponiendo
normalidad) una distribuci on Chi-cuadrado con p 1 grados de libertad.
4. La hipotesis H
0
se rechaza al nivel de signicaci on , si nR
2
> c, donde c es el
valor crtico para el cual Prob(
2
p1
> c) =
Veamos la logica del contraste. Si H
0
es cierta, entonces la varianza
2
i
no depende de
las variables Z
j
(j = 2, . . . , p) y el R
2
en la regresion auxiliar ser a bajo. Por el contrario,
si H
1
es cierta, entonces la varianza
2
i
depende de las variables Z
j
(j = 2, . . . , p) y el
R
2
sera alto. El problema esta en decidir cuando el R
2
se considera bajo y alto. Pues
bien, sera bajo cuando nR
2
< c y alto cuando nR
2
> c.
Observe que cuando las variables que causan la heterocedasticidad, Z
j
(j = 2, . . . , p)
coinciden con las variables explicativas X
j
(j = 1, . . . , k), la ecuaci on de regresi on auxiliar
de este contraste esta contenida en la regresion auxiliar del test de White.
En resumen, algunas ventajas del test de BPG son:
1. es muy simple de aplicar,
2. no requiere conocer la forma funcional de la heterocedasticidad,
3. es un test constructivo, nos sugiere una forma de heterocedasticidad si se rec-
haza H
0
,
y como inconvenientes
1. descansa en el supuesto de normalidad de los errores,
2. la ecuacion de regresion auxiliar no est a exenta de los errores de especicaci on
de cualquier regresion,
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
158 11.2. Deteccion de heterocedasticidad
Observaci on 67. En los ex amenes, algunos estudiantes confunden los tests de au-
tocorrelaci on y heterocedasticidad de Godfrey. Recordemos que en el primer caso nos
interesa la dependencia del residuos u
t
de su pasado u
tk
.
11.2.4. El contraste de Goldfeld-Quandt. El contraste de Goldfeld-Quandt
(1965) se aplica cuando sospechamos que la varianza del error aumenta con los valores
de una variable conocida Z
2
i
=
2
u
Z
i
El problema a contrastar lo podemos formular como
H
0
:
2
i
=
2
u
(homocedasticidad)
H
1
:
2
i
=
2
u
Z
i
para alg un i = 2, . . . , p (heterocedasticidad)
Los pasos del contraste de Goldfeld-Quandt son los siguientes:
1. Identicar la variable que causa la heterocedasticidad, digamos Z.
2. Ordenar la tabla de datos seg un los valores crecientes de Z.
3. Dividir la tabla de datos en tres submuestras. La submuestra central con m
observaciones, y las otras dos submuestras con (n m)/2 observaciones.
4. Omitir las observaciones centrales, y estimar por mnimos cuadrados ordinarios
la ecuaci on de regresion en cada submuestra.
5. Calcular la suma de cuadrados de los residuos en cada submuestra: SCR
1
y
SCR
2
. Si H
1
es cierta, entonces SCR
2
> SCR
1
.
6. Calcular el estadstico de contraste
F =
SCR
2
SCR
1
que sigue una distribuci on F con (nm)/2 grados de libertad en el numerador
y denominador.
7. La hipotesis H
0
se rechaza al nivel de signicacion , si F > c, donde c es el
valor crtico para el cual Prob(F
(nm)/2,(nm)/2
> c) =
La eleccion del n umero de observaciones a omitir, m, juega un papel clave en el con-
traste. Cuanto mayor sea m, tanto mayor ser a la diferencia entre las sumas de cuadrados
de los residuos SCR
1
y SCR
2
y m as probable ser a rechazar H
0
si es falsa. El problema
es que disminuyen los grados de libertad de cada regresi on estimada, con lo cual el valor
crtico c aumenta y menos probable es rechazar H
0
si es falsa. Por ejemplo, el valor
crtico para Prob(F
4,4
> c) = 0,95 es c = 6,388 y Prob(F
8,8
> c) = 0,95 es c = 3,438.
En la practica, m suele elegirse igual a n/3.
Observaci on 68. Si
2
i
depende negativamente de los valores de Z
i
, entonces el co-
ciente SCR
1
/SCR
2
debera ser mayor que uno, y deberamos basar el contraste en esta
ratio.
[Link]. El contraste de raz on de verosimilitudes. Cuando disponemos de una
muestra grande, podemos formar g grupos de residuos y estimar en cada grupo la vari-
anza residual
2
i
=
ji
u
i
/n
i
, en donde n
i
es el n umero de residuos en el grupo i-esimo.
Se demuestra que bajo la hipotesis nula de homocedasticidad
[n
1
log(
2
1
) + +n
g
log(
2
g
)] nlog(
2
u
)
2
g1
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 159
11.3. Tratamiento de la heterocedasticidad
Los remedios que vamos a ver para este problema dependen de si la heterocedasti-
cidad es conocida o desconocida. En el primer caso, el metodo de estimaci on preferido
sera el de mnimos cuadrados generalizados; en el segundo, podemos optar por mnimos
cuadrados generalizados factibles o mnimos cuadrados ordinarios.
11.3.1. Heterocedasticidad conocida. El modelo lineal general con hetero-
cedasticidad
(11.3) Y
i
=
1
+
2
X
2i
+ +
k
X
ki
+u
i
, i = 1, . . . , n
en donde E(u
i
) = 0, E(u
2
i
) =
2
u
i
y E(u
i
u
j
) = 0 i = j, es un caso especial del
modelo con perturbaciones no esfericas. En este marco, el estimador lineal, insesgado,
consistente y optimo es el estimador de mnimos cuadrados generalizados
MCG
= (X
1
X)
1
X
1
y
cuya matriz de varianzas y covarianzas es
V (
MCG
) =
2
u
(X
1
X)
1
en donde = diag(
1
, . . . ,
n
) es una matriz diagonal, cuya inversa es simplemente
1
= diag(1/
1
, . . . , 1/
n
). El c alculo directo de
MCG
y V (
MCG
) requiere crear la
matriz
1
de orden n n. En la pr actica, podemos evitar la creaci on de esta matriz
usando el metodo de mnimos cuadrados ponderados.
[Link]. Mnimos cuadrados ponderados. En el modelo (11.3), los errores cuasi-
tipicados
u
i
=
u
i
i
cumplen las hip otesis basicas:
1. Media cero
E(u
i
) = E
u
i
=
E(u
i
)
i
= 0
2. Varianza constante
E(u
2
i
) = E(
u
2
i
i
) =
E(u
2
i
)
i
=
2
u
i
=
2
u
3. Covarianza cero
E(u
i
u
j
) = E
u
i
u
j
=
E(u
i
u
j
)
j
= 0 i = j
De aqu, si transformamos el modelo de interes (11.3) dividiendo por la cuasi-
desviacion tpica de los errores
w
i
obtenemos
Y
i
i
=
1
1
i
+
2
X
2i
i
+ +
k
X
ki
i
+
u
i
i
, i = 1, . . . , n
o bien
(11.4) Y
i
=
1
X
1i
+
2
X
2i
+ +
k
X
ki
+u
i
, i = 1, . . . , n
El modelo transformado (11.4) contiene los mismos par ametros
1
, . . . ,
k
que el modelo
de interes (11.3), pero su error cumple las hip otesis b asicas. Por tanto, el estimador
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
160 11.3. Tratamiento de la heterocedasticidad
de mnimos cuadrados ordinarios en (11.4) ser a lineal, insesgado y eciente, que se de-
nomina estimador de mnimos cuadrados ponderados. Podemos interpretar este metodo
de estimacion como un metodo en dos estapas: en una primera etapa, se transforman
las variables dividiendo los datos por la cuasi-desviaci on tpica de los errores y, en una
segunda etapa, se estiman los par ametros por mnimos cuadrados ordinarios.
El metodo de mnimos cuadrados ponderados es una forma conveniente de obtener
el estimador de mnimos cuadrados generalizados bajo heterocedasticidad. No debemos
considerarlo como un metodo de estimaci on alternativo. Podemos comprobar la equiv-
alencia entre los dos metodos usando la descomposici on
1
= P
P y expresando el
estimador MCG como
MCG
= (X
PX)
1
X
Py
en donde
P =
1/
1
0 . . . 0
0 1/
2
. . . 0
.
.
.
.
.
.
.
.
.
0 0 . . . 1/
y
1
/
1
y
2
/
2
.
.
.
y
n
/
y PX =
1/
1
X
21
/
1
. . . X
k1
/
1
1/
2
X
22
/
2
. . . X
k2
/
2
.
.
.
.
.
.
.
.
.
1/
n
X
2n
/
n
. . . X
kn
/
se corresponden con los datos de las variables divididos por las cuasi-desviaciones tpicas
de los errores correspondientes.
Ejemplo 20. Sea la ecuaci on de regresi on simple con heterocedasticidad
Y
i
=
1
+
2
X
i
+u
i
en donde E(u
i
) = 0, E(u
2
i
) =
2
u
X
2
i
y E(u
i
u
j
) = 0 i = j. El modelo transformado con
errores homoced asticos se obtiene dividiendo la ecuaci on por X
i
Y
i
X
i
=
1
1
X
i
+
2
+u
i
en donde u
i
= u
i
/X
i
cumple las propiedades E(u
i
) = 0, E(u
2
i
) =
2
u
y E(u
i
u
j
) =
0 i = j. Vemos que el modelo transformado contiene un termino constante. Por tanto,
los residuos u
i
de la estimaci on de mnimos cuadrados tendr an media cero y el R
2
estar a acotado entre 0 y 1.
Ejemplo 21. Sea la ecuaci on de regresi on simple con heterocedasticidad
Y
i
=
1
+
2
X
i
+u
i
en donde E(u
i
) = 0, E(u
2
i
) =
2
u
X
i
y E(u
i
u
j
) = 0 i = j. El modelo transformado con
errores homoced asticos se obtiene dividiendo la ecuaci on por
X
i
Y
i
X
i
=
1
1
X
i
+
2
1
X
i
+u
i
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 161
en donde u
i
= u
i
/
X
i
cumple las propiedades E(u
i
) = 0, E(u
2
i
) =
2
u
y E(u
i
u
j
) =
0 i = j.
Observamos que el modelo transformado no contiene un termino constante. Por
tanto, los residuos u
i
de la estimaci on de mnimos cuadrados no tendr an necesariamente
media cero y el R
2
no estar a necesariamente acotado entre 0 y 1.
Ejemplo 22. Sea la ecuaci on de regresi on simple con heterocedasticidad
Y
i
=
1
+
2
X
i
+u
i
en donde E(u
i
) = 0, E(u
2
i
) =
2
u
e
X
i
y E(u
i
u
j
) = 0 i = j. El modelo transformado con
errores homoced asticos se obtiene dividiendo la ecuaci on por
e
X
i
Y
i
e
X
i
=
1
1
e
X
i
+
2
X
i
e
X
i
+u
i
en donde u
i
= u
i
/
e
X
i
cumple las propiedades E(u
i
) = 0, E(u
2
i
) =
2
u
y E(u
i
u
j
) =
0 i = j.
Para comprender porque el metodo de estimaci on descrito se denomina metodo de
mnimos cuadrados ponderados, hay que notar que la suma de cuadrados en el modelo
transformado
n
i=1
u
2
i
=
n
i=1
(Y
1
X
1i
+
2
X
2i
+ +
k
X
ki
)
2
puede escribirse como una suma ponderada de los cuadrados de los residuos
n
i=1
u
2
i
=
n
i=1
1
i
(Y
i
1
X
1i
+
2
X
2i
+ +
k
X
ki
)
2
en donde la ponderacion asignada a cada residuo es inversamente proporcional a la
varianza del error. De modo que, cuanto mayor sea la varianza tanto menor ser a el peso
que se asigna a cada residuo, y viceversa.
11.3.2. Heterocedasticidad desconocida.
[Link]. Mnimos cuadrados generalizados factibles. En la pr actica cuando de-
seamos estimar una ecuacion de regresi on m ultiple
Y
i
=
1
+
2
X
2i
+ +
k
X
ki
+u
i
, i = 1, . . . , n
desconocemos la forma de heterocedasticidad. Si sospechamos que
2
i
=
1
+
2
Z
2i
+ +
p
Z
pi
podramos aplicar el test de Breusch-Pagan-Godfrey. Si rechazamos la hip otesis nula
de homocedasticidad, entonces debemos estimar por mnimos cuadrados generalizados.
Ahora bien, como no conocemos las varianzas
2
i
, tendremos estimarlas utilizando los
valores ajustados obtenidos en la estimaci on de la regresi on auxiliar
u
2
i
=
1
+
2
Z
2i
+ +
p
Z
pi
+e
i
esto es
2
i
=
1
+
2
Z
2i
+ +
p
Z
pi
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
162 11.5. Ejercicios
Tipicando los datos, obtenemos el modelo transformado
Y
i
i
=
1
1
i
+
2
X
2i
i
+ +
k
X
ki
i
+
u
i
i
, i = 1, . . . , n
en donde el estimador de mnimos cuadrados ordinarios se denomina mnimos cuadrados
generalizados factibles (MCGF). El termino factible enfatiza que la estimaci on se ha
realizado reemplazando
2
i
por una estimaci on
2
i
.
Las propiedades estadsticas de este estimador en muestras nitas son desconocidas;
mientras que en muestras grandes, dependen de las propiedades de
2
i
: si
2
i
es un
estimador consistente de
2
i
, entonces el estimador MCGF tambien lo ser a.
[Link]. Mnimos cuadrados ordinarios. Cuando la heterocedasticidad es descono-
cida, el estimador MCO cumple algunas propiedades deseables: es lineal, insesgado y
consistente. El problema surge porque el estimador es ineciente y, en consecuencia,
los estadsticos t y F estaran sesgados. White demostr o que la matriz de varianzas y
covarianzas
V (
MCO
) =
2
u
X
X
1
puede estimarse consistentemente reemplazando la matriz desconocida por una matriz
diagonal que contiene los residuos al cuadrado de la estimaci on MCO,
= diag( u
2
1
, . . . , u
2
n
).
Algunos autores preeren el estimador MCO al MCGF, y calculan los estadsticos t y
F usando la matriz de varianzas y covarianzas consistente en presencia de heterocedas-
ticidad desconocida.
11.4. Resumen
1. El supuesto de homocedasticidad en las perturbaciones debe cuestionarse cuan-
do trabajamos con datos de secci on cruzada.
2. La forma de heterocedasticidad m as com un es
2
i
=
2
u
i
, en donde la varianza
del error es proporcional a los valores de una variable
i
.
3. El analisis graco de los residuos de un modelo estimado por mnimos cuadrados
es util para detectar la presencia y forma de heterocedasticidad en los errores.
4. Los contrastes de White y Godfrey son los metodos de detercci on de hetero-
cedasticidad mas populares.
5. El procedimiento de mninimos cuadrados ponderados es un remedio simple al
problema de heterocedasticidad conocida.
6. El estimador de MCO sigue siendo util cuando los constrastes de hip otesis se
basan en la matriz de varianzas y covarianzas consistente a la heterocedastici-
dad.
Palabras clave
Datos de seccion cruzada
Homocedasticidad
Heterocedasticidad pura
Heterocedasticidad impura
Varianza local
Gr aco de dispersi on
Mnimos cuadrados ponderados
Errores est andar consistentes ante het-
erocedasticidad
11.5. Ejercicios
1. Explique la diferencia entre heterocedasticidad pura e impura.
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 163
2. Describa el contraste de Goldfeld y Quandt.
3. Glejser propuso un test de heterocedasticidad basado en la regresi on simple de
| u
i
| sobre Z
i
para = 1, 0,5, 0,5, 1. Como debera ser la pendiente de Z
i
bajo homocedasticidad? Y el R-cuadrado? Dibuje los diagramas de dispersi on
de | u
i
| versus Z
i
para = 1, 0,5, 0,5, 1 en presencia de heterocedasticidad.
4. Considere la regresion de Y
i
(i = 1, . . . , n) sobre un termino constante. De-
muestre que, en presencia de heterocedasticidad E(u
2
i
) =
2
u
i
, la varianza de
la media
Y es
V ar(
Y ) =
2
u
n
2
n
i=1
i
5. En el modelo de regresion simple con heterocedasticidad
Y
i
=
1
+
2
X
i
+u
i
(i = 1, . . . , n), u
i
N(0,
2
i
)
demuestre que
V ar(
2,MCO
) =
n
i=1
i
x
2
i
n
i=1
x
2
i
2
11.6. Ejercicios resueltos
Ejercicio 5. Diga si las siguientes armaciones son verdaderas o falsas, justicando
sus respuestas:
(a) En presencia de heterocedasticidad, los estimadores MCO son sesgados e ine-
cientes.
(b) Si hay heterocedasticidad, las pruebas t y F no son v alidas.
(c) En presencia de heterocedasticidad, el metodo MCO sobreestima siempre los
errores est andar de los estimadores.
(d) Si los residuos de una regresi on MCO muestran un patr on sistem atico, esto
signica que hay presencia de heterocedasticidad en los datos.
(e) No hay una prueba general de heterocedasticidad que este libre de supuesto
alguno sobre cu al de las variables est a correlacionada con el termino de error.
(f) Si el modelo de regresi on est a mal especicado (por ejemplo, se ha omitido
una variable importante), los residuos MCO mostrar an un patr on claramente
distinguible.
(g) Si un regresor que tiene varianza no constante se omite (incorrectamente) de
un modelo, los residuos MCO ser an heteroced asticos.
Solucion
a. Falso, la presencia de heterocedasticidad en el termino perturbaci on no afecta
a la propiedad de insesgadez de las estimadores MCO, lo que si es cierto es que
son inecientes.
b. Son inv alidas en el caso en el que el modelo ha sido estimado por MCO, pero
si el modelo es estimado por Mnimos Cuadrados Ponderados las pruebas son
v alidas.
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
164 11.6. Ejercicios resueltos
c. Correcto, el metodo MCO en presencia de heterocedasticidad es menos eciente
que MCG, ya que:
V (
MCO
) =
2
(X
X)
1
X
X(X
X)
1
V (
MCG
) =
2
(X
1
X)
1
y aplicando el teorema de Aitken tenemos que la estimaci on MCG es m as e-
ciente que MCO.
d. Correcto, un patr on sistem atico en los residuos indica heterocedasticidad en los
datos provocada por la omisi on de alguna variable relevante en la explicaci on
de la variable dependiente Y .
e. Falso, en el contraste de WHITE no hay ning un supuesto sobre la forma de la
heterocedasticidad en la especicaci on de la hip otesis alternativa.
f. Correcto, si se realiza un gr aco entre los residuos MCO al cuadrado y la
variable que hemos omitido observaremos un patr on muy claro de relaci on entre
ambos, lo que nos dar a una idea de la transformaci on a realizar en las variables
del modelo.
g. Correcto, supongamos que el modelo correcto es, Y
i
=
1
+
2
X
2i
+
3
X
3i
+U
i
,
pero incorrectamente se estima: Y
i
=
1
+
2
X
2i
+V
i
, el termino perturbaci on
V
i
=
3
X
3i
+U
i
recogera el comportamiento de la variable omitida y los residuos
MCO recoger an el comportamiento obviado en la especicaci on del modelo.
Ejercicio 6. Suponga el siguiente modelo de regresi on:
y
i
= +u
i
donde E(u
i
) = 0 y V ar(u
i
) =
2
x
2
i
(a) Hallar el estimador MCO de y calcular su varianza.
(b) Existe un estimador m as eciente de ? En caso de que exista, halle su ex-
presi on y la de su varianza.
Solucion
a. La estimaci on por MCO ser a la siguiente:
SCR
MCO
=
N
i=1
u
2
i
=
N
i=1
(y
i
MCO
)
2
Derivando con respecto a
MCO
obtenemos su estimador MCO:
SCR
MCO
MCO
= 2
N
i=1
(y
i
MCO
) = 0
MCO
=
1
N
N
i=1
y
i
La esperanza y la varianza de este estimador ser an las siguientes:
MCO
=
1
N
N
i=1
( +u
i
) = +
1
N
N
i=1
u
i
E(
MCO
) = E( +
1
N
N
i=1
u
i
) = +
1
N
N
i=1
E(u
i
) =
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 165
V (
MCO
) = E[
MCO
E(
MCO
)]
2
= E[ +
1
N
N
i=1
u
i
]
2
=
1
N
2
N
i=1
E(u
2
i
)
V (
MCO
)
2
N
2
N
i=1
x
2
i
b. El estimador del apartado anterior no es el m as eciente dada la presencia de
heterocedasticidad, por lo que habr a que estimar el modelo por MCG, para lo
que debemos transformarlo de la siguiente manera:
y
i
x
i
=
1
x
i
+
u
i
x
i
Al igual que en el apartado anterior, obtenemos el estimador de de la
siguiente manera:
SCR
MCG
=
N
i=1
(
u
i
x
i
)
2
=
N
i=1
(
y
i
x
i
MCG
1
x
i
)
2
SCR
MCG
MCG
= 2[
N
i=1
(
y
i
x
i
MCG
1
x
i
)]
1
x
i
= 0
MCG
=
N
i=1
(y
i
/x
2
i
)
N
i=1
(1/x
2
i
)
Calculamos ahora la esperanza y la varianza de
MCG
:
MCG
=
N
i=1
(
+u
i
x
2
i
)
N
i=1
(
1
x
2
i
)
= +
N
i=1
(u
i
/x
2
i
)
N
i=1
(1/x
2
i
)
E(
MCG
) = +
N
i=1
(E(u
i
)/x
2
i
)
N
i=1
(1/x
2
i
)
=
V (
MCG
) = E[
MCG
E(
MCG
)]
2
= E[ +
N
i=1
(u
i
/x
2
i
)
N
i=1
(1/x
2
i
)
]
2
=
=
N
i=1
(E(u
2
i
)/x
4
i
)
(
N
i=1
(1/x
2
i
))
2
=
2
N
i=1
(1/x
2
i
)
(
N
i=1
(1/x
2
i
))
2
V (
MCG
) =
2
N
i=1
(1/x
2
i
)
Comparando ambas varianzas:
V (
MCO
) =
2
(1/x
2
i
)
(
1
x
2
i
)
x
2
i
N
2
>
2
(1/x
2
i
)
= V (
MCG
)
Ejercicio 7. Dado el modelo y
t
= + x
t
+ u
t
donde E(u
t
) = 0, E(u
2
t
) =
2
t
y
E(u
t
, u
s
) = 0 t = s Se propone la siguiente estimaci on para termino constante:
MCG
=
1
T
(
T
t=1
y
t
MCG
T
i=1
x
t
t
)
Es correcta esta expresi on? Justique su respuesta.
Solucion
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
166 11.6. Ejercicios resueltos
Bajo la presencia de heterocedasticidad, el estimador insesgado m as eciente es el
de MCG. Para estimarlo, debemos transformar el modelo de la siguiente manera:
y
t
t
=
1
t
+
x
t
t
+
u
t
t
y
T
=
MCG
x
1t
+
MCG
x
2t
+v
t
Obtenemos el estimador MCG de de la siguiente manera:
SCR
MCG
=
T
t=1
( v
t
)
2
=
T
t=1
(y
t
MCG
x
1t
MCG
x
2t
)
2
SCR
MCG
MCG
= 2
T
t=1
(y
t
MCG
x
1t
MCG
x
2t
)x
1t
= 0
T
t=1
y
t
x
1t
MCG
T
t=1
x
2
1t
MCG
T
t=1
x
2t
x
1t
= 0
MCG
=
1
T
t=1
x
2
1t
T
t=1
(y
t
x
1t
MCG
x
2t
x
1t
) =
1
T
t=1
(1/
t
)
2
T
t=1
(
y
t
2
t
MCG
x
t
2
t
)
Por lo tanto, el estimador MCO propuesto no est a correctamente calculado.
Ejercicio 8. Considere el modelo y
t
= +x
t
+u
t
, donde E(u
t
) = 0 y V ar(u
t
) =
2
t
=
2
x
2
t
, del que se tienen las siguientes observaciones:
t y
t
x
t
1 4 2
2 2 1
3 1 4
4 5 2
5 3 1
(a) Obtenga los estimadores MCO de y , as como su matriz de covarianzas.
Existe alg un problema en la denici on de dichos estimadores?
(b) Obtenga los estimadores MCG de y , as como su matriz de covarianzas.
Existe alg un problema en la denici on de dichos estimadores? Compare su
matriz de covarianzas con la del estimador MCO.
Soluci on
a.
MCO
= (X
X)
1
X
y =
5 10
10 26
15
27
4
0, 5
V (
MCO
) =
2
(X
X)
1
X
X(X
X)
1
=
5 10
10 26
26 82
82 290
5 10
10 26
1
=
4, 3733 2, 6666
2, 6666 1, 8333
El unico problema es que no se verican todas las hip otesis que garantizan
que el estimador es ELIO dentro de los estimadores lineales e insesgados.
b.
MCG
= (X
1
X)
1
X
1
y =
2, 5625 3, 25
3, 25 5
7, 3125
9, 75
2, 1666
0, 541667
MCG
) =
2
(X
1
X)
1
=
2
2, 5625 3, 25
3, 25 5
1
=
2
2, 2222 1, 4444
1, 4444 1, 1388
T
i=1
x
t
= 0
Soluci on
Expresi on analtica general para la matriz de varianzas y covarianzas del estimador
MCO en el modelo y
t
=
1
+
2
x
2t
+u
t
V ar(u
t
) = kx
t
V (
MCO
) =
2
(X
X)
1
X
X(X
X)
1
vamos a ver la expresi on que tiene cada
uno de los componentes de la matriz de varianzas y covarianzas del estimador MCO,
(X
X)
1
=
1
(T
P
T
t=1
x
2
t
(
P
T
t=1
xt)
2
)
T
t=1
x
2
t
T
t=1
x
t
T
t=1
x
t
T
,
X
X =
T
t=1
x
t
T
t=1
x
2
t
T
t=1
x
2
t
T
t=1
x
3
t
,
Si hacemos el producto entre esas matrices obtenemos la siguiente expresi on para
V (
MCO
): V (
MCO
) =
2
(X
X)
1
X
X(X
X)
1
=
k
(T
P
t
x
2
t
(
P
t
xt)
2
)
2
t
x
t
[(
t
x
2
t
)
2
t
x
t
t
x
3
t
] T[(
t
x
2
t
)
2
t
x
t
t
x
3
t
]
T[(
t
x
2
t
)
2
t
x
t
t
x
3
t
]
t
x
t
(
t
x
t
)
2
2T
t
x
2
t
] +T
2
t
x
3
t
]
MCG
) = k(X
1
X)
1
=
k
P
t
1
x
t
P
t
xtT
2
t
x
t
T
T
t
1
xt
1
=
y
x
=
g
n
g
y
g
/
g
n
g
g
n
g
x
g
/
g
n
g
2
=
g
y
g
x
g
g
x
2
g
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
168 11.6. Ejercicios resueltos
3
=
g
n
g
x
g
y
g
g
n
g
x
2
g
(a) Pruebe que los tres estimadores son insesgados.
(b) Obtenga la varianza de cada estimador.
(c) Calcule numericamente cada estimador y su varianza suponiendo que
2
u
= 1.
Cu ales son los estimadores m as ecientes?
(d) Demuestre que la varianza del tercer estimador es siempre menor que la del
segundo.
Soluci on
Antes de calcular las esperanzas y varianzas de los tres estimadores propuestos, los
expresamos en funci on de la perturbaci on aleatoria:
1
=
g
n
g
y
g
g
n
g
x
g
=
g
n
g
( x
g
+ u
g
)
g
n
g
x
g
= +
g
n
g
u
g
g
n
g
x
g
2
=
g
y
g
x
g
g
x
2
g
=
g
( x
g
+ u
g
) x
g
g
x
2
g
= +
g
u
g
x
g
g
x
2
g
3
=
g
n
g
x
g
y
g
g
n
g
x
2
g
=
g
n
g
x
g
( x
g
+ u
g
)
g
n
g
x
2
g
= +
g
n
g
x
g
u
g
g
n
g
x
2
g
a. Las esperanzas de los estimadores son las siguientes:
E(
1
) = E[ +
g
n
g
1
ng
ng
i=1
u
ig
g
n
g
x
g
] = +
ng
i=1
E(u
ig
)
g
n
g
x
g
=
E(
2
) = E[ +
g
x
g
1
ng
ng
i=1
u
ig
g
x
2
g
] = +
g
x
g
1
ng
ng
i=1
E(u
ig
)
g
x
2
g
=
E(
3
) = E[ +
g
n
g
x
g
1
ng
ng
i=1
u
ig
g
n
g
x
2
g
] = +
g
x
g
ng
i=1
E(u
ig
)
g
n
g
x
2
g
=
b. Las varianzas de los estimadores ser an:
V (
1
) = E[
1
E(
1
)]
2
= E[ +
ng
i=1
u
ig
g
n
g
x
g
]
2
=
N
2
u
(
g
n
g
x
g
)
2
V (
2
) = E[
2
E(
2
)]
2
= E[ +
g
x
g
1
ng
ng
i=1
u
ig
g
x
2
g
]
2
=
2
u
g
1
ng
x
2
g
(
g
x
2
g
)
2
V (
3
) = E[
3
E(
3
)]
2
= E[ +
g
n
g
x
g
1
ng
ng
i=1
u
ig
g
n
g
x
2
g
]
2
=
2
u
g
n
g
x
2
g
c. Los valores numericos de los estimadores y sus varianzas son:
1
= 2
2
= 1, 90
3
= 1, 83
V (
1
) = 0, 00028 V (
2
) = 0, 00020 V (
3
) = 0, 00019
Los estimadores m as ecientes (con menor varianza) son
2
y
3
.
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
11. Heterocedasticidad 169
d. Vamos a obtener el estimador m as eciente entre los lineales e insesgados que,
dado el problema de heterocedasticidad por grupos que presenta el modelo prop-
uesto, corresponde con el de MCG.
En primer lugar, derivamos las propiedades del termino de error del modelo:
E( u
g
) = E(
1
n
g
ng
i=1
u
ig
) =
1
n
g
ng
i=1
E(u
ig
) = 0
V ( u
g
) = E[ u
g
]
2
= E(
1
n
2
g
ng
i=1
u
2
ig
) =
2
u
n
g
Por lo tanto, hemos demostrado c omo al considerar los datos en medias, esta-
mos introduciendo heterocedasticidad en el modelo. Para obtener la estimaci on
MCG de transformamos el modelo de la siguiente manera:
n
g
y
g
=
n
g
x
g
+
n
g
u
g
y
g
= x
g
+v
g
Estimamos ahora el modelo transformado por Mnimos Cuadrados:
SCR
MCG
=
g
( v
g
)
2
=
g
(y
MCG
x
g
)
2
SCR
MCG
MCG
= 2
g
(y
MCG
x
g
)x
g
= 0
MCG
=
g
y
g
x
g
x
2
g
=
g
n
g
y
g
x
g
g
n
g
x
2
g
Como vemos, el estimador MCG de coincide con el estimador
3
prop-
uesto en el ejercicio. Por lo tanto, este ultimo siempre tendr a menor varianza
que cualquier otro, por ser, por denici on el estimador insesgado m as eciente.
Prof. Dr. Jose Luis Gallego G omez
Departamento de Economa. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons