Repaso Econometría Módulo III
Diferencias de tipos de datos, econometría.
Datos de corte transversal, muchos individuos en un solo tiempo.
Series de tiempo, una sola entidad o individuo a lo largo del tiempo.
Datos panel, muchos individuos observados a lo largo del tiempo, o en varios periodos.
Pueden ser considerados más completos que los datos de corte transversal. Es como la
diferencia entre una foto y una película (fotograma).
Panel balanceado: Cada individuo es observado en T periodos (el mismo de datos en el
tiempo)
Panel no balanceado: Cada individuo es observado un periodo de tiempo según cada
individuo. Ti.
Y it =Valor de Y para elindividui i en periodo t
Los individuos pueden ser, personas empresas, regiones o países (seudopaneles).
Tipos de paneles:
Macropaneles: El número de individuos de los paneles es pequeño respecto a los
periodos observados para esos individuos N<T
Micropaneles: El número de los individuos son mayores que el periodo observado N>T
Ventajas respecto al corte transversal:
Estimaciones más eficientes por usar más datos.
Considera dinámica de las variables económicas, podemos ver el cambo en el tiempo.
Con datos de panel se puede resolver el problema de endogeneidad de los regresores.
La endogeneidad es la correlación entre le regresor y la perturbación (en el error), que
genera inconsistencia en el regresor calculado por MCO.
Esto también se podía resolver la endogeneidad con VI (variables instrumentales).
Hay una diferencia entre modelo y método, un modelo estadístico relaciona variables
aleatorias que se basan en ciertos supuestos. Luego, dado esos supuestos planteo un método
por otro lado es una aplicación como MCO por ejemplo.
I. Modelo de Homogeneidad Total (MODELO AGRUPADO)
La idea de este modelo es una aplicación del modelo regresión lineal clásico, para el caso de
datos de panel. Los parámetros del modelo son válidos para todos los individuos en todo
periodo de tiempo.
Una endógena que se relaciona en forma lineal con unas exógenas x it (vector fila), beta es un
vector columna de parámetros beta y el error:
Y it =x it β+ uit
Asumimos un panel balanceado.
Se llama agrupado por: Equivale a agregar varios cortes transversales de varios años. Es decir
juntar datos.
Agrupación de la endógena, y es el vector columna. Que luego tenemos los datos de cada
individuo y todos los periodos.
Vector columna de endógenas tiene dimensión NxTx1.
En caso de la matriz X. Donde tenemos los datos del individuo 1, individuo 2 e individuos N, en
todos los periodos.
Los datos de los errores serán similares a las variables endógenas.
Supuestos del modelo agrupado:
1. Lineal en parámetros, en el β
2. E [ uit |X i ] =0 “Exogeneidad estricta”, no hay covarianza o correlación entre los
errores y lo regresores.
3. Var ( uit |X i ) =σ 2 “Homocedasticidad”, la varianza de las perturbaciones para cada
individuo es una constante.
4. Cov ( u it ,u js| X i X j )=0 “No autocorrelación”, la covarianza es cero entre el mismo
individuo en diferentes periodos ó covarianza entre errores de diferentes individuos
en mismo periodos ó diferentes individuos en diferentes periodos.
5. No multicolinealidad, relación entre variables explicativas del modelo.
El estimador de mínimos cuadrados ordinarios de modelo agrupado es:
^β agrupado =( X ' X )−1 X ' y
N
X ' X=∑ X ' i X i
i=1
N
X ' y=∑ X ' i y i
i=1
Entonces:
N −1 N
^β agrupado =
(∑ )
i=1
X 'i X i ∑ X ' i yi
i=1
Pero si:
xi 1
[]
T
X i = ⋮ entonces X ' i X i=∑ x ' it x it
t =1
x iT
Reemplazando el estimador agrupado quedaría:
N T −1 N T
^β agrupado =
(∑ ∑ )
i=1 t=1
x ' it x it ∑ ∑ x 'it y i
i=1 t =1
Es un estimador insesgado, consistente y eficiente siempre que cumplan con los supuestos
mencionados
Criticas al Modelo de Homogeneidad
El error uit captura variables no observables del individuo que no varían en el tiempo, como
costumbres, hábitos, etc. Pero puede haber autocorrelaciones “intra-individuo”, las
perturbaciones del individuo i en el periodo t puede estar correlacionadas con otras del mismo
individuo en otro momento. Autocorrelación verdadera: Que no se debe a error de
especificación.
Con este tipo de autocorrelación, los estimadores son insesgado, y consistente, pero no es
eficiente, es decir no tiene la menor varianza.
El estimador que supera al MCO en este contexto es de Mínimos Cuadrados Generalizado.
En el modelo anterior, se descarta que los individuos puedan ser similares, lo cual es un
supuesto muy difícil de cumplir dentro un panel que contenga mismos familiares, o pobladores
de un mismo lugar con gustos, preferencias similares.
En estos casos se plantea un nuevo modelo, donde descomponemos el error:
II. Modelo de Heterogeneidad Inobservable
El error uit será separado en dos partes, el efecto que no cambia en el tiempo a i vinculado a
sus gustos, habilidades, es decir efectos muy propios de cada individuo, los mismos que no
varían en el tiempo. Además tenemos el error idiosincrático ε it, que se comporta como los
errores del modelo de regresión lineal clásico.
uit =ai +ε it
Ahora hemos identificado el culpable de la autocorrelación intraindividuos a i, la misma que no
es observable.
Este modelo tiene dos versiones:
Modelo de efectos aleatorios
Modelos de efectos fijos
1. Modelo de efectos aleatorios
a. Es un modelo lineal en β
Y it =x it β+ a⏟
i + ε it
uit
El error idiosincrático debería tener las características de un error bien comportado, siendo
shocks aleatorios.
b. E [ ε it| X i , ai ]=0 “Exogeneidad estricta”, no hay covarianza o correlación entre los
errores y lo regresores.
c. Var ( ε it| X i , a i ) =σ 2 “Homocedasticidad”, la varianza de las perturbaciones para cada
individuo es una constante.
d. Cov ( ε it , ε js|X i , X j , ai ) =0 “No autocorrelación”, la covarianza es cero entre el mismo
individuo en diferentes periodos ó covarianza entre errores de diferentes individuos
en mismo periodos ó diferentes individuos en diferentes periodos.
e. Condicional a X i y ai, el ε it i .i . d . N ( 0 , σ 2 ). Son independiente e idénticamente
distribuidos como una normal de media cero y varianza constante.
Supuestos en relación al a i
f. a i i. i. d . N ( 0 , σ 2α )
g. E [ a i| X i ] =0 implica que no correlación entre a i y X i , estos a i resultan en variables
omitidas
No hay correlaciones de x it con ningún componente del error (endogeneidad de regresores).
Pudiéndose estimar por MCO, sin embargo no es el método más eficiente ya que el a i presenta
autocorrelación intra-individuo.
Prueba:
uit =ai +ε it
Var ( uit ) =Var ( ai ) +Var ( ε it ) =σ 2α +σ 2
La varianza es igual para todo it, por lo que existe homocedasticidad
Calculamos la covarianza de los errores del individuo i en los periodos t y s:
Cov ( u it , uis )=Cov ( ai +ε it , ai + ε is )
Cov ( u it , uis )=Cov ( ai , ai ) +Cov ( ai , ε it ) +Cov ( ε is , ai ) +Cov ( ε it , ε is )
Cov ( u it , uis )=Cov ( ai , ai ) +0+ 0+0
Cov ( u it , uis )=Var ( a i )
Cov ( u it , uis )=σ 2α
Comprobamos que hay covarianza, es decir auto covarianza y por lo tanto autocorrelación
intra-individuo.
Calculamos la covarianza entre individuos:
Cov ( u it , u js ) =Cov ( a i+ ε it , ai +ε js )
Cov ( u it , uis )=Cov ( ai , a j ) + Cov ( ai , ε js ) +Cov ( ε it , a j ) +Cov ( ε it , ε js )
Cov ( u it , uis )=0+0+0+ 0
Cov ( u it , uis )=0
No hay autocorrelación entre individuos.
Debido a la autocorrelación intra-individuos es más eficiente el uso de Mínimos Cuadrados
Generalizados.
^β MCG =( X ' V −1 X )−1 X ' V −1 y
V es la matriz de varianzas de u
Es necesario encontrar esta matriz, para introducirla en el estimador y poder obtener la
estimación de MCG.
Donde el Cov ( u it , uis )=0, entre individuos. La varianza que es intra-individuos tiene la forma:
Reemplazando lo hallado nos quedará:
Se utiliza el producto Kronecker para simplificar la expresión.
Propiedades del producto Kronecker:
i. Estimador de efectos aleatorios
Con esta información podremos calcular el estimador de efectos aleatorios, que es un
estimador de mínimos cuadrados generalizados (MCG). Reemplazando el V.
^β EA =( X ' ( I N ⨂ ∑ )−1 X )−1 X ' ( I N ⨂ ∑ )−1 y
^β EA =( X ' ( I N ⨂ ∑−1 ) X )−1 X ' ( I N ⨂ ∑−1 ) y
N −1 N
^β EA =
( ∑ X 'i ∑−1 X i
i=1
)∑i=1
X 'i ∑−1 y
Necesitamos saber cómo es ∑−1
Y podemos escribirla como:
∑=σ 2 I T +σ 2α J
Entonces su inversa será:
σ 2α
∑ =
−1 1
σ2
I
[T −
σ 2+ T σ 2α
J
]
2
Necesitamos los estimadores de σ α y σ 2
Para la varianza del error idiosincrático ε it tomaremos la siguiente:
Donde ^β WG es el estimado “within groups”, que se obtiene de la regresión de ( Y it −Ý i ) contra
( x it − x́ i ).
2
Y para la varianza de σ α:
Donde ^β BG es el estimado “between groups” obtenido de la estimación MCO de:
Ý i= x́ i β+ ú i
Empleando estos dos estimadores obtenemos el estimador de “efectos aleatorios” (BALESTRA-
NERLOVE):
Se trata de un estimador de MCG factible, es insesgado, es consistente y es más eficiente que
le estimador MCO agrupado. Se dice factible, ya que se está estimando la matriz de varianzas y
covarianzas.
¿Qué es el estimador Between Groups?
Entre “grupos” para datos de panel, se habla de un conjunto de observaciones en el tiempo de
UN SOLO individuo.
Es una estimación entre individuos
Y it =x it β+ ai +ε it
Si suma la ecuación para los T periodos de los individuos, de un mismo individuo en los T
periodos:
T T T
∑ Y it=∑ x it β +T ai +∑ εit
t =1 t=1 t=1
Dividiendo entre el número de periodos (sacando promedios):
T T T
1
T
∑ Y it = T1
( ) (∑ x it β+ T ai + ∑ ε it )
t=1 t =1 t =1
Quedando la siguiente ecuación
Ý i= x́ i β+ ai + έ i
Hemos aplanado el tiempo, muy parecido a un modelo de corte transversal. Ya no existe
autocorrelación entre individuos, ya que no tenemos tiempo.
Lo podemos estimar por MCO el estimador Between Groups:
n −1 n
(∑ ) (∑ )
^β BG =
i=1
'
x́ x́i
i
i=1
x́ 'i ý i
Este estimado es insesgado, consistente y no tiene autocorrelación (bajos los supuestos del
modelo aleatorio), no obstante es menos eficientes que el estimador MCG Balestra-Nerlove
(pierde información, al hacer esos promedios, le quitamos la variabilidad en el tiempo). La
varianza en este estimador va a ser más grande.
Va a ser un insumo para el estimador MCG Balestra –Nerlove.
Ejemplo de Grunfeld:
el xtsum
2. Modelo de efectos fijos
Ademas de la autocorrelación intra-individuo debemos eliminar el componente alfa, ya que
este componente se relaciona con los x del modelo.
I. Estimador con dummies LSDV
No se puede utilizar cuando el N es muy grande, por limitaciones computacionales. Es
imposible introducir miles de dummies, ya que se utiliza una dummy por individuo de la
muestra del panel.
II. Estimador Within Groups
Estos dos primeros estimadores, son exactamente iguales, procedimientos distintos de forma
pero se llega a la misma conclusión, del beta similar.
III. Estimador de primeras diferencias
Cuando se hace este método se pierde una observación. Una vez que se eliminado el alfa se
puede estimar con MCO, siempre que no hay ninguna covarianza entre el erros idiosincrático y
el x. Bajos el supuesto de Exogeneidad estricta. Tengo un estimador consistente
Esta épsilon sin embargo podría presentar autocorrelación intra individuo. Es un estimador
consistente pero con autocorrelación, del tipo MA1, que se ha generado en el procedimiento
de medias móviles. NO es lo más eficiente.
Se puede mejorar a través de una MCG en lugar de MCO.
Concluimos de Within Groups es más eficiente que primeras diferencias, que es una versión
MCG de primeras diferencias.
En ocasiones primeras diferencias, es mejor que WG, cuando se presenta fuerte correlación
serial. Es decir el error idiosincráticos muy correlacionados cercano a uno, Primeras
Diferencias es mejor. Ya que lo controla mucho mejor. Con respecto al error pasado.
T=2 PD y WG son iguales. Si T es grande y N pequeño WG se debe aplicar con cuidados o mejor
usar PD. N menor que 20 No se garantiza la propiedad consistencia con WG.
3. TEST
I. Test de Breusch-Pagan
Hipotesis nula, no existe diferencia entre individuos ( H 0 :σ 2α =0 ) es decir estamos en un
modelo de homogeneidad total.
Hipotesis alternativa H 1 : σ 2α ≠ 0
Si aceptamos estamos en modelo de homogeneidad y demos usar estimador Pool-MCO. Si
rechazamos la hipótesis debemos pasar al siguiente test.
Este test se basa en el Lagrange Multipliers LM, asintóticamente equivalente a Wald, basado
en un modelo irrestricto:
2
NT e ' DD ' e
LM =
[
2 ( T −1 ) e' e
−1
]
D es la matriz de las dummys de individuos y e es el vector de residuos pool-MCO.
Bajo la nula, LM se distribuye como una chi-cuadrado con 1 grado de libertad
Si LM>Chi cuadrado de la tabla Chi, rechazo la hipótesis nula. Si es menor acepto y estimo por
MCO.
II. Test de Hausman
Sirve para decidir entre efectos fijos (WG/LSDV) y efectos aleatorios (Balestra-Nerlove). Aquí
comparamos dos estimadores.
Bajo la hipótesis nula, ambos son consistentes pero uno es más eficiente.
Bajo la hipótesis alternativa, el que era eficiente se vuelve inconsistente, mientras que el otro
sigue siendo consistente.
Estadístico de Hausman
−1
[ ]
H=( ^β 1 ,WG− β^ 1 , BN ) ' V^ ( β^ 1 ,WG )−V^ ( β^ 1 , BN ) ( ^β 1, WG− β^ 1 , BN )
Si la hipótesis nula es verdadero entonces H debería ser pequeño, porque los estimadores son
muy parecidos, entonces deberíamos utilizar efectos aleatorios.
Si la hipótesis es falsa el H es grande, y estaríamos en efectos fijos.
H > χ 21−α
Se rechaza la hipótesis nula con α %, considerar los grados de libertad que son iguales al
número de parámetros β 1. Para poder comparar la en la tabla chi-cuadrado.
4. Otros tema de panel
a. Intercepto en la estimación Within Groups
Si redefinimos el modelo
Se van los interceptos junto al alfa.
STATA lo que hace es calcular una media global, no solo entre el tiempo sino también
individuos.
Asumiendo el promedio de alfa igual a cero
Tenemos que el beta de la ecuación v es el mismo del de la ecuación III:
El intercepto calculado por STATA ^β 1 es un promedio de los interceptos de todos los individuos
α^ 1.
b. Medida de Bondad de Ajuste
R cuadrado between mide que tan fuerte es la asociación entre los x promediados y los y
promediados, NO entra el problema del tiempo. Un número alto dice que Entre los N
individuos.
R cuadrado within mide como las fluctuaciones en el tiempo (propias intra-individuos) entre el
promedio influyen en los cambios Y respecto al promedio. Variabilidad intra-individuos.
Si estimo por efectos fijos y el r-cuadrado se aproxima a cero no esta muy bien estimar por
efectos fijos. Significaría de las variaciones en x no explican las variaciones en y.
R cuadrado overall se incorporan los dos efectos.
c. Efectos fijos temporales
Ahora el modelo tiene un componente del error que cambia en el tiempo λ t que afecta a todos
por igual, como una pandemia.
Conocido también como Two-way model. Puede controlar tendencia de X o el Y, que provoca
sesgos de estimación.
Una forma de incluir efectos temporales es con dummies. (regresión LSDV).
Cuando N es muy grande (muchas dummies es imposible) Within Grupos con dummies
para los efectos temporales. Y luego hacer un test de significancia con junta sobre los
coeficientes de las dummies de tiempo.
d. Modelo de Efectos Aleatorios Correlacionados
Que pasa si es importante para mi ver si pertenece o no a una región el efecto (dummie). A
pesar que el test de Hausman me dice que estime por efectos fijos. Ya que los de efectos
aleatorios no es el adecuado, ya que hay efectos aleatorios correlacionados.
Fusiona el modelo aleatorio con el modelo fijos.
Sacando promedio
Ya podremos estimar utilizando efectos aleatorios, con el estimador de Balestra-Nerlove (más
eficiente). El beta será el mismo que Within Groups.
Le quitamos el sesgo y la correlación de los erros con las x y generamos una multicolinealidad
imperfecta.
Cuál es la interpretación del pi ( π ). Con esta variable podemos hacer una test alternativos
entre los efectos fijos y aleatorios.
Sumando V y VI
Si sabemos que VIII y IV
Entonces pi=0 los estimadores son iguales
MCO y el BG son sesgados porque no toman en consideración la verdadera relación entre el
alfa y los X. Donde el WG es el insesgado y consistente.
Una ventaja de este modelo es que podemos agregar variables que no cambian en el texto, y
estimar con efectos aleatorios.
Métodos de EFECTOS Aleatorios Correlacionados, el beta está cerca del valor poblacional, si la
variable w no presenta correlación ni con alfa y epsilo, el estimador de gama converge a la
verdadera gama.
Relajamos los supuestos del modelo, del error idiosincrático bien comportado. Perturbaciones
no esféricas, nos concentramos en épsilon
e. Heterocedasticidad y correlación entre individuos
La correlación entre individuos (error entre dos individuos relacionados) como la correlación
espacial y correlación entre los errores.
Si los individuos tienen diferentes varianzas (heterocedasticidad) sin correlación entre
individuos.
Podemos tener correlación entre individuos y homocedasticidad
O algo más cercano a la realidad, donde heterocedasticidad y correlación. Cada individuo tiene
su propia varianza, y existe covarianza entre individuos.
Se calculan errores estándar muy chicos, y tenemos pruebas T estándar que sobrestimen y den
como variables significativas a variables que no lo son. Aunque lo betas serán consistentes, el
modelo es erróneo.
Xttest para detectar la correlacion entre individuos para el caso de N pequeño N<T
Macropaneles.
Se estima el modelo por WG y se calculan los errores. Necesario en el estadístico LM y se
calculan las correlaciones entre los errores de los individuos.
El estadístico se distribuye asintóticamente como una chi-cuadrado con d grados de libertad.
La hipótesis nula es que no hay correlación entre errores. Los grados de libertad d es N(N-1)/2.
Usamos el beta agrupado y corregimos la matriz de varianzas y covarianzas. O usar MCG.
Y con Micropaneles N>T
f. Test de autocorrelación
Autocorrelación del error consigo mismo en el pasado. Con paneles largos T (grande), la
hipótesis nula de no correlación.
g. Variables instrumentales en homogeneidad (sin alfa)
h. Variables instrumentales en heterogeneidad (con alfa)
Métodos tradicionales para extraer de x lo que no se relacionado con el error
i. Métodos Panel en Corte Transversal