UNIDAD I: AMPLIACIONES DEL MODELO DE REGRESIÓN.
TEMA 2: INTRODUCCIÓN A LOS MODELOS DE REGRESIÓN DE DATOS
PANEL: MODELO DE EFECTOS FIJOS. MODELO DE EFECTOS
ALEATORIOS.
DATOS PANEL1: LA MISMA UNIDAD TRANSVERSAL (FAMILIA, EMPRESA,
PAÍS, INDIVIDUO) ES ESTUDIADA A LO LARGO DEL TIEMPO.
OBSERVACIONES DE SERIES DE TIEMPO SOBRE UNA
MUESTRA DE UNIDADES INDIVIDUALES
DATOS PANEL
DIMENSION ESPACIAL O DIMENSIÓN TEMPORAL:
ESTRUCTURAL: SERIES CORTAS (BASES
MAS IMPORTANTE, DADA COSTOSAS)
SU ESTRUCTURA MENOS ÉNFASIS EN
MODELAR DIFERENCIAS AUTOCORRELACION
INDIVIDUALES
HETEROSCEDASTICIDAD
EJEMPLOS2:
AUNQUE LOS PANELES EN EEUU COMENZARON EN 1960S, NO FUE SINO
HASTA LOS 1980S QUE COMENZARON EN EUROPA
PANEL STUDY OF INCOME DYNAMICS (PSID): SURVEY RESEARCH
CENTER, UNIVERSIDAD DE MICHIGAN.
o CREADA EN 1968 PARA ESTUDIAR POBREZA, EFECTOS DE
PROGRAMAS DE SOCIALES Y ECONÓMICOS.
o ORIGINALMENTE 4802 FAMILIAS, 31000 INDIVIDUOS.
ACTUALMENTE INCLUYE 8000 FAMILIAS
o INFORMACIÓN SOBRE UNAS 5000 VARIABLES ECONÓMICAS,
SALUD Y SOCIALES.
o DISPONIBLE EN [Link]
1
OTROS NOMBRES QUE RECIBEN: DATOS AGRUPADOS O COMBINADOS, MICROPANEL,
DATOS LONGITUDINALES (PREVALECE DIMENSIÓN TEMPORAL).
2
PARA MAS EJEMPLOS Y REFERENCIAS VER BALTAGI, “ECONOMETRIC ANALYSIS OF
PANEL DATA”, CAPITULO INTRODUCTORIO.
J. RAMONI PERAZZI Tema 2.2. 1
ECONOMETRIA II
NATIONAL LONGITUDINAL SURVEYS OF LABOR MARKET
EXPERIENCE (NLS): CENTER FOR HUMAN RESOURCES, OHIO STATE
UNIVERSITY.
o CREADA EN LA DÉCADA DE 1970´S
o DISTINTOS SEGMENTOS DE LA FUERZA LABORAL
(HOMBRES Y MUJERES JÓVENES Y MADUROS, CON
DISTINTOS AÑOS DE REFERENCIA)
o MUESTRA ORIGINAL INCLUÍA CERCA DE 32000 INDIVIDUOS
o DISPONIBLE EN [Link]
CURRENT POPULATION SURVEY (CPS): INFORMACIÓN MENSUAL
RECOGIDA DEL CENSUS BUREAU DE EEUU.
o CREADA EN LA DÉCADA DE 1940´S
o INCLUYE INFORMACIÓN SOCIOECONÓMICA SOBRE UNAS
50000 FAMILIAS EN TODO ESTADOS UNIDOS
o DISPONIBLE EN [Link]
EL PANEL SOCIO-ECONOMICO ALEMAN (GESOEP):
o INCLUYE 1761 INDIVIDUOS ANALIZADOS ENTRE 19984 Y 2002
o INFORMACION SOBRE AÑO DE NACIMIENTO, SEXO, ESTADO
CIVIL, NIVL DEE SATISFACCION CON SU VIDA, INGRESO
LABORAL, HORAS DE TRABAJO ANUAL.
GRAN ENCUESTA INTEGRADA DE HOGARES (GEINH):
DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA
(DANE-COLOMBIA)
o CONDICIONES DE EMPLEO DE LAS PERSONAS,
CARACTERÍSTICAS DEMOGRAFICAS, INGRESO Y SUS GASTOS
A NIVEL NACIONAL, URBANO- RURAL, REGIONAL,
DEPARTAMENTAL, Y PARA CADA UNA DE LAS CAPITALES DE
LOS DEPARTAMENTOS.
o SURGE EN 2006, A RAIZ DE LA INTEGRACIÓN DE LAS TRES MÁS
IMPORTANTES ENCUESTAS A HOGARES DEL DANE: LA
CONTINUA DE HOGARES, LA DE INGRESOS Y GASTOS Y LA DE
CALIDAD DE VIDA.
o EL EJE CENTRAL DE LA GEIH ES LA ENCUESTA DE MERCADO
LABORAL (ECH) POR SU CARÁCTER CONTINUO Y POR SER LA
DE MAYOR TAMAÑO Y COBERTURA. LAS OTRAS ENCUESTAS
SE INCLUIRÁN COMO MÓDULOS ESPECÍFICOS, LOS CUALES NO
SE HARÁN A TODA LA MUESTRA SINO A UNA SUBMUESTRA DE
LA GEIH.
o ACTUALMENTE LA ENCUESTA TIENE UNA MUESTRA TOTAL
ANUAL DE 271.620 HOGARES, CON INFORMACION. SEGÚN EL
J. RAMONI PERAZZI Tema 2.2. 2
ECONOMETRIA II
TIPO DE REGION Y DIVISION GEOGRAFICA SE TIENE
INFORMACION MENSUAL, TRIMESTRAL, SEMESTRAL O ANUAL.
EN VENEZUELA:
ENCUESTA DE HOGARES POR MUESTREO (¿):
o SURGE EN AÑO 1967 COMO RESPUESTA A LA NECESIDAD DE
DISPONER, EN LOS PERÍODOS ÍNTER CENSALES, DE
INFORMACIÓN SOBRE LA ESTRUCTURA, EVOLUCIÓN DEL
MERCADO DE TRABAJO Y LAS CARACTERÍSTICAS
SOCIOECONÓMICAS DE LA POBLACIÓN, ESPECIALMENTE EN
RELACIÓN CON VARIABLES SUSCEPTIBLES A MODIFICACIONES
SIGNIFICATIVAS EN EL CORTO PLAZO.
o EL MARCO MUESTRAL UTILIZADO ESTÁ CONSTITUIDO POR
LA MUESTRA MAESTRA 2001 DEL INE, CONSTRUIDA A PARTIR
DEL REGISTRO DE EDIFICACIÓN (ZONA URBANA) Y
CARPETAS PARROQUIAL RURAL (ZONA RURAL),
INFORMACIÓN GENERADA DE LA PLANIFICACIÓN EN
VENEZUELA DEL XIII CENSO NACIONAL DE POBLACIÓN Y
VIVIENDA 2001.
o EL TOTAL DE LOTES EN LA MUESTRA ES DE 3175,
EQUIVALENTE A 45.000 VIVIENDAS, APROXIMADAMENTE.
CADA SEMESTRE LA MUESTRA SE DISTRIBUYE EN FORMA
ALEATORIA A LO LARGO DE 24 SEMANAS.
ENCUESTA DE PRESUPUESTOS FAMILIARES (¿)
o BCV+INE+UNIVERSIDADES DESDE 2004
o SE REALIZA A LOS HOGARES, CON EL FIN DE OBTENER
INFORMACIÓN SOBRE SUS INGRESOS Y GASTOS DURANTE UN
PERÍODO, ASÍ COMO OTRAS IMPORTANTES VARIABLES
ECONÓMICAS Y SOCIALES VINCULADAS CON LOS MISMOS.
o I (1988), II (1997-8), III (2004), IV (2011)
o MÁS DE 10.000 HOGARES, REPARTIDOS EN TODO EL PAÍS,
PERTENECIENTES A DISTINTOS ESTRATOS ECONÓMICOS
RAZONES PARA EL AUGE EN EL USO DE LOS DATOS PANEL:
1) RECONOCIMIENTO DE LAS DIFICULTADES PARA ESTIMAR
MODELOS DE COMPORTAMIENTO INDIVIDUAL CON DATOS
AGREGADOS DE SERIES DE TIEMPO
2) PREOCUPACION POR LAS DISTORSIONES QUE LAS DIFERENCIAS
INDIVIDUALES INTRODUCEN EN LAS ESTIMACIONES OBTENIDAS A
PARTIR DE ENCUESTAS DE CORTE TRANSVERSAL
J. RAMONI PERAZZI Tema 2.2. 3
ECONOMETRIA II
3) AVANCES EN LAS TECNICAS ECONOMETRICAS, SOFTWARE Y
DISPONIBILIDAD DE ESTE TIPO DE DATOS.
VENTAJAS DE TRABAJAR CON DATOS PANEL:
EN GENERAL, LOS DATOS PANEL TIENEN VENTAJAS QUE VALEN LA
PENA EL COSTO DE ESTE TIPO DE DATOS. SIN EMBARGO ES
IMPORTANTE CONOCER SUS LIMITACIONES.
1) TOMA EN CUENTA DE MANERA EXPLICITA LA HETEROGENEIDAD NO
OBSERVABLE, REDUCIENDO POSIBLE SESGO:
a. CONSIDERA EFECTO DE FACTORES INVARIANTES EN EL
TIEMPO Y/O ESPACIO, PERO QUE PUEDEN AFECTAR LA
VARIABLE BAJO ESTUDIO.
b. PERMITE ANALIZAR EL EFECTO DE CADA INDIVIDUO Y
CONTROLAR OUTLIERS SIN RECURRIR A DICOTÓMICAS.
2) MEJORA CALIDAD DE LA INFORMACIÓN:
a. MAYOR VARIABILIDAD, GRADOS DE LIBERTAD Y EFICIENCIA.
b. MENOS PROBLEMAS DE COLINEALIDAD: LA DIMENSIÓN
TRANSVERSAL AÑADE VARIABILIDAD Y ROMPE LA
COLINEALIDAD.
3) PERMITE ESTUDIAR DINÁMICAS DE AJUSTE, MODELOS CON
RETARDOS, RELACIONES INTERTEMPORALES, MODELOS DE CICLO
DE VIDA E INTERGENERACIONALES, ETC.:
a. VELOCIDAD DE AJUSTE.
b. PERMANENCIA EN EL TIEMPO DE FENÓMENOS COMO
DESEMPLEO, POBREZA (PERMANENTES O TRANSITORIOS).
4) IDENTIFICA Y CUANTIFICA EFECTOS NO POSIBLES DE DETECTAR
CON DATOS DE CORTE TRANSVERSAL O CON SERIES DE TIEMPO
(COMPARACIÓN DE SITUACIONES SIN-CON, DIFFERENCE IN
DIFFERENCE):
a. EFECTO DE SINDICATOS Y PROGRAMAS DE ENTRENAMIENTO
EN SALARIOS
b. EFECTOS DE REGULACIONES Y LEYES
J. RAMONI PERAZZI Tema 2.2. 4
ECONOMETRIA II
5) PERMITE CONSTRUIR Y PROBAR MODELOS DE COMPORTAMIENTO
RELATIVAMENTE MÁS COMPLEJOS SIN RECURRIR A MUCHAS
RESTRICCIONES (EFICIENCIA TÉCNICA, CAMBIO TECNOLÓGICO,
ECONOMÍAS DE ESCALA).
6) LA AGREGACION PUEDE OCULTAR CARACTERISTICAS IMPORTANTES
DE LA VARIABLE EN ESTUDIO. LOS DATOS PANEL REDUCEN SESGO
DE AGREGACIÓN, AL RECOGER INFORMACIÓN DE MICROUNIDADES
(INDIVIDUOS, FIRMAS, HOGARES), AUMENTANDO LA PRECISION DE
LAS ESTIMACIONES.
LIMITACIONES DE LOS DATOS PANEL:
1) PROBLEMAS EN DISEÑO Y RECOLECCIÓN DE DATOS:
a. COBERTURA: FALTA DE COBERTURA DE LA POBLACIÓN DE
INTERÉS O FALTA DE REPRESENTATIVIDAD DE LA MUESTRA
TRAS UNA SERIE DE PERIODOS (ATTRITION BIAS O PERDIDA DE
UNIDADES TRANSVERSALES POR MUERTE, MUDANZA, CAMBIO
DE OPINIÓN HACIA NO PARTICIPAR, ETC).
b. DATOS FALTANTES: NO COOPERACIÓN DEL ENCUESTADO,
IMPOSIBLE UBICARLO, O ERROR DE ENCUESTADOR.
c. OLVIDO DE INFORMACIÓN PROPORCIONADA PREVIAMENTE.
d. FRECUENCIA Y ESPACIAMIENTO DE ENTREVISTAS.
e. PERIODO DE REFERENCIA.
f. SESGOS TEMPORALES: CAMBIOS SUSTANCIALES NO
ESPERADOS EN EL COMPORTAMIENTO DE VARIABLES.
2) DISTORSIÓN POR ERRORES DE MEDIDA:
a. PREGUNTAS NO CLARAS
b. ERRORES DE MEDIDA
c. ERRORES INTENCIONALES (SESGO DE PRESTIGIO)
d. INFORMANTES INADECUADOS
e. SESGO INDUCIDO POR EL ENCUESTADOR
ESTOS ERRORES, TRADICIONALMENTE PRESENTES EN DATOS DE
CORTE TRANSVERSAL, SE ACENTUAN EN LOS DATOS PANEL A
RAIZ DE ENTREVISTAS REPETIDAS A LOS MISMOS INDIVIDUOS
3) PROBLEMAS DE SELECCIÓN:
a. AUTO-SELECCIÓN: ASIGNACIÓN DE INDIVIDUOS A GRUPOS
PUEDE SER VOLUNTARIAS, NO ALEATORIA (DATOS
TRUNCADOS).
b. NO RESPUESTA: NEGATIVA A PARTICIPAR, NADIE EN CASA…
c. ATTRITION: PERDIDA DE UNIDADES TRANSVERSALES
J. RAMONI PERAZZI Tema 2.2. 5
ECONOMETRIA II
NOTAS:
DATOS PANEL NO ES LO MISMO QUE SERIES TEMPORALES DE CORTE
TRANSVERSAL INDEPENDIENTES (PSEUDO PANEL). EN ESTE ULTIMO,
CADA COHORTE ES EXTRAIDA A PARTIR DE UNA NUEVA MUESTRA
ALEATORIA, POR LO QUE NO SE PUEDE ANALIZAR EL
COMPORTAMIENTO DE LOS INDIVIDUOS EN EL TIEMPO3.
EN GENERAL SE ASUMEN PANELES COMPLETOS O BALANCEADOS
(IGUAL NUMERO DE OBSERVACIONES TEMPORALES PARA TODOS LOS
INDIVIDUOS). EL TRATAMEINTO DE PANELES INCOMPLETOS (NO
BALANCEADOS) ES SIMILAR, SOBRE TODO SI LAS ADICIONES Y
SUSTRACCIONES DE INDIVIDUOS A LA MUESTRA SON ALEATORIAS.
ESTRUCTURA DE DATOS: ESTABLECER CONDICIONES DE
ALEATORIEDAD NECESARIAS; EVITAR RESTRICCIONES INNECESARIAS.
Y1 X21 X31 UNI1 T1
Y2 X22 X32 UNI1 T2
Y3 X23 X33 UNI1 T3
Y1 X21 X31 UNI2 T1
Y X X UNI2 T2
Y20 X220 X320 2UNI122T20 32
Y3 X23 X33 UNI2 T3
Y1 X21 X31 UNI3 T1
Y X X UNI3 T2
Y20 X220 X320 2UNI222T20 32
Y3 X23 X33 UNI3 T3
Y1 X21 X31 UNI4 T1
Y X X UNI4 T2
Y20 X220 X320 2UNI322T20 32
Y3 X23 X33 UNI4 T3
Y20 X220 X320 UNI4 T20
ES MUY PROBABLE QUE HAYA AUTOCORRELACION DE LA MISMA
UNIDAD MUESTRAL EN EL TIEMPO, EN EL ESPACIO O AMBOS.
POR LO GENERAL SE ASUME ALEATORIEDAD EN LA DIMENSION
ESPACIAL (CORTE TRANSVERSAL) Y NO SE IMPONEN
3
PARA INFORMACION BASICA SOBRE METODOLOGIA DE ANALISIS DE PSEUDO
PANELES VER DEATON (1985) “PANEL DATA FROM TIME SERIES OF CROSS-SECTIONS”,
JOURNAL OF ECONOMETRICS, 30, 109-126.
J. RAMONI PERAZZI Tema 2.2. 6
ECONOMETRIA II
RESTRICCIONES EN LA DIMENSION TEMPORAL (SOLO EN CASOS
DONDE LA PRIMERA ES MAYOR)
EJEMPLO DE MODELO DE INVERSION CORPORATIVA: GRUNFELD
SOSTIENE QUE LA INVERSIÓN DEPENDE DEL VALOR REAL DE LA
EMPRESA (VR1) Y DEL CAPITAL SOCIAL REAL (CR1).
Yit = 1 + 2 X2it + 3 X3it + uit para i= 1,2,3,4...N
t= 1,2,…T
X SE ASUME NO ESTOCÁSTICA Y Uit ~ (0, 2).
OBSERVE QUE COMO CADA UNIDAD TRANSVERSAL TIENE EL MISMO
NUMERO DE OBSERVACIONES, SE DICE QUE EL PANEL ESTA
BALANCEADO.4
TRADICIONAL MODELO DE REGRESION: INTERCEPTO Y PENDIENTES
INVARIANTES EN EL TIEMPO Y ESPACIO. LOS RESIDUOS RECOGEN
LAS DIFERENCIAS ENTRE INDIVIDUOS (EFECTO INDIVIDUO) Y A
TRAVÉS DEL TIEMPO
. reg inv vr1 cr1
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 2, 77) = 119.63
Model | 4849457.37 2 2424728.69 Prob > F = 0.0000
Residual | 1560689.67 77 20268.697 R-squared = 0.7565
-------------+------------------------------ Adj R-squared = 0.7502
Total | 6410147.04 79 81141.1018 Root MSE = 142.37
------------------------------------------------------------------------------
inv | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
vr1 | .1100955 .0137297 8.02 0.000 .0827563 .1374348
cr1 | .3033932 .0492957 6.15 0.000 .2052328 .4015535
_cons | -63.30413 29.6142 -2.14 0.036 -122.2735 -4.334734
ESTE MODELO IGNORA LA NATURALEZA DE CADA UNIDAD
TRANSVERSAL (EMPRESA) Y SU EVOLUCIÓN EN EL TIEMPO
ERRORES DE ESPECIFICACIÓN
LOS EFECTOS INDIVIDUALES SON AQUELLOS QUE AFECTAN DE
MANERA DESIGUAL A CADA UNO DE LOS AGENTES DE ESTUDIO
CONTENIDOS EN LA MUESTRA (INDIVIDUOS, EMPRESAS, BANCOS).
SON INVARIABLES EN EL TIEMPO Y AFECTAN DE MANERA DIRECTA
4
EN BASES DE DATOS ECONOMICAS Y FINANCIERAS ES MUY PROBABLE TENER
PANELES NO BALANCEADOS, PUESTO QUE INDIVIDUOS Y FIRMAS PUEDEN
DESAPARECER. MANTENER SOLO LOS “SOBREVIVIENTES” GENERA SESGO DE
SUPERVIVENCIA.
J. RAMONI PERAZZI Tema 2.2. 7
ECONOMETRIA II
LAS DECISIONES QUE TOMEN DICHAS UNIDADES (CAPACIDAD
EMPRESARIAL, EFICIENCIA OPERATIVA, EXPERIENCIA, TECNOLOGÍA)
ESTRUCTURA BÁSICA DE MODELOS DE DATOS PANEL
SE BUSCA DETERMINAR SI LAS VARIACIONES OBSERVADAS EN Y SE
DEBEN A CAMBIOS EN LAS VARIABLES EXPLICATIVAS, TOMANDO EN
CUENTA LAS DIFERENCIAS INDIVIDUALES
Yit = 1 + 2 X2it + 3 X3it + … + kXkit + Uit
K
Yit = 1 + kXkit + Uit CON Uit = αi + it
k 2
DONDE αi DENOTA EL EFECTO INDIVIDUAL NO OBSERVABLE
ESPECIFICO DE CADA UNIDAD MUESTRAL Y it DENOTA EL RESIDUO
ALEATORIO RESTANTE. LA DIFERENCIA ENTRE UNO Y OTRO MODELO
ES PREECISAMENTE COMO SE MANEJAN ESTOS COMPONENTES.
EN TERMINOS MATRICIALES
Yit = 'xit+ Uit
DONDE: Xit ES UN VECTOR DE K VARIABLES EXPLICATIVAS
i: 1, …, N UNIDADES MUESTRALES PARA N*T
t: 1, …, T PERIODOS OBSERVACIONES
k: 1, …, K COVARIABLE
Ejemplo: Efecto de programa de entrenamiento T en salarios:
Log(wageit) = t + xit + 1Tit + i + it
Variaciones promedio
en el tiempo
Variables que Habilidades, destrezas,
afectan el salario gustos. Pudieran
correlacionadas determinar asignación de
o no con T individuos al programa de
entrenamiento
(problema de auto-
Señala si se
selección)
somete o no al
entrenamiento (en
t=1 Ti1=0)
PROBLEMAS A LA HORA DE ESTIMAR ESTE MODELO:
1) EXISTEN DIVERSAS FUENTES DE VARIABILIDAD:
J. RAMONI PERAZZI Tema 2.2. 8
ECONOMETRIA II
a. EFECTO INDIVIDUO: GENERALMENTE INVARIANTE EN EL
TIEMPO. REPRESENTA EL IMPACTO DIRECTO DE TODAS LAS
CARACTERISTICAS INDIVIDUALES NO OBSERVABLES E
INVARIANTES EN EL TIEMPO SOBRE Yit.
b. EFECTO TIEMPO: QUE PUEDE ASUMIRSE INVARIANTE ENTRE
INDIVIDUOS. CADA PERIODO TIENE EFECTOS ESPECIFICOS NO
OBSERVABLES.
c. EFECTO INDIVIDUO-TIEMPO: EFECTOS CAMBIANTES QUE
PUEDEN SER TANTO DETERMINISTICOS COMO ESTOCASTICOS.
2) SUPONER QUE LOS COEFICIENTES SON IGUALES PARA LOS N
INDIVIDUOS Y/O LOS T INSTANTES DE TIEMPO PUEDE RESULTAR MUY
RESTRICTIVO. POR SU PARTE, EL CASO EXTREMO, DONDE SE ASUME kit
DIFERENTES ENTRE INDIVIDUOS Y EN EL TIEMPO PUEDE SER
IMPOSIBLE DE MANEJAR.
3) QUE PROCEDIMIENTO DE ESTIMACION UTILIZAR Y QUE SUPUESTOS
ADOPTAR. TRADICIONALMENTE, LOS ESTIMADORES MC ASUMEN:
E( Uit) = 0 PARA TODO i Y PARA TODO t.
V(Uit) = 2 PARA TODO i Y TODO t
COV (Uit, Uss) = 0 PARA TODO i j Y TODO t s
COV (Uit, Xit) = 0 PARA TODO i Y t
Uit N(0, 2)
LA COMBINACION DE HOMOCEDASTICIDAD Y NO
AUTOCORRELACION IMPLICA QUE NO EXISTE RELACION ENTRE
DIFERENTES INDIVIDUOS EN UN MISMO t; ENTRE DIFERENTES
PERIODOS DE UN MISMO INDIVIDUO, O AMBOS. SUPUESTO POCO
REALISTA:
EL PRODUCTO INTERNO BRUTO DE VENEZUELA DE ESTE AÑO SE
RELACIONA CON EL DE AÑOS ANTERIORES Y CON EL DE SUS
SOCIOS COMERCIALES (COLOMBIA, ESTADOS UNIDOS…)
CONCLUSION: LOS MODELOS DE DATOS PANEL IMPLICATEMENTE
VIOLAN EL SUPUESTO DE HOMOCEDASTICIDAD Y NO
AUTOCORRELACION, POR LO QUE LOS ESTIMADORES MCO SE
HACEN INEFICIENTES, DADO QUE ESTAS RELACIONES TERMINAN
SIENDO ABSORBIDAS POR EL TERMINO DE ERROR.
¿QUE HACER?
RESPONDAMOS CON EL MODELO DE LAS AEROLINEAS
J. RAMONI PERAZZI Tema 2.2. 9
ECONOMETRIA II
1) POOLED MCO O MODEO DE COEFICIENTES CONSTANTES: TODOS
LOS COEFICIENTES SE ASUMEN CONSTANTES EN EL TIEMPO Y A
TRAVES DE LOS INDIVIDUOS, DE MODO QUE EL TERMINO DE ERROR
RECOJA LA HETEROGENEIDAD NO OBSERVADA
COSTit = β1+ β2Qit + β3PFit + β4LFit + Uit
SE ASUME: COEFICIENTES IGUALES PARA TODAS LAS LINEAS AEREAS.
LAS VARIABLES EXPLICATIVAS SON NO ALEATORIAS Y QUE
DE SERLO, COV(X,U)=0 (ESTRICTA EXOGENEIDAD: LAS
VARIABLE LA DEPENDEN DE VALORES PASADOS,
PRESENTES Y FUTUROS DE LOS RESIDUOS).
Uit IID(0, 2U). PARA EFECTOS DE PRUBAS DE HIPOTESIS
PUEDE ASUMIRSE NORMALIDAD.
. reg cost q pf lf
Source | SS df MS Number of obs = 90
-------------+------------------------------ F( 3, 86) = 503.12
Model | 1.1966e+14 3 3.9885e+13 Prob > F = 0.0000
Residual | 6.8177e+12 86 7.9276e+10 R-squared = 0.9461
-------------+------------------------------ Adj R-squared = 0.9442
Total | 1.2647e+14 89 1.4210e+12 Root MSE = 2.8e+05
------------------------------------------------------------------------------
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 2026114 61806.94 32.78 0.000 1903246 2148982
pf | 1.225348 .1037217 11.81 0.000 1.019156 1.43154
lf | -3065753 696327.3 -4.40 0.000 -4450006 -1681500
_cons | 1158559 360592.7 3.21 0.002 441724.7 1875394
------------------------------------------------------------------------------
. estat ovtest
Ramsey RESET test using powers of the fitted values of cost
Ho: model has no omitted variables
F(3, 83) = 48.75
Prob > F = 0.0000
PROBLEMAS: INCORRECTA ESPECIFICACION
IGNORA HETEROGENEIDAD INDIVIDUAL O ES
ABSORBIDA POR Uit, POR LO QUE ESTE TÉRMINO
PUEDE ESTAR CORRELACIONADO CON ALGUNO DE
LOS REGRESORES (ESTIMADORES SESGADOS E
INCOSISTENTES)
2) MCVD O EFECTOS FIJOS CON VARIABLES DICOTOMICAS (ESTIMAR
αi): AGRUPAR LAS OBSERVACIONES Y ESTIMAR UNA REGRESION
INCORPORANDO N-1 DICOTOMICAS PARA LOS DISTINTOS INDIVIDUOS.
J. RAMONI PERAZZI Tema 2.2. 10
ECONOMETRIA II
EL TERMINO CONSTANTE SE ASUME ESPECIFICO PARA CADA
INDIVIDUO, MIENTRAS QUE LAS PENDIENTES SON CONSTANTES PARA
TODOS LOS INDIVIDUOS EN EL TIEMPO
EL EFECTO INDIVIDUO αi SE ASUME FIJO PARA CADA INDIVIDUO Y DEBE
SER ESTIMADO CON EL RESTO DE LOS PARAMETROS. EL RESTO DEL
ERROR it SE ASUME IID(0, 2).
COSTit = β1i+ β2Qit + β3PFit + β4LFit + Uit
OBSERVE: LA HETEROGENEIDAD INDIVIDUAL INVARIANTE EN EL
TIEMPO SE RECOGE A TRAVES DE DIFERENTES
INTERCEPTOS PARA CADA INIDIVIDUO (MODEL DE EFECTOS
FIJOS EN UNA VIA)
DE UTILIZAR β1it IMPLICARIA QUE CADA INDIVIDUO VARIA EN
EL TIEMPO (MODELO DE EFECTOS FIJOS EN DOS VIAS)
. xi: reg cost q pf lf i.i
i.i _Ii_1-6 (naturally coded; _Ii_1 omitted)
Source | SS df MS Number of obs = 90
-------------+------------------------------ F( 8, 81) = 346.92
Model | 1.2289e+14 8 1.5361e+13 Prob > F = 0.0000
Residual | 3.5865e+12 81 4.4278e+10 R-squared = 0.9716
-------------+------------------------------ Adj R-squared = 0.9688
Total | 1.2647e+14 89 1.4210e+12 Root MSE = 2.1e+05
------------------------------------------------------------------------------
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 3319023 171354.1 19.37 0.000 2978083 3659964
pf | .7730708 .097319 7.94 0.000 .5794365 .9667052
lf | -3797368 613773.1 -6.19 0.000 -5018584 -2576152
_Ii_2 | 601733.3 100895.7 5.96 0.000 400982.5 802484.1
_Ii_3 | 1337181 186171 7.18 0.000 966758.6 1707602
_Ii_4 | 1777592 213162.9 8.34 0.000 1353465 2201719
_Ii_5 | 1828252 231229.7 7.91 0.000 1368178 2288327
_Ii_6 | 1706474 228300.9 7.47 0.000 1252227 2160721
_cons | -131236 350777.1 -0.37 0.709 -829172.3 566700.4
------------------------------------------------------------------------------
ESTE TIPO DE MODELOS ES APROPIADO CUANDO SE TRABAJA CON UN
CONJUNTO ESPECIFICO DE INDIVIDUOS (FIRMAS, PAISES, ESTADOS),
OBSERVE: SI SE INTRODUCEN MUCHAS VARIABLES DICOTOMICAS NO
HAY SUFICIENTES GRADOS DE LIBERTAD. POR EJEMPLO,
UN MODELO DONDE TODOS LOS COEFICIENTES SON
ESPECIFICOS PARA CADA INDIVIDUO EN CADA PERIODO DE
TIEMPO
K
Yit = 1it + ki t Xkit + Uit
k 2
J. RAMONI PERAZZI Tema 2.2. 11
ECONOMETRIA II
DICOTOMICAS INCREMENTAN RIESGO DE
MULTICOLINEALIDAD.
PUDIESE SUCEDER QUE NO SEA POSIBLE ESTIMAR EL
EFECTO DE FACTORES NO VARIANTES EN EL TIEMPO
(RAZA), AL SER ABSORBIDOS POR EL INTERCEPTO.
CUAL DE LOS DOS MODELOS ES MEJOR?
A) INTERCEPTOS SIGNIFICATIVOS
B) TEST F PARA COMPARAR MODELO RESTRINGIDO (1) Y NO
RESTRINGIDO (2)
Ho: β11 = β12 = β13 = β14 = β15 =0 H1: AL MENOS UN β1i ES DISTINTO DE CERO
F= [(0.9716-0.9461)/5]/[(1-0.9716)/81] = 14.99 RECHAZA Ho
3) SOLUCION 3: ESTIMAR UN MODELO DIFERENTE PARA CADA
INDIVIDUO i, CON BASE EN LAS SERIES DE TIEMPO INDIVIDUALES
DISPONIBLES Y OBSERVAR CAMBIOS EN COMPORTAMIENTO ENTRE
ELLOS
Y1t = i 'x1t+ U1t
PROBLEMAS: N ECUACIONES PUEDE SER PROBLEMA SI N
IGNORA RELACIONES ENTRE INDIVIDUOS
. reg cost q pf lf if i==1
Source | SS df MS Number of obs = 15
-------------+------------------------------ F( 3, 11) = 431.28
Model | 2.1396e+13 3 7.1319e+12 Prob > F = 0.0000
Residual | 1.8191e+11 11 1.6537e+10 R-squared = 0.9916
-------------+------------------------------ Adj R-squared = 0.9893
Total | 2.1578e+13 14 1.5413e+12 Root MSE = 1.3e+05
------------------------------------------------------------------------------
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 2584384 329713.3 7.84 0.000 1858690 3310078
pf | 2.1164 .1776224 11.92 0.000 1.725456 2.507344
lf | -6621326 1967831 -3.36 0.006 -1.10e+07 -2290158
_cons | 1970171 830740.2 2.37 0.037 141723.9 3798618
------------------------------------------------------------------------------
4) SOLUCION 4: ESTIMAR MODELOS DIFERENTES PARA CADA PERIODO
t, A FIN DE CONOCER VARIACIONES EN EL TIEMPO
Yit = t 'xit+ Uit
PROBLEMAS: T ECUACIONES PUEDE SER PROBLEMA SI T
J. RAMONI PERAZZI Tema 2.2. 12
ECONOMETRIA II
IGNORA DIFERENCIAS INDIVIDUALES
. reg cost q pf lf if t==1
Source | SS df MS Number of obs = 6
-------------+------------------------------ F( 3, 2) = 3785.94
Model | 8.5815e+11 3 2.8605e+11 Prob > F = 0.0003
Residual | 151111666 2 75555833 R-squared = 0.9998
-------------+------------------------------ Adj R-squared = 0.9996
Total | 8.5830e+11 5 1.7166e+11 Root MSE = 8692.3
------------------------------------------------------------------------------
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 1405737 34142.43 41.17 0.001 1258834 1552640
pf | 8.344278 1.252366 6.66 0.022 2.955781 13.73277
lf | -1442210 187036.1 -7.71 0.016 -2246961 -637458.3
_cons | -318535.6 118062.4 -2.70 0.114 -826517.2 189446
5) SOLUCION 5: MODELOS INTERMEDIOS COMO LOS MODELOS DE
EFECTOS FIJOS WITHIN Y LOS MODELOS DE EFECTOS ALEATORIOS,
QUE PERMITEN OBTENER ESTIMADORES EFICIENTES.
SEGÚN EL MODELO, SE ADOPTAN DISTINTOS SUPUESTOS EN
CUANTO A LA RELACION ENTRE LAS COVARIABLES Y EL ERROR.
PARA ELLO PODEMOS REESCRIBIR
K
Yit = kit Xkit + Uit
k 2
COMO
yit = x'it + z'i + εit
Zi contiene un término constante y un
conjunto de características
individuales (observadas o no), todas
invariantes en tiempo
SI zi CONTIENE ÚNICAMENTE VARIABLES OBSERVADAS PARA TODOS
LOS yit, SE TRATA COMO UN TRADICIONAL MODELO DE REGRESIÓN
(ESTIMACIÓN POR MCO).
SI zi CONTIENE VARIABLES NO OBSERVADAS, CORRELACIONADAS CON
xit, MCO GENERA ESTIMADORES SESGADOS E INCONSISTENTES DE ,
EN CUYO CASO SE PLANTEA UN MODELO DE EFECTOS FIJOS
SI zi CONTIENE VARIABLES NO OBSERVADAS NO CORRELACIONADAS
CON xit, ESTE SERÁ OTRO FACTOR NO OBSERVABLE AFECTANDO A Y
PERO NO SISTEMATICAMENTE RELACIONADO CON X ABSORBIDO POR
J. RAMONI PERAZZI Tema 2.2. 13
ECONOMETRIA II
EL ERROR. EN ESTE CASO SE PLANTEA UN MODELO DE EFECTOS
ALEATORIOS.
EL QUE LOS EFECTOS SEAN FIJOS O ALEATORIOS NO ES UNA CUALIDAD
INTRINSECA DE LA ESPECIFICACION DEL MODELO SINO DE LOS DATOS:
LOS EFECTOS PUEDEN CONSIDERARSE TODOS COMO ALEATORIOS. LO
IMPORTANTE ES SI ESTAN O NO CORRELACIONADOS CON LAS
VARIABLES OBSERVADAS X.
MODELO DE EFECTOS FIJOS (ELIMINAR αi)
yit = x'it + i + εit
CUANDO SE TIENEN DEMASIADAS UNIDADES TRANSVERSALES,
UTILIZAR VARIABLES DICOTOMICAS GENERA UNA GRAN PERDIDA DE
GRADOS DE LIBERTAD. UNA MANERA DE ESTIMAR LA REGRESION ES
ELIMINANDO EL EFECTO FIJO i EXPRESANDO LOS VALORES EN TODAS
LAS VARIABLES EN DESVIACIONES CON RESPECTO DE LA MEDIA
TEMPORAL DE LOS GRUPOS O INDIVIDUOS (VALORES CORREGIDOS
POR LA MEDIA):
(yit- y i . )= (x'it - x i. ) + (i- i)+ (εit - ε i. )
CUYAS SUMAS DE CUADRADOS REPRESENTAN LAS VARIACIONES EN
TORNO A LA MEDIA DE CADA GRUPO (WITHIN GROUPS):
EL ESTIMADOR DE VIENE DADO POR:
̂ within within -1
= [ S xx ] within
S xy ̂ EF
n T n T
CON within
S xx = ( x it x i )( x it x i ) within
S xy = ( x it x i )( y it y i )
i 1t 1 i 1t 1
SUPUESTO 1: Zi NO VARIA EN EL TIEMPO
SUPUESTO 2: ESTRICTA EXOGENEIDAD CONDICIONAL DE VARIABLES
EXPLICATIVAS (ORTOGONALIDAD ENTRE X y ), CONDICION NECESARIA
PARA QUE E(it xit) = 0 . INDISPENSABLE PARA ASEGURAR LA
CONSISTENCIA DE LOS PARAMETROS.
J. RAMONI PERAZZI Tema 2.2. 14
ECONOMETRIA II
E(yit xit, zi) = xit + z'i E(it xit, zi) = 0
CON E(zi xit) = f(xi) (5)
SUPUESTO 3: Rango [E(X'MDX)]= K
PARA ELLO xit NO PUEDE CONTENER ELEMENTOS QUE NO VARÍEN EN
EL TIEMPO
SUPUESTO 4: PERTURBACIONES ESFERICAS: LOS ERRORES TIENEN
VARIANZA CONSTANTE Y NO ESTÁN SERIALMENTE CORRELACIONADOS
E(i'i´ xit , zi) = 2t
ELLO ASEGURA QUE LOS ESTIMADORES SEAN EFICIENTES
PROBAR EFECTOS FIJOS: EQUIVALE A PROBAR LA SIGNIFICANCIA
CONJUNTA DE LAS VARIABLS DICOTOMICAS O DE LOS DIFERENTES
INTERCEPTOS. EQUIVALE A UN TEST DE CHOW:
F = [(SCEr – SCEnr)/(N-1)]/[SCEnr/(NT-N-K)]
ADVERTENCIAS:
LA VARIANZA DE LA REGRESION NO ESTA APROPIADAMENTE
ESTIMADA. DE ALLI QUE LAS VARIANZAS OBTENIDAS EN LA
REGRESION WITHIN DEBERIAN AJUSTARASE, MULTIPLICANO LA
MATRIZ DE VARIANZAS-COVARIANZAS POR (NT-K)/(N(T-1)-K).
PARA OBTENER ESTIMACIONES ROBUSTAS DE LOS ERRORES
ESTANDAR, ARELLANO (1987) PROPONE UNA TRANSFORMACION
TIPO WHITE DE LA MATRIX DE VARIANZAS Y COVARIANZAS.
. xtreg cost q pf lf, fe
Fixed-effects (within) regression Number of obs = 90
Group variable: i Number of groups = 6
R-sq: within = 0.9294 Obs per group: min = 15
between = 0.9929 avg = 15.0
overall = 0.9112 max = 15
i
F(3,81) = 355.25
J. RAMONI PERAZZI Tema 2.2. 15
ECONOMETRIA II
corr(u_i, Xb) = -0.9045 Prob > F = 0.0000
------------------------------------------------------------------------------
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 3319023 171354.1 19.37 0.000 2978083 3659964
pf | .7730708 .097319 7.94 0.000 .5794365 .9667052
lf | -3797368 613773.1 -6.19 0.000 -5018584 -2576152
_cons | 1077303 310799.2 3.47 0.001 458910 1695696
-------------+----------------------------------------------------------------
sigma_u | 748483.04
sigma_e | 210422.77
rho | .92675367 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(5, 81) = 14.60 Prob > F = 0.0000
DESVENTAJAS: AL TRABAJAR LAS VARIABLES EN DIFERENCIA, SE
ELIMINA EL EFECTO DE LARGO PLAZO.
NO PUEDE ESTIMARSE EL EFECTO DE VARIABLES
QUE NO VARIEN EN EL TIEMPO TALES COMO RAZA,
SEXO, EDUCACION, AFILIACION A SINDICATOS,
RELIGION, ETC.
EJEMPLO COMPARATIVO: ESTIMAR EFECTO DE SINDICATO EN LOS
SALARIOS. LAS ÚNICAS VARIABLES QUE CAMBIAN EN EL TIEMPO SON
EXPERIENCIA (EXPER), ESTADO CIVIL (MARRIED) Y SINDICATO (UNION)
DECLARACION DE VARIBLES:
. tsset nr year
panel variable: nr (strongly balanced)
time variable: year, 1980 to 1987
delta: 1 unit (periodo entre observaciones)
ALTERNATIVAMENTE:
. tis year
. iis nr
MCRL:
. xi: reg lwage educ [Link] exper expersq union married
Source | SS df MS Number of obs = 4360
-------------+------------------------------ F( 7, 4352) = 142.61
Model | 230.719748 7 32.9599641 Prob > F = 0.0000
Residual | 1005.80987 4352 .231114401 R-squared = 0.1866
-------------+------------------------------ Adj R-squared = 0.1853
Total | 1236.52962 4359 .283672774 Root MSE = .48074
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
J. RAMONI PERAZZI Tema 2.2. 16
ECONOMETRIA II
-------------+----------------------------------------------------------------
educ | .0993878 .0046776 21.25 0.000 .0902173 .1085583
_Irace_2 | -.1438417 .0235595 -6.11 0.000 -.1900303 -.0976531
_Irace_3 | .015698 .0208112 0.75 0.451 -.0251026 .0564985
exper | .0891791 .010111 8.82 0.000 .0693563 .1090019
expersq | -.0028487 .0007074 -4.03 0.000 -.0042354 -.0014619
union | .1800725 .0171205 10.52 0.000 .1465076 .2136375
married | .1076656 .0156965 6.86 0.000 .0768925 .1384387
_cons | -.0347056 .064569 -0.54 0.591 -.1612937 .0918825
------------------------------------------------------------------------------
MEF WITHIN
. xtreg lwage educ black hisp exper expersq married union, fe
Fixed-effects (within) regression Number of obs = 4360
Group variable (i): nr Number of groups = 545
R-sq: within = 0.1780 Obs per group: min = 8
between = 0.0005 avg = 8.0
overall = 0.0638 max = 8
F(4,3811) = 206.38
corr(u_i, Xb) = -0.1139 Prob > F = 0.0000
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | (dropped)
black | (dropped)
hisp | (dropped)
exper | .1168467 .0084197 13.88 0.000 .1003392 .1333542
expersq | -.0043009 .0006053 -7.11 0.000 -.0054876 -.0031142
married | .0453033 .0183097 2.47 0.013 .0094056 .081201
union | .0820871 .0192907 4.26 0.000 .044266 .1199083
_cons | 1.06488 .0266607 39.94 0.000 1.012609 1.11715
-------------+----------------------------------------------------------------
sigma_u | .40005389
sigma_e | .35125535
rho | .56467848 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(544, 3811) = 7.98 Prob > F = 0.0000
EL METODO DE EFECTOS FIJOS EXCLUYE LAS VARIABLES
INVARIANTES EN EL TIEMPO.
EL TAMAÑO DE RHO SUGIERE CUANTO DE LA VARIABILIDAD DE LOS
SUELDOS ES DEBIDA A DIFERENCIAS ENTRE LOS INDIVIDUOS.
A MAYOR RHO, MAYOR PERTINENCIA DE LOS EFECTOS FIJOS Y MAYOR
DIFERENCIA CON LOS RESULTADOS DE MCO.
EL F AL FINAL DE LA REGRESION INDICA QUE EXISTEN DIFERENCIAS
INDIVIDUALES SIGNIFICATIVAS. ELLO SUGIERE QUE UN MODELO DE
MCO TRADICIONAL NO SERIA APROPIADO. TAMPOCO ES POSIBLE UN
MEF DE VARIABLES DICOTOMICAS DADA LA CANTIDAD DE INDIVIDUOS
EN LA MUESTRA.
J. RAMONI PERAZZI Tema 2.2. 17
ECONOMETRIA II
VIOLACION DE SUPUESTOS DE HETEROSCEDASTICIDAD:
PRUEBA
xttest3 calculates a modified Wald statistic for groupwise heteroskedasticity
in the residuals of a fixed effect regression model, following Greene
(2000, p. 598). xttest3 tests the hypothesis that sigma^2(i)==sigma for i=1,N_g,
where N_g is the number of cross-sectional units. The resulting test statistic is
distributed Chi-squared(N_g) under the null hypothesis of homoskedasticity.
. xttest3 (CASO MEFW CON AVIONES)
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (6) = 47.01
Prob>chi2 = 0.0000 RES HETEROSCEDASTICOS
. xttest3 (CASO MEFW CON SALARIOS)
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (545) = 2.2e+05
Prob>chi2 = 0.0000 RES HETEROSCEDASTICOS
SOLUCION:
REGRESIONES ROBUSTAS
MINIMOS CUADRADOS GENERALIZADOS
. xtreg cost q pf lf, fe robust
Fixed-effects (within) regression Number of obs = 90
Group variable: i Number of groups = 6
R-sq: within = 0.9294 Obs per group: min = 15
between = 0.9929 avg = 15.0
overall = 0.9112 max = 15
F(3,5) = 2717.15
corr(u_i, Xb) = -0.9045 Prob > F = 0.0000
(Std. Err. adjusted for 6 clusters in i)
------------------------------------------------------------------------------
| Robust
cost | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
J. RAMONI PERAZZI Tema 2.2. 18
ECONOMETRIA II
q | 3319023 176338.8 18.82 0.000 2865730 3772317
pf | .7730708 .2957113 2.61 0.047 .0129209 1.533221
lf | -3797368 1800950 -2.11 0.089 -8426857 832121
_cons | 1077303 875888 1.23 0.273 -1174239 3328845
-------------+----------------------------------------------------------------
sigma_u | 748483.04
sigma_e | 210422.77
rho | .92675367 (fraction of variance due to u_i)
------------------------------------------------------------------------------
xtreg lwage educ black hisp exper expersq married union, fe robust
Fixed-effects (within) regression Number of obs = 4360
Group variable (i): nr Number of groups = 545
R-sq: within = 0.1780 Obs per group: min = 8
between = 0.0005 avg = 8.0
overall = 0.0638 max = 8
F(4,3811) = 164.17
corr(u_i, Xb) = -0.1139 Prob > F = 0.0000
------------------------------------------------------------------------------
| Robust
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | (dropped)
black | (dropped)
hisp | (dropped)
exper | .1168467 .0091362 12.79 0.000 .0989344 .134759
expersq | -.0043009 .0005989 -7.18 0.000 -.005475 -.0031268
married | .0453033 .0181259 2.50 0.012 .0097659 .0808408
union | .0820871 .0194956 4.21 0.000 .0438642 .12031
_cons | 1.06488 .0319433 33.34 0.000 1.002252 1.127507
-------------+----------------------------------------------------------------
sigma_u | .40005389
sigma_e | .35125535
rho | .56467848 (fraction of variance due to u_i)
------------------------------------------------------------------------------
MODELO DE EFECTOS ALEATORIOS (αi ES ALEATORIA)
MODELO GENERAL: yit = X'it + Z'i + it
HASTA AHORA HEMOS INTENTADO ELIMINAR Z' i PUES SE
CONSIDERABA QUE Zi ESTABA CORRELACIONADA CON Xit.
SI LA HETEROGENEIDAD INDIVIDUAL SE ASUME NO CORRELACIONADA
CON LAS VARIABLES INCLUIDAS EN X, SE TIENE UN MODELO DE
EFECTOS ALEATORIOS
J. RAMONI PERAZZI Tema 2.2. 19
ECONOMETRIA II
yit = X'it + ( + αi )+ it = X'it + Uit
PERTURBACIONES
COMPUESTAS
αi ES UN TERMINO ALEATORIO INDIVIDUAL (GRUPAL) SIMILAR A it PERO
INVARIANTE EN EL TIEMPO.
EN EL MODELO DE EF, i SE ASUME COMO UN CONJUNTO DE N
COEFICIENTES ADICIONALES QUE PUEDEN ESTIMARSE
CONJUNTAMENTE CON . EN EL MODELO DE EA SE SUPONE QUE i ES
UNA VARIABLE ALEATORIA INOBSERVABLE INDEPENDIENTE DE X it Y QUE
POR TANTO FORMA PARTE DEL TERMINO DE PERTURBACION
COMPUESTO.
Uit = αi + it
CON E[Ui] = E[it] = 0 Y
E[Xit,Ui] = E[Xit,it] =0, LO QUE PERMITE ESTIMADORES CONSISTENTES
PUESTO QUE E[Xit,it] =0
ASI, αi IID(0, 2α) Y it IID(0, 2)
ESTE TIPO DE MODELOS ES ADECUADO CUANDO SE TRABAJA CON
MUESTRAS ALEATORIAS DE INDIVIDUOS PROVENIENTES DE
POBLACIONES GRANDES.
COMPARACIÓN CON OTROS MODELOS:
AL IGUAL QUE EN EL MODELO DE REGRESION TRADICIONAL
(POOLED MCO), EL EFECTO INDIVIDUAL ES ABSORBIDO POR EL
TERMINO DE ERROR
yit = X'it + + it
PERO EL MODELO DE EFECTOS ALEATORIOS REQUIERE SUPUESTOS
ADICIONALES: ORTOGONALIDAD ENTRE Xit y αi.
A DIFERENCIA DE LO QUE OCURRE EN LOS MODELOS DE EFECTOS
FIJOS, EN EL MODELO DE EFECTOS ALEATORIOS EL EFECTO
INDIVIDUAL SE ASUME NO CORRELACIONADO CON LOS
REGRESORES, POR LO QUE EL MISMO SE PUEDE MODELAR COMO
DISTRIBUIDO ALEATORIAMENTE ENTRE UNIDADES EN EL ESPACIO.
J. RAMONI PERAZZI Tema 2.2. 20
ECONOMETRIA II
EN EL MODELO DE EFECTOS ALEATORIOS PUEDE VERSE COMO UN
MODELO CON UN TERMINO CONSTANTE ALEATORIO.
EJEMPLOS:
A) LINEAS AEREAS
. xtreg cost q pf lf, re
Random-effects GLS regression Number of obs = 90
Group variable: i Number of groups = 6
R-sq: within = 0.9037 Obs per group: min = 15
between = 0.9934 avg = 15.0
overall = 0.9432 max = 15
Random effects u_i ~ Gaussian Wald chi2(3) = 883.50
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
cost | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q | 2288588 109493.7 20.90 0.000 2073984 2503192
pf | 1.123591 .1034406 10.86 0.000 .9208515 1.326331
lf | -3084994 725679.8 -4.25 0.000 -4507301 -1662688
_cons | 1074293 377468 2.85 0.004 334469.4 1814117
-------------+----------------------------------------------------------------
sigma_u | 107411.2
sigma_e | 210422.77
rho | .20670403 (fraction of variance due to u_i)
Efecto individual: predict ui, u
-270615
-87061.32
-21338.4
187142.
134488.
57383.02
B) SINDICATO Y SALARIOS
. xtreg lwage educ black hisp exper expersq married union, re
Random-effects GLS regression Number of obs = 4360
Group variable (i): nr Number of groups = 545
R-sq: within = 0.1774 Obs per group: min = 8
between = 0.1837 avg = 8.0
overall = 0.1808 max = 8
J. RAMONI PERAZZI Tema 2.2. 21
ECONOMETRIA II
Random effects u_i ~ Gaussian Wald chi2(7) = 943.95
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
lwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .1012246 .0089133 11.36 0.000 .0837549 .1186943
black | -.1441307 .0476148 -3.03 0.002 -.237454 -.0508073
hisp | .0201511 .0426011 0.47 0.636 -.0633456 .1036477
exper | .1121195 .0082609 13.57 0.000 .0959285 .1283105
expersq | -.0040689 .0005918 -6.88 0.000 -.0052288 -.0029089
married | .0627951 .0167729 3.74 0.000 .0299209 .0956693
union | .1073788 .01783 6.02 0.000 .0724327 .142325
_cons | -.1074642 .1107057 -0.97 0.332 -.3244434 .109515
-------------+----------------------------------------------------------------
sigma_u | .32456727
sigma_e | .35125535
rho | .46057171 (fraction of variance due to u_i)
AL ESTIMAR EL MODELO DE EFECTOS ALEATORIOS, SE OBSERVAN
RESULTADOS SIMILARES A LOS OBTENIDOS EN MCO PARA LAS
VARIABLES INVARIANTES EN EL TIEMPO (EDUCACION Y RAZA). LOS
EFECTOS DE LAS RESTANTES VARIABLES SE MODIFICAN
SUSTANCIALMENTE.
Efecto individual: predict ui,u
-.4084367
-.1407283
.2387462
.1391532
………
TEST DE ESPECIFICACION DE HAUSMAN (EF VS. EA): HAUSMAN (1978)
PRUEBA ORTOGONALIDAD DE LOS EFECTOS ALEATORIOS
H0 : CORR[Zi, Xit]= 0 ESTIMADORES MCO DEL MODELO DE
EFECTOS FIJOS Y LOS MCG SON CONSISTENTES, PERO LOS PRIMEROS
SON INEFICIENTES. COEFICIENTES EA = EF
UTILICE EFECTOS ALEATORIOS
H1: CORR[Zi, Xit] 0 ESTIMADORES MCO DEL MODELO DE
EFECTOS FIJOS SON CONSISTENTES, PERO LOS MCG NO.
COEFICIENTES EA EF
J. RAMONI PERAZZI Tema 2.2. 22
ECONOMETRIA II
UTILICE EFECTOS FIJOS
H = [ ˆ EF ˆ EA ] -1 [ ˆ EF ˆ EA ] 2K-1
PARA = VAR [ ˆ EF ˆ EA ] = VAR [ ˆ EF ] - VAR [ ˆ EA ]
.estimates store random
.estimates store fixed
.hausman fixed random
---- Coefficients ----
| (b) (B) (b-B) sqrt(diag(V_b-V_B))
| fixed random Difference S.E.
-------------+----------------------------------------------------------------
exper | .1168467 .1121195 .0047272 .0016276
expersq | -.0043009 -.0040689 -.000232 .0001269
married | .0453033 .0627951 -.0174918 .0073427
union | .0820871 .1073788 -.0252917 .0073636
------------------------------------------------------------------------------
b = consistent under Ho and Ha; obtained from xtreg (EF)
B = inconsistent under Ha, efficient under Ho; obtained from xtreg (EA)
Test: Ho: difference in coefficients not systematic
chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 31.45
Prob>chi2 = 0.0000
DECISION: SE RECHAZA Ho. APLICAR EFECTOS FIJOS
VARIABLES INSTRUMENTALES EN MODELOS DE EFECTOS
ALEATORIOS:
RECORDEMOS QUE EN EF SE ASUME QUE x it NO CONTIENE ELEMENTOS
QUE NO VARÍEN EN EL TIEMPO (CONDICION DE RANGO COMPLETO). LAS
CARACTERISTICAS DE ESTE TIPO SON ABSORBIDAS POR EL EFECTO
FIJO O INDIVIDUAL.
MODELO DE EA ASUME CORR[Zi, Xit]= 0 (DEBILIDAD) PERO PERMITE QUE
EL MODELO CONTENGA CARACTERISTICAS INVARIANTES EN EL TIEMPO.
J. RAMONI PERAZZI Tema 2.2. 23
ECONOMETRIA II
HAUSMAN Y TAYLOR (1981) PROPONEN UN METODO PARA
SOBREPONERSE AL PRIMER INCONVENIENTE, TOMANDO VENTAJA DEL
SEGUNDO.
SEA yit = X1'it 1 + X2'it 2 + Z1'i 1 + Z2'i 2 + ui + it
X1it : K1 VARIABLES QUE VARIAN EN t NO CORRELACIONADAS CON ui
X2it : K2 VARIABLES QUE VARIAN EN t CORRELACIONADAS CON u i
Z1i : L1 VARIABLES QUE NO VARIAN EN t NO CORRELACIONADAS CON ui
Z2i : L2 VARIABLES QUE NO VARIAN EN t CORRELACIONADAS CON ui
J. RAMONI PERAZZI Tema 2.2. 24
ECONOMETRIA II