23 de Abril de 2019 Ejercicio de Datos
de Panel
Econometría III
Anahí Ramirez
Universidad de Cuenca
Facultad de Ciencias Económicas y Administrativas
Econometría III
Ejercicios de Ecuaciones Simultáneas
Profesor:
Dr. Moisés Obaco
Fecha:
Martes, 23 de Abril del 2019.
Estudiante:
Anahí Ramírez Zambrano
Ciclo
Marzo 2019 – Agosto 2019
Datos de Panel
El objetivo de este ejercicio tiene el objetivo de poner en práctica las habilidades de datos
de panel en el estudiante. El archivo excel con el mismo nombre de este documento
“ejercicio_1_panel”, consta de una tabla de datos relativos a la producción en millones
de kilovatios hora (y) y los costes de producción (coste) en millones de dólares
(combustible, trabajo, y coste de capital) para 6 empresas durante 4 años.
Con esta información trate de explicar los costes totales de producción en función de la
producción (ambas en logaritmos), a través de datos de panel de las 6 empresas. Indicar
que modelo de datos de panel es el más indicado para el análisis. También puede usar
algo de estadística descriptiva en formato de datos de panel para entender
preliminarmente los datos.
1. Descripción de los datos y las variables:
storage display value
variable name type format label variable label
id long %10.0g id
year int %10.0g year
coste long %10.0g coste
Y int %10.0g Y
lncoste float %9.0g
lny float %9.0g
En la tabla anterior se muestran las variables, y el tipo de cada variable, cabe recalcar que
las variables lncoste y lny fueron generadas por la autora del presente trabajo.
Variable Obs Mean Std. Dev. Min Max
lncoste 24 9.727803 1.093806 8.056427 11.50132
lny 24 8.309351 1.36148 5.365976 10.34039
Como se puede observar se tienen 24 observaciones en total (esto porque se tienen 6
empresas en 4 años distintos, lo cual da las 24 observaciones), el logaritmo natural del
coste tiene una media de 9,73 y el logaritmo natural de la producción de 8,31; la
desviación estándar es mayor para el logaritmo de la producción, lo cual quiere decir que
los datos de la producción están un poco más dispersos que los de los costes para las 6
empresas.
Econometría III – Dr. Moisés Obaco Página 2
Datos de Panel
2. Descripción del panel:
Comando xtset
panel variable: id (strongly balanced)
time variable: year, 1955 to 1970, but with gaps
delta: 1 unit
Como se puede observar, el panel se encuentra fuertemente balanceado (Strongly
Balanced), lo cual implica balanceamiento perfecto, delta indica que los años varían en
una unidad (sin embargo esto no es correcto, pues varían en 5 unidades).
Comando xtdes
id: 1, 2, ..., 6 n = 6
year: id: 1,
1955, 1960, ..., 1970 2, ..., 6 T = 4 n =
Delta(year)year: 1955, 1960, ..., 1970
= 1 unit T =
Delta(year) = 1 unit
Span(year) = 16 periods
(id*year uniquely Span(year) = 16 observation)
identifies each periods
(id*year uniquely identifies each observation)
Distribution of T_i: min 5% 25% 50% 75% 95% max
Distribution
4 of 4T_i: min
4 5%4 25% 4 50%4 75%
4 95%
4 4 4 4 4 4
Freq. Percent Cum. Pattern*
Freq. Percent Cum. Pattern*
6 100.00 100.00 1111
6 100.00 100.00 1111
6 100.00 XXXX
6 100.00 XXXX
*Each column represents 5 periods.
*Each column represents 5 periods.
En las tres tablas anteriores se muestra la estructura de los datos ya luego de hacerlos
panel, nuevamente delta indica un cambio de una unidad, pero el cambio es de 5, al ser
un panel perfecto, a todos los porcentajes se observan 4 veces los datos, lo cual es raro
porque normalmente los paneles perfectos se presentan cuando se tienen países más que
con empresas o individuos.
Comando xt sum
Variable Mean Std. Dev. Min Max Observations
lncoste overall 9.727803 1.093806 8.056427 11.50132 N = 24
between .9976559 8.380096 10.89843 n = 6
within .5752545 8.367962 11.27992 T = 4
lny overall 8.309351 1.36148 5.365976 10.34039 N = 24
between 1.387026 6.178255 9.894854 n = 6
within .4251139 7.497072 9.063544 T = 4
Econometría III – Dr. Moisés Obaco Página 3
Datos de Panel
La principal diferencia de esta tabla con la presentada en la descripción de los datos es
que aquí podemos observar no solo la descripción de todos los datos, sino también las
diferencias entre grupos (between) y entre individuos (within), la desviación entre grupos
es mayor para el caso del logaritmo de la producción, mientras que entre individuos, la
desviación es mayor para el logaritmo del coste
En el presente gráfico se puede observar el logaritmo de producción de las seis empresas
y los años para los cuales se cuenta con los datos, observando que la empresa que mayor
producción tiene es la empresa 6, y la que menor tiene es la número 1.
10
9
8
lny
7
6
5
1955 1960 1965 1970
year
id = 1 id = 2
id = 3 id = 4
id = 5 id = 6
Econometría III – Dr. Moisés Obaco Página 4
Datos de Panel
Gráfico para observar la heterogeneidad de los datos entre empresas:
Panel de empresas
10
9
8
7
6
5
Empresa 1 Empresa 2 Empresa 3 Empresa 4 Empresa 5 Empresa 6
Empresas
valor lny empresa valor lny medio por empresa
Nota: heterogeneidad entre empresas
En el caso de la heterogeneidad de los datos por empresa, las que presentan mayor
heterogeneidad son la empresa 1, 2, 3 y 6.
Gráfico para observar la heterogeneidad de los datos entre los años:
Panel de empresas
12
11
10
9
8
1955 1960 1965 1970
Empresas
valor lncoste del año valor lncoste medio por año
Nota: heterogeneidad entre años
Econometría III – Dr. Moisés Obaco Página 5
Datos de Panel
En el caso de la heterogeneidad de los datos por años, los años en los que se ve mayor
dispersión son 1960, 1965 y 1970.
3. MCO sin Efectos Fijos:
Panel de empresas
MCO
12
6
4
11
54
4
55
435
3
10
3 6
6
2
2
9
6
2 1
1 1
2 3
1
8
5 6 7 8 9 10
lny
lncoste Fitted values
Nota: regresión simple
MCO por efectos fijos tiene un mal ajuste en el caso de la empresa 6 y para un valor de
la empresa 3, para los demás parece ser que la regresión si se ajusta al modelo.
Econometría III – Dr. Moisés Obaco Página 6
Datos de Panel
4. MCO con Efectos Fijos:
Panel de empresas
LSDV
11
10
9
8
5 6 7 8 9 10
lny
lncostehat, id == 1 lncostehat, id == 2
lncostehat, id == 3 lncostehat, id == 4
lncostehat, id == 5 lncostehat, id == 6
Fitted values
MCO con efectos fijos individuales
Lo mismo para este caso, tanto la empresa 4, como la 5 y 6 no se ajustan muy bien a la
regresión.
5. Comparación de las dos regresiones anteriores y MCO con efectos fijos sin
mostrar los efectos individuales (comando AREG):
Variable FE MCO AREG
lny .23670971 .23670971 .23670971
_Iid_2 .19305537
_Iid_3 .73242127
_Iid_4 1.8305141
_Iid_5 1.6141979
_Iid_6 .68934539
_cons 7.7608983* 6.9176427** 7.7608983*
N 24 24 24
legend: * p<0.05; ** p<0.01; *** p<0.001
Econometría III – Dr. Moisés Obaco Página 7
Datos de Panel
Como podemos ver el coeficiente que acompaña a la variable logaritmo natural de la
producción no es significativo para ninguno de los tres modelos, en cuanto a la constante,
se muestra que una estimación más consistente es la presentada en el modelo con efectos
fijos y con efectos fijos sin los efectos individuales, claro que es significativa solo a un
nivel del 5% en ambos casos.
6. Comparación entre efectos fijos y aleatorios:
Efectos Fijos:
Fixed-effects (within) regression Number of obs = 24
Group variable: id Number of groups = 6
R-sq: Obs per group:
within = 0.0306 min = 4
between = 0.7186 avg = 4.0
overall = 0.5094 max = 4
F(1,17) = 0.54
corr(u_i, Xb) = 0.6641 Prob > F = 0.4738
lncoste Coef. Std. Err. t P>|t| [95% Conf. Interval]
lny .2367097 .3231333 0.73 0.474 -.445042 .9184614
_cons 7.760898 2.688394 2.89 0.010 2.088883 13.43291
sigma_u .74011408
sigma_e .65879599
rho .55793385 (fraction of variance due to u_i)
F test that all u_i=0: F(5, 17) = 2.82 Prob > F = 0.0493
Efectos Aleatorios:
Random-effects GLS regression Number of obs = 24
Group variable: id Number of groups = 6
R-sq: Obs per group:
within = 0.0306 min = 4
between = 0.7186 avg = 4.0
overall = 0.5094 max = 4
Wald chi2(1) = 9.77
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0018
lncoste Coef. Std. Err. z P>|z| [95% Conf. Interval]
lny .5133292 .1642335 3.13 0.002 .1914375 .8352209
_cons 5.46237 1.385875 3.94 0.000 2.746106 8.178635
sigma_u .49149837
sigma_e .65879599
rho .35757371 (fraction of variance due to u_i)
Econometría III – Dr. Moisés Obaco Página 8
Datos de Panel
En cuanto a la comparación entre efectos fijos y aleatorios, los coeficientes varían en una
estimación de la otra, y la desviación estándar menor es la presentada con efectos
aleatorios.
7. Test de Haussman:
Coefficients
(b) (B) (b-B) sqrt(diag(V_b-V_B))
fixed random Difference S.E.
lny .2367097 .5133292 -.2766195 .2782849
b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test: Ho: difference in coefficients not systematic
chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 0.99
Prob>chi2 = 0.3202
Como la probabilidad es mayor a 0,05 se recomienda el uso de los efectos aleatorios.
Econometría III – Dr. Moisés Obaco Página 9