Guía de Datos de Panel en Eviews
Guía de Datos de Panel en Eviews
net/publication/328812382
CITATIONS READS
10 12,141
2 authors, including:
Alfredo Baronio
Universidad Nacional de Río Cuarto y Universidad Siglo 21
37 PUBLICATIONS 27 CITATIONS
SEE PROFILE
All content following this page was uploaded by Alfredo Baronio on 08 November 2018.
1
Contenido
INTRODUCCIÓN.................................................................................................................................. 3
2
Introducción
En el análisis de la información (económica, social, empresarial, comercial, etc.)
pueden existir diferentes dimensiones sobre las cuales interesa obtener conclusiones
derivadas de la estimación de modelos que traten de extraer relaciones de causalidad
o de comportamiento entre diferentes tipos de variables, a partir de los datos
disponibles.
Una de estas dimensiones la constituye el análisis de series de tiempo, la cual
incorpora información de variables y/o unidades individuales de estudio durante un
período determinado de tiempo (dimensión temporal). En este caso, cada período de
tiempo constituye el elemento poblacional y/o muestral. Ejemplo de este tipo de datos
lo constituyen las series del PIB y de tasas de interés de un país o el número de
llamadas telefónicas de una familia a lo largo de un período determinado de tiempo.
Especificación de la relación:
⋯ ; con 1, … ,
Tabla de datos:
. ⋯
Supuestos a verificar:
Sobre la perturbación aleatoria
• Media nula
• Homocedasticidad
• No autocorrelación
• Normalidad
3
Sobre la parte sistemática de la relación
• Linealidad
• No multicolinealidad
• Regresores no estocásticos
Existe otra dimensión que no incorpora el aspecto temporal sino que más bien
representa el análisis de la información para las unidades individuales de estudio, en
un momento determinado del tiempo (dimensión estructural). En este tipo de análisis,
el cual se denomina de corte transversal, el elemento o unidad muestral no lo
constituye el tiempo sino las unidades de análisis. Ejemplos de este tipo de análisis
pueden ser la cantidad demandada de alimentos por una muestra de familias durante
un período de tiempo, o la cantidad producida de televisores por una serie de
empresas en el mismo lapso. En ambos casos los elementos muestrales son la familia y
la empresa.
Especificación de la relación:
⋯ ; con 1, … ,
Tabla de datos:
. ⋯
Supuestos a verificar:
Sobre la perturbación aleatoria
• Media nula
• Homocedasticidad
• Normalidad
4
Sobre la parte sistemática de la relación
• Linealidad
• No multicolinealidad
• Regresores no estocáticos
5
grandes cambios. Esta modalidad de analizar la información en un modelo de panel es
muy usual en estudios de naturaleza microeconómica.
La aplicación de esta metodología permite analizar dos aspectos de suma importancia
cuando se trabaja con este tipo de información y que forman parte de la
heterogeneidad no observable: i) los efectos individuales específicos y ii) los efectos
temporales.
En lo que se refiere a los efectos individuales específicos, se dice que estos son
aquellos que afectan de manera desigual a cada uno de los agentes de estudio
contenidos en la muestra (individuos, empresas, países) los cuales son invariables en el
tiempo y que afectan de manera directa las decisiones que tomen dichas unidades.
Usualmente se identifica este tipo de efectos con cuestiones de capacidad empresarial,
eficiencia operativa, capitalización de la experiencia, acceso a la tecnología, etc.
Los efectos temporales son aquellos que afectan por igual a todas las unidades
individuales del estudio. Este tipo de efectos pueden asociarse, por ejemplo, a los
shocks macroeconómicos que pueden afectar por igual a todas las empresas o
unidades de estudio.
⋯ ; con 1, … , 1, … , 1
A partir de este modelo general, y con base en ciertos supuestos y restricciones acerca
del valor de algunos de los parámetros, se pueden derivar algunas otras variantes de
modelos de datos de panel, las cuales se describirán con más detalle en una sección
posterior.
6
Tabla de datos:
í ⋯
1
2
⋮
1
2
⋮
1
2
⋮
1
2
⋮
7
2
representa los efectos no observables que difieren entre las unidades de estudio
pero no en el tiempo, que generalmente se los asocia a la tecnología incorporada.
se le identifica con efectos no cuantificables que varían en el tiempo pero no entre
las unidades de estudio.
se refiere al término de error puramente aleatorio.
La mayoría de las aplicaciones con datos de panel utilizan el modelo de componente
de error conocido como “one way” para el cual 0. Este tipo de análisis supone
que no existen efectos no cuantificables que varíen en el tiempo pero no entre las
unidades individuales de estudio. Existe además el modelo “two‐way” en el cual el
componente de error 0 , a través del cual se pretende capturar efectos
temporales específicos (choques) que no están incluidos en la regresión.
Las diferentes variantes para el modelo “one way” de componentes de errores surgen
de los distintos supuestos que se hacen acerca del término . Pueden presentarse tres
posibilidades:
El caso más sencillo es el que considera al 0, o sea, no existe heterogeneidad
no observable entre los individuos o firmas. Dado lo anterior, los satisfacen todos
los supuestos del modelo lineal general, por lo cual el método de estimación de
mínimos cuadrados clásicos produce los mejores estimadores lineales e insesgados.
La segunda posibilidad consiste en suponer a un efecto fijo y distinto para cada
unidad de corte transversal. En este caso, la heterogeneidad no observable se
incorpora a la constante del modelo.
La tercera alternativa es tratar a como una variable aleatoria no observable que
varía entre individuos pero no en el tiempo.
8
Los datos en panel suponen e incorporan, en el análisis, el hecho de que los
individuos, firmas, bancos o países son heterogéneos. Los análisis de series de tiempo
y de corte transversal no tratan de controlar esta heterogeneidad corriendo el riesgo
de obtener resultados sesgados.
Permite estudiar de una mejor manera la dinámica de los procesos de ajuste. Esto
es fundamentalmente cierto en estudios sobre el grado de duración y permanencia de
ciertos niveles de condición económica (desempleo, pobreza, riqueza).
Permite elaborar y probar modelos relativamente complejos de comportamiento
en comparación con los análisis de series de tiempo y de corte transversal. Un ejemplo
claro de este tipo de modelos, son los que se refieren a los que tratan de medir niveles
de eficiencia técnica por parte de unidades económicas individuales (empresas,
bancos, etc.).
Desventajas:
En términos generales, las desventajas asociadas a la técnica de datos de panel se
relacionan con los procesos para la obtención y el procesamiento de la información
estadística sobre las unidades individuales de estudio, cuando esta se obtiene por
medio de encuestas, entrevistas o utilizando algún otro medio de relevamiento de los
datos. Ejemplos de este tipo de limitaciones son: cobertura de la población de interés,
porcentajes de respuesta, preguntas confusas, distorsión deliberada de las respuestas,
etc.
9
cambios con variables dummy; el otro modelo es el de efectos aleatorios, que trata de
capturar estas diferencias a través del componente aleatorio del modelo.
Como ya se mencionó, la técnica de datos de panel permite contemplar la existencia
de efectos individuales específicos a cada unidad de corte transversal, invariables en el
tiempo que afectan la manera en que cada unidad de corte transversal toma sus
decisiones.
Una forma simple, y de hecho la más utilizada, de considerar esta heterogeneidad es
empleando los modelos de intercepto variable. Así, el modelo lineal es el mismo para
todas las unidades o individuos bajo estudio, pero la ordenada al origen es específica a
cada una de ellas. A partir del modelo general esta situación se representa mediante la
siguiente ecuación:
⋯ ; con 1, … , 1, … , 3
Estos modelos de intercepto variable asumen que los efectos de las variables omitidas,
ya sean específicas a cada individuo y/o que cambian en el tiempo, no son importantes
en forma individual, pero que si son importantes si se consideran en conjunto.
Por otro lado, dado que el efecto de las variables omitidas puede mantenerse
constante en el tiempo para cada individuo, o ser el mismo para todos los individuos
en un momento en el tiempo, o una combinación de ambos, se pueden capturar en el
término constante de un modelo de regresión como un promedio que toma en cuenta
explícitamente la heterogeneidad entre individuos y/o en el tiempo contenida en los
datos (este es el procedimiento que se emplea por ejemplo al estimar una función
Cobb Douglas).
Seguidamente, se analizarán los principales modelos que se estudian a partir de la
especificación general y de acuerdo con la forma de incorporar la heterogeneidad no
observada.
10
Modelo de efectos fijos
Como se indicó brevemente, una posibilidad es explicar los datos con el modelo de
efectos fijos el cual considera que existe un término constante diferente para cada
individuo y supone que los efectos individuales son independientes entre sí.
Con este modelo se considera que las variables explicativas afectan por igual a las
unidades de corte transversal y que éstas se diferencian por características propias de
cada una de ellas, medidas por medio del intercepto. Es por ello que los interceptos
se asocian con variables dummy con coeficientes específicos para cada unidad, los
cuales se deben estimar. Para la i‐ésima unidad de corte transversal, la relación es la
siguiente:
⋯ ; con 1, … , 4
Donde el subíndice representa un vector columna de unos. Debe hacerse notar que
en este modelo se presenta una pérdida importante de grados de libertad.
⋯ ; con 1, … ,
1, … , 5
⋯ ; con 1, … , 1, … , 6
11
Donde se convierte en el nuevo término de la perturbación, no
es homocedástico, donde , , corresponden al error asociado con las series de
tiempo ( ); a la perturbación de corte transversal ( ) y el efecto aleatorio combinado
de ambas ( ).
Si se desea hacer inferencias con respecto a la población, es decir que se trabaja con
una muestra aleatoria, lo mejor es utilizar una especificación del tipo aleatoria. En caso
de que el interés sea limitado a una muestra que se ha seleccionado a conveniencia o
bien que se está trabajando con la población, la estimación de efectos fijos será la
correcta.
Adicionalmente, si el interés del estudio particular está puesto en los coeficientes de
las pendientes de los parámetros, y no tanto en las diferencias individuales, se debería
elegir un método que relegue estas diferencias y tratar la heterogeneidad no
observable como aleatoria.
El modelo de efectos fijos se ve como un caso en que el investigador hace inferencia
condicionada a los efectos que ve en la muestra. El de efectos aleatorios se ve como
uno en el cual el investigador hace inferencia condicional o marginal respecto a una
población.
Se deja al investigador que decida si hace inferencia con respecto a las características
de una población o solo respecto a los efectos que están en la muestra.
b) El contexto de los datos, es decir, cómo fueron obtenidos y el entorno de
donde provienen
12
casos debe hacerse el uso más eficiente de la información para estimar esa parte de la
relación de comportamiento contenida en las variables que difieren sustancialmente
de un individuo a otro.
APLICACIÓN
UNA FUNCIÓN DE PRODUCCIÓN PARA PAÍSES DEL MERCOSUR CON
SOFTWARE E‐VIEWS 6.0
La siguiente tabla de datos contiene la producción en toneladas de productos agrícolas
(AGRIPRO), el capital asignado a la producción en unidades físicas (AGRICAP), el personal
ocupado en número de personas (AGRITRAB) y la tierra utilizada para la producción en has
sembradas (AGRITIERRA), para 4 países del Mercosur durante 20 años (1990 – 2009).
Con esta información se trata de explicar la producción en función de los factores capital,
trabajo y tierra (todas las variables en logaritmos) a partir del panel de datos de los cuatro
países (1. Argentina, 2. Brasil, 3 Paraguay, 4. Uruguay). A través de especificar distintos
modelos se trata de encontrar el ajuste más adecuado para este conjunto de países en el
periodo de tiempo considerado.
SOLUCIÓN
Se especifica el modelo de datos de panel siguiente:
; 1, … ,4 1990, … ,2009
13
Años País AGRIPRO AGRICAP AGRITIERRA AGRITRAB
14
Continuación
1994 Uruguay 1863 90198 12144 622
1995 Uruguay 1745 92391 12269 642
1996 Uruguay 2433 91075 12395 756
1997 Uruguay 2162 92786 12523 716
1998 Uruguay 2779 94262 12667 711
1999 Uruguay 1966 97548 12798 557
2000 Uruguay 2226 101006 12651 530
2001 Uruguay 1819 100209 12611 623
2002 Uruguay 2132 99972 12695 705
2003 Uruguay 2875 99175 12876 845
2004 Uruguay 3272 98135 13422 979
2005 Uruguay 3128 97393 13599 841
2006 Uruguay 3658 96651 13744 973
2007 Uruguay 3946 95605 14309 1171
2008 Uruguay 5059 95659 14796 1561
2009 Uruguay 6194 94916 14811 1882
Para la estimación se trabaja con el software , el cual se abre haciendo doble click
en el ícono existente en el escritorio o desde Inicio‐Todos los programas‐Eviews 6‐Eviews6.
Dentro de Eviews, el primer paso es incorporar al software la tabla de datos de existente
en el archivo agrícola.xls. El formato del archivo de Excel que contiene los datos debe
corresponder a la versión 97‐2003; es necesario tomar nota de la celda donde se encuentra el
primer dato (C2), de la cantidad de columnas con variables de interés a importar (6), el tipo de
dato (anual desde 1990), la hoja en la cual está la información (Hoja 1).
En Eviews ir a File‐Open‐Foreign data as Workfile… (Figura 1), se despliega el explorador de
windows para localizar el archivo; luego se debe seleccionar el archivo agrícola.xls y Abrir. Esta
acción despliega la pantalla de lectura de la de Cálculo para convertir desde lenguaje Excel a
lenguaje Eviews (Figura 2). En esta pantalla es posible indicarle la hoja donde se encuentra la
información en el archivo Excel y observar si está leyendo las columnas que es necesario
importar. En la pantalla siguiente hay que aceptar la configuración por defecto que ofrece el
software desde el ícono Finalizar (Figura 3). El resultado es disponer de los datos en el entorno
Eviews (Figura 4); al desplazar hacia abajo la barra del lado derecho de la ventana del grupo de
datos se observa que, a continuación de los datos de Argentina, se encuentran los datos de
Brasil, Paraguay y Uruguay. En la ventana Workfile se encuentran los íconos de cada serie de
datos (las variables de análisis AGRICAP AGRIPRO, AGRITIERRA y AGRITRAB), en el encabezado
de la ventana se informa que el archivo tiene 80 observaciones que corresponden al total de 4
países en 20 años; esto indica que el archivo no tiene formato de panel.
Figura 1
Figura 2
15
Figura 3
Figura 4
Figura 6
Figura 5
Figura 7 Figura 8
Para dar formato de panel hay que trabajar en la ventana Workfile; ir a Procs‐Structure/Resize
Current Page (Figura 5), se muestra la ventana Workfile structure y al desplegar las alternativas
de Workfile structure type se selecciona Dated Panel (Figura 6); en la nueva pantalla se debe
indicar la frecuencia anual con el primer año de la serie (1990) y las variables que identifican la
16
estructura del panel: Cross section – país y Date series – tiempo (Figura 7). Estas acciones
cambian el encabezado de la ventana Workfile: Range 1990 2009 x 4 – 80 obs (Figura 8). Para
grabar este entorno de trabajo, ir a File‐Save As, seleccionar la carpeta donde guardar el
archivo y dar un nombre. Al grabar, Eviews genera sólo dos archivos con igual nombre y
distinta extensión; el archivo ejecutable es *.wf1.
La tarea de análisis comienza con las representaciones gráficas de las variables del panel
mediante → → (Figura 9) e introduciendo la variable
Log(AGRIPRO) en la pantalla (Figura 10). Al pulsar OK se obtiene la pantalla
(Figura 11); si se elige se obtiene la gráfica de
Log(AGRIPRO) para todas las secciones cruzadas (Figura 12). En la pantalla ,
al elegir (Figura 13) se obtiene un gráfico de la evolución de las medias
de la variable Log(AGRIPRO), en las distintas secciones cruzadas, con una banda de confianza
de 2 í según se ve en la Figura 14.
Figura 9
Figura 10
Figura 11 Figura 12
17
Figura 13 Figura 14
Para hacer contrastes de igualdad de medias o varianzas de Log(AGRIPRO), con doble click en
AGRIPRO aparece la serie para los distintos países (Figura 15), luego basta seleccionar
→ & → (Figura 16).
En la pantalla se elige la variable cuya igualdad de medias, medianas
o varianzas en las distintas secciones cruzadas del panel se contrasta. En la Figura 17 se ha
elegido contrastar medias y en la Figura 18 se ha elegido contrastar varianzas para
Log(AGRIPRO). Las Figuras 19 y 20 muestran los resultados, observándose que se rechaza la
igualdad de medias y la igualdad de varianzas (p‐valores menores que 0,05). Lo mismo se
puede repetir para todas las variables.
Figura 15 Figura 16
18
Figura 17 Figura 18
Figura 20
Figura 19
Una vez realizado el análisis gráfico y descriptivo de las variables del panel se procede a su
estimación considerándolo inicialmente como un panel de coeficientes constantes. Para ello
se elige → , se escribe la ecuación del modelo a ajustar en el
campo de la solapa , se elige en el
campo para ajustar por mínimos cuadrados (Figura 21), se rellena la solapa
como se indica en la Figura 22 (sin especificación de efectos ni ponderaciones)
y se hace clic en . Se obtienen los resultados de la Figura 23.
Los resultados del ajuste del panel de la Figura 23 muestran una significatividad individual y
conjunta de los coeficientes estimados muy alta y un coeficiente de determinación muy bueno.
El mayor problema es el estadístico de Durbin Watson, que es muy bajo.
19
Figura 21 Figura 22
Figura 24
Figura 23
Figura 25
Figura 26
Para probar si hay heteroscedasticiad entre secciones cruzadas, hacer doble click sobre la
variable RESID y elegir → & → (Figura
24). En la pantalla (Figura 25) se elige la variable cuya igualdad de
varianzas en las distintas secciones cruzadas del panel se contrasta RESID. La Figura 26 muestra
los resultados, observándose que se acepta la igualdad de varianzas residual en las distintas
20
secciones cruzadas (p‐valor mayor que 0,05). No existe entonces heteroscedasticidad entre
secciones cruzadas.
Figura 27
Figura 28
Ahora se prueba con el modelo general de efectos fijos. Este modelo presenta los residuos
21
Se estima el panel con efectos fijos de secciones cruzadas (efectos de país) y efectos fijos de
tiempo. Para ello se elige → , se escribe la ecuación del modelo a
ajustar en el campo de la solapa se elige
en el campo para ajustar por mínimos cuadrados (Figura 29), se
rellena la solapa como se indica en la Figura 30 (se especifican efectos fijos de
sección cruzada y de tiempo) y se hace clic en .
Se obtienen los resultados de la Figura 31, donde se ve un estadístico de Durbin Watson
razonable, buena significatividad individual y conjunta y buen .
Figura 29 Figura 30
Figura 32
Figura 31
Si se quiere ver las estimaciones de los efectos fijos, por país y por unidades de tiempo (Figura
32), basta con elegir → / → y en la Figura 33 y Figura 34, se
observan dichos efectos, respectivamente.
Para probar si los efectos fijos de los países y de tiempo pueden o no considerarse iguales se
utiliza el test de máxima verosimilitud para la redundancia de los efectos fijos, se elige
→ / →
22
Ratio. Se observan p‐valores menores que 0,05 (Figura 35), lo que lleva a afirmar
que los efectos fijos de los países y de tiempo son diferentes con un 95% de confianza.
Figura 33
Figura 34
Figura 35
Según los resultados de las Figuras 29 y 30, la ecuación del modelo de efectos fijos ajustado es
la siguiente:
15,06 0,92 ∗ Log 0,33 ∗ 0,46 ∗
0,65 ∗ 0,92 ∗ 1,69 ∗ 3,26 0,49 ∗ 0,40 ∗ ⋯ ∗ 0,37
23
Jarque Bera es superior a 0,05; lo que indica residuos normales con una confianza del 95%.
Para comprobar si los residuos son homocedásticos se procede como en la Figura 21 y 22,
comprobándose que los residuos presentan varianza constante y son homocedásticos.
A continuación estime el panel con efectos aleatorios y compruebe que el mejor ajuste de los
datos es el panel de efectos fijos de corte transversal y de tiempo. Además el panel de efectos
aleatorios no es adecuado ya que el test de Hausman,
→ /
, presenta un p‐valor menor que 0,05 lo que lleva a afirmar que la hipótesis de
que los efectos individuales están incorrelacionados con las variables explicativas debe de ser
rechazada. Por lo tanto el modelo de efectos aleatorios no es adecuado.
Se llega a la conclusión de que el mejor ajuste de panel es el que considera efectos fijos de
sección cruzada y de tiempo.
Bibliografía
Mayorga, M. y Muñoz S., E. (2000) La técnica de datos de panel, una técnica para su uso e interpretación.
Departamento de Investigaciones Económicas. BCCR. [Recuperado de
www.bccr.fi.cr/investigacioneseconomicas/metodoscuantitativos/Tecnica_datos_panel,_una_guia_para_
su_uso_e_interpretacion.pdf, noviembre 2014)
Perez Lopez, C. (2006). Problemas Resueltos de Econometría. Editorial Thomson Paraninfo.
24