ECONOMETRÍA II
SESIÓN VII: Modelos de ecuaciones simultáneas
Ciclo: Temas avanzados del análisis de regresión
Profesor: Javier Hualde
1
ÍNDICE
1. Naturaleza de los modelos de ecuaciones simultáneas
2. Sesgo de simultaneidad en MCO
3. Identificación y estimación de una ecuación estructural
4. Sistemas de más de dos ecuaciones
5. Modelos de ecuaciones simultáneas con series de tiempo
6. Modelos de ecuaciones simultáneas con datos de panel
2
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS
Como sabemos, el método de variables instrumentales puede resolver problemas de
endogeneidad derivados por ejemplo de variables omitidas o de un error de medición
En esta sesión presentaremos otra forma de endogeneidad: la simultaneidad
Se produce cuando una o más de las variables explicativas se determina conjuntamente
con la variable dependiente, generalmente a través de un mecanismo de equilibrio
Como veremos, los modelos de ecuaciones simultáneas (MES) se estiman por VI
De esta forma, solución muy similar a la de otras formas de endogeneidad, aunque la
interpretación de los MES plantea desafíos interesantes
3
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Importante: cada ecuación en el sistema debe tener una interpretación causal ceteris
paribus
Ejemplo clásico de MES: ecuación de oferta y de demanda
Ecuación de oferta de mano de obra en el sector agrícola
ℎ𝑜 = 𝛼1 𝑤 + 𝛽1 𝑧1 + 𝑢1
donde:
ℎ𝑜 : horas anuales de mano de obra ofertadas
𝑤: salario por hora promedio ofrecido a los trabajadores
𝑧1 : variable observable que afecta a la oferta de mano de obra (por ejemplo,
salario en el sector manufacturero)
4
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Se trata de una ecuación estructural: los parámetros tienen una interpretación causal
Gráfico: horas ofertadas en función de 𝑤 (para 𝑧1 y 𝑢1 constantes)
Cambios en 𝑧1 y/o 𝑢1 desplazan la función de oferta
𝑧1 : desplazador observable de la oferta
𝑢1 : desplazador inobservable de la oferta
5
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Diferencia de esta ecuación con modelos anteriores: los datos de horas y salario se
determinan mediante la interacción de la oferta y la demanda de mano de obra
Bajo el supuesto de igualdad de oferta y demanda, los valores de salarios y horas
trabajadas están en equilibrio
La ecuación de demanda de mano de obra sería
ℎ𝑑 = 𝛼2 𝑤 + 𝛽2 𝑧2 + 𝑢2
donde:
ℎ𝑑 : horas anuales de mano de obra demandadas
𝑧2 : variable observable que afecta a la demanda de mano de obra (por
ejemplo, extensión de tierra cultivable)
6
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
De nuevo, ecuación estructural que describe el comportamiento de los patrones (la
ecuación de oferta describía el comportamiento de los trabajadores)
Gráfico: horas demandadas en función de 𝑤 (para 𝑧2 y 𝑢2 constantes)
Cambios en 𝑧2 y/o 𝑢2 desplazan la función de demanda
𝑧2 : desplazador observable de la demanda
𝑢2 : desplazador inobservable de la demanda
7
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Importante: para cada demarcación i
ℎ𝑖𝑜 = ℎ𝑖𝑑 = ℎ𝑖
De esta forma, modelo de ecuaciones simultáneas
ℎ𝑖 = 𝛼1 𝑤𝑖 + 𝛽1 𝑧𝑖1 + 𝑢𝑖1 y ℎ𝑖 = 𝛼2 𝑤𝑖 + 𝛽2 𝑧𝑖2 + 𝑢𝑖2
8
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Características
Dadas 𝑧𝑖1 , 𝑧𝑖2 , 𝑢𝑖1 y 𝑢𝑖2 , estas dos ecuaciones determinan ℎ𝑖 y 𝑤𝑖 ⇒ ℎ𝑖 y
𝑤𝑖 son las variables endógenas en este MES
𝑧𝑖1 𝑦 𝑧𝑖2 se determinan fuera del modelo: variables exógenas
Asumiremos que 𝑧𝑖1 , 𝑧𝑖2 no están correlacionadas con los errores
estructurales 𝑢𝑖1 , 𝑢𝑖2
Sin incluir 𝑧𝑖1 𝑦 𝑧𝑖2 no hay forma de determinar qué ecuación es de oferta y
cuál es de demanda: si 𝑧𝑖1 𝑦 𝑧𝑖2 son iguales, problema de identificación
9
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Las ecuaciones estructurales responden a preguntas hipotéticas del tipo:
¿cuánta mano de obra proporcionarían los trabajadores si el salario fuera diferente al
de su valor de equilibrio?
Ejemplo: índice de homicidios y tamaño de la fuerza policial
Modelo:
donde murdpc: homicidios; polpc: número de policías; incpc: renta (valores per cápita)
Consideramos incpc como variable exógena (se podrían introducir más)
10
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Si polpc fuese exógena: estimación por MCO
Pero, ¿se determina esta variable de forma exógena? Probablemente no
Seguramente
Quizás solo nos interese la primera ecuación, pero la segunda es necesaria para una
estimación adecuada
Importante: la primera ecuación describe el comportamiento de los potenciales
homicidas mientras que la segunda el de la administración
Por esta razón, cada ecuación interpretación ceteris paribus adecuada
11
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – NATURALEZA DE LOS
MODELOS DE ECUACIONES SIMULTÁNEAS
Importante: cuando un mismo agente elige las dos variables endógenas, el MES no es
la herramienta adecuada
El hecho de que dos variables se determinen de forma simultánea no implica que el
MES es adecuado
Para que un MES tenga sentido, cada ecuación debe tener una interpretación ceteris
paribus independiente de la otra
En general esto no ocurre cuando un mismo agente determina las dos variables (por
ejemplo, tiempo dedicado al estudio y al trabajo por un estudiante)
12
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SESGO DE SIMULTANEIDAD EN
MCO
Endogeneidad causada por correlación de un regresor con el error debido a la
simultaneidad
Modelo estructural de dos ecuaciones
Variables endógenas: 𝑦1 e 𝑦2
Variables exógenas: 𝑧1 y 𝑧2
Demostraremos que 𝑦2 está correlacionada con 𝑢1
13
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SESGO DE SIMULTANEIDAD EN
MCO
Claramente
por lo que
Asumiendo que 𝛼1 𝛼2 ≠ 1, se deriva que
𝛼2 𝑢1 +𝑢2
donde 𝜋21 = 𝛼2 𝛽1 /(1 − 𝛼2 𝛼1 ), 𝜋22 = 𝛽2 /(1 − 𝛼2 𝛼1 ), 𝑣2 =
1−𝛼2 𝛼1
El supuesto 𝛼1 𝛼2 ≠ 1 en ciertos casos no es restrictivo: en el ejemplo de policía
seguramente 𝛼1 𝛼2 ≤ 0
14
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SESGO DE SIMULTANEIDAD EN
MCO
La ecuación
expresa 𝑦2 en función de las variables exógenas y de los términos de error
Se trata de la ecuación en forma reducida para 𝑦2
𝜋21 , 𝜋22 : parámetros de la forma reducida (funciones no lineales de los
parámetros estructurales)
𝑣2 : error de la forma reducida (función lineal de los errores estructurales 𝑢1 y 𝑢2 )
Se puede estimar de forma consistente los parámetros 𝜋21 , 𝜋22 por MCO
De forma similar se puede obtener la forma reducida para 𝑦1 15
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SESGO DE SIMULTANEIDAD EN
MCO
La forma reducida es útil para entender porque en general el MCO en las ecuaciones
estructurales es sesgado e inconsistente ⇒ sesgo de simultaneidad
Supongamos que los errores estructurales no están correlacionados. Claramente
donde 𝜎12 = 𝐸(𝑢12 ) = 𝑉𝑎𝑟(𝑢1 )
En el ejemplo de la policía 𝛼1 𝛼2 ≤ 0 y 𝛼2 > 0, por lo que el estimador MCO de 𝛼1
posible sesgo positivo ⇒ MCO subestimará el efecto de una fuerza policial mayor
Si 𝛼2 = 0 y los errores estructurales no correlacionados, el MCO funcionaría en la
ecuación estructural (lógico, las variables no se determinan simultáneamente) 16
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
En la Sesión XII del curso de Econometría I y en la Sesión III de este curso se explicó
el método de mínimos cuadrados en dos etapas (MC2E) para estimar modelos con
regresores endógenos
En esta sección veremos como aplicar MC2E a MES
La diferencia es que como las ecuaciones estructurales incluyen variables
exógenas, puede evaluarse rápidamente si hay suficientes VI para estimar las
ecuaciones
Se trata del problema de identificación
Lo discutiremos para un MES de dos ecuaciones
17
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Ejemplo: oferta y demanda de leche (imponemos la condición de equilibrio 𝑞𝑜 = 𝑞𝑑 = 𝑞)
𝑞: consumo per cápita de leche; 𝑝: precio; 𝑧1 : precio del forraje (exógeno)
Esto implica que la primera ecuación es la de oferta y la segunda la de demanda
Se espera que 𝛼1 > 0, 𝛼2 < 0, 𝛽1 < 0
𝑧1 desplaza la función de oferta, pero no la de demanda
La función de demanda no contiene desplazadores observables
18
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
¿Cuál de estas ecuaciones puede estimarse? ¿Cuál está identificada?
La ecuación de demanda está identificada, pero la de oferta no
𝑧1 puede usarse como VI en la ecuación de
demanda
𝑧1 desplaza la curva de oferta ⇒ se traza la curva
de demanda
Existe un desplazador inobservable de la
demanda (𝑢2 ), pero no afecta sustancialmente a
la estimación siempre y cuando 𝑧1 no esté
correlacionado con 𝑢2 19
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Modelo general de dos ecuaciones
En la primera (segunda) ecuación 𝑘1 (𝑘2 ) variables exógenas
El hecho de que 𝒛1 y 𝒛2 contengan en general diferentes variables implica que se han
impuesto restricciones de exclusión
Si 𝛼1 𝛼2 ≠ 1, muy sencillo derivar las formas reducidas para 𝑦1 e 𝑦2
Problema de identificación: ¿es posible estimar consistentemente los parámetros de
las ecuaciones estructurales? 20
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Condición de rango para la identificación de una ecuación estructural
La primera ecuación estructural está identificada si, y solo si, la segunda ecuación
estructural contiene al menos una variable exógena excluida en la primera
La segunda ecuación estructural está identificada mediante una condición análoga
Ejemplo: inflación y apertura
Romer, D. (1993), “Openness and Inflation: Theory and Evidence,” Quarterly
Journal of Economics 108, 869- 903
Propone que países más “abiertos” deben tener tasas de inflación más bajas
21
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Modelo
donde inf: inflación; open: participación de las importaciones en el PIB; pcinc: renta
per cápita; land: extensión territorial del país
La primera ecuación es la de interés: se espera que 𝛼1 < 0
La segunda ecuación refleja el hecho de que el grado de apertura puede depender
de la inflación, así como de otros factores (países más pequeños, más abiertos)
pcinc y land se consideran exógenas
La primera ecuación identificada si 𝛽22 ≠ 0; la segunda no identificada
22
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Estimación por MC2E
Las variable instrumentales son las exógenas que aparecen en cada ecuación
En el ejemplo anterior, la regresión estimada de forma reducida es
El estadístico t sobre log(𝑙𝑎𝑛𝑑) es superior a 9 en valor absoluto, por lo que se
considera que 𝑜𝑝𝑒𝑛 tiene una correlación parcial suficiente con la VI propuesta
log(𝑝𝑐𝑖𝑛𝑐) no significativa, pero esto es irrelevante 23
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – IDENTIFICACIÓN Y ESTIMACIÓN
DE UNA ECUACIÓN ESTRUCTURAL
Estimación MC2E de la primera ecuación estructural
Se rechaza al 1% la nula de que 𝛼1 = 0 en favor de la alternativa 𝛼1 < 0
Efecto económicamente importante
La estimación por MCO implica un coeficiente estimado menor (−0,215)
24
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SISTEMAS DE MÁS DE DOS
ECUACIONES
Analizar la identificación en modelos generales es difícil, pero una vez que una
ecuación está identificada se puede estimar por MC2E
Supongamos el modelo
Las y’s son variables endógenas y las z’s exógenas
Más sencillo es saber que ecuación no está identificada: la tercera ecuación no lo
está ya que no hay ninguna VI para 𝑦2
25
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SISTEMAS DE MÁS DE DOS
ECUACIONES
Condición de orden para la identificación
Una ecuación de cualquier MES satisface la condición de orden para identificación si
el número de variables exógenas excluidas de la ecuación es mayor o menor que el
número de variables endógenas en el lado derecho
La primera y segunda ecuación satisfacen las
condiciones de orden
Condición de orden necesaria pero no suficiente:
para la segunda ecuación se necesita que 𝛽34 ≠ 0
En general, la identificación depende de los valores de los parámetros y hay
muchas formas sutiles por las que la identificación puede fallar
26
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – SISTEMAS DE MÁS DE DOS
ECUACIONES
En muchas aplicaciones se asume que cuando se cumple la condición de orden la
ecuación está identificada (aunque la condición de rango podría fallar)
En términos de condición de orden:
Ecuación sobreidentificada: más VI que variables endógenas en el lado
derecho (la primera ecuación del sistema anterior)
Ecuación exactamente identificada: mismas VI que variables endógenas
en el lado derecho (la segunda ecuación del sistema anterior)
Ecuación no identificada: menos VI que endógenas en el lado derecho (la
primera ecuación del sistema anterior)
Para ecuaciones identificadas, estimación por MC2E. Para sistemas identificados,
métodos de estimación de sistemas son más eficientes (MC3E) 27
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON SERIES DE TIEMPO
La primeras aplicaciones de MES fueron las ecuaciones simultáneas de grandes
sistemas para describir la economía de un país
Model keynesiano simple de la demanda agregada (sin sector exterior)
donde C: consumo; Y: ingreso; T: impuestos; r: interés; I: inversión; G: gasto público
t representa el periodo (año)
28
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON SERIES DE TIEMPO
Primera ecuación: consumo agregado
Segunda ecuación: función muy simple de inversión
Tercera ecuación: identidad procedente de la contabilidad nacional
Variables endógenas: C, I, Y
Variables exógenas: T, r, G
La segunda ecuación se puede estimar por MCO
La primera ecuación por MC2E usando como instrumentos las variables exógenas
29
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON SERIES DE TIEMPO
Problemas de este modelo
Difícil justificar que las variables exógenas lo sean realmente: el gobierno
no fija su gasto y los impuestos independientemente de la economía, y
las tasas de interés se suelen determinar de forma conjunta a C, I, Y
Es estático. La realidad es dinámica, por lo que es esperable que
retardos de las variables aparezcan en el modelo
Ampliación del modelo permitiendo efectos dinámicos
Se agrega una variable endógena retardada a la ecuación de inversión
30
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON SERIES DE TIEMPO
En general, se puede tratar una variable endógena retardada como exógena ⇒ se
denominan variables predeterminadas
Los retardos de variables exógenas también son variables predeterminadas
Esta ecuación se puede seguir estimando por MCO
Similarmente, se agrega una variable endógena retardada a la ecuación de consumo
Esta ecuación se puede estimar por MC2E usando instrumentos 𝑇𝑡 , 𝐺𝑡 , 𝑟𝑡 , 𝐶𝑡−1 , 𝑌𝑡−1
31
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON SERIES DE TIEMPO
Problemas de este modelo
La validez de los resultados asintóticos para MCO o MC2E depende, en
general, del supuesto de dependencia débil ⇒ no se suele cumplir con
variables macroeconómicas
La búsqueda de variables verdaderamente exógenas es más sencilla con
datos no agregados
32
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON DATOS DE PANEL
El método de estimación básico de MES con datos de panel implica dos pasos:
Eliminar los efectos inobservables mediante primeras diferencias o la
transformación de efectos fijos
Encontrar VI para las variables endógenas de las ecuaciones
transformadas ⇒ esto es complicado ya que necesario VI que cambien
con el tiempo
MES para datos de panel
33
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON DATOS DE PANEL
Se eliminan los efectos fijos mediante diferenciación
Esto resuelve parte del problema de endogeneidad, pero no completamente, ya
que Δ𝑦𝑖𝑡2 y Δ𝑢𝑖𝑡1 están correlacionados
Las VI naturales para Δ𝑦𝑖𝑡2 son los elementos de Δ𝒛𝑖𝑡2 que no estén en Δ𝒛𝑖𝑡1 ⇒ por
tanto se necesitan elementos que varíen en el tiempo en 𝒛𝑖𝑡2
34
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON DATOS DE PANEL
Ejemplo: efecto de la población carcelaria en los índices de delitos violentos
Levitt, S. D. (1996), “The Effect of Prison Population Size on Crime Rates: Evidence
from Prison Overcrowding Legislation,” Quarterly Journal of Economics 111, 319- 351
Análisis del efecto causal del número de población carcelaria en el índice de delitos
a nivel estatal
Modelo de efectos fijos
Variables exógenas: policías, renta, desempleo, proporción de población negra,
proporción de población urbana, distribución por edades
35
SESIÓN VII - MODELOS DE ECUACIONES SIMULTÁNEAS – MODELOS DE ECUACIONES
SIMULTÁNEAS CON DATOS DE PANEL
Existe simultaneidad entre el índice de delitos y la población carcelaria, pero no nos
interesa la segunda ecuación
Se diferencia para eliminar el efecto fijo
Estimación MCO (inconsistente debida a la simultaneidad): −0,181 (0,048)
Estimación MC2E (dos instrumentos para Δlog(𝑝𝑟𝑖𝑠𝑜𝑛𝑖𝑡 )): −1,032 0,370
Efecto mucho mayor, pero estimación menos precisa
Alternativamente, se puede usar la transformación de efectos fijos y a continuación
MC2E en la ecuación transformada
36