100% encontró este documento útil (2 votos)
362 vistas123 páginas

Econometria Ruelas

Este documento presenta apuntes para cursos de econometría impartidos en el ITAM. Incluye introducciones a modelos de regresión lineal simple y múltiple, así como conceptos de álgebra matricial. El objetivo es proporcionar una síntesis de los principales conceptos, teoremas y métodos de econometría a nivel intermedio para facilitar el estudio de otras materias relacionadas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (2 votos)
362 vistas123 páginas

Econometria Ruelas

Este documento presenta apuntes para cursos de econometría impartidos en el ITAM. Incluye introducciones a modelos de regresión lineal simple y múltiple, así como conceptos de álgebra matricial. El objetivo es proporcionar una síntesis de los principales conceptos, teoremas y métodos de econometría a nivel intermedio para facilitar el estudio de otras materias relacionadas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

APUNTES PARA EL CURSO DE

ECONOMETRÍA

Enero – Mayo 2015

DAVID RUELAS RODRÍGUEZ


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Programa de clases

Estos apuntes fueron revisados y corregidos para cubrir por completo el temario de los
cursos de Econometría I (EST 11103) y Econometría (EST 11104) del Departamento de
Estadística del Instituto Tecnológico Autónomo de México (ITAM) para el semestre
Enero – Mayo 2015.

El documento no es un libro de texto, sino una síntesis de las principales definiciones,


teorema, conceptos y métodos de un primer curso en Econometría de nivel intermedio,
que en algunos programas académicos también se le denomina Análisis de Regresión o
Pronóstico de Negocios. Esta compilación puede tenerse como referencia en el estudio
de otras materias que dependen fundamentalmente de los Modelos de Regresión; por
ejemplo, Microeconometría, Macroeconometría, Econometría Financiera, Análisis de
Series de Tiempo, Modelos Lineales Generalizados, Modelo Econométricos Dinámicos,
etc.

Cada sección fue escrita con la finalidad de revisar rápidamente la teoría y dedicar la
mayor parte del tiempo de clase a: (i) la demostración y análisis de los principales
resultados; y (ii) a la resolución de ejercicios que ilustran el uso de los Modelos de
Regresión con aplicaciones en Economía, Finanzas y Administración.

Los apuntes de la Sección 3 sobre el Modelo de Regresión Lineal Múltiple son más
largos que los demás, pues incluyen un repaso de los principales conceptos y resultados
de Álgebra Matricial, que facilitan la notación y demostración de algunos teoremas.

Al inicio del documento se incorporó un índice para facilitar la búsqueda de algún tema
en particular. Al final del documento se presenta como anexo el Material de Apoyo
para el Curso de Econometría repartido durante las clases de este semestre, incluyendo
las preguntas de los 58 ejercicios revisados en clase.

Esta es la cuarta versión de estos apuntes completos e incluyen las correcciones que
gracias a las preguntas y comentarios de mis alumnos de este semestre fuimos
detectando durante las clases. Sé que todavía hay errores por corregir y explicaciones
por mejorar, así que cualquier comentario es bienvenido al correo electrónico
[email protected].

David Ruelas Rodríguez

Mayo 2015

DAVID RUELAS RODRÍGUEZ ii


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Programa de clases

Índice

1. Introducción a la Econometría ............................................................................ 1-1


1.1. Propósito y definición.................................................................................... 1-1
1.2. Modelos Econométricos ................................................................................ 1-2
1.3. Tipo de datos ................................................................................................. 1-4
1.4. Variables ........................................................................................................ 1-5
1.5. Usos y abusos de la Econometría .................................................................. 1-7

2. Modelo de Regresión Lineal Simple .................................................................... 2-1


2.1. Modelo de regresión y esperanza condicional............................................... 2-1
2.2. Modelo de Regresión Lineal Simple (MRLS)............................................... 2-4
2.2.1. Elementos del MRLS ......................................................................... 2-4
2.2.2. Supuestos del modelo ........................................................................ 2-6
2.2.3. Definición del MRLS ........................................................................ 2-9
2.3. Estimadores de Mínimos Cuadrados ........................................................... 2-10
2.3.1. Método de Mínimos Cuadrados Ordinarios (MCO) ........................ 2-10
2.3.2. Modelo de regresión ajustado, valores ajustados y residuos ........... 2-13
2.4. Propiedades de los estimadores MCO ......................................................... 2-14
2.4.1. Teorema de Gauss-Markov.............................................................. 2-14
2.4.2. Matriz de Varianzas y Covarianzas ................................................. 2-15
2.5. Bondad de ajuste.......................................................................................... 2-16
2.5.1. Coeficiente de determinación (R2) ................................................... 2-16
2.5.2. Análisis de Varianza (ANOVA) ...................................................... 2-18
2.6. Estimadores de Máxima Verosimilitud (EMV) .......................................... 2-19
2.7. Estimación por intervalo y pruebas de hipótesis ......................................... 2-21
2.7.1. Intervalos de confianza sobre los parámetros del MRLSN ............. 2-22
2.7.2. Pruebas de hipótesis acerca de los parámetros del MRLSN............ 2-22
2.8. Predicción en el MRLS ............................................................................... 2-24
2.8.1. Predicción de la media condicional ................................................. 2-24
2.8.2. Predicción individual ....................................................................... 2-25

3. Modelo de Regresión Lineal Múltiple ................................................................. 3-1


3.1. Modelo de Regresión Lineal Múltiple (MRLM) ........................................... 3-1
3.2. Álgebra matricial del MRLM ........................................................................ 3-4
3.2.1. Operaciones con Matrices.................................................................. 3-4
3.2.2. Otros conceptos y propiedades relevantes del álgebra matricial ....... 3-6
3.2.3. Diferenciación Matricial .................................................................... 3-8
3.3. Estimación por MCO del MRLM.................................................................. 3-9

DAVID RUELAS RODRÍGUEZ iii


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Programa de clases

3.4. Propiedades estadísticas de los estimadores MCO ...................................... 3-11


3.4.1. Esperanza y Varianza de los estimadores MCO .............................. 3-11
3.4.2. Teorema de Gauss-Markov.............................................................. 3-11
3.5. R2 y R2 ajustada ........................................................................................... 3-12
3.6. Análisis de varianza. .................................................................................... 3-13
3.7. Estimadores de Máxima Verosimilitud (EMV) .......................................... 3-14
3.8. Estimación por intervalo y pruebas de hipótesis ......................................... 3-17
3.8.1. Intervalos de confianza sobre los parámetros del MRLM ............... 3-17
3.8.2. Pruebas de hipótesis acerca de los parámetros del MRLM ............. 3-18
Pruebas de hipótesis individuales ................................................... 3-18
Pruebas de hipótesis conjunta de la regresión ................................ 3-19
Pruebas de hipótesis conjuntas para Transformaciones Lineales .. 3-19
3.9. Predicción del MRLM ................................................................................. 3-21
3.9.1. Predicción de la media condicional ................................................. 3-21
3.9.2. Predicción individual ....................................................................... 3-22
3.10. Modelos de Regresión Polinomial............................................................... 3-23
3.11. Contribuciones incrementales de una o varias variables ............................. 3-24
3.11.1. Análisis de los parámetros del MRLM ............................................ 3-24
Significado de los coeficientes de regresión .................................... 3-24
Medidas de sensibilidad .................................................................. 3-24
3.11.2. Análisis de los parámetros estimados del MRLM ........................... 3-25
3.11.3. Coeficiente de Correlación Parcial .................................................. 3-25
3.12. Criterios para la selección de modelos ........................................................ 3-29
3.12.1. Criterios de selección ....................................................................... 3-29
3.12.2. Criterios de Información de Akaike, Schwarz y Hannan-Quinn ..... 3-30
3.12.3. Métodos para la Construcción de Modelos Econométricos ............ 3.31
Identificación de variables explicativas potenciales ....................... 3-31
Selección de la forma funcional ...................................................... 3-32
Métodos de selección de variables .................................................. 3.32

4. Variables Dicótomas ............................................................................................. 4-1


4.1. Naturaleza de las variables dicótomas ........................................................... 4-1
4.1.1. Variables Dicótomas y Variables Cualitativas .................................. 4-1
4.1.2. Múltiples Variables Cualitativas e Interacciones .............................. 4-3
4.2. MRLM con Variables Cuantitativas y Dicótomas ........................................ 4-4
4.3. Análisis estacional ......................................................................................... 4-6
4.4. Cambio estructural y regresión lineal por segmentos.................................... 4-8
4.4.1. Cambio estructural ............................................................................. 4-8
4.4.2. Regresión Lineal por Segmentos ....................................................... 4-9

DAVID RUELAS RODRÍGUEZ iv


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Programa de clases

5. Análisis de los Supuestos del MRLM .................................................................. 5-1


5.1. Normalidad .................................................................................................... 5-2
5.2. Multicolinealidad ........................................................................................... 5-4
5.2.1. Definición y Causas de la Multicolinealidad ..................................... 5-4
5.2.2. Identificación de la Multicolinealidad ............................................... 5-5
5.2.3. Corrección de la Multicolinealidad ................................................... 5-5
5.3. Heterocedasticidad......................................................................................... 5-7
5.3.1. Definición y Causas de la Heterocedasticidad................................... 5-7
5.3.2. Identificación de la Heterocedasticidad ............................................. 5-8
Métodos informales ........................................................................... 5-8
Métodos formales............................................................................... 5-9
5.3.3. Corrección de la Heterocedasticidad ............................................... 5-12
Corrección de la heterocedasticidad con varianzas conocidas ...... 5-12
Corrección de la heterocedasticidad con varianzas desconocidas . 5-14
5.4. Autocorrelación ........................................................................................... 5-16
5.4.1. Definición y Causas de la Autocorrelación ..................................... 5-16
5.4.2. Identificación de la Autocorrelación ............................................... 5-17
Métodos gráficos ............................................................................. 5-17
Pruebas Estadísticas ........................................................................ 5-19
5.4.3. Corrección de la Autocorrelación .................................................... 5-20
Corrección de la autocorrelación de primer orden
con  conocida ................................................................................. 5-20
Corrección de la autocorrelación de primer orden
con  desconocida ........................................................................... 5-20

Anexo: Material de Apoyo para el Curso de Econometría

DAVID RUELAS RODRÍGUEZ v


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

1. Introducción a la Econometría
1.1. Propósito y definición
Figura 1.1

PROBABILIDAD, INFERENCIA ESTADÍSTICA Y ECONOMETRÍA


Econometría
Inferencia Estadística
Probabilidad (Regresión, Pronóstico de
(Estadística Matemática)
Negocios, Series de Tiempo)
Tipo de cambio Peso / Dólar
• Rama de las Matemáticas y de • Proceso inductivo (de lo particular a lo Pesos por Dólar (MXN/USD)
general) que permite obtener
la Estadística que se encarga conclusiones sobre la población a partir 16.0
del estudio formal de las del estudio de una muestra
reglas de la incertidumbre que • Siempre existe posibilidad de error y se 15.0
permiten modelar fenómenos mide en términos de probabilidad
aleatorios 14.0

• Cálculo de probabilidades: 13.0


enfoques (clásico, frecuentista
Observado Pronóstico
y subjetivo) y desarrollo 12.0
Inferencia
axiomático

jul-14

sep-14

oct-14

nov-14

dic-14
ago-14

feb-15

mar-15
Muestra Población

ene-15
estadística
• Probabilidad condicional e
independencia estadística Muestreo Fuente: Banxico
(RPT y TB) • ¿Cuál es el pronóstico para el
• Variables aleatorias y tipo de cambio Peso / Dólar?
• Distribuciones de Muestreo de
distribuciones de probabilidad ¿Qué intervalos garantizan
estadísticas y estimadores
(univariadas y multivariadas) cierto nivel de confianza?
• Estimación puntual y por
• Modelos paramétricos: • Con base en un conjunto de
intervalo de parámetros
Binomial, Poisson, Uniforme, precios y cantidades
Gamma, Normal, etc. • Pruebas de hipótesis observadas, ¿cuál es la función
paramétricas de demanda estimada?
La Econometría es la rama de la Economía que utiliza las técnicas estadísticas del
Análisis de Regresión para analizar los fenómenos económicos

Figura 1.2

ECONOMETRÍA

Definición y
Clasificación
propósito

• Etimológicamente econometría significa • Categorías


“medición económica”
 Econometría Teórica: elaboración de
• La Econometría es una disciplina que métodos estadísticos para medir las
combina: relaciones económicas
 Teoría económica  Econometría Aplicada: uso de las
herramientas de la econometría teórica
 Economía matemática (expresión
para estudiar campos específicos de la
matemática de la teoría mediante
economía y los negocios
ecuaciones)
 Estadística económica (recopilación,
procesamiento y análisis exploratorio de • Enfoques (de cada categoría)
datos económicos)
 Econometría Clásica: se basa en
 Estadística matemática (inferencia métodos de la Estadística Frecuentista
estadística para modelar la incertidumbre
 Econometría Bayesiana: se basa en
y hacer pronósticos)
métodos de la Estadística Bayesiana
• Su propósito es validar y dar contenido
empírico a gran parte de la teoría
económica.

DAVID RUELAS RODRÍGUEZ 1-1


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

Figura 1.3

ANÁLISIS DE REGRESIÓN
Análisis de Regresión
• La variable de interés (Y) es variable
• Estudio de la dependencia de una variable de interés aleatoria
respecto de una o más variables explicativas
• Las variables explicativas (X1, X2,...., Xk)
• Su objetivo es estimar o predecir la media poblacional se supondrán conocidas
de la variable de interés
• Se busca estimar E[Y | X1, X2,..., Xk]
Ejemplos: Origen histórico

Variable dependiente Variable(s) explicativas


• El científico y humanista inglés
Francis Galton (1822-1911)
• Dinero / Ingreso • Tasa de inflación estableció la “Ley de regresión
universal”

• Consumo personal • Ingreso personal neto • Los padres de estatura alta (o


disponible baja) tienden a procrear hijos
altos (o bajos), sin embargo, la
estatura promedio de cada grupo
• Tasa de cambio • Tasa de desempleo tiende a “regresar” a la estatura
de los salarios promedio de la población total
(“regresión a la mediocridad”)
• Producción • Trabajo • Este hecho fue confirmado por el
• Capital matemático inglés Karl Pearson
(1857-1936) mediante una
• Mortalidad infantil • PIB per cápita muestrea de más de mil
• Tasa de alfabetización de las miembros de grupos familiares
mujeres

1.2. Modelos Econométricos


Figura 1.4

RELACIONES DETERMINISTAS VS ESTADÍSTICAS


Relación determinista Variable dependiente
• Relaciones funcionales propias de la Variables
Física (v.gr., Segunda Ley de Newton: Modelo explicativas
F = m*a) Matemático: Y = 0 + 1 X1+ 2ln(X2)
• La variable dependiente queda
Parámetros
perfectamente descrita una vez que Modelo
las variables explicativas son Econométrico: Y = 0 + 1 X1+ 2ln(X2) + u
conocidas
• Mismos niveles o valores de las
variables explicativas conducen Perturbación Estocástica
siempre al mismo valor de la variable
dependiente • Sustituto de las variables que se omiten en el
modelo
Relación estadística
• Hace que la variable dependiente sea variable
• Relaciones aleatorias o estocásticas, aleatoria
es decir, variables con distribuciones
de probabilidad 1. Vaguedad de la teoría

• La variable dependiente tiene una 2. Falta de disponibilidad de datos


variabilidad intrínseca o aleatoria que 3. Variables periféricas
no puede explicarse en su totalidad
por las variables explicativas 4. Aleatoriedad intrínseca

• Mismos niveles o valores de las 5. Variables representantes (proxy) inadecuadas


variables explicativas no 6. Principio de parsimonia (lo más simple posible)
necesariamente conducen al mismo
valor de la variable dependiente 7. Forma funcional incorrecta

DAVID RUELAS RODRÍGUEZ 1-2


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

Figura 1.5

METODOLOGÍA DE LA ECONOMETRÍA
Metodología Ejemplo

• Las personas incrementan su consumo (Y ) al incrementar


Teoría o hipótesis su ingreso (X) (Keynes, 1936)
(estudios previos) • La tasa de cambio del consumo por unidad de ingreso
adicional (1) es la propensión marginal a consumir (PMC)

Y = 0 + 1 X • 0 es el nivel de consumo


Especificación del
cuando no hay ingreso (no
Modelo Matemático
necesariamente es cero)

Y = 0 + 1 X + u • u es el término de perturbación


Especificación del
o de error (media cero y varianza
Modelo Econométrico
constante  2 )

Obtención de información
^
Y = – 0.619 + 0.758 X • Estimación de  0, 1 y  2
y estimación del modelo (Método de Mínimos Cuadrados
^ 2 = 0.007 Ordinarios)

Validación • Significancia de los parámetros (v.gr., H0 :  1 = 0)


supuestos
no • Análisis de residuos (v.gr., H0 :  2 = 0.005)
si
• Interpretación del modelo (v.gr., PMC  0.758)
Uso del modelo ^
• Pronóstico o predicción (v.gr., Y(11.5) = 8.1)
• Análisis con fines de control o de políticas

Figura 1.6

METODOLOGÍA DE LA ECONOMETRÍA (EJEMPLO)


Producto Interno Bruto (PIB) y Gasto en Consumo ^
Personal (GCP) en Estados Unidos de América Y (11.5) = – 0.619 + 0.758 (11.5) = 8.1
Cifras en billones de dólares de 2000
Si el PIB es de 11.5 billones de dólares se
Año PIB (X) GCP (Y ) pronostica un GCP de 8.1 billones de dólares

1986 6.3 4.2


1987 6.5 4.4
GCP (Y )
1988 6.7 4.5
Billones de dólares de 2000
1989 7.0 4.7
1990 7.1 4.8 9.0
1991 7.1 4.8
1992 7.3 4.9 8.0
1993 7.5 5.1
1994 7.8 5.3 7.0
1995 8.0 5.4
1996 8.3 5.6
1997 8.7 5.8 6.0
1998 9.1 6.1
1999 9.5 6.4 5.0
2000 9.8 6.7 ^
Y = – 0.619 + 0.758 X
2001 9.9 6.9 4.0
2002 10.0 7.1
2003 10.3 7.3
2004 10.7 7.6 3.0
2005 11.0 7.8 5.0 6.0 7.0 8.0 9.0 10.0 11.0 12.0

Fuente: Gujarati (2009), Econometría, 5ª Edición. PIB (X)


Extracto de la Tabla I.1 (p. 6). Billones de dólares de 2000

DAVID RUELAS RODRÍGUEZ 1-3


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

1.3. Tipo de datos


Figura 1.7

CLASIFICACIÓN DE LOS DATOS

Clasificación de los datos Características

Por su tipo Cualitativos • Se pueden clasificar en un número finito de


categorías
• Cualidades o atributos de
los elementos • Las categorías deben ser mutuamente excluyentes
(cada dato pertenece a una sola clase) y exhaustivas
• Se pueden codificar
(abarcan todos los valores potenciales de los datos)

Cuantitativos
• Discretos: provienen de un proceso de conteo.
• Valores de los elementos
con significado numérico • Continuos: provienen de un proceso de medición.

• Se reúnen en el mismo tiempo o en el mismo


Por el Transversales
período
tiempo de
recolección • Corresponden a un conjunto de unidades
y observa- experimentales
ción
• Se reúnen a lo largo de varios intervalos en el
Series de tiempo
tiempo
• Regularmente son observaciones de una misma
variable en distintos momentos del tiempo

Datos en • Combina datos transversales y de series de tiempo


panel • Se reúnen a lo largo de varios intervalos en el
tiempo para el mismo conjunto transversal

Figura 1.8

ESCALAS DE MEDICIÓN
Datos Escala Características Ejemplo

• Nivel más bajo de medición • Preferencia sobre


• Utiliza la operación más sencilla y básica: partido político
la clasificación (v.gr., PAN, PRD,
Nominal
• No es posible establecer una relación de PRI)
Cualitativos

orden

• Establece una relación de orden de • Calificación de un


acuerdo con la posesión de cierto atributo servicio (v.gr.,
Conversión de datos

• No permite realizar operaciones malo, regular,


Ordinal
aritméticas bueno)

• Los datos se clasifican con base en el • Temperatura en


grado de posesión del atributo grados
• El cero es relativo (no representa la Centígrados
De intervalo
ausencia del atributo) (v.gr., 0°C no es
Cuantitativos

• Es posible realizar operaciones de suma o ausencia de


resta temperatura)
• Los datos se clasifican con base en la • Estatura, peso,
medición exacta del grado de posesión distancias o
del atributo tiempo (v.gr.,1.75
De razón
• El cero es absoluto (ausencia del atributo) metros, 72 kg, 5
• Es posible realizar operaciones de suma, km, 3 horas)
resta, multiplicación y división

DAVID RUELAS RODRÍGUEZ 1-4


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

1.4. Variables
Figura 1.9

TERMINOLOGÍA

Variable dependiente Variable explicativa

• Variable explicada • Variable independiente

• Predicha • Predictora

• Regresada • Regresora

• Respuesta • Estímulo

• Endógena • Exógena

• Resultado • Covariante o covariable

• Variable controlada • Variable de control

Figura 1.10

NOTACIÓN
Variable Variable(s)
Caso dependiente independiente(s) Datos

Univariado o
Simple Y1 , Y2 , . . . , Yn
n observaciones
Y X
Y = g (X) X1, X2, . . . , Xn (Xi, Yi)
g:RR

Multivariado o Y1 X11 , X21 , . . . , Xk1 k variables


Múltiple Y2 X12 , X22 , . . . , Xk2
Y X1 , X2 , . . . , Xk
Y = g (X1, X2,..., Xk)
...

...

...

...

g : Rn  R Yn X1n , X2n , . . . , Xkn n obs.

Estadísticos univariados (variable dependiente o variables independientes)

Definición Proposición
Media 1 n n • Estimador insesgado
muestral: Y =  Yi  Yi = n Y de la media
poblacional 
n i=1 i=1

Varianza 1 n 1 n • Estimador insesgado


muestral: S2 =  (Yi–Y )2 S Y2 =  Yi
2
– nY
2
de la varianza
Y n–1 i=1 n–1 i=1
poblacional 2

DAVID RUELAS RODRÍGUEZ 1-5


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

Figura 1.11

ESTADÍSTICOS BIVARIADOS: COVARIANZA Y CORRELACIÓN

Interpretación geométrica

– Y +
Xk  X Def. Covarianza Muestral
(Xk , Yk)
1 n

 (X – X ) (Y – Y )
Yk
SXY  i i
n–1 i=1
Yk  Y
( X, Y )
Y • Es el promedio de la variación conjunta
• Identifica la asociación lineal entre dos
variables
0 Xk X
• Puede ser positiva o negativa

• Es simétrica: SXY = SYX
+
(Xk – X )(Yk – Y ) es la • La covarianza de X con X es la varianza
X
variación conjunta de X, es decir, SXX = SX2
de (Xk , Yk) respecto Proposición
de ( X , Y ) 1 n

• Puede ser positiva o


SXY 
n–1 i=1
X Y  i i nXY

negativa
• Se expresa en
unidades cuadradas

Figura 1.12

INTERPRETACIÓN DE LA COVARIANZA

Asociación lineal positiva Asociación no lineal


Recta de
Y Regresión Y
Lineal
• La covarianza
Y solo identifica
Y SXY = 0
la asociación
lineal entre dos
variables
SXY > 0
• Puede ser
0 0 cualquier valor
X X X X
real, es decir,
SXY  (–, )
Asociación lineal negativa No asociación • Para cuantificar
Y Y el grado de
asociación
SXY < 0
lineal se define
al coeficiente
Y Y de correlación
lineal
Recta de
Regresión SXY = 0
Lineal
0 X X 0 X X

DAVID RUELAS RODRÍGUEZ 1-6


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 1

Figura 1.13

COEFICIENTE DE CORRELACIÓN LINEAL


Definición Ejemplos de interpretación
SXY Alto grado de asocia- Bajo grado de asocia- Asociación no lineal
rXY  ción lineal positiva ción lineal positiva
SX SY
Y Y Y
• Mide el grado de asociación
lineal entre dos variables
Y Y
• Es adimensional e Y
invariante ante
transformaciones lineales
• Es simétrico: rXY = rXY 0 X X 0 X X 0 X X
Proposición
rXY = 0.914 rXY = 0.529 rXY = 0.114
 1  rXY  1
Alto grado de asocia- Bajo grado de asocia- No asociación
• rXY  1  Alto grado de ción lineal negativa ción lineal positiva
asociación lineal negativa
Y Y Y
• rXY  1  Alto grado de
asociación lineal positiva
Y Y Y
• rXY  0  No asociación o
asociación no lineal entre
las variables X y Y
Correlación Perfecta
0 X X 0 X X 0 X X
| rXY | = 1    0 ,  1 ≠ 0,
tales que Y =  0 +  X rXY = 0.891 rXY = 0.410 rXY = 0.054

1.5. Usos y abusos de la Econometría


Figura 1.14

REGRESIÓN VS CORRELACIÓN: NO CAUSALIDAD


Análisis Objetivo Supuestos sobre las variables

• Mide el grado de asociación lineal • Tratamiento simétrico


entre dos variables • Las variables son aleatorias
• Genera un escalar (Coeficiente de
Correlación • Las variables, dependiente e
Correlación Lineal)
independiente, son indistintas
(rXY = rYX)

• Estima o predice el valor promedio • Tratamiento asimétrico


de una variable con base en los • La variable dependiente es
valores fijos de otras aleatoria pero las variables
Regresión
• Genera una ecuación (v.gr., Recta independientes toman valores
de Regresión Lineal) fijos (en muestras repetidas)

• El Análisis de Correlación y el Análisis de Regresión estudian estadísticamente la


relación que hay entre dos o más variables
• Una relación estadística, por más fuerte y sugerente que sea, nunca podrá establecer
una conexión causal (ni correlación ni regresión implican causalidad)
• Incluso la correlación perfecta ( | rXY | = 1 ) significa que todas los datos (Xi, Yi) se ubican
sobre la recta de regresión (colinealidad), sin embargo, ni en esos casos se puede
concluir que haya causalidad
• La causalidad sólo se puede establecer a partir de consideraciones teóricas, y se
pueden probar estadísticamente mediante Diseño de Experimentos (se controlan las
variables independientes y se observa a la variable dependiente)

Ejercicios E1 y E2 .

DAVID RUELAS RODRÍGUEZ 1-7


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2. Modelo de Regresión Lineal Simple

2.1. Modelo de regresión y esperanza condicional.


Def. Análisis de Regresión.
Es el estudio de la dependencia de una variable de interés respecto de una o más
variables explicativas. Su objetivo es estimar o predecir la media poblacional de la
variable de interés.

El caso univariado o simple se caracteriza por considerar únicamente una variable


explicativa (X). Si se denota por Y a la variable de interés o variable dependiente,
entonces el objetivo del Análisis de Regresión será estimar la media de Y suponiendo
conocidos los valores de X, es decir, la esperanza condicional E Y X  .

Hay que recordar que si X y Y son variables aleatorias discretas (o continuas), f X ,Y  x, y 


es su función de masa (o densidad) de probabilidad conjunta y f X  x  la función de masa
(o densidad) de probabilidad marginal de X, entonces la función de masa (o densidad) de
f  x, y 
probabilidad condicional de Y X  x está dada por f Y X  y x   X ,Y , f X x   0 .
f X x 

Proposición

i) E Y X  x    y f Y X  y x  si X y Y son variables aleatorias discretas.


y

E Y X  x    y f Y X  y x dy si X y Y son variables aleatorias continuas.



ii)


Para valores fijos de X (X = x), la esperanza condicional de Y es una función de x, es


decir, E Y X  x   g  x  .

Ejercicios E3 y E4 .

Notación: En al Análisis de Regresión Univariado se considerarán las parejas de datos


(Xi, Yi), i = 1, 2,…, n, de modo que los valores fijos de X serán X1, X2,…, Xn. Para
 
simplificar la notación se denotará a la esperanza condicional por E Y X i  g  X i  .

Def. Función de Regresión Poblacional (FRP). Es el lugar geométrico de las medias


condicionales de la variable dependiente para los valores fijos de la variable explicativa,
 
es decir, E Y X i  g  X i  .

DAVID RUELAS RODRÍGUEZ 2-1


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

La forma de la FRP depende del comportamiento aleatorio de X y Y. El análisis de los


datos (Xi, Yi), i = 1, 2,…, n, y la teoría pueden ayudar empíricamente a determinar la
forma de g  X i   E Y X i  .

Por ejemplo, para los datos (X1, Y1), (X2, Y2),…, (X10, Y10) de la figura 2.1 podría
pensarse que la FRP es “lineal”, es decir, E Y X i    0  1 X i , donde 0 y 1 se
denominan coeficientes de regresión. Geométricamente se trata de una línea recta con
ordenada al origen 0 (también llamada intercepto) y pendiente 1.

Figura 2.1

(X8,Y8) E[Y|Xi ] =  0 +  1 Xi
Desviación positiva
u8 = Y8  E[Y|X8 ] > 0

Desviación negativa
u5 = Y5  E[Y|X5 ] < 0
(X5,Y5)
0
0
0 0 X

Def. Linealidad en variables. Se dice que la FRP es lineal en variables si en


g  X i   E Y X i  sólo aparece Xi elevada a la potencia 1 acompañada de constantes. Por
 0  12 X i
ejemplo, E Y X i    0  1 X i , E Y X i   12 X i y E Y X i   con  3  0 son
ln  3 
FRPs lineales en variables.

Def. Linealidad en parámetros. Se dice que la FRP es lineal en parámetros si en


g  X i   E Y X i  sólo aparecen parámetros individuales elevados a la potencia 1, sin
importar la forma en que aparece Xi. Por ejemplo E Y X i    0  1 X i , E Y X i    0 y
E Y X i    0  1 ln  X i    2 X 12 son FRPs lineales en parámetros, pero E Y X i   12 X i ,
 0  12 X i
E Y X i    0   0 1 X i y E Y X i   ,  3  0 , no lo son.
ln  3 

Ejercicios E5 y E6 .

DAVID RUELAS RODRÍGUEZ 2-2


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

En la figura 2.1 también se puede observar cómo la esperanza condicional E Y X i  no


necesariamente coincide con los datos Yi para todas las X. La desviación Yi  E Y X i 
(dato Yi correspondiente a Xi menos su respectiva media condicional) puede ser positiva
o negativa.

Def. Perturbación estocástica o término de error (ui).

Son las desviaciones ui  Yi  E[Y X i ] , y son variables aleatorias no observables que


sustituyen o representan a todas las variables omitidas o ignoradas que, en conjunto,
pueden afectar a Y.

Existen muchas razones por las cuáles no es necesario o no es posible considerar algunas
variables en los modelos econométricos, por ejemplo:
 Vaguedad de la teoría
 Falta de disponibilidad de datos
 Variables periféricas (cuyo efecto conjunto es marginal)
 Aleatoriedad intrínseca (comportamiento humano)
 Variables representantes (o proxy) inadecuadas
 Principio de parsimonia (lo más simple posible)
 Forma funcional incorrecta

Despejando Yi de la definición de perturbación estocástica se obtiene el Modelo de


Regresión Simple, compuesto de una parte determinista (parámetros y valores conocidos
Xi) y una parte aleatoria.

Def. Modelo de Regresión Simple.

Yi  E[Y X i ]  ui

Componente Componente
sistemático o no sistemático
determinista o aleatorio

En particular, se estudiarán los Modelos de Regresión cuyo componente determinista es


lineal en los parámetros, partiendo de aquel que además es lineal en las variables.

DAVID RUELAS RODRÍGUEZ 2-3


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.2. Modelo de Regresión Lineal Simple (MRLS).


2.2.1. Elementos del MRLS.

Si (X1, Y1), (X2, Y2),…, (Xn, Yn) son n observaciones de la variable dependiente Y y la
variable explicativa X, cuya FRP es la recta E Y X i    0  1 X i , entonces el Modelo
de Regresión Lineal Simple (MRLS) establece que valores Yi pueden ser modelados
como la suma de esta media condicional y un término de error ui de la siguiente manera:

Yi   0  1 X i  ui

REPRESENTACIÓN GEOMÉTRICA DEL MRLS

Geométricamente, el MRLS Yi   0  1 X i  ui se presenta en la figura 2.2. Para cada


dato Xi su correspondiente Yi es el valor de la media condicional E Y X i    0  1 X i
más un término de error ui que puede ser negativo o positivo. La media condiciona es la
FRP y para el MRLS es una recta con pendiente 1 y ordenada al origen 0.

Figura 2.2

E[Y|Xi ] =  0 +  1 Xi
uj > 0

ui < 0
Yi
Ordenada al Yi =  0 +  1 Xi + ui
origen

0 1 ui es variable aleatoria


que puede ser positiva
Pendiente o negativa

0
0 0 1 Xi X

INTERPRETACIÓN DE LOS PARÁMETROS DEL MRLS

Los parámetros del MRLS Yi   0  1 X i  ui son 0 y 1 y se interpretan de la


siguiente manera:
 La ordenada al origen o intercepto 0 corresponde al valor esperado de la variable
dependiente Y en ausencia de la variable independiente X, es decir,  0  E Y X  0 .

 La pendiente 1 representa el cambio (positivo o negativo) de la media condicional


E Y X i  al aumentar la variable independiente X en una unidad.

DAVID RUELAS RODRÍGUEZ 2-4


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

En algunas ocasiones 0 carece de interpretación, por ejemplo, cuando la variable


independiente es el tiempo (t), t = 0 no significa ausencia de tiempo y el valor 0 sólo
indica el nivel de inicio de una serie de tiempo.

En general, para analizar la FRP E Y X i   g  X i  frecuentemente se consideran algunas


medidas de sensibilidad como efectos parciales, elasticidades o semi-elasticidades.

Def. Efecto parcial (E[Y|Xi]). Es el cambio marginal de E Y X i  cuando Xi crece en


 d 
una cantidad pequeña X i , es decir, E Y X i    E Y X i X i .
 dX i 

Def. Elasticidad (). Es el cambio porcentual aproximado en E Y X i  cuando Xi


 d  Xi d ln E Y X i 
aumenta un punto porcentual, es decir,    E Y X i   .
 dX i  E Y X i  d ln  X i 

Def. Semi-elasticidad (  ). Es el cambio porcentual aproximado en E Y X i  cuando Xi


 d  1
aumenta en una unidad, es decir,   100 E Y X i  .
 dX i  E Y X i 

En Economía y otras disciplinas estas medidas también se acostumbra definirlas para la


relación determinista Y  g  X  . Por ejemplo, en el contexto del MRLS, si
Y   0  1 X , y las medidas de sensibilidad dependen del parámetro 1 como se
muestra a continuación.

Proposición.
Si se tiene la relación determinista Y   0  1 X entonces:
i) Efecto parcial: Y  1X
X
ii) Elasticidad:   1  
Y 
1001
iii) Semi-elasticidad:  
Y

Demostración: Si Y   0  1 X entonces
dY

d
 0  1 X   1 , y aplicando las
dX dX
X 1 1001
definiciones: (i) Y  1X i , (ii)   1   y (iii)   1001   .
Y  Y Y

DAVID RUELAS RODRÍGUEZ 2-5


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

TRANSFORMACIÓN DE MODELOS NO LINEALES

La estimación del MRLS permite estimar fácilmente modelos no lineales que es posible
1
convertir en modelos lineales en parámetros. Por ejemplo, Yi  no es
 0  1 X i  u i
1
modelo lineal en variables, pero tomando recíprocos se obtiene   0  1 X i  ui . Si
Yi
1
en lugar de considerar los datos (Xi, Yi) se consideran los datos (Xi, Wi), con Wi  , el
Yi
modelo a estimar es Wi   0  1 X i  ui , que es MRLS. La figura 2.3 muestra algunos
de estos modelos.

Figura 2.3

Modelo Forma no lineal Forma lineal (en parámetros)



lnYi    0  1 ln X i   ui ,
Logarítmico o multiplicativo Yi   0 X i 1 e ui
donde  0  ln 0 


Yi   0  1 ln X i   ui ,
Semilogarítmico o Lin-Log e Yi   0 X i 1 e ui
donde  0  ln 0 
lnYi    0  1 X i  ui ,
Yi   0 1 i e ui
X
Semilogarítmico inverso o Log-Lin
donde  0  ln 0  y  1  ln 1 
 1 
Recíproco Yi   0  u i X i  1 Yi   0  1    ui
 Xi 
 1 
1 lnYi    0   1    u i ,
Logarítmico recíproco Yi   0  1  X i e ui  Xi 
donde  0  ln 0  y  1  ln 1 

Ejercicio E7 .

2.2.2. Supuestos del modelo.

En el Modelo de Regresión Lineal Simple, Yi   0  1 X i  ui , el término de error ui es


variable aleatoria y consecuentemente Yi también es variable aleatoria. Para poder
hacer inferencia estadística sobre los parámetros 0 y 1 es necesario hacer algunos
supuestos acerca de ui y de su relación con Xi.

Independencia vs no correlación. Es importante recordar que: (i) las variables


n
aleatorias Z1, Z2,…, Zn son independientes si y sólo si f Z1 ,Z 2 ,,Z n z1 , z 2 , z n    f Zi  z i  ;
i 1
(ii) si Z1, Z2,…, Zn son independientes entonces también son no correlacionadas, es
 
decir, Cov Z i , Z j  0 para toda i ≠ j; pero (iii) no correlación no implica independencia,
salvo algunas excepciones (v.gr., variables aleatorias normales).

DAVID RUELAS RODRÍGUEZ 2-6


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Supuestos del Modelo de Regresión Lineal Simple


i) La relación entre Xi y Yi es lineal en parámetros (no necesariamente en variables).
ii) Los valores Xi son fijos en muestras repetidas (variable no estocástica):
Covui , X i X i   0 . O bien, Xi y ui son independientes: Covui , X i   0 (si Xi es
estocástica).
iii) La media del error es cero: E ui   0 o E ui X i   0 (si Xi es estocástica).
iv) La varianza del error es constante: Varui    2 o Var ui X i    2 (si Xi es
estocástica).
v) Los errores son independientes y por tanto no están correlacionados:
   
Cov ui , u j  0 o Cov ui , u j X i , X j  0 (si Xi, Xj son estocásticas), para toda i ≠ j.
vi) El número de observaciones (n) debe ser mayor al número de parámetros a
estimar: n > 2.
vii) Los valores X1, X2,… Xn de una muestra no pueden ser todos iguales ni existen
observaciones atípicas.

El supuesto (ii) establece la independencia estadística entre Xi y ui (sin importar si Xi es


variable aleatoria o no), de modo que la distribución condicional de ui X i  y la
distribución incondicional de ui son la misma. Para simplificar la notación se
considerará la distribución incondicional de ui.

Los supuestos (iii), (iv) y (v) pueden resumirse estableciendo que los errores u1, u2,…, un
deben ser independientes e idénticamente distribuidos con media cero y varianza
constante  2, es decir, ui ~ iid(0,  2).

El supuesto (iv) de varianza constante se conoce también como supuesto de


homocedasticidad (ver figura 2.4).

Figura 2.4

Errores homocedásticos

E[Xi | Yi ] =  0 +  1 Xi

un

u2

Yn =  0 +  1 Xn + un
u1
ui ~ iid(0,  2)
varianza constante
0

0 X1 X2 ... Xn X

DAVID RUELAS RODRÍGUEZ 2-7


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Si la varianza no es constante se dice que hay heterocedasticidad, es decir,


Var ui X i    i2 , donde  i2 va cambiando dependiendo del nivel Xi (ver figura 2.5).

Figura 2.5

Errores heterocedásticos

E[Xi | Yi ] =  0 +  1 Xi

un
u2

Yn =  0 +  1 Xn + un
u1
ui ~ iid(0,  i 2)
varianza no constante
0

0 X1 X2 ... Xn X

 
De los supuestos (ii) y (iii) se puede deducir fácilmente que E ui2   2 , pues como
E ui   0 y Varui    2 , entonces Var u   E u   E u   E u   0  
 E ui2   2 .
2 2 2 2
i i i i

Para determinar esperanza, varianza y covarianza condicionales de Y1, Y2,…, Yn , dados


X1, X2,…, Xn, es útil recordar las principales propiedades de estos operadores.

Teorema
Si X1, X2,…, Xm y Y1, Y2,…, Yn son variables aleatorias, c0, c1,…, cm y d0, d1,…, dn son
constantes, entonces:
 n  n
i) E  d iYi    d i E Yi  (Operador Lineal);
 i 1  i 1
y en particular E d 0  d1Y1   d 0  d1 E Y1 
n  n
   
n m
ii) Var  d iYi    d i2VarYi   2 d i d j Cov Yi , Y j   d i d j Cov Yi , Y j ;
 i 1  i 1 i j i 1 j 1

y en particular Var d 0  d1Y1   d12VarY1 


m  m n
 
n
iii) Cov  ci X i ,  d j Y j    ci d j Cov X i , Y j (Operador Bilineal);
 i 1 j 1  i 1 j 1
y en particular Covc0  c1 X 1 , d 0  d1Y1   c1d1CovX 1 , Y1 

DAVID RUELAS RODRÍGUEZ 2-8


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Proposición
Bajo los supuestos del MRLS Yi   0  1 X i  ui :
i) E Yi X i    0  1 X i
ii) Var Yi X i    2
iii)  
Cov Yi , Y j X i , X j  0 para toda i ≠ j

Ejercicio E8 .

Para determinar esperanza, varianza y covarianza incondicionales de Y1, Y2,…, Yn es


necesario recordar las Leyes de Valor Esperado Iterado.

Teorema. Leyes de Valor Esperado Iterado.


Si X, Y y Z son variables aleatorias, entonces:
i) E Y   E E Y X 
ii) Var Y   E Var Y X   Var E Y X 
iii) CovY , Z   E CovY , Z X   CovE Y X , E Z X 

Proposición
Bajo los supuestos del MRLS Yi   0  1 X i  ui , considerando que Xi es estocástica:
i) E Yi    0  1 E  X i 
ii) Var Yi    2  12Var X i 
iii)    
Cov Yi , Y j  12Cov X i , X j para toda i ≠ j

2.2.3. Definición del MRLS.

Def. Modelo de Regresión Lineal Simple (MRLS).


Si (X1, Y1), (X2, Y2),…, (Xn, Yn) son n observaciones de la variable dependiente Y y la
variable explicativa X (n > 2 y no todas las Xi’s toman el mismo valor), cuya FRP es la
recta E Y X i    0  1 X i , entonces el Modelo de Regresión Lineal Simple (MRLS)
supone que valores Yi pueden ser modelados como la suma de esta media condicional y
un término de error ui de la siguiente manera:
Yi   0  1 X i  ui ,
donde los valores Xi son fijos y ui ~ iid(0,  2).

DAVID RUELAS RODRÍGUEZ 2-9


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.3. Estimadores de Mínimos Cuadrados.


El problema de estimación puntual parte del supuesto de que se tiene una muestra
aleatoria Y1, Y2,…, Yn de una población caracterizada por el parámetro  y el objetivo es
encontrar una estadística ˆ  g Y1 , Y2 ,, Yn  llamada estimador, que para una muestra
observada y1, y2,…, yn, permita obtener una estimación o aproximación del verdadero
valor de . A su vez, ˆ es una variable aleatoria (su valor cambia de muestra en
muestra) y su distribución de probabilidad se denomina distribución de muestreo.

Los estimadores más populares en Inferencia Estadística son los Estimadores de Máxima
Verosimilitud (EMV), sin embargo, para poder determinarlos es indispensable suponer
un modelo (o distribución) de probabilidad para Yi que dependa de , f Yi  yi   , que

permita calcular y maximizar la función de verosimilitud L    f Yi  yi  .


n

i 1

En el MRLS Yi   0  1 X i  ui los parámetros a estimar son 0 y 1, sin embargo,


ninguno de los supuestos del MRLS establece una distribución ni para los términos de
error ui, ni para la variable dependiente Yi. Adicionalmente, como en el MRLS se
supone que ui ~ iid(0,  2), también el parámetro  2 se debe estimar.

Ante esta dificultad es posible aplicar otro método de estimación de la Inferencia


Estadística denominado Mínimos Cuadrados Ordinarios (MCO), que fue formulado a
finales del siglo XVIII por Karl Friedrich Gauss (1777-1855) y por Adrien-Marie
Legendre (1752-1833).

2.3.1. Método de Mínimos Cuadrados Ordinarios (MCO).

Def. Función de Regresión Muestral (FRM). Es el lugar geométrico de las


estimaciones de las medias condicionales de la variable dependiente para los valores
 
fijos de la variable explicativa, es decir, Yˆi  Eˆ Y X i .

En el caso de la FRP lineal E Y X i    0  1 X i , su respectiva FRM lineal es


Yˆi  ˆ0  ˆ1 X i , donde ̂ 0 y ̂1 son los estimadores de 0 y 1, respectivamente.

Importante: En el contexto del MRLS la FRP E Y X i    0  1 X i es una recta teórica


no observable, pero a partir del conjunto de datos (X1, Y1), (X2, Y2),…, (Xn, Yn) se
buscarán ̂ 0 y ̂1 que permitan determinar la FRM Yˆi  ˆ0  ˆ1 X i . Esta recta estimada
cambiará con cada conjunto de datos observados (x1, y1), (x2, y2),…, (xn, yn).

DAVID RUELAS RODRÍGUEZ 2-10


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

La formulación teórica del MRLS supone que Yi se puede expresar como la suma de la
FRP E Y X i    0  1 X i y el término de error ui, sin embargo, estos componentes son
no observables. Para estimar los parámetros del MRLS se remplazará cada componente,
por su estimador para expresar a Yi como la suma de la FRM Yˆi  ˆ0  ˆ1 X i y del
residuo ûi como se muestra a continuación (ver figura 2.6):

Yi  Yˆi  uˆi  ˆ0  ˆ1 X i  uˆi

Figura 2.6

(X10,Y10) E[Y|Xi ] =  0 +  1 Xi FRP


Residuo positivo
^ ^ ^ ^ ^
u10 = Y10  Y10 > 0 Yi =  0 +  1 Xi FRM

^ ^ ^
Yi =  0 +  1 Xi + ui

Residuo negativo
^ ^
u5 = Y5  Y5 < 0
^
0
(X5,Y5)

0
0
0 0 Xi X

Def. Residuos.

uˆi  Yi  Yˆi

En general, en el Análisis de Regresión, los residuos ûi son los estimadores de los
términos de error ui.

Como la variación Yi  Yˆi puede ser positiva o negativa, en lugar de tomar su valor
absoluto se prefiere elevarla al cuadrado y trabajar con los cuadrados de los residuos
 2

uˆ 2  Y  Yˆ . Los Métodos de Mínimos Cuadrados buscan minimizar de manera
i i i

conjunta la suma de los cuadrados de los residuos (Mínimos Cuadrados Ordinarios) o un


promedio ponderado de ellos (Mínimos Cuadrados Generalizados).

Método de Mínimos Cuadrados Ordinarios (MCO).


n
Consiste en minimizar la suma de cuadrados de los residuos SCR   uˆi2
i 1

DAVID RUELAS RODRÍGUEZ 2-11


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Para el MRLS los residuos son de la forma uˆi  Yi  Yˆi  Yi  ˆ0  ˆ1 X i , de modo que la

   
n n
suma de cuadrados de residuos es SCR   uˆi2   Yi  ˆ0  ˆ1 X i
2
 g ˆ0 , ˆ1 .
i 1 i 1

Teorema. Estimadores MCO del MRLS


Para el MRLS Yi   0  1 X i  ui , donde ui ~ iid(0,  2):
S XY
i) ˆ1  y ˆ0  Y  ˆ1 X son los estimadores MCO de 1 y 0, respectivamente.
S X2
1 n 2
ii) ̂ 2  
n  2 i 1
uˆi es estimador insesgado de  2 .

Los estimadores MCO de ̂ 0 y ̂1 surgen directamente en el proceso de minimización


1 n 2
de la suma de cuadrados de residuos del MRLS. El estimador ̂ 2   uˆi se elige
n  2 i 1
así por conveniencia para poder hacer inferencia estadística al suponer normalidad en los
términos de error ui.

Al aplicar el método de MCO para estimar el MRLS aparecen 2 ecuaciones, llamadas


ecuaciones normales, que son útiles al analizar las propiedades de ̂ 0 , ̂1 y ̂ 2 .

Corolario. Ecuaciones Normales del MRLS


n n
i) Yi nˆ0  ˆ1  X i
i 1 i 1
n n n
ii)  X iYi  ˆ0  X i  ˆ1  X i2
i 1 i 1 i 1

EXCEL. Estimadores MCO de 0 y 1 . La funciones


=INTERSECCION.LINEAL(rangoY,rangoX) y =PENDIENTE(rangoY,rangoX)
calculan ̂ 0 y ̂1 , respectivamente, si los datos de la variable dependiente Y
están en el “rangoY” y los datos de la variable explicativa X están en el
“rangoX”.

Ejercicios E9 , E10 y E11 .

DAVID RUELAS RODRÍGUEZ 2-12


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.3.2. Modelo de regresión ajustado, valores ajustados y residuos.

Si se considera el MRLS Yi   0  1 X i  ui , para un conjunto de datos (Xi, Yi) es fácil


calcular los estimadores MCO ̂ 0 y ̂1 . A partir de esos valores es posible definir un
modelo determinista para modelar Y al considerar distintos valores de X, comparar los
valores reales contra los valores ajustados y analizar esas discrepancias.

Def. MRLS ajustado. Es la relación determinista Y  ˆ0  ˆ1 X  g  X  , también


llamada recta de regresión lineal.

Def. Valores ajustados. Son los valores estimados de Yi, es decir, Yˆi  ˆ0  ˆ1 X i .

A partir de los valores reales (Yi) y de los valores ajustados ( Ŷi ) es fácil calcular los
residuos uˆ  Y  Yˆ .
i i i

Propiedades del MRLS ajustado por MCO.


Si el MRLS Yi   0  1 X i  ui se estima por MCO, entonces:
i) La recta de regresión lineal siempre pasa por  X , Y  , es decir, Y  ˆ0  ˆ1 X .
ii) La media de los valores ajustados coincide con la media de los valores reales, es
decir, Yˆ  Y .

Demostración: (i) Evaluando g  X   ˆ0  ˆ1 X en X y sustituyendo el estimador MCO


 
de ˆ0 se obtiene g  X   ˆ0  ˆ1 X  Y  ˆ1 X  ˆ1 X  Y , por lo tanto Y  ˆ0  ˆ1 X ;
1 n 1 n
 1
   1 n 
y (ii) Yˆ   Yˆi   ˆ0  ˆ1 X i  nˆ0  ˆ1   X i   ˆ0  ˆ1 X , y de nuevo
n i 1 n i 1 n  n i 1 
 
sustituyendo el estimador MCO de ˆ0 se obtiene Yˆ  Y  ˆ1 X  ˆ1 X  Y .

Propiedades de los residuos.

Si el MRLS Yi   0  1 X i  ui se estima por MCO y uˆi  Yi  ˆ0  ˆ1 X i :


n
i) La suma de los residuos es cero:  uˆ
i 1
i  0.
n
ii) Los residuos y los regresores no están correlacionados:  uˆ X
i 1
i i 0
n
iii) Los residuos y los valores ajustados no están correlacionados:  uˆ Yˆ  0 .
i 1
i i

Ejercicios E12 y E13 .

DAVID RUELAS RODRÍGUEZ 2-13


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.4. Propiedades de los estimadores MCO.


2.4.1. Teorema de Gauss-Markov.

Def. Estimador Lineal

Se dice que ˆ  g Y1 , Y2 ,, Yn  es estimador lineal del parámetro  si g es función


n
lineal, es decir, ˆ  c1Y1  c2Y2    cnYn   ciYi , donde c1, c2,…, cn  R.
i 1

1 n n
1
Por ejemplo, la media muestral Y  
n i 1
Yi    Yi es un estimador lineal, donde
i 1  n 

1
ci  para i = 1, 2,… n. Los estimadores MCO del MRLS también lo son.
n

Lema

Los estimadores MCO del MRLS ̂ 0 y ̂1 son estimadores lineales:


n
Xi  X
i) ̂1   ciYi con ci  n
i 1
X i 1
i
2
 nX 2

n
1
ii) ̂ 0   d iYi con d i   Xci
i 1 n

S 1  n 2 
Demostración: (i) Se sabe que ˆ1  XY2 , donde S X2    X i  nX 2  y
SX n  1  i 1 
1 n
X i  X Yi  Y   1  X i  X Yi   X i  X Y   1  X i  X Yi
n n n
S XY  
n  1 i 1 n  1  i 1 i 1  n  1 i 1

 X  X Yi
n

1 n 
pues   X i  X    X i  n  X i   0 .
n n i
Entonces ˆ1  i 1
n
, es decir,
 n i 1 
i 1 i 1
X
i 1
i
2
 nX 2

n
Xi  X n
̂1   ciYi con ci  n
. (ii) Sustituyendo ̂1   ciYi en ˆ0  Y  ˆ1 X se
i 1
X
i 1
i
2
 nX 2 i 1

1 n
n n
1  n
1
obtiene ˆ0   Yi  X  ciYi     Xci Yi   d iYi con d i   Xci .
n i 1 i 1 i 1  n  i 1 n

DAVID RUELAS RODRÍGUEZ 2-14


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Teorema de Gauss-Markov

Bajo los supuestos del MRLS, los estimadores MCO ̂ 0 y ̂1 son los Mejores
Estimadores Lineales Insesgados (MELI)

De este teorema hay que aclarar lo siguiente:


 ̂ 0 y ̂1 efectivamente son estimadores lineales como se demostró previamente.

 ̂ 0 y ̂1 son los “mejores” estimadores lineales, pues dentro de su tipo, son los que
 
tienen menor varianza, es decir, Var ˆ  Var ˆ * para cualquier otro estimador
j  
j

lineal ˆ *j de  j , j = 0, 1.

 ̂ 0 y ̂1 insesgados significa que E ˆ j   j , j = 0, 1.  


Teorema

Bajo los supuestos del MRLS, los estimadores MCO ̂ 0 y ̂1 son consistentes.

Hay que recordar que ˆ  g Y1 , Y2 ,, Yn  es estimador consistente si ˆ 


p
 , es
  
decir, si lim P ˆ      0 o bien si lim P ˆ      1 para todo  > 0.
n 
n
n 
n 

2.4.2. Matriz de Varianzas y Covarianzas.

Teorema

Si ̂ 0 y ̂1 son los estimadores MCO del MRLS, entonces:


n

X 2

    2
  X 2
i
Var ˆ0  i 1
 , Var ˆ1 
2
y Cov ˆ0 , ˆ1  
n  X i  X   X X  X X
n n n
2 2 2
i i
i 1 i 1 i 1

Note cómo Var ̂ 0 , Var ̂1     


y Cov ˆ0 , ˆ1  dependen de  2 . Sus respectivos
estimadores, denotados por S 2ˆ , S 2ˆ y S ˆ ,ˆ , respectivamente, se definen del mismo
0 1 0 1

1 n 2
modo remplazando a  2 por ̂ 2  
n  2 i 1
uˆi , que es estimador insesgado de  2.

Ejercicios E14 , E15 y E16 .

DAVID RUELAS RODRÍGUEZ 2-15


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.5. Bondad de ajuste.


En el contexto del MRLS la bondad de ajuste quiere decir qué tan bien se ajusta la
recta de regresión lineal al conjunto de datos observados. La bondad de ajuste será
mejor en la medida en que todos los residuos uˆi  Yi  Yˆi sean pequeños. Para medir
dicha bondad de ajuste se define el coeficiente de determinación (R2).

2.5.1. Coeficiente de determinación (R2).

Si para la variable de interés Y se tienen los datos Y1, Y2,…, Yn, se sabe que el mejor
1 n
estimador de la media poblacional es la media muestral Y   Yi . En el contexto del
n i 1
MRLS, adicionalmente se cuenta con los datos X1, X2,…, Xn de la variable explicativa X,
que permiten modelar Yi  Yˆi  uˆi donde Yˆi  ˆ0  ˆ1 X i . De esta manera la variación
total Yi  Y se puede expresar como suma de la variación debida a la regresión (o
variación explicada por la regresión) Yˆ  Y , más la variación debida al residuo Y  Yˆ ,
i i i

como se muestra en la figura 2.7. Esta misma relación se mantiene al considerar las
variaciones al cuadrado.

Figura 2.7

(Xi, Yi) FRM


Yi
Variación debida ^
al residuo Yi  Yi
^
Yi Yi  Yi Variación
Variación debida ^ total
a la regresión Yi  Yi
Y

^
0

0
0 0 Xi X

Proposición
Si el MRLS se estima por MCO, entonces:
i) i    
Y  Y  Yˆ  Y  Y  Yˆ
i i i

 Y  Y    Yˆ  Y    Y  Yˆ 
n n n
2 2 2
ii) i i i i
i 1 i 1 i 1

DAVID RUELAS RODRÍGUEZ 2-16


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Demostración: (i) Se obtiene directamente sumando y restando Yˆi . (ii) Por propiedades
de la estimación MCO del MRLS Yi  ˆ0  ˆ1 X i  uˆi , Yˆi  ˆ0  ˆ1 X i , Y  ˆ0  ˆ1 X y
Yˆ  Y , de modo que Yˆi  Yˆi  Yˆi  Y  ˆ0  ˆ1 X i  ˆ0  ˆ1 X  ˆ1  X i  X  entonces  
 Yˆ  Y   ˆ  X  X  . Por
n n
2 2 2
elevando al cuadrado y sumando para i = 1, 2,…, n, i 1 i
i 1 i 1

su parte, Y  Y  ˆ  ˆ X  uˆ  ˆ  ˆ X   ˆ  X  X   uˆ , entonces elevando al


i 0 1 i i 0 1 1 i i

cuadrado Y  Y   ˆ  X  X   2ˆ  X  X uˆ  uˆ y sumando para i = 1, 2,…, n, se


2 2 2 2
i 1 i 1 i i i

tiene que  Y  Y   ˆ   X  X   2 ˆ  X  X uˆ   uˆ . Por propiedades


n n n n
2 2 2 2
i 1 i 1 i i i
i 1 i 1 i 1 i 1

 X  X uˆi   X i uˆi  X  uˆi  0  X 0  0 , por lo que se concluye


n n n
de los residuos i
i 1 i 1 i 1

 Y  Y    Yˆ  Y    uˆ
n n n
2 2 2
que i i i .
i 1 i 1 i 1

Esta última expresión establece que la suma de cuadrados totales SCT   Yi  Y 
n
2

i 1

 
n
es igual a la suma de cuadrados explicada SCE   Yˆi  Y
2
más la suma de
i 1

    uˆ
n n
cuadrados de los residuos SCR   Yi  Yˆi
2 2
i , es decir:
i 1 i 1

SCT  SCE  SCR

SCE SCR
Dividiendo esta última expresión entre SCT se obtiene 1   , es decir, el
SCT SCT
100% de la variación total se puede descomponer como la proporción o porcentaje
SCE
explicado por la regresión más la proporción o porcentaje explicado por los
SCT
SCR
residuos .
SCT

Def. Coeficiente de Determinación (R2)

 Yˆ  Y 
n 2
i
SCE
R2   i 1

 Y Y 
n
SCT 2
i
i 1

DAVID RUELAS RODRÍGUEZ 2-17


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

El coeficiente de determinación es una medida de bondad de ajuste que indica la


proporción o porcentaje de la variación cuadrática total que es explicada por la regresión
( 0  R 2  1 ). Si R 2  1 se tiene un buen ajuste (residuos pequeños), en cambio, si
R 2  0 se tiene un mal ajuste (residuos grandes).

Propiedades del Coeficiente de Determinación


n

SCR  uˆ 2
i
i) R2  1  1 i 1

 Y  Y 
n
SCT 2
i
i 1

 S2 
ii) R 2  ˆ12  X2 
 SY 
R 2  rXY 
2
iii)

2.5.2. Análisis de Varianza (ANOVA).

En el Análisis de Regresión a la descomposición SCT  SCE  SCR se le conoce como


Análisis de Varianza (ANOVA por sus siglas en inglés) y consiste en presentar estos
componentes en una tabla como se muestra en la figura 2.8.

Figura 2.8

Fuente de
Suma de cuadrados g.l. Suma de cuadrados medios
variación
   ˆ12  X i  X   ˆ12  X i  X 
n n n
Regresión SCE   Yˆi  Y
2 2
CME 
SCE 2
1
(explicada) i 1 i 1 1 i 1

    uˆ 1 n 2
n n
SCR
SCR   Yi  Yˆi  uˆ i  ˆ 2
2
Residuos
2
n–2 CMR  
n  2 n  2 i 1
i
i 1 i 1

SCT   Yi  Y  Yi  Y 2  S Y2


n
SCT 1 n

2
Total n–1 CMT  
i 1 n  1 n  1 i 1

A cada suma de cuadrados corresponden ciertos grados de libertad (g.l.), que son el
número de observaciones independientes requeridas para calcular dichas estadísticas.
SCT tiene n – 1 grados de libertad pues pierde un grado de libertad en el cálculo de Y ,
SCE tiene 1 grado de libertad pues sólo depende de ̂1 (las Xi’s son conocidas), y SCR
tiene n – 2 grados de libertad pues pierde dos grados de libertad en el cálculo de ̂ 0 y
̂1 . La suma de cuadrados medios es simplemente la suma de cuadrados totales entre
sus respectivos grados de libertad.

Ejercicios E17 y E18 .

DAVID RUELAS RODRÍGUEZ 2-18


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.6. Estimadores de Máxima Verosimilitud (EMV).


Para estimar el MRLS Yi   0  1 X i  ui bajo el Método de Máxima Verosimilitud es
necesario suponer una distribución de probabilidad para cada término de error ui. Para
cumplir con el resto de los supuestos del MRLS la distribución de ui debe tener media
cero y varianza constante  2. Por practicidad y conveniencia, para fines de inferencia
estadística se considerará a la Distribución Normal, es decir, ui ~ N(0,  2).

Teorema. Transformaciones Lineales de Distribuciones Normales

 
Si Y1, Y2,…, Yn son variables aleatorias independientes con Yi ~ N  i , i2 , i = 1, 2,…, n,
n
 n n
2 2
y c0, c1,…, cn son constantes entonces 
i 1
c Y
i i ~ N  
 i 1
c i i  ci  i  , y en particular,
 ,
i 1 

c0  c1Y1 ~ N c0  c1 1 , c12 12 
Def. Modelo de Regresión Lineal Simple Normal (MRLSN).
Si (X1, Y1), (X2, Y2),…, (Xn, Yn) son n observaciones de la variable dependiente Y y la
variable explicativa X (n > 2 y no todas las Xi’s toman el mismo valor), cuya FRP es la
recta E Y X i    0  1 X i , entonces el Modelo de Regresión Lineal Simple Normal
(MRLSN) supone que valores Yi pueden ser modelados como la suma de esta media
condicional y un término de error normal ui de la siguiente manera:
Yi   0  1 X i  ui ,
donde los valores Xi son fijos y ui ~ iid N(0,  2).

Proposición

Bajo los supuestos del MRLSN Y X i  ~ N  0  1 X i , 2 

Demostración: Bajo los supuestos del MRLSN los valores Xi son fijos e independientes
de los errores ui, de modo que E ui X i   E ui   0 y Var ui X i   Var ui    2 . Como
Yi   0  1 X i  ui es transformación lineal de una variable aleatoria normal, entonces
Yi también es normal con media E Y X i   E  0  1 X i  ui X i    0  1 X i y varianza
 
Var Y X i   Var  0  1 X i  ui X i    2 , por lo tanto, Y X i  ~ N  0  1 X i , 2 .

DAVID RUELAS RODRÍGUEZ 2-19


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Teorema. EMV del MRLSN


Para el MRLSN Yi   0  1 X i  ui , donde ui ~ iid N(0,  2):
S XY
i) ˆ1  y ˆ0  Y  ˆ1 X son los EMV de 1 y 0, respectivamente; y
S X2
1 n 2
ii) ˆ *2  
n i 1
uˆi es el EMV de  2 .

Ejercicio E19 .

Este teorema establece que los EMV y los estimadores MCO de 1 y 0 son los
mismos. De modo que suponer normalidad en los errores ui garantiza que ̂ 0 y ̂1
posean la propiedad de invarianza, así como las propiedades asintóticas de los EMV,
1 n
particularmente eficiencia y consistencia. Desafortunadamente ˆ *2   uˆi2 , el EMV
n i 1
de  , no es insesgado, por eso se preferirá estimar a  mediante el estimador
2 2

1 n 2
insesgado ̂ 2   uˆi .
n  2 i 1

Hay que recordar que ˆ  g Y1 , Y2 ,, Yn  es estimador eficiente si (i) es insesgado; y
(ii) es de mínima varianza, es decir, su varianza alcanza la Cota Inferior de Crámer-Rao:

    
2
 2 
, donde I    E  ln f Y Y      E  2 ln f Y Y   es la
ˆ 1
Var   CICR 
nI         
Información de Fisher.

Distribuciones de muestreo del MRLSN (2 conocida)


1 n 2
Si ̂ 0 y ̂1 son los EMV del MRLSN y ̂ 2   uˆi , entonces:
n  2 i 1
n

ˆ   0 X i
2

i) Z0  0 ~ N 0,1 , donde  2ˆ  i 1


2
 ˆ
n  X i  X 
0 n
2
0

i 1

ˆ1  1 2
ii) Z1  ~ N 0,1 , donde  2ˆ 
 ˆ
 X  X
1 n
2
1
i
i 1

iii) J
n  2ˆ 2
~  2 n  2
 2

DAVID RUELAS RODRÍGUEZ 2-20


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Estas distribuciones de muestreo son fáciles de deducir al recordar que ̂ 0 y ̂1 son
n
estimadores lineales, es decir, existen c1, c2,…, cn y d1, d2,…, dn tales que ˆ0   d iYi y
i 1
n
̂1   ciYi . Como Yi tiene una distribución normal, entonces ̂ 0 y ̂1 también tienen
i 1

una distribución normal, de hecho, ˆ0 ~ N  0 ,  2ˆ 0


 y ˆ 1 
~ N 1 ,  2ˆ .
1

1 n 2
Deducir la distribución de muestreo asociada a ̂ 2   uˆi no es tan directo, pero
n  2 i 1
la lógica es la misma que se utiliza para demostrar que si Y1, Y2,…, Yn es muestra
 
aleatoria con Yi ~ N Y ,  Y , i = 1, 2,…, n, entonces
2 n  1SY2
~  2 n  1 .
2
Y

El cálculo de Z0 y Z1 depende de  2ˆ y  2ˆ , que a su vez dependen de  2 . En realidad


0 1

la varianza de los errores  no se conoce y sólo se aproxima mediante ˆ 2 ,


2

modificando la distribución de muestreo asociada a ̂ 0 y ̂1 .

Distribuciones de muestreo del MRLSN (2 desconocida)


1 n 2
Si ̂ 0 y ̂1 son los EMV del MRLSN y ̂ 2   uˆi , entonces:
n  2 i 1
n

ˆ   0 X i
2

i) T0  0 ~ t n  2 , donde S 2ˆ  i 1
ˆ 2
n  X i  X 
n
S ˆ 0
2
0

i 1

ˆ1  1 ˆ 2
ii) T0  ~ t n  2 , donde S 
2
ˆ
 X  X
n
S ˆ 1
2
1
i
i 1

2.7. Estimación por intervalo y pruebas de hipótesis.


Es importante notar que en el contexto del MRLSN las estadísticas Z0, Z1, J, T0 y T1 son
cantidades pivotales (estadísticas que involucran a los parámetros de interés 0, 1 y
 2 , pero cuya distribución de probabilidad no depende de dichos parámetros), que
permiten construir fácilmente intervalos de confianza mediante el Método Pivotal y
que permiten ser consideradas como estadísticas de prueba en la formulación de
pruebas de hipótesis.

DAVID RUELAS RODRÍGUEZ 2-21


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

2.7.1. Intervalos de confianza sobre los parámetros del MRLSN.

La figura 2.9 muestra el resumen de los intervalos simétricos (misma área en cada cola)
con nivel de significancia 1 –  para estimar por intervalo los parámetros 0, 1 y  2 ,
bajo los supuestos del MRLSN.

Figura 2.9

Intervalo de confianza simétrico


Parámetro Pivote
con nivel de confianza 1 – 
n

ˆ0   0 X i
2

 T0  ~ t n  2 ˆ0  t  S ˆ donde S 2 


ˆ
i 1
ˆ 2
n X i  X 
n 2 , 0 n
S ˆ 2
0
2
0

i 1

ˆ1  1 ˆ1  t S ˆ donde S 2  ˆ 2


 T1  ~ t n  2 
ˆ
 X  X
n 2 , 1 1 n
2 2
S ˆ i
1
i 1

 n  2ˆ 2 n  2ˆ 2 
 2 J
n  2ˆ 2 ~  2 n  2  , 2 
2   n2 2,   n 2,1  
 2 2 

Es útil recordar que la distribución t de Student se puede aproximar mediante la


distribución Normal Estándar si sus grados de libertad tienden a infinito, es decir, para
muestras grandes los cuantiles t  pueden ser remplazados por z  .
n2, n2,
2 2

Ejercicios E20 y E21 .

2.7.2. Pruebas de hipótesis acerca de los parámetros del MRLSN.

De la relación entre los intervalos de confianza y las regiones de rechazo de las pruebas
de hipótesis es fácil inferir las regiones de rechazo de las pruebas de hipótesis para 0, 1
y  2 , bajo los supuestos del MRLSN.

Tomando en cuenta que 1 es relevante en la descripción de la relación entre la variable


de dependiente Y y la variable explicativa X (v.gr., efecto parcial, elasticidad o semi-
elasticidad dependen de 1), es útil probar H0: 1 = 1,0 vs H1: 1 ≠ 1,0, donde 1,0 es un
valor particular del espacio paramétrico de 1.

La figura 2.10 muestra estadísticos de prueba y regiones de rechazo (RR) para pruebas
de tamaño  (de una y dos colas) para 0, 1 y  2 bajo los supuestos del MRLSN.

DAVID RUELAS RODRÍGUEZ 2-22


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Figura 6.6

H0: vs. H1: RR = Estadístico de prueba


 0   0, 0 t  t
  0 n  2 ,
ˆ0   0,0
0 =0,0  0   0 , 0 0 t  t n  2 ,
T0  ~ t n  2 
   t  t  S ˆ
 0  0
0
0,0 n 2, 2

1  1, 0 t  t
  1 n  2 ,
ˆ1  1,0
1 =1,0 1   1, 0 t1  t n  2, T1  ~ t n  2 
   t  t  S ˆ
 1  1
1
1, 0 n  2, 2

 2   02 j  2
n  2 ,1
 2  n  2ˆ 2
 2   02     0  j   n  2, ~  2 n  2 
2 2
J
   2 j   2

2
0 
2
n  2 ,1 2
, j   n2 2, 
2

Las pruebas para 0 y 1 se denominan Pruebas T.

La mayoría de los paquetes estadísticos calculan la estadística de prueba bajo la


hipótesis nula y la acompañan de su respectivo valor-p. Sobre el valor-p hay que
recordar que:
 Se calcula como la probabilidad de obtener un valor de la estadística de prueba tan
extremo como el observado al evaluar la región de rechazo dado H0 verdadero.
 Se rechaza H0 siempre que  > valor-p.
 Si valor-p  0 entonces H0 siempre se rechaza.

Desde el punto de vista del modelaje Econométrico es relevante:


 Rechazar H0: 0 = 0, pues de lo contrario es necesario evaluar la necesidad de hacer
la estimación del MRLS sin intercepto Yi  1 X i  ui , con la posibilidad de que los
residuos no sumen cero o que el coeficiente de determinación deje de tener
interpretación como porcentaje (ver problema 11 de la Tarea 1); y
 Rechazar H0: 1 = 0, pues de lo contrario se debería hacer la estimación de
Yi   0  ui , es decir, la variable X en realidad no explica a la variable de interés Y.

Si se rechaza H0: 1 = 0 entonces hay evidencia estadística de que la variable X


realmente explica a la variable de interés Y. Una manera alternativa de probar H0: 1 = 0
es considerar la suma de cuadrados medios de la tabla ANOVA.

Proposición
CME n  2SCE
Bajo los supuestos del MRLSN, si 1 = 0, entonces F   ~ F 1, n  2
CMR SCR

DAVID RUELAS RODRÍGUEZ 2-23


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Teorema. Prueba F (ANOVA).


Para el MRLSN Yi   0  1 X i  ui , donde ui ~ iid N(0,  2), si se quiere probar

  0 (una cola )  f  f1,n2, (una cola )



H0: 1 = 0 vs. H1:  1 , entonces RR = f  f (dos cola ) ,
1  0 (dos cola )  1, n  2 ,

2

CME n  2 SCE
donde F   ~ F(1,n – 2).
CMR SCR

Ejercicios E22 y E23 .

2.8. Predicción en el MRLS.


Si el MRLS estimado Yˆi  ˆ0  ˆ1 X i es significativo, uno de sus principales usos es el
pronóstico o predicción de la media condicional E Y0 X 0  o del valor individual Y0
para un valor X 0 de la variable explicativa X. A estas predicciones también se les suele
llamar interpolación si X0 se ubica dentro del conjunto original de datos Xi, o
extrapolación si X0 queda fuera de dicho conjunto.

2.8.1. Predicción de la media condicional.

Dado que la variable explicativa X toma el valor X0, el valor de la media poblacional
(ubicado sobre la FRP pero no observable) es E Y0 X 0    0  1 X 0 y para estimarla
basta sustituir los estimadores MCO de ˆ y ̂ . 0 1

Teorema. Predicción puntual de la media condicional

Bajo los supuestos del MRLS, el estimador puntual de E Y0 X 0    0  1 X 0 es


Eˆ Y0 X 0   Yˆ0*  ˆ0  ˆ1 X 0 , donde:
i) Yˆ0* es MELI.
 
ii)  
1
Var Yˆ0*   2  
X 0  X  
2

n X i  X 2 
n

 
i 1 

 
Para calcular SY2ˆ* , el estimador de Var Ŷ0* , basta sustituir  2 por ̂ 2 
0
1 n 2
 uˆi .
n  2 i 1

DAVID RUELAS RODRÍGUEZ 2-24


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Bajo el supuesto de normalidad en los errores es fácil ver que Yˆ0* sigue una distribución
Yˆ *   0  1 X 0 
normal, de modo que 0  
~ N 0,1 , y sustituyendo Var Ŷ0* por SY2ˆ* se
Var Yˆ *
 
0
0

Yˆ   0  1 X 0 
*
obtiene el pivote 0
~ t n  2 .
SYˆ *
0

Teorema. Predicción por intervalo de la media condicional


Bajo los supuestos del MRLSN, el intervalo de confianza simétrico al 100(1 – )% para
 
1
E Y0 X 0    0  1 X 0 es ˆ0  ˆ1 X 0  t  SYˆ * , donde SY2ˆ*  ˆ 2   n 0
X  X  2 

n2, n
 X i  X 2 
0 0
2
 i 1 

Ejercicio E24 .

2.8.2. Predicción individual.

Dado que la variable explicativa X toma el valor X0, su respectivo valor individual Y0
está dado por Y0   0  1 X 0  u 0 . Como el término de error u0 tiene media cero lo más
razonable es eliminarlo en la estimación ( uˆ0  0 ) y simplemente sustituir los
estimadores MCO de ˆ y ̂ . 0 1

Teorema. Predicción puntual de valores individuales


Bajo los supuestos del MRLS, el estimador puntual de Y0   0  1 X 0  u 0 es
Yˆ  ˆ  ˆ X , donde:
0 0 1 0

i) Yˆ0 es MELI.
 
ii) 
 1

Var Y0  Yˆ0   2 1   n 0
X  X  2 

 n
   Xi  X  
2

i 1

A la diferencia e0  Y0  Yˆ0 se le denomina error de predicción. Para estimar su


1 n 2
varianza, SY2 Yˆ , basta sustituir  2 por ̂ 2 
0 0
 uˆi .
n  2 i 1

DAVID RUELAS RODRÍGUEZ 2-25


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 2

Importante: Al pronosticar la media condicional E Y0 X 0    0  1 X 0 se está


estimando un parámetro y en ese contexto es posible hablar de intervalos de confianza.
Al pronosticar un valor individual Y0   0  1 X 0  u 0 no se está pronosticando un
parámetro sino una variable aleatoria y por lo tanto no es posible hablar de intervalos
de confianza sino de intervalos de predicción.

Bajo el supuesto de normalidad en los errores es fácil ver que e0  Y0  Yˆ0 tiene una

distribución normal con media cero y varianza Var Y0  Yˆ0 , de modo que 
Y0  Yˆ0
~ N 0,1 , y sustituyendo Y0  Yˆ0 por SY2 Yˆ se obtiene la estadística

Var Y0  Y0 ˆ  0 0

Y0  Yˆ0
~ t n  2 .
SY Yˆ
0 0

Teorema. Predicción por intervalo de valores individuales


Bajo los supuestos del MRLSN, el intervalo de predicción simétrico al 100(1 – )% para
 
 1
Y0   0  1 X 0  u 0 es ˆ0  ˆ1 X 0  t  SY Yˆ , donde SY2 Yˆ  ˆ 2 1   n 0
X  X  2 

n2,  n
 X i  X 2 
0 0 0 0
2
 i 1 

Sobre la predicción por intervalo hay que notar lo siguiente:


 La longitud del intervalo de predicción del valor individual Y0 siempre es mayor que
la longitud del intervalo de confianza de la media condicional E Y0 X 0    0  1 X 0 .
 Al lugar geométrico de los extremos de los intervalos de predicción para todos los
posibles valores de X0 se denominan bandas de predicción, y su amplitud es más
pequeña para valores de X0 cercanos a X .

Antes de finalizar con el Análisis de Regresión Simple es importante notar que la


estimación, la bondad del ajuste y la predicción serán válidas únicamente si se
cumplen los 8 supuestos del MRLNSN. Las técnicas para hacer la validación de
supuestos y, en su caso, corregirlos se estudiará más adelante.

En la práctica la, estimación, validación de supuestos, bondad de ajuste y predicción del


MRSL (y del MRLSN) se realiza mediante paquetes de cómputo (v.gr., Excel, E-Views,
R, Stata, Minitab, Statgraphics).

EXCEL. Análisis de Regresión. Instalar el complemento “Herramienta para Análisis” e


iniciarlo mediante Datos > Análisis de datos > Regresión.

Ejercicios E25 , E26 y E27 .

DAVID RUELAS RODRÍGUEZ 2-26


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3. Modelo de Regresión Lineal Múltiple

3.1. Modelo de Regresión Lineal Múltiple (MRLM).


El Análisis de Regresión Multivariado o Múltiple estudia la dependencia de una
variable de interés (Y) respecto de k variables explicativas (X1, X2,…, Xk). Su objetivo es
estimar o predecir la media poblacional de Y suponiendo conocidos los valores de X1,
X2,…, Xk, es decir, la FRP E Y X 1 , X 2 ,, X k   g  X 1 , X 2 ,, X k  .

Para la Regresión Múltiple se considerarán arreglos ordenados de datos correspondientes


a una muestra de n observaciones, es decir, (X1i, X2i,…, Xki, Yi), i = 1, 2,…, n; donde Xj1,
Xj2,…, Xjn, son n valores fijos de la j-ésima variable explicativa, j = 1, 2,…, k.

En forma similar al MRLS, para el caso multivariado se analizará el caso en que la FRP
toma una forma lineal, es decir, E Y X 1i , X 2i ,  , X ki    0  1 X 1i   2 X 2i     k X ki .

El Modelo de Regresión Lineal Múltiple (MRLM) establece que los valores Yi pueden
ser modelados como la suma de esta media condicional lineal y un término de error ui de
la siguiente manera:

Yi   0  1 X 1i   2 X 2i     k X ki  ui , donde ui ~ iid(0,  2).

Con fines de estimación se asumirán los siguientes supuestos.

Supuestos del Modelo de Regresión Lineal Múltiple


i) El modelo es lineal en parámetros (no necesariamente en variables).
ii) 
Las variables Xj son no estocásticas e independientes de ui : Cov ui , X ji  0 . 
iii) La media del error es cero: E ui   0 .
iv) La varianza del error es constante: Var ui    2 (homocedasticidad).
v)  
Los errores son independientes y no correlacionados: Cov ui , u j  0 , i ≠ j.
vi) El número de observaciones (n) debe ser mayor al número de parámetros a
estimar: n > k + 1.
vii) Los valores de cada variable Xj no pueden ser todos iguales y no deben existir
observaciones atípicas.
viii) No debe haber colinealidad entre las variables Xj.
ix) No debe haber sesgo de especificación.

DAVID RUELAS RODRÍGUEZ 3-1


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Los supuestos (i) a (vii) son los mismos que se consideraron en el MRLS.

Al supuesto (viii) se le denomina de no colinealidad y significa que ningún regresor


puede expresarse como combinación lineal de algunos otros regresores. Si existen
constantes c1,…, ck, tales que X j   ch X h para alguna ch ≠ 0, entonces se dice que
h j

hay problema de multicolinealidad.

El sesgo de especificación del supuesto (ix) significa que los regresores considerados en
el modelo son consistentes con el planteamiento teórico que hay detrás de un modelo.
Por ejemplo, en Microeconomía la Teoría del Productor establece que la función de
 
producción Cobb-Douglas en su forma econométrica está dada por Pi   0 Li 1 K i 2 e ui ,
donde Pi es la producción, Li el insumo trabajo, Ki el insumo capital y ui es perturbación
estocástica. Su respectivo MRLM es lnPi    0  1 lnLi    2 lnK i   ui , donde
 0  ln 0  , 1   1 y  2   2 . Si se estima el modelo lnPi    0  1 ln Li   ui
entonces se estaría incurriendo en un sesgo de especificación pues al omitir el regresor
ln(Ki) no se estaría considerado el “modelo verdadero”.

Notación: Para el análisis del MRLM es útil considerar datos, parámetros y errores en
forma de vectores (letras minúsculas negritas) y matrices (letras mayúsculas negritas).

De este modo las n observaciones de la variable de interés, los k + 1 parámetros y los n


términos de error se pueden representar mediante los vectores:

Y1   0   u1 
Y    u 
y   2 ,    1 y u   2 .
   
     
Yn   k  u n 

Por su parte, los valores de las n variables explicativas se pueden acomodar en una
matriz de dimensión n  (k + 1), con un renglón por cada observación, una columna por
cada variable y una columna auxiliar de unos, de la siguiente manera:

1 X 11 X 21  X k1 
1 X X 22  X k 2 
X 12
.
    
 
1 X 1n X 2n  X kn 

A la matriz X se le conoce como matriz de diseño, y permite expresar simultáneamente


las n observaciones del MRLM de mantera compacta: y  X  u . Note que la FRP es
simplemente E y X  X . Agregando los supuestos se puede definir formalmente el
MRLM de la siguiente manera.

DAVID RUELAS RODRÍGUEZ 3-2


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Def. Modelo de Regresión Lineal Múltiple (MRLM).


Si (X1i, X2i,…, Xki, Yi), i = 1, 2,…, n, j = 1, 2,…, k, son n observaciones de la variable
dependiente Y acomodadas en el vector y, y n observaciones de las variables explicativas
X1, X2,…, Xk (n > k + 1 y no todas las Xji’s toman el mismo valor) acomodadas en la
matriz de diseño X, cuya FRP es E y X   X , entonces el Modelo de Regresión Lineal
Múltiple supone que y puede ser modelado como la suma de esta media condicional y un
vector de errores u de la siguiente manera:
y  X  u ,
donde X es no estocástica, XX es no singular y u ~ 0, 2 I  .

Note que 0 es un vector de n ceros (o vector nulo), I es una matriz identidad de


dimensión n  n y  2 una constante positiva (o un escalar positivo). En esta definición
se incluyen todos los supuestos establecidos previamente, excepto el (ix) de no sesgo de
especificación. Si XX es no singular significa: (i) que sus columnas son linealmente
independientes, lo que garantiza la no colinealidad; y (ii) que su inversa XX  existe.
1

Def. Esperanza y Varianza de Vectores Aleatorios


Si w es el vector aleatorio que contiene a las n variables aleatorias W1, W2,…, Wn:
 E W1   1 
 E W    
i) E w    2 
  2  
   
   
 E Wn    n 

ii) Var w   E w   w    
 
 E W1  1 2
E W1  1 W2   2    E W1  1 Wn   n   



 E W2   2 W1  1   
E W2   2 
2
 
 E  W2   2 Wn   n  
    

 E  Wn   n W1  1   E Wn   n W2   2    
E Wn   n 
2
 


 VarW1  CovW1 ,W2   CovW1 ,Wn 


CovW ,W  VarW2   CovW2 ,Wn 
 1 2
 ΣW
    
 
CovW1 ,Wn  CovWn ,W2   VarWn  

Note que Var w   Σ w es la matriz de varianzas y covarianzas y por propiedades de la


covarianza es una matriz simétrica, es decir, Σw  Σ w .

DAVID RUELAS RODRÍGUEZ 3-3


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

La expresión u ~ 0, 2 I  es una manera compacta de establecer los supuestos (iii), (iv) y
(v) acerca del término de error pues E u   0  E ui   0 para todo i = 1, 2,…, n; y
 
Var u   2 I  Var ui    2 para todo i = 1, 2,.., n, y Cov ui , u j  0 para todo i ≠ j.

Antes de estimar el MRLM es necesario recordar algunos conceptos de Álgebra Lineal


útiles en el Análisis de Regresión.

3.2. Álgebra matricial del MRLM.


3.2.1. Operaciones con Matrices.

Def. Matriz Transpuesta. Si A es matriz de dimensión m  n, con elementos aij,


entonces A es la matriz transpuesta de A y es una matriz de dimensión n  m con
elementos aji.

EXCEL. Matriz transpuesta. La función matricial =TRANSPONER(rango), permite


calcular la transpuesta de una matriz (o vector) ubicada en un “rango”. Por ser
función matricial primero hay que seleccionar las celdas en donde quedará la
correspondiente matriz (o vector) transpuesta y después de escribir la función
presionar simultáneamente Ctrl + Shift + Enter.

Def. Producto Matricial. Si A es matriz de dimensión m  n con elementos aij, y B es


matriz de dimensión n  p con elementos bij, entonces C = AB es una matriz de
n
dimensión m  p con elementos cij   aik bkj . Este producto no es conmutativo.
k 1

EXCEL. Producto Matricial. La función matricial =MMULT(rango1,rango2), permite


calcular el producto matricial de las matrices ubicadas en el “rango1” y el
“rango2”. Por ser función matricial primero hay que seleccionar las celdas en
donde quedará la correspondiente matriz y después de escribir la función
presionar simultáneamente Ctrl + Shift + Enter. Nota: aunque no haya
coincidencia entre columnas del “rango1” y los renglones del “rango2”, esta
función generará un resultado que no corresponde al producto deseado.

Def. Producto Interior y Producto Exterior. El producto interior (también llamado


producto punto o producto escalar) de los vectores a y c de dimensión n se define como
n
ac  a1c1  a2 c2    an cn   ai ci , es decir, produce un escalar. En cambio, el
i 1
producto exterior ac produce una matriz.

DAVID RUELAS RODRÍGUEZ 3-4


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Def. Determinante de una Matriz. El determinante de la matriz cuadrada A, denotado


por |A| o det(A), es un escalar que se puede calcular de manera recursiva por la
expansión de Laplace o expansión de cofactores. En particular para n =2:

a11 a12
 a11a 22  a12 a 21
a 21 a22

   
Y para n = 3, considerando el primer renglón de la matriz de signos    
   

a11 a12 a13


a22 a23 a21 a23 a21 a22
a21 a22 a23  a11  a12  a13
a32 a33 a31 a33 a31 a32
a31 a32 a33
 a11 a22 a33  a23 a32   a12 a21a33  a23 a31   a13 a21a32  a22 a31 

EXCEL. Determinantes. La función matricial =MDETERM(rango), permite calcular el


determinante de una matriz cuadrada ubicada en un “rango”. Por ser función
matricial primero hay que seleccionar la celda en donde quedará el escalar
correspondiente y después de escribir la función presionar simultáneamente
Ctrl + Shift + Enter.

Def. Matriz Inversa. Si A es matriz cuadrada de dimensión n  n se dice que A–1 es su


matriz inversa si A–1A = AA–1 = I, donde I es la matriz identidad de dimensión n  n.

Existen distintos métodos para calcular la inversa de una matriz:


 Eliminación Gaussiana: Parte de la matriz aumentada [A | I] y consiste en hacer
operaciones elementales por renglón hasta obtener [I | A–1].
1
 Solución Analítica: A 1  AdjA  , donde AdjA   C es la matriz adjunta de A y
A
es la transpuesta de la matriz de cofactores C. Los elementos de la matriz C son de la
forma Cij   1 M ij , donde Mij es el menor de la matriz A y es el determinante de
i j

la submatriz que se genera al eliminar el renglón i y la columna j de la matriz A.

En particular para n =2:

1
 a11 a12  1  a22  a12 
a 
 21 a22  a11a22  a12 a21  a
 21 a11 

DAVID RUELAS RODRÍGUEZ 3-5


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

EXCEL. Matriz Inversa. La función matricial =MINVERSA(rango), permite calcular la


inversa de una matriz cuadrada ubicada en un “rango”. Por ser función
matricial primero hay que seleccionar el rango donde quedará la matriz inversa
y después de escribir la función presionar simultáneamente Ctrl + Shift + Enter.

Def. Traza. Si A es matriz cuadrada de dimensión n  n se dice su traza es la suma de


n
los elementos de su diagonal principal, es decir, tr A    aii .
i 1

Propiedades de las Operaciones con Matrices


Si a y b son vectores de dimensión n, y A, B y C son matrices de dimensión n  n:
i) ab  ba viii) A 
1 1
A
n
ii) aa   ai2  0 ix) AB  A B
i 1

 1
iii) ab  ba x) A 1 
A

iv) A  A xi) cA  c n A

v) A  B   A  B xii) tr cA   ctr A 

vi) AB   BA xiii) tr A  B   tr A   tr B 

vii) A   A
1 1
xiv) tr ABC   tr CBA  y cualquier
otra permutación posible.

3.2.2. Otros conceptos y propiedades relevantes del álgebra matricial.

Def. Matriz Simétrica. Se dice que la matriz cuadrada A es simétrica si A  A , es


decir, aij = aji.

Def. Matriz Idempotente. Se dice que la matriz cuadrada A es idempotente si se


cumple que A  A 2  A 3   , donde A 2  AA , A 3  AAA , etc.

DAVID RUELAS RODRÍGUEZ 3-6


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Def. Vectores Linealmente Independientes. Se dice que los vectores a1, a2,…, ak son
linealmente independientes si ninguno de ellos puede ser escrito como combinación
lineal de los otros, es decir, si la única solución de c1a1  c2 a 2    ck a k  0 es
c1  c2    ck  0 .

Def. Rango. El rango de la matriz A, denotado por Rango(A), es el número de


columnas o renglones linealmente independientes. Si A es matriz cuadrada de
dimensión n  n y su rango es n, entonces se dice que es matriz de rango completo.

Def. Forma Cuadrática. Se dice que el escalar q  cAc es una forma cuadrática si A
es una matriz simétrica y c es un vector no nulo.

Def. Matriz Positiva Definida. Se dice que la matriz cuadrada A de dimensión n  n es


positiva definida si cAc  0 para todo vector no nulo c de dimensión n. Si cAc  0 se
dice que A es matriz es positiva semidefinida.

Def. Matriz Negativa Definida. Se dice que la matriz cuadrada A de dimensión n  n


es negativa definida si cAc  0 para todo vector no nulo c de dimensión n. Si cAc  0
se dice que A es matriz es negativa semidefinida.

Def. Matriz Diagonal. Se dice que la matriz cuadrada D es matriz diagonal si dij = 0
para toda i ≠ j, es decir, si los elementos fuera de la diagonal principal son ceros.

Def. Matriz Ortogonal. Se dice que Q es matriz ortogonal si su inversa es simplemente


su transpuesta, es decir, Q 1  Q .

Propiedades Matriciales
Si A es matriz de dimensión n  n, B es matriz de dimensión n  m, c es un vector de
dimensión n, y D es matriz diagonal de dimensión n  n, entonces:
i) Si A es de rango completo entonces A  0
ii) Si A es de rango completo entonces A–1 siempre existe.
iii) AA siempre es matriz simétrica.
iv) Si A es de rango completo AA siempre es positiva definida.
v) Si A es idempotente entonces Rango(A) = tr(A).
vi) Si A es positiva definida y Rango(B) = m, entonces BAB es positiva definida.

vii) Si A es simétrica, entonces cAc   cAc .
n
viii) D   d ii
i 1

DAVID RUELAS RODRÍGUEZ 3-7


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.2.3. Diferenciación Matricial.

Def. Derivada Matricial


Si c es vector de dimensión n y z = g(c) donde g: Rn  R, entonces:
    2 2 2 
 c g c   g c  g c   g c 
 c21
2
c1c 2 c1cn 
 1 
  g c    2
2
 
z  y  z
2
 2
g c  g c   g c 
 g c    c2   g c    c2 c1 c 22 c 2 cn
c c    cc cc  
    2   
g c    2 2 
 c c g c  c c g c   g c  

 cn   n 1 n 2 cn 2

Proposición
Si a y c son vectores de dimensión n, 0 es el vector nulo de dimensión n, 1 es el vector
de unos de dimensión n, A es matriz simétrica de dimensión n  n, g y h son funciones
(g, h: Rn  R) y k es un escalar, entonces:

i) aa   0
c

ii) c1  1
c

iii) kg c   k  g c
c c

iv) g c   hc    g c    hc 
c c c

v) ac    ca   a
c c

vi) cAc  2Ac
c
2 2
vii) a c   O nn y
 cAc  2A
cc cc

n
Demostración: (i) a (iv) son triviales. (v) Recuerde que ac  ca   ai ci de donde se
i 1


observa que ac    ca   ai para i = 1, 2,…, n, de modo que el vector con todos
ci ci

estos elementos es simplemente el vector a, es decir, ac    ca   a . (vi) Se
c c
considerará el caso en que n = 3:

DAVID RUELAS RODRÍGUEZ 3-8


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

 a11 a12 a13   c1   c1a11  c2 a12  c3 a13 


cAc  c1 c2 c3  a12 a22 a23  c2   c1 c2 c3  c1a12  c2 a22  c3 a23 
 a13 a23 a33  c3   c1a13  c2 a23  c3 a33 
 c1 c1a11  c2 a12  c3 a13   c2 c1a12  c2 a22  c3 a23   c3 c1a13  c2 a23  c3 a33 
 c12 a11  c22 a22  c32 a33  2c1c2 a12  2c1c3 a13  2c2 c3 a23

 
Entonces cAc  2c1a11  2c2 a12  2c3 a13 , cAc  2c1a12  2c2 a22  2c3a23 y
c1 c2

cAc  2c1a13  2c2 a23  2c3 a33 , y factorizando el 2 de cada componente se obtienen
c3

los renglones de la matriz Ac , por lo tanto, cAc  2Ac .
c

Ejercicio E28 .

3.3. Estimación por MCO del MRLM.

En forma análoga al caso simple, en el MRLM se busca estimar la FRP


E Y X 1 , X 2i ,  , X ki    0  1 X 1i   2 X 2i     k X ki mediante la Función de
Regresión Muestral (FRM) Eˆ Y X , X ,  , X   Yˆ  ˆ  ˆ X  ˆ X    ˆ X ,
1i 2i ki i 0 1 1i 2 2i k ki

i = 1, 2,…, n, donde ˆ0 , ̂1 ,…, ˆk son los estimadores de los parámetros 0, 1,…, k.

Si ŷ denota el vector de dimensión n con los valores ajustados Yˆ1 , Yˆ2 ,…, Yˆn , y ˆ
denota el vector de dimensión k + 1 con los estimadores ˆ0 , ̂1 ,…, ˆk , entonces la
FRM se puede escribir como yˆ  Xˆ , y es el estimador de la FRP E y X  X .

Además, si û denota el vector de dimensión n con los residuos û1 , û 2 ,…, û n , entonces
el vector de observaciones y se puede expresar como suma de la FRM yˆ  Eˆ y X  Xˆ
y el vector de residuos û como se muestra a continuación:

y  yˆ  uˆ  Xˆ  uˆ

Es fácil ver que el vector de residuos se puede expresar de la siguiente manera:

uˆ  y  yˆ

DAVID RUELAS RODRÍGUEZ 3-9


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Al aplicar el Método de Mínimos Cuadrados Ordinarios, la Suma de Cuadrados de




  
n
Residuos se puede expresar como SCR   uˆi2  uˆ uˆ  y  Xˆ y  Xˆ  g ˆ , donde
i 1

g: Rn  R es la función a minimizar.

Teorema. Estimadores MCO del MRLM

Para el MRLM y  X  u , donde u ~ 0, 2 I  y XX es no singular:


i) ˆ  XX 1 Xy  es el estimador MCO de  .
uˆ uˆ
ii) ˆ 2  es estimador insesgado de  2 .
n  k  1

El vector de estimadores MCO ˆ surge directamente en el proceso de minimización de


uˆ uˆ
la suma de cuadrados de residuos del MRLM. El estimador ˆ 2  se elige así
n  k  1
por ser estimador insesgado.

En forma análoga al caso simple, al plantear las condiciones de primer orden en la


aplicación del Método MCO surgen las llamadas ecuaciones normales.

Corolario. Ecuaciones Normales del MRLM

XX ˆ  Xy

Ejercicios E29 y E30 .

A partir de los estimadores MCO es posible definir el MRLM ajustado, que es


simplemente la relación determinista Yˆ  ˆ0  ˆ1 X 1  ˆ2 X 2    ˆk X k . A partir de los
valores reales y y de los valores ajustados yˆ  Xˆ es fácil calcular los residuos
uˆ  y  yˆ , que satisfacen las siguientes propiedades:

Propiedades de los residuos.

Si el MRLM y  X  u se estima por MCO y uˆ  y  yˆ  y  Xˆ :


i) Los residuos y los regresores no están correlacionados: Xˆu  0
n
ii) La suma de los residuos es cero:  uˆ
i 1
i  0.

iii) Los residuos y los valores ajustados no están correlacionados: yˆ uˆ  0 .

Ejercicios E31 y E32 .

DAVID RUELAS RODRÍGUEZ 3-10


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.4. Propiedades estadísticas de los estimadores MCO.


3.4.1. Esperanza y Varianza de los estimadores MCO.

Teorema
uu
Si ˆ  XX  Xy  y ˆ 2 
1
son los estimadores MCO del MRLN
n  k  1
y  X  u , donde u ~ 0, 2 I  y XX es no singular, entonces:
i) ˆ  XX 1 Xy  es estimador insesgado de  .
ii) 
Var ˆ  Σ ˆ   2 XX  es la matriz de varianzas-covarianzas de ˆ .
1

uˆ uˆ
iii) ˆ 2  es estimador insesgado de  2 .
n  k  1

Para estimar la matriz de varianzas-covarianzas de ˆ basta remplazar a  2 por


uˆ uˆ ˆ ˆ  ˆ 2 XX 1 .
ˆ 2  , de modo que Σ
n  k  1 

Al estimar el MRLM por MCO es posible escribir el vector de residuos como sigue:

 
uˆ  y  yˆ  y  Xˆ  y  X XX  Xy   y  Hy  I  H y  My
1

A la matriz H  XXX  X se le conoce como matriz gorro (hat matrix), es de


1

dimensión n  n, y geométricamente es la proyección ortogonal sobre el espacio de


columnas de la matriz de diseño X; de hecho, tr(H) = Rango(X). La matriz M  I  H
tiene las siguientes propiedades: (i) es simétrica e idempotente; (ii) MX  O n  k 1 ; y
(iii) Muˆ  uˆ (ver Tarea 2).

uˆ uˆ
La matriz M es útil para demostrar que ˆ 2  es insesgado y para calcular la
n  k  1
matriz de varianzas-covarianzas del vector de residuos. Bajo los supuestos del MRLM
se puede demostrar que Var uˆ    2 M .

3.4.2. Teorema de Gauss-Markov.

Teorema de Gauss-Markov

Bajo los supuestos del MRLM, el estimador MCO ˆ es MELI.

Ejercicios E33 y E34 .

DAVID RUELAS RODRÍGUEZ 3-11


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.5. R2 y R2 ajustada.
En el contexto del MRLM la bondad de ajuste se enfoca en determinar qué tan bien se
ajusta el modelo lineal en parámetros al conjunto de datos observados. En forma
completamente análoga al MRLS, en el MRLM se considerará el coeficiente de
determinación ( R 2 ), pero adicionalmente se definirá el coeficiente de determinación
ajustado ( R 2 ) que permite comparar modelos con distinto número de regresores.

Proposición. Descomposición de la SCT


Si el MRLM y  X  u se estima por MCO, entonces SCT  SCE  SCR , donde
n
SCT  y y  nY 2 , SCE  ˆ  XXˆ  nY 2 y SCR  uˆ uˆ   uˆi2 .
i 1

Demostración: Al estimar por MCO, los valores observados se pueden expresar como
los valores ajustados más los residuos, es decir, y  yˆ  uˆ . Entonces la suma de

cuadrados de las Yi’s es y y  yˆ  uˆ  yˆ  uˆ   yˆ yˆ  yˆ uˆ  uˆ yˆ  uˆ uˆ  yˆ yˆ  uˆ uˆ pues los
residuos y los valores ajustados no están correlacionados ( yˆ uˆ  uˆ yˆ  0 ). Se sabe que

la suma de cuadrados totales es SCT   Yi  Y    Yi 2  nY 2  y y  nY 2 entonces


n n
2

i 1 i 1

y y  nY 2  yˆ yˆ  nY 2  uˆ uˆ . Finalmente, sustituyendo yˆ  Xˆ y yˆ   Xˆ  ˆ  X : 
yy  nY 2 
= ˆ  XXˆ  nY 2  + uˆ uˆ

SCT = SCE + SCR

SCE SCR
De esta última expresión se sabe que 1   , es decir, el 100% de la variación
SCT SCT
cuadrática total se puede descomponer como el porcentaje explicado por la regresión
SCE SCR
más el porcentaje explicado por los residuos . De este modo la definición
SCT SCT
del coeficiente de determinación del MRLM es la misma que en el MRLS.

Def. Coeficiente de Determinación (R2)


SCE SCR uˆ uˆ
R2   1  1
SCT SCT y y  nY 2

Es decir, el coeficiente de determinación mide la proporción o porcentaje de la


variación cuadrática total que es explicada por la regresión ( 0  R 2  1 ). Si R 2  1 se
tiene un buen ajuste (residuos pequeños), en cambio, si R 2  0 se tiene un mal ajuste
(residuos grandes).

DAVID RUELAS RODRÍGUEZ 3-12


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

A diferencia del MRLS, en el MRLM no se puede establecer que R 2  rXY  pues no


2

hay un solo regresor X, sino un conjunto de k regresores X1, X2,…, Xk.

Desafortunadamente en el contexto multivariado R 2 crece conforme aumenta el número


de regresores, de manera que para evitar esa distorsión y poder comparar una medida de
bondad de ajuste de modelos con distinto número de regresores se define al coeficiente
de determinación ajustado.

Def. Coeficiente de Determinación Ajustado ( R 2 )


SCR
R 2  1
n  k  1
 1
n  1SCR
SCT n  k  1SCT
n 1

Proposición
n 1 k
R2  R2 
n  k  1 n  k  1

Demostración: R 2  1 
n  1SCR  1
n  1  SCE  SCE
1   , donde  R2 ,
n  k  1SCT n  k  1  SCT  SCT
entonces
n 1 n 1 n  k 1 n 1 n 1
R 2  1
n  k  1
1 R2  
n  k  1
R2 
n  k  1

n  k  1
R2 
k
n  k  1
.

Importante: La comparación de R 2 o R 2 de distintos modelos es válida únicamente si:


(i) la variable dependiente es la misma; y (ii) incluyen mismo número de observaciones.

3.6. Análisis de varianza.


En el MRLM también se acostumbra presentar la descomposición SCT  SCE  SCR
mediante la Tabla ANOVA como se muestra en la figura 3.1.

Figura 3.1

Fuente de
Suma de cuadrados g.l. Suma de cuadrados medios
variación
Regresión SCE ˆ  X Xˆ  nY 2
SCE  yˆ yˆ  nY 2  ˆ  X Xˆ  nY 2 k CME  
(explicada) k k
 n
SCR uˆ uˆ
Residuos SCR  y  yˆ  y  yˆ   uˆ uˆ   uˆ i2 n  k  1 CMR    ˆ 2
i 1 n  k  1 n  k  1
SCT y y  nY 2
Total SCT  y y  nY 2 n–1 CMT    S Y2
n 1 n 1

DAVID RUELAS RODRÍGUEZ 3-13


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

A cada suma de cuadrados corresponden ciertos grados de libertad, que son el número
de observaciones independientes requeridas para calcular dichas estadísticas. SCT tiene
n – 1 grados de libertad pues pierde un grado de libertad en el cálculo de Y , SCE tiene k
grado de libertad (correspondientes a ̂1 , ̂ 2 ,…, ̂ k asociados a las k variables
explicativas X1, X2,…, Xk), y SCR tiene n – (k + 1) grados de libertad pues pierde k + 1
grados de libertad en el cálculo de ̂ 0 , ̂1 ,…, ̂ k . La suma de cuadrados medios es
simplemente la suma de cuadrados totales entre sus respectivos grados de libertad.

Ejercicio E35 .

3.7. Estimadores de Máxima Verosimilitud (EMV).


Para estimar el MRLM y  X  u bajo el Método de Máxima Verosimilitud es
necesario suponer una distribución de probabilidad para el vector de errores u. Para
cumplir con el resto de los supuestos del MRLM la distribución multivariada de u debe
tener vector de medias cero, E u   0 , y matriz de varianzas-covarianzas de la forma
Var u    2 I , es decir, con varianzas constantes  2 y no correlacionados. Por
practicidad y conveniencia, para fines de inferencia estadística se considerará a la
Distribución Normal Multivariada, es decir, u ~ N n 0, 2 I .  
Def. Modelo de Regresión Lineal Múltiple Normal (MRLMN).
Si (X1i, X2i,…, Xki, Yi), i = 1, 2,…, n, j = 1, 2,…, k, son n observaciones de la variable
dependiente Y acomodadas en el vector y, y n observaciones de las variables explicativas
X1, X2,…, Xk (n > k + 1 y no todas las Xji’s toman el mismo valor) acomodadas en la
matriz de diseño X, cuya FRP es E y X   X , entonces el Modelo de Regresión Lineal
Múltiple Normal supone que y puede ser modelado como la suma de esta media
condicional y un vector de n errores u de la siguiente manera:
y  X  u ,
donde X es no estocástica, XX es no singular y u ~ N n 0, 2 I .  
Def. Distribución Normal Multivariada
Si w es el vector aleatorio que contiene a las n variables aleatorias W1, W2,…, Wn, se
dice que w tiene una Distribución Normal Multivariada de dimensión n con vector de
medias  y matriz de varianzas , denotado por w ~ N n  , Σ  , si su función de densidad
de probabilidad conjunta está dada por:
1  1  
f w w   exp w    Σ 1 w    , w  Rn
1
2 
n
2 Σ 2  2 

DAVID RUELAS RODRÍGUEZ 3-14


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

 
En particular, para u ~ N n 0, 2 I se tiene que   0 y Σ   2 I . Como  2 I es matriz
diagonal, propiedades de los determinantes y de la inversa Σ   2 I   2 I   2 n y   n

 uu 
Σ 1   2 I   12 I , por lo tanto, f u u   2 2 
n
1 
2 exp 2
, u  Rn.
 2 

Aunque en general no correlación no implica independencia, es importante recordar que


en el caso particular de la Distribución Normal Multivariada la no correlación sí implica
independencia.


Suponer ui ~ iid N(0,  2 ) es equivalente a suponer u ~ N n 0, 2 I pues el producto de 
las densidades Normales marginales independientes coincide con la conjunta de la
Normal Multivariada:

u2
 1 
1
 
n n  i2 n n

 f ui ui    u   f u u  .

e 2  2 2 2 exp 2

2   2
2 i
i 1 i 1 i 1 

La propiedad más importante de la Distribución Normal Multivariada es que cualquier


transformación lineal que se le aplique continua siendo Normal Multivariada, como
se establece en el siguiente teorema.

Teorema. Transformaciones Lineales de la Distribución Normal Multivariada


Si w ~ N n  , Σ  , A es matriz de dimensión m  n, c es vector de dimensión m, entonces
Aw  c ~ N m Α  c, AΣA

Note que por propiedades de valor esperado y varianza:


 E Aw  c  AE w   c  A  c (operador lineal); y
 
 Var Aw  c  E Aw  c  A  c Aw  c  A  c    E  Aw   w    A
   

 AE w   w     A  AVar w A  AΣA
 

Proposición

Bajo los supuestos del MRLMN y ~ N n X , 2 I .  


Demostración: y  X  u  u  X es transformación lineal de u ~ N n 0, 2 I ;  
aplicando el teorema anterior con A = I y c = X se concluye que y ~ N n X , I .  2

DAVID RUELAS RODRÍGUEZ 3-15


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Teorema. EMV del MRLMN

Para el MRLMN y  X  u , donde u ~ N n 0, 2 I :  


i) ˆ  XX 1 Xy  es el EMV de  ; y
uˆ uˆ
ii) ˆ *2  es el EMV de  2 .
n

Ejercicio E36 .

Es decir, bajo los supuestos del MRLMN los EMV y los estimadores MCO de  son
los mismos, por lo tanto ̂ 0 , ̂1 ,…, ̂ k poseen la propiedad de invarianza, así como las
propiedades asintóticas de los EMV, particularmente eficiencia y consistencia.
uˆ uˆ
Desafortunadamente el EMV de  2 , ˆ *2  , no es insesgado, por eso se preferirá
n
uˆ uˆ
estimar a  2 mediante el estimador insesgado ˆ 2  .
n  k  1

 
Se sabe que si ˆ  XX  Xy  entonces E ˆ   y Var ˆ   2 XX  . Bajo los
1 1

supuestos del MRLMN y ~ N X , 2 I  y ˆ es transformación lineal de y, por lo tanto


n


su distribución de muestreo es Normal, es decir, ˆ ~ N k 1  ,  2 XX  .
1

Además, como ˆ tiene una distribución conjunta Normal Multivariada, sus respectivas
j 
distribuciones marginales son Normales Univariadas, es decir, ˆ ~ N  ,  2ˆ , donde j j

 
 2ˆ  Var ˆ j es el j-ésimo elemento de la diagonal principal de la matriz de varianzas-
j

covarianzas  2 XX  , j = 0, 1,…, k. A partir de estas distribuciones es posible


1

construir estadísticos Zj con distribución Normal Estándar.

Las varianzas en realidad nunca son conocidas pero sus respectivas estimaciones,
uˆ uˆ
en  2 XX  para
1
S 2ˆ  ˆ 2ˆ , se pueden obtener sustituyendo a  2 por ˆ 2 
j j
n  k  1
construir estadísticos Tj con distribución t-Student.

 
Por su parte u ~ N n 0, 2 I , es decir, u sigue una distribución Normal Multivariada con
componentes no correlacionados (e independientes), y sus distribuciones marginales
también son Normales Univariadas con ui ~ N(0,  2 ). Estandarizando y elevando al
u2 u 2  u 22    u n2
cuadrado se obtiene i2 ~  1 , por lo tanto 1 ~  n  , es decir, la
 
2

uˆ uˆ
distribución de muestreo asociada a ˆ 2  tiene una distribución Ji-Cuadrada.
n  k  1

DAVID RUELAS RODRÍGUEZ 3-16


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Distribuciones de muestreo del MRLMN

Bajo los supuestos del MRLMN y  X  u , donde u ~ N n 0, 2 I  , si ˆ  XX  Xy 


1

uˆ uˆ
y ˆ 2  , entonces:
n  k  1
ˆ j   j
~ N 0,1 , donde  2ˆ se obtiene de  2 XX  , j = 0, 1,…, k
1
i) Zj 
 ˆ j
j

ˆ j   j
~ t n  k  1 , donde S 2ˆ se obtiene de ˆ 2 XX  , j = 0, 1,…, k
1
ii) Tj 
S ˆ j
j

iii) J
n  k  1ˆ 2 
uˆ uˆ
~  2 n  k  1
 2
2

Estas estadísticas son cantidades pivotales que permiten fácilmente construir intervalos
de confianza y hacer pruebas de hipótesis sobre los parámetros 0, 1,…, k y  2 .

3.8. Estimación por intervalo y pruebas de hipótesis.


3.8.1. Intervalos de confianza sobre los parámetros del MRLMN.

La figura 3.2 muestra el resumen de los intervalos simétricos (misma área en cada cola)
con nivel de confianza 1 –  para estimar por intervalo los parámetros 0, 1,…, k y
 2 , bajo los supuestos del MRLMN.

Figura 3.2

Intervalo de confianza simétrico


Parámetro Pivote
con nivel de confianza 1 – 
ˆ j   j ˆ j  t  S ˆ
n   k 1,
~ t n  k  1
j

j Tj  2
S ˆ ˆ ˆ  ˆ 2 X X 1
donde S 2ˆ se obtiene de Σ

j
 0

 n  k  1ˆ 2 n  k  1ˆ 2 
 2 J
n  k  1ˆ 2 ~  2 n  k  1  , 
2   n2k 1,   n2k 1,1  
 2 2 

En el contexto multivariado es posible hablar de conjuntos de confianza o de regiones


de confianza para  (versión multivariada de los intervalos de confianza), pero en la
práctica estos conjuntos no se utilizan.

Ejercicio E37 .

DAVID RUELAS RODRÍGUEZ 3-17


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.8.2. Pruebas de hipótesis acerca de los parámetros del MRLMN.

Tomando en cuenta que en el contexto del MRLMN puede haber muchos más
parámetros que en el MRLSN y que la inferencia se puede de manera individual sobre
cada parámetro o de manera conjunta sobre todos o algunos de ellos, se considerarán 3
tripos de pruebas de hipótesis:
 Individuales para 0, 1,…, k y  2 .
 Conjunta para .
 Conjunta para alguna transformación lineal de .

PRUEBAS DE HIPÓTESIS INDIVIDUALES

Con base en la dualidad entre intervalos de confianza y regiones de rechazo de las


pruebas de hipótesis, la figura 3.3 muestra regiones de rechazo (RR) y estadísticos de
prueba para Pruebas de Hipótesis individuales de tamaño  (de una y dos colas) los
parámetros 0, 1,…, k y  2 , bajo los supuestos del MRLMN.

Figura 3.3

H0: vs. H1: RR = Estadístico de prueba


 j   j , 0 t  t
n   k 1,
  j ˆ j   j ,0
j =j,0  j   j , 0  j
t  t n   k 1,
Tj  ~ t n  k  1
   t  t S ˆ
 j  j
j
j ,0 n   k 1, 2

 2   02 j  2
n   k 1,1

 2   02 
 2  n  k  1ˆ 2 ~  2 n  k  1
   0  j   n k 1, J
2 2

 2   2 j  2  02
, j   n2k 1, 
 0
 n   k 1,1 2 2

Las pruebas para 0, 1,…, k, se denominan Pruebas T. Es relevante:


 Rechazar H0: 0 = 0, pues de lo contrario es necesario evaluar la necesidad de hacer
la estimación del MRLMN sin intercepto, con la posibilidad de que los residuos no
sumen cero o que R2 deje de tener interpretación como porcentaje; y
 Rechazar H0: j = 0, j = 1, 2,…, k, pues de lo contrario se debería hacer la estimación
sin la variable explicativa Xj pues individualmente (manteniendo las demás variables
explicativas) no explica a la variable de interés Y.

La mayor parte de los paquetes estadísticos estiman el MRLMN por MCO y presentan
los estimados ̂ 0 , ̂1 ,…, ̂ k junto con sus errores estándar estimados S ˆ , S ˆ ,…, S ̂ ,
0 1 k

y sus respectivos valores-p de las Pruebas T (H0: j = 0, j = 0, 1,…, k).

Importante: Que cada Prueba T resulte significativa no implica que el modelo completo
resulte significativo. Para probar esto último hay que hacer el análisis conjunto.

DAVID RUELAS RODRÍGUEZ 3-18


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

PRUEBA DE HIPÓTESIS CONJUNTA DE LA REGRESIÓN

Proposición
CME n  k  1SCE
Bajo los supuestos del MRLMN, si  = 0, F   ~ F k , n  k  1
CMR k SCR

Teorema. Prueba F (ANOVA).

Para el MRLMN y  X  u , donde u ~ N n 0, 2 I  , si se quiere probar


H 0 :  0  1     k  0 vs. H1: alguna j ≠ 0, entonces RR   f  f k ,nk 1, ,
CME n  k  1SCE
donde F   ~ F k , n  k  1 .
CMR k SCR

Note que la hipótesis nula se puede expresar en forma compacta como H0:  = 0.

PRUEBAS DE HIPÓTESIS CONJUNTAS PARA TRANSFORMACIONES LINEALES

En el contexto multivariado, en algunas aplicaciones puede ser relevante hacer


inferencia acerca de transformaciones lineales de algunos de los parámetros del
MRLMN, por ejemplo,  j  0 para alguna j = 0, 1,…, k, 1   2     k  1 ,
1   2     k  0 ,  0  1 y  k   k ,0 , etc.

Todas estas transformaciones se pueden expresar mediante una matriz R de dimensión


q  (k + 1), donde q es el número de restricciones sobre los parámetros involucrados en
la prueba de hipótesis, de modo que bajo H0 se quiere probar R = r, donde r es un
vector de dimensión q que contiene los valores fijos ri  Ri   , y donde Ri: Rk + 1  R.
La figura 3.4 muestra la forma que tomaría R para modelar las transformaciones lineales
de parámetros del MRLMN mencionadas previamente.

Figura 3.4

Hipótesis nula en la forma Estructura de R Estructura de r


q
H0: R = r de dimensión q  (k + 1) de dimensión q
j 0 R  0  0 1 0  0
1 r=0
con 1 en la columna j + 1
1   2     k  1 1 R  0 1  1 r=1
1  0 0 1 0 0  0 0
0 0 1 0  0 0
2  0
k R r  0k
      
k  0  
0 0 0 0  0 1
 0  1  0 1  1 0  0 0  0 
2 R  r 
 k   k ,0 0 0 0  0 1   k ,0 

DAVID RUELAS RODRÍGUEZ 3-19


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Proposición
Bajo los supuestos del MRLMN, si R es matriz de dimensión q  (k + 1), r es vector de
dimensión q, R = r (o bien R – r = 0q) y  se estima por MCO, entonces:

F
  


n  k  1 Rˆ  r RXX  R  Rˆ  r
1 1

~ F q, n  k  1
q uˆ uˆ

n  k  1 1
En la estadística F de la proposición anterior el término
uˆ uˆ ˆ
 
1
 2  ˆ 2 podría
incorporarse en la matriz inversa del numerador para completar la matriz de varianzas-
ˆ ˆ  ˆ 2 XX 1 .
covarianzas estimada de ˆ , es decir, Σ 

Teorema. Prueba F (Transformación Lineal General).

Para el MRLMN y  X  u , donde u ~ N n 0, 2 I  , si R es la matriz de q restricciones


sobre los parámetros , r es el vector de valores de las q restricciones y se quiere probar
H 0 : R  r  0 q vs. H 0 : R  r  0 q , entonces RR   f  f q ,nk 1, ,

donde F 
q

1 ˆ

 ˆ
R  r RΣ ˆ
 
R  Rˆ  r ~ F q, n  k  1 .
1

Una forma alternativa de probar relaciones de igualdad entre distintos parámetros del
vector  es a través del Método de Mínimos Cuadrados Restringidos (MCR). Este
método considera que hay q restricciones lineales bajo H0.

Método de Mínimos Cuadrados Restringidos (MCR)


1) Modificar el MRLMN para incorporar las q restricciones.
2) Estimar el modelo restringido por MCO.
3) Calcular la suma de cuadrados del modelo restringido (SCRR).
4) Aplicar la Prueba F de Mínimos Cuadrados Restringidos.

Teorema. Prueba F (MCR).


H0: Se cumplen las q restricciones sobre  vs. H1: Alguna restricción no se cumple,
RR   f  f q ,nk 1, , donde F 
n  k  1SCRR  SCRNR  ~ F q, n  k  1 y los
q SCRNR
subíndices indican R = Restringido y NR = No restringido.

Ejercicios E38 y E39 .

DAVID RUELAS RODRÍGUEZ 3-20


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.9. Predicción en el MRLM.


En forma análoga al MRLS, en el MRLM se considerará el pronóstico o predicción de
 
la media condicional E Y0 X 1,0 , X 2, 0 ,  , X k , 0 o del valor individual Y0 para un conjunto
de valores fijos x 0  1, X 1,0 , X 2,0 ,, X k ,0   de las variables explicativas X1, X2,…, Xk.
Note que el vector x0 es de dimensión k + 1 porque además de los valores de las k
variables, su primer elemento es un 1.

Por practicidad se denotará a la media condicional por E Y0 x 0   x0  y al valor


individual por Y0  x0   u0 .

3.9.1. Predicción de la media condicional.

Teorema. Predicción puntual de la media condicional


Bajo los supuestos del MRLM, el estimador puntual de la media condicional
E Y0 x 0   x0  es Eˆ Y0 x 0   Yˆ0*  x0 ˆ , donde:

i) Yˆ0* es MELI.
ii)   
Var Yˆ0*   2 x0 XX  x 0
1

0
 
Para calcular SY2ˆ* , el estimador de Var Ŷ0* , basta sustituir  2 por ˆ 2 
uu
n  k  1
.

Bajo el supuesto de normalidad en los errores es fácil ver que Yˆ0* sigue una distribución

Normal, de modo que


Yˆ0*  x0 
 
~ N 0,1 , y sustituyendo Var Ŷ0* por SY2ˆ* se obtiene el
 
Var Yˆ0 * 0

Yˆ *  x0 
pivote 0 ~ t n  k  1 .
SYˆ *
0

Teorema. Predicción por intervalo de la media condicional


Bajo los supuestos del MRLMN, el intervalo de confianza simétrico al 100(1 – )% para
el parámetro E Y0 x 0   x0  es x0 ˆ  t  S Yˆ * , donde el error estándar estimado se
n  k 1, 0
2

calcula a partir de S Y2ˆ*  ˆ 2 x0 XX  x 0  x0 Σ


ˆ ˆx
1
0  0

DAVID RUELAS RODRÍGUEZ 3-21


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.9.2. Predicción individual.

Dado que la variables explicativas X1, X2,…, Xk toman los valores fijos de x 0 el
respectivo valor individual Y0 está dado por Y0  x0   u0 . Como los errores tienen
media cero, lo más razonable es eliminarlo en la estimación ( uˆ0  0 ) y simplemente
sustituir los estimadores MCO de  .

Teorema. Predicción puntual de valores individuales


Bajo los supuestos del MRLM, el estimador puntual del valor individual Y0  x0   u0
es Yˆ0  x0 ˆ , donde:
i) Yˆ0 es MELI.
ii)   
Var Y0  Yˆ0   2 1  x0 XX  x 0
1

A la diferencia e0  Y0  Yˆ0 se le denomina error de predicción. Para estimar su
uˆ uˆ
varianza, SY2 Yˆ , basta sustituir  2 por ˆ 2  .
0 0
n  k  1

Importante: Al pronosticar la media condicional E Y0 x 0   x0  se está estimando un


parámetro y en ese contexto es posible hablar de intervalos de confianza. Al pronosticar
un valor individual Y0  x0   u0 no se está pronosticando un parámetro sino una
variable aleatoria y por lo tanto no es posible hablar de intervalos de confianza sino de
intervalos de predicción.

Bajo el supuesto de normalidad es fácil ver que e0  Y0  Yˆ0 tiene una distribución

Normal con media cero y varianza Var Y0  Yˆ0 , de modo que  


Y0  Yˆ0
~ N 0,1 , y
Var Y0  Yˆ0  
  Y  Yˆ0
sustituyendo Var Y0  Yˆ0 por SY2 Yˆ se obtiene la estadística 0
0 0
SY Yˆ
~ t n  k  1 .
0 0

Teorema. Predicción por intervalo de valores individuales


Bajo los supuestos del MRLMN, el intervalo de predicción simétrico al 100(1 – )%
para Y0  x0   u0 es x0 ˆ  t  S Y Yˆ , donde el error estándar estimado se calcula a
n  k 1, 0 0
2

0 0
 1

partir de SY2 Yˆ  ˆ 2 1  x0 XX  x 0  ˆ 2  x0 Σˆ ˆ x 0

DAVID RUELAS RODRÍGUEZ 3-22


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Es importante recalcar que la longitud del intervalo de predicción del valor individual Y0
siempre es mayor que la longitud del intervalo de confianza de la media condicional
E Y0 x 0   x0  .

Al considerar más de una variable explicativa no es práctico considerar conjuntos de


predicción (generalización de las bandas de predicción).

Ejercicios E40 y E41 .

3.10. Modelos de Regresión Polinomial.


Def. Modelo de Regresión Polinomial (MRP).
Si la variable dependiente Y se explica mediante la variable explicativa X y su FRP es de
la forma E Yi X i    0  1 X i   2 X i2     k X ik , entonces el Modelo de Regresión
Polinomial supone que los valores Yi pueden ser modelados por esta media condicional y
un término de error de la siguiente manera:
Yi   0  1 X i   2 X i2     k X ik  ui ,
donde Xi es no estocástica y ui ~ iid(0,  2 ).

Para expresar el MRP en forma matricial es necesario considerar siguiente matriz de


diseño (Matriz de Vandermonde):

1 X 1 X 12  X 1k 
 
1 X2 X 22  X 2k 
XP  
    
 
1 X n X n2  X nk 

Entonces el MRP se puede expresar como y  X P   u , donde u ~ iid 0, 2 I  , es decir,


un MRLM pero con una sola variable explicativa.

A pesar de que el MRP es una extensión del MRLS (una sola variable explicativa), su
estimación se realiza por MCO del respectivo MRLM.

Para este tipo de modelos sí es posible construir bandas de confianza, siempre y cuando

haya normalidad en los errores, es decir, u ~ N n 0, 2 I . 
Ejercicio E42 .

DAVID RUELAS RODRÍGUEZ 3-23


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.11. Contribuciones incrementales de una o varias variables.

3.11.1. Análisis de los parámetros del MRLM.

SIGNIFICADO DE LOS COEFICIENTES DE REGRESIÓN

La relación determinista del MRLM es Y   0  1 X 1  1 X 2     k X k , al parámetro


0 se le denomina intercepto, mientras que a los parámetros 1, 2,…, k se les
denomina coeficientes de regresión parcial y es fácil ver que corresponden con la
Y
derivada parcial de Y respecto a cada regresor, es decir,   j , j = 1, 2,…, k.
X j

MEDIDAS DE SENSIBILIDAD

Para el análisis marginal de Y  g  X 1 , X 2 ,  , X k  se consideran las medidas de


sensibilidad estudiadas previamente (efecto parcial, elasticidad y semi-elasticidad). Sus
definiciones son muy similares a las del caso univariado pero cambian la notación de
derivada a derivada parcial, pues ahora hay k variables explicativas:
 Y 
 Efecto parcial: Y j   X , es el cambio aproximado en Y asociado a un
 X  j
 j 

cambio pequeño en Xj, considerando todo lo demás constante (caeteris paribus).


 Y  X j  ln Y 
 Elasticidad:  j     es el cambio porcentual aproximado en Y
 X  Y
 j   ln X j 
cuando Xj aumenta un punto porcentual, considerando todo lo demás constante.
 Y  1
 Semi-elasticidad:  j  100  es el cambio porcentual aproximado en Y cuando
 X  Y
 j 

Xj aumenta en una unidad, considerando todo lo demás constante.

Para el análisis conjunto de Y   0  1 X 1  1 X 2     k X k se define el efecto total


como se muestra a continuación.

Def. Efecto total. En el MRLM el efecto total, denotado por Y, es el cambio
aproximado en Y asociado a un pequeño cambio en cada Xj, j = 1, 2,…, k, es decir,
 Y   Y   Y 
Y   X 1   X 2     X k .

 1
X 
 2
X 
 k
X

Si se calcula el efecto total considerando un cambio unitario en cada variable explicativa


entonces Y  1   2     k .

DAVID RUELAS RODRÍGUEZ 3-24


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.11.2. Análisis de los parámetros estimados del MRLM.

En las secciones anteriores se analizaron las técnicas estadísticas para estimar el MRLM,
sin embargo, es importante vincular el resultado de la estimación con el significado de
los parámetros.

Analizando el MRLM con 2 regresores. Al estimar Yi   0  1 X 1i   2 X 2i  ui por


MCO se obtienen directamente ̂ 0 , ̂1 y ̂ 2 . En particular ̂1 es la estimación del
coeficiente de regresión parcial 1 , es decir, cuánto cambia en términos absolutos Y ante
un aumento de X1 en una unidad. Es posible calcular ̂1 de manera indirecta mediante
el siguiente método.

Método de estimación indirecta


Para estimar en forma indirecta a 1 en Yi   0  1 X 1i   2 X 2i  ui :
1) Estimar por MCO los modelos Yi   0  1 X 2i  vY ,i y X 1i   0   1 X 2i  v X1 ,i para
aislar el efecto de X2.
2) Calcular los residuos vˆY ,i y vˆ X1 ,i , pues contienen la parte que X2 no pudo explicar
de Y y de X1, respectivamente.
3) Estimar por MCO el modelo vˆY ,i   vˆ X1 ,i  wi , sin considerar intercepto pues
E vY ,i   0 .
4) En la regresión de residuos del punto anterior,  es la parte que X1 explica de Y sin
tomar en cuenta el efecto de X2, por lo tanto ˆ1  ˆ .

Ejercicio E43 .

3.11.3. Coeficiente de Correlación Parcial.

En el contexto multivariado la correlación juega un papel importante pues permite


analizar qué tanto contribuyen los regresores X1, X2,…, Xk en la explicación de la
variable dependiente Y, ya sea en forma conjunta o en forma individual.

SYX j
Al coeficiente de correlación lineal muestral entre las variables Y y Xj, rYX j  , se
SY S X j
le denomina coeficiente de correlación simple, y por practicidad se simplificará su
notación a rYj , de modo que es posible calcular k coeficientes de correlación simples de
este tipo.

DAVID RUELAS RODRÍGUEZ 3-25


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

En el MRLS es fácil demostrar que R 2  rXY  , es decir, que el coeficiente de


2

determinación es simplemente el coeficiente de correlación elevado al cuadrado. En el


contexto del MRLM existen k posibles coeficientes de correlación simples y sus
cuadrados no necesariamente coinciden con el coeficiente de determinación. Sin
embargo, por analogía, a la raíz cuadrada del coeficiente de determinación del MRLM se
le conoce como coeficiente de correlación múltiple.

Def. Coeficiente de Correlación Múltiple

R  R2

R es una medida del grado de asociación entre Y y todas las variables explicativas en
conjunto. R siempre es positivo por lo que en la práctica tiene poca importancia y se
prefieren R 2 y R 2 como medidas de bondad de ajuste.

Para analizar la correlación entre Y y cada variable explicativa de manera individual,


aislando el efecto de todas las demás variables (caeteris paribus), se define coeficiente
de correlación parcial.

Coeficiente de correlación parcial con 2 regresores. Para el MRLM con 2 regresores


Yi   0  1 X 1i   2 X 2i  ui es posible definir 2 coeficientes de regresión parcial:
 El coeficiente de correlación parcial entre Y y X1, manteniendo constante X2 o
aislando la influencia de X2, denotado por rY 1.2 ; y
 El coeficiente de correlación parcial entre Y y X2, manteniendo constante X1 o
aislando la influencia de X1, denotado por rY 2.1 .
Siguiendo la lógica del método de estimación indirecta, para calcular rY 1.2 hay que aislar
la influencia de X2 mediante los MRLS Yi   0  1 X 2i  vY .2,i y X 1i   0   1 X 2i  v1.2,i .
Al estimar estos modelos por MCO se obtienen los vectores de residuos vˆ Y .2 y v̂1.2 , que
contienen las partes de Y y X1 que X2 no pudo explicar. Finalmente el coeficiente de
correlación parcial rY 1.2 es el coeficiente de correlación lineal muestral entre estos dos
conjuntos de residuos (cuyas medias muestrales son cero).

Def. Coeficiente de Correlación Parcial (con 2 regresores)


Para el MRLM con 2 regresores Yi   0  1 X 1i   2 X 2i  ui :
vˆ Y .2 vˆ 1.2
i) rY 1.2  rvˆY .2 ,vˆ1.2 
vˆ Y .2 vˆ Y .2 vˆ 1.2 vˆ 1.2 
vˆ Y .1 vˆ 2.1
ii) rY 2.1  rvˆY .1 ,vˆ2.1 
vˆ Y .1 vˆ Y .1 vˆ 2.1 vˆ 2.1 

DAVID RUELAS RODRÍGUEZ 3-26


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Los coeficientes de correlación parcial se pueden calcular a partir de los coeficientes de


correlación simples mediante las fórmulas de la siguiente proposición.

Proposición.
Para el MRLM con 2 regresores Yi   0  1 X 1i   2 X 2i  ui :
rY 1  rY 2 r12
i) rY 1.2 
1  r 1  r 
2
Y2
2
12

rY 2  rY 1r21
ii) rY 2.1 
1  r 1  r 
2
Y1
2
21

La interpretación del coeficiente de correlación parcial es muy similar a la del


coeficiente de correlación simple: rY 1.2 indica qué tan fuerte es la asociación lineal entre
la variable de interés Y y el regresor X1, manteniendo constante o aislado el efecto de X2.
Igual que en el caso simple,  1  rY 1.2  1 , de modo que si rY 1.2  1 indica un alto
grado de asociación lineal negativo, rY 1.2  1 indica un alto grado de asociación lineal
positivo y rY 1.2  0 indica que no hay asociación o que la asociación no es de tipo
lineal. Si existe alguna correlación espuria (sin lógica o sin fundamento) entre Y y X2 o
entre X1 y X2 el coeficiente de correlación parcial la elimina.

En este contexto al coeficiente de determinación R 2 también se le denota por RY2.12 y


puede ser calculado mediante los coeficientes de correlación simples y parciales.

Proposición.
Para el MRLM con 2 regresores Yi   0  1 X 1i   2 X 2i  ui :
i)  
R 2  RY2.12  rY21  rY22.1 1  rY21 ; o
ii) R 2  RY2.12  rY22  rY21.2 1  r 
2
Y2

Def. Coeficiente de determinación parcial. Al coeficiente de correlación parcial al


cuadrado rY22.1 también se le denomina coeficiente de determinación parcial y se
interpreta como la proporción de la variación cuadrática de Y no explicada por la
variable X1 que se explica por la variable X2.

Análisis de contribución incremental. La principal aplicación de los coeficientes de


correlación parciales es el análisis de contribución incremental o marginal que tienen
los regresores en el MRLM. Este análisis consiste en desglosar la SCE de la Tabla
ANOVA. La Tabla ANOVA de contribución incremental se muestra en la figura 3.5

DAVID RUELAS RODRÍGUEZ 3-27


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Figura 3.5

Fuente de Fuente de
Suma de cuadrados Suma de cuadrados
variación variación
X1 
SCE1  rY21 y y  nY 2  X2 
SCE 2  rY22 y y  nY 2 
Incremento
debido a X2
SCE 2.1  r2
1  r y y  nY 
Y 2 .1
2
Y1
2 Incremento
debido a X1
SCE1.2  r 2
1  r y y  nY 
Y 1 .2
2
Y2
2

X1 y X2 SCE  R y y  nY 
2
Y .12
2
X1 y X2 SCE  R y y  nY 
2
Y .12
2

Residuos SCR  1  R y y  nY 


2
Y .12
2
Residuos SCR  1  R y y  nY 
2
Y .12
2

Total SCT  y y  nY 2 Total SCT  y y  nY 2

A esta tabla se le pueden agregar columnas con los grados de libertad (1 para los dos
primeros renglones, 2 para la contribución de X1 y X2, n – 3 para los residuos y n – 1,
para el total), cuadrados medios y porcentaje de contribución.

Para validar la significancia del incremento debido a X2 es posible aplicar la Prueba F


(ANOVA incremental) con estadístico de prueba F 
n  3SCE2.1 ~ F 1, n  3 ; y
SCR
para probar la significancia del incremento debido a X1 F 
n  3SCE1.2
~ F 1, n  3 .
SCR

El análisis de contribución incremental se puede extender a más de 2 regresores


mediante coeficientes de correlación parcial de orden superior.

Ejercicio E44 .

Se dice que rY 1.2 y rY 1.1 son coeficientes de correlación parcial de primer orden, pues
sólo se está aislando el efecto de un regresor. Si se considera el MRLM con 3 regresores
entonces es posible hablar de los coeficientes de correlación parcial de segundo orden
rY 1.23 , rY 2.13 y rY 3.12 ; y así sucesivamente. A los coeficientes de correlación simple
también se les denomina coeficientes de correlación parcial de orden cero.

Coeficiente de correlación parcial con k regresores. Para el MRLM con k regresores


y  X  u es posible definir k coeficientes de regresión parcial de orden k – 1: rY 1.23k ,
rY 2.13k ,…, rYk .12k 1 . Para calcularlos es necesario definir las siguientes matrices:

 X j , que es una matriz de dimensión k  n, y corresponde a la matriz de diseño X pero


reducida al eliminar la columna x j correspondiente al regresor Xj; y

 M j  I  H j  I  X j Xj X j  Xj , que es una matriz de dimensión n  n, y se


1

construye a partir de la matriz gorro reducida H j .

DAVID RUELAS RODRÍGUEZ 3-28


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

Def. Coeficiente de Correlación Parcial de Orden k – 1


Para el MRLM con k regresores y  X  u , el coeficiente de correlación parcial de
xj M j y
entre Y y Xj de orden k – 1 está dado por rYj.1 j 1 j 1k  .
xj M j x j yM j y 

3.12. Criterios para la selección de modelos.

3.12.1. Criterios de selección

El principal problema de la Econometría Aplicada al considerar el MRLM es determinar


el conjunto de regresores X1, X2,…, Xk que expliquen a la variable de interés Y.

En la selección de regresores se debe tener presente que el MRLM debe satisfacer los
siguientes criterios:
 Adecuado para los datos. Sus predicciones deben ser lógicamente posibles.
 Consistente con la Teoría. Si un regresor no cabe dentro de la teoría que sustenta el
modelo no debe incluirse (aunque tenga una contribución incremental significativa).
 Regresores exógenos débiles. Las variables explicativas no deben estar
correlacionadas con los errores.
 Consistencia paramétrica. Los parámetros deben ser estables para que el pronóstico
fuera del conjunto muestral tenga validez (Prueba de Chow).
 Coherente en los datos. Los residuos deben ser ruido blanco: ui ~ iid(0,  2 ).
 Inclusivo. El modelo debe abarcar o incluir todo modelo contendiente, es decir, no
puede haber mejor modelo que el elegido.

Estos criterios deben prevalecer siempre al construir un Modelo Econométrico.

Por regla general, si hay una teoría sólida que define a las variables explicativas de un
modelo, no deben agregarse regresores adicionales.

Sin embargo, en muchas ocasiones no existe una teoría que ayude a definir los
regresores y en esos casos lo que se acostumbra es analizar la relación entre la variable
de interés y algunas otras variables que tentativamente podrían explicarla (ya sea por
lógica o por algún conocimiento específico del ámbito de aplicación). Estas técnicas de
“ensayo y error” forman parte de lo que actualmente se denomina Minería de Datos
(data mining).

DAVID RUELAS RODRÍGUEZ 3-29


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.12.2. Criterios de Información de Akaike, Schwarz y Hannan-Quinn

Se sabe que al aumentar el número de regresores el coeficiente de determinación ( R 2 )


aumenta, revelando mayor bondad de ajuste (menor SCR). Pero por otro lado, siempre
es preferible un modelo lo más simple posible o con el menor número de regresores
posibles (Principio de Parsimonia).

Una forma de resolver este conflicto es mediante el coeficiente de determinación


ajustado ( R 2 ), pues toma en cuenta el número de regresores considerados en el modelo
y permite comparar la bondad de ajuste de distintos modelos con la misma variable de
interés y muestras del mismo tamaño.

Otra alternativa es considerar los llamados Criterios de Información, que permiten


analizar un adecuado balance entre bondad de ajuste y simpleza del modelo.

Los criterios de información de Akaike, Schwarz y Hannan-Quinn consideran


estadísticas basadas en la SCR pero imponen un castigo por incluir un número creciente
de regresores en el MRLM. Estos criterios establecen que se debe elegir aquel modelo
cuya estadística sea mínima.

Def. Criterio de Información de Akaike (CIA)

 uˆ uˆ  2k  1
CIA  ln 
 n  n

Def. Criterio de Información de Schwarz (CIS)

 uˆ uˆ  k  1ln n 
CIS  ln 
 n  n

Def. Criterio de Información de Hannan-Quinn (CIHQ)

 uˆ uˆ  2k  1ln ln n 


CIHQ  ln 
 n  n

Nota: Algunos paquetes estadísticos al estimar un MRLM calculan automáticamente


estas cantidades, o alguna variante de ellas. En particular, EViews reporta
aproximadamente el doble de estas cantidades.

DAVID RUELAS RODRÍGUEZ 3-30


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

3.12.3. Métodos para la Construcción de Modelos Econométricos

La construcción de Modelos Econométricos requiere: (i) determinar qué variables


explicativas potencialmente podrían formar parte del modelo; (ii) la forma funcional en
que dichas variables se podrían incorporar al MRLM; y (iii) un método que permita
decidir cuales variables deben permanecer en el modelo.

IDENTIFICACIÓN DE VARIABLES EXPLICATIVAS POTENCIALES

A falta de una teoría sólida que defina las variables explicativas de un modelo, se
acostumbra analizar un conjunto de variables que lógicamente estén asociadas o
vinculadas con la variable de interés. En este proceso se corre el riesgo de identificar
correlaciones espurias, es decir, variables que están correlacionadas pero que carecen de
una conexión lógica.

Un método gráfico que facilita la determinación de variables explicativas potenciales es


el Diagrama de Dispersión Múltiple, que consiste en una matriz cuadrada que en cada
uno de sus elementos (i, j) muestra el diagrama de dispersión entre la variable del
renglón i y la variable de la columna j. La mayoría de los paquetes estadísticos generan
este tipo de gráfico.

Por ejemplo, la figura 3.6 muestra el Diagrama de Dispersión Múltiple de EViews entre
mortalidad infantil (MI), PIB per cápita (PIB), tasa de alfabetización femenina (TA) y
tasa de fecundidad (TF) para una muestra de 64 países.

Figura 3.6
400

300

200
MI

100

20,000

15,000
PIB

10,000

5,000

100

80

60
TA

40

20

10

6
TF

0 100 200 300 400 0 5,000 15,000 0 25 50 75 100 0 2 4 6 8 10

MI PIB TA TF

DAVID RUELAS RODRÍGUEZ 3-31


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 3

SELECCIÓN DE LA FORMA FUNCIONAL

El Diagrama de Dispersión Múltiple también permite identificar empíricamente la forma


funcional en la que los regresores pueden incorporarse al MRLM.

Existen pruebas estadísticas para determinar si la forma funcional de un MRLM es la


correcta. Por ejemplo, la Prueba MWD (MacKinnon, White y Davidson) permite
determinar si un Modelo Log-Lin es preferido sobre un Modelo Lineal (aplicable a la
función de producción Cobb-Douglas).

MÉTODOS DE SELECCIÓN DE VARIABLES

Estos métodos iterativos consisten en ir analizando la significancia estadística


(individual y conjunta) del MRLM con la entrada o salida de variables explicativas.

Método ascendente (stepwise regression)


1) Formular el MRLS con el regresor más correlacionado. Si no es significativo
(Prueba T) el modelo correcto es una constante. Si resulta significativo continuar.
2) Incorporar el regresor con correlación parcial de primer orden más alto, aislando el
efecto del primer regresor. Si no es significativo (Prueba F incremental) el modelo
correcto es un MRLS. Si resulta significativo continuar incluir y continuar.
3) Incorporar el regresor con correlación parcial de segundo orden más alto, aislando
el efecto de los dos primeros regresores. Si no es significativo (Prueba F
incremental) el modelo correcto es un MRLM con k = 2. Si resulta significativo
incluir y continuar en forma similar hasta agotar el análisis de los regresores
disponibles.

Método descendente (backward elimination)


1) Formular el MRLM con los k* los regresores disponibles.
2) Analizar la significancia incremental (Prueba F incremental) de cada uno de los k*
regresores considerando a cada regresor como la última variable en haberse
incorporado al MRLM.
3) El estadístico de prueba más bajo, f L , se compara con un valor crítico
preseleccionado f 0 . Comúnmente f 0  f1,nk *,0.05 . Si f L  f 0 eliminar el regresor
correspondiente y volver a aplicar estos tres pasos. Si f L  f 0 adoptar el MRLM
calculado en el primer paso de la última iteración.

Ejercicios E45 y E46 .

DAVID RUELAS RODRÍGUEZ 3-32


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

4. Variables Dicótomas

4.1. Naturaleza de las variables dicótomas.

4.1.1. Variables Dicótomas y Variables Cualitativas

En las secciones previas se han analizado los Modelos de Regresión en donde la variable
de interés Y y las variables explicativas X1, X2,…, Xk son variables cuantitativas; sin
embargo, también es posible utilizar variables cualitativas (o variables categóricas)
como variables explicativas mediante el uso de las llamadas variables dicótomas.

Def. Variable Dicótoma.


Se dice que la variable D es dicótoma si sólo puede tomar dos valores: Di = 1 si la
i-ésima observación posee cierto atributo y Di = 0 si no lo posee. A este tipo de
variables también se les denomina variables instrumentales o variables dummy.

Por ejemplo, si se quiere explicar el salario mensual de las personas (Y) considerando si
están titulados o no, entonces se puede plantear el modelo econométrico:
Yi   0  1 Di  ui , ui ~ iid(0,  2 ),
donde: Di = 1 si la i-ésima persona está titulada; y
Di = 0 en caso contrario.

Con base en esta definición se presentan 2 posibilidades para Y:


   1  u i si Di  1
Yi   0
 0  u i si Di  0

Este modelo econométrico es un MRLS que se puede estimar por MCO para obtener ˆ0
y ̂1 ; y a partir de estos valores concluir que el salario mensual estimado para los
titulados es de Yˆ  ˆ  ˆ , mientras que para los no titulados es de Yˆ  ˆ .
0 1 0

Si la variable cualitativa presenta más de 2 categorías es necesario incorporar más


variables dicótomas. Por ejemplo, si se quiere explicar el ingreso mensual de las
personas (Y) considerando su situación laboral (activo, retirado o desempleado),
entonces el modelo econométrico se puede expresar como:
Yi   0  1 D1i   2 D2i  ui , ui ~ iid(0,  2 ),
donde: D1i = 1 si la i-ésima persona es activa y D1i = 0 en caso contrario; y
D2i = 1 si la i-ésima persona es retirada y D2i = 0 en caso contrario.

DAVID RUELAS RODRÍGUEZ 4-1


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Importante: A pesar de que hay 3 posibles categorías no es necesario agregar una


cuarta variable dicótoma, pues las personas desempleadas quedarían descritas por la
situación en que D1 = 0 y D2 = 0. Lo anterior atiende a que las categorías de una
variable cualitativa deben ser exhaustivas.

Con base en esta definición se presentan 3 posibilidades:


  0  1  u i si D1i  1 y D2i  0

Yi   0   2  ui si D1i  0 y D2i  1
  u si D1i  0 y D2i  0
 0 i

Como las categorías de una variable cualitativa deben ser mutuamente excluyentes no
puede ocurrir que simultáneamente se tengan D1i = 1 y D2i = 1.

Este modelo econométrico es un MRLM que se puede estimar por MCO para obtener
ˆ0 , ̂1 y ̂ 2 ; y a partir de estos valores concluir que el ingreso mensual estimado para
los activos es Yˆ  ˆ  ˆ , el ingreso mensual estimado de los retirados es Yˆ  ˆ  ˆ y
0 1 0 2

que el ingreso mensual estimado para los desempleados es Yˆ  ˆ0 .

Note que en los MRLM con variables dicótomas la matriz de diseño X conserva el
vector de unos como primera columna (correspondientes al intercepto 0), y el resto de
sus columnas están formadas sólo por ceros y unos.

Proposición
Si una variable cualitativa tiene m categorías, hay que incluir m – 1 variables dicótomas.

Trampa de la variable dicótoma. Ocurre si por error se agregan las m variables


dicótomas y se deja el intercepto, ya que esto conduce al problema de multicolinealidad,
pues para un conjunto de n observaciones, la suma de las columnas de las m variables
dicótomas forzosamente conducen a una columna de unos. En estos casos la matriz de
diseño X deja de ser de rango completo y hace que XX sea singular. Una forma de
resolver la “trampa de la variable dicótoma” es hacer la regresión sin intercepto.

Nota: No existe una forma única para incorporar las variables dicótomas en un Modelo
de Regresión.

Significancia estadística de las variables dicótomas. Bajo el supuesto de normalidad


en los errores es posible probar la significancia individual de las categorías (Pruebas T) o
de la variable cualitativa en su conjunto (Prueba F).

DAVID RUELAS RODRÍGUEZ 4-2


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

4.1.2. Múltiples Variables Cualitativas e Interacciones

Es posible incorporar varias variables cualitativas en los Modelos de Regresión.

Por ejemplo, si para explicar el ingreso mensual de las personas (Y) además de
considerar su situación laboral (activo, retirado o desempleado) se considera su género
(hombre o mujer), se puede formular el modelo econométrico:
Yi   0  1 D1i   2 D2i   3Ci  ui , ui ~ iid(0,  2 ),
donde: D1i = 1 si la i-ésima persona es activa y D1i = 0 en caso contrario; y
D2i = 1 si la i-ésima persona es retirada y D2i = 0 en caso contrario;
Ci = 1 si la i-ésima persona es hombre y Ci = 0 si es mujer.

Con base en esta definición se presentan 6 posibilidades para Y:


  0  1  u i si D1i  1, D2i  0, Ci  0
    u si D1i  0, D2i  1, Ci  0
 0 2 i

  ui si D1i  0 , D2i  0, Ci  0


Yi   0
  0  1   3  u i si D1i  1, D2i  0, Ci  1
 0   2   3  ui si D1i  0, D2i  1, Ci  1

 0   3  u i si D1i  0 , D2i  0, Ci  1

Al estimar el MRLM por MCO se obtienen ˆ0 , ̂1 , ̂ 2 y ̂ 3 , de modo que los ingresos
mensuales estimados se pueden presentar en una tabla como se muestra en la figura 4.1.

Figura 4.1
Ingreso mensual estimado

Género
Situación laboral
Mujer Hombre
Activo ˆ0  ˆ1  0  ˆ1  ˆ3
ˆ
Retirado ˆ  ˆ
0 2 ˆ  ˆ  ˆ
0 2 3

Desempleado ̂ 0 ˆ0  ˆ3

A los MRLM cuyos regresores son exclusivamente variables cualitativas se les


denomina Modelos de Análisis de Varianza o Modelos ANOVA, pues permiten
analizar el comportamiento de la variable cuantitativa Y a través de las distintas
categorías (o combinaciones de categorías) de las variables explicativas.

De la figura 4.1 se observa cómo en los Modelos ANOVA es importante poder analizar
transformaciones lineales de los parámetros. Bajo el supuesto de normalidad en los
errores es posible aplicar la Prueba F (TLG) para validar si, por ejemplo, el ingreso
mensual de los hombres activos es el salario mínimo (H0:  0  1   3  wmin ).

DAVID RUELAS RODRÍGUEZ 4-3


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

En los ejemplos previos se ha considerado que las variables dicótomas tienen un efecto
aditivo en la variable explicativo; sin embargo, también es posible considerar que las
variables dicótomas tengan un efecto multiplicativo.

Por ejemplo, considerando nuevamente el ingreso mensual de las personas (Y) explicado
por su situación laboral (activo, retirado o desempleado) y su género (hombre o mujer),
se puede formular el siguiente modelo econométrico alternativo:
Yi   0  1 D1i   2 D2i   3Ci   4 D1i Ci  ui , ui ~ iid(0,  2 ),
donde: D1i = 1 si la i-ésima persona es activa y D1i = 0 en caso contrario; y
D2i = 1 si la i-ésima persona es retirada y D2i = 0 en caso contrario;
Ci = 1 si la i-ésima persona es hombre y Ci = 0 si es mujer.

En este modelo al término  4 D1i Ci se le denomina término de interacción. El


parámetro 4 es un efecto multiplicativo adicional al efecto aditivo de 1 de los activos y
3 de los hombres, de modo que en este modelo la estimación del ingreso mensual de los
hombres activos es ˆ0  ˆ1  ˆ3  ˆ4 .

Ejercicio E47 .

4.2. MRLM con Variables Cuantitativas y Dicótomas


A los MRLM cuyos regresores combinan variables cuantitativas y variables cualitativas
se les denomina Modelos de Análisis de Covarianza o Modelos ANCOVA, pues
permiten explicar el comportamiento de la variable cuantitativa Y mediante regresores
cuantitativos pero considerando además las distintas categorías (o combinaciones de
categorías) asociadas a los regresores cualitativos.

La incorporación de las variables dicótomas a los Modelos ANCOVA puede ser tanto
aditiva como multiplicativa, y con frecuencia se consideran términos de interacción
entre variables cualitativas y cuantitativas.

El Modelo ANCOVA más simple es el que incluye un regresor cuantitativo (X) y una
variable dicótoma (D). Mediante este modelo se pueden estimar:
 Cambio de intercepto (ver Figura 4.2, rectas paralelas):
   2 X i  u i si Di  0
Yi   0  1 Di   2 X i  ui   0 ;o
 0  1    2 X i  ui si Di  1

 Cambio de pendiente (ver Figura 4.3, rectas concurrentes):


  1 X i  u i si Di  0
Yi   0  1 X i   2 Di X i  ui   0
 0  1   2 X i  ui si Di  1

DAVID RUELAS RODRÍGUEZ 4-4


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Figura 4.2
Cambio de intercepto (rectas paralelas)

Y ^ ^ ^ ^
Yi = ( 0 +  1) +  2 Xi

^ ^ ^
Yi =  0 +  2 Xi

^ ^
 0 1 D=1
D=0

^
0

0
0 0 X

Figura 4.3
Cambio de ordenada (rectas concurrentes)

Y ^ ^ ^ ^
Yi =  0 + ( 1 +  2 ) Xi

^ ^ ^
Yi =  0 +  1 Xi

D=1
D=0
^
0
0
0 0 X

Si se desean modelar simultáneamente cambio de intercepto y cambio de pendiente el


modelo econométrico es:
Yi   0  1 Di   2 X i   3 Di X i  ui , ui ~ iid(0,  2 ),
a partir del cual se generan 2 posibles regresiones:
 Recta de comparación: Yi   0   2 X i  ui , si Di  0 ; y

 Recta disímbola: Yi   0  1    2   3 X i  ui si Di  1 .

La figura 4.4 muestra las gráficas de las estimaciones de la recta de comparación y de la


recta disímbola.

DAVID RUELAS RODRÍGUEZ 4-5


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Figura 4.4
Cambio de intercepto y de pendiente (rectas de comparación y disímbola)

Y ^ ^ ^ ^ ^
Yi = ( 0 +  1) + ( 2 +  3) Xi

^ ^ ^
Yi =  0 +  2 Xi

^
0 D=1 D=0

^ ^
 0 1
0
0 0 X

Los Modelos ANCOVA se pueden generalizar para cualquier número de regresores


cuantitativos y de variables dicótomas (aditivas o multiplicativas). Por ejemplo, si se
consideran k regresores cuantitativos X1, X2,…, Xk, y k variables dicótomas (aditivas y
multiplicativas) D1, D2,…, Dk, se puede formular el modelo econométrico:
k k k
Yi   0    j D ji    j X ji    j D ji X ji  ui , ui ~ iid(0,  2 ),
j 1 j 1 j 1

en el cual aparecen 1 + k + k + k + 1 = 3k + 2 parámetros y para poder estimarse por


MCO se requieren n > 3k + 2 observaciones.

Ejercicio E48 .

4.3. Análisis estacional


En el análisis de series de tiempo, donde la variable de interés (Yt) se explica mediante la
variable tiempo (t), es común encontrar cierto patrón que se repite a lo largo del tiempo
sobre intervalos de igual longitud (típicamente un año calendario). A ese patrón se le
denomina estacionalidad y se puede modelar mediante variables dicótomas.

Por ejemplo, en la figura 4.5 se muestra el consumo mensual doméstico de energía


eléctrica en México (Yt), de enero de 2005 a diciembre de 2012 (t = 1, 2,…, 96). Esta
serie presenta estacionalidad pues año con año el patrón es el mismo: inicia
disminuyendo alcanzando su mínimo en marzo, luego crece de manera sostenida hasta
septiembre, y finalmente cierra en diciembre con una tendencia a la baja.

DAVID RUELAS RODRÍGUEZ 4-6


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Figura 4.5

Consumo doméstico mensual de energía eléctrica en México


(Enero 2005 - Diciembre 2012)

Miles de millones watts/hora 4,500

4,000

3,500

3,000

2,500

2,000
0 12 24 36 48 60 72 84 96

Mes
Fuente: www.inegi.gob.mx

En este caso particular, además de estacionalidad, existe una tendencia lineal creciente,
de modo que se puede considerar el modelo econométrico:
11
Yt   0    j M jt  12 t  ui , ui ~ iid(0,  2 ),
j 1

donde: Mjt = 1 en el mes j, j = 1, 2,…, 11; y


Mjt = 0 en caso contrario.

Note que no se incluye una variable dicótoma para el mes 12 a fin de evitar la “trampa
de la variable dicótoma” (problema de multicolinealidad).

Ejercicio E49 .

Con la finalidad de analizar con mayor profundidad a las series de tiempo (metodología
de Box-Jenkins, 1970) y poder hacer mejores pronósticos, se acostumbra eliminar la
estacionalidad de la serie. A este proceso se le conoce como desestacionalización de la
serie. Es común que las fuentes de información oficial de los países, como el INEGI o
BANXICO en México, presenten series de tiempo macroeconómica desestacionalizadas.

A continuación se presenta un método básico para desestacionalizar series de tiempo, sin


embargo, en la práctica existen muchos otros métodos más sofisticados y precisos para
desestacionalizar series de tiempo como el ARIMA X-12 (desarrollado por el United
States Census Bureau) o TRAMO (desarrollado por el Banco Central de España).

DAVID RUELAS RODRÍGUEZ 4-7


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Método de Desestacionalización con Variables Dicótomas


1) Estimar la serie de tiempo por MCO considerando intercepto y utilizando como
regresores sólo las variables dicótomas que modelan la estacionalidad. Los
coeficientes de este modelo permiten calcular los factores de estacionalidad.
2) Construir la serie de tiempo desestacionalizada sumando los residuos del modelo
anterior y la media muestral de la serie de tiempo original.

Los factores de estacionalidad son los aumentos o disminuciones periódicos (v.gr.,


mensuales, trimestrales) que se presentan a lo largo del tiempo y se calculan como el
intercepto más el coeficiente de cada variable dicótoma menos la media muestral de la
serie de tiempo original. La suma de los factores de estacionalidad siempre debe ser
cero.

Al eliminar la estacionalidad de una serie de tiempo es más fácil identificar si existe


algún tipo de tendencia.

Para hacer pronósticos de una serie de tiempo a partir de su respectiva serie


desestacionalizada es necesario incorporar nuevamente la estacionalidad sumando sus
respectivos factores de estacionalidad.

Ejercicio E50 .

4.4. Cambio estructural y regresión lineal por segmentos.


4.4.1. Cambio estructural.

Otra de las aplicaciones de las variables dicótomas en el análisis de series de tiempo es


el Modelo de Cambio Estructural, que permite modelar cambios en la tendencia de la
serie en distintos intervalos de tiempo. La principal característica es que cada segmento
de tendencia tiene sus propios parámetros pero hay continuidad en el ajuste.

Por ejemplo, en la figura 4.6 se muestra la serie de tiempo del índice de precios al
consumidor (IPCt) en Estados Unidos de 1950 a 2012, t = 1950, 1951,…, 2012, (base
1984 = 100). En esta gráfica es fácil identificar que el comportamiento de 1950 a 1970
es lineal y que de 1971 a 2012 el comportamiento también es lineal pero con intercepto
y pendiente distintos. Al punto del tiempo en el que se presenta el cambio de tendencia
de le denomina nudo, y en este caso corresponde al tiempo t = 1970. En este caso se
puede considerar el modelo econométrico:
IPCt   0  1t   2 t  1970CEt  ut , ut ~ iid(0,  2 ),
donde: CEt = 1 si t = 1970, 1971,…, 2012; y
CEt = 0 en caso contrario.

DAVID RUELAS RODRÍGUEZ 4-8


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 4

Figura 4.6

Índice de Precios al Consumidor (IPC) en Estados Unidos


(1950 - 2012)

250

IPC (base 1984 = 100)


200

150

100
nudo
(1970)
50

0
1950 1960 1970 1980 1990 2000 2010

Año

Definición del nudo. La definición del nudo no es única. Existen distintos criterios
para determinarlo; uno de ellos consiste en elegir como nudo aquel valor para el cuál se
maximizan simultáneamente la R2 de ambas tendencias lineales.

Importante: A diferencia del Modelo ANCOVA de un regresor cuantitativo y una


variable dicótoma con cambio de intercepto y de ordenada (4 parámetros), en el Modelo
de Cambio Estructural sólo es necesario estimar 3 parámetros pues el valor del nudo es
conocido de antemano, lo que garantiza la continuidad en el ajuste.

4.4.2. Regresión Lineal por Segmentos

Al igual que el Modelo de Cambio Estructural, la Regresión Lineal por Segmentos


consiste en un MRLS que experimenta un cambio de intercepto y/o de pendiente a partir
de cierto nivel del regresor (no necesariamente el tiempo) denominado umbral.

En el contexto de la Regresión Lineal por Segmentos al umbral se le denota por X* y el


modelo econométrico puede formularse de la siguiente manera:
 
Yi   0  1 X i   2 X i  X * D i ui , ut ~ iid(0,  2 ),
donde: Di = 1 si Xi ≥ X*; y
Di = 0 si Xi < X*.

Ejercicio E51 .

DAVID RUELAS RODRÍGUEZ 4-9


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

5. Análisis de Supuestos del MRLM

La validez de los resultados que se pueden obtener mediante la aplicación del MRLM
recae en gran medida en que se cumplan los supuestos planteados para su estimación,
inferencia estadística y predicción.

Para definir al MRLM y  X  u se hicieron nueve supuestos: (i) linealidad en los


parámetros; (ii) regresores no estocásticos e independientes de los errores; (iii) errores
con media cero; (iv) errores con varianza constante (homocedasticidad); (v) errores
independientes y no correlacionados; (vi) número de observaciones mayor al número de
parámetros; (vii) valores diferenciados en los regresores y sin valores atípicos; (viii) no
colinealidad entre los regresores; y (ix) no debe haber sesgo de especificación.

Estos supuestos se deben cumplir para que el MRLM se pueda estimar por MCO, que
ˆ  XX 1 Xy  sea MELI y poder hacer predicción puntual.

Adicionalmente se formuló un décimo supuesto: (x) normalidad en los errores. Este


supuesto se debe cumplir para poder afirmar que el EMV de  coincide con su
respectivo estimador MCO y que en consecuencia ˆ  XX  Xy  , además de ser
1

MELI, posee las propiedades de los EMV: invarianza, consistencia y eficiencia


asintótica.

El supuesto de normalidad es indispensable para realizar estimación por intervalo


(intervalos de confianza para los parámetros), pruebas de hipótesis (particularmente las
Pruebas T y F) y predicción por intervalo (intervalos de confianza para las medias e
intervalos de predicción para los valores).

Algunos de estos supuestos se validan por la especificación del modelo: (i) y (ix).
Otros se validan mediante el análisis exploratorio de los datos que integran la muestra
disponible para la estimación: (ii), (vi) y (vii).

El supuesto (iii) de errores con media cero (u = 0) es fácil de validar mediante la
gráfica de los residuos vs. la variable de interés o de los residuos vs. algún regresor. Si
el MRLM se estima con intercepto se sabe que  uˆi  0 , lo cual garantiza el
cumplimiento de este supuesto pues ˆ u  uˆi  0 .

Los supuestos (iv), (v) y (viii) son más complejos de validar, y su incumplimiento
conduce a los siguientes problemas:
 Multicolinealidad, que surge por incumplimiento del supuesto (viii);
 Heterocedasticidad, que surge por incumplimiento del supuesto (iv); y
 Autocorrelación, que surge por incumplimiento del supuesto (v).

DAVID RUELAS RODRÍGUEZ 5-1


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Para identificar, analizar y corregir algunos de estos problemas es útil el supuesto de


normalidad, así que iniciaremos este tema presentando algunas pruebas estadísticas que
permiten validar el supuesto (x) de normalidad.

5.1. Normalidad
La normalidad de los errores del MRLM se puede validar analizando sus respectivos
residuos mediante métodos gráficos o mediante pruebas estadísticas más formales como
se resume en la figura 5.1

Figura 5.1

Métodos gráficos Pruebas de bondad de ajuste


 Histogramas  Jarque-Bera (1980)
 Gráfica de Probabilidad  Lilliefors (1967)
Normal  Cramér-Von Mises (1928-1930)
 Gráfica Cuantil-Cuantil  Watson (1961)
(Q-Q Plot).
 Anderson-Darling (1952)

Si un conjunto de residuos tiene una distribución normal, entonces su histograma debe


ser simétrico y acampanado, y en sus respectivas gráficas de probabilidad normal y
gráfica cuantil-cuantil los cuantiles muestrales deben ubicarse sobre la recta (o muy
cercanos a ella).

En las pruebas de bondad de ajuste se plantea que los errores u1, u2,…, un tienen una
distribución Normal caracterizada por F0 ~ N 0, u2  , es decir,
H0: Fu  F0 vs. H1: Fu  F0 .

La Prueba Jarque-Bera utiliza un estadístico de prueba basado en los coeficientes de


asimetría y curtosis muestrales:
1 n
CA 
m3 m
, CC  44  3 , donde s  m2 y mk   X i  X k .
s 3
s n  1 i 1

Desafortunadamente esta prueba sólo es válida para muestras muy grandes (n > 2,000).

El resto de estas pruebas son modificaciones más potentes de la Prueba Kolmogorov-


Smirnov (1933-1948), válidas para muestras de cualquier tamaño, que comparan las
distancias (en valor absoluto) entre la función de distribución acumulada teórica F0 uˆi 

y la función de distribución acumulada empírica Fn uˆi    I  ,uˆi  uˆ j  . La figura 5.2
1
n uˆ j uˆi
resume las regiones de rechazo y estadísticas de prueba en cada caso:

DAVID RUELAS RODRÍGUEZ 5-2


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Figura 5.2

Prueba Región de rechazo Estadístico de prueba


RR  JB   22,  n
JB  CA 
2 CC 2  
d
 2 2 
Jarque-Bera 
6 4 
RR  D  l  , donde l se
Lilliefors obtiene numéricamente mediante i

D  sup Fn uˆi    F0 uˆ i   
simulación Monte Carlo
RR   2  c n , , donde c n ,
Fn u   F0 u 2 f 0 u du

Cramér-Von Mises 2  

aparece en tablas para esta prueba.
2
1 n 1
U 2  T  n   F0 uˆi    , donde
RR  U 2  u n2, , donde u n2,  i 1
n 2
Watson
aparece en tablas para esta prueba. 1 n
 2i  1 
T   F0 u i 
12n i 1  2n 
A2  n  S donde
 
RR  A 2  a2 , donde a2
2i  1
Anderson Darling
lnF0 uˆ i    ln1  F0 uˆ n1i  
n

aparece en tablas para esta prueba. S 


i 1 n

Como en todos estos casos bajo H0 se plantea la distribución teórica Normal, el


supuesto de normalidad se valida si el valor-p es grande.

La mayor parte de los paquetes Estadísticos y Econométricos presentan algunas de estas


pruebas de bondad de ajuste para analizar la normalidad de los errores. En particular
EViews presenta todas estas pruebas.

Ejercicio E52 .

Si para un MRLM no se valida la normalidad de sus residuos, es posible transformar la


variable dependiente Yi en busca de que su respectivo MRLM transformado tenga
residuos normales. Una transformación utilizada con frecuencia para este fin es la
transformación potencia, que depende de   R, que es una parámetro adicional.

Def. Transformación Potencia.

Yi  si   0
Yi    
ln Yi  si   0

Algunos paquetes de Estadísticos y Econométricos estiman simultáneamente  y los


parámetros del MRLM por máxima verosimilitud. Una forma simple de determinar el
valor de  que conduzca a la normalidad de los errores, es estimar por MCO los modelos
Yi     0  1 X 1i   2 X 2i     k X ki  ui   para algunos valores de  (por ejemplo,
0, ±0.5, ±1, ±1.5 y ±2) y elegir aquél con menor SCR.

DAVID RUELAS RODRÍGUEZ 5-3


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

5.2. Multicolinealidad

5.2.1. Definición y Causas de la Multicolinealidad

Def. Multicolinealidad.
Se dice que el MRLM Yi   0  1 X 1i   2 X 2i     k X ki  ui presenta el problema de
multicolinealidad si algún regresor (Xj) se puede expresar como combinación lineal de
algunos otros regresores, es decir, si existen constantes c1,…, ck, tales que X j   ch X h
h j

para alguna ch ≠ 0.

Esta definición establece que hay una relación exacta entre los regresores, por lo que
también se le denomina multicolinealidad perfecta. Desafortunadamente, incluso si
existe una relación aproximada entre los regresores el problema de multicolinealidad
persiste y se denomina multicolinealidad alta pero imperfecta.

Consecuencias de la multicolinealidad:
 Si la multicolinealidad es perfecta, el MRLM y  X  u no se puede estimar por
MCO, pues la matriz de diseño X no es de rango completo (Rango(X) < k + 1), XX
es singular y por lo tanto XX  no existe.
1

 Si la multicolinealidad es alta pero imperfecta, el MRLM y  X  u sí se puede


estimar por MCO pero los errores estándar de ˆ j , j = 0, 1,…, k, son muy grandes, lo
que implica que las estimaciones puntuales no son muy precisas (intervalos de
confianza amplios y pruebas de significancia poco significativas). En estas
situaciones hay que tener en cuenta que el simple hecho de tener relaciones
aproximadas entre los regresores aumenta el valor de la R2.

Causas de la multicolinealidad:
 Es común que al considerar series de tiempo que comparten una tendencia se presente
el problema de multicolinealidad. Por ejemplo, si se quiere explicar el consumo
mediante el ingreso y la riqueza, existe altas correlaciones entre el ingreso y la
riqueza a lo largo del tiempo que conducen a una multicolinealidad alta pero
imperfecta.
 Al incorporar variables dicótomas en el MRLM se puede incurrir en la “trampa de la
variable dicótoma”, que conduce de inmediato a una multicolinealidad perfecta.
 En general, la multicolinealidad es un problema de tipo muestral, la variable de
interés se observa para intervalos limitados de los regresores. Ante una
multicolinealidad imperfecta lo relevante es saber qué tan fuerte es dicha colinealidad
para poder corregirla.

DAVID RUELAS RODRÍGUEZ 5-4


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

5.2.2. Identificación de la Multicolinealidad

No existe un método único que permita identificar la multicolinealidad, pero existen


algunas reglas prácticas:
 XX singular. En estas situaciones los paquetes estadísticos no pueden calcular
XX 1 al tratar de estimar el MRLM por MCO e indican al usuario la existencia de
multicolinealidad perfecta.
 R2 alta pero Pruebas T poco significativas. Esto es un indicativo de la posible
existencia de multicolinealidad imperfecta.
 Altas correlaciones entre parejas de regresores. La matriz de correlaciones y el
diagrama de dispersión múltiple son útiles para realizar este análisis. Altas
correlaciones pueden ocasionar multicolinealidad alta pero imperfecta. Correlaciones
perfectas (1) provocan multicolinealidad perfecta.

La multicolinealidad perfecta siempre de debe corregir. La multicolinealidad imperfecta


es un problema con el que se puede vivir. Una regla práctica para determinar si la
multicolinealidad imperfecta es “grave” es la Regla de Klein.

Regla de Klein
La multicolinealidad imperfecta es un problema “grave” únicamente si la R2 de una
regresión auxiliar es mayor a la R2 global.

En esta regla la R2 global es la R2 de la regresión en donde se explica a Y mediante los


regresores X1, X2,… Xk; y R2 de una regresión auxiliar corresponde a la R2 de la
regresión en donde se explica a uno de los regresores (Xj) mediante el resto de los
regresores ( X 1 ,…, X j 1 , X j 1 ,…, X k ) y sin incluir a la variable de interés.

5.2.3. Corrección de la Multicolinealidad

Si un MRLM presenta multicolinalidad perfecta es indispensable corregirla, sin


embargo, si hay multicolinealidad imperfecta es posible vivir con ella y simplemente
saber que las estimaciones que se puedan hacer mediante ese MRLM son poco precisas.

A continuación se expondrán algunas técnicas que permiten corregir la


multicolinealidad:
 Eliminación de variables.
 Incorporación de información a priori.
 Transformación de variables.
 Métodos multivariados.

DAVID RUELAS RODRÍGUEZ 5-5


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Eliminación de variables. La solución más simple para resolver la multicolinealidad es


eliminar del modelo las variables que la provocan. Si X j   ch X h quiere decir que se
h j

posible eliminar a Xj pues toda la información relevante está en los regresores Xh’s; o
que es posible eliminar a las Xh’s y dejar sólo a Xj, ya que ésta resume la información de
dichos regresores.

Por ejemplo, si se incurre en la “trampa de la variable dicótoma” se puede resolver


mediante esta técnica eliminando la columna de unos de la matriz de diseño (regresión
sin intercepto) o bien, eliminando la variable dicótoma de alguna de las categorías del
regresor cualitativo.

Esta forma de proceder parece trivial pero conceptualmente es relevante pues puede
conducir a un sesgo de especificación. Si la Teoría Económica establece cuáles son los
regresores que hay que utilizar en un modelo y se presenta el problema de
multicolinealidad lo que se tiene es un problema de muestreo (con los datos disponibles)
y no deben eliminarse los regresores del modelo pues se incurre en sesgo de
especificación. Es necesario aplicar alguna otra técnica de corrección.

Incorporación de información a priori. Si se tienen identificados los regresores que


ocasionan la multicolinealidad (v.gr., aquellos que están altamente correlacionados) es
posible incorporar información a priori proveniente de la teoría del área específica de
estudio que permita establecer una relación determinista entre dichos regresores y
posteriormente incluir dicha relación como un nuevo regresor.

Transformación de variables. Al considerar series de tiempo es común que algunos


regresores se muevan en la misma dirección a lo largo del tiempo provocando
multicolinealidad alta pero imperfecta. Una forma de eliminar la multicolinealidad es
transformar dicha variables. Las transformaciones más comunes son las de primeras
diferencias y de razón.

Por ejemplo, si el modelo con alta multicolinealidad es Yt   0  1 X 1t   2 X 2t  ut ,


entonces sus transformaciones son:
 Primeras diferencias: Yt  Yt 1  1  X 1,t  X 1,t 1    2  X 2,t  X 2,t 1   vt

Yt  1  X  u
 Razón:   0    1  1t    2  wt , donde wt  t
X 2t  X 2t   X 2t  X 2t
Hay que tener cuidado con la transformación de razón pues al dividir los errores del
modelo original entre uno de los regresores es posible incurrir en heterocedasticidad.

Métodos multivariados. En Estadística Multivariada se estudian a detalle las posibles


relaciones entre los regresores y pueden utilizarse algunas de sus técnicas como el
Análisis Factorial o el Análisis de Componentes Principales para resolver el problema
de multicolinealidad.

Ejercicio E53 .

DAVID RUELAS RODRÍGUEZ 5-6


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

5.3. Heterocedasticidad

5.3.1. Definición y Causas de la Heterocedasticidad

El supuesto (iv) del MRLM establece que los errores deben tener varianza constante
(homocedasticidad), es decir, Var[ui ]   2 para toda i = 1, 2,…, n. El problema que
surge por la violación de este supuesto se denomina heterocedasticidad.

Def. Heterocedasticidad.
Se dice que el MRLM Yi   0  1 X 1i   2 X 2i     k X ki  ui presenta el problema de
heterocedasticidad si Var[ui ]   i2 , i = 1, 2,…, n, donde  i2   2j para alguna i ≠ j.

Geométricamente los errores heterocedásticos se pueden representar para el MRLS


como se muestra en la figura 5.3.

Figura 5.3

Errores heterocedásticos

E[Xi | Yi ] =  0 +  1 Xi

un
u2

Yn =  0 +  1 Xn + un
u1
ui ~ iid(0,  i 2)
varianza no constante
0

0 X1 X2 ... Xn X

Para el MRLM con heterocedasticidad (y sin autocorrelación) la matriz de varianzas y


covarianzas es una matriz diagonal de la forma:
 12 0  0 
 
 0  22  0 
V ,
    
 
 0 0   n2 

de modo que y  X  u , u ~ 0, V  .

DAVID RUELAS RODRÍGUEZ 5-7


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Consecuencias de la heterocedasticidad:
 Los estimadores MCO son lineales, insesgados y consistentes, pero dejan de ser de
mínima varianza (no son MELI).
 Si la matriz de varianzas-covarianzas de los estimadores MCO se estima como
uˆ uˆ
ˆ ˆ  ˆ 2 XX  donde ˆ 2 
1
, ˆ i2 (el i-ésimo elemento de la diagonal
n  k  1
principal) sobrestima el verdadero valor de  i2 , invalidando las Pruebas T y F, a
pesar de que el supuesto de normalidad se valide.

Causas de la heterocedasticidad:
 Modelos de aprendizaje. La variable dependiente puede tener menos variabilidad
conforme alguno de los regresores aumentan (o disminuyen) su valor. Por ejemplo,
el número de errores de un capturista va presentando menor variabilidad (menor
error) conforme aumentan sus horas dedicadas a la captura de información.
 Presencia de observaciones atípicas (outliers).
 Asimetría en la distribución de uno o varios de los regresores. Por ejemplo, la
distribución del ingreso y riqueza típicamente presentan un sesgo derecho.

5.3.2. Identificación de la Heterocedasticidad

No existe un método único que permita identificar la heterocedasticidad, pero existen


algunos métodos (informales y formales) para su detección.

MÉTODOS INFORMALES

Los métodos informales más simples son:


 Naturaleza del problema.
 Método gráfico.

Naturaleza del problema. El investigador sabe de antemano que la dispersión de la


variable explicada es mayor o menor ante distintos niveles de sus regresores. Por
ejemplo, modelos de aprendizaje.

Método gráfico. Consiste en estimar el MRLM por MCO y analizar el comportamiento


uˆ uˆ 1 n
de los residuos. El estimador MCO de  2 es ˆ 2    uˆi2 , de
n  k  1 n  k  1 i 1
modo que bajo el supuesto de homocedasticidad, el comportamiento de û12 , û 22 ,…, uˆ n2 ,
debe ser bastante uniforme. Para verificarlo la gráfica de los residuos al cuadrado vs. los
valores ajustados deben revelar un patrón como el de la figura 5.4.

DAVID RUELAS RODRÍGUEZ 5-8


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Figura 5.4

^
u2

residuos
homocedásticos

0
^
00 Y

Si el supuesto de homocedasticidad no se cumple, entonces la gráfica de los residuos al


cuadrado vs. los valores ajustados deberán mostrar algún tipo de patrón no uniforme,
como los que se muestran en la figura 5.5, revelando la heterocedasticidad.

Figura 5.5

^ ^ ^
u2 u2 u2
residuos residuos residuos
heterocedásticos heterocedásticos heterocedásticos

0 0 0
^ ^ ^
00 Y 00 Y 00 Y

MÉTODOS FORMALES

Se expondrán las siguientes pruebas estadísticas que son fáciles de implementar en


EViews para el diagnóstico de los residuos:
 Breusch-Pagan-Godfrey.
 Glejser.
 White.
 Igualdad de varianzas por grupos.

Otro método formal de fácil implementación es la Prueba Goldfeld-Quandt, sin


embargo, no se expondrá aquí pues no está programada en EViews.

DAVID RUELAS RODRÍGUEZ 5-9


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Prueba de Breusch-Pagan-Godfrey

Si Yi   0  1 X 1i     k X ki  ui , Var ui    i2   0  1 Z1i     m Z mi  vi y Zi son


todas o algunas de las Xj, m ≤ k, entonces el MRLM tiene errores homocedásticos sí y
sólo si 1   2     m  0 . Entonces para la prueba H0: 1   2     m  0 vs
H1: alguna  i  0 , la región de rechazo es RR  j   m2 ,  y el estadístico de prueba es
J  nRv2 
d
 2 m  , donde Rv2 es el coeficiente de determinación de la regresión
auxiliar uˆi2   0  1 Z1i     m Z mi  vi .

El rechazo de la hipótesis nula en la Prueba de Breusch-Pagan-Godfrey confirma la


heterocedasticidad. La distribución asintótica Ji-Cuadrada de esta prueba se
fundamenta en el Teorema Central del Límite. Para que la distribución de J  nRv2 sea
Ji-Cuadrada en muestras chicas, es necesario validar primero el supuesto de normalidad
en los errores ui.

Una variante de esta prueba es considerar la región de rechazo RR  scre   m2 , ,  


1 n 2 d
donde el estadístico de prueba es SCRE   vˆ*i   2 m  y los residuos se toman
2 i 1
uˆ 2
uˆ uˆ 1 n 2
de la regresión auxiliar i2   0  1Z1i     m Z mi  v*i , ˆ *2    uˆi .
ˆ * n n i 1

Prueba de Glejser
Si Yi   0  1 X 1i     k X ki  ui ,  ui   i  0  1Z1i     m Z mi  vi y Zi son
todas o algunas de las Xj, m ≤ k, entonces el MRLM tiene errores homocedásticos sí y
sólo si 1   2     m  0 . Entonces para la prueba H0: 1   2     m  0 vs
H1: alguna  i  0 , la región de rechazo es RR  f v  f m,nm1,  y el estadístico de

prueba es Fv 
n  m  1SCEv ~ F m, n  m  1 , de la Prueba F (ANOVA) de la
mSCRv
regresión auxiliar uˆi   0  1 Z1i     m Z mi  vi , vi ~ N(0,  v2 ).

El rechazo de la hipótesis nula en la Prueba de Glejser confirma la existencia de


heterocedasticidad en los errores.

DAVID RUELAS RODRÍGUEZ 5-10


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Una variante de esta prueba es la Prueba de Park, que supone que las varianzas se
pueden expresar mediante el modelo no lineal Var ui    i2   2 Z1i 1  Z mi
 m wi
e , de modo
que ln  i2   ln  2    1 lnZ1i      m lnZ mi   wi . En este caso la región de rechazo

es RR  f w  f m,nm1, , donde Fw 


n  m  1SCEw ~ F m, n  m  1 es el
mSCRw
estadístico de prueba de la Prueba F (ANOVA) de la regresión auxiliar
 
ln uˆi2   0  1 Z1i     m Z mi  wi ,  0  ln  2 y wi ~ N(0,  w2 ).  
Prueba de White
Si Yi   0  1 X 1i     k X ki  ui y la varianza de los errores se determinan mediante
k 2k
la forma cuadrática Var ui    i2   0    j X ji   j X 2ji   j X l X h  vi , los
j 1 j  k 1  j:l  h
k 
errores son homocedásticos sí y sólo si 1   2     m  0 , donde m  2k    .
 2
Entonces para la prueba H0: 1   2     m  0 vs H1: alguna  i  0 , la región de
rechazo es RR  J   m2 ,  y el estadístico de prueba es J  nRv2 ~  2 m  , donde Rv2
es el coeficiente de determinación de la regresión auxiliar
k 2k
uˆi2   0    j X ji   j X 2ji   j X l X h  vi
j 1 j  k 1  j:l  h

El rechazo de la hipótesis nula en la Prueba de White confirma la existencia de


heterocedasticidad en los errores. A diferencia de las Pruebas de Breusch-Pagan-
Godfrey y de Glejser que requieren forzosamente del supuesto de normalidad, la prueba
de White no requiere del supuesto de normalidad. La regresión auxiliar de esta
prueba involucra muchos parámetros y su estimación requiere muchos datos. Esta
dificultad se puede superar eliminando los términos lineales y las interacciones.

Ejercicio E54 .

Pruebas de igualdad de varianzas por grupos. Las Pruebas F, Bartlett, Levene y


Brown-Forsythe, comparten la siguiente lógica: Yi   0  1 X 1i     k X ki  ui , donde
Var ui    i2  g X ji  , es decir, la varianza del error está en función de alguno de los
regresores (Xj) de modo que  i2 toma distintos valores para distintos niveles Xji. Si se
eligen m grupos, definidos por m intervalos mutuamente excluyentes y exhaustivos de
los posibles valores de Xj, entonces se busca probar H0:  12   22     m2 vs.
H1:  i2   2j para alguna i ≠ j. El rechazo de H0 confirma la existencia de
heterocedasticidad.

DAVID RUELAS RODRÍGUEZ 5-11


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Si los n residuos û1 , û 2 ,…, û n se dividen en m grupos de tamaños n1, n2,…, nm, tales
m
que n
h 1
h  n, para cada grupo es posible calcular varianza muestral

S uˆ2h 
1 nh
nh  1 i 1

 uˆi  uˆi 
2
, desviación estándar muestral S uˆh  S uˆ2h , desviación media

respecto a la media dmh uˆ   1 nh


 uˆi  uˆi y desviación media respecto a la mediana
nh  1 i 1
~

dmh uˆ 
1 nh

nh  1 i 1
~
uˆi  uˆi . En la tabla de la figura 5.6 se muestran las regiones de

rechazo y las distribuciones de muestreo de los estadísticos de prueba (no se presentan


los estadísticos per se, pues son fórmulas muy extensas y los paquetes estadísticos las
calculan automáticamente).

Figura 5.6

Prueba y supuestos Región de Rechazo Estadístico de Prueba


F
(Normalidad, m = 2)

RR  f  f n1 1,n2 1,  S2
F  12 ~ F n1  1, n2  1
S2
Bartlett RR  b   m2 1,  B  g S uˆ1 , S uˆ 2 ,, S uˆm  ~  2 m  1
(Normalidad)
Levene RR  l  f m 1,n  m ,      
L  g dm1 uˆ , dm2 uˆ ,, dmm uˆ ~ F m  1, n  m 
Brown-Forsythe RR  bf  f m 1,n m ,    
~ ~ ~
 
BF  g dm1 uˆ , dm2 uˆ ,, dmm uˆ ~ F m  1, n  m

Ejercicio E55 .

5.3.3. Corrección de la Heterocedasticidad

Si un MRLM presenta heterocedasticidad se puede corregir con distintas técnicas,


dependiendo si las varianzas  i2 , son conocidas o no.

CORRECCIÓN DE LA HETEROCEDASTICIDAD CON VARIANZAS CONOCIDAS

Si las varianzas  i2 , i = 1, 2,…, n, son conocidas, la estimación del Modelo de


Regresión Lineal Múltiple Heterocedástico (MRLMH) se debe hacer mediante Mínimos
Cuadrados Generalizados (MCG).

DAVID RUELAS RODRÍGUEZ 5-12


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Teorema. Estimadores MCG del MRLMH

Para el MRLMH y  X  u , donde u ~ 0, V  y XV 1 X es no singular:


ˆ   XV 1X  XV 1y  es el estimador MCG de  .
1
i)

ii)  
Var ˆ   Σ ˆ   XX  XVX XX  .
1 1

iii) ˆ  es MELI

La demostración de este Teorema es muy similar a la demostración de MCO, basta


 
minimizar la suma de cuadrados de residuos SCR  g ˆ   uˆ uˆ y calcular esperanza y
1
varianza de ˆ   XV 1X XV 1y . 
 
Para el MRLSH Yi   0  1 X i  ui , ui ~ 0, i2 , es posible dividir ambos lados del
Yi  1  X  ui
modelo entre su desviación estándar para obtener   0    1  i   , donde:
i i   i  i
u  1 u  1
E  i   E ui   0 y
1
Var  i   2 Var ui   2  i2  1 ,  
 i   i  i   i i
Yi 1 Xi ui
es decir, si Yi*  , X 0*i  , X i*  y ui*  entonces Yi*   0* X 0*i  1* X i*  ui*
i i i i
es MRLS con ui* ~ 0,1 , y se puede estimar por MCO por tener errores homocedásticos.

Al calcular la suma de cuadrados de residuos para este modelo se obtiene:


2

   1 
 
 
n n n
SCR       Yi  ˆ0*  ˆ1* X i    wi Yi*  ˆ0*  ˆ1* X i
2 2
Yi  ˆ0* X 0*i  ˆ1* X i*
*

i 1 i 1   i   i 1

,
1
es decir, una suma de cuadrados de residuos ponderada por wi  .
 i2

Debido a lo anterior, a los estimadores MCG con errores heterocedásticos también se les
denominan estimadores Mínimos Cuadrados Ponderados (MCP).

DAVID RUELAS RODRÍGUEZ 5-13


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Teorema. Estimadores MCP del MRLSH

Para el MRLSH Yi   0  1 X i  ui , donde ui ~ 0, i2 y wi    1


 i2
:

i) ˆ1*  w w X Y  w X wY
i i i i i i i i
y ˆ0*  Yw  ˆ1* X w son los estimadores
 w  w X   w X  2 2
i i i i i

MCP de 1 y 0, respectivamente; Yw 


wY i i
y Xw 
w X i i
.
w i w i

1
 wi  wi X i2
w
ii)  
Var ˆ0 
* n ,  
Var ˆ1* 
i
y
 wi  wi X i2   wi X i  w w X   wi X i 
2 2 2
i i i

X w  wi
 
Cov ˆ0* , ˆ1*  
w w X   wi X i 
2 2
i i i

Desde el punto de vista computacional, para calcular los estimadores MCP es mucho
Y 1 X
más práctico hacer las transformaciones Yi*  i , X 0*i  , X 1*  i y estimar por
i i i
MCO el MRLM sin intercepto Yi *   0* X 0*i  1* X 1*i  ui* .

La corrección de heterocedasticidad mediante MCG (o MCP) genera estimadores


puntuales ˆ  similares a los de MCO ˆ (ambos estimadores son insesgados y
consistentes). Sin embargo, en presencia de heterocedasticidad, MCO sobrestiman las
   
varianzas, por lo que generalmente Var ˆ j  Var ˆ *j (es decir, ˆ no es MELI pero ˆ 
si lo es).

Ejercicio E56 .

CORRECCIÓN DE LA HETEROCEDASTICIDAD CON VARIANZAS DESCONOCIDAS

Si las varianzas  i2 , i = 1, 2,…, n, son desconocidas, la corrección de la


heterocedasticidad se puede realizar mediante los siguientes métodos:
 Procedimiento de White.
 Transformaciones de estabilización de varianza.

DAVID RUELAS RODRÍGUEZ 5-14


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Procedimiento de White. Consiste en estimar el MRLMH mediante MCO pero ajustar


la varianza de los estimadores para no sobrestimarla. La estimación de la matriz de
varianzas-covarianzas propuesta por White considera los residuos û1 , û 2 ,…, uˆ1n , de la
estimación MCO :
uˆ12 0  0 
 
 
2
ˆΣ ˆ   XX 1 XV ˆ   0 uˆ 2  0  .
ˆ X XX 1 , donde V
   
 2
 0 0  uˆ n 

Algunos paquetes estadísticos permiten calcular directamente la matriz de varianzas-


covarianzas del procedimiento de White e incluso reportan sus respectivos errores
estándar (raíz cuadrada de los elementos de la diagonal principal de Σ̂ ˆ  ), a los cuales se
les denomina errores estándar robustos.

Transformaciones de estabilización de varianza. Consisten en transformar un


MRLMH para que sea homocedástico. Parten del supuesto de que el patrón que sigue la
varianza de los errores en función del regresor,  i2  g  X i  , es conocido.

La figura 5.7 muestra el caso en que la varianza del error es proporcional al cuadrado de
los regresores  i2   2 X i2 (transformación lineal, lado izquierdo) y el caso en que la
varianza del error es directamente proporcional a los regresores  i2   2 X i
(transformación raíz cuadrada, lado derecho). En ambos casos  2 es una constante
(que por conveniencia denotamos de esta manera).

Figura 5.7

Transformación lineal Transformación raíz cuadrada

2 2

0 0
00 X 00 X

DAVID RUELAS RODRÍGUEZ 5-15


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

 
Por ejemplo, si Yi   0  1 X i  ui , donde ui ~ 0, i2 y se sospecha que  i2   2 X i2 ,
entonces es posible aplicar la transformación lineal dividiendo ambos lados del MRLS
Y  1  u
entre Xi obteniendo i   0    1  i , donde:
Xi  Xi  Xi

u  1 u 
E i   E ui   0 y
1 1
 
Var  i   2 Var ui   2  2 X i2   2 ,
 Xi  Xi  Xi  Xi Xi
es decir, el modelo transformado es homocedástico, puede ser estimado por MCO y sus
estimadores son MELI.

Importante: Las transformaciones de estabilización de varianza eliminan la


heterocedasticidad pero no estiman a Yi directamente, sino una transformación de Yi. Si
se desean hacer estimaciones o predicciones sobre Yi hay que aplicar la transformación
inversa.

Existen otras transformaciones que buscan estabilizar la varianza (eliminar la


heterocedasticidad) pero que no requiere suponer un patrón para la varianza de los
errores. Entre estas transformaciones están:
 La transformación logarítmica, que comprime las escalas de X y Y disminuyendo el
problema de heterocedasticidad; y
 La transformación potencia, que elimina la heterocedasticidad al considerar el tiempo
como regresor y se utiliza con frecuencia en el Análisis de Series de Tiempo.

Ejercicio E57 .

5.4. Autocorrelación

5.4.1. Definición y Causas de la Autocorrelación

El supuesto (v) del MRLM establece que los errores deben ser independientes, lo que
implica que sean no correlacionados, es decir, Cov[ui , u j ]  0 para toda i ≠ j. El
problema que surge por la violación de este supuesto se denomina autocorrelación.

Existen 2 situaciones en las cuales los errores del MRLM pueden estar correlacionados:
 En datos transversales, la correlación puede presentarse en unidades muestrales
contiguas. Por ejemplo, en estudios de consumo los errores de hogares en la misma
colonia pueden estar correlacionados. A este tipo de correlación se le denomina
correlación espacial; y
 En series de tiempo, la correlación puede presentarse en observaciones consecutivas
en el tiempo (en uno o varios períodos). A este tipo de correlación se le denomina
correlación serial o autocorrelación.

DAVID RUELAS RODRÍGUEZ 5-16


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

En esta sección se analizará la autocorrelación que surge al explicar la serie de tiempo


Yt, mediante las series de tiempo X1t, X2t,…, Xkt, t = 1, 2,…, n; es decir, todas las
variables estarán indizadas por el tiempo t.

Def. Autocorrelación.
Se dice que el MRLM Yt   0  1 X 1t   2 X 2t     k X kt  ut presenta el problema de
autocorrelación si Cov[ut , ut k ]  0 , para alguna k = 1, 2,…

Bajo el supuesto de homocedasticidad, Cov[ut , ut ]  Var ut    2 . Si Cov[ut , ut 1 ]  0


se dice que hay autocorrelación de primer orden, si Cov[ut , ut 2 ]  0 se dice que hay
autocorrelación de segundo orden, y así sucesivamente.

Consecuencias de la autocorrelación:
 Los estimadores MCO son lineales, insesgados y consistentes, pero dejan de tener
mínima varianza (no son MELI).
uˆ uˆ
 Es posible que el estimador de la varianza ˆ 2  subestime el verdadero
n  k  1
valor de  2 y sobrestime R2, invalidando las Pruebas T y F, a pesar de que el
supuesto de normalidad se valide.

Causas de la autocorrelación:
 Inercia o pasividad. Surge por la existencia de un impulso ascendente o descendente
en el comportamiento de una serie de tiempo.
 Sesgo de especificación. Omisión de alguna variable que teóricamente debe explicar
el comportamiento de una serie de tiempo. Por ejemplo, si existe una tendencia
cuadrática omitir el término t 2 provoca autocorrelación.
 Rezagos. Ocurre cuando la variable explicativa depende de rezagos (de la propia
variable o de algún regresor) y éstos se omiten en el modelo.

5.4.2. Identificación de la Autocorrelación

No existe un método único que permita identificar la autocorrelación, pero existen


métodos gráficos y pruebas estadísticas para su detección.

MÉTODOS GRÁFICOS

Serie de tiempo de los residuos. Consiste en graficar los residuos û1 , û 2 ,…, û n , en
forma ordenada a lo largo del tiempo t. La existencia de algún tipo de patrón es indica
que posiblemente haya autocorrelación.

DAVID RUELAS RODRÍGUEZ 5-17


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

Residuos vs residuos rezagados. Consiste en construir el diagrama de dispersión de los


residuos ût vs. los residuos rezagados uˆt 1 , t = 2, 3,…, n. Una asociación (positiva o
negativa) indica la existencia de autocorrelación de primer orden. Para analizar la
existencia de autocorrelación de orden superior basta graficar ût vs. uˆt k , k = 2, 3,…

Estos gráficos permiten identificar 2 tipos de autocorrelaciones:


 Autocorrelación positiva, si se identifican grupos de residuos positivos y/o grupos
de residuos negativos y las parejas ( uˆt 1 , ût ), t = 2, 3,…, n, presentan asociación
positiva (ver figura 5.8); y
 Autocorrelación negativa, si se identifican brincos alternados de residuos positivos
y negativos, y las parejas ( uˆt 1 , ût ), t = 2, 3,…, n, presentan asociación negativa (ver
figura 5.9).

Figura 5.8

Autocorrelación positiva

^
^ ut
ut

0
t 0 ^
ut - 1

-3

Figura 5.9

Autocorrelación negativa

^
^ ut
ut

0
t 0 ^
ut - 1

-3

DAVID RUELAS RODRÍGUEZ 5-18


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

PRUEBAS ESTADÍSTICAS

Prueba Durbin-Watson. Esta prueba permite identificar autocorrelación de primer


orden, pues suponte que el error (ut) sigue un proceso autorregresivo de primer orden,
AR(1), definido por el MRLS sin intercepto:
ut  ut 1   t ,  t ~ iid 0,  2 ,  
donde  es el coeficiente de autocovarianza y los errores  t con media cero, varianza
constante y no correlacionados se denominan ruido blanco.

Si  = 0, entonces no hay autocorrelación, pero si  > 0 hay autocorrelación positiva y si


 < 0 hay autocorrelación negativa. Es decir, existen 2 posibles hipótesis alternativas,
por lo que es más fácil establecer 2 hipótesis nulas negando las posibles alternativas:
 H 0 : No hay autocorrelación positiva vs H 1 : Hay autocorrelación positiva; y
 H 0 : No hay autocorrelación negativa vs. H 1 : Hay autocorrelación negativa.

El estadístico de prueba Durbin-Watson es:


n

 uˆ  uˆt 1 
2
t
d t 2
n
,
 uˆ
t 1
2
t

y se compara contra valores críticos dL y dU calculados para distintos tamaños de


muestra n y para distintos niveles de confianza  que aparecen en la Tabla Durbin-
Watson (ver Formulario, p.42-45, en donde se consideran n = 6, 7,…, 40, 45,…, 100,
150 y 200, y  = 0.01 y 0.05).

La figura 5.10 muestra las regiones de rechazo de las hipótesis nulas.

Figura 5.10

0 dL dU 2 4 - dU 4 - dL 4
d
Se rechaza H0+ Zona de No se rechazan Zona de Se rechaza H0-
(autocorrelación indecisión H0- ni H0+ indecisión (autocorrelación
positiva) (no autocorelación) negativa)

H0+ : No hay autocorrelación positiva H0- : No hay autocorrelación negativa

La Prueba Durbin-Watson puede ser no concluyente si el estadístico de prueba d se


ubica en las zonas de indecisión de la figura 5.10. La mayoría de los paquetes
estadísticos reportan automáticamente el cálculo del estadístico de prueba d.

DAVID RUELAS RODRÍGUEZ 5-19


APUNTES PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015
Sección 5

5.4.3. Corrección de la Autocorrelación

Si un MRLM presenta autocorrelación de primer orden se puede corregir con distintas


técnicas, dependiendo si el coeficiente de autocovarianza  es conocido o no.

CORRECCIÓN DE LA AUTOCORRELACIÓN DE PRIMER ORDEN CON  CONOCIDA

Si el coeficiente de autocovarianza  es conocido, es posible hacer la estimación MCG


aplicando la transformación de primeras diferencias, para obtener un modelo no
correlacionado y estimarlo por MCO.


Por ejemplo, para el MRLS Yt   0  1 X t  ut con ut  ut 1   t ,  t ~ iid 0,  2 , es 
posible considerar el modelo al tiempo t – 1 y multiplicarlo por :
Yt 1   0  1 X t 1  ut 1 ,
y restando esta última expresión del modelo original se obtiene el MRLS con intercepto:
Yt  Yt 1   0 1     1  X t  X t 1    t .

Desde el punto de vista computacional, para calcular los estimadores MCG es más
práctico hacer las transformaciones Yt *  Yt  Yt 1 ,  0*   0 1    , X t*  X t  X t 1 y
estimar por MCO el modelo con intercepto Yt*   0*  1* X t*   t .

CORRECCIÓN DE LA AUTOCORRELACIÓN DE PRIMER ORDEN CON  DESCONOCIDA

Si  no es conocida, se puede estimar su valor y a partir de éste corregir la


autocorrelación, o simplemente estimar por MCO y corregir su respectiva matriz de
varianzas-covarianzas.

Estimación de . Existen métodos iterativos como el de Cochrane-Orcutt para estimar


a . En EViews también es posible estimarla fácilmente incorporando el proceso
ut  ut 1   t directamente en el MRLM mediante el regresor AR(1). Su respectivo
coeficiente de MCO corresponde al valor de ̂ .

Método Newey-West. Consiste en estimar el MRLM con autocorrelación mediante


MCO pero ajustar la varianza de los estimadores. La estimación de la matriz de
varianzas-covarianzas propuesta por Newey-West es compleja pues ajusta
simultáneamente autocorrelación y heterocedasticidad, sin embargo, algunos paquetes
estadísticos la incluyen. A los errores estándar que genera este método se le denominan
errores estándar CHA (consistentes con heterocedasticidad y autocorrelación).

Ejercicio E58 .

DAVID RUELAS RODRÍGUEZ 5-20


Material de Apoyo para el Curso de Econometría
David Ruelas Rodríguez, Enero – Mayo 2015

E1. Para las variables cuantitativas X y Y se tienen los datos (X1, Y1), (X2, Y2),…, (Xn, Yn).
a) A partir de las definiciones de varianza muestral y covarianza muestral demuestre
1  n 2 2 1  n 
que SY2   i Y  nY  y XY
S    X iYi  nXY  .
n  1  i 1  n  1  i 1 
n
 n  n 
n X iYi    X i   Yi 
i 1  i 1  i 1 
b) Demuestre que rXY  .
 n 2  n 
2
  n
 n

2

n X i    X i   n Yi 2    Yi  
 i 1  i 1    i 1  i 1  

E2. Algunos Economistas apoyan la teoría de que un mayor “ingreso mensual” (Y) está
asociado a un mayor número de “años de estudios de posgrado” (X). A continuación se
presentan estas variables y algunas otras para una muestra aleatoria de 22 personas con
estudios de posgrado:

Años de
Ingreso mensual Tipo de Tipo de
estudios de Estudios (2)
(miles de dólares) ingreso (1) actividad
posgrado
2.0 4.0 Medio bajo Otra 1
5.0 4.0 Medio bajo Academia 1
3.0 5.2 Medio alto Otra 1
2.0 7.5 Alto Negocios 2
3.5 2.3 Medio bajo Academia 1
2.0 4.5 Medio alto Otra 2
4.0 2.7 Medio bajo Academia 2
0.5 4.5 Medio alto Negocios 2
5.0 4.8 Medio alto Academia 2
4.0 6.2 Alto Otra 1
4.0 5.8 Medio alto Otra 1
2.0 7.5 Alto Negocios 2
5.5 5.8 Medio alto Academia 1
3.0 2.1 Medio bajo Academia 2
1.0 5.5 Medio alto Negocios 1
2.0 4.0 Medio bajo Otra 2
2.5 4.3 Medio alto Otra 2
1.5 6.5 Alto Negocios 2
6.0 7.5 Alto Academia 1
3.0 4.8 Medio alto Otra 1
3.5 5.5 Medio alto Otra 1
4.5 3.3 Medio bajo Academia 2
(1) Clasificado como Bajo en [0, 2], Medio bajo en (2, 4], Medio alto en (4, 6] y Alto mayor a 6 mil dólares.
(2) 1 = en universidades de Estados Unidos, 2 = en universidades fuera de Estados Unidos.
Fuente: Ilustrativo
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

Adicionalmente para las variables X y Y se calcularon las siguientes estadísticas:

 X  69.5
i X i
2
 265.75  X Y  341.4
i i

Y  108.3
i Y i
2
 585.21 n  22

a) Calcule el coeficiente de correlación entre las variables “años de estudios de


posgrado” e “ingreso mensual”. ¿Este resultado es consistente con la teoría de
algunos Economistas?
b) Clasifique cada una de las variables e indique su escala de medición.
c) Construya el diagrama de dispersión de las variables “años de estudios de
posgrado” e “ingreso mensual”, distinguiendo el “tipo de actividad”. ¿Qué se
puede decir acerca de la variable “tipo de actividad”?
d) Calcule por separado el coeficiente de correlación entre las variables “años de
estudios de posgrado” e “ingreso mensual” para cada categoría de la variable “tipo
de actividad”. ¿Estos resultados son consistentes con la teoría de algunos
Economistas?
e) Utilice Excel para determinar las ecuaciones de las rectas de regresión para
explicar el “ingreso mensual” mediante los “años de estudio de posgrado”. ¿Qué
puede concluir en cada caso?
f) Utilice Excel para determinar la ecuación de la regresión exponencial para explicar
el “ingreso mensual” mediante los “años de estudio de posgrado” de las personas
con posgrado que se dedican a la academia.
g) Para las personas con posgrado que se dedican a la academia construya el
diagrama de dispersión de las variables “años de estudios de posgrado” y el “log-
ingreso mensual”. Calcule en este caso el coeficiente de correlación y compárelo
con el resultado del inciso d). Determine en este caso también la ecuación de la
recta de regresión y compárela con la ecuación de la regresión exponencial del
inciso f).

E3. Una inmobiliaria ha determinado que si X es el número de habitaciones de los


departamentos que maneja y Y el número de lugares de estacionamiento, entonces su
distribución conjunta se muestra en la siguiente tabla:

Número de Lugares de estacionamiento


Total
habitaciones 0 1 2 3 4
1 0.06 0.12 0.02 0 0 0.20
2 0.03 0.18 0.21 0 0 0.42
3 0.01 0.09 0.11 0.07 0 0.28
4 0 0.02 0.05 0.02 0.01 0.10
Total 0.10 0.41 0.39 0.09 0.01 1

a) ¿Son X y Y variables independientes?


b)    
Calcule E Y X  x y Var Y X  x para x = 1, 2, 3, 4.
c) Grafique g  x   EY X  x para x = 1, 2, 3, 4. ¿Qué puede concluir?

DRR 2
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E4. Las empresas petroleras integradas típicamente pagan impuestos compuestos por una
regalía (royalty) y una serie de impuestos y derechos adicionales. Si X denota la tasa de
la regalía y Y la tasa del impuesto total que paga una empresa petrolera, entonces Y
puede ser explicada por el nivel de X. Si f X ,Y x, y   2 xI  x ,1  y I 0,1 x  , calcule y

grafique E Y X  x . 
E5. Para cada una de las siguientes Funciones de Regresión Poblacionales indique si son
lineales en variables, en parámetros, en ambos o en ninguna de las dos:
a) EY X i    0  12 X i
b) EY X i    0  1 X i   2 X i2     k X ik
c) EY X i   e 0 1X i

EY X i  
Xi
d)
 0  1 X i

E6. Se sabe que si X y Y tienen distribución conjunta Normal Bivariada con medias X, Y,
varianzas  X2 y  Y2 , y coeficiente de correlación , entonces su función de densidad de
1  1 
probabilidad conjunta es f X ,Y  x, y   exp Q x, y  para
2 X  Y 1 2 
 2 1 
2
 
2 2
 x  X   x   X  y  Y   y  Y 
x, y  R, donde Q x, y      2        . Además se
 X    X   Y    Y 
  
 
sabe que Y X  x ~ N  Y   Y  x   X , Y2 1   2  . Si se quiere explicar a Y
X
 
mediante el valor fijo Xi …
a) ¿Se puede decir que su FRP es lineal en variables o lineal en parámetros?
b)  
Grafique E Y X i y Var Y X i .  
c)  
Si se quiere expresar la esperanza condicional E Y X i en la forma  0  1 X i ,
¿qué valores deben tomar 0 y 1?
d) ¿Qué pasa con f X ,Y  x, y  si X y Y están perfectamente correlacionadas, es decir, si
 = 1? Explique.

E7. Considere el Modelo Multiplicativo Yi   0 X i1 e ui , donde ui es perturbación estocástica:


a) Demuestre que este modelo puede ser transformado en Modelo de Regresión
Lineal Simple.
b) Calcule efecto parcial, elasticidad y semi-elasticidad para este modelo expresado
como relación determinista.

DRR 3
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E8. Bajo los supuestos del Modelo de Regresión Lineal Simple Yi   0  1 X i  ui ,


demuestre que:
a) EYi X i    0  1 X i
b) VarYi X i    2
c)  
Cov Yi , Y j X i , X j  0 para toda i ≠ j

E9. Estimación por Mínimos Cuadrados Ordinarios (MCO) del MRLS. Para el MRLS
Yi   0  1 X i  ui , donde ui ~ iid(0,  2):
a) Obtenga las ecuaciones normales:
n n n n n

Y
i 1
i nˆ0  ˆ1  X i
i 1
y XY
i 1
i i  ˆ0  X i  ˆ1  X i2
i 1 i 1

S
b) Demuestre que ˆ1  XY2 y ˆ0  Y  ˆ1 X
SX

E10. El desarrollo de las telecomunicaciones en los últimos 20 años ha provocado que cada
vez más personas destinen parte de su ingreso a la adquisición de teléfonos celulares. A
continuación se presentan el consumo de teléfonos celulares (por cada 100 habitantes) y
el ingreso per cápita anual de 2003 para una muestra de 34 países.

Teléfono celular Ingreso per Teléfono celular Ingreso per


País (por cada 100 cápita País (por cada 100 cápita
personas) (Miles de dólares) personas) (Miles de dólares)
Alemania 78.5 27.6 Holanda 76.8 28.6
Arabia Saudita 32.1 13.2 Hungría 76.9 13.8
Argentina 17.8 11.4 India 2.5 2.9
Australia 72.0 28.8 Indonesia 8.7 3.2
Bélgica 79.3 28.9 Inglaterra 91.2 27.7
Brasil 26.4 7.5 Italia 101.8 26.8
Bulgaria 46.6 0.1 Japón 67.9 28.5
Canadá 41.9 30.0 México 29.5 9.0
China 21.5 5.0 Pakistán 1.8 2.0
Colombia 14.1 6.4 Polonia 45.1 11.2
Ecuador 18.9 3.9 República Checa 96.5 15.6
Egipto 8.5 3.9 Rusia 24.9 9.0
España 91.6 22.2 Sudáfrica 36.4 10.1
Estados Unidos 54.6 37.8 Suecia 98.1 26.7
Francia 69.6 27.6 Suiza 84.3 32.2
Grecia 90.2 19.9 Tailandia 39.4 7.5
Guatemala 13.2 4.1 Venezuela 27.3 4.8

Fuente: Gujarati, Econometría, quinta edición, 2009. Tabla 3.3 Statistical Abstract of the United States, 2006.

Si X denota el ingreso per cápita (en miles de dólares) y Y el consumo de teléfonos


celulares (por cada 100 habitantes) entonces:

 X  X   4,160.3  Y  Y   34,004.3
2 2
i i

 X  X Y  Y   9,232.5
i i Y  117,600.2
i
2

DRR 4
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

Además, la media muestral del ingreso per cápita es de 15.8 miles de dólares. Considere
el MRLS Yi   0  1 X i  ui , donde ui ~ iid(0,  2). Estime por Mínimos Cuadrados
Ordinarios (MCO) los parámetros 0 y 1.

E11. Continuando con el MRLS del ejercicio E10…


a) Construya el diagrama de dispersión que permita ver si el consumo de teléfonos
celulares (Y) puede ser explicado por el ingreso per cápita (X).
b) Utilice Excel para verificar la estimación MCO de 0 y 1.
c) Calcule los residuos uˆ  Y  Yˆ (valor real menos valor ajustado) y grafíquelos
i i i
para cada valor observado Xi. A partir de esta gráfica y el diagrama de dispersión
del inciso a) analice empíricamente si se cumplen los 8 supuestos del MRLS.
d) Estime la varianza de los términos de error ( 2).

E12. Demuestre que, si el MRLS Yi   0  1 X i  ui se estima por MCO entonces:


n
a) La suma de los residuos es cero:  uˆ
i 1
i  0.

n
b) Los residuos y los regresores no están correlacionados:  uˆ X
i 1
i i  0.

n
c) Los residuos y los valores ajustados no están correlacionados:  uˆ Yˆ  0 .
i 1
i i

E13. Continuando con los ejercicios E10 y E11 verifique que: (i) Y  ˆ0  ˆ1 X , (ii) Yˆ  Y ,
n n n
(iii)  uˆi  0 , (iv)
i 1
 uˆi X i  0 , y (v)
i 1
 uˆ Yˆ  0 .
i 1
i i Interprete el resultado en cada caso.

E14. Si ̂ 0 y ̂1 son los estimadores MCO del MRLS, demuestre que:
a) ̂1 es insesgado.

b)  
Var ˆ1 
2

y Cov ˆ0 , ˆ1    X 2

 X X  X X
n n
2 2
i i
i 1 i 1

E15. Teorema de Gauss-Markov. Bajo los supuestos del MRLS demuestre que los
estimadores MCO ̂ 0 y ̂1 son los Mejores Estimadores Lineales Insesgados (MELI).

E16. Continuando con los ejercicios E10, E11 y E13, estime la matriz de varianzas y
covarianzas de los estimadores MCO ̂ 0 y ̂1 .

DRR 5
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E17. Demuestre que al estimar el MRLS mediante MCO, el coeficiente de determinación es


igual al coeficiente de correlación lineal muestral al cuadrado, es decir, R 2  rXY  .
2

E18. Continuando con los ejercicios E10, E11, E13 y E16…


a) Verifique que la suma de cuadrados totales (SCT) es igual a la suma de la suma de
cuadrados explicada (SCE) más la suma de cuadrados de los residuos (SCR), es
decir, SCT = SCE + SCR.
b) Calcule e interprete el coeficiente de determinación.
c) Construya la tabla ANOVA.

E19. Estimación por Máxima Verosimilitud del MRLSN. Considere el MRLSN


Yi   0  1 X i  ui , donde ui ~ iid N(0,  2), y demuestre que los EMV de 0, 1 y  2
S 1 n
son ˆ1  XY2 , ˆ0  Y  ˆ1 X y ˆ 2   uˆi2 , respectivamente.
SX n i 1

E20. Considere el MRLSN. Utilice el Método Pivotal para demostrar que el intervalo
simétrico al 100(1 – )% de confianza para 0 es ˆ0  t  S ˆ . ¿Cuál es el respectivo
n 2 , 0
2

intervalo de confianza para 1?

E21. Continuando con los ejercicios E10, E11, E13, E16 y E18, se sabe que ˆ 2  422.4 y que
 37.833  1.606
la matriz de varianzas-covarianzas estimada de ̂ 0 y ̂1 es   . Si se
 1.606 0.102 
supone que ui ~ iid N(0,  2)…
a) Calcule los intervalos de confianza al 95% para 0 y 1. ¿Podría pensarse que
alguno de estos parámetros es cero?
b) Calcule el intervalo de confianza al 95% para la desviación estándar de los
términos de error ui.
c) ¿Es razonable el supuesto de normalidad en los errores?

E22. Demuestre que, bajo los supuestos del MRLSN, si 1 = 0, entonces la estadística
F
n  2SCE ~ F 1, n  2 .
SCR

E23. Continuando con los ejercicios E10, E11, E13, E16, E18 y E21, si ui ~ iid N(0,  2)…
a) Si se quiere probar H0: 0 = 0 vs. H1: 0 > 0, calcule su respectivo valor-p. ¿Qué
se puede concluir?
b) ¿Se puede afirmar con un error tipo I de 5% que el ingreso per cápita permite
explica el consumo de teléfonos celulares? Realice las pruebas T y F. Calcule el
valor-p en cada caso.

DRR 6
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E24. Bajo los supuestos del MRLS, considere a Eˆ Y0 X 0   Yˆ0*  ˆ0  ˆ1 X 0 como estimador
 
puntual de E Y0 X 0   0  1 X 0 .

a) Demuestre que Ŷ0* es predictor insesgado.


 
b)  
1
Demuestre que Var Yˆ0*   2  
X 0  X   .
2

n X i  X 2 
n

 
i 1 

E25. Continuando con los ejercicios E10, E11, E13, E16, E18, E21 y E23 se sabe que n = 34,
ˆ  14.48 , ˆ  2.22 , ˆ 2  422.4 , X  15.8 , y
0 1 X  X 2  4,160.3 . Si se supone
 i

que ui ~ iid N(0,  )…2

a) Estime la media del consumo de teléfonos celulares (por cada 100 habitantes) para
una economía con ingreso per cápita de 40 mil dólares. Proporcione el pronóstico
puntual y su respectivo intervalo de confianza al 95% de confianza.
b) Estime el nivel de consumo de teléfonos celulares (por cada 100 habitantes) para
una economía con ingreso per cápita de 40 mil dólares. Proporcione el pronóstico
puntual y su respectivo intervalo de predicción con 95% de probabilidad.

E26. Continuando con los ejercicios E10, E11, E13, E16, E18, E21, E23 y E25, considerando
válido el supuesto de normalidad, es decir, si ui ~ iid N(0,  2)…
a) Calcule y grafique las bandas de predicción al 95% de la media condicional y de
valores individuales del consumo de teléfonos celulares (Y) considerando los
valores observados del ingreso per cápita (X).
b) ¿Para qué valor del ingreso per cápita la amplitud de estas bandas del inciso
anterior se minimiza?

E27. Los Modelos de Gasto de Engel, en honor del Estadístico Alemán Ernst Engel (1821 –
1896) postulan que “el gasto total en un bien tiende a incrementarse en progresión
aritmética, mientras que el gasto total aumenta en progresión geométrica".

En la siguiente tabla se presentan los datos sobre el gasto de consumo personal total
(GT), el gasto en bienes duraderos (GD, incluyendo vehículos automotores y
refacciones, muebles y equipo doméstico), el gasto en bienes perecederos (GP,
incluyendo comida, ropa, gasolina, aceite, combustibles de petróleo y carbón mineral) y
el gasto en servicios (GS, incluyendo vivienda, electricidad, gas, transporte y atención
médica), todos medidos en miles de millones de dólares de 2000, del primer trimestre de
2003 al cuarto trimestre de 2006 en Estados Unidos.

DRR 7
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

Gasto trimestral en Estados Unidos 2003-2006


Cifras en miles de millones de dólares de 2000

Gasto de Gasto en Gasto en


Gasto en
Año y Consumo Bienes Bienes
Servicios
trimestre Personal Total Duraderos Perecederos
(GS)
(GT) (GD) (GP)
2003-I 7,184.9 971.4 2,072.5 4,143.3
2003-II 7,249.3 1,009.8 2,084.2 4,161.3
2003-III 7,352.9 1,049.6 2,123.0 4,190.7
2003-IV 7,394.3 1,051.4 2,132.5 4,220.2
2004-I 7,479.8 1,067.0 2,155.3 4,268.2
2004-II 7,534.4 1,071.4 2,164.3 4,308.4
2004-III 7,607.1 1,093.9 2,184.0 4,341.5
2004-IV 7,687.1 1,110.3 2,213.1 4,377.4
2005-I 7,739.4 1,116.8 2,241.5 4,395.3
2005-II 7,819.8 1,150.8 2,268.4 4,420.0
2005-III 7,895.3 1,175.9 2,287.6 4,454.5
2005-IV 7,910.2 1,137.9 2,309.6 4,476.7
2006-I 8,003.8 1,190.5 2,342.8 4,494.5
2006-II 8,055.0 1,190.3 2,351.1 4,535.4
2006-III 8,111.2 1,208.8 2,360.1 4,566.6

Fuente: Gujarati, Econometría, quinta edición, 2009. Adaptación de la Tabla 6.3, p. 161

a) Estime puntualmente el gasto de consumo personal total para el cuarto trimestre de


2006. ¿Cambia su estimación dependiendo de la forma de etiquetar el tiempo?
b) Analice gráficamente si es razonable pensar que el gasto de consumo personal
total explica el gasto en bienes duraderos.
c) Ajuste los siguientes modelos:
Modelo 1: GDi   0   1GTi  u i
Modelo 2: ln GDi    0  1GTi  vi
Modelo 3: ln GDi    0   1 ln GTi   wi
¿Son comparables sus coeficientes de determinación? ¿Qué modelo considera que
proporciona el mejor ajuste? Justifique su respuesta.
d) Utilice los Modelos 1 y 2 del inciso anterior para estimar puntualmente y por
intervalo al 95% el valor del gasto en bienes duraderos si GT0 = 2,800.

E28. Considere el MRLM y  X  u , donde u ~ 0, 2 I .  


a) Calcule XX para k = 2.
Calcule XX 
1
b) para k = 1. ¿Qué puede concluir?
c) Calcule esperanza y varianza condicionales de y dado X.
     
d) Calcule  2X  y  y  X  X  . Obtenga las matrices de segundas
     
derivadas en cada caso.

DRR 8
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E29. Estimación MCO del MRLM. Para el MRLM y   X  u donde XX es no


estocástica y no singular, y donde u ~ 0, 2 I :  
a) Obtenga las ecuaciones normales: XX ˆ  Xy .
Demuestre que el vector de estimadores MCO de  es ˆ  XX  Xy  .
1
b)

E30. Estudios demográficos indican que la mortalidad infantil puede ser explicada por la
educación de las mujeres de la población, su tasa de fecundidad y la riqueza de sus
habitantes. En la siguiente tabla se presenta la mortalidad infantil (MI, medida en
número de defunciones de menores de 5 años por cada 1,000 nacidos vivos), la tasa de
alfabetismo femenina (TA, en porcentaje), el producto interno bruto per cápita (PIB, en
dólares correspondiente a 1980) y la tasa de fecundidad (TF, promedio de hijos por
mujer con información entre 1980 y 1985) para una muestra de 64 países:

Mortalidad infantil

Obs. MI TA PIB TF Obs. MI TA PIB TF


1 128 37 1,870 6.66 33 142 50 8,640 7.17
2 204 22 130 6.15 34 104 62 350 6.60
3 202 16 310 7.00 35 287 31 230 7.00
4 197 65 570 6.25 36 41 66 1,620 3.91
5 96 76 2,050 3.81 37 312 11 190 6.70
6 209 26 200 6.44 38 77 88 2,090 4.20
7 170 45 670 6.19 39 142 22 900 5.43
8 240 29 300 5.89 40 262 22 230 6.50
9 241 11 120 5.89 41 215 12 140 6.25
10 55 55 290 2.36 42 246 9 330 7.10
11 75 87 1,180 3.93 43 191 31 1,010 7.10
12 129 55 900 5.99 44 182 19 300 7.00
13 24 93 1,730 3.50 45 37 88 1,730 3.46
14 165 31 1,150 7.41 46 103 35 780 5.66
15 94 77 1,160 4.21 47 67 85 1,300 4.82
16 96 80 1,270 5.00 48 143 78 930 5.00
17 148 30 580 5.27 49 83 85 690 4.74
18 98 69 660 5.21 50 223 33 200 8.49
19 161 43 420 6.50 51 240 19 450 6.50
20 118 47 1,080 6.12 52 312 21 280 6.50
21 269 17 290 6.19 53 12 79 4,430 1.69
22 189 35 270 5.05 54 52 83 270 3.25
23 126 58 560 6.16 55 79 43 1,340 7.17
24 12 81 4,240 1.80 56 61 88 670 3.52
25 167 29 240 4.75 57 168 28 410 6.09
26 135 65 430 4.10 58 28 95 4,370 2.86
27 107 87 3,020 6.66 59 121 41 1,310 4.88
28 72 63 1,420 7.28 60 115 62 1,470 3.89
29 128 49 420 8.12 61 186 45 300 6.90
30 27 63 19,830 5.23 62 47 85 3,630 4.10
31 152 84 420 5.79 63 178 45 220 6.09
32 224 23 530 6.50 64 142 67 560 7.20

Fuente: Gujarati, Econometría, quinta edición, 2009. Adaptación de la Tabla 6.6, p. 168.

DRR 9
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

a) Estime el modelo MI i   0  1TAi   2 PIBi   3TFi  u i , donde ui ~ iid(0,  2 ),


por MCO.
b) Utilice la función matricial de Excel =ESTIMACION.LINEAL(rangoY,rangoX)
para estimar el modelo del inciso anterior.

E31. Considere el MRLM y  X  u estimado por MCO.


a) Demuestre que X ˆu  0 , es decir, que los residuos y los regresores no están
correlacionados.
n
b) Demuestre que  uˆ
i 1
i  0 , es decir, que la suma de los residuos es cero.

c) Demuestre que yˆ uˆ  0 , es decir, que los residuos y los valores ajustados no están
correlacionados.

E32. Continuando con el ejercicio E30 …


a) Estime  2 por MCO.
n
b) Verifique que:  uˆ
i 1
i  0 , Xˆu  0 y y uˆ  0 .

uˆ uˆ
Se sabe que ˆ  XX  Xy  y ˆ 2 
1
E33. son los estimadores MCO del MRLN
n  k  1
 
y  X  u , donde u ~ 0, 2 I y XX es no singular.
Demuestre que ˆ  XX  Xy  es estimador insesgado de  .
1
a)
b) 
Demuestre que Var ˆ  Σ ˆ   2 XX  .
1

uˆ uˆ
c) Demuestre que ˆ 2  es estimador insesgado de  2 .
n  k  1

E34. Teorema de Gauss-Markov. Considere el MRLM y  X  u donde u ~ 0, 2 I y  


XX es no singular. Demuestre que el estimador MCO ˆ  XX 1 Xy  es MELI.

E35. Continuando con los ejercicios E30 y E32…


a) Construya la Tabla ANOVA del modelo MI i   0  1TAi   2 PIBi   3TFi  u i y
calcule sus respectivos coeficientes de determinación (simple y ajustado).
b) Estime por MCO el modelo MI i   0   1TAi   2 PIBi  wi , wi ~ iid(0,  w2 ).
Calcule sus respectivas R 2 y R 2 . ¿Son comparables estos coeficientes de
determinación con los del inciso anterior? ¿Qué modelo elegiría bajo este criterio?

DRR 10
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E36. Estimación por Máxima Verosimilitud del MRLMN. Considere el MRLMN


y  X  u , donde u ~ N n 0, 2 I  , y demuestre que los EMV de  y  2 son
uˆ uˆ
ˆ  XX 1 Xy  y ˆ *2  , respectivamente.
n

E37. Continuando con los ejercicios E30, E32 y E35, considere el modelo con 3 variables
explicativas MI i   0  1TAi   2 PIBi   3TFi  u i , donde ui ~ iid(0,  2 ).
a) Estime la matriz de varianzas-covarianzas de ˆ .
b) Calcule intervalos de confianza individuales al 95% para cada uno de los
parámetros del modelo. ¿Se puede afirmar que todas las ’s son significativas?

E38. Continuando con los ejercicios E30, E32, E35 y E37, considerando el MRLM con 3
variables explicativas se sabe que:
Modelo estimado: Mˆ I i  168 .307  1.768TAi  0.006 PIBi  12.869TFi R 2  0.7474
(errores estándar) (32.892) (0.248) (0.002) (4.191) ˆ  39.13
a) Pruebe individualmente las siguientes hipótesis: 0 < 165, 2 = 0 y  = 40.
b) ¿El modelo con su conjunto es significativo? Pruebe   0 para justificar su
respuesta.
c) Utilice Excel para determinar si las ’s del modelo son significativas (en forma
individual y de manera conjunta).
d) ¿Se pueden sustentar estadísticamente la validez de las pruebas anteriores?

E39. Continuando con los ejercicios E30, E32, E35, E37 y E38, considerando el modelo
MI i   0  1TAi   2 PIBi   3TFi  u i , donde ui ~ iid(0,  2 )…
a) Utilice la Prueba F de Transformación Lineal General para probar la hipótesis
conjunta 0 = 165 y 3 = –71.
b) Utilice la Prueba F de Mínimos Cuadrados Restringidos para probar la hipótesis
conjunta del inciso anterior.

E40. Continuando con los ejercicios E30, E32, E35, E37 y E38, considere una economía con
un PIB per cápita de 7,700 dólares, una tasa de alfabetización femenina de 85% y una
tasa de fecundidad de 2.2 hijos por mujer para calcular lo siguiente:
a) Intervalo de confianza al 95% para la mortalidad infantil promedio.
b) Intervalo de predicción al 95% para el nivel de mortalidad infantil.

DRR 11
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E41. En Microeconomía la Teoría del Productor establece que la función de producción


 
Cobb-Douglas en su forma econométrica está dada por Pi   0 Li 1 K i 2 e ui , donde Pi es la
producción, Li el insumo trabajo, Ki el insumo capital y ui es perturbación estocástica.

Se sabe que para este modelo la suma de los parámetros 1 y 2 proporciona


información sobre los rendimientos a escala, es decir, la respuesta de la producción a un
cambio proporcional en los insumos: (i) si la suma es 1, existen rendimientos constantes
a escala, es decir, duplicar los insumos duplica la producción, triplicar los insumos
triplica la producción y así sucesivamente; (ii) si la suma es menor que 1 existen
rendimientos decrecientes a escala, es decir, al duplicar los insumos la producción crece
en menos del doble; y (iii) si la suma es mayor que 1 hay rendimientos crecientes a
escala, pues duplicar los insumos conducen a un aumento en la producción de más del
doble.

La siguiente tabla muestra el valor agregado (Pi en miles de dólares), las horas de
trabajo (Li en miles de horas) y la inversión de capital (Ki en miles de dólares) para los
50 estados y el Distrito de Columbia (Washington, D.C.) de Estados Unidos de
Norteamérica referentes al sector manufacturero durante 2005.
Valor Horas de Inversión de Valor Horas de Inversión de
agregado trabajo capital agregado trabajo capital
Entidad Entidad
(miles de (miles de (miles de (miles de (miles de (miles de
dólares) horas) dólares) dólares) horas) dólares)
Alabama 38,372,840 424,471 2,689,076 Montana 2,644,567 24,167 334,008
Alaska 1,805,427 19,895 57,997 Nebraska 14,650,080 163,637 627,806
Arizona 23,736,129 206,893 2,308,272 Nevada 7,290,360 59,737 522,335
Arkansas 26,981,983 304,055 1,376,235 New Hampshire 9,188,322 96,106 507,488
California 217,546,032 1,809,756 13,554,116 New Jersey 51,298,516 407,076 3,295,056
Colorado 19,462,751 180,366 1,790,751 New Mexico 20,401,410 43,079 404,749
Connecticut 28,972,772 224,267 1,210,229 New York 87,756,129 727,177 4,260,353
Delaware 14,313,157 54,455 421,064 North Carolina 101,268,432 820,013 4,086,558
DC 159,921 2,029 7,188 North Dakota 3,556,025 34,723 184,700
Florida 47,289,846 471,211 2,761,281 Ohio 124,986,166 1,174,540 6,301,421
Georgia 63,015,125 659,379 3,540,475 Oklahoma 20,451,196 201,284 1,327,353
Hawaii 1,809,052 17,528 146,371 Oregon 34,808,109 257,820 1,456,683
Idaho 10,511,786 75,414 848,220 Pennsylvania 104,858,322 944,998 5,896,392
Illinois 105,324,866 963,156 5,870,409 Rhode Island 6,541,356 68,987 297,618
Indiana 90,120,459 835,083 5,832,503 South Carolina 37,668,126 400,317 2,500,071
Iowa 39,079,550 336,159 1,795,976 South Dakota 4,988,905 56,524 311,251
Kansas 22,826,760 246,144 1,595,118 Tennessee 62,828,100 582,241 4,126,465
Kentucky 38,686,340 384,484 2,503,693 Texas 172,960,157 1,120,382 11,588,283
Louisiana 69,910,555 216,149 4,726,625 Utah 15,702,637 150,030 762,671
Maine 7,856,947 82,021 415,131 Vermont 5,418,786 48,134 276,293
Maryland 21,352,966 174,855 1,729,116 Virginia 49,166,991 425,346 2,731,669
Massachusetts 46,044,292 355,701 2,706,065 Washington 46,164,427 313,279 1,945,860
Michigan 92,335,528 943,298 5,294,356 West Virginia 9,185,967 89,639 685,587
Minnesota 48,304,274 456,553 2,833,525 Wisconsin 66,964,978 694,628 3,902,823
Mississippi 17,207,903 267,806 1,212,281 Wyoming 2,979,475 15,221 361,536
Missouri 47,340,157 439,427 2,404,122

Fuente: Gujarati, Econometría, quinta edición, 2009. Tabla 7.3, p. 208.

a) Exprese la función de producción Cobb-Douglas econométrica como Modelo de


Regresión Lineal Múltiple. ¿Qué supuestos debe cumplir ui?
b) Estime la función de producción Cobb-Douglas utilizando Mínimos Cuadrados
Ordinarios. Calcule su respectiva R2, R2 ajustada y tabla ANOVA.

DRR 12
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

c) ¿Se puede afirmar que en esta economía los rendimientos a escala son constantes?
Justifique estadísticamente su respuesta.
d) Si el estado de Colorado planea duplicar los insumos trabajo y capital, ¿cuál será
el nivel de producción estimado? ¿Dicha estimación se ubica dentro del conjunto
de datos muestrales?

E42. A continuación se presentan los datos sobre la producción de un bien (X en unidades


producidas) y su costo total (Y en pesos).

Producción
Costo total
(X en unidades
(Y en pesos)
producidas)
1 193
2 226
3 240
4 244
5 257
6 260
7 274
8 297
9 350
10 420

Fuente: Gujarati, Econometría, quinta


edición, 2009. Tabla 7.4, p. 211.

a) Analice la relación entre la producción y el costo total mediante un diagrama de


dispersión. ¿Es posible explicar el costo total mediante la producción utilizando
un Modelo de Regresión Polinomial (MRP)? ¿De qué grado?
b) Utilice Excel para ajustar un MRP de grado 3 utilizando MCO. ¿Es el modelo
significativo? Calcule su respectiva Tabla ANOVA.
c) Utilice EViews para ajustar nuevamente el modelo del inciso b). Obtenga la
matriz de varianzas y covarianzas estimada de los estimadores MCO.
d) Utilice EViews para ajustar MRP’s de grados 4 y 5. ¿Son estos modelos
significativos? Compare sus respectivas R 2 . ¿Qué puede concluir?
e) Construya y grafique las bandas de predicción al 95% para la media y el nivel del
costo total.

E43. Continuando con el ejercicio E41 sobre la producción manufacturera en Estados Unidos
durante 2005, se sabe que la estimación directa por MCO del modelo Log-Lin de la
función de producción Cobb-Douglas es l̂n Pi   3.888  0.468 ln Li   0.521 ln K i  .
a) Utilice el método de estimación indirecta para obtener ̂1 .
b) Utilice el método de estimación indirecta para obtener ˆ . 2

DRR 13
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E44. Continuando con los ejercicio E41 y E43 sobre la producción manufacturera en Estados
Unidos durante 2005, considerando el modelo Log-Lin de la función de producción
Cobb-Douglas ln Pi    0  1 ln Li    2 ln K i   u i , ui ~ iid(0,  2 )…
a) Calcule los coeficientes de correlación parciales a partir de la definición
(utilizando los residuos de los MRLS) y compárelos vs. sus respectivos
coeficientes de correlación simples.
b) Calcule nuevamente los coeficientes de correlación parcial pero ahora a partir de
los coeficientes de correlación simples.
c) Calcule el coeficiente de determinación a partir de los coeficientes de correlación
simples y parciales. Reporte e interprete el coeficiente de correlación múltiple.
d) Construya la Tabla ANOVA de contribución incremental y pruebe la significancia
incremental de los insumos trabajo y capital. ¿Qué puede concluir?

E45. De la teoría microeconómica, se sabe que la demanda de un bien suele depender del
ingreso real del consumidor, del precio real del bien y de los precios reales de los bienes
complementarios o que compiten con él (bienes sustitutos). A continuación se muestran
datos sobre la demanda de carne de pollo en Estados Unidos de 1960 a 1982:
Precio real de
Consumo per Ingreso per Precio real de la Precio real de la Precio real de la
sustitutos del
cápita de carne cápita real carne de pollo carne de res carne de puerco
Año pollo *
de pollo disponible (W 2 en centavos (W 3 en centavos (W 4 en centavos
(W 5 en centavos
(Z en libras) (W 1 en dólares) de dólar por libra) de dólar por libra) de dólar por libra)
de dólar por libra)
1960 27.8 397.5 42.2 78.3 50.7 65.8
1961 29.9 413.3 38.1 79.2 52.0 66.9
1962 29.8 439.2 40.3 79.2 54.0 67.8
1963 30.8 459.7 39.5 79.2 55.3 69.6
1964 31.2 492.9 37.3 77.4 54.7 68.7
1965 33.3 528.6 38.1 80.2 63.7 73.6
1966 35.6 560.3 39.3 80.4 69.8 76.3
1967 36.4 624.6 37.8 83.9 65.9 77.2
1968 36.7 666.4 38.4 85.5 64.5 78.1
1969 38.4 717.8 40.1 93.7 70.0 84.7
1970 40.4 768.2 38.6 106.1 73.2 93.3
1971 40.3 843.3 39.8 104.8 67.8 89.7
1972 41.8 911.6 39.7 114.0 79.1 100.7
1973 40.4 931.1 52.1 124.1 95.4 113.5
1974 40.7 1,021.5 48.9 127.6 94.2 115.3
1975 40.1 1,165.9 58.3 142.9 123.5 136.7
1976 42.7 1,349.6 57.9 143.6 129.9 139.2
1977 44.1 1,449.4 56.5 139.2 117.6 132.0
1978 46.7 1,575.5 63.7 165.5 130.9 132.1
1979 50.6 1,759.1 61.6 203.3 129.8 154.4
1980 50.1 1,994.2 58.9 219.6 128.0 174.9
1981 51.7 2,258.1 66.4 221.6 141.0 180.8
1982 52.9 2,478.7 70.4 232.6 168.2 189.4
* Promedio ponderado de los precios reales al menudeo por libra de carne de puerco y res. Ponderadores basados en el consumo relativo.

Fuente: Gujarati, D., Porter, D. (2009). Econometría . 5a edición, p. 221. Se modificó el orden de los regresores.

DRR 14
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

A partir de esta información analice la forma funcional que mejor convenga para
construir un MRLM aplicando el método ascendente (stepwise regression) respondiendo
a las siguientes preguntas:
a) Calcule el diagrama de dispersión múltiple de estas variables. ¿Es razonable
pensar que la forma funcional entre Z y los regresores es lineal?
b) Calcule el diagrama de dispersión múltiple del logaritmo natural de todas las
variables. ¿Es razonable pensar que la forma funcional entre Y  ln Z  y el
logaritmo natural del resto de los regresores, X j  ln W j  , j = 1, 2, 3, 4 y 5, es
lineal? Especifique el modelo econométrico en su forma lineal y no lineal
considerando todos los regresores potenciales.
c) Calcule la matriz de correlaciones considerando los logaritmos de todas las
variables. ¿Cuál es el regresor más correlacionado con Y  ln Z  ? Interprete su
resultado.
d) Considere el MRLS incluyendo sólo a X1 y estímelo por MCO. ¿Es significativo
el modelo? ¿Qué puede concluir?
e) Calcule los coeficientes de correlación parcial entre Y y Xj, j = 2, 3, 4 y 5, aislando
el efecto de X1. ¿Qué regresor está más correlacionado con Y aislando el efecto de
X1? Interprete su resultado y calcule su respectivo coeficiente de determinación
parcial.
f) Considere el MRLM incluyendo sólo X1 y X2. Sin necesidad de estimar aún el
modelo, construya la Tabla ANOVA Incremental y aplique la Prueba F
(incremental) para determinar si la inclusión de X2 resulta significativa. ¿Qué
puede concluir?
g) Estime por MCO el MRLM incluyendo sólo X1 y X2. Calcule su respectiva Tabla
ANOVA. ¿Qué puede concluir? ¿Estos resultados son los esperados?
h) Calcule los coeficientes de correlación parcial de segundo orden entre Y y Xj, j = 3,
4 y 5, aislando el efecto de X1 y X2. ¿Qué regresor está más correlacionado con Y
aislando el efecto de X1 y X2?
i) Considere el MRLM incluyendo sólo X1, X2 y X4. ¿Es significativa la contribución
de X4 al modelo? Aplique la Prueba F (ANOVA incremental) para sustentar su
respuesta.
j) Estime por MCO el MRLM incluyendo sólo X1, X2 y X4. ¿Qué puede concluir?
¿Estos resultados son los esperados?
k) ¿Cuál es el modelo final estimado que arroja el método ascendente (stepwise
regression)?
l) Compare los criterios de información de Akaike, Schwarz y Hannan-Quinn de los
modelos de los incisos g) y j). ¿Qué puede concluir al respecto? ¿Esta conclusión
es la misma que la del criterio de la R2 ajustada?
m) Verifique que la Prueba F (ANOVA incremental) del inciso i) se puede obtener a
partir de las sumas de cuadrados de residuos del modelo con los regresores X1 y X2
(SCR12) y del modelo con los regresores X1, X2 y X4 (SCR124) mediante el
estadístico de prueba F 
n  k  1SCR12  SCR124  ~ F 1, n  k  1 .
SCR124

DRR 15
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E46. Considere nuevamente la información sobre la demanda de carne de pollo en Estados


Unidos de 1960 a 1982 del ejercicio E45. Para estos datos se sabe que la forma
funcional que permite formular un MRLM es el modelo Log-Lin, es decir, considerar el
logaritmo natural de cada variable. Construya un MRLM aplicando el método
descendente (backward elimination) respondiendo a las siguientes preguntas:
a) Estime el MRLM considerando todos los posibles regresores. ¿El modelo resulta
significativo?
b) Analice la significancia incremental al 1% de cada uno de los 5 regresores (X1, X2,
X3, X4 y X5) estimando por MCO los MRLM de 4 regresores. ¿Cuál es el regresor
menos significativo? ¿Es necesario eliminarlo?
c) Analice la significancia incremental al 1% de cada uno de los 4 regresores (X1, X2,
X4 y X5) estimando por MCO los MRLM de 3 regresores. ¿Cuál es el regresor
menos significativo? ¿Es necesario eliminarlo?
d) Analice la significancia incremental al 1% de cada uno de los 3 regresores (X1, X2
y X4) estimando por MCO los MRLM de 2 regresores. ¿Cuál es el regresor menos
significativo? ¿Es necesario eliminarlo?
e) Analice la significancia incremental al 1% de cada uno de los 2 regresores (X1 y
X2) estimando por MCO los MRLS posibles. ¿Cuál es el regresor menos
significativo? ¿Es necesario eliminarlo?
f) ¿Cuál es el modelo final estimado que arroja el método descendente (backward
elimination)?

DRR 16
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E47. A continuación se presenta información sobre salarios y educación para una muestra de
114 empleados en una ciudad industrial del sur de India en 1990.

Salario Salario Salario


Edu. Tipo Edu. Tipo Edu. Tipo
Género semanal Género semanal Género semanal
Máx. (1) Empleo (2) Máx. (1) empleo (2) Máx. (1) empleo (2)
(Rupias) (Rupias) (Rupias)
Mujer 0 0 120.0 Mujer 0 0 100.0 Mujer 0 0 129.5
Mujer 3 1 224.0 Mujer 0 0 105.0 Mujer 1 0 112.0
Mujer 0 0 132.0 Mujer 2 1 300.0 Mujer 1 0 82.0
Mujer 2 0 75.0 Hombre 2 1 115.3 Mujer 2 1 385.0
Hombre 2 0 111.0 Hombre 3 1 102.5 Hombre 3 1 94.3
Mujer 2 0 127.0 Mujer 1 0 189.5 Mujer 0 1 350.0
Mujer 0 0 30.0 Mujer 2 0 62.5 Mujer 0 0 107.7
Mujer 0 0 24.0 Mujer 1 0 50.0 Mujer 0 0 20.0
Mujer 0 1 119.0 Hombre 3 1 272.5 Hombre 0 0 53.8
Mujer 0 0 75.0 Mujer 2 1 175.0 Mujer 0 1 427.0
Mujer 2 0 324.0 Mujer 1 1 117.0 Mujer 0 0 18.0
Mujer 0 0 42.0 Mujer 3 0 950.0 Mujer 0 0 120.0
Mujer 0 0 100.0 Mujer 0 0 100.0 Mujer 0 0 40.5
Mujer 0 0 135.5 Mujer 0 0 140.0 Mujer 1 1 375.0
Mujer 0 0 107.0 Mujer 2 0 97.0 Mujer 0 0 120.0
Hombre 1 0 50.0 Mujer 0 0 150.0 Mujer 1 1 175.0
Mujer 0 0 90.0 Hombre 0 0 25.0 Hombre 0 0 50.0
Mujer 0 1 377.0 Hombre 0 0 15.0 Mujer 1 1 100.0
Mujer 2 0 150.0 Mujer 0 0 131.0 Hombre 0 1 25.0
Mujer 0 0 162.0 Mujer 0 0 120.0 Mujer 0 1 40.0
Mujer 1 0 18.0 Hombre 0 0 25.0 Mujer 0 1 65.0
Mujer 1 0 127.6 Hombre 0 0 25.0 Hombre 0 1 47.5
Hombre 0 0 47.5 Hombre 0 1 30.0 Mujer 0 1 162.5
Mujer 2 0 135.0 Hombre 0 1 30.0 Hombre 0 1 175.0
Mujer 0 1 400.0 Mujer 0 0 122.0 Hombre 0 1 150.0
Mujer 3 1 91.8 Mujer 2 1 287.5 Mujer 0 1 162.5
Mujer 0 1 139.5 Hombre 0 0 75.0 Mujer 1 1 162.5
Mujer 0 0 49.2 Mujer 0 0 79.0 Hombre 0 1 50.0
Mujer 1 0 30.0 Hombre 1 0 85.3 Mujer 2 1 395.0
Hombre 0 0 40.5 Mujer 2 1 350.0 Hombre 0 1 175.0
Mujer 0 0 81.0 Mujer 0 1 54.0 Mujer 1 0 87.5
Mujer 0 0 105.0 Mujer 0 0 110.0 Mujer 0 0 75.0
Mujer 0 0 200.0 Mujer 0 1 342.0 Mujer 0 1 162.5
Mujer 0 1 139.5 Mujer 0 1 77.5 Mujer 0 1 325.0
Mujer 0 0 80.0 Mujer 0 0 370.0 Mujer 2 0 120.5
Hombre 0 0 47.0 Mujer 0 1 156.0 Mujer 1 0 600.0
Mujer 0 0 125.0 Mujer 0 0 261.2 Mujer 0 0 52.0
Mujer 0 0 500.0 Mujer 2 0 54.0 Mujer 1 0 116.5

Notas: (1) Educación máxima: 0 = Sin primaria, 1 = Hasta primaria, 2 = Hasta secundaria, 3 = Superior a segundaria
(2) 0 = Temporal, 1 = Permanente

Fuente: Gujarati D., Poreter, D. (2009). Econometría, 5a edición. Adaptación de la Tabla 9.7

a) Formule un Modelo ANOVA para explicar el logaritmo natural del sueldo a través
de las variables “género” y “tipo de empleo”. Estímelo por MCO y analice su
significancia estadística.
b) Construya una tabla que muestre el ingreso estimado para cada una de los grupos
identificados a partir del Modelo ANOVA del inciso anterior.
c) Bajo el supuesto de normalidad, ¿es razonable pensar que el ingreso de las mujeres
con empleo permanente es igual al de los hombres con empleo permanente?
d) Formule el Modelo ANOVA para explicar el logaritmo natural del sueldo
considerando las 3 variables cualitativas con efectos aditivos. ¿Es significativo?
e) Formule el Modelo ANOVA para explicar el logaritmo natural del sueldo
considerando las 3 variables cualitativas con efectos aditivos y multiplicativos.
¿Es significativo? ¿Qué puede concluir?

DRR 17
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E48. En el ejercicio E2 se analizó una muestra aleatoria de 22 personas con estudios de


posgrado para validar la teoría de algunos Economistas que afirman que un mayor
“ingreso mensual” (Y) está asociado a un mayor número de “años de estudios de
posgrado” (X). A continuación se presenta uno de los resultados de dicho análisis

"Años de estudios de posgrado" vs "Ingreso mensual" por "Tipo de


actividad" (Academia, Negocios, Otra)

8
Ingreso mensual (miles de dólares)

y = 2x + 3.5
7

6 y = 0.932x + 2.2299
Academia
5 Negocios
4 Otra

3 Linear (Academia)
Linear (Negocios)
2
y = 1.7481x - 3.913 Linear (Otra)
1

0
0 1 2 3 4 5 6
Años de estudios de posgrado

a) Formule un Modelo ANCOVA que permita explicar el “ingreso mensual”


mediante los “años de estudio de posgrado” y el “tipo de actividad” al que se
dedican las personas.
b) Estime el modelo del inciso anterior por MCO. ¿Son coincidentes los resultados
frente a los de las regresiones mostradas en la gráfica?

DRR 18
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E49. A continuación se muestra el consumo mensual de energía eléctrica de uso doméstico


(Yt, en miles de millones de watts/hora) en México de 2005 a 2012:

Año
Mes
2005 2006 2007 2008 2009 2010 2011 2012
Enero 2,599 2,595 2,760 2,837 2,861 2,825 2,998 3,049
Febrero 2,530 2,523 2,732 2,852 2,833 2,769 3,062 2,999
Marzo 2,389 2,430 2,556 2,661 2,686 2,655 2,907 2,990
Abril 2,473 2,507 2,563 2,697 2,798 2,735 3,012 2,983
Mayo 2,594 2,760 2,779 2,952 3,123 2,996 3,349 3,068
Junio 2,743 2,873 2,911 3,121 3,232 3,282 3,537 3,279
Julio 2,960 2,966 3,054 3,205 3,377 3,594 3,688 3,440
Agosto 2,986 3,013 3,201 3,276 3,545 3,544 3,632 3,636
Septiembre 2,996 3,059 3,198 3,332 3,558 3,633 3,792 3,670
Octubre 2,989 3,033 3,119 3,183 3,275 3,422 3,608 3,835
Noviembre 2,788 2,882 2,959 3,012 3,079 3,220 3,274 3,605
Diciembre 2,609 2,774 2,797 2,813 2,792 2,859 3,049 3,436

Fuente: www.inegi.gob.mx

a) Si Mj, j = 1, 2,…, 11, son las variables dicótomas que permiten modelar la
estacionalidad mensual que presenta la serie de tiempo Yt, estime por MCO el
11
modelo Yt   0    j M jt  12 t  ui , ui ~ iid(0,  2 ), es decir, una tendencia
j 1

lineal con estacionalidad mensual.


b) Calcule el pronóstico puntual del nivel de consumo mensual de energía eléctrica
de uso doméstico en México para 2013.
c) Construya una gráfica que muestre las series de tiempo real y ajustada en el
período enero 2005 – diciembre 2012, y el pronóstico sobre el periodo enero –
diciembre 2013. ¿Qué puede concluir?

E50. Continuando con el ejercicio E49…


a) Calcule la serie de tiempo desestacionalizada del consumo mensual de energía
eléctrica de uso doméstico en México en el período enero 2005 – diciembre 2012 y
grafíquela junto con la serie de tiempo original.
b) Estime por MCO una tendencia lineal (usando al tiempo como regresor) para
explicar la serie de tiempo desestacionalizada del inciso anterior.
c) Calcule el pronóstico puntual del nivel de consumo mensual de energía eléctrica
de uso doméstico en México para 2013 partiendo de la tendencia lineal del inciso
anterior y agregando los factores estacionales del inciso a).¿Cómo se comparan
estos pronósticos contra los obtenido en el ejercicio E49?
d) Se sabe que para enero, febrero y marzo de 2013 el consumo mensual de energía
eléctrica de uso doméstico en México fue de 3,126, 3,120 y 2,905 miles de
millones de watt/hora, respectivamente. Compare los pronósticos del inciso
anterior frente a los del inciso b) del ejercicio E49 y ambos pronósticos frente a los
valores reales observados.

DRR 19
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E51. El sistema tributario de cierto país establece que las personas físicas que perciben más
de 200,000 dólares por año deben pagar un impuesto sobre la renta (ISR) de 35%,
mientras que las personas que ganan 200,000 dólares o menos deben pagar un ISR del
25%. El monto de deducciones varía de persona en persona, de modo que para una
muestra de 60 personas físicas se identificaron los siguientes ingresos anuales y
deducciones fiscales:

Ingreso Deducciones Ingreso Deducciones Ingreso Deducciones


159 18.6 135 21.5 79 12.8
287 33.0 252 52.9 167 21.8
129 13.5 179 18.4 192 17.6
222 54.9 303 49.4 134 11.2
243 61.3 179 27.8 251 49.5
186 25.9 215 62.3 247 62.3
254 33.4 138 19.2 181 28.7
288 47.5 142 11.4 143 3.6
214 54.0 265 67.5 159 15.8
205 41.1 288 54.1 233 49.5
152 20.5 165 22.2 95 5.5
277 46.1 342 38.4 149 4.2
195 28.7 100 7.6 126 10.7
243 39.9 172 14.2 196 24.0
226 61.6 139 10.2 127 8.4
187 21.2 139 10.2 122 5.9
224 40.7 180 11.3 202 43.2
190 24.7 231 36.4 172 31.0
165 24.7 255 57.2 186 15.6
130 4.2 135 10.1 123 11.5

Fuente: Ilustrativo

a) Construya la gráfica del impuesto por pagar (ISR menos deducciones) explicado
por el ingreso de las personas de esta muestra.
b) Formule el respectivo Modelo de Regresión por Segmentos, estímelo por MCO y
grafique las rectas ajustadas. ¿Es relevante mantener el intercepto?

E52. Continuando con el ejercicio E51, determine si es posible validar el supuesto de


normalidad en los errores del Modelo de Regresión por Segmentos sin intercepto
mediante…
a) La Gráfica Cuantil-Cuantil.
b) El Histograma y la Prueba Jarque-Bera.
c) Las Pruebas Lillieforce, Cramér-Von Mises, Watson y Anderson-Darling.
d) ¿Son coincidentes todos los criterios?
e) Utilice la Transformación Potencia sobre el modelo con intercepto considerando
los valores  = –1, 0, 0.5 y 1. ¿Es posible validar el supuesto de normalidad en los
modelos transformados?

DRR 20
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E53. Para comparar la exactitud de las estimaciones MCO de distintos paquetes


computacionales, James W. Longley (1967) utilizó datos de Estados Unidos de 1947 a
1962 para explicar el número de personas con trabajo (Y en miles), mediante el índice de
deflación implícito (X1), el PIB (X2 en millones de dólares), el número de desempleados
(X3 en miles), el número de reclutas en las fuerzas armadas (X4), la población civil
mayor de 14 años de edad (X5) y el tiempo (X6). Además, con motivo de la Guerra de
Corea en 1951, el número de reclutas se incrementó de manera importante a partir de ese
año, por lo que se incluyeron las variables dicótomas X7 y X8.

Número de Población civil Pos-


personas con Índice de Número de Número de mayor de 14 Pre-Guerra Guerra de
Año
trabajo deflación PIB desempleados reclutas años de edad Tiempo de Corea Corea
(Y, miles) (X1) (X2, mill. dólares) (X3, miles) (X4) (X5) (X6) (X7) (X8)
1947 60,323 830 234,289 2,356 1,590 107,608 1 1 0
1948 61,122 885 259,426 2,325 1,456 108,632 2 1 0
1949 60,171 882 258,054 3,682 1,616 109,773 3 1 0
1950 61,187 895 284,599 3,351 1,650 110,929 4 1 0
1951 63,221 962 328,975 2,099 3,099 112,075 5 0 1
1952 63,639 981 346,999 1,932 3,594 113,270 6 0 1
1953 64,989 990 365,385 1,870 3,547 115,094 7 0 1
1954 63,761 1,000 363,112 3,578 3,350 116,219 8 0 1
1955 66,019 1,012 397,469 2,904 3,048 117,388 9 0 1
1956 67,857 1,046 419,180 2,822 2,857 118,734 10 0 1
1957 68,169 1,084 442,769 2,936 2,798 120,445 11 0 1
1958 66,513 1,108 444,546 4,681 2,637 121,950 12 0 1
1959 68,655 1,126 482,704 3,813 2,552 123,366 13 0 1
1960 69,564 1,142 502,601 3,931 2,514 125,368 14 0 1
1961 69,331 1,157 518,173 4,806 2,572 127,852 15 0 1
1962 70,551 1,169 554,894 4,007 2,827 130,081 16 0 1

Fuente: Gujarati, D., Porter, D. (2009). Econometría. 5a Ed. Adaptación de la Tabla 10.8, p. 348

a) Utilice EViews y Excel para estimar por MCO el MRLM con intercepto para
explicar el número de personas con trabajo (Y), mediante X1, X2,…, X8 de la tabla
anterior. ¿Qué puede concluir?
b) Estime nuevamente por MCO el MRLM con intercepto para explicar el número de
personas con trabajo (Y), sin considerar las variables dicótomas X7 y X8. ¿Hay
indicios de multicolinealidad?
c) Calcule la matriz de correlaciones de los regresores X1, X2,…, X6. ¿Se verifica la
presencia de multicolinealidad?
d) Utilice la Regla de Klein para determinar si la multicolinealidad imperfecta es
“grave”.
e) Gujarati y Porter sugieren que: (i) en lugar de incorporar el PIB nominal y el
índice de deflación por separado, es posible considerar el PIB real considerando el
X
regresor a 2 ; (ii) la población civil de más de 14 años de edad (X5) crece con el
X1
tiempo y está muy correlacionada con el tiempo (X6), por lo que X6 se puede
eliminar; y (iii) no hay razón de peso para explicar el número de personas con
trabajo (Y) mediante el número de personas desempleadas (X3), por lo que X3
también se puede eliminar. Corrija la multicolinealidad imperfecta del modelo
estimado en b) incorporando esta información a priori.

DRR 21
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

f) Tomando en cuenta la “gravedad” de la multicolinealidad detectada por la Regla


de Klein, corrija la multicolinealidad imperfecta del modelo estimado en b)
considerando alguna transformación de razón que tenga interpretación.
g) Estime por MCO el MRLM considerando los regresores X1, X2,…, X7 y corrija la
multicolinealidad imperfecta eliminando variables mediante el método ascendente
con significancia del 10% (stepwise regression). ¿Cuál de los modelos corregido?
h) ¿Cuál de los modelos libres de multicolinealidad e), f) o g) es el preferido?
Justifique su respuesta.

E54. A continuación se muestra el gasto diario (G, en dólares) y el ingreso diario (Y, en
dólares) para una muestra de 30 personas de cierto país.

Gasto diario Ingreso diario Gasto diario Ingreso diario


(G, dólares) (Y, dólares) (G, dólares) (Y, dólares)
55 80 115 180
65 100 140 225
70 85 120 200
80 110 145 240
79 120 130 185
84 115 152 220
98 130 144 210
95 140 175 245
90 125 180 260
75 90 135 190
74 105 140 205
110 160 178 265
113 150 191 270
125 165 137 230
108 145 189 250

Fuente: Gujarati, D., Porter, D. (2009). Econometría. 5a Ed. Tabla 11.3, p. 384

a) Analice gráficamente la relación entre estas variables, estime por MCO el MRLS
con intercepto para explicar el gasto diario mediante el ingreso diario.
b) ¿Se cumple el supuesto de normalidad en los errores del MRLS del inciso a)?
c) Analice gráficamente si se cumple el supuesto de varianza constante en el MRLS
estimado en a).
d) Utilice la Prueba Breusch-Pagan-Godfrey para determinar si los residuos del
MRLS estimado en a) son heterocedásticos.
e) Utilice la Prueba de Glejser para determinar si los residuos del MRLS estimado en
a) son heterocedásticos.
f) Utilice la Prueba de White (con interacciones) para determinar si los residuos del
MRLS estimado en a) son heterocedásticos. ¿Cambia su conclusión si se aplica la
prueba sin interacciones?

DRR 22
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E55. Continuando con el ejercicio E54…


a) Realice las pruebas de igualdad de varianzas Barlett, Levene y Brown-Forsythe
considerando 5 grupos. ¿Se confirma la heterocedasticidad de los errores del
MRLS Gi   0  1Yi  ui ?
b) Realice las pruebas de igualdad de varianzas F, Barlett, Levene y Brown-Forsythe
considerando 2 grupos. ¿Se obtienen las mismas conclusiones que en el inciso
anterior?

E56. A continuación se presentan los salarios anuales (en dólares) de los empleados de 10
sectores de la industria manufacturera de bienes no duraderos, de acuerdo con el tamaño
de las empresas del sector (plantilla laboral en número de empleados) en Estados Unidos
durante 1958. En las últimas 3 líneas se incluyen media y desviación estándar de los
salarios por tamaño de la industria, y la productividad promedio (aumento de los
rendimientos en función del trabajo necesario para el producto final, en dólares).

Tamaño de la plantilla laboral (número de empleados)


Sector
1a4 5a9 10 a 19 20 a 49 50 a 99 100 a 249 250 a 499 500 a 999 1,000 a 2,499
Alimentos y similares 2,994 3,295 3,565 3,907 4,189 4,486 4,676 4,968 5,342
Productos del tabaco 1,721 2,057 3,336 3,320 2,980 2,848 3,072 2,969 3,822
Productos textiles 3,600 3,657 3,674 3,437 3,340 3,334 3,225 3,163 3,168
Ropa y productos relacionados 3,494 3,787 3,533 3,215 3,030 2,834 2,750 2,967 3,453
Papel y similares 3,498 3,847 3,913 4,135 4,445 4,885 5,132 5,342 5,326
Impresión y publicación 3,611 4,206 4,695 5,083 5,301 5,269 5,182 5,395 5,552
Productos Químicos y similares 3,875 4,660 4,930 5,005 5,114 5,248 5,630 5,870 5,876
Productos petroleros y carboníferos 4,616 5,181 5,317 5,337 5,421 5,710 6,316 6,455 6,347
Productos de caucho y plásticos 3,538 3,984 4,014 4,287 4,221 4,539 4,721 4,905 5,481
Cuero y productos de cuero 3,016 3,196 3,149 3,317 3,414 3,254 3,177 3,346 4,067
Remuneración promedio 3,396.3 3,787.0 4,012.6 4,104.3 4,145.5 4,240.7 4,388.1 4,538.0 4,843.4
Desviación estándar 742.2 851.4 727.8 805.1 930.0 1,080.6 1,241.5 1,307.7 1,110.7
Productividad promedio 9,355.0 8,584.0 7,962.0 8,275.0 8,389.0 9,418.0 9,795.0 10,281.0 11,750.0

Fuente: Gujarati, D., Porter, D. (2009). Econometría. 5a Ed. Tabla 11.1, p. 369

a) Suponga que se quiere explicar la remuneración promedio (Y) mediante el tamaño


de las empresas (X) a través de un MRLS. Por simplicidad considere que X toma
los valores 1 para empresas de 1 a 4 empleados, 2 para empresas de 5 a 9
empleados,…., y 9 para empresas de 1,000 a 2,499 empleados. ¿Se puede afirmar
que la varianza de los errores es conocida y que es heterocedástica?
b) Estime el modelo Yi   0  1 X i  ui , u i ~ 0,  i2  por MCO y analice
gráficamente si los errores son heterocedásticos.
c) Estime el modelo Yi   0  1 X i  ui , u i ~ 0,  i2  por MCP. ¿Se esperan
resultados muy distintos a los de MCO?

DRR 23
MATERIAL DE APOYO PARA EL CURSO DE ECONOMETRÍA ENERO – MAYO 2015

E57. Continuando con los ejercicios E54 y E55…


a) Corrija la heterocedasticidad del modelo utilizando el procedimiento de White.
Compare las estimaciones puntuales de los parámetros, errores estándar y matriz
de varianzas y covarianzas frente a los resultados de MCO.
b) ¿Es razonable pensar que  i2   2Yi ? En caso afirmativo corrija la
heterocedasticidad del modelo utilizando la transformación estabilizadora de
varianza respectiva.

E58. A continuación se presentan datos sobre el consumo, ingreso, riqueza y tasa de interés
(C, Y, R, I, respectivamente y en dólares reales de 1996) para la economía de en Estados
Unidos de 1947 a 2000.

Año C Y R I Año C Y R I
1947 976.4 1,035.2 5,166.8 -10.4 1974 2,653.7 3,051.9 11,868.8 -1.0
1948 998.1 1,090.0 5,280.8 -4.7 1975 2,710.9 3,108.5 12,634.4 -3.5
1949 1,025.3 1,095.6 5,607.4 1.0 1976 2,868.9 3,243.5 13,456.8 -0.7
1950 1,090.9 1,192.7 5,759.5 0.4 1977 2,992.1 3,360.7 13,786.3 -1.2
1951 1,107.1 1,227.0 6,086.1 -5.3 1978 3,124.7 3,527.5 14,450.5 0.1
1952 1,142.4 1,266.8 6,243.9 -0.3 1979 3,203.2 3,628.6 15,340.0 1.7
1953 1,197.2 1,327.5 6,355.6 0.6 1980 3,193.0 3,658.0 15,965.0 2.3
1954 1,221.9 1,344.0 6,797.0 -0.1 1981 3,236.0 3,741.1 15,965.0 4.7
1955 1,310.4 1,433.8 7,172.2 0.3 1982 3,275.5 3,791.7 16,312.5 4.4
1956 1,348.8 1,502.3 7,375.2 -0.7 1983 3,454.3 3,906.9 16,944.8 4.7
1957 1,381.8 1,539.5 7,315.3 -0.3 1984 3,640.6 4,207.6 17,526.7 5.8
1958 1,393.0 1,553.7 7,870.0 -0.6 1985 3,820.9 4,347.8 19,068.3 4.3
1959 1,470.7 1,623.8 8,188.1 2.3 1986 3,981.2 4,486.6 20,530.0 3.8
1960 1,510.8 1,664.8 8,351.8 1.5 1987 4,113.4 4,582.5 21,235.7 2.8
1961 1,541.2 1,720.0 8,971.9 1.3 1988 4,279.5 4,784.1 22,332.0 3.3
1962 1,617.3 1,803.5 9,091.5 1.4 1989 4,393.7 4,906.5 23,659.8 4.3
1963 1,684.0 1,871.5 9,436.1 2.1 1990 4,474.5 5,014.2 23,105.1 3.6
1964 1,784.8 2,006.9 10,003.4 2.0 1991 4,466.6 5,033.0 24,050.2 1.8
1965 1,897.6 2,131.0 10,562.8 2.1 1992 4,594.5 5,189.3 24,418.2 1.0
1966 2,006.1 2,244.6 10,522.0 2.0 1993 4,748.9 5,261.3 25,092.3 0.6
1967 2,066.2 2,340.5 11,312.1 1.2 1994 4,928.1 5,397.2 25,218.6 2.2
1968 2,184.2 2,448.2 12,145.4 1.1 1995 5,075.6 5,539.1 27,439.7 3.3
1969 2,264.8 2,524.3 11,672.3 1.7 1996 5,237.5 5,677.7 29,448.2 3.1
1970 2,317.5 2,630.0 11,650.0 1.2 1997 5,423.9 5,854.5 32,664.1 3.1
1971 2,405.2 2,745.3 12,312.9 -0.7 1998 5,683.7 6,168.6 35,587.0 3.6
1972 2,550.5 2,874.3 13,499.9 -0.2 1999 5,968.4 6,320.0 39,591.3 3.2
1973 2,675.9 3,072.3 13,081.0 1.4 2000 6,257.8 6,539.2 38,167.7 3.6

Considere el MRLM: lnCt    0  1 lnYt    2 lnRt    3 I t  ut ….


a) Estime el modelo por MCO y analice gráficamente sus residuos para determinar si
existe autocorrelación de primer orden.
b) Aplique la Prueba Durbin-Watson par adeterminar si se confirma la existencia de
autocorrelación de primer orden.
c) Corrija la autocorrelación estimando el coeficiente de autocovarianza
incorporando el proceso autorregresivo del error.
d) Estime el modelo por MCO pero corrija la matriz de varianzas-covarianzas
mediante el Método Newey-West y reporte los errores estándar CHA.

DRR 24

También podría gustarte