Econometria Aplicada Utilizando R
Econometria Aplicada Utilizando R
ETRÍA
APLICADA
UTILIZANDO R
Luis Quintana
Romero Miguel
Ángel Mendoza
Coordinadores
1
ECONOME
TRÍA
APLICADA
UTILIZANDO R
ECONOMET
RÍA APLICADA
UTILIZANDO R
Luis Quintana
Romero
Roldán Andrés
Rosales
ISBN EBook: En
trámite
Hecho en
México
Contenid
o
INTRODUCCIÓN ...................................................................................................................
.............. 10
1. ¿QUÉ ES LA
ECONOMETRIA? ..................................................................................................... 15
2. LA METODOLOGÍA
ECONOMÉTRICA ......................................................................................... 17
3. EL MODELO
ECONOMÉTRICO ................................................................................................... 20
4. ECONOMETRÍA APLICADA Y
R ................................................................................................... 22
REFERENCIAS ..................................................................................................................
............... 43
MATERIAL DE APRENDIZAJE EN
LÍNEA .......................................................................................... 44
1. EL MODELO
MATRICIAL ............................................................................................................. 45
REFERENCIAS ..................................................................................................................
............... 55
MATERIAL DE APRENDIZAJE EN
LÍNEA .......................................................................................... 56
4. PRUEBAS DE
DIAGNÓSTICO ...................................................................................................... 75
5. UN EJEMPLO FINAL EN
R ........................................................................................................... 77
REFERENCIAS ..................................................................................................................
............... 82
MATERIAL DE APRENDIZAJE EN
LÍNEA .......................................................................................... 82
CAPITULO 4: ERROR DE
ESPECIFICACIÓN .......................................................................................... 83
1.
INTRODUCCIÓN ...............................................................................................................
.......... 83
5
2. ESPECIFICACIÓN Y SUPUESTOS DEL MODELO GENERAL DE REGRESIÓN
LINEAL ...................... 85
4. PRUEBA
RESET ...........................................................................................................................
89
5. PRUEBA RESET EN
R .................................................................................................................. 90
REFERENCIAS ..................................................................................................................
............... 93
MATERIAL DE APRENDIZAJE EN
LÍNEA .......................................................................................... 94
CAPITULO 5:
NORMALIDAD............................................................................................................... 95
1.
INTRODUCCIÓN ...............................................................................................................
.......... 95
5. PRUEBA JARQUE-BERA EN
R ................................................................................................... 110
7.
CONCLUSIONES ..............................................................................................................
......... 114
REFERENCIAS ..................................................................................................................
............. 115
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 116
CAPÍTULO 6:
MULTICOLINEALIDAD ................................................................................................. 117
1. LA MULTICOLINEALIDAD UN PROBLEMA DE
GRADO.............................................................. 117
4. SOLUCIONES AL PROBLEMA DE LA
MULTICOLINEALIDAD ...................................................... 133
REFERENCIAS ..................................................................................................................
............. 138
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 139
CAPÍTULO 7:
HETEROCEDASTICIDAD .............................................................................................. 140
1.
INTRODUCCIÓN ...............................................................................................................
........ 140
3. LAS CAUSAS DE LA
HETEROCEDASTICIDAD ............................................................................. 144
4. CONTROL Y DETECCIÓN DE LA
HETEROCEDASTICIDAD .......................................................... 145
5. EJEMPLO EN
R ......................................................................................................................... 150
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 156
CAPÍTULO 8: AUTOCORRELACIÓN
SERIAL ....................................................................................... 157
1.
INTRODUCCIÓN ...............................................................................................................
........ 157
2. DETECCIÓN DE LA
AUTOCORRELACIÓN .................................................................................. 158
REFERENCIAS ..................................................................................................................
............. 173
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 173
1.
INTRODUCCION ...............................................................................................................
........ 174
2. ANALISIS DE
INTEGRACIÓN ..................................................................................................... 174
3. APLICACIONES EN
R ................................................................................................................. 182
REFERENCIAS ..................................................................................................................
............. 207
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 207
1
INTRODUCCIÓN ...............................................................................................................
......... 208
2 EL CONCEPTO DE
COINTEGRACIÓN ......................................................................................... 209
5. MODELO DE CORRECCIÓN DE
ERROR ..................................................................................... 229
REFERENCIAS ..................................................................................................................
............. 243
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 244
1.
INTRODUCCIÓN ...............................................................................................................
........ 245
7
REFERENCIAS ..................................................................................................................
............. 270
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 271
1. RIESGO Y
VOLATILIDAD .......................................................................................................... 272
2. PROCESOS
ARCH ...................................................................................................................... 273
REFERENCIAS ..................................................................................................................
............. 293
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 294
2. MODELOS LOGIT Y
PROBIT ...................................................................................................... 297
3. APLICACIONES EN
R ................................................................................................................. 303
REFERENCIAS ..................................................................................................................
............. 308
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 308
1.
INTRODUCCION ...............................................................................................................
........ 309
3. ELECCIÓN DE MODELOS
ALTERNATIVOS ................................................................................ 314
REFERENCIAS ..................................................................................................................
............. 328
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 329
1.
INTRODUCCION ...............................................................................................................
........ 330
2. VECINDAD Y DEPENDENCIA
ESPACIAL .................................................................................... 332
3. ESTADÍSTICOS DE DEPENDENCIA
ESPACIAL ............................................................................ 344
4. MODELOS
ESPACIALES ............................................................................................................ 360
REFERENCIAS ..................................................................................................................
............. 382
8
ARCHIVOS DE DATOS ASOCIADO AL
CAPÍTULO .......................................................................... 383
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 383
1.
INTRODUCCIÓN ...............................................................................................................
........ 384
2. REVISIÓN DE LOS
DATOS ......................................................................................................... 384
3. VARIABLE
ALEATORIA .............................................................................................................. 396
REFERENCIAS ..................................................................................................................
............. 443
MATERIAL DE APRENDIZAJE EN
LÍNEA ........................................................................................ 444
LISTA DE
AUTORES ..........................................................................................................................
445
9
INTRODUCCIÓ
N
En este libro de texto los usuarios encontraran una vía práctica para mejorar su
Los capítulos de este libro de texto tienen como eje común la aceptación de que
la mayoría de los libros de texto, fue sustentado en supuestos muy discutibles. Los
School of Economics) o DHDY (por las iniciales de sus autores); los numerosos
concepto de cointegración a los MCE; el trabajo del mismo Engle (1982) que dio
hacer econometría en la
actualidad.
1
0
El reto de este libro es ofrecer a los lectores un enfoque aplicado con el fin de
de elevado costo comercial como el EViews, STATA y Microfit, entre otros. Sin
En cada uno de los capítulos del libro se muestran las bases del método o técnica
econométrica de que se trate y se aplica inmediatamente al estudio de algún tema
Los capítulos que conforman este libro presentan un nivel introductorio de cada
uno de los temas que se abordan y se priorizan las aplicaciones en R, por lo cual
fuera del texto el tema de los modelos de series de tiempo, ya que por la amplitud
Debemos señalar que este libro de texto forma parte de la producción y edición de
electrónicas
didácticas.
1
1
cursos de actualización del personal docente en econometría. Los profesores
presentaciones de power point para cada capítulo, una grabación de video con los
que se estiman
regresiones.
tabla
.
1
2
CAPÍTULOS CONTENIDO
CAPÍTULO ón:
1. La autocorrelación serial y sus consecuencias es analizada con base en el estudio de las tasas
Metodología de interés en México. Utilizando R se muestran las pruebas para detectar este problema y las
econométric
a:
en la metodología econométrica moderna y en el
CAPÍTULO 9.
Integración
En este capítulo se aborda uno de los temas más relevantes de la metodología econométrica
CAPÍTULO 2.
moderna que es el de identificar el orden de integración de las variables utilizadas en los
Enfoque matricial de
modelos econométricos. Con base en el R se realizan pruebas de raíz unitaria utilizando como
la regresión lineal
ejemplo el análisis del Producto Interno Bruto de México.
o de mínimos cuadrados ordinarios en su versión matricial con ejemplos de
ública en México
CAPÍTULO
CAPÍTULO 3. El 10.
modelo de Cointegraci
regresión múltiple: ón
lo de regresión múltiple y la forma en la cual se evalúan sus resultados.
Los resultados del capítulo anterior se extienden al estudio de los procesos de cointegración
es en R al análisis de las ventas al menudeo en México.
entre las variables del modelo econométrico utilizando en R las técnicas de Engle-Granger y
de Johansen, ejemplificándolas con ayuda del estudio de la relación de largo plazo entre el
CAPÍTULO 4.
Error de
especificación. CAPÍTULO 11.
odos utilizados para determinar si el modelo econométrico fue especificado Modelos VAR:
do a un planteamiento no apropiado de la forma funcional. Se realizan
Se destaca el uso de modelos VAR para el análisis de la política económica tomando como
n el análisis de la demanda de gasolina en los Estados
casoUnidos.
el estudio de la inflación y la oferta monetaria. Se presentan las diferentes rutinas
disponibles en R para estimar y realizar pruebas en los modelos VAR.
CAPÍTULO
CAPÍTULO 12.
5.
Modelos ARCH:
Normalida
Los modelos ARCH utilizados para el análisis de la volatilidad y el riesgo son ejemplificados en R
d.
con base en el análisis de los procesos inflacionarios en México.
studia la importancia e implicaciones del supuesto de normalidad en el
ineal y de manera específica en la inferencia estadística de sus parámetros.
es en R de la prueba Jarque-Bera en un modelo de la demanda de gasolina
CAPÍTULO 13.
s.
Modelos Logit y
Probit:
CAPÍTULO 6. Se desarrollan los modelos Probit y Logit aplicados a casos en los que la variable dependiente
Multicolinealid es binaria o cualitativa. Con base en el estudio de la diferenciación salarial en México se
ad muestran las rutinas disponibles en R para estimar y realizar pruebas en ese tipo de modelos
rminantes del consumo en México se exploran las diferentes pruebas
es en R para detectar y corregir el problema de la multicolinealidad en los
os.
CAPÍTULO 14.
Modelos de panel:
CAPÍTULO 7. Cuando el fenómeno económico. que se está analizando tiene un componente de
Heterocedastici desagregación de corte trasversal o sección cruzada y otro de series de tiempo se aplican
dad modelos de panel. En este capítulo se estudian las técnicas de panel utilizando R en el análisis
cuencias del problema de heterocedasticidad en losde modelos
la inflación y el desempleo en México.
endo uso de un ejemplo sobre distribución de cerveza se muestran las
es en R para realizar pruebas de detección de ese problema.
CAPÍTULO 8.
Autocorrelaci
Uno CAPÍTULO 15. Econometría espacial:
de los desarrollos más recientes de la econometría es la econometría espacial. En este capítulo se presenta la forma en la que se
deben especificar y estimar este tipo de modelos en R y se ejemplifica su uso con el estudio del empleo y el capital humano en la
zona centro de México.
CAPÍTULO 16: Repaso básico de estadística, probabilidad y álgebra lineal en R:
Finalmente, se incluye un capítulo opcional en el que se realiza un breve repaso de los elementos básicos de estadística,
probabilidad y algebra lineal indispensables para comprender la base matemática de los diferentes capítulos del libro.
Este libro y los materiales didácticos adicionales que lo acompañan contaron con
el apoyo financiero de la Dirección General de Asuntos del Personal Académico
de la UNAM a través del proyecto PAPIME PE302513 “Libro electrónico y
complementos didácticos en medios computacionales, para el fortalecimiento en la
enseñanza de la econometría”.
Los coordinadores del libro agradecen a los profesores José A. Huitrón, Jaime
Prudencio, Aída Villalobos y Ángel Reynoso por su apoyo en la revisión de los
capítulos y en el diseño de los apoyos didácticos que acompañan al libro. También
agradecemos a los alumnos y becarios del proyecto PAPIME; Arturo Abraham
Salas, Mónica González, Paola Orozco, Ana Isabel Hernández, Coral Gutiérrez,
Eddy Michell López, Jarett Fernando González, Mónica Patricia Hernández,
Samarkanda Norma Bustamante, Nataly Hernández, Sarahí Aldana, Brenda
Mireya González, Alejandro Corzo, Damaris Susana Mendoza, Nancy Nayeli
Morales, Claudia Torres, Edelmar Morales y Carolina Guadalupe Victoria. Todas y
todos ellos hicieron una excelente labor de apoyo para el buen éxito del proyecto.
LUIS QUINTANA ROMERO Y MIGUEL ÁNGEL MENDOZA GONZÁLEZ
14
1. ¿QUÉ ES LA
ECONOMETRIA?
economía cuenta, entre su currículo, con uno o más cursos de econometría; hoy
1
5
La importancia de esta disciplina es tal que basta escribir en un buscador de
internet la palabra "econometrics", para que nos arroje más de nueve millones de
referencias
.
política para enfrentarlas. Para ello, la econometría utiliza modelos, con estos se
busca representar de forma simplificada a los principales factores causales de un
significado
.
A diferencia de lo que ocurre hoy en día, en los años treinta, época en la que se
econometría era la
siguiente:
estadísticos. Por otro lado, es vista prácticamente como la piedra filosofal, al darle
el papel de criterio último de verdad al ser la vía para verificar o refutar teorías. El
Este es un enfoque moderno con el cual se coincide en este libro, lo que hace a la
Spanos:
modestos orígenes del "ajuste de curvas" por mínimos cuadrados en los inicios del
todo tipo de datos, desde las tradicionales series de tiempo a las secciones
cruzadas y los datos de panel." (Spanos, 2006, p. 5)
2. LA METODOLOGÍA ECONOMÉTRICA
debe ser considerado esencial, por ello resulta muy atinada la afirmación de
1
7
Spanos (2006) en el sentido de que sin fundamentos metodológicos para guiar la
práctica econométrica, no es posible que se logre acumular conocimiento genuino
a través de la modelación empírica.
En la medida en que existe una diversidad metodológica en la econometría,
resulta difícil establecer un proceso metodológico único. Sin embargo, en términos
generales, en el cuadro siguiente se pueden observar las características básicas
de los principales enfoques metodológicos, los cuales se distinguen por el papel
que le asignan a la teoría y del grado de independencia que le dan a la teoría para
la caracterización de los datos Hoover (2006).
Cuadro 1
Perspectivas metodológicas en la econometría
Metodología Período Autores Características
Comisión Cowles
Se centró en el problema de identificación y el Años 40
papel de la teoría para establecer las restricciones y 50 Koopmans
de identificación
Vectores Auto Regresivos (VAR) Años 80
Enfoque sin teoría en la estructura de los datos y uso e ecuaciones VAR para modelar impactos en las
variables
Calibración A{os 90
Christoper Sims Finn Kydland y Edward Prescott
Modelos teóricos de expectativas racionales a los que se les asignan valores numéricos en los parámetros
claves
Libro de texto
Post Comisión Cowles
Resurge la metodología de la Comisión Cowles aplicada a modelos uniecuacionales con métodos
instrumentales
London School Economics (LSE)
Años 90 y 2000
Denis Sargan, David Hendry
Especificaciones dinámicas, cointegración y búsqueda de especificaciones parsimoniosas; Años 90
Anidamiento y metodología de lo general a lo y 2000
especifico Fuente:
Elaboración propia con base en Hoover (2006)
Dentro de estas perspectivas la LSE ha jugado un papel destacado al
contraponerse a la de libro de texto y conformar lo que puede denominarse una
nueva metodología econométrica. La de libro de texto parte del supuesto de que el
modelo teórico es el verdadero modelo y, en consecuencia, coincide con el
proceso generador de los datos (PGD). En consecuencia, para esa metodología,
18
la econometría se reduce a la estimación de los parámetros que la teoría plantea;
PGD. El PGD como fenómeno económico de interés que da lugar a los datos, no
laboratorio bajo
control.
Ahí se observa que la teoría y los datos tienen la misma importancia y aparecen
Figura
1
TEORÍA GENERADOR
ECONÓMICA DELOS DATOS
PROCESO
DATOS
MODELO ECONOMÉTRICO
ESTIMACIÓN
PRUEBAS DE
DIAGNÓSTICO Y DE
ESPECIFICACIÓN
MODELO
ECONOMETRICO
EMPÍRICO
3. EL MODELO
ECONOMÉTRICO
de relaciones entre variables. Dichas relaciones son no exactas y, por ello, se les
2
0
En donde el término ui es un error o perturbación aleatoria y β1 ...βk son los
parámetros desconocidos a estimar por el modelo.
medibles no es asunto fácil ya que por una parte, la teoría no especifica cuál
multiecuacionales están formados por más de dos ecuaciones que pueden estar
escala. Sin embargo, aún se siguen actualizando modelos de gran escala para
que requieren los gobiernos, grandes empresas o bancos. Para el caso mexicano
la empresa IHS sigue actualizando el primer modelo construido para el país en los
años sesenta por CIEMEX una empresa asociada con la firma de modelos
metodología moderna, al contrario, considera que las variables del modelo son
término de
error.
2
1
Para formalizar esta idea consideremos el modelo de regresión como la media
FRP = E[yi|Xji] = f(Xji ) = β1 + β2X2i + ⋯+ βkXki donde j = 2,3, ...,k i = 1,2,..., n (2)
regresión muestral
(FRM):
De esta manera la ecuación tendrá una parte sistemática que se corresponde con
4. ECONOMETRÍA APLICADA Y
R
por ello se centra en las aplicaciones empíricas y se le brinda menor espacio a las
2
2
manejo de paquetería computacional que permita la utilización de la metodología
Dada esas características los desarrollos que se han realizado en R son abiertos y
así debido a que los usuarios hacen desarrollos, los documentan y los suben al
[Link]
R genera objetos que son números, vectores, matrices, alfa numéricos y cuadros
acostumbrados en otros paquetes son los mismos en R; suma (+), resta (-),
multiplicación (*), división (/) y potencia (^). Los ejemplos siguientes están basados
multiplicar 2 por
5:
a <- 2 b
<- 5 y
<- a*b
> y [1]
10
2
3
Los objetos que hemos creado los podemos listar con las siguientes
opciones:
objects()
ls()
help(objects
)
ejemplos de su
uso.
Los objetos pueden eliminarse rápidamente, por ejemplo para eliminar a y b basta
rm(a,b)
Para generar un objeto que sea un vector columna podemos usar la opción
c;
x <- c(5,10,8,7,9)
assign("x", c(5,10,8,7,9))
Es posible calcular la media, mean(), la varianza, var(), el valor máximo, max(), el
valor mínimo, min() o la longitud del vector, length(). Por ejemplo, si calculamos la
media
:
mean(x
)
[1] 7.8
2
4
7 8 9 10
Las gráficas se obtienen usando plot, por ejemplo para realizar una gráfica de los
La gráfica resultante
es:
2
5
y <- c(1,2,3,-1,0,-1,2,1,2)
x<- c(0,1,2,-2,1,-2,0,-1,1)
del método de estimación ya que eso se aborda en los capítulos siguientes del
libro. Aquí simplemente debe aprender que para correr esa regresión se utiliza la
Call: lm(formula =
y ~ x)
Coefficients:
(Intercept) x
1.0000 0.8125
summary(lm(y ~ x))
Residuals:
Min 1Q Median 3Q Max -1.8125 -0.3750 0.1875 0.3750
1.0000 Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 1.0000
codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error:
0.8814 on 7 degrees of freedom Multiple R-squared: 0.6602, Adjusted
R-squared: 0.6116 F-statistic: 13.6 on 1 and 7 DF, p-value: 0.007782
en una hoja de cálculo como Excel y guardarlos como archivo de texto delimitado
por tabulaciones.
2
6
Los datos del archivo PWT_2000.txt fueron guardados en formato de texto
Penn Tables (2013) con información para el 2000 del PIB per cápita (PIBPC) y de
Para abrir esa tabla en R primero se tiene que asegurar que el paquete este
getwd(
)
con:
Para que sus datos puedan ser cargados en R debe usar el comando para leer
tablas ([Link]) e indicar que la primer línea de su cuadro de datos contiene los
nombres de las variables (header=TRUE) y que las columnas están separadas por
datos<-
[Link]("PWT_2000.txt",header=TRUE,sep="")
Los datos de la tabla ahora están cargados en un objeto llamado "datos", sin
embargo R no puede reconocer cada una de las variables que están en el cuadro:
para indicar que las variables están en las columnas se debe usar la siguiente
instrucción:
> attach(datos)
ls(
)
2
8
The following object(s) are masked from 'datos (position 3)':
K, PAIS,
PIBPCL
cápita
:
En la gráfica se puede observar claramente una relación positiva entre el esfuerzo
modelo para explicar el ingreso per cápita de los países en función de su capital,
PWT<-lm(PIBPCL ~
K)
2
9
Los resultados del modelo indican que al incrementarse la inversión en un dólar el
02 37.668 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’
abline(PWT)
3
0
Otra gráfica que nos va a ser de utilidad es el histograma, en el cual podemos
relacionar intervalos de los datos con sus frecuencias. Con la siguiente instrucción
generaremos el histograma para los datos del PIB per cápita de los
países:
hist(PIBPC)
3
1
Claramente el histograma muestra que la mayoría de los países se encuentran en
instrucción siguiente:
hist(PIBPCL,freq=FALSE)
> lines(density(PIBPCL))
La gráfica resultante es la
siguiente:
3
2
Para observar la distribución de los datos es utilizar cajas de box, en las cuales la
caja muestra los umbrales para los cuartiles inferior y superior, además de la
siguiente:
boxplot(PIBPCL)
3
3
5. ALGUNOS DESARROLLOS EN R QUE FACILITAN EL USO DE LA
ECONOMETRÍA
En R contamos con interfaces que nos permiten utilizar de forma más amigable
los
http://
[Link]
con una ventana en la cual se puede visualizar la ayuda (HELP), archivos (FILE),
3
4
Usted puede revisar la amplia documentación de este interface en el sitio ya
nos
ofrece.
Por ejemplo, para cargar la base de datos que ya hemos trabajado en el archivo
Consol
a
Files/Plots/Packages/
Help
Workspace/
History
Al cargar el archivo al sistema automáticamente se cargará en la ventana
3
6
Con los datos es posible ahora realizar rápidamente gráficas para su análisis, en
plot(K,PIBPCL)
Como habrá podido notar, la consola cuenta con auto generación de los códigos
capturada
.
Objeto
datos
3
7
Todos los ejemplos de R que vimos en la sección previa puede ahora replicarlos
Otro de los interfaces que nos será de gran utilidad es el RCommander, que fue
optar por el
USA(CA1).
muestra a
continuación:
Gráfica
generada
3
8
library(Rcmdr)
3
9
En el menú principal de RCommander con la opción DATA es posible importar
nuestra base de datos, usted podrá constatar que las opciones de importación son
Excel, Stata, SPSS, SAS y Minitab. Por ejemplo, podemos abrir nuestro archivo txt
con las opciones del menú DATA/IMPORT DATA/ FROM TEXT FILE, una vez
botón VIEW DATA SET en la segunda línea de botones superiores del interface, el
4
0
Una vez cargados los datos el interface permite realizar múltiples funciones
estimados con el menú MODELS. Por ejemplo, para correr la regresión entre el
se muestra en la imagen
siguiente:
4
1
Una vez que se selecciona el botón de OK los resultados de la regresión se
muestra a
continuación:
Finalmente con el menú MODELS se cuenta con amplias posibilidades para
4
2
despliega una batería gráfica para evaluar los residuales y estimaciones del
modelo.
REFERENCIA
S
4
3
Hoover D., Kevin (2006), The methodology of econometrics, en Terence Mills y
REFERENCIAS
ELECTRÓNICAS
[Link]
px
Penn Tables (2013),
[Link]
RStudio (2013),
[Link]
PWT_2000.tx
t
Teória_Cap1
Práctica_Cap1
VideoPráctica_Cap1
VideoTeoría_Cap1
4
4
1. EL MODELO
MATRICIAL
En este capítulo se considera relevante que el usuario conozca, en primera
instancia, las rutinas básicas que son necesarias para estimar los parámetros de
software R, los cuales podrán ser utilizados en sus variantes como es el RStudio.
( ) 2, 3 y f X X = ( 1 )
yXuβ=+(2)
23 yXXuβββ=+++(3)
12 ttttt
4
5
vector columna de orden( k× )1 , por último u es un vector columna de orden ( n× )1 ,
es decir1:
1 21 31 1 1 1
2 22 32 2 2 2
23 ⌈ │ │ │ │ ⌊ βy y y n ⌉ │ │ │ │ ⌋ 111 ββ X X X X X X X X X = ⌈ │ │ │ │ ⌊ n n u u
u kk kn ⌉⌈ ││ ││ ││ ││ ⌋⌊ k ⌉ │ │ │ │ ⌋ + ⌈ │ │ │ │ ⌊ n ⌉ │ │ │ │ ⌋
(4)
( n× )1 ( n k× ) ( k× )1 ( n× )1 De la ecuación ( 3 ) la variable dependiente, y, es el
nivel de deuda pública del
gobierno mexicano (miles de millones de pesos) que es explicada por el nivel de
reservas internacionales, X2, (miles de millones de dólares) y por el índice bursátil
de la Bolsa Mexicana de Valores, X3 (miles de unidades).
Para encontrar el modelo en el cual explique el comportamiento de la deuda
externa en función de la reserva internacional y del índice bursátil se utilizará los
datos que se encuentran en el archivo CAP2_MCO con extensión CSV (delimitado
por comas). Para ejecutarlo en R se hace uso del siguiente código:
> deuda<-[Link]("C:/data/cap2_mco.csv", header =T) > attach(deuda)
Si el usuario desea visualizar los datos a través de una lista, basta con escribir:
> deuda
1 Para el desarrollo correspondiente a la teoría econométrica del presente capítulo se ha consultado
los siguientes autores Quintana y Mendoza (2008), Green (2003) y Dinardo (1997).
46
El cual arroja como los siguientes resultados para el periodo de estudio: 1) el valor
4
7
Del anterior código, el programa R agrupa los datos y calcula los cuartiles donde el
gráfic
o
>
[Link](c(1,2))
> hist(y) > screen(2)
> boxplot(y)
siguientes:
> summary
(X2,X3)
> summary
(X2,X3)
Min. 1st Qu. Median Mean 3rd Qu. Max. 81510
101600 126500 126000 154100 168300
4
8
gráfico de caja un valor atípico u outlier que se localiza por debajo del límite
código para obtener la matriz de correlación entre las variables (y, X2,
X3).
4
9
> cor(deuda)
> cor(deuda)
y x2 x3 y 1.0000000 0.9874354
0.8960622 x2 0.9874354
1.0000000 0.9126517 x3
0.8960622 0.9126517 1.0000000
positiva y del 0.9874 o del 98.74 por ciento. Mientras la asociación entre (X3,y) es
de igual manera positiva y del 89.60 por ciento. Por otro lado, las variables (X2,X3)
se asocian en 91.26 por ciento. Para obtener los diagramas de dispersión para
indicar a nivel gráfico como influye la reserva internacional (X2) y el índice bursátil
siguiente
código.
> scatter1<-
plot(y~x2) > fit<-
lm(y~x2) > abline(fit)
5
0
> scatter1<-
plot(y~x3) > fit2<-
lm(y~x3) > abline(fit2)
través de los Mínimos Cuadrados Ordinarios (MCO). Para ello se considera que el
( ) 1' ' X X X y β -= ( 5 )
5
1
de variables a matriz se utiliza el código “cbind()”; y 2) Una vez que se ha dado
para encontrar los componentes del vector (X′X)−1X′Y los cuales se describen a
continuación.
siguiente
código:
> X<-cbind(1,X2,X3)
Donde las opciones que aparecen dentro del paréntesis indican que el uno hace
índice bursátil. Para el caso para transformar la variable deuda pública (y) a vector
se utiliza el mismo
código.
> y1<-
cbind(y)
Para estimar el vector β de la ecuación ( 5 ), primero se obtiene el producto ( ) 'X
X para ello se sigue los siguientes pasos:1) transpuesta de X; 2) Producto de
> trX<-
(t(X))
>
X_X
5
2
>
X_X
x2 x3 45.000 5670.887 1562.692 x2
5670.887 750953.005 202649.321
x3 1562.692 202649.321 55348.376
ésta tiene inversa o no. Para obtener la inversa ( ) 1 ' X X - , se debe primero activar
la librería “library(MASS)”, después utilizar el código
“ginv()”.
>
det(X_X)
>
library(MASS)
> invX_X<-
(ginv(X_X))
>
invX_X
>
invX_X
[,1] [,2] [,3] [1,] 1.68427699 0.0094969200
-0.0823249040 [2,] 0.00949692 0.0001648509
-0.0008717089 [3,] -0.08232490 -
0.0008717089 0.0055340314
Una vez que se tiene la inversa ( ) 1 ' X X - , se procede a obtener el producto '
Xy
>
Xy
>
Xy
y 182.422 x2
23775.420 x3
6458.080
5
3
Por último, se procede a calcular al vector beta a través del siguiente código
>
beta
>
beta
y [1,]
1.381548779 [2,]
0.022279261 [3,]
-0.003897697
Un método de comprobación para tener la certeza que este vector, el cual fue
obtenido paso a paso mediante algebra lineal, se utiliza el código para estimar de
utiliza el mismo
método.
> modelo<-lm(y~x2+x3)
>
summary(modelo)
Call: lm(formula = y ~ x2
+ x3)
Residuals:
Min 1Q Median 3Q Max -0.20360 -0.08483
0.01550 0.06820 0.28696
Coefficients
:
Estimate Std. Error t value Pr(>|t|) (Intercept)
1.381549 0.131886 10.475 2.75e-13 *** x2 0.022279
0.001305 17.075 < 2e-16 ***
5
4
Se aprecia que el vector beta encontrado coincide con los coeficientes estimados
REFERENCIA
S
Crawley, Michael (2013), The R Book, 2a. Ed., Wiley, United Kingdom.
EUA.
cap2_mco.cs
v
5
5
Teória_Cap2
Práctica_Cap2
VideoPráctica_Cap2
VideoTeoría_Cap2
5
6
5
7
En economía se pueden identificar diversas relaciones teóricas entre variables;
gobierno, la tasa de inflación se puede determinar por la brecha del producto y las
con los elementos que se han descrito, para identificar los vínculos fundamentales
Por ejemplo: El administrador de una tienda quiere determinar los mejores criterios
5
8
para la especificación del modelo es elegir la variable dependiente en este caso
Y = Ventas
Χ1 = Tamaño de la tienda
grado de relación entre la variable endógena (Y) con las variables exógenas
5
9
el nombre “ventas”, mientras que los nombres de las variables independientes
quedarán de la siguiente
forma:
X1: “tamaño”
X2: “tráfico”
X3 :
“rivales”
X4: “renta”
X5: “residentes”
tiendas<-[Link]("ruta de
acceso",sep=",",header=T,stringsAsFactors=F)
k ŷ i= b0 + ∑b j=1
+ εi
1) Estimar los valores de una variable independiente (ŷ) mediante una función
1,....,K
La representación es la siguiente,
6
0
ŷi = b0 + b1x1i + b2x2i + ⋯+ bkxkn
entre estas
variables.
6
1
El modelo de regresión múltiple permite obtener estimaciones simultáneas de b j a
variables independientes Xj
3) Los términos de error εi son variables cuya media esperada es igual a cero
que
,
6
2
permite hacer una selección específica de las variables y su impacto sobre la
e i = yi − ŷi
i=1
nSCE = ∑ei2
= SCE = ∑(yi − ŷi)2
i=1
n
de (yi) y los valores de la variable estimada ŷi. De igual manera la SCE, se puede
SCE = ∑( i=1
2
n + b1x1i + ⋯+ bkxki))
Por ejemplo: para obtener los resultados de la regresión para dos variables
6
3
ŷ1 = b0 + b1x1i + b2x2i
La SCE resultado de la estimación de ŷ1 en el caso de dos variables
independientes (b1x1i, b2x2i) se puede expresar de la siguiente manera, tomando
en cuenta el resultado de la relación entre las variables independientes y la
variable independiente observada (yi)
n SCE = ∑[yi − (b0 + b1x1i + ⋯+ b2x2i)]2
i=1
El desarrollo extenso del MCO es resultado de la aplicación de cálculo diferencial
donde se debe tener en cuenta un sistema de 3 ecuaciones lineales y 3
incógnitas, (b0,b1, b2), las expresiones resultantes son las siguientes:
n= nb0 + b1 ∑x1i
i=1
ni=1
n
i=1
b0 ∑x1i
+ b2 ∑x2i
= ∑yi
n
i=1
ni=1
n
i=1 n+ b1 ∑x21i
+ b2 ∑x1i
x2i = ∑x1i
yi i=1
n b0∑x2i i=1
n
i=1
n
i=1
n+ b1 ∑x1i
x2i + b2∑x22i
= ∑x2i
yi i=1
Ejercicio en R: Utilizando los datos del ejemplo antes mencionado, el comando en
R para estimar los coeficientes del modelo de regresión múltiple sería el siguiente:
> lm(ventas ~ tamaño + tráfico + rivales + renta + residentes,data=tiendas)
64
De esa forma, el modelo de regresión lineal múltiple estimado es el
siguiente:
Para almacenar los datos del modelo, a fin de realizar las pruebas pertinentes más
residentes,data=tiendas)
las observaciones de las variables independientes (x 1i, x2i) y una constante (b0)
variable dependiente (x1i, yi) esta explicada por la constante asociada a (x1i), las
comportamiento entre las dos variables independientes (x 1i, x2i) asociadas a b2.
variable dependiente (x2i, yi) esta explicada por la constante asociada a (x2i), las
comportamiento entre las dos variables independientes (x 1i, x2i) asociadas a b1.
de la primera variable independiente (x1i, b1), esta explicada por la misma variable
6
5
al cuadrado, y en el caso del otro coeficiente (b 2) esta explicado por la asociación
entre las variables independientes. Lo que se espera, en la regresión es que los
coeficientes:
vectores a estimar la variable independiente (Y) los coeficientes (β) y los errores
ŷ
en la estimación (e): Y = [yy⋮12yn 1]Y ̂ = [ŷ 2β̂n]
[ β ̂ e=
ŷ1 1β⋮2βn] β =
e
β̂ [ e⋮12e
[ 1
n]
β̂⋮ e=
e
[ e⋮12e
n]
1x x x
[ 11 21 1 x12 x22 ⋯ k1
xkn]
Y = Xβ + U
La estimación objetivo del modelo, busca obtener los coeficientes estimados del
̂ ̂
Y = Xβ
̂
coeficientes estimados (β)
Es
decir,
̂ + β̂ x + β̂ x + ⋯+ β̂ x )
e = yi − ŷi = yi − (β0 1 1i 2 2i k ki
6
7
Al aplicar, el método de MCO, debemos minimizar la suma de los errores al
cuadrado SEC:
n SEC = ∑ei2
i=1
⃗
∂s∂β = −2XTY + 2 (XTXβ) =
0Para obtener los coeficientes estimados despejamos
β
̂
β = (XTX)−1 − XTY
̂
Entonces (β), es igual a la matriz inversa resultante de la multiplicación entre la
matriz transpuesta (XT) y la matriz (X), menos la matriz (XT) multiplicada por el
̂
vector de (Y). El coeficiente estimado (β) representa el efecto de un aumento en
6
8
3. LAS PROPIEDADES DE LOS ERRORES
Los estimadores o coeficientes obtenidos tienen propiedades esenciales que
permiten una inferencia estadística apropiada, se deduce que la sumatoria de los
errores en una serie son igual a cero:
n ∑eixij = 0.j = 1...k i=1
La covarianza entre los errores y las variables explicativas a medida que aumenta
el número de observaciones es igual cero:
Cova = (ei, xij) = 0
En el caso del sesgo, se define como la diferencia entre la media del estimador y
el verdadero valor del parámetro a estimar. En econometría se utiliza la varianza
residual de los errores, el cual es insesgado al estar entorno a la misma varianza.
En este caso tenemos:
sr2 = n − (k 1
∑e
+ 1) i=1
n
2
i
Ejercicio en R: El comando para obtener el vector de residuales de la estimación
en el ejemplo:
> residuales<- resultado$residuals
69
La interpretación de los fenómenos económicos mediante un modelo
econométrico depende de la robustez de los resultados obtenidos en la
estándar es igual a
uno.
̂
β~ N (0,1)
H0: βi = 0
La hipótesis alternativa
es
7
0
Ha:βi ≠ 0
error tipo I es nulo, por lo tanto, podemos rechazar la hipótesis nula y aceptamos
la hipótesis
alternativa:
Ha:βi ≠ 0
7
1
El criterio muestra la probabilidad de que el verdadero β i se encuentra en el
plantea que hay un 95% de confianza de que el valor verdadero para cada
siguiente:
>summary(resultado)
La matriz de varianzas-covarianzas de los coeficientes en su forma matricial
reducida es la
siguiente:
̂
COV(β) = σ2(XTX)−1
estimación del modelo, se espera que la varianza de los residuos sea el valor
̂
E(Se2) = σ2
7
2
Ejercicio R: En nuestro ejemplo, la matriz de varianzas-covarianzas se obtiene de
la siguiente manera:
>vcov(resultado)
Una forma de medir el poder explicativo del modelo es el contraste F, muestra si
las variables explicativas en conjunto explican las variaciones de la variable
independiente. Se ha demostrado que los coeficientes β 1 = β2 = ⋯ = βk = 0 y
además, siguen una distribución F dado la siguiente forma:
∑ ni=1 (ŷk
i− y̅i)2 n ∑ − ni=1 k e− i2 1
~Fk,n−k−1
El resultado muestra la proporción en que la varianza de los coeficientes explica
la variación en los errores; cuando se acepta la hipótesis nula se debe a dos
factores: 1) las variables no influyen en la variable independiente, 2) existe
dependencia no lineal entre la variable explicada y algún regresor. Cuando se
rechaza la hipótesis nula en el contraste del test F, muestra que la variable
dependiente esta explicada por alguna de las variables independientes. Para
conocer de forma específica las variables con poder explicativo relativo a las otras
variables es necesario revisar los contrastes individuales mediante la t de student.
En la aplicación de los contrastes de F se presentan los siguientes casos:
73
1) Cuando el contraste F es significativo y todos los coeficientes individuales
este caso todas las variables independientes son significativas para explicar
el comportamiento de la variable
dependiente.
̂
S
2
e
̂
Sr
2
desarrollado es el
siguiente:
>anova(resultado)
7
4
El Test F muestra la proporción en que la varianza de los errores determina el
d
00
̂ ~ N (β ,σ√d )
βi i ii
̂ −β σ√dii
βi i
→ N(0,1)
̂
La desviación entre el coeficiente estimado (β ) y el coeficiente (βi) en proporción
>[Link](resultado
)
4. PRUEBAS DE
DIAGNÓSTICO
modelo contiene todas las variables relevantes para explicar el modelo. En este
7
5
sentido la realización de pruebas de diagnóstico sobre la selección eficiente de
la selección de las variables para la conformación del modelo, se realiza con los
Y = X1β1 + X2β2 + U
Y = X1β1 + U
H0:β2 = 0
Posteriormente se realiza un prueba de contraste F para estimar el
poder
hipótesis nula en este caso mostrará que fue omitida una variable
relevante.
7
6
De igual manera, cuando se incluyen variables irrelevantes en el modelo
es
H0:β2 = 0
5. UN EJEMPLO FINAL EN
R
ventas que se utilizó en el primer apartado de este capítulo, pero haremos algunas
per cápita (Lingr) aproximado por un índice de remuneraciones reales por persona
ocupada.
7
7
Residuals:
Min 1Q Median 3Q Max -0.068921 -0.022129 -
0.000394 0.025324 0.073677
Coefficients
:
Estimate Std. Error t value Pr(>|t|) (Intercept)
2.41595 0.26438 9.138 7.26e-14 *** LINGR
0.67508 0.04718 14.307 < 2e-16 *** LPR -0.18473
0.04719 -3.915 0.000196 *** --- Signif. codes: 0 '***'
En los resultados se observa que los coeficientes del modelo son estadísticamente
signos son los esperados y se muestra que el incremento del 10% en el nivel de
ingresos reales da lugar a un aumento del 6.75% en las ventas, mientras que el
incremento de un 10% en los precios da lugar a una reducción del 1.8% en las
ventas
.
variabilidad total en las ventas se explica en más del 70% por la variación de las
7
8
variables del modelo, esto implica que hay un ajuste lineal elevado entre las
variables
.
cero, lo cual permite rechazar la hipótesis nula de que las variables del modelo
en el recuadro
siguiente:
> Anova(RegModel.1,
type="II") Anova Table (Type II
tests) Response: LVENTA
Sum Sq Df F value Pr(>F) LINGR 0.214297 1
204.700 < 2.2e-16 *** LPR 0.016045 1 15.327 0.0001957 *** Residuals
0.079563 76 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Para generar los valores estimados de las ventas por la ecuación de regresión, en
ventana que se abre se activan las opciones Fitted values que permite obtener los
valores estimados y Residuals que incorpora a la tabla de datos los residuales del
modelo.
los valores estimados de las ventas y las ventas observadas. En el menú principal
7
9
seleccionan los valores para el eje de las X y los valores para el eje de las Y. En el
aprecia que los valores estimados son relativamente muy próximos a los valores
observados de la
variable.
Finalmente, en el menú principal MODELS/Graps/Base diagnostic plots se obtiene
primera se comparan los residuales del modelo con los valores estimados de la
8
0