Sesión 2
Definición y Metodología de la Econometría, Tipos de Datos y Análisis de
Regresión Simple
Introducción a la Econometría
¿Qué es la Econometría?
Funciones de la Econometría
La metodología de la Econometría
La regresión es una herramienta fundamental de la Econometría.
Estructura de los datos económicos
Terminología
Introducción
Naturaleza de la econometría y de los datos económicos
¿Qué es la La econometría se basa en métodos
econometría? estadísticos para estimar las relaciones
económicas, poner a prueba teorías
económicas y evaluar y poner en práctica
Literalmente, políticas gubernamentales y comerciales.
econometría significa
“medición económica”.
Aplicaciones de la econometría
Pronóstico de variables macroeconómicas ( inflación, el producto
interno bruto…)
Estudios aplicados a diversos campos de la economía (Ej: estudio de
los efectos de los gastos de las campañas políticas en los resultados
de las votaciones, en el efecto de los gastos en educación en el
rendimiento de los estudiantes, etc)
3
¿Cuáles son las funciones de la econometría?
La econometría tiene básicamente tres funciones estrechamente
interrelacionadas.
1) Probar teorías económicas o hipótesis.
Por ejemplo, ¿está el consumo
directamente relacionado con el ingreso?,
¿está la cantidad demandada de un artículo
inversamente relacionada con su precio?.
2) Dar estimaciones numéricas de los La Econometría da
coeficientes de las relaciones económicas. contenido empírico a
Estos son esenciales en la toma de gran parte de la teoría
decisiones. Por ejemplo, un asesor económica
gubernamental necesita tener una
estimación exacta del coeficiente de la
relación entre consumo e ingreso con el fin
de determinar el efecto estimulante de una
reducción de impuestos propuesta.
3) La predicción de sucesos económicos
4
Metodología clásica de la Econometría
En términos generales, el análisis econométrico sigue las
siguientes líneas generales de acción:
• Enunciado de la teoría o hipótesis
• Especificación del modelo econométrico dirigido a probar la
teoría
• Obtención de datos.
• Estimación de los parámetros del modelo
• Verificación o inferencia estadística
• Predicciones o pronósticos
• Utilización del modelo para fines de control o formulación
de políticas
La regresión es una herramienta fundamental
de la econometría.
Interpretación moderna de la regresión
El análisis de regresión está relacionado con el estudio de la
dependencia de una variable, la variable dependiente, de una
o más variables adicionales, las variables explicativas con la
perspectiva de estimar y/ o predecir el valor (poblacional)
medio o promedio de la primera en términos de valores
conocidos o fijos ( en muestreos repetidos) de las segundas.
Debe tenerse siempre en mente que el éxito del análisis de
regresión depende de la disponibilidad de información adecuada.
7
Estructura de los datos económicos
Las estructuras de datos más comunes en la econometría
aplicada son las de los datos de corte transversal, de series de
tiempo, de combinación de cortes transversales, y de panel.
Datos de corte transversal
Un conjunto de datos de corte transversal consta de una muestra
de individuos, hogares, empresas, ciudades, estados, países u
otras diversas unidades, tomada en un momento determinado.
Datos de series de tiempo
Un conjunto de datos de series de tiempo consta de
observaciones, de una o más variables, hechas en el tiempo.
Entre los ejemplos de este tipo de información se encuentran los
precios de las acciones, el índice de precios al consumidor, el
producto interno bruto, los índices anuales de homicidios y las
cifras de venta de automóviles.
8
Ejemplo de Datos de Corte Transversal
Conjunto de datos de corte transversal sobre salario
y otras características individuales
Obs sala educ exper sexo ecivil
1 3.10 11 2 1 0
2 3.24 12 22 1 1
3 3.00 11 2 0 0
4 6.00 8 44 0 1
5 5.30 12 7 0 1
. . . . . .
. . . . . .
. . . . . .
525 11.56 16 5 0 1
526 3.50 14 5 1 0
9
Otro ejemplo, Corte Transversal
Conjunto de datos sobre las tasas de crecimiento
económico y características de los países.
obs país tpib Consgob60 Secund60
1 Argentina 0.89 9 32
2 Austria 3.32 16 50
3 Bélgica 2.56 13 69
4 Bolivia 1.24 18 12
.. . . .
.. . . .
.. . . .
61 Zimbabwe 2.30 17 6
10
Ejemplo de Datos de Series de Tiempo
Salario mínimo, desempleo y datos relacionados
para un país “X”
obs año salamin cob desem pib
1 1950 0.20 20.1 15.4 878.7
2 1951 0.21 20.7 16.0 925.0
3 1952 0.23 22.6 14.8 1015.9
. . . . . .
. . . . . .
. . . . . .
37 1986 3.35 58.1 18.9 4281.6
38 1987 3.35 58.2 16.8 4496.7
11
Estructura de los datos económicos
Datos combinados
Algunos conjuntos de datos tienen características tanto de corte
transversal como de series temporales.
Datos de panel
Un conjunto de datos de panel (o longitudinales) consta de una serie de
tiempo para cada miembro del corte transversal en el conjunto de datos.
Como ejemplo, supongamos que tenemos salario, educación y
antecedentes de empleo de un grupo de individuos a los que se ha dado
seguimiento durante 10 años. De igual forma es posible recopilar datos de
panel en unidades geográficas. Por ejemplo, podemos reunir datos de los
mismos municipios de un país sobre flujos de migración, tasas
impositivas, niveles de salarios, gastos gubernamentales, etc., para los
años 1980, 1985 Y 1990.
La característica fundamental de los datos de panel, que los
distinguen de las combinaciones de cortes transversales, es el
hecho de que se da seguimiento a las mismas unidades. 12
Ejemplo de Datos Combinados
Combinaciones de cortes transversales:
dos años de precios de la vivienda
obs año precio imptos piecuad habit Baños
1 1993 85500 42 1600 3 2.0
2 1993 67300 36 1440 3 2.5
3 1993 134000 38 2000 4 2.5
. . . . . . .
. . . . . . .
. . . . . . .
250 1993 243600 41 2600 4 3.0
251 1995 65000 16 1250 2 1.0
252 1995 182400 20 2200 4 2.0
253 1995 97500 15 1540 3 2.0
. . . . . . .
. . . . . . .
. . . . . . .
520 1995 57200 16 1100 2 1.5
13
Ejemplo de Datos en panel
Conjunto de datos de panel de dos años sobre
estadísticas de delincuencia urbana
obs ciudad año homicidios población desem Policía
1 1 1986 5 350000 8.7 440
2 1 1990 8 359200 7.2 471
3 2 1986 2 64300 5.4 75
4 2 1990 1 65100 5.5 75
. . . . . . .
. . . . . . .
. . . . . . .
297 149 1986 10 260700 9.6 286
298 149 1990 6 245000 9.8 334
299 150 1986 25 543000 4.3 520
300 150 1990 32 546200 5.2 493
14
Terminología
Yi 1 2 X 2i 3 X 3i .... n X ni i
En la teoría económica los términos variable dependiente y variable
independiente están descritos de varias maneras; a continuación se
presenta una lista representativa de ellas:
y X1, X2, X3, …. Xk
Variable dependiente Variable independiente
Variable explicada Variable explicativa
Variable de respuesta Variables de control
Variable predicha Variables predictora
Regresada Regresora
15
Análisis de Regresión
• El análisis de regresión se relaciona con la estimación o predicción de
la media (de la población) o valor promedio de la variable
dependiente, con base en los valores conocidos o fijos de las variables
explicativas.
16
Ejemplo Hipotético
17
Valor Esperado Condicional
• Es importante distinguir entre los valores esperados condicionales
E(Y | X ) y el valor esperado incondicional del consumo semanal, E(Y).
• ¿cuál es el valor esperado del consumo semanal de una familia?
• la media incondicional
• ¿cuál es el valor esperado del consumo semanal de una familia cuyo
ingreso mensual es de X unidades monetarias (u.m.)?
• la media condicional
18
Distribución condicional del gasto en varios
niveles de ingreso
19
Curva de regresión poblacional
• Los puntos oscuros dentro de círculos de la figura muestran los valores
medios condicionales de Y, graficados en función de los diferentes
valores de X. Al unir esos valores obtenemos, la curva de regresión
poblacional.
• Es decir, la regresión de Y sobre X.
• Así, desde el punto de vista geométrico, una curva de regresión
poblacional es tan sólo el lugar geométrico de las medias condicionales
de la variable dependiente para los valores fijos de la(s) variable(s)
explicativa(s).
• La recta (o curva) de regresión pasa a través de los valores medios
(condicionales).
20
Línea de regresión poblacional
21
Concepto de función de regresión poblacional (FRP)
• Cada media condicional E(Y | Xi) es función de Xi, donde Xi es un valor
dado de X.
• ¿Qué forma adopta la función ƒ(Xi)?
• La forma funcional de la FRP es una pregunta empírica, aunque en algunos
casos la teoría tiene algo que decir.
• Supongamos que la FRP E(Y | Xi) es una función lineal de Xi
22
Función de regresión poblacional lineal
donde β1 y β2 son parámetros no conocidos, que se denominan
coeficientes de regresión;
• β1 y β2 se conocen también como coeficientes de intersección y de
pendiente, respectivamente.
• En el análisis de regresión, la idea es estimar las FRP como la
ecuación (2.2.2); es decir, estimar los valores no conocidos de β1 y
β2 con base en las observaciones de Y y X.
23
Especificación estocástica de la FRP
• ¿qué se puede decir sobre la relación entre el consumo de una familia
y un nivel determinado de ingresos?
• Se expresa la desviación de un Yi en particular alrededor de su valor
esperado de la manera siguiente:
24
Especificación estocástica de la FRP
• donde la desviación ui es una variable aleatoria no observable que
adopta valores positivos o negativos. Técnicamente, ui se conoce
como perturbación estocástica o término de error estocástico.
• En nuestro ejemplo… El gasto de una familia en particular, según su
nivel de ingreso, se expresa como la suma de dos componentes:
• 1) E(Y | Xi), que es simplemente la media del consumo de todas las familias
con el mismo nivel de ingreso. Este componente se conoce como
componente sistemático, o determinista, y
• 2) ui que es el componente aleatorio, o no sistemático.
25
Naturaleza del término de perturbación
estocástica
• ui, es un término que sustituye o representa a todas las variables
omitidas o ignoradas que puedan afectar a Y pero que no se incluyen
(o no pueden incluirse) en el modelo de regresión.
• Si suponemos que E(Y | Xi) es lineal en Xi, como en (2.2.2), la
ecuación (2.4.1) se escribe como:
La ecuación (2.4.2) plantea que el consumo de una familia se relaciona linealmente con su
ingreso más el término de perturbación.
26
Término de perturbación estocástica
• El supuesto de que la línea de regresión pasa a través de las medias
condicionales de Y, implica que los valores de la media condicional de
ui (condicionados al valor dado de X ) son cero.
27
Importancia del término de perturbación estocástica
• El término de perturbación ui es un sustituto de todas las variables
que se omiten en el modelo, pero que, en conjunto, afectan a Y.
• ¿porqué no se introducen en el modelo?
• (Gujarati 5ª. ed. Págs. 41 y 42)
28
Función de regresión muestral (FRM)
• En la práctica lo que se tiene al alcance no es más que una muestra de
valores de Y que corresponden a algunos valores fijos de X.
• El objetivo es estimar la FRP con base en información muestral.
• ¿es posible predecir el consumo semanal promedio Y de la población
en su conjunto correspondiente a los valores de X seleccionados?
29
Líneas de regresión muestral
30
Líneas de regresión muestral (LRM)
• Las LRM, se supone que representan la línea de regresión poblacional,
pero son en el mejor de los casos, sólo una aproximación de la
verdadera RP.
• En general, se obtendrían N FRM diferentes para N muestras
diferentes, y estas FRM no por fuerza son iguales.
31
Función de regresión muestral (FRM)
• La contraparte muestral de la ecuación (2.2.2) puede escribirse como:
• La FRM en su forma estocástica, se expresa de la siguiente manera:
32
Objetivo principal del análisis de regresión
• Estimar la FRP
• Con base en la FRM
33
Líneas de regresión muestral y poblacional.
• La estimación de la FRP basada en la FRM es, en el mejor de los casos,
una aproximación.
• En términos de la FRM,
la Yi observada se expresa
como:
• ¿En términos de la FRP?
• ¿Qué pasa en el punto A?
34
Conclusiones
• El concepto fundamental del análisis de regresión es el función de regresión
poblacional (FRP).
• El objetivo del análisis de regresión es averiguar la forma en que varía el valor
promedio de la variable dependiente (o regresada) de acuerdo con el valor dado
de la variable explicativa (o regresora).
• Se pide linealidad en los parámetros.
• El término de perturbación estocástica ui desempeña una función crucial para
estimar la FRP.
• La FRP es un concepto idealizado. Por lo general se cuenta sólo con una muestra
de observaciones de la población.
• En consecuencia, se utiliza la función de regresión muestral estocástica (FRM)
para estimar la FRP.
35