0% encontró este documento útil (0 votos)
24 vistas55 páginas

Modelos de Regresión en Econometría

Cargado por

jhon Antony
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas55 páginas

Modelos de Regresión en Econometría

Cargado por

jhon Antony
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ECONOMETRÍA FINANCIERA

DOCENTE: VÍCTOR PAJARES GÓMEZ


Logro u objetivo de la sesión
Al terminar la sesión, el estudiante conocer y
desarrolla modelos de regresión simple. Así
como, conoce y desarrolla pruebas de
hipótesis.
Sesión
Especial

MODELO DE REGRESIÓN
REGRESIÓN
Función de regresión
poblacional (FRP)
Función de regresión poblacional (FRP)
• Es claro que cada media condicional E(Y|𝑋𝑖 ) es función de 𝑋𝑖 , donde
𝑋𝑖 es un valor dado de X. Simbólicamente:
E(Y|𝑋𝑖 ) = 𝑓(𝑋𝑖 )
• A esta ecuación se le conoce como función de esperanza condicional
(FEC), función de regresión poblacional (FRP) o regresión poblacional
(RP).
¿Qué forma adopta la función 𝒇(𝑿𝒊 )? Depende del investigador.
• Por ejemplo, un economista puede plantear que el consumo
manifiesta una relación lineal con el ingreso. Por tanto, como primera
aproximación o hipótesis de trabajo, podemos suponer que la FRP
E(Y|𝑋𝑖 ) es una función lineal de 𝑋𝑖 , del tipo:
Forma adopta la función 𝒇(𝑿𝒊 )
• E(Y|𝑋𝑖 ) = 𝛽1 + 𝛽2 𝑋𝑖
• La esta ecuación se le conoce como función de regresión poblacional
lineal.
• 𝛽1 y 𝛽2 son parámetros no conocidos pero fijos o coeficientes de
regresión.
• Donde
• 𝛽1 : coeficiente de intersección
• 𝛽2 : coeficiente de pendiente
Ingreso familiar semanal X, $

• A estos valores medios se les llama valores esperados condicionales, en


virtud de que dependen de los valores de la variable (condicional) X.
Distribución condicional del gasto en varios
niveles de ingreso

Curva de regresión
poblacional (CRP) Es la
curva que conecta las
medias de las
subpoblaciones de Y que
corresponden a los valores
dados de la regresora X.
Línea de regresión poblacional
Significado del término lineal
• Linealidad en las variables: El primer significado, y tal vez el más
“natural”, de linealidad es aquel en que la esperanza condicional de Y
es una función lineal de 𝑋𝑖 . Geométricamente, la curva de regresión
en este caso es una recta. En esta interpretación, una función de
regresión como E(Y|𝑋𝑖 ) = 𝛽1 + 𝛽2 𝑋𝑖2 no es una función lineal porque
la variable X aparece elevada a una potencia o índice de 2.
• Linealidad en los parámetros: La segunda interpretación de
linealidad se presenta cuando la esperanza condicional de Y, E(Y|𝑋𝑖 )
es una función lineal de los parámetros, los β; puede ser o no lineal
en la variable X. De acuerdo con esta interpretación, E(Y|𝑋𝑖 ) = 𝛽1 +
𝛽2 𝑋𝑖2 es un modelo de regresión lineal (en el parámetro).
Linealidad en los parámetros
• De las dos interpretaciones de
linealidad, la linealidad en los
parámetros es pertinente para
el desarrollo de la teoría de
regresión que presentaremos
en breve.
• Por consiguiente, en adelante,
el término regresión “lineal”
siempre significará una
regresión lineal en los
parámetros; los β (es decir, los
parámetros) se elevan sólo a la
primera potencia. Puede o no
ser lineal en las variables
explicativas X.
Especificación estocástica de la FRP
• Expresamos la desviación de un 𝑌𝑖 en particular alrededor de su valor
esperado de la manera siguiente:
𝑢𝑖 = 𝑌𝑖 − 𝐸(𝑌|𝑋𝑖 )
𝑌𝑖 = 𝐸(𝑌|𝑋𝑖 )+ 𝑢𝑖

• Donde la desviación 𝑢𝑖 es una variable aleatoria no observable que


adopta valores positivos o negativos. Técnicamente, 𝑢𝑖 se conoce
como perturbación estocástica o término de error estocástico.
Especificación estocástica de la FRP
• Si suponemos que E(Y| 𝑋𝑖 ) es lineal en 𝑋𝑖 , entonces la ecuación se
escribe como:
𝑌𝑖 =𝐸(𝑌|𝑋𝑖 )+ 𝑢𝑖
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
• 𝑌𝑖 es igual al componente sistemático, o determinista, más ui que es
el componente aleatorio, o no sistemático.
Valor esperado de la perturbación estocástica
• Si: 𝑌𝑖 = 𝐸(𝑌|𝑋𝑖 )+ 𝑢𝑖
• Tomamos su valor esperado:
• 𝐸(𝑌𝑖 |𝑋𝑖 )= E(𝐸(𝑌|𝑋𝑖 ))+ E(𝑢𝑖 |𝑋𝑖 )
• 𝐸(𝑌𝑖 |𝑋𝑖 )= 𝐸(𝑌|𝑋𝑖 )+ E(𝑢𝑖 |𝑋𝑖 )
• Como 𝐸(𝑌𝑖 |𝑋𝑖 ) es lo mismo que 𝐸(𝑌|𝑋𝑖 ), esto implica que:
E(𝑢𝑖 |𝑋𝑖 ) = 0
Así, el supuesto de que la línea de regresión pasa a través de las medias
condicionales de Y implica que los valores de la media condicional de
𝑢𝑖 (condicionados al valor dado de X) son cero.
Importancia del término de perturbación
estocástica
• Vaguedad de la teoría.
• Falta de disponibilidad de datos.
• Variables centrales y variables periféricas.
• Aleatoriedad intrínseca en el comportamiento humano.
• Variables representantes (proxy) inadecuadas.
• Principio de parsimonia.
• Forma funcional incorrecta.
SUPUESTOS
Supuesto 1: linealidad en los parámetros
• SUPUESTO 1 Modelo de regresión lineal: El modelo de regresión es
lineal en los parámetros, aunque puede o no ser lineal en las
variables. Es decir, el modelo de regresión como se muestra en la
ecuación:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖

• Como analizaremos en la clase pasada, este modelo puede


extenderse para incluir más variables explicativas.
Supuesto 2: Los valores de X independientes
del término de error
• SUPUESTO 2 Valores fijos de X, o valores de X independientes del
término de error: Los valores que toma la regresora X pueden
considerarse fijos en muestras repetidas (el caso de la regresora fija),
o haber sido muestreados junto con la variable dependiente Y (el caso
de la regresora estocástica). En el segundo caso se supone que la(s)
variable(s) X y el término de error son independientes, esto es:

𝑐𝑜𝑣 𝑋𝑖 , 𝑢𝑖 = 0
Supuesto 3: El valor medio de la perturbación
𝑢𝑖 es igual a cero:
• SUPUESTO 3 El valor medio de la perturbación 𝒖𝒊 es igual a cero:
Dado el valor de 𝑋𝑖 , la media o el valor esperado del término de
perturbación aleatoria 𝑢𝑖 es cero. Simbólicamente, tenemos que:

𝐸 𝑢𝑖 |𝑋𝑖 = 0
• Es importante señalar que el supuesto 3 implica que no hay sesgo de
especificación o error de especificación en el modelo del análisis
empírico.
Distribución condicional de las perturbaciones
𝑢𝑖 .
SUPUESTO 4 Homocedasticidad o varianza
constante de 𝒖𝒊
• SUPUESTO 4 Homocedasticidad o varianza constante de 𝒖𝒊 : La
varianza del término de error, o de perturbación, es la misma sin
importar el valor de X. Simbólicamente, tenemos que:

2
• Var(𝑢𝑖 ) = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑋𝑖
• = 𝐸 𝑢𝑖2 , por el supuesto 3.
• = 𝜎2
Homocedasticidad
Heterocedasticidad
SUPUESTO 5 No hay autocorrelación entre las
perturbaciones
• No hay autocorrelación entre las perturbaciones: Dados dos valores
cualesquiera de X, 𝑋𝑖 y 𝑋𝑗 (i≠j), la correlación entre dos 𝑢𝑖 y 𝑢𝑗
cualesquiera (i≠j) es cero. En pocas palabras, estas observaciones se
muestrean de manera independiente. Simbólicamente,
𝑐𝑜𝑣 𝑢𝑖 𝑢𝑗 𝑋𝑖 𝑋𝑗 = 0
𝑐𝑜𝑣(𝑢𝑖 𝑢𝑗 ) = 0, si X no es estocástica
• donde i y j son dos observaciones diferentes y cov significa
covarianza.
• Técnicamente, éste es el supuesto de no correlación serial, o no
autocorrelación.
Patrones de
correlación entre las
perturbaciones: a)
correlación serial
positiva; b)
correlación serial
negativa; c)
correlación cero.
Supuesto 6: El número de observaciones n debe ser
mayor que el número de parámetros por estimar:
• El número de observaciones n debe ser mayor que el número de
parámetros por estimar: Sucesivamente, el número de observaciones
n debe ser mayor que el número de variables explicativas.
• Imaginemos que sólo había el primer par de observaciones sobre Y y
X (4 y 1). De esta sola observación no hay forma de estimar los dos
parámetros desconocidos, β1 y β2. Se necesitan por lo menos dos
pares de observaciones para estimar dichos parámetros.
SUPUESTO 7 La naturaleza de las variables X
• SUPUESTO 7 La naturaleza de las variables X: No todos los valores X
en una muestra determinada deben ser iguales. Técnicamente, var(X)
debe ser un número positivo. Además, no puede haber valores
atípicos de la variable X, es decir, valores muy grandes en relación con
el resto de las observaciones.
• El requisito de que no existan valores atípicos de X es para evitar que
los resultados de la regresión estén dominados por tales valores
atípicos. Si hay algunos valores de X que, por ejemplo, sean 20 veces
el promedio de los valores de X, las líneas de regresión estimadas con
o sin dichas observaciones serían muy diferentes. Con mucha
frecuencia, estos valores atípicos son el resultado de errores humanos
de aritmética o de mezclar muestras de diferentes poblaciones.
Función de regresión
muestral (FRM)
Función de regresión muestral (FRM)
• En la práctica lo que se tiene al alcance no es más que una muestra
de valores de Y que corresponden a algunos valores fijos de X. Por
tanto, la labor ahora es estimar la FRP con base en información
muestral.
• ¿Se puede estimar la FRP a partir de los datos de la muestra?
Líneas de regresión basadas en dos muestras
diferentes.
Función de regresión muestral (FRM)
• La contraparte muestral de la ecuación de la FRP puede escribirse
como:
෢1 + 𝛽
𝑌෡𝑖 = 𝛽 ෢2 𝑋𝑖
Donde:
• 𝑌෡𝑖 se lee “Y sombrero”
• 𝑌෡𝑖 = estimador de 𝐸(𝑌|𝑋𝑖 )
•𝛽෢1 = estimador de 𝛽1
•𝛽෢2 = estimador de 𝛽2
FRM en su forma estocástica
෢1 + 𝛽
𝑌෡𝑖 = 𝛽 ෢2 𝑋𝑖 + 𝑢ෝ𝑖
• Donde, además de los símbolos ya definidos, 𝑢ෝ𝑖 denota el término
residual (muestral). Conceptualmente, 𝑢ෝ𝑖 es análogo a 𝑢𝑖 y se
considera una estimación de 𝑢𝑖 , que se introduce en la FRM por las
mismas razones que se introdujo 𝑢𝑖 en la FRP.
• Así, para resumir, concluimos que el objetivo principal del análisis de
regresión es estimar la FRP con base en la FRM.
Líneas de regresión muestral y poblacional.
• Debido a las fluctuaciones
muestrales, la estimación
de la FRP basada en la
FRM es, en el mejor de los
casos, una aproximación.
La cuestión…
• La pregunta crítica es ahora: como la FRM es apenas una
aproximación de la FRP, ¿se puede diseñar una regla o método que
“acerque” esta aproximación lo más posible? En otras palabras,
෢1 y 𝛽
¿cómo se debe construir la FRM para que 𝛽 ෢2 estén tan “cerca” de
los verdaderos 𝛽1 y β2 como sea posible, aunque nunca se lleguen a
conocer los verdaderos β1 y 𝛽2 ?
Modelo de regresión con dos
variables: problema de
estimación
Método de mínimos cuadrados ordinarios
(MCO)
• El método de mínimos cuadrados ordinarios se atribuye a Carl
Friedrich Gauss, matemático alemán.
• Si la FRP de dos variables:
• 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
• Como la FRP no es observable directamente. Se calcula a partir de la
FRM:
𝑌𝑖 = 𝛽෢1 + 𝛽
෢2 𝑋𝑖 + 𝑢ෝ𝑖
𝑌𝑖 = 𝑌෡𝑖 + 𝑢ෝ𝑖
𝑢ෝ𝑖 = 𝑌𝑖 − 𝑌෡𝑖
Criterio de mínimos cuadrados.
Método de mínimos cuadrados ordinarios
(MCO)
• El criterio de mínimos cuadrados, el cual establece que la FRM se
determina en forma tal que:
2 2
෡𝑖
• σ 𝑢ෝ𝑖 = σ 𝑌𝑖 − 𝑌
2 2
෢1 − 𝛽
• σ 𝑢ෝ𝑖 = σ 𝑌𝑖 − 𝛽 ෢2 𝑋𝑖
• De donde obtenemos:
𝑛 σ 𝑋𝑖 𝑌𝑖 −σ 𝑋𝑖 σ 𝑌𝑖 σ 𝑥𝑖 𝑦𝑖

• 𝛽2 = ; ෢
𝛽2 = 2
σ 2
𝑛 2
𝑋𝑖 − 𝑋𝑖 𝑥𝑖
෢2 σ 𝑋𝑖
σ 𝑌𝑖 −𝛽
෢1 =
•𝛽 ; ෢1 = 𝑌ത − 𝛽
𝛽 ෢2 𝑋ത
𝑛
Propiedades Numéricas de la Estimación
MCO
a) Los estimadores puntuales 𝛽 ෢1 y 𝛽
෢2 son expresados en términos de
las observaciones únicamente.
b) σ 𝑒𝑖 = 0
De la ecuación normal (1) se deduce esto directamente.
෢1 − 𝛽
−2 σ𝑛𝑖=1 𝑌𝑖 − 𝛽 ෢2 𝑋𝑖 =0
c) σ 𝑒𝑖 𝑋𝑖 = 0
De la ecuación normal (2) se deduce esto
−2 σ𝑛𝑖=1 𝑌𝑖 − 𝛽෢1 − 𝛽
෢2 𝑋𝑖 * 𝑋𝑖 =0
Propiedades Numéricas de la Estimación MCO
d) σ 𝑒𝑖 𝑌෡𝑖 = 0
Se deduce de las dos anteriores
σ 𝑒𝑖 𝑌෡𝑖 = σ 𝑒𝑖 𝛽෢1 + 𝛽෢2 𝑋𝑖
𝛽෢1 σ 𝑒𝑖 + 𝛽 ෢2 σ 𝑒𝑖 𝑋𝑖 = 0
e) La recta de regresión estimada pasa por el punto de los promedios
ത 𝑌).
(𝑋, ത
Esto es cierto pues como vimos se cumple 𝑌ത = 𝛽 ෢1 + 𝛽
෢2 𝑋ത
Precisión o errores estándar
de las estimaciones de
mínimos cuadrados
Precisión o errores estándar de las
estimaciones de mínimos cuadrados
• Como es probable que los datos cambien entre una muestra y otra,
los valores estimados cambiarán ipso facto. Por consiguiente, se
requiere alguna medida de “confiabilidad” o precisión de los
estimadores 𝛽1 , 𝛽2 . En estadística, la precisión de un valor estimado
se mide por su error estándar (ee). OJO: El error estándar no es otra
cosa que la desviación estándar de la distribución muestral del
estimador. Dados los supuestos gaussianos, se muestra que los
errores estándar de las estimaciones de MCO pueden obtenerse de la
siguiente manera:
Error estándar: fórmulas

෢2 = 𝜎2 ¡OJO!
• 𝑣𝑎𝑟 𝛽 σ 𝑥𝑖2
𝜎 𝑋𝑖 ≠ 𝑥𝑖
෢2 =
• 𝑒𝑒 𝛽
σ 𝑥𝑖2
𝑥𝑖 = 𝑋𝑖 − 𝑋ത
σ 𝑋𝑖2
෢1 =
• 𝑣𝑎𝑟 𝛽 2 𝜎 2
𝑛 σ 𝑥𝑖
𝑥𝑖2 = 𝑋𝑖 − 𝑋ത 2
σ 𝑋𝑖2
෢1 =
• 𝑒𝑒 𝛽 𝜎
𝑛 σ 𝑥𝑖2
Cálculo de 𝝈𝟐 - constante o varianza
homoscedástica de 𝒖𝒊 y el error estándar de
estimación
• 𝜎෢2 es el estimador de MCO de la verdadera pero desconocida 𝜎 2 .
Todas las cantidades que entran en las anteriores ecuaciones, excepto
𝜎 2 , pueden estimarse a partir de los datos, ahora la misma 𝜎 2 se
estima mediante la fórmula:
෢2
σ𝑢
• 𝜎෢2 = 𝑖
𝑛−2
σ𝑢෢2
•𝜎= 𝑖
𝑛−2
• Donde la expresión n − 2 es conocida como el número de grados de
libertad (gl).
Covarianza de los estimadores
෢1 ; 𝛽
• 𝑐𝑜𝑣 𝛽 ෢2 = −𝑋𝑣𝑎𝑟(
ത ෢2 )
𝛽
෢1 ; 𝛽
෢2 = 𝜎2
• 𝑐𝑜𝑣 𝛽 ത
−𝑋( 2 )
σ 𝑥𝑖

• ¿Cómo permiten las varianzas y los errores estándar de los


coeficientes estimados de regresión evaluar la confiabilidad de estos
valores estimados?
𝟐
Coeficiente de determinación 𝒓 : una
medida de la “bondad del ajuste”
𝟐
Coeficiente de determinación 𝒓 : una medida
de la “bondad del ajuste”
• Veremos ahora la bondad del ajuste de la línea de regresión a un
conjunto de datos; es decir, veremos cuán “bien” se ajusta la línea de
regresión a los datos.
• El coeficiente de determinación 𝑟 2 (caso de dos variables) o 𝑅2
(regresión múltiple) es una medida comprendida que dice cuán bien
se ajusta la línea de regresión muestral a los datos.
• Verbalmente, 𝒓𝟐 mide la proporción o el porcentaje de la variación
total en Y explicada por el modelo de regresión.
Coeficiente de determinación y coeficiente de
correlación
• El coeficiente de correlación es una medida del grado de asociación entre
dos variables.
σ ෢2
𝑢
2 𝑖
𝑟 =1−
σ(𝑌𝑖 − 𝑌)ത 2
2 ത 𝑌
σ(𝑌𝑖 −𝑌)( ത 2
෢𝑖 −𝑌)
•𝑟 = ത 2 σ(𝑌
σ(𝑌𝑖 −𝑌) ത 2
෢𝑖 −𝑌)

𝑟 = ± 𝑟2
𝑛 σ 𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖 )(σ 𝑌𝑖 )
•𝑟=
𝑛 σ 𝑋𝑖2 −(σ 𝑋𝑖 )2 𝑛 σ 𝑌𝑖2 −(σ 𝑌𝑖 )2
Comparando el modelo econométrico vs el
modelo estimado
Modelo Econométrico Modelo Estimado
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 ෢1 + 𝛽
𝑌𝑖 = 𝛽 ෢2 𝑋𝑖 + 𝑒𝑖
𝐸 𝑌𝑖 |𝑋𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 ෢1 + 𝛽
𝑌෡𝑖 = 𝛽 ෢2 𝑋𝑖
𝑢𝑖 = 𝑌𝑖 − 𝛽1 − 𝛽2 𝑋𝑖 𝑒𝑖 = 𝑌𝑖 − 𝛽෢1 − 𝛽෢2 𝑋𝑖
Comparando el modelo econométrico vs el
modelo estimado
Modelo Econométrico Modelo Estimado
𝛽1 , 𝛽2 son números fijos no ෢1 , 𝛽
𝛽 ෢2 son variables aleatorias
observables. observables.
𝑢𝑖 es no observable 𝑒𝑖 es observable
Sup. 2 implica 𝐸 𝑢𝑖 = 0 MCO asegura que 𝑒 = 0
Sup. 2 implica 𝐸 𝑋𝑖 𝑢𝑖 = 0 MCO asegura que σ 𝑒𝑖 𝑋𝑖 = 0
Ejercicio 1

• La economía laboral básica indica que, entre muchas variables, la


escolaridad es un determinante importante de los salarios. En la tabla
de la siguiente diapositiva proporciona datos primarios que se
necesitan para estimar el efecto cuantitativo de la escolaridad en los
salarios.
• Salario promedio por hora según la escolaridad Fuente: Arthur S.
Goldberger, Introductory Econometrics, Harvard University Press,
Cambridge, Massachusetts, 1998, tabla 1.1, p. 5 (adaptada).
Tabla
Años de escolaridad Salario promedio, $ Número de personas
6 4.4567 3
7 5.77 5
8 5.9787 15
9 7.3317 12
10 7.3182 17
11 6.5844 27
12 7.8182 218
13 7.8351 37
14 11.0223 56
15 10.6738 13
16 10.8361 70
17 13.615 24
18 13.531 31
Enunciados
• Grafique e interprete la relación entre las variables cuantitativas de
estudio.
• Determine la ecuación de la recta de regresión e interprete.
• Calcule lo siguiente e interprete:
෢2 , 𝜎 , 𝑣𝑎𝑟 𝛽
•𝜎 ෢2 , 𝑒𝑒 𝛽
෢2 , 𝑣𝑎𝑟 𝛽
෢1 , 𝑒𝑒 𝛽
෢1 , 𝑟 2 , 𝑟
GRACIAS

También podría gustarte