Facultad de Ingeniería y Empresa
Econometría
Repaso
integrativa
Jaquelin Morillo Remesnitzky – Cristián Gutiérrez
Segundo Semestre 2024
Evaluación del Modelos
1. Bondad de ajuste:
R2 : Representa la proporción de la varianza de la variable
dependiente (Yi) explicada por las variables independientes. Si R2 =
0.75, el 75% de la variabilidad en Yi es explicada por las variables
explicativas.
R2 ajustado: Corrige R2 penalizando por incluir variables
irrelevantes. Es útil para modelos con muchas variables.
2. Significancia global:
Evaluada mediante el estadístico F, el cual contrasta la predicción de
que todos los coeficientes son iguales a cero frente a la alternativa de
que al menos uno es distinto. Si el p -valor asociado es menor a 0.05,
las variables independientes explican significativamente Yi.
Evaluación de Modelos
Los coeficientes β representan el cambio esperado en la variable dependiente (Y i) dado un
cambio unitario en la variable independiente correspondiente (X i), manteniendo constantes
las demás variables del modelo.
β0 : Es la constante del modelo (intercepto). Representa el valor promedio de Y i cuando
todas las variables independientes son iguales a cero.
Ejemplo: Si el modelo estima el salario (Y i) como función de la educación (X1) y
experiencia (X2), β0 sería el salario esperado de una persona sin educación ni
experiencia laboral.
βj : Es el coeficiente asociado a la variable independiente X i . Representa el cambio en Yi
asociado a un incremento de una unidad en Xi, manteniendo constantes las otras variables.
Ejemplo: Si β1=2.5 en un modelo que relaciona salario y años de educación, un año
adicional de educación incrementaría el salario esperado en 2.5 unidades monetarias,
asumiendo que la experiencia y otras variables permanecen constantes.
Signo de β:
Positivo (βj>0): Indica que Yi aumenta a medida que Xi aumenta.
Negativo (βj<0): Indica que Yi disminuye a medida que Xi aumenta.
Cercano a cero: Sugiere un efecto
REPASAR mínimo o nulo de XNO
TRANSFORMACIONES i sobre Yi.
LINEALES!!!!
Evaluación de Modelos
Significancia Estadística de los Coeficientes
Los t-tests evalúan si un coeficiente (βj ) es significativamente distinto de cero, es decir, si Xi tiene
un efecto real sobre Yi.
Hipótesis:
• H0:βj = 0: Xi no tiene un efecto significativo sobre Yi.
• Ha:βj ≠0: Xi tiene un efecto significativo sobre Yi.
Estadístico t:
1. : Coeficiente estimado para Xi .
2. Error estándar del coeficiente, que mide la precisión de la estimación.
El valor absoluto de t indica cuántas desviaciones estándar está de cero.
p-valor:
3. Es la probabilidad de observar un valor absoluto del estadístico t tan extremo (o más)
como el calculado, bajo la suposición de que H0 es verdadera.
4. Si el p-valor es menor que el nivel de significancia (α, típicamente 0.05), se rechaza H0,
concluyendo que Xi tiene un efecto significativo sobre Yi.
Ajuste del modelo
Residuos Aleatorios (Buen Ajuste): Los puntos se distribuyen de manera aleatoria
alrededor de la línea roja (cero), indicando un buen ajuste del modelo.
Residuos con Patrón Curvo (Mal Ajuste): Los puntos muestran una tendencia curva,
lo que sugiere que el modelo no captura adecuadamente la relación entre las
variables.
Normalidad de los residuos
QQ-Plot con Distribución Normal: Los puntos se alinean aproximadamente con
la línea diagonal, indicando que los residuos siguen una distribución normal.
QQ-Plot con Desviaciones de Normalidad: Los puntos se desvían
significativamente de la línea diagonal, especialmente en las colas, lo que refleja
una distribución no normal (en este caso, sesgada).
Normalidad de los residuos
Test de Shapiro-Wilk:
Hipótesis:
H0: Los residuos siguen una distribución normal.
Ha: No siguen una distribución normal.
Conclusión:
Un p-valor menor a 0.05 rechaza H0, indicando residuos no
normales.
Varianza de los errores
Test de Breusch-Pagan:
Hipótesis:
H0: Varianza constante.
Ha: Varianza no constante.
Conclusión:
Un p-valor menor a 0.05 sugiere heteroscedasticidad, invalidando supuestos del modelo de MCO y requiriendo
estimadores robustos.
Recordamos:
La homoscedasticidad es una condición en la que la varianza de los errores ( ε) es constante para todos los valores
de las variables independientes (X).En términos más simples, los errores tienen una dispersión uniforme a lo largo
del rango de predicción del modelo.
Es uno de los supuestos fundamentales en el modelo OLS, ya que garantiza que los estimadores sean eficientes
(mínima varianza).
La heteroscedasticidad ocurre cuando la varianza ε no es constante para todos los valores de las variables
independientes. En este caso, los errores presentan una dispersión variable, como una forma de abanico o patrón
creciente/decreciente.
Aspecto Homoscedasticidad Heteroscedasticidad
Varianza de errores Constante (σ2) Variable (σ2 depende de X)
Estimadores insesgados pero no
Impacto en OLS Estimadores eficientes
eficientes
Representación gráfica Dispersión uniforme Dispersión cambiante
Revisión gráfica de varianza de los errores
Homoscedasticidad: Los residuos tienen una dispersión uniforme y constante
alrededor de la línea roja (cero) para todos los valores de la variable independiente.
Esto demuestra un supuesto clave cumplido en los modelos de regresión.
Heteroscedasticidad: Los residuos muestran una dispersión creciente a medida que
aumenta el valor de la variable independiente. Este patrón indica que la varianza de los
errores no es constante, lo cual puede afectar la eficiencia de los estimadores.
Comparación entre Grupos
Modelos Separados por Género
Se estiman dos modelos de regresión, uno para mujeres y otro para
hombres. Las ecuaciones son:
Para mujeres:
Ymujeres = β₀ mujeres + β educación_mujeres ⋅ X educación + ε
Para hombres:
Yhombres = β₀ hombres + β educación_hombres ⋅ X educación + ε
Interpretación:
1. βeducación_mujeres y βeducación_hombres representan el efecto de la educación
sobre el salario en cada género.
2. Si βeducación_mujeres ≠ βeducación_hombres , hay diferencias en el retorno de la
educación entre géneros.
Comparación entre Grupos
Modelo con Variables de Interacción
En un solo modelo, se incluye una variable de interacción entre el género y la
educación:
Donde:
: Es una variable dummy que toma el valor 1 si el individuo es hombre y 0 si es
mujer.
: Es el término de interacción que mide cómo cambia el efecto de la educación en
función del género.
Interpretación:
β educación : Efecto de la educación sobre el salario para mujeres (cuando = 0).
: Diferencia promedio en el salario entre hombres y mujeres cuando = 0.
: Diferencia en el retorno de la educación entre hombres y mujeres.
Dudas? Preguntas? Comentarios?
GRACIAS