Regresión lineal múltiple – Verificación de supuestos
Regresión lineal
Modelo de la población 𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝑢
𝑢 es una variable aleatoria
Parámetros del modelo 𝛽0 , 𝛽1 , 𝛽2 , … , 𝛽𝑘
variable independientes 𝑥1 , 𝑥2 , … 𝑥𝑘
variable dependiente 𝑦
Los valores que conforman la observación i se identifican por:
𝑦𝑖 , 𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑘
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑘 𝑥𝑖𝑘 + 𝑢𝑖
Estimadores ̂0 , 𝛽
𝛽 ̂1 , 𝛽
̂2 , … , 𝛽
̂𝑘
Ecuación ajustada ̂0 + 𝛽
𝑦̂ = 𝛽 ̂1 𝑥1 + 𝛽
̂2 𝑥2 + ⋯ + 𝛽
̂𝑘 𝑥𝑘
Valor ajustado observación 𝑖 ̂0 + 𝛽
𝑦̂𝑖 = 𝛽 ̂1 𝑥𝑖1 + 𝛽
̂2 𝑥𝑖2 + ⋯ + 𝛽
̂𝑘 𝑥𝑖𝑘
Residuales 𝑢̂𝑖 = 𝑦𝑖 − 𝑦̂𝑖
SRC suma de residuales al cuadrado 𝑆𝑅𝐶 = ∑ 𝑢̂𝑖 2 = ∑(𝑦𝑖 − 𝑦̂𝑖 )2
𝑆𝑅𝐶
Desviación estimada de los errores 𝑠 = √ 𝑛−(𝑘+1)
Regresión lineal múltiple – Verificación de supuestos
Supuestos del modelo de regresión lineal
∀𝑖=1,2,…,𝑛; 𝑗=1,2,…,𝑘
1. 𝐸[𝑢𝑖 ] = 0 la media del error aleatorio es cero
2. 𝑉[𝑢𝑖 ] = 𝜎 2 la varianza del error es constante – Homocedasticidad
no depende del valor de 𝑖
3. 𝐶𝑜𝑣[𝑥𝑖𝑗 , 𝑢𝑖 ] = 0 no hay correlación entre las independientes y el error
4. 𝐶𝑜𝑣[𝑢𝑖 , 𝑢𝑡 ] = 0 no hay correlación entre errores de dos observaciones
5. No multicolinealidad Ninguna variable independiente se puede expresar como
combinación lineal de otras variables independientes
6. 𝑢𝑖 ~𝑁(0, 𝜎 2 ) los errores siguen una distribución normal
Regresión lineal múltiple – Verificación de supuestos
Supuesto 2 – La varianza es constante
Pruebas de homocedasticidad
𝐻0 : 𝑉(𝑢𝑖 ) = 𝜎 2 La varianza del error es constante
𝐻1 : 𝑉(𝑢𝑖 ) 𝑛𝑜 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 Varianza del error no constante
La variable aleatoria 𝑢𝑖 tiene 𝐸[𝑢𝑖 ] = 0
La varianza se define por 𝐸[〈𝑢𝑖 − 𝐸(𝑢𝑖 )〉2 ] = 𝐸[𝑢𝑖 2 ]
Es decir, los cuadrados de los residuales son una estimación de la varianza del residual
La afirmación de que la varianza es constante se puede verificar mostrando que el residual
al cuadrado no se puede explicar por otras variables.
Prueba Breusch Pagan
Modelo auxiliar 𝑢̂2 = 𝛿0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 + 𝑣
𝐻0 : 𝛿1 = 0, 𝛿2 = 0, … , 𝛿𝑘 = 0 EL modelo para explicar la varianza
NO es significativo. La varianza es constante
Utilice el estadístico F de significancia general para este modelo auxiliar
Prueba White 1
𝑢̂2 = 𝛿0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 +
+ 𝑡é𝑟𝑚𝑖𝑛𝑜𝑠 𝑒𝑛 𝑥𝑗2 , 𝑡é𝑟𝑚𝑖𝑛𝑜𝑠 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖𝑜𝑛 (𝑥𝑗 ∗ 𝑥𝑟 ) + 𝑣
𝐻0 : 𝛿1 = 0, 𝛿2 = 0, … EL modelo para explicar la varianza
NO es significativo. La varianza es constante
Utilice el estadístico F de significancia general para este modelo auxiliar
Prueba White 2
𝑢̂2 = 𝛿0 + 𝛿1 𝑦̂ + 𝛿2 𝑦̂ 2 + 𝑣
𝐻0 : 𝛿1 = 0, 𝛿2 = 0 EL modelo para explicar la varianza
NO es significativo. La varianza es constante
Utilice el estadístico F de significancia general para este modelo auxiliar
Decisión en la prueba de homocedasticidad
El rechazo de la hipótesis nula indica la presencia de heterocedasticidad, es decir varianza
no constante
Regresión lineal múltiple – Verificación de supuestos
Supuesto 3 – Errores no correlacionados con variables explicativas
Prueba
Modelo auxiliar 𝑢̂ = 𝛿0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 + 𝑣
𝐻0 : 𝛿1 = 0, 𝛿2 = 0, … , 𝛿𝑘 = 0 EL modelo para explicar el residual
NO es significativo.
Utilice el estadístico F de significancia general para este modelo auxiliar
Decisión en la prueba
El rechazo de la hipótesis nula indica que al menos una de las variables independientes
puede explicar el comportamiento del error.
Las variables y los residuales estarían correlacionados
Regresión lineal múltiple – Verificación de supuestos
Supuesto 4 – Errores no correlacionados entre ellos
Prueba Durbin Watson (DW)
Parámetro es la correlación entre dos errores consecutivo 𝜌 = 𝐶𝑜𝑟𝑟(𝑢𝑖 , 𝑢𝑖−1 )
𝐻0 : 𝜌 = 0 No hay correlación entre 2 errores consecuivos
𝐻1 : 𝜌 ≠ 0 Sí hay correlación
∑(𝑢𝑖 −𝑢𝑖−1 )2
Estadístico de prueba 𝐷𝑊 = ∑ 𝑢𝑖 2
Buscar valores críticos en una tabla Durbin Watson
Se puede verificar que 𝐷𝑊~2(1 − 𝜌)
0 dL dU 2 4-dU 4-dL 4
Correlación + ¿? NO ¿? -
Interpretación
0 < 𝐷𝑊 < 𝑑𝐿 correlación positiva entre 𝑢𝑖 , 𝑢𝑖−1
𝑑𝐿 < 𝐷𝑊 < 𝑑𝑈 el criterio no decide
𝑑𝑈 < 𝐷𝑊 < 4 − 𝑑𝑈 no hay correlación entre 𝑢𝑖 , 𝑢𝑖−1
4 − 𝑑𝑈 < 𝐷𝑊 < 4 − 𝑑𝐿 el criterio no decide
4 − 𝑑𝐿 < 𝐷𝑊 < 4 correlación negativa entre 𝑢𝑖 , 𝑢𝑖−1