MODELO DE ESTIMACIÓN LINEAL
PRUEBA DE CONSISTENCIA DE LOS PARÁMETROS 𝜶 𝒚 𝜷
El estimado derivado de β es:
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝛽=
∑𝑛𝑖=1 𝑥𝑖 2 − 𝑛 (𝑥̅ )2
Exponiendo el numerador se tiene
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑥̅ ∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )𝑦𝑖
𝛽= =
∑𝑛𝑖=1 𝑥𝑖 2 − 𝑛 (𝑥̅ )2 ∑𝑛𝑖=1 𝑥𝑖 2 − 𝑛(𝑥̅ )2
(𝑥𝑖−𝑥̅)
Si denominamos: 𝑐𝑖 = ∑𝑛
𝑖=1 𝑥𝑖 2 −𝑛(𝑥̅ )2
Entonces 𝛽 = ∑𝑛𝑖=1 𝑐𝑖 𝑦𝑖
Lo cual demuestra que β es una combinación lineal de los valores de Y.
El valor esperado de β es:
E (β)= E[𝛴𝑐𝑖 𝑦𝑖 ]=Σ𝑐𝑖 (α+β𝑥𝑖 )
E (β)=α 𝛴𝑐𝑖 +β Σ𝑐𝑖 𝑥𝑖
Y la variable de β es:
Var[𝛽]=var [𝛴𝑐𝑖 𝑦𝑖 ]= Σ𝑐𝑖2 var [𝑦𝑖 ]
2 2 2 2
𝛴 (𝑥1 − 𝑥̅ )2
𝜎𝛽= 𝑣𝑎𝑟[𝛽]= 𝜎 𝛴𝑐𝑖 = 𝜎 (∑ 𝑥𝑖 2 − 𝑛(𝑥̅ )2 )2
𝜎2
𝜎𝛽 2=∑ 𝑥 2−𝑛(𝑥̅ )2
𝑖
𝜎2
𝜎𝛽 2 = 𝑛 𝑠 2 ; y el valor de la desviación estándar
𝑥
De 𝛽 𝑒𝑠: 𝑠
𝛽=√𝜎𝛽2
Donde 𝜎 2 es la varianza de los valores de Y, dado X (la cual se asume constante).
El valor estimado de 𝜎 2 es 𝑆 2 :
1
𝑆 2= 𝜎̂ 2 = ∑[𝑦𝑖 − (𝛼 + 𝛽 𝑥𝑖 )]2
𝑛−2
∑𝐸 2
𝑆 2 = 𝑛−2
𝑖
Prueba de Hipótesis para los Parámetros α y β.
Parámetro α:
La Hipótesis Nula es 𝐻0 : α=0
La hipótesis Alterna es 𝐻1 : 𝛼 ≠ 0
Para que se pueda rechazar la Hipótesis nula el valor de α debe estar fuera del rango definido por:
-C ≤ 𝛼̂ ≤ C
Donde ≤ es el valor estimado del parámetro α verdadero de la población.
El valor de C se obtiene de la distribución de probabilidades t-student para un grado de
confianza w y n-2 grados de libertad.
El valor de w usualmente es 5-10%. Se utiliza n-2 grados de libertad ya que la estimación de α y
β reduce los valores de información independientes en 2. Para el caso de M variables
Independientes (𝛽1… 𝛽𝑗… 𝛽𝑚 ), los grados de libertad son n-(m+1).
P[−𝑐 ≤ 𝛼 ≤ 𝑐 ∖𝐻0 ] = 1 − 𝑤
Utilizando la distribución t:
C=[𝑡 𝑤⁄2, 𝑛 − 2] ∗ 𝑆𝛼
La variación estimada de α es:
𝜎2 𝑥̅ 2
𝜎𝛼 2 = (1 + )
𝑛 𝑠𝑥 2
𝑠2 𝑥2
𝑆𝛼 = √𝜎𝛼 2 = √ (1 + 2 )
𝑛 𝑠𝑥
1
𝑆2 = [𝛴𝑥𝑖 2 − 𝑛(𝑥̅ )2 ]
𝑛
1
𝑆𝑥 2 = [𝛴𝑥𝑖 2 − 𝑛(𝑛̅)2 ]
𝑛
Para el Parámetro 𝛽 la primera es:
Hipótesis Nula 𝐻𝑜 : 𝛽 = 𝑂
Hipótesis Alterna 𝐻1 : 𝛽 ≠ 𝑂
El intervalo de no rechazo de la hipótesis nula
𝑤1 𝑤
-(𝑡 2 , 𝑛 − 2 ) 𝑆𝛽 ≤ 𝛽 ≤ (𝑡 2 , 𝑛 − 2 ) 𝑆𝛽
Si 𝛽 cae dentro de este rango no podemos rechazar la Hipótesis nula 𝛽 = 𝑂; por lo que
concluimos que, en base a la data disponible, Y no depende de X. Si 𝛽 esta fuera de este rango se
puede aceptar la relación entre Y y X con un grado de confianza 1-w.
Recordando que:
𝜎 2
Var(𝛽̂) = 𝑆 𝑥 𝑥
𝜎
Y 𝜎𝛽 =
√𝑠 𝑥 𝑥
El valor estimado de 𝜎 𝑒𝑠 𝑆 y de 𝜎𝛽=
̂ 𝑆𝛽
De modo que:
𝑆
𝑆𝛽 =
√𝛴𝑥𝑖 2 − 𝑛(𝑥̅ )2
Prueba de Ajuste Global del Modelo
La Hipótesis nula establece que la correlación múltiple es igual a O. La prueba se realiza
verificando la consistencia estadística de la relación entre la variable explicada (𝑌) y las variables
independientes (𝑋 )
La bondad o ajuste global del modelo se representa mediante la relación entre la variación
explicada, reflejara en el modelo, por medio de la recta de regresión y la variación total observada
en la variable dependiente menos la que toma en su cuenta la regresión ; es decir, los residuos
(términos de error).
Esta relación, al ser un cociente, toma la forma de una distribución de Probabilidades “F”.
𝑆𝑆 𝑟𝑒𝑔.⁄ 𝐾 𝑅2 /𝐾
𝐹= =
𝑆𝑆 𝑟𝑒𝑠. ⁄ (𝑁 − 𝐾 − 1) (1 − 𝑅2 )/(𝑁 − 𝐾 − 1)
Donde:
SS reg. =Suma de cuadrados de las desviaciones explicadas por la regresión.
𝑆𝑆 𝑟𝑒𝑔. = 𝛴(𝛼 + 𝛽𝑋𝑖 − 𝐺̅ )2
2
= ∑𝑛𝑖=1(𝐺̂− 𝐺̅ )
SS res: Suma de cuadrados de la variación no explicada o residual.
2
𝑆𝑆 𝑟𝑒𝑠 = ∑ 𝐸𝑖 2 = ∑(𝐺𝐼 − 𝐺̂ )
K: número de variables independientes en el modelo (𝑋𝑆 1 )
N: Tamaño de la muestra (Ej.: número de zonas).
La razón F tiene la distribución similar a la función de distribución de probabilidades “F” con K y
(N-K-1) grados de libertad.
Coeficientes de Determinación de la Regresión
SST: Suma total de desviaciones al cuadrado, con respecto al promedio.
SST=𝛴(𝑌𝑖 − 𝑌̅)2 = ∑ 𝑌𝑖 − 2𝑌̅ 𝛴𝑌𝑖 − 𝑁 ̅𝑌 2
SST=Σ𝑌𝑖 2 -N 𝑌̅ 2
(𝛴 𝑌 ) 2
𝑌̅ 2 = 𝑛2𝑖
𝛴(𝑌𝑖)2
SST=Σ 𝑌𝑖 2 − 𝑁
Y la suma de cuadrados del error (residuos) es:
𝑆𝑆𝑇 = 𝛴 𝐸𝑖 2
𝑆𝑆𝐸
La variación no explicada es: 𝑆𝑆𝑇
Y la variación explicada es: 1 − 𝑆𝑆𝐸⁄𝑆𝑆𝑇
Esta relación se define como coeficiente de determinación de la regresión.
𝑆𝑆𝐸
𝑅2 = 1 −
𝑆𝑆𝑇
Si se expresa en términos de SSR
(Suma de cuadrados de la regresión)
𝑆𝑆𝑅 = 𝑆𝑆𝑇 − 𝑆𝑆𝐸
𝑆𝑆𝑇 − 𝑆𝑆𝐸 𝑆𝑆𝑅
𝑅2 = =
𝑆𝑆𝑇 𝑆𝑆𝑇
Ejemplo:
1 2 314.28
𝑆2 = 𝛴(𝑌𝐼 − 𝑌̂) = = 31.4
𝑁−2 10
𝑆 = √𝑆 2 = √31.4 = 5.60 MODELO
𝜎 2 49.2
𝑆𝛽 2 = 𝑛 𝑆𝑥
𝑌 =
2 12∗394.1 = 0.010
𝑆
𝛽=√𝑆𝛽 2 =0.102
𝑆
𝑠2 𝑥̅ 2 31.4 73.62
𝛼=√ (1+ 2)= √ (1+ )
𝑛 𝑠𝑥 12 394.1
𝑠𝛼 = 6.21
Intervalo de Confianza:(10%) 𝑤⁄
2 = 5%
Valor de α:
𝐶 = [5%, 10] ∗ 𝑆𝛼
De la distribución t-student 𝑡5%,10 = 1.813
𝐶 = 1.813 ∗ 6.21 = 11.26
11.26 ≤ 𝛼̂ ≤ 11.26 Intervalo de no rechazo
En este caso 𝜶 = 23.31 Se rechaza la hipótesis Nula
𝜶 es significativo al 10%
Prueba para 𝜷:
𝑆𝛽= 0.102
t 5%, 10=1.813
𝑆𝛽 𝑡 5%, 10 = 0.185
Intervalo de no rechazo:
̂ ≤ 1.81
−0.185 ≤ 𝛽
Valor estimado de β=0.23 se rechaza la hipótesis nula.
Modelo: 𝑦̂ = 23.31+0.23 X
Para el modelo Global:
𝑠𝑠 𝑟𝑒𝑔./𝑘
𝐹=
𝑠𝑠 𝑟𝑒𝑠/(𝑛 − 𝑘 − 1)
𝑠𝑠 𝑟𝑒𝑔 = 227.39
K=1
𝑛 − 𝑘 − 1 = 10
𝑠𝑠 𝑟𝑒𝑠 = 314.28
227.39⁄
𝐹= 1 = 7.235
314.28⁄
10
De la distribución F con (1,10) 𝐹1 = 4.96
(95%)
𝐹 > 𝐹1 𝐿𝑎 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑡𝑖𝑒𝑛𝑒 𝑐𝑜𝑛𝑠𝑖𝑠𝑡𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎.