INSTITUTO TECNOLÓGICO SUPERIOR DE PÁNUCO
MATERIA: ESTADISTICA INFERENCIAL II
CARRERA: INGENIERIA EN GESTION EMPRESARIAL
TRABAJO: ENSAYO
GRUPO: G-502
DOCENTE: AMERICO RIOS MORALES
ALUMNO: RODRIGO CRISTOBAL DEL ANGEL
ANÁLISIS RESIDUAL
Los residuos de un modelo de regresión son 𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖 , 𝑖 = 1, 2, … , 𝑛, donde 𝑦𝑖
es una observación real y 𝑦̂𝑖 es el correspondiente valor ajustado a partir del modelo
de regresión.
Con frecuencia el análisis de residuos es útil para verificar la hipótesis de que los
errores tienen una distribución que es aproximadamente normal con varianza
constante, así como para determinar la utilidad que tiene la adición de más términos
al modelo.
Como comprobación aproximada de la normalidad, el experimentador puede
construir un histograma de frecuencias de los residuos o una gráfica de probabilidad
normal. Muchos programas de computadora producen una gráfica de probabilidad
normal de los residuos, y puesto que los tamaños de las muestras en la regresión a
menudo son pequeños como para que el histograma sea de utilidad, la gráfica de
probabilidad normal es el método preferido.
También se acostumbra usar el Residual estandarizado, el cual se obtiene al dividir
el residual entre la desviación estándar del residual (siempre que hagamos análisis
de residuales debemos utilizar Residual estandarizado), y el Residual estudentizado
"deleted", que es similar al anterior,
pero eliminando de los cálculos la observación cuyo residual se desea hallar.
El análisis de residuales permite cotejar si las suposiciones del modelo de regresió
n se cumplen. Se puede detectar:
a) Si efectivamente la relación entre las variables X e Y es lineal.
b) Si hay normalidad de los errores.
c) Si hay valores anormales en la distribución de errores (Si se usa Residual
estandarizado, cualquier observación con un residual mayor de 2 o menor de -
2 es considerado “outlier”)
d) Si hay varianza constante (propiedad de Homocedasticidad) y
e) Si hay independencia de los errores.
El análisis de residuales se basa en el examen de varias gráficas, a saber:
• Gráfica de los residuales en función de la variable independiente
• Gráfica de residuales estandarizados
• Gráfica de probabilidad normal
Gráfica de residuales en función de x Ésta es una gráfica en la que los valores de
la variable independiente se representan en el eje horizontal y los valores de los
residuales correspondientes, en el eje vertical. Se grafica un punto para cada
residual.
También es usual presentar la gráfica de residuales con respecto a los valores de
la variable dependiente (ŷi ) estimados por la ecuación. Para la regresión lineal
simple, la gráfica de residuales en función de x y la de residuales en función de ŷ
muestran la misma información; mientras que, para la regresión lineal múltiple, la
gráfica de residuales en función de ŷ se usa con más frecuencia, porque se maneja
más de una variable independiente.
Gráfica de residuales estandarizados La mayoría de las gráficas de residuales que
se obtienen con el uso de programas estadísticos u hojas de cálculo muestran una
versión estandarizada de los residuales. Estandarizar una variable aleatoria
significa restarle su media y dividir el resultado entre su desviación estándar.
Como sabemos, el promedio de los residuales es cero debido al método de los
mínimos cuadrados. Por tanto, para obtener un residual estandarizado basta con
dividir el residual entre su desviación estándar.
Estimado de la desviación estándar del i-ésimo residual
El estimado de la desviación estándar del residual i depende del error estándar del
estimado s y el valor correspondiente de la variable independiente xi , así: Donde
sei = s √1 - hi (31) hi = 1 n + (xi - x̅)2 ∑ (xi - x̅)2