0% encontró este documento útil (0 votos)
109 vistas20 páginas

El Método Box-Cox

Cargado por

Yon Ander
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
109 vistas20 páginas

El Método Box-Cox

Cargado por

Yon Ander
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UADY

Transformaciones de y:

EL MÉTODO BOX-COX
EQUIPO 6 REGRESIÓN LINEAL
Canul Yon Transformaciones para
Cordero Luis corregir inadecuaciones del
García Augusto modelo
SUPUESTOS
El modelo de regresión lineal, ya sea
simple o múltiple, debe cumplir con
ciertos supuestos para hacer
regresión correctamente.
Dado el modelo:

En caso de que no se cumpla el


supuesto de normalidad o varianza
constante (Homocedasticidad) en los
residuales, se pueden usar
transformaciones para que los
supuestos se cumplan.
Verificación de supuestos
Normalidad
Se debe de distribuir de forma Varianza constante
normal los residuales de la (Homocedasticidad)
regresión.
No se comprueba la normalidad La varianza de los errores es
de cada variable del modelo. igual para cualquier combinación
Se puede realizar mediante un de valores de las variables
test de normalidad como independientes.
Shapiro-Wilk o un gráfico. Se puede verificar mediante un
test como el de Breusch-Pagan
o un gráfico.
TRANSFORMACIÓN DE
LA POTENCIA
Relación entre X y Y
Si conozco la relación entre la variable predictora y la
respuesta es posible tener una transformación tal que al
aplicarle una potencia a los datos se corrija la falta de
normalidad o varianza constante.

¿Qué ocurre?
Muchas veces no sabemos dicha relación y perderíamos
mucho tiempo intentando buscar una transformación
adecuada.
LA
TRANSFORMACIÓN
DE BOX-COX
Nos dice la mejor potencia λ a la que podemos elevar y de tal forma que los residuales se ajusten a la distribución
normal con media 0 y varianza constante desconocida.
La transformación tiene la siguiente forma:

Notemos que si λ toma el valor de 0 la Como obtenemos una indeterminación 0/0


expresión se indetermina, por lo que cuando aplicamos la regla de L'Hôpital como sigue:
eso suceda tomaremos el límite cuando λ
tiende a 0
LA TRANSFORMACIÓN DE
BOX-COX
Entonces la transformación queda de
la siguiente manera:
Cálculo de
Para encontrar la estimación de λ procedemos por el método de
mínimos cuadrados, en donde queremos minimizar la siguiente función
de λ:

Lo siguiente es derivar con respecto a λ e igualar a 0.


Al final del método obtenemos una estimación puntual del λ óptimo.
CONSIDERACIONES
Se sugiere que los valores de λ estén en el intervalo (-5,5) pues al ser una
potencia, si el valor de lambda es mayor a 5 estaríamos elevando los
datos de y a una potencia muy grande y podríamos perder información
valiosa.
En caso de tener una lambda mayor o menor a ese intervalo no podremos
aplicar la transformación y concluimos que el método de Box-Cox no fue
útil para tratar la normalidad o la homocedasticidad.
Si lambda=1 no es necesaria ninguna transformación.
Esta fórmula se utiliza cuando los datos de la variable respuesta son
mayores a 0, en otro caso se tendrían que hacer adecuaciones a la
expresión.
¿POR QUÉ
TRATAR Y
Recordemos que la definición de
ARREGLA LA residuales es .

NORMALIDAD EN Entonces, podemos notar que


depende directamente de la
LOS variable respuesta, y de este modo
transformar “y” termina afectando a
RESIDUALES? los errores.
La transformación lleva todas las Y en una dirección.
(es decir, la transformación conserva el orden de los
valores de Y)

La cantidad de desplazamiento es menor en la cola


más larga y aumenta a medida que avanzamos hacia la
cola más corta.
Transformación de Box-Cox en y (λ=2 en azul, λ=1
punteado)
Box-Cox con λ>1 hace que una y con distribución
sesgada hacia la izquierda (negativa) sea más simétrica
Transformación de Box-Cox en y (λ=0.5 en rojo, λ=1
punteado)
Box-Cox con λ<1 hace que una y con distribución
sesgada hacia la derecha (positiva) sea más simétrica
INTERVALOS DE
CONFIANZA
Para encontrar el intervalo de confianza que contiene a λ, primero debemos considerar la
función de máxima verosimilitud.

Por lo que el intervalo de confianza se genera de la siguiente forma, aplicando la función


de máxima verosimilitud al estimador puntual óptimo de λ y usando la función Chi-squared
con 1 grado de libertad.
INTERVALOS DE CONFIANZA PARA λ
Para calcular el IC tenemos que minimizar la suma de cuadrados de los residuales de λ y
graficar la función de SSres(λ). El intervalo de confianza va a estar definido por los puntos
en los que corte
CONSIDERACIONES
DE LOS IC

Si el intervalo contiene al 0 la
transformación adecuada es ln(y).
Si el intervalo de confianza contiene al 1, se
sugiere no aplicar transformación alguna.
Se suele preferir valores conocidos para
lambda en el IC con el fin de tener una
interpretación sencilla de lo que se está
haciendo.
Ejemplos a
continuación.
COMPAÑÍA ELÉCTRICA
DIVERSIDAD DE ESPECIES EN LA ISLA
GALÁPAGOS
Hay 30 islas Galápagos y 7 variables en el conjunto de datos. La relación
entre el número de especies de plantas y varias variables geográficas es
de interés.
Se desarrollará un modelo ded regresión lineal que relacione las variables
predictores de interés con el número de especies de plantas en una isla,
despúes de depurar el modelo con el procedimineto correcto, se obtiene
lo siguiente.

También podría gustarte