SEMANA 10
Coeficiente de Determinacin Parcial
Coeficiente de Determinacin Parcial
Los coeficientes son una medida de la porcin de la variacin
en la variable dependiente que es explicada por cada variable
explicativa, mientras se controla o se mantiene constante a las
dems variables explicativas.
As pues, en un modelo de regresin mltiple con dos
variables explicativas tenemos:
y tambin
en la que:
SSR(X1 / X2) = suma de cuadrados de la contribucin de la
variable X1 al modelo de regresin dado que la variable X2
ha sido incluida en el modelo.
SST = suma total de cuadrados para Y
SSR(X1 y X2) = suma de cuadrados de regresin cuando las
variables X1 y X2 estn incluidas en el modelo de regresin
mltiple.
SSR(X2 / X1) = suma de cuadrados de la contribucin de la
variable X2 al modelo de regresin dado que la variable X1
ha sido incluida en el modelo.
Mientras que en un modelo de regresin mltiple que
contiene varias (P) variables explicativas, tenemos:
Para nuestro problema sobre el consumo de petrleo para
calefaccin podemos calcular
El coeficiente de determinacin parcial de la variable Y
con X1, mientras se mantiene constante X2 puede
interpretarse como que, para una cantidad fija
(constante) de aislamiento en el tico, 95.61% de la
variacin en el consumo de petrleo para calefaccin
durante enero puede explicarse por la variacin en la
temperatura atmosfrica diaria promedio en dicho mes.
El coeficiente de determinacin parcial de la variable Y
con X2, mientras se mantiene constante X1
puede
interpretarse como que, para una temperatura atmosfrica
diaria promedio dada (constante), 85.88% de la variacin
en el consumo de petrleo para calefaccin durante enero
puede ser explicada por la variacin en la cantidad de
aislamiento.
El Modelo de Regresin Curvilneo
En nuestro anlisis de la regresin simple y en el de
regresin mltiple, hemos supuesto que la relacin entre Y
y cada variable explicativa es lineal.
Sin embargo, existen varios tipos diferentes de relaciones
entre variables. Una de las relaciones no lineales ms
comunes es la relacin polinomial curvilnea entre dos
variables en la que Y aumenta (o disminuye) con una
rapidez variable para diferentes valores de X.
Este modelo de una relacin polinomial entre X y Y puede
expresarse como:
en la que:
Este modelo de regresin es parecido al modelo de
regresin mltiple con dos variables explicativas, excepto
en que la segunda variable explicativa, en este caso, es
justamente el cuadrado de la primera variable.
La ecuacin de regresin para el modelo polinomial
curvilneo con una variable explicativa (X1) y una
variable dependiente (Y) es:
(1)
Un planteamiento alternativo al modelo de regresin
curvilneo expresado en la ecuacin (1) consiste en centrar
los datos mediante la sustraccin de la media de la variable
explicativa de cada valor del modelo.
Este modelo de regresin centrada se presenta en la
siguiente ecuacin:
(2)
Matemticamente hablando, la ecuacin (1) y la ecuacin
(2) son equivalentes.
La diferencia entre los dos mtodos se presenta en los
trminos correspondientes a la interseccin y al efecto
lineal.
Bsqueda de los Coeficientes de Regresin y
Prediccin de Y
Con el fin de ilustrar el modelo de regresin curvilneo,
suponga que el departamento de mercadotecnia de una
cadena grande de supermercados desea estudiar la
flexibilidad de precios de los paquetes de rasuradoras
desechables. Se seleccion una muestra aleatoria de 15
tiendas con igual afluencia de clientes y colocacin de
artculos (es decir, junto a las cajas registradoras).
El nmero de paquetes vendidos y el precio en cada tienda
se presentan en la siguiente tabla:
TABLA: Ventas y precios de paquetes de rasuradoras desechables para una
muestra de 15 tiendas
Ventas
Precio (ctvos.)
Ventas
Precio (ctvos.)
142
151
163
168
176
91
100
107
79
79
79
79
79
99
99
99
115
126
77
86
95
100
106
99
99
119
119
119
119
119
Con el propsito de investigar la seleccin del modelo
adecuado que representa la relacin entre precio y ventas,
se grafic un diagrama de dispersin en la siguiente figura:
FIG.: Diagrama de dispersin del precio (X) y las ventas (Y)
Un examen ms detallado de ste nos indica que la
disminucin de las ventas se nivela con un aumento de
los precios
Por consiguiente, parece que podra ser ms apropiado
utilizar un modelo curvilneo para estimar las ventas
basndose en el precio, en lugar de usar un modelo lineal.
Ventas(Y)
142
151
163
168
176
91
100
107
115
126
77
86
95
106
Precio(X1i)
79
79
79
79
79
99
99
99
99
99
119
119
119
119
2 ( X 1i )
Precio
6241
6241
6241
6241
6241
9801
9801
9801
9801
9801
14161
14161
14161
14161
( X1i X1 )
-20
-20
-20
-20
-20
0
0
0
0
0
20
20
20
20
( X1i X1 )2
400
400
400
400
400
0
0
0
0
0
400
400
400
400
En la siguiente Fig. se presenta el resultado parcial obtenido
con el paquete MINITAB para los datos de nuestro ejemplo,
utilizando el modelo centrado (ecuacin 2).
Anlisis de Regresin
La ecuacin de regresin es:
Ventas(Y) = 108 - 1.68 (X1i - media) + 0.0465 (X1i - media)sq
Predictor
Constant
(X1i - m
(X1i - m
S = 12.87
Coef
107.800
-1.6800
0.04650
StDev
5.756
0.2035
0.01762
R-Sq = 86.2%
T
18.73
-8.26
2.64
P
0.000
0.000
0.022
R-Sq(adj) = 83.9%
Anlisis de Varianza
Source
Regression
Residual Error
Total
DF
2
12
14
SS
12442.8
1987.6
14430.4
MS
6221.4
165.6
F
37.56
P
0.000
En la figura observamos que:
b0" 107.8
b1" 1.68
b11 0.0465
Por consiguiente, el modelo curvilneo centrado puede
expresarse como:
Para interpretar los coeficientes vemos que las ventas
disminuyen con un aumento de los precios; sin embargo,
observamos tambin que estas disminuciones en las ventas
se nivelan o se reducen al aumentar el precio.
Esto se puede ver al predecir las ventas promedios para
paquetes con precios de 79 centavos, 99 centavos y 119
centavos ($1.19) Utilizando nuestra ecuacin de regresin
curvilnea
para X1i 79 ,tenemos
para X 1i 99 , tenemos
para X1i 119 , tenemos
As pues, observamos que se espera que una tienda que
vende las rasuradoras en 79 centavos venda 52.2 paquetes
ms que una tienda que vende las rasuradoras en 99
centavos.
Pero se espera que una tienda que las vende a 99 centavos
venda solamente 15 paquetes ms que una tienda que las
venda a $1.19.
Diagrama de dispersin que representa la relacin
curvilnea entre el precio (X) y las ventas (Y)
Prueba de la Significacin del Modelo Curvilneo
Ahora que el modelo curvilneo ha sido ajustado a los
datos, podemos determinar si existe una relacin
curvilnea significativa entre las ventas, Y, y el precio, X.
De manera parecida a la regresin mltiple, las hiptesis
nula y alternativa pueden establecerse como
H 0 : 1 11 0
(no existe relacin entre X1 y Y)
H1 : 1 y/o 11 0
(el ltimo coeficiente de regresin no es igual a cero)
La hiptesis nula puede ser probada utilizando una prueba
F.
Utilizando los resultados obtenidos para nuestro problema
mediante el paquete MINITAB, se tiene:
Si se selecciona un nivel de segnificacin de 0.05, tenemos
que, para 2 y 12 grados de libertad, el valor crtico de la
distribucin F es de 3.89
Se llega a la conclusin de que existe una relacin
curvilnea significativa entre las ventas y el precio
de las rasuradoras.
En el anlisis de regresin curvilnea, el coeficiente de
determinacin mltiple puede calcularse con la ecuacin
siguiente:
De los resultados del paquete MINITAB, tenemos:
SSR = 12,442.8 y SST = 14,430.4
As pues,
Este coeficiente de determinacin mltiple, cuyo valor se
calcul en 0.862, puede interpretarse como que el 86.2%
de la variacin en las ventas puede ser explicado por la
relacin curvilnea entre las ventas (Y) y el precio (X).
Tambin se puede calcular un coeficiente de
determinacin ajustado para tomar en cuenta el nmero
de variables explicativas y el nmero de grados libertad.
En nuestro modelo de regresin curvilneo, P = 2,
puesto que tenemos dos variables independientes
Por consiguiente, para las ventas de rasuradoras, tenemos:
Prueba del Efecto Curvilineal
Al utilizar un modelo de regresin para examinar una relacin
entre dos variables, nos gustara ajustar no slo el modelo
ms preciso, sino tambin el ms sencillo que pueda expresar
dicha relacin.
En consecuencia, resulta importante examinar si existe una
diferencia significativa entre el modelo curvilneo
y el modelo lineal
Estos dos modelos pueden ser comparados mediante la determinacin del efecto de regresin que se tiene al agregar
2
el trmino curvilneo, dado que el trmino lineal ya ha sido incluido, esto es, SSR( X1 / X1 ).
Podemos utilizar la prueba t para el coeficiente de regresin con el fin de determinar
si cada variable particular hace una contribucin significativa al modelo de regresin
De acuerdo con el resultado obtenido con el paquete MINITAB, observamos que
el error estndar de cada coeficiente de regresin y su correspondiente estadstica t
estn disponibles.
Podemos probar la significacin de la contribucin del
efecto curvilneo con las siguientes hiptesis nula y
alternativa:
H0 : El incluir el efecto curvilneo no mejora significativamente el modelo ( ( 11 0) .
H1 : El incluir el efecto curvilneo mejora significativamente el modelo ( 11 0) .
Para nuestros datos:
Si se selecciona un nivel de significacin de 0.05,
encontramos que con doce grados de libertad, los valores
crticos son 2.1788 y +2.1788
Puesto que t = 2.64 > t12 =2.1788, nuestra decisin sera
rechazar H0 y llegar a la conclusin de que el modelo
curvilneo es significativamente mejor que el modelo lineal
en la representacin de la relacin entre las ventas y los
precios.
Prueba del Efecto Lineal
Como en el caso del efecto curvilneo, podemos utilizar la
prueba t para determinar la contribucin del efecto lineal
dado que el efecto curvilneo ya se encuentra incluido en el
modelo.
Para nuestros datos,
Las hiptesis nula y alternativa para probar la contribucin
del efecto lineal al modelo de regresin son:
H 0 : 1' 0 (La inclusin del efecto lineal no mejora el modelo de efecto curvilneo.)
H1 : 1' 0 (La inclusin del efecto lineal mejora el modelo de efecto curvilneo.)
Si se selecciona un nivel de significacin de 0.05,
encontramos que con doce grados de libertad, los valores
crticos son 2.1788 y +2.1788
Modelos de Variables Ficticias
En nuestro anlisis de los modelos de regresin mltiple
efectuada hasta el momento, hemos supuesto que cada
variable explicativa (o independiente) es numrica.
Sin embargo, se tienen muchos casos en los que se necesita
tomar en cuenta variables categricas como parte del proceso
de desarrollo del modelo.
Por ejemplo, si se tiene los resultados de una Encuesta de
satisfaccin de los empleados en una empresa, y utilizamos la
antigedad (en nmero de aos) en la planta de trabajo para
desarrollar un modelo para predecir el ingreso.
Adems, podemos desear tambin incluir el efecto de
factores como el sexo de los trabajadores, si los
individuos participan en decisiones presupuestales, si
toman parte en las decisiones que afectan su trabajo y si
estn orgullosos de estar trabajando para la organizacin.
El uso de variables ficticias es el vehculo que nos
permite tomar en consideracin variables categricas
como parte del modelo de regresin.
Si una variable independiente categrica tiene dos
categoras, entonces solamente se necesitar una
variable ficticia para representar a las dos categoras.
La variable ficticia particular (Xd) se define como:
Examinemos un modelo para predecir el ingreso de los
empleados basndonos en la antigedad en la planta de
trabajo (X1) y si el individuo participa o no en decisiones
presupuestales.
Una variable ficticia correspondiente a la participacin en
decisiones presupuestales (X2) se define como:
Suponiendo que la pendiente entre el ingreso y la
antigedad en la planta de trabajo es la misma para ambos
grupos, el modelo de regresin puede establecerse como:
(1)
Yi ingreso correspondiente al empleado i.
Usando la muestra de 57 empleados cuya ocupacin est
clasificada como tcnica de ventas, se ajust el modelo
establecido en la ecuacin (1).
Los valores de los coeficientes de regresin de muestra
resultantes (b0 , b1 y b2) , de los errores estndar y de t
se resumen en la siguiente tabla:
TABLA: Resumen de los Resultados para el Modelo de
Variable Ficticia
Coeficiente de regresin
Nombre de la variable
Constante
Aos
Participacin
presupuestales
en
Error estndar
13.936
0.7314
3.850
0.1759
3.62
4.16
8.027
3.341
2.40
decisiones
Observe lo siguiente:
1. Manteniendo constante el efecto de si el individuo
participa en decisiones presupuestales, se estima que
cada ao adicional de antigedad en la planta de trabajo
se obtiene en promedio $731.40 en el ingreso del
empleado.
2. b2 mide el efecto sobre el ingreso de haber participado
en decisiones presupuestales (X2 = 1) en comparacin con
no haber participado en tales decisiones (X2 = 0). Por lo
tanto, manteniendo la antigedad en la planta de trabajo
constante, estimamos que un empleado que participa en
decisiones presupuestales tendr, en promedio, un ingreso
de $8,027.00 por encima de alguien que no participa en
dichas decisiones
Utilizando los resultados de la tabla anterior, el modelo para
estos datos puede establecerse como:
Para empleados que no participan
presupuestales el modelo se reduce a:
en
decisiones
puesto que X2 = 0
Para empleados que s
participan en decisiones
presupuestales el modelo se reduce a:
puesto que X2 = 1