32.
Considere un estudio de regresin en el que intervienen una variable dependiente y, u
independiente cuantitativa x1 y una variable cualitativa de dos niveles (nivel 1 y nivel 2).
a. D la ecuacin de regresin mltiple que relaciona x1 y la variable cualitativa
b. Cul es el valor esperado de y que corresponde al nivel 1 de la variable cualit
c. Cul es el valor esperado de y que corresponde al nivel 2 de la variable cualit
d. Interprete los parmetros de la ecuacin de regresin.
A
a. D la ecuacin de regresin mltiple que relaciona x1 y la variable cualitativa
Ecuacin de regresin mltiple
E(y)= Bo+B1x1+B2x2
x2
es:
0 si es nivel 1
1 si es nivel 2
b. Cul es el valor esperado de y que corresponde al nivel 1 de la variable cualit
0 si es nivel 1
nivel 1 de x
E(y)= Bo+B1x1+B2(0)
=
E(y)= Bo+B1x1
c. Cul es el valor esperado de y que corresponde al nivel 2 de la variable cualit
1 si es nivel 2
nivel 2 de x
E(y)= Bo+B1x1+B2(1)
=
E(y)= Bo+B1x1+B2
D
d. Interprete los parmetros de la ecuacin de regresin.
E(y)= Bo+B1x1+B2x2
B1
es la variacion de E(y) por la variacin de una unidad en en x1 cuando x2 per
B2
E(y) nivel 2 - E(y) nivel 1 de las variables cualitativa
una variable dependiente y, una variable
os niveles (nivel 1 y nivel 2).
x1 y la variable cualitativa con y.
nivel 1 de la variable cualitativa?
nivel 2 de la variable cualitativa?
x1 y la variable cualitativa con y.
nivel 1 de la variable cualitativa?
nivel 2 de la variable cualitativa?
unidad en en x1 cuando x2 permanece constante
34. El administrador propuso el siguiente modelo de regresin para predecir las ventas en un
venta de comida rpida.
donde
y=Bo+B1x1+B2x2+B3x3+e
donde:
x1= Nmero de competidores a no ms de una milla
x2=poblacin a no mas de una milla (en miles)
x3= 1 si tiene ventanillas para conductores; 0 si no es asi
y= ventas (miles de $)
Se obtuvo la siguiente ecuacin de regresin estimada con los datos de 20 puntos de venta.
y= 10,1-4,2x1+6,8x2+15,3x3
a. Cul es la cantidad esperada de ventas atribuible a la ventana para conductore
b. Pronostique las ventas de un negocio que tiene dos competidores y una poblaci
a no ms de una milla y ventana para los conductores.
c. Pronostique las ventas de un negocio que tiene un competidor y una poblacin d
ms de una milla y ventana para los conductores.
a. Cul es la cantidad esperada de ventas atribuible a la ventana para conductore
x3= 1 si tiene ventanillas para conductores; 0 si no es asi
(MILES DE s)
y= 10,1-4,2x1+6,8x2+15,3x3
y=
### ventas atribuibles
b. Pronostique las ventas de un negocio que tiene dos competidores y una poblaci
a no ms de una milla y ventana para los conductores.
y= 10,1-4,2(2)+6,8(8)+15,3(0)
y=
y=
56.1
### total de ventas
c. Pronostique las ventas de un negocio que tiene un competidor y una poblacin d
ms de una milla y ventana para los conductores.
y= 10,1-4,2(1)+6,8(3)+15,3(1)
y=
y=
41.6
### ventas que tendra un competidor, poblacion de 3000
para predecir las ventas en un punto de
datos de 20 puntos de venta.
la ventana para conductores?
ompetidores y una poblacin de 8000
mpetidor y una poblacin de 3000 a no
la ventana para conductores?
ompetidores y una poblacin de 8000
mpetidor y una poblacin de 3000 a no
r, poblacion de 3000
40. A continuacin se dan datos para las variables x y y.
xi 22 24 26 28 40
yi 12 21 31 35 70
a. Obtenga una ecuacin de regresin estimada para estos datos.
b. Calcule los residuales eliminados estudentizados de estos datos Empleando co
significancia 0.05, puede clasificarse cualquiera de estas observaciones como o
atpica? Explique.
c. Calcule los valores de influencia de estos datos. Parece haber alguna observa
en estos datos? Explique.
d. Calcule la medida de la distancia de Cook de estos datos. Es alguna de las ob
una observacin influyente? Explique.
A
a. Obtenga una ecuacin de regresin estimada para estos datos.
X1
22
24
26
28
40
Y
12
21
31
35
70
Resumen
Estadsticas de la regresin
Coeficiente de
correlacin mltiple
Coeficiente de
determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.99
0.99
0.98
2.85
5.00
ANLISIS DE VARIANZA
Grados de
libertad
Regresin
Residuos
Total
1
3
4
Coeficientes
Intercepcin
Variable X 1
y=
Suma de
cuadrados
Promedio de los
cuadrados
1934.42
1934.42 238.0336341
24.38 8.126666667
1958.8
Error tpico
Estadstico t
Probabilidad
-53.28 5.786351758 -9.20787436 0.002709275
3.11 0.201577115 15.42833867 0.000591539
-53.28
3.11
b. Calcule los residuales eliminados estudentizados de estos datos Empleando co
significancia 0.05, puede clasificarse cualquiera de estas observaciones como o
atpica? Explique.
Residuales
eliminiados
estudentizados
Observacin
Pronstico para Y
Residuos
Residuos
estndares
15.14
-3.14
-1.27
-1.94
21.36
-0.36
-0.15
-0.12
27.58
3.42
1.39
1.79
33.8
1.20
0.49
0.40
71.12
-1.12
-0.45
-1.90
c. Calcule los valores de influencia de estos datos. Parece haber alguna observa
en estos datos? Explique.
Observacin
Pronstico para Y
Residuos
Residuos
estndares
Influencia hi
15.14
-3.14
-1.27
0.38
21.36
-0.36
-0.15
0.28
27.58
3.42
1.39
0.22
33.8
1.20
0.49
0.20
71.12
-1.12
-0.45
0.92
d. Calcule la medida de la distancia de Cook de estos datos. Es alguna de las ob
una observacin influyente? Explique.
Observacin
Pronstico para Y
Residuos
Residuos
estndares
Distancia de cook
15.14
-3.14
-1.27
0.60
21.36
-0.36
-0.15
0.00
27.58
3.42
1.39
0.26
33.8
1.20
0.49
0.03
71.12
-1.12
-0.45
11.09
estos datos.
e estos datos Empleando como nivel de
stas observaciones como observacin
rece haber alguna observacin influyente
datos. Es alguna de las observaciones
estos datos.
Valor crtico de F
0.000591539
Inferior 95%
Superior 95%
Inferior 95,0%
Superior 95,0%
-71.6947538 -34.8652462 -71.6947538 -34.8652462
2.468491655 3.751508345 2.468491655 3.751508345
e estos datos Empleando como nivel de
stas observaciones como observacin
Con un nivel de significancia 0.05, en la distribucin t para 2
grados de libertad se obtiene, t0.025= 4.3027. Se concluye que la observaci
atpica si el residual eliminado estudentizado es menor a -2.447 o mayor a +
adjunta se observa que los residuales eliminados estudentizados no se encu
por lo tanto se concluye que en este conjunto de datos no hay observaciones
rece haber alguna observacin influyente
Para detectar observaciones influyentes se emplea la regla
hi>3(p+1)/n
p=2
n=5
3(2+1)
1.8
5
Como ninguno de los valores hi es mayor a 1.8, en este conjunto de datos no
detectan observaciones influyentes.
datos. Es alguna de las observaciones
Como regla general se acepta que si Di > 1 la obser
La observacin con mayor influencia es la observacin 5, par
ucin t para 2
Se concluye que la observacin i es una observacin
s menor a -2.447 o mayor a +2. 447. En la tabla
os estudentizados no se encuentran fuera de estos lmites;
de datos no hay observaciones atpicas.
plea la regla
, en este conjunto de datos no se
acepta que si Di > 1 la observacin i es
encia es la observacin 5, para la que Di =11,29
En el ejercicio 5 se presentaron los datos siguientes sobre el ingreso semanal bruto y publicid
tanto en televisin como en peridicos de Showtime Movie Theater.
Weekly Gross
Revenue
($1000s)
96
90
95
92
95
94
94
94
Televison
Advertising
($1000s)
5.0
2.0
4.0
2.5
3.0
3.5
2.5
3.0
Newspaper
Advertising
($1000s)
1.5
2.0
1.5
2.5
3.3
2.3
4.2
2.5
a. D una ecuacin de regresin estimada que relacione el ingreso semanal bruto c
en publicidad en televisin y peridicos.
b. Grafique los residuales estandarizados contra y. Respalda la grfica de residua
acerca de e? Explique.
c. Revise que no haya observaciones atpicas en estos datos. A qu conclusin lle
d. Hay alguna observacin influyente?
a. D una ecuacin de regresin estimada que relacione el ingreso semanal bruto c
en publicidad en televisin y peridicos.
Estadsticas de la regresin
Coeficiente de
correlacin mltiple
Coeficiente de
determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.9586634444
0.9190355997
0.8866498396
0.6425873026
8
ANLISIS DE VARIANZA
Grados de libertad
Regresin
Suma de cuadrados
23.4354077925
Promedio de los cuadrados
11.7177038962
Residuos
Total
5
7
2.0645922075
25.5
83.2300916901
2.2901836209
1.3009890983
1.5738689517
0.3040645561
0.320701597
Coeficientes
Intercepcin
Variable X 1
Variable X 2
Error tpico
0.4129184415
Estadstico t
52.8824789371
7.5318993132
4.0566966621
Ecuacin de regresin estimada: Ingreso=83,23+2,29 publicidad televis
b. Grafique los residuales estandarizados contra y. Respalda la grfica de residua
acerca de e? Explique.
Anlisis de los residuales
Observacin
Pronstico para Y
Residuos
Residuos estndares
96.6324934421
-0.6324934421
-1.1646298178
90.4124371285
-0.4124371285
-0.7594332934
94.3423098212
0.6576901788
1.2110253516
92.2080234881
-0.2080234881
-0.383040109
94.3939065771
0.6060934229
1.1160186424
94.2380092893
-0.2380092893
-0.4382538961
94.4197049551
-0.4197049551
-0.7728157683
93.3531152985
0.6468847015
1.1911288905
RESIDUAL ESTANDARIZADO
1.5
1
0.5
0
90
-0.5
-1
-1.5
-2
91
92
93
94
95
96
97
c. Revise que no haya observaciones atpicas en estos datos. A qu conclusin lle
residual studentizado
suprimido
Observacin
1
-2.11
-1.1
1.31
-0.33
1.13
-0.36
-1.16
1.1
Con un nivel de significancia 0.05, en la d
grados de libertad se obtiene, t0.025= 2.
atpica si el residual eliminado estudentiz
adjunta se observa que los residuales elim
por lo tanto se concluye que en este conju
D
Observacin
hi
Di
0.63
1.52
0.65
0.7
0.3
0.22
0.23
0.01
0.26
0.14
0.14
0.01
0.66
0.81
0.13
0.06
ingreso semanal bruto y publicidad
ne el ingreso semanal bruto con los gastos
espalda la grfica de residuales las suposiciones
datos. A qu conclusin llega?
ne el ingreso semanal bruto con los gastos
Valor crtico de F
28.37776839 0.001865242
Probabilidad
Inferior 95%
Superior 95%
Inferior 95,0%
Superior 95,0%
4.5717E-008 79.18433275 87.27585063 79.18433275 87.27585063
0.000653232 1.508560796 3.071806446 1.508560796 3.071806446
0.009760798 0.476599398 2.125378798 0.476599398 2.125378798
3,23+2,29 publicidad televisin + 1,30 publicidad peridico
espalda la grfica de residuales las suposiciones
RESIDUAL
ESTANDARIZADO
-1.62
-1.08
1.22
-0.37
1.1
-0.4
-1.12
1.08
El tamao de las observaciones es un limitante para
identificar observaciones atpicas.
no se puede demostrar que el trmino del error est distribuido n
la distribucin de la grfica grfica presenta una tendencia cnc
95
96
97
datos. A qu conclusin llega?
vel de significancia 0.05, en la distribucin t para 4
e libertad se obtiene, t0.025= 2.7765. Se concluye que la observacin i es una observacin
el residual eliminado estudentizado es menor a -2.7765o mayor a +2. 7765. En la tabla
e observa que los residuales eliminados estudentizados no se encuentran fuera de estos lmites;
to se concluye que en este conjunto de datos no hay observaciones atpicas.
Para detectar observaciones influyentes se emplea la regla
hi>3(p+1)/n
p=2
n=8
3(2+1)
1.125
8
Como ninguno de los valores hi es mayor a 1.8, en este conjunto de datos no se
detectan observaciones influyentes.
Como regla general se acepta que si Di > 1 la observacin i es
La observacin con mayor influencia es la observacin 1, para la que Di =1,52
es un limitante para
rmino del error est distribuido normalmente.
ca presenta una tendencia cncava y convexa
i es una observacin
7765. En la tabla
ran fuera de estos lmites;
unto de datos no se
es
ra la que Di =1,52