Las ventas de una importante tienda departamental se ha incrementado durante los
últimos 12 años conforme la cadena ha expandido el número de tiendas abiertas. El
nuevo director de planeación necesita desarrollar un enfoque sistemático para seleccionar
nuevas localidades que permitan que la cadena de ropa tome decisiones para abrir otras
tiendas. El director cree que el tamaño de la tienda contribuye significativamente a su
éxito y desea considerar esta relación en el proceso de toma de decisiones.
A) Haga el diagrama de dispersión.
B) Determine la ecuación de regresión lineal que le permita pronosticar las ventas anuales
para todas las tiendas nuevas
C) Determine el importe de las ventas anuales si el tamaño de la tienda es de 6,000 pies
cuadrados
D) Calcule el coeficiente de determinación.Interprete el resultado.
Ventas anuales ( en millone
14
12
10
8
Ventas
6
4
2
0
0 1 2 3
Tamaño de la ti
Ventas
Pies anuales
Tienda cuadrados ( en Resumen
1 (000)
1.7 X millones
3.7 de
2 1.6 dólares
3.9 Y Estadísticas de la regresión
3 2.8 6.7 Coeficiente de correlación múltiple 0.950883275
4 5.6 9.5 Coeficiente de determinación R^2 0.904179003
5 1.3 3.4 R^2 ajustado 0.89619392
6 2.2 5.6 Error típico 0.966379679
7 1.3 3.7 Observaciones 14
8 1.1 2.7
9 3.2 5.5
ANÁLISIS DE VARIANZA
10 1.5 2.9 Grados de libertad
11 5.2 10.7 Regresión 1
12 4.6 7.6 Residuos 12
13 5.8 11.8 Total 13
14 3 4.1
Coeficientes
Intercepción (a) 0.964473659
Pies cuadrados (000) X (b) 1.669862317
anuales ( en millones de dólares Y
Análisis de los residuales
Observación
Pronóstico Ventas anuales ( en millones de dóla
1 3.803239598
2 3.636253367
3 5.640088147
1 2 3 4 5 6 7 4 10.31570263
Tamaño de la tienda 5 3.135294672
6 4.638170757
7 3.135294672
8 2.801322208
9 6.308033074
10 3.469267135
11 9.647757708
12 8.645840318
13 10.6496751
14 5.974060611
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
105.7476095 105.7476095 113.233512802 1.82269E-07
11.20667621 0.933889684
116.9542857
Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
0.526193302 1.832926522 0.09172683168 -0.18200306 2.110950377 -0.18200306 2.110950377
0.156925375 10.64112366 1.8226903E-07 1.327951298 2.011773337 1.327951298 2.011773337
b) y=0.964473659+1.669862317x
Residuos
-0.1032396 c)
0.263746633 x 6 En miles
1.059911853 y 10.98364756
-0.81570263
0.264705328 d) r^2 90.42%
0.961829243
0.564705328 Las ventas anuales dependen de el tamaño de la tienda en un 90.42%
-0.10132221
-0.80803307
-0.56926714
1.052242292
-1.04584032
1.150324902
-1.87406061
Pies cuadrados (000) X Curva de re-
gresión ajustada
Ventas anuales ( en millones de
15
Ventas anuales ( en millones
10 de dólares Y
dólares Y
Pronóstico Ventas anuales
5 ( en millones de dólares Y
0
0 1 2 3 4 5 6 7
Pies cuadrados (000) X
perior 95.0%
de la tienda en un 90.42%
Las siguientes son las calificaciones de un grupo de 9 estudiantes en un examen parcial y en el examen final
A) Elabore el diagrama de dispersión
Examen Parcial (X) Nota final (Y) B) Estime la recta de regresión lineal
1 77 82 C) Calcule la calificación final de un estudian
2 50 66 D) Calcule el coeficiente de determinación. I
3 71 78
4 72 34
5 81 47 Nota final (Y)
6 94 85 120
7 96 99 100
8 99 99
80
Nota Final
9 67 68
60
40
20
0
40 50 60 70 80
Parcial
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.561005514
Coeficiente de determinación R^2 0.314727186
R^2 ajustado 0.21683107
Error típico 19.47153771
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 1 1218.903423 1218.903423 3.21490983
Residuos 7 2653.985466 379.1407808
Total 8 3872.888889
Coeficientes Error típico Estadístico t Probabilidad
Intercepción (a) 12.06232107 34.66119872 0.34800646 0.738065787
Parcial (X) (b) 0.777141599 0.433426797 1.793016963 0.116064369
b) 12.0623+0.777x
c) x 85
y 78.11935697 Nota Final
d) r^2 31.47%
La calificacion final depende de la nota del parcial en un 31%
amen final
grama de dispersión
a de regresión lineal
ficación final de un estudiante que obtuvo 85 en el examen parcial
eficiente de determinación. Interprete su resultado
Nota final (Y)
0 60 70 80 90 100 110
Parcial
Valor crítico de F
0.116064369
Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
-69.89839 94.02303215 -69.89839 94.02303215
-0.24774992 1.802033114 -0.24774992 1.802033114
arcial en un 31%
Se realizó un estudio sobre la cantidad de azúcar convertida, en cierto proceso, a distintas temperaturas. Los datos se cod
Temperatura Azúcar
Dato
convertida
1 1 8.1
2 1.1 7.8
3 1.2 8.5
4 1.3 9.8
5 1.4 9.5
6 1.5 8.9
7 1.6 8.6
8 1.7 10.2
9 1.8 9.3
10 1.9 9.2
11 2 10.5
A) Elabore el diagrama de dispersión
B) Estime la recta de regresión lineal
C) Calcule la cantidad media de azúcar convertida que se produce cuando la temperatura registrada es 1.75
D) Calcule el coeficiente de determinación. Interprete su resultado
Azúcar convertida
12
10
Azúcar Convertida
0
0.8 1 1.2 1.4 1.6 1.8 2 2.2
Temperatura
as temperaturas. Los datos se codificaron y se registraron como sigue :
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.707026444
Coeficiente de determinación R^2 0.499886392
R^2 ajustado 0.444318214
Error típico 0.632607239
Observaciones 11
ANÁLISIS DE VARIANZA
Grados de libertad
ra registrada es 1.75 Regresión 1
Residuos 9
Total 10
Coeficientes
Intercepción (a) 6.413636364
Temperatura (b) 1.809090909
b)
c)
d)
2.2
La cantidad de azucar final
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
3.600090909 3.600090909 8.995911053 0.014972903
3.601727273 0.400191919
7.201818182
Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
0.924638018 6.936375361 6.7865E-05 4.321959849 8.505312878 4.321959849 8.505312878
0.603167336 2.999318431 0.014972903 0.444631599 3.173550219 0.444631599 3.173550219
6.41363636+1.80909091x
x 1.75
y 9.579545455 Cantidad de examen
r^2 49.99%
cantidad de azucar final depende de un 49.99 de la temperatura
perior 95.0%
El profesor Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes de su muerte, escribió
casi 500 libros durante una carrera de 40 años. De hecho, cuando su carrera avanzaba, fue incluso más
productivo en términos del número de libros escritos en un periodo determinado. Los datos siguientes dan el
tiempo, en meses, necesario para escribir sus libros en incrementos de 100
Numero de Tiempo en
libros X meses Y
237 100
350 200
419 300
465 400
507 500
a. Realice la gráfica de dispersión.
b. Indique la recta de regresión respectiva.
c. Estime el tiempo transcurrido en meses, cuando escribió 250 libros.
d. Calcule el coeficiente de determinación. Interprete sus resultados
Tiempo en meses Y
600
500
400
Número de libros
300
200
100
0
200 250 300 350 400 450 500 550
Tiempo en meses
muerte, escribió
ncluso más
guientes dan el
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.976338246
Coeficiente de determinación R^2 0.953236371
R^2 ajustado 0.937648495
Error típico 39.48148466
Observaciones 5
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 1 95323.63711 95323.63711 61.15242077
Residuos 3 4676.362893 1558.787631
Total 4 100000
Coeficientes Error típico Estadístico t Probabilidad
Intercepción (a) -275.725662 75.70987455 -3.64187186 0.035694898
Numero de libros X (b) 1.455322704 0.186102616 7.820001328 0.004353683
b) -274.270327
c) x 250
y 88.10501431
d) r^2 95.32%
El tiempo en meses para leer los libros depende un 95.32%
Valor crítico de F
0.004353683
Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
-516.668272 -34.7830511 -516.668272 -34.7830511
0.863061121 2.047584286 0.863061121 2.047584286
os libros depende un 95.32% de la cantidad de libros
Con el uso de un procedimiento químico llamado polarografía diferencial de pulsos, un químico midió la máxima
corriente generada (en microamperes) cuando una solución que contenía una cantidad determinada de níquel
(en part4es por mil millones, ppmm) se agregó a un regulador.
Y=corriente
X=Ni (ppmm) máxima
19.1 0.095
38.2 0.174
57.3 0.256
76.2 0.348
95 0.429
114 0.5
131 0.58
150 0.651
170 0.722
a. Realice la gráfica de dispersión.
b. Indique la recta de regresión respectiva.
c. Estime la corriente máxima, si el Ni = 148 ppmm.
d. Calcule el coeficiente de determinación. Interprete sus resultados.
Y=corriente máxima
0.8
0.7
0.6
Corriente máxima
0.5
0.4
0.3
0.2
0.1
0
0 20 40 60 80 100 120 140 160 180
Ni (ppmm)
co midió la máxima
minada de níquel
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.999344581
Coeficiente de determinación R^2 0.998689591
R^2 ajustado 0.998502389
Error típico 0.008376312
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 1 0.374306417 0.374306417 5334.842832
Residuos 7 0.000491138 7.01626E-05
Total 8 0.374797556
Coeficientes Error típico Estadístico t Probabilidad
Intercepción (a) 0.018749024 0.006128526 3.059303666 0.018341398
X=Ni (ppmm) (b) 0.004215161 5.77103E-05 73.04000843 2.3718E-11
b) 0.01874902+0.00421516x
c) x 148
y 0.642592818
d) r^2 99.87%
La corriente máxima depende un 99.87% de los Ni (ppm
Valor crítico de F
2.3718E-11
Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
0.004257361 0.033240686 0.004257361 0.033240686
0.004078698 0.004351624 0.004078698 0.004351624
un 99.87% de los Ni (ppmm)
Suponga que deseamos determinar, con un nivel de significancia del 5%, si las opiniones de los votantes
residentes del Edo. De Illinois con respecto a una nueva reforma de impuestos son independientes de sus
ingresos. Una muestra aleatoria de 1000 votantes se clasifica de acuerdo con su posición en las categorías de
ingreso bajo, medio y alto, y si están a favor o no de la nueva reforma de impuestos. A continuación se da la
tabla de contingencia :
Reforma de (fo- (fo-
Nivel Bajo fe Nivel Medio fe fe
impuestos fe)^2/fe fe)^2/fe Nivel Alto
A favor 182 200.928 1.783072 213 209.898 0.045843 203 187.174
En contra 154 135.072 2.652431 138 141.102 0.068195 110 125.826
TOTAL 336 336 4.435504 351 351 0.114038 313 313
Paso 1. Hipotesis
Ho: el nivel socioeconómico es independiente de la postura
HA: no son independientes
Paso 2. Estadístico
fe= (total de la columna)(total del renglón)/ gran total χ2=∑i(fo−fe)2/fe
X^2o= 7.878211595
Paso 3. Valor critico
Fórmula a usar: INV.CHICUAD.CD(alfa,v)
renglones r 2 v (r-1)(c-1)= 2
Columnas c 3
valor crítico 5.991464547
Paso 4. Region de rechazo
7.87
se rechaza Ho
5.88
Paso 5. Conclusión
Se rechaza Ho, la postura y el nivel socioeconómico no son independientes, con alfa de 0.05
(fo-fe)^2/
fe TOTAL
1.3381254 598
1.9905447 402
3.32867 1000
Durante la guerra de Vietnam se instituyó un sistema de lotería para seleccionar a los varones que serían
reclutados para la milicia. Los números que representaban días del año eran seleccionados “aleatoriamente”; los
hombres nacidos en días del año con números bajos eran reclutados primero; los que tenían números altos no
eran reclutados. A continuación se muestra cuántos números bajos (1-122), intermedios (123-244) y altos (245-
366 ) eran sacados para fechas de nacimiento en cada trimestre del año :
Conjunto de fe (fo-fe)^2/fe fe (fo-fe)^2/fe
Ene-mar Abr-jun Jul-sept
números
Bajos 21 30.33333333 2.871794872 28 30.33333333 0.179487179 35
Medios 34 30.33333333 0.443223443 22 30.33333333 2.289377289 29
Altos 36 30.33333333 1.058608059 41 30.33333333 3.750915751 28
Total 91 91 4.373626374 91 91 6.21978022 92
¿Existe evidencia de que los números seleccionados estuvieran significativamente relacionados con la época del año? Utilice
Paso 1. Hipótesis
Ho: los número y los cuatrimestres son independientes
HA: no son independientes
Paso 2. Estadistico de prueba
fe= (total de la columna)(total del renglón)/ gran total χ2=∑i(fo−fe)2/fe
X^2o= 20.68036312
Paso 3. Valor critico
Fórmula a usar: INV.CHICUAD.CD(alfa,v)
renglones r 3 v 6
Columnas c 4 Alfa 0.05
VC 12.59158724
Paso 4. Región de rechazo
20.68
12.59
Paso 5. Conclusión
Se rechaza Ho, los numeros y cuatrimestres no son idependientes, con alfa de 0.05
fe (fo-fe)^2/fe Oct-dic fe (fo-fe)^2/fe Total
30.66666667 0.612318841 38 30.66666667 1.753623188 122
30.66666667 0.09057971 37 30.66666667 1.307971014 122
30.66666667 0.231884058 17 30.66666667 6.09057971 122
92 0.934782609 92 92 9.152173913 366
a época del año? Utilice alfa de .05
El USA Today reportó acerca de cuándo se toma la decisión de lo que se habrá de comer en la
cena. Suponga que los resultados se basaron en una encuesta que se aplicó a 1,000 personas, en
las que se consideró si la familia incluye a hijos menores de 18 años de edad. Los resultados se
clasificaron en la siguiente tabla :
Cuándo se Dos o más
Adulto sin fe (fo-fe)^2/fe Adulto con fe (fo-fe)^2/fe
toma la adultos sin
niños niños
decisión niños
Antes de
162 125.43 10.66224109 54 105.82 25.37622756 154
cenar
En la tarde 73 61.02 2.352022288 38 51.48 3.52972805 69
En la
59 57.63 0.032568107 58 48.62 1.809633896 53
mañana
Unos días
21 44.07 12.07680735 64 37.18 19.34675632 45
antes
La noche
15 37.29 13.32378922 50 31.46 10.92598856 45
anterior
Siempre
comen lo
2 6.78 3.369970501 16 5.72 18.47524476 2
mismo esa
noche
No están
7 6.78 0.007138643 6 5.72 0.013706294 7
seguros
Total 339 339 41.8245372 286 286 79.47728543 375
En un nivel de significancia de .05, ¿existe evidencia de la relación significativa entre el momento en que se toma la decisión d
Paso 1. Hipótesis
Ho: el tipo de familia y la hora en la que se toma la decisión son independientes
HA: el tipo de familia y la hora no son independientes
Paso 2. Estadistico de prueba
fe= (total de la columna)(total del renglón)/ gran total χ2=∑i(fo−fe)2/fe
X^2o= 129.5200645
Paso 3. Valor critico
Fórmula a usar: INV.CHICUAD.CD(alfa,v)
renglones r 7 v 12
Columnas c 3 Alfa 0.05
VC 21.02606982
Paso 4. Región de rechazo
129.52
Se rechaza Ho
21.02
Paso 5. Conclusión
Se rechaza Ho, el tipo de familia y la hora en la que se toma la decision no son independientes, con alfa de 0.05
fe (fo-fe)^2/fe Total
138.75 1.676126126 370
67.5 0.033333333 180
63.75 1.812745098 170
48.75 0.288461538 130
41.25 0.340909091 110
7.5 4.033333333 20
7.5 0.033333333 20
375 8.218241854 1000
ue se toma la decisión de lo que se va a cenar y el tipo de familia?
Una gran corporación está interesada en determinar si existe relación entre el tiempo de traslado
de sus empleados y el nivel de problemas relacionados con el nivel de estrés observados en el
trabajo. Un estudio de 116 trabajadores de la línea de ensamblaje revela lo siguiente :
Tiempo de Bajo
Alto fe (fo-fe)^2/fe Moderado fe (fo-fe)^2/fe
traslado
Menos 15
9 12.13793103 0.811226489 5 5.24137931 0.011116152 18
min
De 15 a 45
17 20.10344828 0.479091501 8 8.681034483 0.05342773 28
min
Más de 45
18 11.75862069 3.312872889 6 5.077586207 0.167569229 7
min
Total 44 44 4.603190879 19 19 0.232113111 53
En un nivel de significancia de .01, ¿existe evidencia de una relación significativa entre el tiempo de traslado y el nivel de estré
Paso 1. Hipótesis
Ho: el tiempo de traslado y el nivel de estrés son independientes
HA: el tiempo de traslado y el nivel de estrés no son independientes.
Paso 2. Estadistico de prueba
fe= (total de la columna)(total del renglón)/ gran total χ2=∑i(fo−fe)2/fe
X^2o= 9.831141104
Paso 3. Valor critico
Fórmula a usar: INV.CHICUAD.CD(alfa,v)
renglones r 3 v 4
Columnas c 3 Alfa 0.01
VC 13.27670414
Paso 4. Región de rechazo
9.83 13.27
No se rechaza Ho
Paso 5. Conclusión
No see rechaza Ho, el tiempo de traslado y el nivel de estrés son independientes, con alfa de 0.01
fe (fo-fe)^2/fe Total
14.62068966 0.781067014 32
24.21551724 0.591451738 53
14.1637931 3.623318362 31
53 4.995837113 116
aslado y el nivel de estrés?