0% encontró este documento útil (0 votos)
903 vistas31 páginas

Modulo 3 Modelos

Este documento presenta los resultados de un laboratorio de estadística aplicada sobre modelos de sacos de dormir fabricados por Bergans. Se analizan los datos de temperatura y precio de 11 modelos usando un diagrama de dispersión, regresión lineal y intervalos de confianza. Los resultados muestran que a medida que aumenta la temperatura, el precio tiende a disminuir. Adicionalmente, se estima el precio para sacos con temperaturas de 20°F y 30°F, y se prueba la normalidad de los errores.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
903 vistas31 páginas

Modulo 3 Modelos

Este documento presenta los resultados de un laboratorio de estadística aplicada sobre modelos de sacos de dormir fabricados por Bergans. Se analizan los datos de temperatura y precio de 11 modelos usando un diagrama de dispersión, regresión lineal y intervalos de confianza. Los resultados muestran que a medida que aumenta la temperatura, el precio tiende a disminuir. Adicionalmente, se estima el precio para sacos con temperaturas de 20°F y 30°F, y se prueba la normalidad de los errores.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

“Año del Bicentenario del Perú: 200 años de Independencia”

FACULTAD DE CIENCIAS AGRARIAS


ESCUELA DE AGROINDUSTRIAS

“LABORATORIO DE III UNIDAD”

Asignatura
Modelos estadísticos para ingeniería

Docente
Mg. Estad. Juan S. Blas Pérez

Alumno
Marlon Anderson Bellota Zárate

Ciclo
VII

Semestre
2021-I

TUMBES – PERÚ
2021
“Año del Bicentenario del Perú: 200 años de Independencia”

LABORATORIO DE ESTADISTICA APLICADA III UNIDAD

1) Bergans of Norway ha estado fabricando equipo para excursionismo desde 1908. En los datos
que se presentan en la tabla siguiente se da la temperatura (°F) y el precio ($) de 11 modelos
de sacos de dormir fabricados por Bergans (Backpacker 2006 Gear Guide)

a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente sea la
temperatura (°F).

DIAGRAMA DE DISPERSION

450

y = -5.2772x + 359.27
400
R² = 0.8043
350

300
Precio en $

250

200

150

100

50

0
0 5 10 15 20 25 30 35 40 45 50
Temperatura en ºF

b) ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre temperatura
y precio?
Su línea de tendencia es con pendiente negativa; conforme aumenta la temperatura, el precio
tiende a bajar.
“Año del Bicentenario del Perú: 200 años de Independencia”

c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada. d.


Prediga cuál será el precio de un saco de dormir si el índice de temperatura (°F) es 20.

x y x2 Y2 xy
12 319 144 101761 3828
24 289 576 83521 6936
3 389 9 151321 1167
13 239 169 57121 3107
38 149 1444 22201 5662
4 289 16 83521 1156
5 359 25 128881 1795
15 259 225 67081 3885
25 229 625 52441 5725
45 129 2025 16641 5805
25 199 625 39601 4975
x =209 y =2849  =5883  = 804091 xy =44041

X =
X =
209
= 19
n 11

Y=
Y =
2849
= 259
n 11
n X .Y −  X  Y 11 44041 − 209  2849
b= = = -5.2772
n X − (  X ) 11 5883 − ( 209 )
2 2 2

a = Y − b X → a = 259 − ( -5.2772 )  19
a = 259 − ( -5.2772 )  19 = 359.27
La ecuación sería :
Y = -5.2772 X + 359.27

De acuerdo a los resultados de los datos que se presentan en la tabla siguiente se da la


temperatura (°F) y el precio ($) de 11 modelos de sacos de dormir fabricados por Bergans
(Backpacker 2006 Gear Guide) disminuirán en 5.2772 ºF

Y = -5.2772 X + 359.27
Y = -5.2772  20 + 359.27
Y = 253.726
Si el índice de temperatura (  F ) es 20,
entonces el precio del saco de dormir sería $253.726

d) Dé una estimación puntual del precio de un saco de dormir cuya temperatura sea 30.
Y = -5.2772 X + 359.27
Y = -5.2772  30 + 359.27
Y = 200.954
si el índice de temperatura (  F ) es 30,
entonces el precio del saco de dormir sería $200.954
“Año del Bicentenario del Perú: 200 años de Independencia”

e) Dé un intervalo de 95% de confianza para el precio medio de todos los sacos de dormir cuya
temperatura sea 30. c. Suponga que Bergans elabora un nuevo modelo cuya temperatura
es 30. Dé un intervalo de predicción de 95% para el precio de este nuevo modelo.

Yˆ (Y − Yˆ )
2
X Y
12 319 295.94 531.75
24 289 232.61 3179.38
3 389 343.44 2076.16
13 239 290.66 2669.08
38 149 158.73 94.74
4 289 338.16 2416.50
5 359 332.88 682.22
15 259 280.11 445.58
25 229 227.34 2.77
45 129 121.79 51.94
25 199 227.34 802.98

(Y − Yˆ ) = 12953.09
2

( X − X )
2

SYX =
n−2
12953.09
SYX = = 37.937208
(Y − Y )
9 2
1
IC1− = Yˆ  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

X = 30º F
X = 19º F
Yˆ = 200.950837
S XY = 37.937208
n = 11
t 0.95 = 2.262
1− ;9
2

1 ( 30 − 19 )
2

IC95% = 200.950837  t 0.95  S XY +


1− ;9 11 12953.09
2

1 ( 30 − 19 )
2

IC95% = 200.95  2.262  37.94 +


11 12953.09
IC95% = 200.95  27.17
173.78
IC95% 
228.12

f) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera

JARQUE BERA

H0: La distribución de los errores de los datos se aproxima a una normal


H1: La distribución de los errores de los datos no se aproxima a una normal
“Año del Bicentenario del Perú: 200 años de Independencia”

α = 0.05

t = 11
2 2
 3 2   
( ) ( )
3 2
 
   Y − Yˆ
     Y − Yˆ
 − 3 = 8.999983953

A2 =     = 9.53228  10−9
( − ) = 
2
B 3 
( ) ( )
2 3 2 3
     
     
Y − Yˆ Y − Yˆ
   
 A2 ( K − 3 ) 2 
JB = t.  + 
 6 24 
 9.53228  10 ( 8.999983953)2 
JB = 11  +  = 4.125
 6 24 

 2
Tab =  2
1−0.05; 9 =18.31

Como
 Tab
2
 JBCalc
Se acepta la H0 Por lo tanto La distribución de los errores de los datos se aproximaa
distribución normal
“Año del Bicentenario del Perú: 200 años de Independencia”

2) Aunque actualmente en los aeropuertos grandes los retrasos son menos frecuentes, es útil saber
en qué aeropuertos es más probable que le echen a perder a uno sus planes. Además, si su vuelo
llega con retraso a un determinado aeropuerto en el que tiene que hacer un trasbordo, ¿cuál es la
probabilidad de que se retrase la salida y que pueda hacer así el trasbordo? En la tabla siguiente
se muestra el porcentaje de llegadas y salidas retrasadas durante el mes de agosto en 13
aeropuertos (Business 2.0, febrero 2002).

a) Trace un diagrama de dispersión con estos datos, en el que la variable independiente sean las
llegadas retrasadas.

Diagrama de dispersión
31

29 y = 0.8554x + 2.4208
R² = 0.804
27

25

23

21

19

17

15
15 17 19 21 23 25 27 29 31

b) ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre llegadas
retrasadas y salidas retrasadas?
Su línea de tendencia es con pendiente positiva, a medida que aumenta las llegadas retrasadas
también aumenta las salidas retrasadas.
“Año del Bicentenario del Perú: 200 años de Independencia”

c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada.

X Y x2 Y2 XY
24 22 576 484 528
20 20 400 400 400
30 29 900 841 870
20 19 400 361 380
20 22 400 484 440
23 23 529 529 529
18 19 324 361 342
20 16 400 256 320
18 18 324 324 324
21 22 441 484 462
25 22 625 484 550
18 17 324 289 306
16 16 256 256 256
x = 273 y =265 x2 =5899 y2 =5553 xy=5707

X =
X 273
= = 21
n 13

Y=
 Y = 265 = 20.38
n 13
n X .Y −  X  Y 13  5707 − 273  265
b= = = 0.8554
n X 2 − (  X ) 13  5899 − ( 273)
2 2

a = Y − b X → a = 20.38 − 0.8554  21
a = 2.4208
La ecuación sería :
Y = 0.8554X + 2.4208

d) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera

JARQUE BERA

H0: La distribución de los errores de los datos se aproxima a una normal


H1: La distribución de los errores de los datos no se aproxima a una normal

α = 0.05
“Año del Bicentenario del Perú: 200 años de Independencia”

X Y y'=a+bx (y-y')2 (y-y')3 (y-y')4


24 22 22.95 0.904 -0.85976101 0.81752994
20 20 19.53 0.222 0.10435825 0.04913252
30 29 28.08 0.840 0.77005996 0.70582882
20 19 19.53 0.280 -0.14819856 0.07842575
20 22 19.53 6.105 15.0839853 37.269606
23 23 22.10 0.818 0.74009099 0.66944283
18 19 17.82 1.396 1.64993266 1.9496424
20 16 19.53 12.455 -43.9568421 155.13221
18 18 17.82 0.033 0.00599382 0.00108878
21 22 20.38 2.609 4.21529358 6.8093204
25 22 23.81 3.263 -5.89347144 10.64539
18 17 17.82 0.670 -0.54804696 0.44849441
16 16 16.11 0.012 -0.00124254 0.00013358
(y-y')2=28.926 (y-y')2=-28.289 (y-y')4=214.128

n = 13
2 2
 3 2   
  ( Y − Yˆ ) 
    Y − (Yˆ
4
) 
A2 =     = 0.001093 K − 3 2 = 
( ) − 3 = 8.998
( ) ( )
3 4
 Y − Yˆ    Y − Yˆ  
 
2 2

       
 A2 ( K − 3 ) 2 
JB = n.  + 
 6 24 
 0.001093 ( 8.998 )2 
JB = 13   +  = 4.876
 6 24 

 2
Tab =  2
1−0.05; 11= 4.575

Como
 Tab
2
<JBCalc
Se rechaza la H0 Por lo tanto La distribución de los errores de los datos no se
aproxima a la distribución normal

e) ¿Cómo se debe interpretar la pendiente de la ecuación de regresión estimada?

De acuerdo a los resultados, los porcentajes de llegadas retrasadas se verán incrementados


en 0.8554
“Año del Bicentenario del Perú: 200 años de Independencia”

f) Suponga que en el aeropuerto de Filadelfia hubo 22% de llegadas retrasadas. ¿Cuál es el


porcentaje estimado de salidas retrasadas?

Y = 0.8554X + 2.4208
Y = 0.8554 ( 22 ) + 2.4208
Y = 0.8554 ( 22 ) + 2.4208
Y = 21.2396%

3. En los datos siguientes, y corresponde a los salarios mensuales y x es el promedio obtenido por los
estudiantes que terminaron la licenciatura de administración con especialidad en sistemas de
información. La ecuación de regresión estimada obtenida con estos datos es:
yˆ = 1790.5 + 581.1x

a) Calcule SCE, STC y SCR.

X Y y' SCE=(y-y')2 SCR=(Y'-y)2 SCT=(Y-y)2


2.6 3300 3301.35 1.83 121555.88 122500.00
3.4 3600 3766.22 27627.83 13506.21 2500.00
3.6 4000 3882.43 13822.13 54024.84 122500.00
3.2 3500 3650.00 22500.00 0.00 22500.00
3.5 3900 3824.32 5726.81 30388.97 62500.00
2.9 3600 3475.68 15456.54 30388.97 2500.00
19.2 21900 21900.00 85135.14 249864.86 335000.00
3.20 3650.00

b) Calcule el coeficiente de determinación r2 . Haga un comentario sobre la bondad del ajuste.

SCR
r2 =
SCT
249864.86
r2 =
335000.00
r = 0.746
2

0.746*100%=74.6% de la variabilidad en los promedios se explica por la asociación con los


salarios. Quedan 25.4% de variabilidad en los salarios que no se explica en la regresión

c) Calcule el coeficiente de correlación muestral.


r 2 = 0.746
r = 0.746 = 0.8636
“Año del Bicentenario del Perú: 200 años de Independencia”

d) Dé un intervalo de 95% de confianza para el salario medio inicial de todos los estudiantes cuyo
promedio fue 3.0.

(Y − Y )
2
X Y Y
2.6 3300 3650 122500
3.4 3600 3650 2500
3.6 4000 3650 122500
3.2 3500 3650 22500
3.5 3900 3650 62500
2.9 3600 3650 2500
( )
2
 Y −Y =335000

(X − X )
2
1
IC1− = Y  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Y = 3650

 (Y − Y )
2

SYX =
n−2
85135.14
SYX = = 46.1929
4
n=6
t 0.95 = 2.776
1− ;4
2

1 ( 3 − 3.2 )
2

IC95% = 3650  2.776  46.1929 +


6 85135.14
1 ( 30 − 19 )
2

IC95% = 3650  2.262  37.94 +


11 12953.09
IC95% = 3650  52.35
3597.65
IC95% 
3702.35

e) Dé un intervalo de 95% de predicción para el salario medio inicial de Joe Heller cuyo promedio
fue 3.0.

(Y − Yˆ )
2
X Y Yˆ
2.6 3300 3301.35 1.83
3.4 3600 3766.22 27627.83
3.6 4000 3882.43 13822.13
3.2 3500 3650.00 22500.00
3.5 3900 3824.32 5726.81
2.9 3600 3475.68 15456.54
( )
2
 Y − Yˆ =85135.14
“Año del Bicentenario del Perú: 200 años de Independencia”

(X − X )
2
1
IC1− = Yˆ  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Yˆ =1790.5 + 581.1x
Yˆ = 1790.5 + 581.1 3 = 3533.8

 (Y − Y )
2

SYX =
n−2
85135.14
SYX = = 46.1929
4
n=6
t 0.95 = 2.776
1− ;4
2

1 ( 3 − 3.2 )
2

IC95% = 3533.8  2.776  46.1929 +


6 85135.14
1 ( 30 − 19 )
2

IC95% = 3533.8  2.262  37.94 +


11 12953.09
IC95% = 3533.8  52.35
3481.45
IC95% 
3586.15

4. Consumer Reports publica pruebas y evaluaciones sobre televisores de alta definición. Para cada
modelo se elaboró una evaluación general basada principalmente en la calidad de la imagen. Una
evaluación más alta indica un mejor funcionamiento. En los datos siguientes se dan evaluación
general y precio de televisores de plasma de 45 pulgadas (Consumer Reports, marzo 2006).

a) Use estos datos para obtener una ecuación de regresión estimada que pueda emplearse
para estimar el precio en la evaluación general de una puntuación de 42
“Año del Bicentenario del Perú: 200 años de Independencia”

X Y XY
62 2800 3844 7840000 173600
53 2800 2809 7840000 148400
44 2700 1936 7290000 118800
50 3500 2500 12250000 175000
54 3300 2916 10890000 178200
39 2000 1521 4000000 78000
66 4000 4356 16000000 264000
55 3000 3025 9000000 165000
34 2500 1156 6250000 85000
39 3000 1521 9000000 117000
x =496 y =29600 x2 =25584 y2 =90360000 xy=1503000

X =
X 496
=
= 49.60
n 10

Y=
 Y = 29600 = 2960
n 10
n X .Y −  X  Y 10  1503000 − 496  29600
b= = = 35.464
n X 2 − (  X ) 10  25584 − ( 496 )
2 2

a = Y − b X → a = 2960 − 35.464  49.60


a = 1200.9772
La ecuación sería :
Y = 35.464X + 1200.9772

Y = 35.464X + 1200.9772
Y = 35.464(42) + 1200.9772 = 2,690.47

b) Calcule r2. ¿Proporcionó un buen ajuste la ecuación de regresión estimada?

SX =
X 2

−X =
2 25584
− 49.62 = 98.24
n 10

SY =
Y 2 −Y =
2 90360000
− 29602 = 274400
n 10

S XY =
 XY − X .Y
n
1503000
S XY = − 49.6  2960
10
S XY = 3484
S XY
r=
S X SY
r = 0.000129242599
r 2 = 1.670365 10−8

r2 es prácticamente cero si SCR =0 en este caso no hay correlación ni regresión


“Año del Bicentenario del Perú: 200 años de Independencia”

c) Estime la puntuación en la evaluación general de un televisor cuyo precio es $3200.

Y = 35.464X + 1200.9772
3200 = 35.464X + 1200.9772
X = 56.368
“Año del Bicentenario del Perú: 200 años de Independencia”

5) Una aplicación importante del análisis de regresión a la contaduría es la estimación de costos.


Con datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados
para obtener la ecuación de regresión estimada que relacione volumen de producción y costos, los
contadores pueden estimar los costos correspondientes a un determinado volumen de producción.
Considere la siguiente muestra de datos sobre volumen de producción y costos totales de una
operación de fabricación.

a) Con estos datos obtenga la ecuación de regresión estimada para pronosticar los costos totales dado
un volumen de producción.

X Y XY
400 4000 160000 16000000 1600000
450 5000 202500 25000000 2250000
550 5400 302500 29160000 2970000
600 5900 360000 34810000 3540000
700 6400 490000 40960000 4480000
750 7000 562500 49000000 5250000
x=3450 y=33700 x = 2077500
2
x = 194930000
2
xy=20090000

X =
X 3450
= = 575
n 6

Y=
 Y = 33700 = 5616.67
n 6
n X .Y −  X  Y 6  1503000 − 575  5616.67
b= = = 7.6
n X 2 − (  X ) 6  2077500 − 34502
2

a = Y − b X → a = 5616.67 − 7.6  575


a = 1246.7
La ecuación sería :
Y = 7.6X + 1246.7
“Año del Bicentenario del Perú: 200 años de Independencia”

Diagrama de dispersión
8000
y = 7.6x + 1246.7
7000 R² = 0.9587
6000

5000

4000

3000

2000

1000

0
300 400 500 600 700 800

b) ¿Cuál es el costo por unidad producida?

Y = 7.6X + 1246.7
Y = 7.6 (1) + 1246.7 = 1254.3

c) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera

JARQUE BERA

H0: La distribución de los errores de los datos se aproxima a una normal


H1: La distribución de los errores de los datos no se aproxima a una normal

α = 0.05

X Y y'=a+bx (y-y')2 (y-y')3 (y-y')4


-
400 4000 4286.67 82177.78 23557629.63 6753187160.49
450 5000 4666.67 111111.11 37037037.04 12345679012.35
550 5400 5426.67 711.11 -18962.96 505679.01
600 5900 5806.67 8711.11 813037.04 75883456.79
700 6400 6566.67 27777.78 -4629629.63 771604938.27
750 7000 6946.67 2844.44 151703.70 8090864.20
3450 33700 33700 233333.333 9795555.556 19954951111
“Año del Bicentenario del Perú: 200 años de Independencia”

n=6
2 2
 3 2   
   (
Y − Yˆ 
)
  (
  Y − Yˆ
4
) 
A2 =    = 5.705 10−5 ( K − 3) = −  =9
2
3
( ) ( )
2 3 2 4
 Y − Yˆ     
     
Y −Yˆ
   
 A2 ( K − 3 ) 2 
JB = n.  + 
 6 24 
 5.705 10−5 92 
JB = 6   + = 2.25
 6 24 

 2
Tab =  2
1−0.05; 4= 0.71

Como
 2
Tab
<JB
Calc

Se rechaza la H0 Por lo tanto La distribución de los errores de los datos no se


aproxima a la distribución normal.

d) Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en los costos totales puede
ser explicada por el volumen de producción?

(Yˆ − Y ) (Y − Y )
2 2
X Y Yˆi = a + bX i i i

400 4000 4286.67 1768900.00 2613611.11


450 5000 4666.67 902500.00 380277.78
550 5400 5426.67 36100.00 46944.44
600 5900 5806.67 36100.00 80277.78
700 6400 6566.67 902500.00 613611.11
750 7000 6946.67 1768900.00 1913611.11
( ) ( )
2 2
3450 33700 33700  Yˆi − Y = 233333.333  Yi − Y = 5648333.333

 ( Yˆ − Y )
2
i
r 2
= 1−
 (Y − Y )
2
i

233333.333
r2 = 1− = 1 − 0.041310 = 0.9587
5648333.333
“Año del Bicentenario del Perú: 200 años de Independencia”
Es decir, el 95.87% de la variabilidad en los costos totales se explica la asociación con los
volúmenes de producción. Quedan 4.13% de variabilidad en los gastos que no se explica la
regresión

e) De acuerdo con el programa de producción de la empresa, el mes próximo se deberán


producir 500 unidades. ¿Cuál es el costo total estimado de esta operación?

Y = 7.6X + 1246.7
Y = 7.6 ( 500 ) + 1246.7 = 5046.7

f) Use α = 0.05 para determinar si el volumen de producción está relacionado de manera


significativa con los costos totales. Dé la tabla ANOVA. ¿Cuál es la conclusión?

CUADRO DEL ANOVA

FV GL SC CM Fcal
Regresión 1 233333.33 233333.33 0.1724
Residuos 4 5,415,000 1,353750
Total 5 5648333.3

FTab = 7.709

Fcal < FTab Se acepta la H0 por lo tanto el modelo no es significativo


“Año del Bicentenario del Perú: 200 años de Independencia”

6) PC World publicó evaluaciones de las cinco mejores impresoras láser de oficina y de las cinco
mejores impresoras láser corporativas (PC World, febrero 2003). La impresora de oficina mejor

evaluada fue la Minolta-QMS PagePro 1250W, que en la evaluación general obtuvo una
puntuación de 91 puntos. La impresora láser corporativa mejor evaluada fue la Xerox Phase
4400/N, que en la evaluación general obtuvo una puntuación de 83 puntos. En la tabla siguiente
se da rapidez, en páginas por minuto (ppm), en la impresión de texto y precio de cada impresora.

a) Dé la ecuación de regresión estimada empleando velocidad como variable independiente.

X Y X2 Y2 XY
12 199 144 39601 2388
10 499 100 249001 4990
12.2 299 148.84 89401 3647.8
10.3 299 106.09 89401 3079.7
11.7 399 136.89 159201 4668.3
17.8 1850 316.84 3422500 32930
16.1 1000 259.21 1000000 16100
11.8 1387 139.24 1923769 16366.6
19.8 2089 392.04 4363921 41362.2
28.2 2200 795.24 4840000 62040
x =149.9 y=10221 x =2538.39 y =16176795 xy=187572.6
2 2

X =
X 149.9
= = 14.99
n 10

Y=
 Y = 10221 = 1022.1
n 10
n X .Y −  X  Y 10  187572.6 − 14.99 1022.1
b= = = 117.92
n X 2 − (  X ) 10  2538.39 − 149.9 2
2

a = Y − b X → a = 1022.1 − 117.92 14.99


a = −745.48
La ecuación sería :
Y = 117.92 X − 745.48
“Año del Bicentenario del Perú: 200 años de Independencia”

Diagrama de dispersión
3000

2500 y = 117.92x - 745.48


R² = 0.7071
2000

1500

1000

500

0
5 10 15 20 25 30

b) Calcule r2 ¿Qué porcentaje de la variación del precio puede ser explicado por la velocidad de la
impresora?
 (Yˆ − Y )
2
i
r2 = 1−
 (Y − Y )
2
i

5911526.09
r2 = 1− = 1 − 0.2211= 0.7789
7589820.28

Es decir, el 77.89% de la variabilidad en los precios se explica la asociación con la velocidad.


Quedan 4.13% de variabilidad en los gastos que no se explica la regresión
c) ¿Cuál es el coeficiente de correlación muestral entre velocidad y precio? ¿Refleja este coeficiente una
relación fuerte o débil entre la velocidad de la impresora y el costo?
¿Indican las evidencias que haya una relación significante entre velocidad de impresión y precio?
Realice la prueba estadística apropiada y dé su conclusión. Use α = 0.05.

r 2 = 0.7789
r= 0.7789 = 0.88255

r>0 se dice que existe una correlación directa positiva, ambas variables aumentan (o disminuyen)
simultáneamente
CUADRO DEL ANOVA

FV GL SC CM Fcal
Regresión 1 5911526.09 5911526.09 28.178736
Residuos 8 1,678,294 209786.773
Total 9 7589820.28

FTab = 5.318
Fcal > FTab Se rechaza la H0 por lo tanto el modelo es significativo
“Año del Bicentenario del Perú: 200 años de Independencia”

7) En Estados Unidos casi todo el sistema de tranvías usa vagones eléctricos que corren sobre vías a
nivel de la calle. La Administración de Tránsito Federal afirma que el tranvía es uno de los
medios de transporte más seguros, ya que la tasa de accidentes es 0.99 accidentes por millón de
millas-pasajero en comparación con 2.29 en los autobuses. En los datos siguientes se dan las
millas de vía y la cantidad de pasajeros transportados en los días laborables, en miles, de seis
sistemas de tranvías (USA Today, 7 de enero 2003).

a) Use estos datos para obtener la ecuación de regresión estimada que podría emplearse para
predecir la cantidad de pasajeros, dadas las millas de vías.

X Y X2 Y2 XY
15 15 225 225 225
17 35 289 1225 595
38 81 1444 6561 3078
21 31 441 961 651
47 75 2209 5625 3525
31 30 961 900 930
34 42 1156 1764 1428
x=203 y=309 x = 6725
2
y =17261
2
xy=10432

X =
X 203
= = 29
n 7

Y=
 Y = 309 = 44.14
n 7
n X .Y −  X  Y 7  10432 − 29  44.14
b= = = 1.7554
n X 2 − (  X ) 7  6725 − 2032
2

a = Y − b X → a = 44.14 − 1.7554  29
a = −6.7629
La ecuación sería :
Y = 1.7554 X − 6.7629
“Año del Bicentenario del Perú: 200 años de Independencia”

Diagrama de dispersión
90
y = 1.7554x - 6.7629
80
R² = 0.7131
70
60
50
40
30
20
10
0
10 15 20 25 30 35 40 45 50

b) ¿Proporciona la ecuación de regresión estimada un buen ajuste? Explique.

(Yˆ − Y ) (Y − Y )
2 2
X Y Yˆi = a + bX i i i
15 15 19.57 603.94 849.31
17 35 23.08 443.71 83.59
38 81 59.94 249.59 1358.45
21 31 30.10 197.20 172.73
47 75 75.74 998.35 952.16
31 30 47.65 12.33 200.02
34 42 52.92 77.03 4.59

 (Y − Y ) = 2582.149 ( )
2 2
ˆ
i  Yi − Y =3620.857

 (Yˆ − Y )
2
i
r2 = 1−
 (Y − Y )
2
i

2582.149165
r2 = 1− = 1 − 0.2869= 0.7131
3620.857143

Es decir, el 71.31% de la variabilidad en la cantidad de pasajeros transportados se explica la


asociación con la cantidad de millas de vías. Quedan 28.69% de variabilidad en la cantidad de
pasajeros que no se explica la regresión.
“Año del Bicentenario del Perú: 200 años de Independencia”

c) Obtenga un intervalo de 95% de confianza para la media de la cantidad de pasajeros


transportados en los días laborables en los sistemas de tranvías que tienen 30 millas de vías.

X Y Yˆ
2.6 3300 3301.35 1.83
3.4 3600 3766.22 27627.83
3.6 4000 3882.43 13822.13
3.2 3500 3650.00 22500.00
3.5 3900 3824.32 5726.81
2.9 3600 3475.68 15456.54
( )
2
 Y − Yˆ =85135.14

(X − X )
2
1
IC1− = Y  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Y = 44.14

 (Y − Y )
2

SYX =
n−2
3620.857143
SYX = = 26.910433
5
n=7
t 0.95 = 2.447
1− ;6
2

( 30 − 29 )
2
1
IC95% = 44.14  2.447  26.910433 +
7 3620.857143
IC95% = 44.14  24.91
19.23
IC95% 
69.06

d) Suponga que Charlotte está considerando la construcción de un sistema de tranvía de 30 millas


de vías. Dé un intervalo de predicción de 95% para la cantidad de pasajeros
transportada en un día laborable por el sistema Charlotte. ¿Cree usted que el intervalo de
predicción que desarrolló pueda ser útil a los que están planeando Charlotte para anticipar la
cantidad de pasajeros en un día laborable en su sistema de tranvía? Explique
“Año del Bicentenario del Perú: 200 años de Independencia”

(X − X )
2
1
IC1− = Yˆ  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Yˆ = −6.7629 + 1.7554 X
Yˆ = −6.7629 + 1.7554 ( 30 ) = 45.899

 (Y − Y )
2

SYX =
n−2
3620.857143
SYX = = 26.910433
5
n=7
t 0.95 = 2.447
1− ;6
2

( 30 − 29 )
2
1
IC95% = 45.899  2.447  26.910433 +
7 3620.857143
IC95% = 45.899  24.91
20.986
IC95% 
70.812
“Año del Bicentenario del Perú: 200 años de Independencia”

8) Los expertos en salud recomiendan que los corredores beban 4 onzas de agua por cada 15
minutos que corran. Aunque las botellas de plástico son una buena alternativa para la
mayoría de los corredores, cuando se corre todo un día a campo traviesa se requieren
sistemas de hidratación que se llevan sobre la cintura o sobre la espalda. Estos sistemas de
hidratación además de permitir llevar más agua permiten llevar también alimento o ropas.
Por supuesto, a medida que aumenta la capacidad de estos sistemas, aumenta también su
peso y su precio. En la lista siguiente se da peso y precio de 26 de estos sistemas de
hidratación (Trail Runner Gear Guide, 2003).

a) Con estos datos obtenga una ecuación de regresión estimada que pueda ser empleada para predecir
el precio de un sistema de hidratación en función de su peso. Interprete el valor de sus coeficientes.
Realice el diagrama de dispersión

Diagrama de dispersión
70

60 y = 2.937x + 4.9785
R² = 0.8068
50

40

30

20

10

0
0 5 10 15 20 25
“Año del Bicentenario del Perú: 200 años de Independencia”

X Y XY
3 10 9 100 30
4 12 16 144 48
5 12 25 144 60
7 20 49 400 140
8 25 64 625 200
9 25 81 625 225
9 35 81 1225 315
11 35 121 1225 385
21 45 441 2025 945
15 40 225 1600 600
18 60 324 3600 1080
9 30 81 900 270
12 40 144 1600 480
14 60 196 3600 840
16 65 256 4225 1040
16 65 256 4225 1040
3 20 9 400 60
1 7 1 49 7
2 10 4 100 20
1 10 1 100 10
8 30 64 900 240
14 40 196 1600 560
9 35 81 1225 315
19 55 361 3025 1045
14 50 196 2500 700
13 60 169 3600 780
x=261 y=896 x =3451
2
y =39762
2
xy=11435

X =
X 261
= = 10.04
n 26

Y=
 Y = 896 = 34.46
n 26
n X .Y −  X  Y 26  11435 − 261 896
b= = = 2.937
n X 2 − (  X ) 26  3451 − 2612
2

a = Y − b X → a = 34.46 − 2.937  10.04


a = 4.9785
La ecuación sería :
Y = 2.937 X + 4.9785

De acuerdo a los resultados, los pesos en onzas de las botellas de plásticos se verán
incrementados en 4.9785
“Año del Bicentenario del Perú: 200 años de Independencia”

b) Pruebe la significancia de la relación empleando 0.05 como nivel de significancia.

CUADRO DEL ANOVA

FV GL SC CM Fcal
Regresión 1 5911526.09 5911526.09 28.178736
Residuos 8 1,678,294 209786.773
Total 9 7589820.28

FTab = 5.318
Fcal > FTab Se rechaza la H0 por lo tanto el modelo es significativo

c) ¿Proporciona un buen ajuste la ecuación de regresión estimada?


Debido al coeficiente de correlación igual a 0.8068 si proporciona un buen ajuste

d) Suponga que la ecuación de regresión estimada obtenida en el inciso a) también pueda usarse para
sistemas de hidratación elaborados por otras empresas. Obtenga un intervalo de confianza de 95%
para estimar el precio de todos los sistemas de hidratación que pesan 10 onzas.

(X − X )
2
1
IC1− = Y  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Y = 34.46

 (Y − Y )
2

SYX =
n−2
8884.462
SYX = = 19.24
24
n = 26
t 0.95 = 2.064
1− ;24
2

1 (10.04 − 10 )
2

IC95% = 34.46  2.064 19.24 +


26 8884.462
IC95% = 34.46  7.788
26.672
IC95% 
42.248
“Año del Bicentenario del Perú: 200 años de Independencia”

e) Suponga que la ecuación de regresión estimada obtenida en el inciso a) también pueda usarse para
sistemas de hidratación elaborados por otras empresas. Obtenga un intervalo de predicción de 95%
para estimar el precio del sistema Back Draft elaborado por Eastern Mountain Sports; este sistema
de hidratación pesa 10 onzas.

(X − X )
2
1
IC1− = Yˆ  t  S XY +
 (Y − Y )
 2
1− ; n − 2 n
2

Yˆ = 4.9785 + 2.937 X
Yˆ = 4.9785 + 2.937 (10 ) = 34.35

 (Y − Y )
2

SYX =
n−2
8884.462
SYX = = 19.24
24
n = 26
t 0.95 = 2.064
1− ;24
2

1 (10.04 − 10 )
2

IC95% = 34.35  2.064 19.24 +


26 8884.462
IC95% = 34.35  7.788
26.562
IC95% 
42.128

f) Evaluar que ρ ≠ 0.90

H0 : ρ ≠ 0

H1 : ρ ≠ 0

α = 0.05

b = 0.47106 = 2.1588
tCal = ttab = t 0.05 = 2.101
ˆb 0.2182 2
;18
“Año del Bicentenario del Perú: 200 años de Independencia”

Como el TCal < Ttab

Se rechaza la H0 por lo tanto si es significativa la pendiente de regresión muestral

g) Pruebe la normalidad de los errores utilizando la prueba de Jarque bera

n=6
2 2
 ˆ    
( )
3 2
 − (
  Y − Yˆ )
4
 Y Y
  
A2 =    = 5.705 10−5 ( K − 3) = − 3 = 9
2

( ) ( )
2 3 4
 Y − Yˆ    Y − Yˆ  
   
2

     
 A2 ( K − 3 ) 2 
JB = n.  + 
 6 24 
 5.705 10−5 92 
JB = 6   + = 2.25
 6 24 

 2
Tab =  2
1−0.05; 4= 0.71

 Tab
2
<JBCalc
Como
Se rechaza la H0 Por lo tanto La distribución de los errores de
los datos no se aproxima a la distribución normal.
“Año del Bicentenario del Perú: 200 años de Independencia”

9) Cushman Wakefield, Inc. recoge datos sobre la tasa de desocupación en edificios de oficinas y
las tasas de las rentas en mercados de Estados Unidos. Los datos siguientes dan la tasa de
desocupación (%) y las tasas de rentas promedio (por pie cuadrado) en las zonas comerciales
centrales de 18 mercados.

a) Con estos datos trace un diagrama de dispersión; en el eje horizontal grafique la tasa de
desocupación.

Diagrama de dispersión
40
y = -0.7792x + 37.075
35 R² = 0.4341

30

25

20

15

10

0
0 5 10 15 20 25
“Año del Bicentenario del Perú: 200 años de Independencia”

X Y XY
21.9 18.54 479.61 343.7316 406.026
6 33.7 36 1135.69 202.2
22.8 19.67 519.84 386.9089 448.476
18.1 21.01 327.61 441.4201 380.281
12.7 35.09 161.29 1231.3081 445.643
14.5 19.41 210.25 376.7481 281.445
20 25.28 400 639.0784 505.6
19.2 17.02 368.64 289.6804 326.784
16 24.04 256 577.9216 384.64
6.6 31.42 43.56 987.2164 207.372
15.9 18.74 252.81 351.1876 297.966
9.2 26.76 84.64 716.0976 246.192
19.7 27.72 388.09 768.3984 546.084
20 18.2 400 331.24 364
8.3 25 68.89 625 207.5
17.1 29.78 292.41 886.8484 509.238
10.8 37.03 116.64 1371.2209 399.924
11.1 28.64 123.21 820.2496 317.904
x=269.9 y=457.05 x = 4529.49
2
y = 12279.9461 xy=6477.275
2

b) ¿Parece haber alguna relación entre las tasas de desocupación y las tasas de rentas?

Debido al coeficiente de correlación igual a 0.4341 por lo que si están relacionadas entre si

c) Dé la ecuación de regresión para predecir la tasa promedio de renta en función de una tasa de
desocupación dada.

X =
X =
269.9
= 10.38
n 18

Y=
Y 457.05
= = 17.58
n 18
n X .Y −  X  Y 18  6477.275 − 269.9  457.05
b= = = −0.7792
n X 2 − (  X ) 18  4529.49 − 269.92
2

a = Y − b X → a = 17.58 − ( −0.7792 )  10.38


a = 37.075
La ecuación sería :
Y = −0.7792 X + 37.075
“Año del Bicentenario del Perú: 200 años de Independencia”

d) Empleando como nivel de significancia 0.05 pruebe la significancia de esta relación.

CUADRO DEL ANOVA

FV GL SC CM Fcal
Regresión 1 5911526.09 5911526.09 28.178736
Residuos 8 1,678,294 209786.773
Total 9 7589820.28

FTab = 5.318
Fcal > FTab Se rechaza la H0 por lo tanto el modelo es significativo

e) ¿Proporciona, la ecuación de regresión estimada, un buen ajuste? Explique.


Debido a que el coeficiente de determinación es 0.4341 se encuentra en el intervalo 0<r 2<1 si hay un
buen ajuste en la ecuación obtenida

f) Pronostique la tasa de renta esperada en los mercados en los que la tasa de desocupación en zonas
comerciales centrales es 25%.

Y = −0.7792 X + 37.075
Y = −0.7792 ( 25 ) + 37.075
Y = 17.595

g) La tasa de desocupación general en la zona comercial central de Ft. Lauderdale es 11.3%.


Pronostique la tasa de renta esperada en Ft. Lauderdale.

Y = −0.7792 X + 37.075
11.3 = −0.7792 X + 37.075
X = 33.078

También podría gustarte