0% encontró este documento útil (0 votos)
387 vistas48 páginas

Regresión Lineal Simple en Estadística Aplicada

El documento presenta un curso sobre regresión lineal simple. Contiene 6 problemas que implican obtener ecuaciones de regresión a partir de datos, hacer predicciones usando los modelos y analizar los coeficientes. Los problemas involucran temas como elongación vs peso, precipitación vs contaminación, crecimiento de bacterias, rendimiento agrícola y mediciones de sólidos vs demanda química de oxígeno.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
387 vistas48 páginas

Regresión Lineal Simple en Estadística Aplicada

El documento presenta un curso sobre regresión lineal simple. Contiene 6 problemas que implican obtener ecuaciones de regresión a partir de datos, hacer predicciones usando los modelos y analizar los coeficientes. Los problemas involucran temas como elongación vs peso, precipitación vs contaminación, crecimiento de bacterias, rendimiento agrícola y mediciones de sólidos vs demanda química de oxígeno.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

CURSO: ESTADÍSTICA APLICADA

REGRESIÓN LINEAL SIMPLE. ESTIMACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE.

Integrantes :
1. .
2. .
3. .
4. .
5. .

Semana: 5

Instrucciones: Lea cuidadosamente cada problema y responda en forma ordenada, clara y precisa.

1. Se tomaron las siguientes mediciones de Elongación (Y) para diferentes pesos (F) y se obtuvo la siguiente tabla:

F 0 5 10 15 20 25 30 35
Elongación 0 1.56 1.29 3.15 4.23 4.66 5.2 6.99

F 40 45 50 55 60 65 70 75
Elongación 7.07 9.7 10.46 11.45 11.81 11.82 14.71 15.89

a) Trace el diagrama de dispersión é indicar la tendencia.


b) La ecuación de regresión lineal simple de la Elongación, en función del Peso.
c) Utilizando el modelo pronostique la elongación cuando el peso es 43.
d) Interpretar coeficientes de Regresión
2. La información está relacionada con un estudio acerca de la cantidad de precipitación pluvial y la cantidad de
contaminación atmosférica.
Lluvia (0.026") 18 7 14 31 21 5 11 16 26 29
Remoción de
55 17 36 85 62 18 33 41 63 87
contaminación

Hacer las siguientes estimaciones:


a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica que vaya en función de la
variable dependiente Y, y la variable independiente X.

2021 1 - 1-
b) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica.

10 (10820)−(178)( 497)
b= 2
=2.735
10( 3890)−178
497 178
a= −(2.735) =1.017
10 10
Y =a+bX
Y =2.735 X+ 1.017

c) Utilizando el modelo pronostique la contaminación cuando la cantidad de precipitación pluvial es 20.


2021 1 - 2-
Y =2.735 X+ 1.017
Y =2.735(20)+ 1.017=55.717
d) Interpretar coeficientes de Regresión.

Del cuadro de datos se tiene:


2
r =0.962=0.962 x 100 %=96.2 %
El 96.2% de la variación del remoción de contaminación se explica mediante la ecuación de regresión
Y =2.735 X+ 1.017

3. Tabla mostrando los datos


Tiempo en días
de inoculación 3 6 9 12 15 18
(X)
Nº de bacterias
115 147 189 235 257 286
(miles)

Hacer las siguientes estimaciones:


a) Identificar la variable dependiente y la variable independiente. Hacer una gráfica que vaya en función de la
variable dependiente Y, y la variable independiente X.

2021 1 - 3-
b) Obtener la ecuación de regresión lineal simple y trazarla en la gráfica.

6(14751)−(63)(1229)
b= 2
=11.724
6(819)−63
1229 63
a= −(11.724) =81.731
6 6
Y =a+bX
Y =11.724 X +81.731

c) Utilizando el modelo pronostique el número de bacterias después de 20 días.


Y =11.724 X +81.731
Y =11.724 (20)+81.731=316.211
d) Interpretar coeficientes de Regresión.

2021 1 - 4-
Del cuadro de datos se tiene:
2
r =0.989=0.989 x 100 %=98.9 %
El 98.9% de la variación del número de bacterias(miles) se explica mediante la ecuación de regresión
Y =11.724 X +81.731 :

4. En un estudio relacionado con la siembra de algodón, la precipitación anual y el rendimiento de la cosecha de


algodón son como sigue.

Precipitación en Pulgadas ( X) 7.12 63.54 47.38 45.92 8.68 50.86 44.46


Rendimiento de las cosecha en
1037 380 416 427 619 388 321
libras/acre (Y)

Hacer los siguientes cálculos:

a) Calcular los valores del intercepto a y la pendiente b.

7 (110224.82)−(267.96)(3588)
b= 2
=−9.609
7(13080.3104)−267.96
3588 267.96
a= −(−9.609) =880.404
7 7

2021 1 - 5-
b) Escribir la ecuación de la línea de regresión.
Y =−9.608 X +880.397
c) Predecir el rendimiento de la cosecha de algodón, si la precipitación es de 30 pulgadas.
Y =−9.608 X +880.397
Y =−9.608(30)+880.397=592.157
d) Interpretar coeficientes de Regresión

Del cuadro de datos se tiene:


2
r =0.699=0.699 x 100 %=69.9 %
El 69.9% de la variación del rendimiento de las cosechas se explica mediante la ecuación de regresión
Y =−9.608 X +880.397
5. El libro Applied Statistics: Análisis of Variance and Regression de Dunn y Clark, describe un estudio de física,
relacionado a la óptica, donde se obtuvieron los datos que muestran los diámetros de las fibras ópticas (en
micras) en función de la fuerza de rompimiento de éstas
Diámetro 22. 28. 27. 25. 22. 30. 23. 25.
5 0 5 5 0 5 0 0
Log de Fuerza de 0.1 0.6 0.5 0.5 0.2 0.8 0.2 0.2
rompimiento 9 2 1 3 4 7 5 5

Diámetro 23. 27. 21. 22. 29. 20. 27. 27.


5 0 5 0 0 5 0 0
Log de Fuerza de 0.3 0.3 0.1 0.3 0.5 0.2 0.6 0.6
rompimiento 7 2 3 5 3 2 5 7
a. Identificar la variable dependiente y la variable independiente. Hacer una gráfica que
vaya en función de la variable dependiente Y, y la variable independiente X.
VARIABLE DEPENDIENTE: DIÁMETRO
VARIABLE INDEPENDIENTE: LOG. DE FUERZA DE ROMPIMIENTO

2021 1 - 6-
b. Obtener la ecuación de regresión lineal simple y trazarla en la gráfica.

c. Utilizando el modelo pronostique el log de la fuerza de rompimiento d, cuando el


diámetro de la fibra es 22 micras.

y = 11.766x + 20.411
Entonces:
y = 11.766 (22) + 20.411
Por lo tanto:
y = 279.263

d. Interpretar coeficientes de Regresión


a = Es la fuerza de rompimiento, independiente a los diámetros de las fibras ópticas (X= 0).

2021 1 - 7-
b = El valor 11.766 representa la fuerza de rompimiento, por cada variación unitaria de los diámetros de
las fibras ópticas.

6. Se muestra las mediciones de sólidos y la demanda química de oxígeno (DQO).

Sólidos suspendidos

30 29 33 37 25 3
2
30 30 33 30 35 3
1
29 30 34 30 36 3
0
34 31 36 29 31 3
0
28 31 36 28 33 3
2
27 32 36 27 31 3
2
DDQ
29 27 31 36 25 31
29 28 32 29 30 30
28 29 34 29 34 29
33 30 35 28 30 28
26 30 34 28 30 31
27 32 34 26 29 31

a. Trace el diagrama de dispersión e indicar la tendencia.

2021 1 - 8-
b. La ecuación de regresión lineal simple de DQO, en función de las mediciones de sólidos.

2021 1 - 9-
y = 0.876x + 2.603

c. Utilizando el modelo pronostique la demanda química de oxígeno, cuando la medición del sólido es 32.

y = 0.876x + 2.603
Entonces:
y = 0.876 (32) + 2.603
Por lo tanto:
y = 30.635

d. Interpretar coeficientes de Regresión

a = Es la demanda DDQ, independiente a las mediciones de sólidos suspendidos (X= 0).

b = El valor 0.876, representa el promedio de incremento de la demanda DDQ, por cada variación
unitaria de las mediciones de sólidos suspendidos.

7. Los datos corresponden a las notas obtenidas por 8 estudiantes en las asignaturas de Matemáticas y
Estadística:
Matemáticas (X) 9,5 14 12 13 12,5 15 17 7,5
Estadística (Y) 9 14 11, 12 10 15 15, 8
5 5

a) Representar los datos en un diagrama de dispersión. Analice la relación entre las variables.

2021 1 - 10-
Análisis: Observando el gráfico de dispersión podemos decir que las notas obtenidas en las asignaturas
de estadísticas y matemáticas, tienen una Correlación Lineal Positiva o Directa.
b) Calcular el coeficiente de correlación lineal. Interpretar el resultado.

2021 1 - 11-
INTERPRETACIÓN: Como e coeficiente de correlación de Pearson r = 0.948, existe una correlación positiva
fuerte entre las notas de matemática y estadística.

8. Las estaturas (X) y los pesos (Y) de 10 trabajadores de una empresa se muestran a continuación:
X(cm 18 16 17 17 17 17 18 18 18 16
) 5 9 3 8 3 0 3 2 5 5
Y(kg) 83 60 70 70 72 65 82 80 79 60
a) Elaborar un diagrama de dispersión.

2021 1 - 12-
b) ¿Qué tipo de relación se aprecia?. Comentar.
Se aprecia una correlación lineal positiva, observamos que a mayor estatura suele aumentar el peso de
los trabajadores
c) Determinar el coeficiente de correlación lineal e interpretar el resultado.
r = 0.952129351, existe una correlación positiva fuerte entre la estatura y el peso.
9. Se lleva a cabo un estudio para establecer la relación entre el tiempo de uso (en años) de unas
computadoras y le eficiencia de las mismas (%), los datos se muestran en la siguiente tabla:
Tiempo de uso (X) Eficiencia (Y)
8 50
6 70
9 45
4 90
3 90
10 45
4 85
7 65

a) Diseñar un diagrama de dispersión e interpretar el comportamiento de las variables.

Observando el gráfico de dispersión podemos decir que el tiempo de uso de las computadoras y la
eficiencia tienen una correlación lineal negativa, es decir a más tiempo de uso de las computadoras se
reduce su eficiencia

2021 1 - 13-
b) Determinar el coeficiente de correlación lineal e interpretar el resultado.
r= -0.98231234, existe una correlación negativa fuerte entre el tiempo de uso de las computadoras y su
eficiencia.

10. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un producto que salió
a la venta con relación al tiempo de publicidad (en horas/semana). Se recopilaron datos a partir de la
segunda semana de iniciada la publicidad resultando el cuadro que sigue:
Semana 2 3 4 5 6 7
Tiempo de 20 25 22 28 36 40
propaganda
Venta del producto ($) 30 31 30 32 35 42
0 0 2 0 0 0
a) Elaborar un diagrama de dispersión.

b) ¿Existe relación entre las variables?. Comentar.


Sí, a más tiempo de publicidad al aire aumentó la venta.
c) Determinar el coeficiente de correlación lineal e interpretar el resultado.
r=0.91021882, existe una correlación positiva fuerte entre el tiempo de publicidad al aire y su aumento
según las semanas con relación a la cantidad de ventas.

2021 1 - 14-
11. La empresa MINPETEL requiere averiguar si el consumo de combustible (en m 3) está relacionada con la
energía generada (en Mwh) por la compañía. Para ello se tiene la siguiente información durante el año
2014:
meses Energía Consumo de
generada (X) combustible (Y)

Enero 70.65 23.18


Febrero 57.47 25.54
Marzo 67.74 20.04
Abril 68.45 23.94
Mayo 83.80 27.23
Junio 77.56 25.31
Julio 45.76 11.83
Agosto 94.88 30.42
Setiembre 120.13 34.35
Octubre 123.74 39.39
Noviembre 106.92 35.64
Diciembre 122.23 38.11

a) Elaborar un diagrama de dispersión.

b) ¿Existe relación entre las variables?. Comentar.

2021 1 - 15-
Existe una relación, debido a que la mayoría de los datos de las variables se encuentran cerca de una a
la otra . Y da a entender que existe una correlación lineal positiva.
Determinar el coeficiente de correlación lineal e interpretar el resultado.

Energía Consumo de XY X^2 Y^2


Meses generada (X) combustible (Y)

Enero 70.65 23.18 1637.667 4991.4225 537.3124

Febrero 57.47 25.54 1467.7838 3302.8009 652.2916

Marzo 67.74 20.04 1357.5096 4588.7076 401.6016

Abril 67.74 20.04 1357.5096 4588.7076 401.6016

Mayo 83.8 27.23 2281.874 7022.44 741.4729

Junio 77.56 25.31 1963.0436 6015.5536 640.5961

Julio 45.76 11.83 541.3408 2093.9776 139.9489

Agosto 94.88 30.42 2886.2496 9002.2144 925.3764

Setiembre 120.13 34.42 4134.8746 14431.2169 1184.7364

Octubre 123.74 39.39 4874.1186 15311.5876 1551.5721

Noviembre 106.92 35.64 3810.6288 11431.8864 1270.2096

122.23 38.11 4658.1853 14940.1729 1452.3721


Diciembre

TOTAL 1038.62 331.15 30970.7853 97720.688 9899.0917

n=12
2021 1 - 16-
donde el coeficiente de correlación r= 0.946
Interpretación: Como r=946, entonces existe una correlación positiva fuerte entre la energía generada
y el consumo de combustible.

c) Construir el modelo de regresión lineal simple. Trace la línea recta de regresión que se ajuste a dicho
modelo.

b=2.059 a= 0.295

d) ¿Cuál será el consumo estimado de combustible, si se emplea una energía de 50.25 m 3?


b=2.059 a= 0.295, entonce la función es y=0.295x+2.059
Para 50.25 y=0.295(50.25)+2.059 y= 12.56125
El consumo de combustible estimado, si se emplea una energía de 50.25 es 12.56125 de consumo del combustible

2021 1 - 17-
12. Un estudio clínico desea determinar el efecto de un medicamento en la presión arterial (en mm de Hg) de
las personas, para ello se evalúan la presión arterial en condiciones basales (X) y tras 3 semanas de
tratamiento (Y) en un total de 12 pacientes con según se observa en la siguiente tabla:
X 90 10 9 10 9 10 9 9 10 10 9 11
0 5 0 5 5 8 5 4 0 5 0
Y 80 95 8 90 7 92 9 8 88 94 8 10
6 5 2 0 5 2
a) Elaborar un diagrama de dispersión.

b) ¿Existe relación entre las variables? Comentar.


Existe una relación, debido a que la mayoría de los datos de las variables se encuentran cerca de una a
la otra . Y da a entender que existe una correlación lineal positiva.
c) Determinar el coeficiente de correlación lineal e interpretar el resultado.

Paciente Presión arterial Tratamiento (Y) XY X^2 Y^2


condiciones basales (X)
en mm de hg

1 90 80 7200 8100 6400

2 100 95 9500 10000 9025

2021 1 - 18-
3 95 86 8170 9025 7396

4 100 90 9000 10000 8100

5 95 75 7125 9025 5625

6 105 92 9660 11025 8464

7 98 92 9016 9604 8464

8 95 80 7600 9025 6400

9 104 88 9152 10816 7744

10 100 94 9400 10000 8836

11 95 85 8075 9025 7225

12 110 102 11220 12100 10404

TOTAL 1187 1059 105118 117745 94083

n=12

r=0.802
Como el coeficiente de correlación es 0.802 nos indica que existe correlación positiva entre las
variables de presión arterial en condiciones basales y el tratamiento.

d) Construir el modelo de regresión lineal simple. Trace la línea recta de regresión que se ajuste a dicho
modelo.

2021 1 - 19-
b=20.929 a= 1.104

e) ¿Cuál es el valor de la presión arterial del paciente tras el tratamiento, si este presentó una presión arterial
basal de 89 mm de Hg?
b=20.929 a= 1.104, entonce la función es y=1.104x-20.929
Para 89 mm de Hg y=1.104(89)+20.929 y= 77.327
Si un paciente con una presión arterial basal de 89 mm de Hg, si se somete al tratamiento su presión arterial será
77.327 debido al tratamiento.

13. Se quiere determinar si existe o no relación en los gastos en publicidad y los ingresos mensuales (en miles
de soles) de las mypes en Lima Norte según se aprecia en los datos de la siguiente tabla:
ingresos 105 105 98 110 145 78 74 90 20 60 45 75 148 170
gastos 15 12 10 12 15 12 9 12 4 8 8 10 15 20
a) Graficar un diagrama de dispersión.

2021 1 - 20-
b) ¿Existe relación entre las variables? Intérprete.
Existe una relación, debido a que la mayoría de los datos de las variables se encuentran cerca de una a la
otra . Y da a entender que existe una correlación lineal positiva por la tendencia de los puntos.
c) Calcular el coeficiente de correlación lineal e interpretar el resultado.

mype en Ingresos (x)(miles de gastos(y)(miles de dólares) XY X^2 Y^2


Lima Norte dólares)

1 105 15 1575 11025 225

2 105 12 1260 11025 144

3 98 10 980 9604 100

4 110 12 1320 12100 144

5 145 15 2175 21025 225

6 78 12 936 6084 144

7 74 9 666 5476 81

2021 1 - 21-
8 90 12 1080 8100 144

9 20 4 80 400 16

10 60 8 480 3600 64

11 45 8 360 2025 64

12 75 10 750 5625 100

13 148 15 2220 21904 225

14 170 20 3400 28900 400

TOTAL 1323 162 17282 146893 2076

n=14

r= 0.940
El coeficiente de correlación es de 0.940 lo que nos indica que existe correlación positiva entre las
variables de gastos e ingresos.
d) Construir el modelo de regresión lineal simple. Trazar la recta de regresión.

b=3.046 a= 0.090

2021 1 - 22-
e) Estimar el ingreso mensual de la empresa si ésta dispuso en publicidad de un monto de 25000 soles.
b=3.046 a= 0.090, entonce la función es y=0.090x+3.046
Para 25 en miles de dólares 25=0.90(x)+3.046 x=24.393
Si una empresa dispuso de un monto de 25000, se estima que el ingreso es de 24.393 en miles de dólares

14. Los datos que se muestran a continuación reportan el número de horas que
dedican a dormir (X) y jugar PlayStation (Y) un grupo de niños seleccionados al
azar con la finalidad de verificar la relación entre dichas variables:
X 8 6,5 7 10 10 7,5 6 9

Y 2,5 4 3 1 1,5 3 4 2

a) Representar los datos en un diagrama de dispersión. Evalúe la relación de las


variables.

2021 1 - 23-
b) Calcular el coeficiente de correlación lineal. Interpretar el resultado.

suma sumay^
x y xy x^2 y^2 x^2 2
8 2.5 20 64 6.25 4096 484
6.5 4 26 42.25 16
7 3 21 49 9
10 1 10 100 1
10 2.5 25 100 6.25
7.5 3 22.5 56.25 9
2021 1 - 24-
6 4 24 36 16
9 2 18 81 4
=64 =22 =166.5 =528.5 =67.5

❑ ❑ ❑
n ∑ xy−∑ x ∑ y
= ❑ ❑ ❑

(8 x 166.5)−(64 x 22)
= √❑
=-0,12
.Correlación negativa débil nos indica que los dos valores tienen
tendencias contrarias.
15. En una cadena de tiendas por departamento, se desea establecer la relación
entre las ventas mensuales (en unidades de artículo) y los años de experiencia
de un vendedor. Para ello se selecciona una muestra de 10 vendedores
aleatoriamente, los datos se presentan en la tabla adjunta:
ventas 12 8 7 17 10 11 5 9 14 12
experie 5 3 2 7 4 4 1 3 5 6
ncia

a) Diseñar un diagrama de dispersión y verificar la existencia de la relación entre


las variables. Interpretar.

2021 1 - 25-
b) Calcular el coeficiente de correlación lineal e interpretar el resultado.

x y xy x^2 y^2 suma x^2 sumay^2


12 5 60 144 25 6241 841
8 3 24 64 9
7 2 14 49 4
17 7 119 289 49
10 4 40 100 16
11 4 44 121 16
5 1 5 25 1
9 3 27 81 9
14 5 70 196 25
12 6 72 144 36
79 29 333 873 129

2021 1 - 26-
❑ ❑ ❑
n ∑ xy−∑ x ∑ y
= ❑ ❑ ❑

(10 x 333)−(79 x 29)
= √❑
=0.05
.correlación positiva débil nos indica que más débil será la tendencia los
dos valores tienen tendencias contrarias.
c) Construir el modelo de regresión lineal simple. Graficar la recta de regresión.
❑ ❑ ❑
n ∑ xy−∑ x ∑ y
b= ❑ ❑ ❑

(10 x 333)−(79 x 29)
b¿ (10 x 873−6241❑ )
=3329,08

❑ ∑ x
a ∑ y−b ❑


¿

29 79
a¿ 10 −(3329,08) 10 =-26296.83
Y=a+bx

2021 1 - 27-
Y=-26296.83+3329,08X

d) Estimar las ventas del mes para un vendedor con 8 años de experiencia.
Y=a+bx
8=-26296.83+3329,08X
7.90=X
Los vendedores de 8 años de experiencia venden al mes 7.9 artículos.

16. Para poder utilizar los resultados de un examen de aptitud en la contratación


de nuevo personal obrero de una fábrica, se tomó una prueba de aptitud a 10

2021 1 - 28-
obreros de planta y se determinó su productividad, asimismo se registró su
tiempo de sueldo mensual tal como se muestra en la siguiente tabla:
Aptitud (puntos) 12 17 20 13 8 9 11 13 19 10
Productividad 50 62 82 54 35 40 45 50 70 42
(%)
Sueldo (miles de 6,5 7 9 5 2,5 3 5,5 6 10 3,5
soles)
Con los datos del caso:
a) Representar gráficamente el diagrama de dispersión correspondiente a
productividad y sueldo.
Interpretar la relación de las variables.

b) Calcular el coeficiente de correlación de las variables aptitud y


productividad. Intérprete.
x y xy x^2 y^2 suma x^2 sumay^2
12 50 600 144 2500 7396 126736
20 82 1640 400 6724
13 54 702 169 2916

2021 1 - 29-
8 35 280 64 1225
9 40 360 81 1600
11 45 495 121 2025
13 50 650 169 2500
19 70 1330 361 4900
10 42 420 100 1764
86 356 4727 1148 19490

❑ ❑ ❑

= n∑

xy−∑ x ∑ y
❑ ❑

(9 x 4727)−(86 x 356)
= √❑

=0.005
.correlación positiva débil nos indica que más débil será la tendencia los
dos valores tienen tendencias contrarias.

c) Construir el modelo de regresión las variables aptitud y productividad.


❑ ❑ ❑
n ∑ xy−∑ x ∑ y
b= ❑ ❑ ❑

(9 x 4727)−(86 x 356)
b¿ (9 x 1148−7396)
=42532.57

❑ ∑ x
a ∑ y−b ❑


¿

356 86
a¿ 9
−42532.57 =-406382.78
9
Y=a+bx
y=-406382.78+42532.57x

2021 1 - 30-
d) Predecir la productividad de un trabajador cuyo puntaje en la prueba de
aptitud es de 15.5 puntos.
15.5=-406382.78+42532.57x
9.55=x
La productividad de un trabajador cuyo puntaje en la prueba de aptitud es de
15.5 puntos es de 9.55

e) Predecir la productividad de un trabajador cuyo sueldo es de 1.5 miles de


soles.

x y xy x^2 y^2 suma x^2 sumay^2


6.5 50 325 42.25 2500 1482.25 174724
7 62 434 49 6724
9 82 738 81 2916
5 54 270 25 1225
2.5 35 87.5 6.25 1600
3 40 120 9 2025
5.5 45 247.5 30.25 2500
6 50 300 36 4900
10 70 700 100 1764
3.5 42 147 12.25 174724
38.5 418 2222 242.75 19490
❑ ❑ ❑
n ∑ xy−∑ x ∑ y
b= ❑ ❑ ❑

(10 x 2222)−(38.5 x 418)
b¿ (10 x 242.75−1482.25)
=6.48

2021 1 - 31-

❑ ∑ x
a ∑ y−b ❑


¿

418 38.5
a¿ 10
−6.48
10 =16.85
Y=a+bx
y=16.85+6.48x
Y=16.5+6.48(1.5)
Y=26.22
La productividad de una persona cuyo sueldo es de 1.5 miles de soles es de
26.22

17. Una empresa de reparto de pollo a la brasa a domicilio desea estudiar la relación entre la distancia de
entrega (en km) y el tiempo empleado (en minutos), los datos se muestran en la siguiente tabla:
Distancia de 2 1 1 3 3 1 2 1 1
entrega 8 4 2 1 0 9 4 5 6
Tiempo empleado 6 1 1 7 7 4 5 2 2
0 9 2 5 0 0 5 5 5
a) Representar los datos en un diagrama de dispersión. Evalúe la relación de las variables.
b) Calcular el coeficiente de correlación lineal. Interpretar el resultado.
c) Construir el modelo de regresión y predecir el tiempo de empleado en la entrega si la distancia con el
domicilio es de 20 km.
desarrollo:

2021 1 - 32-
b) Calcular el coeficiente de correlación lineal. Interpretar el resultado.
9 (9370)−189(381)
r=
√❑
r =0.99
La correlación entre el tiempo de entrega y la distancia es de 0.99 se considera una correlación positiva fuerte .

c) Construir el modelo de regresión y predecir el tiempo empleado en la entrega si la distancia con el domicilio es
de 20 km.
9(9370)−(189)(381)
b= → b= 3.154
9 (4403)−¿ ¿

381 189
a= −3.154 → a= -23.909 Y=3.154X-23.909
9 9

x=20 km Y=3.154(20)-23.909 Y=39.171

Cuando la distancia sea de 20 km el tiempo de entrega será de 39.171 minutos.

18. La tabla siguiente muestra las notas obtenidas por 8 estudiantes en un examen parcial, las horas de estudio
dedicadas a su preparación previos al examen:
2021 1 - 33-
Nota 15 16 17 10 15 18 11 19
Horas de estudio 7 10 9 4 8 10 5 14

Con los datos del problema:


a) Representa gráficamente los diagramas correspondientes a Horas de estudio y Nota.
b) Halla el coeficiente de correlación. Interpretar.
c) Predecir la nota de un estudiante que dedicó a estudiar 12 horas previas al examen.

DESARROLLO:

b) Halla el coeficiente de correlación. Interpretar.

2021 1 - 34-
8 (1079)−121(67)
r=
√❑
r =0.93
La correlación entre las notas y el tiempo de estudio es de 0.93 se considera una correlación positiva fuerte .

c) Predecir la nota de un estudiante que dedicó a estudiar 12 horas previas al examen.


ecuación : Y=0.926X-5.630
Y=12 horas
12=0.926(x)-5.630
x= 19.03
Por lo tanto, un alumno que estudia 12 horas previo al examen obtendrá una nota de 19.03.

19. Un estudio de psicología requiere verificar si existe relación entre los coeficientes de inteligencia (CI) de los
padres y de sus hijos, para ello se toma una muestra de 12 sujetos y sus hijos respectivos cuyos resultados
luego de la aplicación de un test de inteligencia se muestran en el siguiente cuadro:
CI padre (X) 76 74 72 73 71 75 68 72 70
CI hijo (Y) 75 73 72 76 70 73 71 73 73
Se pide:
a) Grafique un diagrama de dispersión con los datos del caso, luego identifique el tipo de relación que se
observa.
b) Determinar el coeficiente de correlación lineal, luego interprete el resultado.
c) Construir la ecuación de regresión lineal y trace la recta de ajuste.
d) Predecir el CI de un hijo si su padre registra un CI de 98 puntos.

DESARROLLO:

a)

2021 1 - 35-
b) Determinar el coeficiente de correlación lineal, luego interprete el resultado.
9 (47990)−658 (656)
r=
√❑
r =0.97
La correlación entre el CI padre y CI hijo es de 0.97 se considera una correlación positiva fuerte .
c) Construir la ecuación de regresión lineal y trace la recta de ajuste.
Y= 0.885X+8.176
d) Predecir el CI de un hijo si su padre registra un CI de 98 puntos.

2021 1 - 36-
Y= 0.885X+8.176
X=98 → Y=0.885(98)+8.176
Y=94.9
Cuando el padre registra 98 puntos de CI el hijo tendrá 94.9 de CI.

20. Una empresa vendedora de libros desea realizar mejoras en sus procesos, tal como realizar con tiempo sus
pedidos, distribuir mejor su personal, ampliar su local, etc. Para tal efecto, lleva a cabo un estudio en 6
semanas a fin de establecer la relación existente entre número de personas que solicitan información de los
libros en una semana (X) y el número de libros vendidos en la semana siguiente (Y). Los resultados se
muestran en la siguiente tabla:
X 20 8 10 12 30 25
Y 13 4 8 6 16 12
Se pide:
a) Graficar un diagrama de dispersión con los datos del caso, luego identifique el tipo de relación que se
observa.

Relación: número de personas que solicitan información de los libros en una semana (X) y el número de
libros vendidos en la semana siguiente (Y)

b) Determinar el coeficiente de correlación lineal, luego interprete el resultado.

2021 1 - 37-
c) Construir el modelo de regresión lineal y trace la recta de ajuste.

d) Predecir el número de libros que venderá la empresa en una semana, si en la semana anterior 8
personas solicitaron información.
Según la gráfica seran 7
21. En un estudio de la relación entre la publicidad por radio y las ventas de un producto, durante 10 semanas
se han recopilado los tiempos de duración en minutos de la publicidad por semana(X), y el número de
artículos vendidos (Y), resultando:
Semana 1 2 3 4 5 6 7 8 9 10

Publicidad 20 30 30 40 50 60 60 60 70 80
X
Ventas Y 50 73 69 87
108 128 135 132 148 170
a) Trazar el diagrama de dispersión, e indicar la tendencia

2021 1 - 38-
b) Calcular la recta de regresión de mínimos cuadrados con el fin de predecir las ventas.

c) Estimar la venta si en una semana se hacen 100 minutos de propaganda


Estimadamente 45
d) Calcular el coeficiente de correlación.

e) Si en la novena semana se incrementara la publicidad en 5 minutos, ¿en cuánto se estima se


incrementen las ventas?
Estimadamente a 30 ventas

2021 1 - 39-
22. Una fábrica de cierta marca de refrescos ha tomado al azar 10 semanas al año, observando la temperatura
media correspondiente (en grados centígrados) a cada una de ellas y la cantidad de refrescos pedidos
durante cada uno de dichos periodos. La información obtenida es la siguiente:
T. media (°C) 10 28 12 31 30 19 24 5 9 15

Cantidad de 21 65 19 72 75 39 67 11 12 24
refrescos
a) La recta de ajustes, grado de dependencia de la temperatura (x) sobre la cantidad de refrescos (y)

b) El coeficiente de determinación y el coeficiente de correlación. ¿Con este coeficiente podría


planificarse la producción?

23. Los ingresos (X) y los gastos (Y) mensuales en dólares de una muestra de 100 familias han dado los
siguientes resultados:

x= 210, y= 200, sX2 = 5.76, sY2 = 2.56, XY = 4200364.8

Determine la recta de regresión de mínimos cuadrados de Y en X y estime el gasto de una familia que
tiene $250 de ingreso.

2021 1 - 40-
HALLAMOS LA SUMATORIA DE X Y DE Y:

Hallamos el coeficiente de correlación:

Recta de regresión:

la recta es: Y=67.7+0.63X y el gasto para una familia de ingreso 250 dólares es de 225.2 dólares.

2021 1 - 41-
24. El coeficiente de correlación entre dos variables X e Y es r= 0.60. Si sX =1.50, sY = 2.00, x=10, y= 20
, hallar la recta de regresión:
c. De Y en X

y=12+ 0.8 x

d. De X en Y
y 12
x= − = 1.25y – 15
0.8 0,8

25. Al estudiar la regresión lineal entre los ingresos medios (Y en $) y el número de hijos por familia (X), se
obtuvo la siguiente información:

x= 3, y= 700, sX = 0.5 sXY

Estimar los ingresos de las familias con 4 hijos, ¿a cuantos hijos por familia correspondería un ingreso
estimado en $ 712?

26. La tabla contiene las estaturas redondeadas en pulgadas y los pesos redondeados en libras (lb.), de una
muestra de 12 estudiantes hombres obtenida al azar de los estudiantes del primer año de la universidad
Telesup.
Estatura 70 63 72 60 66 70 74 65 62 67 65 68
(X)
Peso Y
(lb.) 155 150 180 135 156 168 178 160 132 145 139 152
a. Obtenga un diagrama de
dispersión de los datos

2021 1 - 42-
b. Construya una recta que se aproxime a los datos

c. Estime la ecuación de la recta


construida en el inciso b)
y= 3.216x-60.746
d. Estime el peso de un estudiante cuya estatura es de 63 pulg.
63=3.12x-60.746 entonces x=38.478 es el peso aproximado del estudiante que mide 63 pulgadas
e. Calcule la estatura de un estudiante cuyo peso es de 168 lb.
y =168*3.126-60.746 entonces y=464.422 es la estatura del alumno que pese 168 lb.

27. Dos jueces x e y de un concurso asignaron separadamente a los 10 finalistas del concurso las siguientes
puntuaciones.
X 3 10 9 1 2 4 6 5 8 7

y 3 8 10 .4 1 2 5 6 7 9

a. Hallar la covarianza dada por los jueces bajo el supuesto de que emitieran su juicio con absoluta
independencia indicando así el signo de la dependencia.
Sxy = 7.7222 La covarianza es positiva.

b. El coeficiente de correlación.
r= 0.842424, existe una correlación positiva fuerte entre x e y.
desarrollo:

2021 1 - 43-
a) Hallar la covarianza dada por los jueces bajo el supuesto de que emitieran su juicio con absoluta
independencia indicando así el signo de la dependencia.
En este problema nos está pidiendo que hallemos la covarianza entonces:
372
Sxy= − [ (5,5).(5,5) ]
10
Sxy=( 37.2)−(30.25)
Sxy=6.95

b) El coeficiente de correlación.
El coeficiente de correlación se halla de la siguiente manera:
• LA PARTE DEL NUMERADOR SERÍA :
(n.( Σ xy ¿) - ( Σ x. Σ y)
(10.((372))- ((55).(55))
3720 - 3025
= 695
• LA PARTE DEL DENOMINADOR SERÍA :
= √❑

=√ ❑

=√ ❑

= √❑

= 825
• Finalmente halló el r:

2021 1 - 44-
695
r =¿
825
r = 0.842

28. Supongamos que la producción (en millones) de un determinado artículo fabricado por una compañía
durante los años 1980- 1989 es como sigue.
Años 19 19 19 19 19 19 19 19 19 19
80 81 82 83 84 85 86 87 88 90
Producción
92. 92. 80. 89. 83. 68. 69. 67. 58. 61.
2 3 0 1 5 9 2 1 3 2
a. Trazar un gráfico de líneas y describir la tendencia.

b. Hallar la recta de regresión (serie de tiempo) de mínimos cuadrados de la producción en función de


los años.

2021 1 - 45-
c. Estimar la producción de artículos para 1990 y establecer si es significativa tal predicción.
Reemplazamos la x en la recta de regresión

29. En el estudio de la relación entre ingresos mensuales y gastos de educación de las familias, una muestra
proporciona un coeficiente de determinación del 90.25%, medias respectivas de $420 y $120, y
desviaciones estándar respectivas de $10 y $7. según este estudio
a. ¿En cuánto se estima los gastos por ecuación de una familia cuyo ingreso mensual es de $300?

b. Si una familia estima su gasto por ecuación en $370, ¿Cuánto debería ser su ingreso mensual?

c. Si una familia tiene un aumento de $50, ¿en cuánto se incrementaría la estimación de sus gastos de
educación?

30. Al estudiar la relación entre la edad (X) y la presión sanguínea (Y) a partir de una muestra de mujeres, se
obtuvo la siguiente información:

2021 1 - 46-
sX = 7.5 , sY =10, x= 50, y=120, r = 0.90

Hallar la relación lineal de la presión con respecto a la edad y predecir la presión sanguínea para una
mujer de 45 años.

31. Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo, obteniendo
los siguientes datos:
No de 63 55 40 25 37 32 61
paginas 0 0 0 0 0 0 0
Precio $ 10 8 7 4 6 6 9

a. Determine una función lineal entre el precio y el número de páginas con el fin de predecir precios.
¿Qué porcentaje de la varianza total de precios se explica por esta función?

b. Estimar el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una
segunda edición. ¿En cuánto se incrementaría su precio?

2021 1 - 47-
c. ¿Cuántas páginas debería tener un libro cuyo precio se estima en $ 12.27?

32. Los porcentajes en gastos de publicidad y los porcentajes de beneficios netos de ventas en una muestra de
9 negocios es como sigue:
Gastos 2.3 1.9 3.5 1.0 1.5 4.0 2.6 3.0 2.4

Beneficios 4.0 3.8 6.2 2.9 3.4 6.8 4.5 5.0 4.2

a. Hallar la recta de regresión de mínimos cuadrados para predecir beneficios netos.

b. Determinar el beneficio si el gasto es 5%.

2021 1 - 48-

También podría gustarte