SEP SES TecNM
INSITUTO TECNOLOGICO DE TOLUCA
Carrera: Ingeniería Logística
Materia:
Estadística inferencial
Trabajo:
Análisis Estadístico de Regresión Lineal y Correlación en
Aplicaciones Prácticas.
PRESENTA:
Alumno
Rito Castillo Edgar Yahve
Numero de Control:
23280154
Semestre:
4to
Docente:
Donovan Ricardo Ramírez Carranza
METEPEC, ESTADO DE MÉXICO, A 12 DE DICIEMBRE DE 2024
Análisis de los ejercicios
Ejercicio 1
En un laboratorio de investigación se quiere investigar la forma en la que se relaciona la cantidad de fibra (pilguada de madera) con una
resistencia del producto (papel). Determina los datos siguientes:
a) Determina la variable dependiente e independiente. %
b) Determinar la ecuación de regresión lineal. NO FIBRA RESISTENCIA
c) Determinar el porcentaje de fibra para una resistencia de 169. 1 4 134
d) Determinar el coeficiente de correlación. 2 6 145
e) Determinar el diagrama de dispersión. 3 8 142
a) Determinar el error residual. 4 10 149
5 12 144
6 14 160
7 16 156
8 18 157
9 20 168
10 22 166
11 24 167
12 26 171
13 28 174
14 30 183
(Xi-Xm)(YiYm) (Y-Y tilde)^2
% FIBRA RESISTENCI Y ERRO
NO (x) A (Y) (Xi)(Yi) X^2 Xi-Xm (Xi-Xm)^2 (Yi-Ym) (Yi-Ym)^2 tilde Y-Y tilde R
1 4 134 536 16 -13 169 -24 590 316 137 -3 10
2 6 145 870 36 -11 121 -13 177 146 140 5 21
3 8 142 1136 64 -9 81 -16 265 147 144 -2 3
4 10 149 1490 100 -7 49 -9 86 65 147 2 4
5 12 144 1728 144 -5 25 -14 204 71 150 -6 38
6 14 160 2240 196 -3 9 2 3 -5 153 7 43
7 16 156 2496 256 -1 1 -2 5 2 157 -1 0 3.876
8 18 157 2826 324 1 1 -1 2 -1 160 -3 8
9 20 168 3360 400 3 9 10 94 29 163 5 23
10 22 166 3652 484 5 25 8 60 39 166 0 0
11 24 167 4008 576 7 49 9 76 61 170 -3 7
12 26 171 4446 676 9 81 13 162 114 173 -2 4
13 28 174 4872 784 11 121 16 247 173 176 -2 5
14 30 183 5490 900 13 169 25 611 321 179 4 13
TOTA 238 2216 39150 4956 0 910 0 2581 1478 180
L
B) F)
NO Residual
1 -3.17
2 4.58
3 -1.67
4 2.08
5 -6.17
6 6.59
7 -0.66
8 -2.91
9 4.84
10 -0.41
11 -2.66
12 -1.90
13 -2.15
14 3.60
E) y = 1.6242x + 130.67
200
Diagrama de dispercion R² = 0.9301
150
100
50
0
0 5 10 15 20 25 30 35
a) Variables dependiente e independiente
El porcentaje de fibra es la variable independiente que afecta directamente la resistencia del producto lo cual lo vuelve dependiente
b) Ecuación de regresión lineal
La ecuación obtenida es y = 1.62 x + 130.67.
Por cada 1% adicional de fibra, la resistencia aumenta 1.62 unidades. Con 0% de fibra, se estima que la resistencia inicial sería
de 130.67 unidades.
c) Porcentaje de fibra para una resistencia de 169
Para alcanzar una resistencia de 169 unidades, se necesita un 23.60% de fibra. La ecuación de regresión nos permite predecir
niveles de fibra necesarios para obtener una resistencia específica.
d) Coeficiente de correlación
El coeficiente de correlación es r = 0.964 r^2 = 9.301
e) Diagrama de dispersión
El diagrama muestra puntos alineados cerca de la línea de regresión lo que la resistencia aumenta a medida que el porcentaje de
fibra incrementa.
Ejercicio 2
Los resortes se usan en aplicaciones por su capacidad para alargarse (contraerse) bajo NO PESO LONGITUD
carga. La rigidez de un resorte se mide con la constante del resorte, que es la longitud del 1 0.0 5.06
resorte que se alargará por unidad de la fuerza o de la carga. Para asegurarse de que un 2 0.2 5.01
resorte dado funciona adecuadamente es necesario calcular la constante de resorte con 3 0.4 5.12
exactitud y precisión a través de los siguientes datos. a) Determinar la variable 4 0.6 5.13
dependiente e independiente. 5 0.8 5.14
b) Determinar la ecuación de regresión lineal. 6 1.0 5.16
c) Determinar coficiente de correlación 7 1.2 5.25
d) Determinar diagrama de dispersión 8 1.4 5.19
e) Determinar el analisis residual (E 9 1.6 5.24
f) Predecir la longitud del resorte bajo una carga determinada de 0.3 y 1.3 libras 10 1.8 5.46
11 2.0 5.40
12 2.2 5.57
13 2.4 5.47
14 2.6 5.53
15 2.8 5.61
16 3.0 5.59
17 3.2 5.61
18 3.4 5.75
19 3.6 5.68
20 3.8 5.8
Resolucion del problema en excel
(Xi-
LONGITU Xm)(YiYm) (Y- ERRO
NO PESO (X) D (Y) Xi*Yi Xi^2 Xi-Xm (Xi-Xm)^2 Yi-Ym (Yi-Ym)^2 Y^ Y-Y^ Y^)^2 R
1 0.0 5.06 0 0.000 -1.900 3.610 -0.329 0.108 0.624 5.000 0.060 0.004
2 0.2 5.01 1 0.040 -1.700 2.890 -0.379 0.143 0.643 5.041 -0.031 0.001
3 0.4 5.12 2 0.160 -1.500 2.250 -0.269 0.072 0.403 5.082 0.038 0.001
4 0.6 5.13 3 0.360 -1.300 1.690 -0.259 0.067 0.336 5.122 0.008 0.000
5 0.8 5.14 4 0.640 -1.100 1.210 -0.249 0.062 0.273 5.163 -0.023 0.001
6 1.0 5.16 5 1.000 -0.900 0.810 -0.228 0.052 0.206 5.204 -0.044 0.002
7 1.2 5.25 6 1.440 -0.700 0.490 -0.139 0.019 0.097 5.245 0.005 0.000
8 1.4 5.19 7 1.960 -0.500 0.250 -0.198 0.039 0.099 5.286 -0.096 0.009
9 1.6 5.24 8 2.560 -0.300 0.090 -0.148 0.022 0.045 5.327 -0.087 0.008
10 1.8 5.46 10 3.240 -0.100 0.010 0.072 0.005 -0.007 5.368 0.092 0.008
0.0575
11 2.0 5.40 11 4.000 0.100 0.010 0.012 0.000 0.001 5.409 -0.009 0.000
12 2.2 5.57 12 4.840 0.300 0.090 0.182 0.033 0.054 5.450 0.120 0.014
13 2.4 5.47 13 5.760 0.500 0.250 0.082 0.007 0.041 5.491 -0.021 0.000
14 2.6 5.53 14 6.760 0.700 0.490 0.142 0.020 0.099 5.532 -0.002 0.000
15 2.8 5.61 16 7.840 0.900 0.810 0.222 0.049 0.199 5.573 0.037 0.001
16 3.0 5.59 17 9.000 1.100 1.210 0.202 0.041 0.222 5.614 -0.024 0.001
17 3.2 5.61 18 10.240 1.300 1.690 0.222 0.049 0.288 5.655 -0.045 0.002
18 3.4 5.75 20 11.560 1.500 2.250 0.362 0.131 0.542 5.695 0.055 0.003
19 3.6 5.68 20 12.960 1.700 2.890 0.292 0.085 0.496 5.736 -0.056 0.003
20 3.8 5.8 22 14.440 1.900 3.610 0.412 0.169 0.782 5.777 0.023 0.001
SUMA 38.0 107.77 210 98.800 26.600 1.173 5.443 0.000 0.059
PROMEDI
O 1.9 5.4
a) Variable dependiente e independiente
La longitud del resorte depende del peso aplicado, la longitud es dependiente y el peso independiente
b) Ecuación de regresión lineal
La ecuación de regresión es: y = 0.2046 x + 4.9997 por cada libra adicional aplicada al resorte la longitud del resorte aumenta
en promedio, 0.2046 pulgadas, describe cómo se relacionan peso y longitud del resorte. El valor de 4.9997 indica la longitud
inicial.
c) Coeficiente de correlación
El coeficiente de correlación r fue cercano a 1, indica una relación lineal positiva entre peso y longitud del resorte. Cuanto mayor
sea el peso aplicado al resorte, mayor será su longitud.
d) Diagrama de dispersión
Muestra que los puntos siguen una tendencia lineal positiva, con pocos valores alejados de la línea ajustada. Esto refuerza que
existe una relación lineal entre las variables.
e) Análisis residual
Los residuales son pequeños y no tienen un patrón sistemático, lo que confirma que la regresión lineal ajusta bien los datos. Las
predicciones son precisas, y la variación en los datos observados se explica en su mayoría por el modelo.
f) Predicción de la longitud
La longitud predicha del resorte es 5.0611 in para un peso de 0.3 lb y 5.2657 in para 1.3 lb.
EJERCICIO 3
El director general de una cadena de tiendas de autoservicio en expansión desea conocer el comportamiento de las ventas en diferentes
establecimientos con base en la superficie de piso en la que se exhiben los diferentes productos con el fin de contar con un modelo que
le permita llevar un control adecuado de la eficiencia con la que trabaja cada establecimiento. Para ello utiliza el volumen de ventas
mensuales (en millones de pesos) y la superficie de piso (en miles de metros cuadrados). En forma aleatoria recopila el volumen de
ventas del último mes en diez tiendas de la cadena que correspondan más o menos entre 2000 y 12000 m² de superficie de piso. a)
Determinar la variable dependiente e independiente.
b) Determinar la ecuación de regresión lineal.
c) Determinar coficiente de correlación
d) Determinar diagrama de dispersión
e) Determinar el analisis residual (E
NO SUPERFICIE VENTAS
1 2.15 1
2 9.20 3
3 6.70 3
4 13.50 4.5
5 5.50 2
6 12.15 5
7 4.80 1
8 10.70 4
9 3.25 1.5
10 8.25 3.5
(Xi-
SUPERFICIE VENTAS (Yi- Xm)(YiYm) (Y-
NO (X) (Y) Xi*Yi Xi^2 Xi-Xm (Xi-Xm)^2 Yi-Ym Ym)^2 Y^ Y-Y^ Y^)^2 ERROR
1 2.15 1 2 5 -5.5 30 -1.9 3.4 10.1 0.9 0.1 0.0
2 9.20 3 28 85 1.6 2 0.2 0.0 0.2 3.4 -0.4 0.2
3 6.70 3 20 45 -0.9 1 0.2 0.0 -0.1 2.5 0.5 0.2
4 13.50 4.5 61 182 5.9 35 1.7 2.7 9.7 5.0 -0.5 0.2
5 5.50 2 11 30 -2.1 4 -0.9 0.7 1.8 2.1 -0.1 0.0
6 12.15 5 61 148 4.5 21 2.2 4.6 9.7 4.5 0.5 0.3 0.48
7 4.80 1 5 23 -2.8 8 -1.9 3.4 5.2 1.8 -0.8 0.7
8 10.70 4 43 114 3.1 9 1.2 1.3 3.5 4.0 0.0 0.0
9 3.25 1.5 5 11 -4.4 19 -1.4 1.8 5.9 1.3 0.2 0.0
10 8.25 3.5 29 68 0.6 0 0.7 0.4 0.4 3.1 0.4 0.2
SUMA 76.20 28.5 264 710 0.0 130 0.0 18.5 46.5 1.8
PROMEDIO 7.62 2.85
B) E)
Sxy 46.53 NO RESIDUOS (MILLONES )
Sxx 129.786 1 0.11
Bi 0.3585 2 -0.42
Bo 0.1181 3 0.48
C) 4 -0.46
r 9.489E-01 5 -0.09
r^2 9.005E-01 6 0.53
7 -0.84
8 0.05
9 0.22
10 0.42
D) VENTAS (Y)
y = 0.3585x + 0.1181
R² = 0.9005
6
5
4
3
2
1
0
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00
a) Variables dependiente e independiente
La variable independiente es la superficie de piso la variable dependiente son las ventas mensuales, ya que dependen de la
superficie de piso.
b) Ecuación de regresión lineal
Ecuación de regresión es: y = 0.35x + 0.1181
Esto indica que por cada aumento de 1000 m² en la superficie de piso, las ventas aumentan en promedio 0.36 millones de pesos.
c) Coeficiente de correlación
El coeficiente de correlación es r = 0.949, una relación fuerte y positiva entre la superficie de piso y las
ventas la relación entre estas dos variables es muy fuerte, las tiendas con mayor superficie de piso tienden
a tener mayores ventas.
d) Diagrama de dispersión
El diagrama muestra tendencia positiva, con una distribución de puntos que sigue aproximadamente la línea de regresión. a
medida que aumenta la superficie de piso, las ventas también tienden a aumentar.
e) Análisis residual
Los residuos son las diferencias entre las ventas observadas y las predichas, y muestran ciertas fluctuaciones alrededor de cero,
los residuos son pequeños, lo que es una señal positiva de la calidad del modelo.
Análisis: sugiere que la superficie de piso tiene influencia en las ventas.
2.4.1. EJERCICIO 4
Una compañía refresquera esta estudiando el efecto de su ultima campaña publicitaria. A un grupo de personas a quienes eligieron al
azar se les preguntó por teléfono cuantas latas del nuevo refresco habían comprado en la semana anterior y cuantos anuncios de él
había leído o visto durante la semana
a) Determinar la variable dependiente e independiente.
b) Determinar la ecuación de regresión lineal.
c) Determinar coficiente de correlación
d) Determinar diagrama de dispersión
e) Determinar el analisis residual (E)
NO NO. DE ANUNCIOS LATAS COMPRADAS
1 4 1
2 10 3
3 3 3
4 0 4.5
5 1 2
6 4 5
7 2 1
8 5 4
9 6 1.5
10 8 3.5
LATAS (Xi-
NO. DE COMPRADAS (Xi- (Yi- Xm)(YiYm) (Y-
NO ANUNCIOS (X) (Y) Xi*Yi Xi^2 Xi-Xm Xm)^2 Yi-Ym Ym)^2 Y^ Y-Y^ Y^)^2 ERROR
1 4 1 4 16 -0.3 0 -1.9 3 0.56 2.84 -1.84 3.4
2 10 3 30 100 5.7 32 0.2 0 0.86 2.95 0.05 0.0
3 3 3 9 9 -1.3 2 0.2 0 -0.20 2.83 0.17 0.0
4 0 4.5 0 0 -4.3 18 1.7 3 -7.10 2.78 1.72 3.0
5 1 2 2 1 -3.3 11 -0.9 1 2.81 2.79 -0.79 0.6
1.5207
6 4 5 20 16 -0.3 0 2.2 5 -0.65 2.84 2.16 4.6
7 2 1 2 4 -2.3 5 -1.9 3 4.26 2.81 -1.81 3.3
8 5 4 20 25 0.7 0 1.2 1 0.81 2.86 1.14 1.3
9 6 1.5 9 36 1.7 3 -1.4 2 -2.30 2.88 -1.38 1.9
10 8 3.5 28 64 3.7 14 0.7 0 2.41 2.91 0.59 0.3
SUMA 43 28.5 124 271 0 86 0.0 19 1.45 18.5
PROMEDI
O 4.3 2.85
B) E)
Sxy 1.45 NO RESIDUOS ( E )
Sxx 86.1 1 -1.845
Bi 0.0168 2 0.054
Bo 2.7776 3 0.172
4 1.722
C) 5 -0.794
r 0.03631 6 2.155
r^2 0.00132 7 -1.811
8 1.138
9 -1.379
10 0.588
D) y = 0.0168x + 2.7776
LATAS COMPRADAS (Y)
R² = 0.0013
6
0
0 2 4 6 8 10 12
a) Variables dependiente e independiente:
La cantidad de anuncios es la variable independiente, el número de latas compradas es la variable dependiente, los anuncios
no dependen de cuantas da.
b) Ecuación de regresión lineal:
La ecuación de regresión: Y = 0.0168X + 2.7776. Por cada anuncio adicional incrementa el número de latas compradas en 0.017,
comenzando con un valor base de 2.78 latas si no se ven anuncios. Los anuncios en las ventas son insignificantes.
c) Coeficiente de correlación:
El coeficiente de correlación r=0.0363 indica una relación muy baja entre el número de anuncios y las latas compradas. No hay
una relación significativa entre el número de anuncios vistos y el consumo del refresco.
d) Diagrama de dispersión:
El diagrama de dispersión muestra puntos distribuidos de manera dispersa y sin una tendencia en específico. No existe una
relación lineal alta entre los anuncios y las latas compradas.
e) Análisis residual:
Los residuos muestran que los valores observados difieren, con residuos tanto positivos como negativos. Esto indica que el
modelo de regresión no es un buen predictor del comportamiento de los consumidores.
Análisis: sugiere que la campaña publicitaria no está teniendo un efecto significativo en el consumo del refresco.
2.5.1. EJERCICIO 5
El propietario de una cadena de heladería desea estudiar el efecto de la temperatura atmosférica sobre las ventas durante la temporada
de verano seleccionando una muestra aleatoria de 12 días con los resultados siguientes: a) Determinar la variable dependiente e
independiente.
b) Determinar la ecuación de regresión lineal.
c) Determinar coficiente de correlación
d) Determinar diagrama de dispersión
e) Determinar el analisis residual (E)
NO TEMPERATURA VENTAS EN MILES
1 22.8 18
2 23.9 20.5
3 24.1 21.8
4 25.3 22.9
5 26.7 23.6
6 27.8 22.5
7 29.5 26.8
8 31.1 29
9 32.2 31.4
10 33.4 32.4
11 36.7 34
12 37.8 32.8
A)
(Xi-
TEMPERATURA VENTAS EN (Xi- (Yi- Xm)(YiYm)
NO (X) MILES (Y) Xi*Yi Xi^2 Xi-Xm Xm)^2 Yi-Ym Ym)^2 Y^ Y-Y^ (Y-Y^)^2 ERROR
1 22.8 18 410 520 -6.5 42 -8.3 69 54 19.53 -1.53 2.34
2 23.9 20.5 490 571 -5.4 29 -5.8 34 31 20.68 -0.18 0.03
3 24.1 21.8 525 581 -5.2 27 -4.5 20 23 20.89 0.91 0.82
4 25.3 22.9 579 640 -4.0 16 -3.4 12 14 22.15 0.75 0.57
5 26.7 23.6 630 713 -2.6 7 -2.7 7 7 23.61 -0.01 0.00
6 27.8 22.5 626 773 -1.5 2 -3.8 15 6 24.76 -2.26 5.13
1.509
7 29.5 26.8 791 870 0.2 0 0.5 0 0 26.54 0.26 0.07
8 31.1 29 902 967 1.8 3 2.7 7 5 28.22 0.78 0.61
9 32.2 31.4 1011 1037 2.9 9 5.1 26 15 29.37 2.03 4.12
10 33.4 32.4 1082 1116 4.1 17 6.1 37 25 30.63 1.77 3.15
11 36.7 34 1248 1347 7.4 55 7.7 59 57 34.08 -0.08 0.01
12 37.8 32.8 1240 1429 8.5 73 6.5 42 55 35.23 -2.43 5.91
SUMA 351.3 315.7 9534 10563 0.0 279 0.0 328 292 22.76
PROMEDIO 29.275 26.3083
B) E)
Sxy 292 NO RESIDUO (E)
Sxx 279 1 -1.53
Bi 1.0467 2 -0.18
Bo -4.333 3 0.91
4 0.75
C) 5 -0.01
r 0.9647 6 -2.26
r^2 0.9307 7 0.26
8 0.78
9 2.03
10 1.77
11 -0.08
12 -2.43
D) VENTAS EN MILES (Y) y = 1.0467x - 4.333
R² = 0.9307
40
30
20
10
0
0 5 10 15 20 25 30 35 40
20
a) Variables dependiente e independiente
La temperatura atmosférica es la variable independiente. Las personas tienden a consumir más helados en climas cálidos por lo
que la variable independiente es las ventas de helado.
b) Ecuación de regresión lineal
La ecuación queda así y = 1.00467x -4.333 por cada incremento de 1°C en la temperatura, las ventas aumentan en promedio
0.869 miles.
c) Coeficiente de correlación (r)
El valor de r= 0.9647, r^2 = 0.9307 existe una correlación muy alta y positiva entre la temperatura y las ventas. A medida que
aumenta la temperatura, las ventas tienden a incrementarse significativamente.
d) Diagrama de dispersión
El diagrama muestra una tendencia positiva. La relación lineal entre las variables tiene es alta.
e) Análisis residual
Los residuos muestran una variación relativamente baja, los residuos más grandes sugieren días con ventas ligeramente mayores
o menores a lo esperado.
Análisis: La temperatura es un factor determinante en las ventas de helados durante el verano.