UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE INGENIERÍA QUÍMICA
ESCUELA DE INGENIERÍA QUÍMICA
PRÁCTICA 2 – SEMANA 4
REGRESIÓN Y CORRELACIÓN
Integrantes:
Azañedo Arana Edwin Stiven
Cruzado Ríos Edwin Ernesto
Herrera Anampa Cesar Joel
Diseño Estadístico y Diseño de experimentos
Ms. Luis Alberto Estrada Alva
Trujillo, Perú
2024
1.Sea el experimento aleatorio.
𝝃: El lanzamiento de cuatro monedas y observar los resultados en cada uno de ellos. Se
pide:
Escribir el espacio muestral
Al lanzar cuatro monedas, cada moneda puede resultar en Cara (C) o Sello (S). El espacio muestr
al contiene todos los posibles resultados:
S={CCCC,CCCS,CCSC,CCSS,CSCC,CSCS,CSSC,CSSS,SCCC,SCCS,SCSC,SCSS,SSCC,SSC
S,SSSC,SSSS}
Escribir los siguientes eventos denotados por
E: El conjunto de resultados conformado por dos sellos.
{CCSS, CSCS, CSSC, SCCS, SCSC, SSCC}
F: El conjunto de resultados conformado por tres caras.
{CCCS, CCSC, CSCC, SCCC}
G: El conjunto de resultados conformado por figuras iguales.
{CCCC, SSSS}
2. Sea el experimento aleatorio
𝜉: Observar el número de fallas de un lote; se pide:
a) Escribir el espacio muestral
Conjunto de todos los resultados posibles para el numero de fallas observadas en el lote
𝑥
Ω = { 𝜖 ℕ ; 𝑥 ≥ 4}
𝑥
b) Escribir los siguientes eventos denotados:
F: El conjunto de resultados conformado por lo menos cuatro fallas.
Este evento incluye todas las posibilidades de fallas que sean mayores o iguales a cuatro, en
nuestro caso significa:
𝑥
F = { 𝜖 ℕ ; 𝑥 ≥ 4}
𝑥
G: El conjunto de resultados conformado por tres, cuatro o cinco fallas.
Este evento incluye exactamente los resultados por lo que hay 3,4 o 5 fallas, entonces en
conjunto es:
𝑥
F = { 𝜖 ℕ ; 3 ≤ 𝑥 ≤ 5}
𝑥
3.Suponga que se tiene el siguiente espacio muestral:
: {P, Q, R, S}
Escriba todos y cada uno de los conjuntos del espacio muestral (conjunto potencia).
Si n= y
Tendremos como conjunto problema: 2𝑛
Reemplazando = 24 = 16
Conjunto potencia: ∅, (𝑦1 ), (𝑦2 ), (𝑦3 ), (𝑦4 )
1 +4+6+4+1 =16
Los conjuntos del espacio muestral
Ω = {∅,(P), (Q), (R). (S), (PQ). (RR), (PS), (QR), (QS), (RS), (Q, R), (P, R, S), (P, Q, S). (Q.R.S).
(P, Q, R, S)}
4.El porcentaje de alcohol (100x) por galón en cierto compuesto se puede considerar como
una variable aleatoria x, con la siguiente función de densidad:
( 3 4)
(X)= { 𝑘 𝑥 − 𝑥 0<𝑥<1
0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Obtenga el valor de k
1
𝑓(0 < 𝑥 < 1) = ∫ (𝑥 3 − 𝑥 4 ) 𝑑𝑥
0
1 1
∫ 𝑥 3 𝑑𝑥 − ∫ 𝑥 4 𝑑𝑥
0 0
𝑥4 𝑥5 1 1
− (𝐾 ) = ( − ) 𝐾
4 4 4 5
1 = 0,05 𝐾
K=20
b) Obtenga el porcentaje promedio esperado de alcohol por galón.
+∞ 1
𝐺 (𝑥 ) = ∫ 𝑥 𝑓(𝑥 ) 𝑑𝑥 − ∫ 𝑥𝑓(𝑥 ) 𝑑𝑥
−∞ 𝑟𝑥
𝐸 (𝑥 ) = 0,66
Se espera un porcentaje promedio de 66 %de alcohol en los galones
c) Para un galón con dicho compuesto elegido al azar ¿cuál es la probabilidad
que tenga menos de 0.75 de alcohol?
𝑝( 𝑥 < 0,75)
0,75
𝑓 (0 ≤ 𝑥 ≤ 0,75) = ∫ [ 𝐾 (𝑥 3 − 𝑥 4 )]𝑑𝑥
0
0,75
∫ [ 𝐾 (𝑥 3 − 𝑥 4 )]𝑑𝑥 = 420 𝑥 (0,75⁄4 − 0,75⁄5) = 0,75
0
d) Supóngase que el precio de venta del galón con dicho compuesto depende del
contenido de alcohol: específicamente el galón se vende a 25 soles si 0.30 < x < 0.70 y se
vende a 20 soles en otro caso. Si se ponen a la venta un total de 1250 galones, diga cuál
sería la utilidad esperada por la venta si el costo de producción por galón es de 15 soles.
Si f(x) = 20 (𝑥 3 − 𝑥 4 )
𝑥
F(x) = P (x≤ 𝑥) = ∫0 𝑓(𝑡)𝑑𝑡
Función de utilidad
U= C1 = 25 soles/galón, Si 0.30 < 𝑥 < 0,70
U= C2 = 20 soles/galón, Si x ≤ 0,30 o x ≥0,70
E(U) = (25 -20) x (F(0,70)-F(0,30) +(20-15) x (F(0,30)+(1-F(0,70)
E(U) = 7,4872
7.4872 x 1250 galones= 9359 soles
5. En una fábrica de baterías se estima que la proporción con duración menor a 180 horas es
de aproximadamente 0.20. Si se eligen aleatoriamente a 6 baterías, diga cuál es la probabilidad:
Baterías con duración menor a 180 hora = 0.20 = p
Baterías con duración no menor a 180 horas = 1-0.20 = 0.80
Si n = 6 baterías
a) De encontrar cuatro baterías con dicha duración
Usando la tabla 1 y con n = 6; x = 4 y p = 0.20
6
𝑃𝑟𝑜𝑏(𝑥 = 4) = ( ) 𝑥0.204 𝑥0.802 = 0.0154
4
La probabilidad de encontrar 4 baterías con duración menor a 180 horas es de 0.0154.
b) De encontrar al menos tres baterías con dicha duración
Usando la tabla 1 y con n = 6 y p = 0.20
6 6 6
𝑃𝑟𝑜𝑏(𝑥 ≥ 3) = ( ) 𝑥0.204 𝑥0.802 + ( ) 𝑥0.204 𝑥0.802 + ( ) 𝑥0.204 𝑥0.802
3 4 5
6 4 2
+ ( ) 𝑥0.20 𝑥0.80
6
𝑃𝑟𝑜𝑏(𝑥 ≥ 3) = 0.0819 + 0.0154 + 0.0015 + 0.0001 = 0.0989
La probabilidad de encontrar al menos 3 baterías con duración menor a 180 horas es de 0.0989.
c)De encontrar no más de cuatro baterías con dicha duración.
Usando la tabla 1 y con n = 6 y p = 0.20
6 6 6
𝑃𝑟𝑜𝑏(𝑥 ≥ 4) = ( ) 𝑥0.204 𝑥0.802 + ( ) 𝑥0.204 𝑥0.802 + ( ) 𝑥0.204 𝑥0.802
0 1 2
6 4 2
+ ⋯ … . ( ) 𝑥0.20 𝑥0.80
4
𝑃𝑟𝑜𝑏(𝑥 ≥ 4) = 0.2621 + 0.3932 + 0.2458 + 0.0819 = 0.9830
La probabilidad de encontrar no más de 4 baterías con duración menor a 180 horas es de 0.9830.
6. Una tienda realiza un promedio de µ = 3.5 ventas por hora; sabiendo que el número de ventas
que hacen en 1 hora sigue una distribución Poisson, calcular la probabilidad:
a) Que realice exactamente dos ventas.
𝜇 = 3.5 𝑥=2
−3.5 2
𝑒 𝑥3.5
𝑃𝑟𝑜𝑏(𝑥 = 2) = = 0.1849
2
Valores en la tabla de Poisson:
𝑃𝑟𝑜𝑏(𝑥 = 2) = 𝑃𝑟𝑜𝑏(𝑥 ≤ 2) − 𝑃𝑟𝑜𝑏(𝑥 ≤ 1)
𝑃𝑟𝑜𝑏(𝑥 = 2) = 0.3208 − 0.1359 = 0.1849
Respuesta: La probabilidad que se realice 2 ventas es de 0.1849.
b) Que realice más de tres ventas.
3
𝑒 −3.5 𝑥3.5
𝑃𝑟𝑜𝑏(𝑥 ≤ 3) = 𝐸𝑥=0
𝑥!
3
𝑒 −3.5 𝑥3.5𝑥 𝑒 −3.5 𝑥3.50 𝑒 −3.5 𝑥3.51 𝑒 −3.5 𝑥3.52 𝑒 −3.5 𝑥3.503
∑ = + + +
𝑥! 0! 1! 2! 3!
𝑥=0
3
𝑒 −3.5 𝑥3.5𝑥
∑ = 0.030 + 0.106 + 0.185 + 0.216 = 0.537
𝑥!
𝑥=0
Respuesta: La probabilidad de realizar más de 3 ventas es de 0.537.
c) Que realice entre dos y cuatro ventas.
𝑃𝑟𝑜𝑏(𝑥 ≤ 4) = 𝑃𝑟𝑜𝑏(𝑥 ≤ 1) + 𝑃𝑟𝑜𝑏(2 ≤ 𝑥 ≤ 4)
𝑃𝑟𝑜𝑏(2 ≤ 𝑥 ≤ 4) = 𝑃𝑟𝑜𝑏(𝑥 ≤ 4) − 𝑃𝑟𝑜𝑏(𝑥 ≤ 1)
𝑃𝑟𝑜𝑏(2 ≤ 𝑥 ≤ 4) = 0.7254 − 0.1359 = 0.5895
Respuesta: La probabilidad que realice entre dos a 4 ventas es de 0.5895.
7. Se describe un experimento en el que se estudió la resistencia de contacto para dos materiales
diferentes o aleaciones (todos fueron aleaciones basadas en plata). Los datos son los siguientes:
Aleación Resistencia de contacto
1 100 97 100 94 98 99 99 99 95 95 98
2 103 102 102 105 99 101 102 103 100 100 98
Usando un 95% de confianza con t =2.086 para 20 grados de libertad.
a. Señale si el tipo de aleación afecta la resistencia de contacto media
Utilizamos una prueba de hipótesis para comparar las medias de dos muestras (en este caso, las
dos aleaciones).
- Hipótesis nula (𝑯𝑶 ): Las medias de las resistencias de contacto para ambas aleaciones son
iguales (𝜇1 = 𝜇2 ).
- Hipótesis alternativa (𝑯𝟏 ): Las medias de las resistencias de contacto para las aleaciones
son diferentes (𝜇1 ≠ 𝜇2 ).
Calculamos la diferencia entre las medias de las dos aleaciones y aplicar la fórmula del estadístico
t para dos muestras.
𝑋̅1 − 𝑋̅2
𝑡=
𝑆𝑑𝑖𝑓 /√𝑛
La media de la aleación 1 es 𝑋̅1 = 97.9
La media de la aleación 2 es 𝑋̅2 = 101.5
La desviación estándar de la aleación 1 es 𝑆1 = 2.025
La desviación estándar de la aleación 2 es 𝑆2 = 2.068
El valor calculado de t es t = -3.933.
Dado que t = −3.933 y el valor crítico de t para un 95% de confianza y 20 grados de libertad es
𝑡𝑐 = 2.068 rechazamos la hipótesis nula 𝐻0 . Esto sugiere que el tipo de aleación sí afecta la
resistencia de contacto media.
b. Encuentre un intervalo de confianza para la diferencia media de las dos aleaciones.
Interprete.
La diferencia entre las medias:
𝑋̅1 − 𝑋̅2 = −3.60
El intervalo de confianza del 95% para la diferencia de medias es:
IC= [-5.51, -1.69]
El intervalo no contiene el valor 0, lo que confirma que hay una diferencia significativa entre las
resistencias de contacto de las dos aleaciones. Esto apoya la conclusión de que el tipo de aleación
afecta la resistencia de contacto media.
8. La corrosión de varillas de refuerzo de acero es el problema de durabilidad más
importante de las estructuras de concreto reforzadas. La carbonatación del concreto
ocurre a consecuencia de una reacción química que reduce el pH lo suficiente para iniciar
la corrosión de las varillas de refuerzo. A continuación, se dan datos representativos sobre
X= profundidad de carbonatación (mm) y Y= resistencia (MPa) para una muestra de
especímenes tomados de un edificio particular.
x 8.2 15.0 16.5 20.8 20.0 27.5 30.0 30.0 35.0
y 22.7 27.2 23.7 17.0 21.5 18.6 16.1 23.4 13.4
x 38.0 40.0 45.0 50.0 50.0 55.0 55.0 59.0 66.0
y 19.5 12.4 13.2 11.4 10.3 14.1 9.7 12.0 6.5
a) Haga el diagrama de dispersión
Figura 1.
Gráfica de resistencia versus profundidad
RESISTENCIA VS PROFUNDIDAD
30
25
RESISTENCIA (MPa)
20
15
10
5 y = -0.2988x + 27.233
R² = 0.7691
0
0 10 20 30 40 50 60 70
PROFUNDIDAD (mm)
b) Ajuste los datos a un modelo lineal
Observación x y XY X^2 y^2
1 8.2 22.7 186.14 67.24 515.29
2 15 27.2 408 225 739.84
3 16.5 23.7 391.05 272.25 561.69
4 20.8 17 353.6 432.64 289
5 20 21.5 430 400 462.25
6 27.5 18.6 511.5 756.25 345.96
7 30 16.1 483 900 259.21
8 30 23.4 702 900 547.56
9 35 13.4 469 1225 179.56
10 38 19.5 741 1444 380.25
11 40 12.4 496 1600 153.76
12 45 13.2 594 2025 174.24
13 50 11.4 570 2500 129.96
14 50 10.3 515 2500 106.09
15 55 14.1 775.5 3025 198.81
16 55 9.7 533.5 3025 94.09
17 59 12 708 3481 144
18 66 6.5 429 4356 42.25
SUMATORIA 661 292.7 9296.29 29134.38 5323.81
Entonces: 𝑌 = 𝑏0 + 𝑏1 𝑋
𝑌 = 27.233 − 0.2988𝑋
c) Estime la resistencia para una profundidad de carbonatación de 32 mm.
Y: Resistencia (Mpa)
X: Profundidad(mm)
𝑌 = 27.233 − 0.2988𝑋
𝑌 = 27.233 − 0.2988(32)
𝒀 = 𝟏𝟕. 𝟔𝟕𝟏𝟒 𝑴𝑷𝒂
Respuesta: La resistencia para una profundidad de carbonatación de 32 mm es 17.6714
MPa.
9. En un proceso químico de destilación se quiere estudiar la relación entre la pureza
del oxígeno (Y) producido en un proceso químico de destilación y el nivel de
hidrocarburos (X) presentes en el condensador principal de la unidad de destilación. Se
realizan n=20 observaciones y se anotan los valores de las variables (X, Y) = (xi, yi), i=1,
..., 20.
a). Haga el diagrama de dispersión.
Figura 2.
Gráfica de pureza del Oxígeno versus Nivel de hidrocarburos
Pureza del Oxígeno vs Nivel de hidrocarburos
102
100
98 y = 16.094x + 72.718
PUEZA DEL OXÍGENO
R² = 0.8624
96
94
92
90
88
86
84
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
NIVEL DE HIDROCARBURO
b) Estime e interprete el coeficiente de correlación.
Observación X Y XY X^2 y^2
1 1.08 90.4 97.632 1.1664 8172.16
2 1.01 88.05 88.9305 1.0201 7752.8025
3 1.18 91.4 107.852 1.3924 8353.96
4 1.29 93.74 120.9246 1.6641 8787.1876
5 1.45 96.7 140.215 2.1025 9350.89
6 1.36 94.45 128.452 1.8496 8920.8025
7 0.87 87.59 76.2033 0.7569 7672.0081
8 1.23 91.77 112.8771 1.5129 8421.7329
9 1.55 99.42 154.101 2.4025 9884.3364
10 1.4 93.65 131.11 1.96 8770.3225
11 1.2 93.54 112.248 1.44 8749.7316
12 1.15 92.52 106.398 1.3225 8559.9504
13 0.98 90.56 88.7488 0.9604 8201.1136
14 1.01 89.54 90.4354 1.0201 8017.4116
15 1.1 89.85 98.835 1.21 8073.0225
16 1.2 90.39 108.468 1.44 8170.3521
17 1.26 93.25 117.495 1.5876 8695.5625
18 1.32 93.41 123.3012 1.7424 8725.4281
19 1.43 94.98 135.8214 2.0449 9021.2004
20 0.98 86.2 84.476 0.9604 7430.44
SUMATORIA 24.05 1841.41 2224.5243 29.5557 169730.415
𝑛 = 20
∑ 𝑋 = 24.05
∑ 𝑌 = 1841.41
∑ 𝑋. 𝑌 = 2224.5243
∑ 𝑋 2 = 29.5557
∑ 𝑌 2 = 169730.415
𝑛 ∑ 𝑋. 𝑌 − ∑ 𝑋 ∑ 𝑌
𝑟=
√(𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 )(𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 )
𝑟 = 0.928677
Debido a que el Coeficiente de correlación es 0.928677≥ 0.80 se asume una correlación
fuerte.
c). Escriba el modelo de regresión lineal y el coeficiente de determinación.
Entonces: 𝑌 = 𝑏0 + 𝑏1 𝑋
𝑌 = 72.718 + 16.094𝑋
Coeficiente de Determinación: 𝑅2 = 0.8602
d). Interprete el valor de b1 y estime y para un valor de x= 1.48.
Y: Pureza de oxígeno
X: nivel de hidrocarburos
𝑌 = 72.718 + 16.094𝑋
𝑌 = 72.718 + 16.094(1.48)
𝒀 = 𝟗𝟔. 𝟓𝟑𝟕𝟏𝟐
RESPUESTA: Para un valor de X = 1.48 (nivel de hidrocarburos), Y será 96.53712
(pureza de oxígeno).
10. La resistencia del papel utilizado en la fabricación de cajas de cartulina (Y) está
relacionado con la concentración de madera dura en la pulpa original (X). Bajo
condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente de pulpa y
mide la resistencia a la tensión. Los datos obtenidos son los siguientes:
a) Representar gráficamente los datos y comentar los resultados.
Resistencia del Papel vs Concentración de la
Madera
160
140
Resistencia del Papel
120
100
80
60
40
y = -24.039x2 + 110.34x + 7.0171
20
0
0 0.5 1 1.5 2 2.5 3 3.5
Concentración de la madera
b) Ajustar un modelo de regresión cuadrático. Predecir la resistencia de una caja de cartulina
para x= 2.6
Usando los datos obtenidos, hallamos los valores de b0, b1 y b2:
𝑏0 = 7.0171
𝑏1 = 110.34
𝑏2 = −24.039
Quedando el modelo de regresión de modo:
𝑌̂ = 𝑏0 + 𝑏1𝑋 + 𝑏2𝑋 2
𝑌̂ = 7.0171 + 110.34𝑋 − 24.039𝑋 2
Para un valor 𝑋 = 2,6
𝑌̂ = 7.0171 + 110.34(2.6) − 24.039(2.6)2
𝑌̂ = 131.39746
c) Determine la concentración de madera que puede optimizar la resistencia.
Derivamos la ecuación y la igualamos a 0:
𝑑(𝑌)
= 𝑏1 + 2 𝑏2𝑋
𝑑(𝑥)
110.34 + 2(−24.039) ∗ 𝑋 = 0
𝑋 = 2.295
La concentración de madera que puede optimizar la resistencia es de 2.295.