TIF DE DISEÑOS EXPERIMENTALES
1.- Se toman 8 medidas del diámetro interno de los anillos para pistones del motor de un
automóvil. Los datos (en mm ) son :
74,001 74.003 74.015 74.000 74.005 74.002 74.005 74.004
Construya un diagrama de puntos y realice un comentario con respecto a los datos.
Resolución
Usaremos el programa de minitap
Comentario:
Podemos observar en la gráfica cierta varianza de los datos Las mediciones del diámetro interno
de los anillos presentan baja variabilidad y alta precisión, concentrándose mayormente entre
74.000 mm y 74.005 mm. Esto indica un buen control del proceso de fabricación. Aunque hay
un valor algo más alto (74.015 mm), sigue estando dentro de un margen muy estrecho.
2.- En su libro Forescasting and Time Series Análisis, 2da. Edición (McGraw-Hill) D.C.
Montgomery, L.A. Johnson y J.S Gardiner, analizan los datos de la tabla 2.5 , que corresponden
a las millas totales de vuelo de aerolíneas de pasajeros en el Reino unido, 1964 – 1970 ( en
millones de millas). Construya una gráfica de series de tiempo de los datos y comente las
características de los datos
Tabla 2-5 Millas de vuelo de aerolíneas de pasajeros en el Reino Unido
Mes 1964 1965 1966 1967 1968 1969 1970
Enero 7.269 8.350 8.186 8.334 8.639 9.491 10.840
Febrero 6.775 7.829 7.444 7.899 8.772 8.919 10.436
Marzo 7.819 8.829 8.484 9.994 10.894 11.607 13.589
Abril 8.371 9.948 9.864 10.078 10.455 8.852 13.402
Mayo 9.069 10.638 10.252 10.801 11.179 12.537 13.103
Junio 10.248 11.253 12.282 12.953 10.588 14.759 14.933
Julio 11.030 11.424 11.637 12.222 10.794 13.667 14.147
Agosto 10.882 11.391 11.577 12.246 12.770 13.731 14.057
Septiembre 10.333 10.665 12.417 13.281 13.812 15.110 16.234
Octubre 9.109 9.396 9.637 10.366 10.857 12.185 12.389
Noviembre 7.685 7.775 8.094 8.730 9.290 10.645 11.594
Diciembre 7.682 7.933 9.280 9.614 10.925 12.161 12.772
Comentario:
La serie de tiempo muestra un crecimiento sostenido en las millas voladas por aerolíneas de pasajeros
en el Reino Unido entre 1964 y 1970, con un patrón estacional claro: los valores aumentan desde enero,
alcanzan su pico entre julio y septiembre (posiblemente por las vacaciones), y luego disminuyen hasta
diciembre. El año 1970 presenta los mayores registros en casi todos los meses, mientras que 1964
muestra los más bajos. Enero y febrero son los meses de menor actividad, reflejando una caída tras las
festividades. En conjunto, los datos indican una tendencia creciente y una estacionalidad marcada en el
transporte aéreo.
3.- Un artículo publicado en una revista de ingeniería, presenta datos de viscosidad de un lote
de cierto proceso químico. La siguiente es una muestra de estos datos.
13.3 14.5 15.3 15.3 14.3 14.8 15.2 14.5 14.6 14.1 14.3 16.1 13.1 15.5 12.6 14.6 14.3 15.4 15.2 16.8
14.9 13.7 15.2 14.5 15.3 15.6 15.8 13.3 14.1 15.4 15.2 15.2 15.9 16.5 14.8 15.1 17.0 14.9 14.8 14.0
15.8 13.7 15.1 13.4 14.1 14.8 14.3 14.3 16.4 16.9 14.2 16.9 14.9 15.2 14.4 15.2 14.6 16.4 14.2 15.7
16.0 14.9 13.6 15.3 14.3 15.6 16.1 13.9 15.2 14.4 14.0 14.4 13.7 13.8 15.6 14.5 12.8 16.1 16.6 15.6
a) Construya una tabla de frecuencias con los datos de viscosidad del proceso químico.
b) Grafique un histograma con la tabla de frecuencia anterior.
La distribución de la viscosidad es aproximadamente simétrica, con la mayoría de los valores
concentrados en los intervalos centrales (14.1 - 14.6) y (15.1 - 15.6), que tienen las frecuencias
más altas. Los valores extremos son poco frecuentes, lo que indica estabilidad y consistencia
en el proceso químico
c) Grafique una ojiva de frecuencia acumulada, y determine el valor aproximado que
corresponde al valor del 80 % de los datos para la viscosidad.
El valor aproximado que corresponde al 80% de datos con respecto a la viscosidad es 14.9
d) Determine el percentil 30 y percentil 70.
Para determinar el percentil 30 y 70 haremos uso de la formula
𝑝 = 𝑘(𝑁) + 0.5
PERCENTIL 30
30
(80) + 0.5 = 24.5
100
Percentil 30 = 14.3
PERCENTIL 70
70
(80) + 0.5 = 56.5
100
Percentil 70 = 15.3
e) ¿Cuál es el valor del rango intercuartilico? . Comente el resultado
25 75
(80) + 0.5 = 20.5 (80) + 0.5 = 60.5
100 100
Percentil 25 = 14.3 Percentil 75 = 15.6
por consecuente sabemos que el rango intercuartílico se halla de la siguiente forma
𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 75 – 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 25 = 𝑟𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡í𝑙𝑖𝑐𝑜
15.6 – 14.3 = 1.3
El rango intercuartílico con valor 1.3 indica que la mitad central de los datos (entre el
percentil 25 y 75) está concentrada en un rango relativamente estrecho, esto nos da entender
que los valores no están muy dispersos en esa zona.
f) Construya un diagrama de caja, con los datos de la tabla anterior.
Llevamos la tabla al sofware Minitap
g) ¿Cuál es el valor del promedio de los datos?
𝑛
𝑥𝑖
𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = ∑ = 14.72375
𝑛
𝑛=1
h) Determine el valor de la desviación Estándar muestral.
∑𝑁 (𝑥𝑖−𝑥̅ )2
desviación estándar = √ 𝑖=1 = 0.9803763
𝑁−1
i) Determine el valor de la mediana. Compare con el promedio. Explique si hubiera
diferencia.
Hallamos la mediana ubicando los datos de mayor a menor y comparamos
Mediana 14.9
Promedio 14.9
Al restar vemos que la diferencia es 0 por consecuente ambas medidas de tendencia central
son iguales, esto puede reflejar de cierta manera la gráfica casi simétrica que apreciamos
anteriormente
j) Cuál es el valor del coeficiente de asimetría?. ¿Qué implica este valor? Comente
El coeficiente de asimetría, con un valor de 0.07913789, sugiere que la distribución de los
datos es casi simétrica, debido a su proximidad a cero. Esto implica que los datos se
encuentran distribuidos de forma equilibrada en torno a la media, sin una inclinación
significativa hacia un lado u otro.
k) Determine el valor de la curtosis. ¿Este valor se puede vincular con alguna propiedad
de los datos?
curtosis = -0262818999
El valor de la curtosis es aproximadamente –0.26, lo que indica que la distribución es
platicúrtica, es decir, más achatada y con colas menos pesadas que una distribución normal.
Esto sugiere que los datos están más dispersos y tienen menos valores extremos o atípicos.
4.- Se analizan los discos de policarbonato de un proveedor para determinar su resistencia a la
rayadura y a los golpes. A continuación, se resumen los resultados obtenidos al analizar 100
muestras
Sean A: el evento donde el disco tiene una alta resistencia a los golpes y B evento donde el disco
tiene una alta resistencia a las rayaduras. Determine
a) El número de discos en A ∩ B
U = 100
A ∩ B = 80
6 80 9
b) El número de discos en A’
U = 100
A’ = 14
c) El número de discos en A U B. Dibuje un diagrama de Venn que represente los datos, en
cada uno de los casos.
U = 100
A U B = 95
6 80 9
d) Determine la probabilidad de
P(A)
85
𝑃(𝐴) = → 0.885
96
P(A’)
9
𝑃(𝐴´) = → 0.094
96
P(A∩B)’
15
𝑃(𝐴 ∩ 𝐵)´ = → 0.156
96
P(AU B)
95
𝑃(𝐴 ∪ 𝐵) = → 0.990
96
P(A’U B)
89
𝑃(𝐴´ ∪ 𝐵) = → 0.927
96
5.- Se prueba la vida de un componente electrónico bajo condiciones de alta temperatura para
acelerar el mecanismo de falla. El tiempo de falla (en horas) para 20 componentes
seleccionados al azar se presentan en la tabla. determine si los datos proviene de una
distribución normal, utilice un procedimiento gráfico y una prueba de bondad de ajuste.
6.- Se utilizan dos máquinas para llenar botellas de plástico con detergente para maquinas
lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son σ1 = 0.10 onzas
de líquido, y σ2 = 0.15 onzas de líquido para las dos máquinas respectivamente., Se toman dos
altas bajas altas 80 9 baja 6 5 Resistencia golpes Resistencia rayadura 3 muestras aleatorias n1
= 12 botellas de la maquina 1 y n2 = 10 botellas e la maquina 2 . Los volúmenes promedio de
llenado son ẍ 1 = 30.87 onzas de líquido y ẍ2 = 30 .68 onzas de líquido. ¿Las dos máquinas
tienen igual volumen de llenado de detergente?
a) Construya un intervalo de confianza bilateral del 90 % para la diferencia entre las medias del
volumen de llenado.
𝑍0.05 = 1.645
𝜎2 𝜎2 𝜎2 𝜎2
𝑥2 − 𝑧𝑎 √ +
𝑥̅1 − ̅̅̅ ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅𝛼 + 𝑧𝑎 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
0.12 0.152
30.87 − 30.68 − 1.645√ + ≤ 𝜇1 − 𝜇2
12 10
0.12 0.152
≤ 30.87 − 30.68 + 1.645√ +
12 10
0.09866 ≤ 𝜇1 − 𝜇2 ≤ 0.28134
b) Construya un intervalo de confianza bilateral del 95 % para la diferencia entre las medias de
volumen de llenado. Compare el ancho de este intervalo con el ancho del calculado en el
inciso
𝑍0.025 = 1.96
𝜎2 𝜎2 𝜎2 𝜎2
𝑥2 − 𝑧𝑎 √
𝑥̅1 − ̅̅̅ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅𝛼 + 𝑧𝑎 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
0.12 0.152 0.12 0.152
30.87 − 30.68 − 1.96√ + ≤ 𝜇1 − 𝜇2 ≤ 30.87 − 30.68 + 1.96√ +
12 10 12 10
0.08117 ≤ 𝜇1 − 𝜇2 ≤ 0.29883
• Intervalo de confianza al 90%
0.09866 onzas de liquido 𝜇1 − 𝜇2 ≤ 0.28134 onzas de liquido
• Intervalo de confianza al 95%
0.8117 s de liquido 𝜇1 − 𝜇2 ≤ 0.29883 onzas de liquido
C) Construya un intervalo de confianza superior del 95 %, para la diferencia de medias del
volumen de llenado
𝜎2 𝜎2
𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅𝛼 + 𝑧𝑎 √ +
2 𝑛1 𝑛2
0.12 0.152
𝜇1 − 𝜇2 ≤ 30.87 − 30.68 + 1.645√ +
12 10
𝜇1 − 𝜇2 ≤ 0.28134
TRABAJO DE INVESTIGACIÓN FORMATIVA
1.- Se toman 8 medidas del diámetro interno de los anillos para pistones del motor de un
automóvil. Los datos (en mm ) son :
74,001 74.003 74.015 74.000 74.005 74.002 74.005 74.004
Construya un diagrama de puntos y realice un comentario con respecto a los datos.
2.- En su libro Forescasting and Time Series Análisis, 2da. Edición (McGraw-Hill) D.C.
Montgomery, L.A. Johnson y J.S Gardiner, analizan los datos de la tabla 2.5 , que corresponden
a las millas totales de vuelo de aerolíneas de pasajeros en el Reino unido, 1964 – 1970 ( en
millones de millas). Construya una gráfica de series de tiempo de los datos y comente las
características de los datos
3.- Un artículo publicado en una revista de ingeniería, presenta datos de viscosidad de un lote
de cierto proceso químico. La siguiente es una muestra de estos datos.
13.3 14.5 15.3 15.3 14.3 14.8 15.2 14.5 14.6 14.1 14.3 16.1 13.1 15.5 12.6 14.6 14.3 15.4 15.2 16.8
14.9 13.7 15.2 14.5 15.3 15.6 15.8 13.3 14.1 15.4 15.2 15.2 15.9 16.5 14.8 15.1 17.0 14.9 14.8 14.0
15.8 13.7 15.1 13.4 14.1 14.8 14.3 14.3 16.4 16.9 14.2 16.9 14.9 15.2 14.4 15.2 14.6 16.4 14.2 15.7
16.0 14.9 13.6 15.3 14.3 15.6 16.1 13.9 15.2 14.4 14.0 14.4 13.7 13.8 15.6 14.5 12.8 16.1 16.6 15.6
a) Construya una tabla de frecuencias con los datos de viscosidad del proceso químico.
b) Grafique un histograma con la tabla de frecuencia anterior.
c) Grafique un ojiva de frecuencia acumulada, y determine el valor aproximado que
corresponde al valor del 80 % de los datos para la viscosidad.
d) Determine el percentil 30 y percentil 70.
e) ¿Cuál es el valor del rango intercuartilico? . Comente el resultado.
1
f) Construya un diagrama de caja, con los datos de la tabla anterior.
g) ¿Cuál es el valor del promedio de los datos?
h) Determine el valor de la desviación Estándar muestral.
i) Determine el valor de la mediana. Compare con el promedio. Explique si hubiera
diferencia.
j) Cuál es el valor del coeficiente de asimetría?. ¿Qué implica este valor? Comente
k) Determine el valor de la curtosis. ¿ Este valor se puede vincular con alguna propiedad
de los datos ?
4.- Se analizan los discos de policarbonato de un proveedor para determinar su resistencia a las
rayadura y a los golpes. A continuación se resumen los resultados obtenidos al analizar 100
muestras
Resistencia golpes
alta baja
alta 80 9
Resistencia rayadura
baja 6 5
Sean A : el evento donde el disco tiene una alta resistencia a los golpes y B evento donde el
disco tiene una alta resistencia a las rayaduras. Determine
a) El número de discos en A ∩ B,
b) El número de discos en A’
c) El número de discos en A U B. Dibuje un diagrama de Venn que represente los datos,
en cada uno de los casos.
d) Determine la probabilidad de
P(A)
P(A’)
P(A∩B)’
P(AU B)
P(A’U B)
5.- Se prueba la vida de un componente electrónico bajo condiciones de alta temperatura para
acelerar el mecanismo de falla. El tiempo de falla (en horas) para 20 componentes seleccionados
al azar se presentan en la tabla. determine si los datos proviene de una distribución normal,
utilice un procedimiento gráfico y una prueba de bondad de ajuste.
6.- Se utilizan dos máquinas para llenar botellas de plástico con detergente para maquinas
lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son σ1 = 0.10 onzas de
líquido, y σ2 = 0.15 onzas de líquido para las dos máquinas respectivamente., Se toman dos
2
muestras aleatorias n1 = 12 botellas de la maquina 1 y n2 = 10 botellas e la maquina 2 . Los
volúmenes promedio de llenado son ẍ 1 = 30.87 onzas de líquido y ẍ2 = 30 .68 onzas de líquido.
¿Las dos máquinas tienen igual volumen de llenado de detergente?
a) Construya un intervalo de confianza bilateral del 90 % para la diferencia entre las
medias del volumen de llenado.
b) Construya un intervalo de confianza bilateral del 95 % para la diferencia entre las
medias de volumen de llenado. Compare el ancho de este intervalo con el ancho del
calculado en el inciso a.
c) Construya un intervalo de confianza superior del 95 %, para la diferencia de medias
del volumen de llenado.
7.- Se piensa que la concentración del ingrediente activo de flotación, es afectada por el tipo de
catalizador utilizada en el proceso de fabricación. Se sabe que la desviación estándar de la
concentración activa es de 3 gr/lt, sin importar el tipo de catalizador utilizado. Se realizan 10
observaciones con cada catalizador, y se obtiene los datos siguientes:
Catalizador 1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0
Catalizador 2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8
Suponga que la concentración activa está distribuida normalmente y que la varianza de la
concentración activa de ambos tipos de catalizadores es desconocido.
a) Encuentre un intervalo de confianza del 95 % para la diferencia entre las medias de
las concentraciones activas suponiendo que ambas varianzas son iguales.
Primero, estableceremos nuestra fórmula según nuestro caso:
1 1 1 1
(̅̅̅ 𝑥2 ) − 𝑡𝛼,𝑣 𝑆𝑝 √ +
𝑥1 − ̅̅̅ < 𝜇1 − 𝜇2 < (̅̅̅ 𝑥2 ) + 𝑡𝛼,𝑣 𝑆𝑝 √ +
𝑥1 − ̅̅̅
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Segundo, hallaremos los datos necesarios para la fórmula estimada:
Tercero, hallaremos la desviación estándar combinada (𝑆𝑝 ):
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22 (10 − 1)(11.864) + (10 − 1)(4.9462)
𝑆𝑝 = √ =√ = 2.8992
𝑛1 + 𝑛2 − 2 10 + 10 − 2
Cuarto, hallaremos el valor de nuestra t:
𝑡𝛼,𝑣 = 𝑡0.025,18 = 2.101
2
Donde:
𝛼 = 0.05
𝑣 = 𝑛1 + 𝑛2 − 2 = 18 3
Por último, hallamos nuestro intervalo de confianza:
1 1 1 1
(65.22 − 68.42) − (2.101)(2.8992)√ + < 𝜇1 − 𝜇2 < (65.22 − 68.42) + (2.101)(2.8992)√ +
10 10 10 10
−5.92407 < 𝜇1 − 𝜇2 < −0.47592
b) Encuentre un intervalo de confianza del 95% para la diferencia entre las
concentraciones activas promedio, suponiendo que las varianzas no son iguales.
Primero, establecemos nuestra fórmula según el caso:
𝑠2 𝑠2 𝑠2 𝑠2
(̅̅̅ ̅̅̅2 ) − 𝑡𝛼 ,𝑣 √ 1 + 2 < 𝜇1 − 𝜇2 < (̅̅̅
𝑥1 − 𝑥 𝑥2 ) + 𝑡𝛼,𝑣 𝑆𝑝 √ 1 + 2
𝑥1 − ̅̅̅
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Segundo, hallaremos los datos necesarios para la fórmula estimada:
Tercero, hallaremos el valor de nuestra t:
𝑡𝛼,𝑣 = 𝑡0.025,15 = 2.131
2
Donde:
𝛼 = 0.05
𝑠2 𝑠2 11.864 4.9462
( 1 + 2 )2 ( 10 + 10 )2
𝑛1 𝑛2
𝑣= 2 = = 15.39314 ≅ 15
𝑠 𝑠2 11.864 4.9462
( 10 )2 ( 10 )2
(𝑛1 )2 (𝑛2 )2
1 2
𝑛1 − 1 + 𝑛2 − 1 10 − 1 + 10 − 1
Por último, hallamos nuestro intervalo de confianza:
11.864 4.9462 11.864 4.9462
(65.22 − 68.42) − 2.131√ + < 𝜇1 − 𝜇2 < (65.22 − 68.42) + 2.131√ +
10 10 10 10
−5.96293 < 𝜇1 − 𝜇2 < −0.43706
c) Compare la longitud del intervalo de confianza calculado en el inciso (a) con la
longitud del intervalo de confianza obtenido, con los datos y consideraciones
anteriores (b); que intervalo es mayor y por qué?
El intervalo del inciso b es ligeramente mayor, esto se debe a que al desconocer las
varianzas, se disminuye la precisión y eficacia en la estimación de la diferencia de las
medias poblacionales.
8.- Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de
4
plástico. Para ello se toman dos muestras aleatorias, cada una de 15 especímenes, anotando las
temperaturas de deflexión observadas ( oF ) . Los resultados son los siguientes:
Tipo 1 Tipo 2
206 193 192 177 176 198
188 207 210 197 185 188
205 185 194 206 200 189
187 189 178 201 197 203
194 213 205 180 192 192
a) ¿Los datos apoyan la afirmación de que la temperatura de deflexión bajo carga para
la tubería de tipo 2 es mayor que para la tubería de tipo 1? Para llegar a una
conclusión utilice α = 0.05 y suponga que las varianzas de ambas poblaciones son
iguales.
Okey, para responder esta cuestión, haremos lo siguiente:
1. Identificamos el parámetro:
Las temperaturas medias de deflexión bajo carga para dos tipos diferentes de
tubería, con varianzas desconocidas pero iguales.
2. Establecemos hipótesis nula:
Ho : μ1 = μ2
3. Establecemos hipótesis alterna:
H1 : μ1 < μ2
4. Establecemos nuestro nivel de significancia:
𝛼 = 0.05
5. Establecemos un estadístico de prueba de acuerdo a nuestro caso:
𝑥1 − ̅̅̅
̅̅̅ 𝑥2 196.4 − 192.07
𝑡0 = = = 1.189
1 1 1 1
𝑆𝑝 √𝑛 + 𝑛 9.97234√15 + 15
1 2
Donde:
(𝑛1 − 1)𝑠21 + (𝑛2 − 1)𝑠22 (15 − 1)(109.8286) + (15 − 1)(89.0667)
𝑆𝑝 = √ =√ = 9.97234
𝑛1 + 𝑛2 − 2 15 + 15 − 2
6. Establecemos nuestra región de rechazo:
𝑡𝛼,𝑛1 +𝑛2 −2 = 𝑡0.05,28 = 1.701
7. Establecemos el criterio de rechazo:
−𝑡0 < −𝑡𝛼,𝑛1 +𝑛2 −2 ∶ −1.189 < −1.701
8. Decidimos si aceptar o no la hipótesis nula:
Por tanto, los datos no apoyan la afirmación de que la temperatura de deflexión
bajo carga de la tubería de tipo 2 es mayor que para la tubería de tipo 1, con un
nivel de significancia del 0.05.
b) Calcule un valor P para la prueba del inciso a.
5
El p-valor será: 0.122
Como el p-valor es mayor que el nivel de significancia, no hay evidencia suficiente para rechazar
la hipótesis nula.
c) Construya diagramas de caja para las dos muestras. ¿Estas graficas apoyan la
hipótesis de que las varianzas son iguales ?. Escriba una interpretación práctica para
estas gráficas.
Interpretación: Vemos que la amplitud de los bigotes y el rango intercuartílico es
similar, por lo que podríamos sugerir que las varianzas no son notablemente distintas.
9.- El motor de un cohete se fabrica al unir dos tipos de propulsores; uno de encendido y
uno de impulso. Se piensa que la resistencia al esfuerzo cortante de la unión es una función
lineal de la edad en semanas del propulsor cuando se arma el motor. En la tabla siguiente
aparece la información recolectada.
Numero de Resistencia y Edad x
observación (psi) (semanas)
1 2158.70 15.50
2 1678.15 23.75
3 2316.00 8.00
4 2061.30 17.00
5 2207.50 5.00
6 1708.30 19.00
7 1784.70 24.00
8 2575.00 2.50
9 2357.90 7.50
10 2277.70 11.00
11 2165.20 13.00
12 2399.55 3.75
13 1779.80 25.00
14 2336.75 9.75
15 1765.30 22.00
16 2053.50 18.00
17 2414.40 6.00
18 2200.50 12.50
6
19 2654.20 2.00
20 1753.70 21.50
a) Dibuje un diagrama de dispersión de los datos ¿Parece plausible utilizar como
modelo de regresión una línea recta?
Edad vs Resistencia
2800
2600
Resistencia (psi)
2400
2200
2000
1800
1600
0 5 10 15 20 25 30
Edad (semanas)
En el gráfico, se nota que a medida que la edad del propulsor aumenta, la resistencia
comienza a disminuir, aunque con cierta dispersión de datos. Entonces, esto sugiere
que sí es plausible utilizar como modelo de regresión una línea recta, ya que la relación
parece aproximadamente lineal.
b) Encuentre las estimaciones de mínimos cuadrados para la pendiente y la ordenada al
origen del modelo de regresión lineal simple.
Okey, el modelo de regresión lineal simple es el siguiente:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
Las estimaciones de mínimos cuadrados se hallan de la siguiente forma:
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝛽̂1 =
∑(𝑥𝑖 − 𝑥̅ )2
𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅
Los promedios son los siguientes:
Con ello, ya podemos hallar los sumatorios:
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = −41199.8131
∑(𝑥𝑖 − 𝑥̅ )2 = 1114.6594
Por lo que, tenemos que la pendiente es la siguiente:
−41199.8131
𝛽̂1 = = −36.9618
1114.6594
Y la ordenada al origen la siguiente:
𝛽̂0 = 2132.4075 − (−36.9618)(13.3375) = 2625.39801
Por último, el modelo de regresión lineal estimado es:
𝑦 = 2625.39801 − 36.9618𝑥
7
c) Estime σ2 y los errores estándar de β0 y β1 de los regresores del modelo lineal.
Para estimar la varianza residual, tenemos lo siguiente:
𝑆𝑆𝐸
𝜎2 =
𝑛−2
Para ello, calculamos el SSE, el cual sería:
𝑆𝑆𝐸 = 𝑆𝑦𝑦 − 𝛽̂1 𝑆𝑥𝑦 = 176601.648
Donde:
𝑆𝑦𝑦 = ∑(𝑦𝑖 − 𝑦̅)2 = 1699420.9
𝑆𝑥𝑦 = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = −41199.8131
𝛽̂1 = −36.9618
Con ello, hallamos la varianza residual:
𝑆𝑆𝐸 176601.648
𝜎2 = = = 9811.20267
𝑛−2 20 − 2
Ahora, el error estándar de β̂1 :
𝜎2
𝑆𝐸(𝛽̂1 ) = √ = 2.97
𝑆𝑥𝑥
Y, por último, el error estándar de β̂0 :
1 𝑥̅ 2
𝑆𝐸(𝛽̂0 ) = √𝜎 2 ( + ) = 45.35
𝑛 𝑆𝑥𝑥
d) Pruebe la hipótesis de Ho : β1 = 0 contra H1 : β1 ≠ 0 , utilizando el procedimiento
del análisis de la varianza con α = 0.05.
Para realizar esta prueba, haremos lo siguiente:
1. Identificamos el parámetro de interés:
Relación entre la edad del propulsor y la resistencia al esfuerzo cortante
2. Establecemos el estadístico de prueba apropiado:
𝛽̂1 − 0 −36.9618
𝑡= = = −12.45
𝑆𝐸(𝛽̂1 ) 2.97
3. Establecemos la región de rechazo:
𝑡𝛼,𝑛−2 = 𝑡0.025,18 = 2.101
2
4. Establecemos el criterio de rechazo:
|𝑡| > 𝑡𝛼,𝑛−2 ∶ 12.45 > 2.101
2
5. Decidimos si rechazar o aceptar la hipótesis nula:
Rechazamos la hipótesis nula. Por lo tanto, existe suficiente evidencia estadística
de que la pendiente es diferente de cero.
e) Determine el coeficiente de determinación del modelo. ( R2).
𝑆𝑆𝐸 176601.648
𝑅2 = 1 − =1− = 0.89
𝑆𝑆𝑇 1699420.9
Esto significa que el 89% de la variación en la resistencia al esfuerzo constante puede explicarse
por la edad del propulsor.
8
f) Obtenga los valores ajustados ŷi que corresponden a cada valor observado yi. Haga
una grafico de ŷ contra yi y haga un comentario sobre la forma que tendría esta
grafica si la relación lineal entre la resistencia al esfuerzo y la edad fuese
perfectamente determinista (sin error). ¿La grafica indica que la edad es un regresor
razonable para el modelo?
𝑦 ̂𝑖 𝑐𝑜𝑛𝑡𝑟𝑎 𝑦i
2700
2500
2300
𝑦 ̂i (valor ajustado)
2100
1900
1700
1500
1500 1700 1900 2100 2300 2500 2700
9 yi (resistencia)
La gráfica nos muestra que los puntos se alinean de manera cercana a línea recta
ascendente de 45 grados, lo que quiere decir que hay una fuerte relación lineal pero
no perfecta. Si ésta fuera perfecta, todos los puntos caerían en una recta lineal de 45
grados ascendente, donde todos los valores ajustados de 𝑦̂𝑖 = 𝑦𝑖 .
Además, al tener los valores ajustados bastante cerca de los valores observados,
podemos decir que la edad si es un regresor razonable para la resistencia en este caso.
g) Realice un grafico de donde considere a ŷi como ordenada y al error como abscisas.
valor ajustado (𝑦 ̂i) vs error
3000
2500
Valor ajustado (𝑦 ̂i)
2000
1500
1000
500
0
-300 -250 -200 -150 -100 -50 0 50 100 150
Error (ei)
h) Si el modelo es adecuado, Estime la resistencia al esfuerzo promedio de un motor
construido con un propulsor armado hace 20 semanas.
𝑦 = 2625.39801 − 36.9618𝑥
𝑦 = 2625.39801 − 36.9618(20)
𝑦 = 1886.16201
10.- Un ingeniero de una compañía quiere modelar la relación entre la HFE del dispositivo
(y) y tres parámetros: RS del emisor (x1) RS de la base (x2 ) y RS emisor base(x3) . los datos se
muestran en la tabla
1
0
1
1
a. Ajuste un modelo de regresión lineal múltiple a los datos de la tabla anterior.
b. Utilice el modelo para predecir el desgaste cuando x1 = 14.5 y x2 = 220 y x3 = 5.0
c. Ajuste un modelo de regresión lineal múltiple con un término de interacción entre los
datos.
d. Utilice el modelo del inciso d para hacer una predicción cuando x1 = 14.5 y x2 = 220 y
x3 = 5.0. Compare esta predicción con el valor calculado en el inciso b.
e. Determine el coeficiente de determinación de ambos modelos.
11.- En el diseño y análisis de experimentos tercera edición, se describe un experimento en el
que el fabricante está interesado en la resistencia a la tensión de una fibra sintética, se sospecha
que la resistencia está relacionada con el porcentaje de algodón de la fibra. Para ello se emplea
5 niveles de porcentaje de algodón y se corren 5 réplicas en orden aleatorio, con ello se obtienen
los datos siguientes:
Porcentaje de Observaciones
Algodón
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
a. Dibuje diagramas de cajas comparativos, de los porcentajes de algodón.
b. Realice una prueba de hipótesis
de: H0: µ15 = µ20 = µ25 = µ30 = µ35
H1: µ15 ≠ µ20….(por lo menos uno diferente). Utilice un nivel de confianza del 95%.
1
2
Como se observa, el valor F es mayor que el valor crítico, por lo tanto rechazamos la hipótesis
nula. Esto quiere decir que existe evidencia suficiente, con una significancia del 0.05, de que al
menos un porcentaje de algodón afecta la resistencia a la tensión.
c. Realice una gráfica de probabilidad normal de los residuos.
d. De validar H1, realice la comparación de promedios por cualquier método
de comparación (Tuckey, LSD, Múltiples Duncan, a elección).
1
3
12.- Un Ingeniero está interesado en el efecto que tiene la rapidez de corte (A), la configuración
(B) y el ángulo de corte (C), sobre la duración de la herramienta. Se eligieron dos niveles de cada
factor y se realiza un diseño factorial 23 con tres replicas. Los resultados se muestran a
continuación:
A B C Combinación de Replicas
Tratamientos
- - - (1) 22 31 25
+ - - a 32 43 29
- + - b 35 34 50
+ + - ab 55 47 46
- - + c 44 45 38
+ - + ac 40 37 36
- + + bc 60 50 54
1
4
a. Estime los efectos de los factores. ¿Cuáles de estos efectos resultan ser mayores? Se
recomienda, para esta etapa, utilizar gráficos
b. Utilice el análisis de varianza, a fin de confirmar sus conclusiones para el inciso a.
Nivel de confiabilidad del 95%.
c. Analice los residuos. ¿Existen problemas evidentes?
d. Cuales niveles de a, b y c, recomendaría usted.
1
5