Efectos estimados
Se observa que el efecto del
tamaño de broca (factor A) es
prácticamente el doble de los
otros dos, pero falta investigar
si alguno es estadísticamente
significativo.
Modelo de Regresión en un diseño factorial 2k
Es útil ajustar un modelo de regresión a los datos experimentales con la finalidad de predecir el
valor de Y en diferentes valores de los factores estudiados.
Por ejemplo, en el caso del problema de la ranuradora, con el uso de valores codificados para los
dos factores (x1 y x2), como se muestra en la tabla, el modelo de regresión ajustado que describe el
comportamiento de la vibración sobre cualquier punto está dado por:
Ŷ = 23.83 + 8.32 x1 + 3.77 x2 + 4.35 x1 x2
donde Ŷ es la respuesta predicha, con x1 = A : broca y x2 = B : velocidad.
La predicción del comportamiento de la
vibración sobre la combinación de
niveles que se quiera dentro de la región
experimental se puede realizar con el
modelo ajustado
Por ejemplo, el coeficiente de x1 es igual al efecto de A/2 = (16.64/2).
El término independiente β = 23.83 es la media global de todos los datos y representa la vibración predicha en el centro
de la región experimental (x1 = 0, x2 = 0).
Modelo de regresión en un diseño factorial 2k
- En el caso de diseños 2k, los coeficientes del modelo de regresión son iguales a los
efectos estimados que resultaron significativos divididos entre dos.
- La predicción del comportamiento de la vibración sobre la combinación de niveles
que se quiera dentro de la región experimental se puede realizar con el modelo
ajustado.
Que estadísticos mide la
calidad de un modelo de
regresión múltiple???
Coeficientes de determinación, R2 y R2aj
Dos de los estadísticos más útiles para medir la calidad global del modelo de
regresión múltiple es el coeficiente de determinación (R2) y el coeficiente de
determinación ajustado (R2aj), que se obtienen a partir del ANOVA de la siguiente
manera:
Estos coeficientes comparan la variabilidad
explicada por el modelo frente a la variación total,
cuantificadas a través de la suma de cuadrados
(SC) o por el cuadrado medio (CM).
En general, para fines de predicción se recomienda un
De esta forma, para interpretar estos coeficientes coeficiente de determinación ajustado de al menos 70%.
se cumple que: Cuando hay muchos factores se prefiere el estadístico
0.0 < R2aj < R2 < 100 R2aj en lugar del R2, puesto que este último se
y cuantifican el porcentaje de variabilidad incrementa de manera artificial con cada término que se
presente en los datos y que es explicado por el agrega al modelo, aunque sea un término que no
modelo; por ello, son deseables valores próximos contribuya en mucho a la explicación de la respuesta. En
a 100. cambio, el R2aj incluso baja de valor cuando el término
que se agrega no aporta mucho.
Como son los Coeficientes de determinación, R2 y R2aj ???
Tabla ANOVA
R2 = 95.8 R2aj = 94.75
De esta manera, de acuerdo con R2 aj, el modelo ajustado explica 94.76% de la
variabilidad de la vibración observada en el experimento (algo similar nos dice el R2).
Esto significa que los factores estudiados (tipo de broca y velocidad de la ranuradora),
junto con su interacción, son responsables o explican un alto porcentaje de la
variabilidad observada en la variable de respuesta (vibración).
De esta manera, el efecto atribuible a factores no estudiados, ya sea que se hayan
mantenido en un nivel fijo o que hayan tenido pequeñas variaciones, más el efecto de
errores experimentales, fueron pequeños en comparación con el efecto de los factores
estudiados.
Un R2 bajo puede deberse a una o varias de las siguientes razones:
Los factores estudiados, por sí solos no tienen la suficiente influencia para explicar las
variaciones observadas en la variable de respuesta.
• Los niveles de los factores estudiados son demasiado estrechos, por lo que el efecto
sobre la variable de respuesta al cambiar de un nivel a otro es demasiado pequeño.
• Otros factores no estudiados en el experimento no se mantuvieron suficientemente
fijos, por lo que al tener variaciones durante el experimento causaron mucha variación
experimental.
• Los errores experimentales y los errores de medición fueron altos.
Hacer la predicción en un modelo
La predicción en uno de los mejores tratamientos (-1, 1) para minimizar se obtiene al sustituir este
punto en el modelo ajustado :
Ŷ (-1, 1) = 23.83 + 8.32 x1 + 3.77 x2 + 4.35 x1 x2
Ŷ = 23.83 + 8.32 (-1) + 3.77 (1) + 4.35 (-1) (1) = 14.92
Dicho valor es el estimador de la vibración en ese tratamiento .
Análisis de los residuos en un Diseño Factorial
El residuo se define como la diferencia entre el valor observado en cierto tratamiento y la
respuesta predicha por el modelo para tal tratamiento.
Los residuos permiten evaluar varios aspectos de la calidad del modelo (sea un modelo de análisis
de varianza o de regresión) que se propone para los datos, ya que en la medida de que los
residuos sean pequeños, el modelo describirá de mejor manera el comportamiento de la
respuesta.
Diseño Factorial 23
Con el diseño factorial 23 se estudian tres factores en dos niveles cada uno.
Consta de 23 = 2 × 2 × 2 = 8 tratamientos diferentes, los cuales pueden identificarse con las mismas
notaciones introducidas con el diseño 22.
Los tratamientos del diseño 23 y su representación geométrica o región experimental ahora es un
cubo regular centrado en el origen (0, 0, 0), cuyos vértices son los ocho tratamientos.
La matriz de diseño se construye fácilmente alternando el signo menos y el signo más en la primera
columna, dos menos y dos más en la segunda columna, y cuatro menos y cuatro más en la tercera.
Con este diseño se pueden estudiar los 23 – 1 = 7 efectos: tres efectos principales A, B, C; tres
interacciones dobles AB, AC, BC y una interacción triple ABC.
Por lo general, el interés se enfoca en estudiar los efectos principales y las interacciones dobles. Sin
embargo, aunque de antemano se puede considerar la interacción triple ABC en el diseño 23 como un
efecto ignorable, es recomendable asegurarse de que su valor se mantenga pequeño.
Contrastes
Calculo de los efectos – diseño factorial 23
Si se hacen n réplicas de cada tratamiento, los efectos de un
diseño 23 se estiman dividiendo los contrastes entre 4n.
La suma de cuadrados de los efectos se calculan a partir de sus
contrastes con la fórmula:
La suma total de cuadrados se obtiene de la manera usual como:
Experimento 23: ejemplo
Una empresa fabrica dispositivos electrónicos identificó mediante un análisis de Pareto que las
fracturas de las obleas de silicio por choques térmicos era la principal causa de obleas rotas en
las etapas de procesamiento conocidas como “grabado mesa” y “piraña”.
Un grupo de esas áreas identificó a tres factores principales (temperaturas) como las probables
causas del problema.
Por ello, se utilizó un experimento factorial 23 con el objetivo de localizar una combinación de
temperaturas en la cual se rompan un mínimo de obleas por efecto térmico.
Los tres factores controlados y sus niveles en unidades originales, son las temperaturas:
¿Cuales son los efectos?
ANOVA
En general, para un diseño 2k con n réplicas, sea CMerror el cuadrado medio del error que se obtiene
a partir de la tabla de análisis de varianza, entonces el error estándar para un efecto puede ser
estimado por:
Recordemos que el error estándar de un estadístico es una estimación de su desviación estándar, y
ésta a su vez es una estimación de la variación muestral o experimental que tiene dicho estimador.
Así, en el diagrama de Pareto estandarizado se grafica la estimación de los efectos estandarizados:
Para el caso del efecto principal de A para el ejemplo de obleas rotas, tenemos que:
donde el CMerror se obtiene de la tabla de análisis de varianza con todos los efectos incluidos.
Se logra demostrar que el efecto estandarizado sirve de estadístico de prueba para probar la
hipótesis:
contra la alternativa de que el efecto poblacional es diferente de cero.
Así, se rechaza H0 si el valor absoluto del efecto estandarizado es mayor que el valor crítico de
tablas de la distribución T de Student con v grados de libertad: t𝛂/2, v, donde 𝛂 es el nivel de
significancia prefijado para la prueba (por lo general 𝛂 = 0.05), y v son los grados
de libertad asociados al error.
En el ejemplo de las obleas, como el error tiene 8 grados de libertad y se trabaja con 𝛂 = 0.05,
entonces de la tabla para la distribución T de Student (Tabla) se obtiene que el valor crítico
es t0.25, 8 = 2.306.
Por lo tanto, si el valor absoluto de la estimación del efecto estandarizado es mayor que 2.306,
entonces el efecto poblacional correspondiente será estadísticamente diferente de
cero. Una forma sencilla de hacer esta prueba es agregar una línea en el diagrama
de Pareto estandarizado a la altura del valor crítico.
De esta manera, los efectos cuyas barras superen tal línea serán significativos.
El mejor ANOVA ?
Es claro que los efectos AB, BC y ABC son no significativos, por lo que se eliminan y se envían al
error para obtener el análisis de varianza mejorado.
Interpretación
Se observa una interacción importante entre la temperatura de grabado y la temperatura de agua, en
particular se observa que si se trabaja con temperatura alta de grabado, prácticamente da lo mismo utilizar
cualquiera de las dos temperaturas de agua.
Además, al observar graficas de los efectos principales por lo que de aquí y de la gráfica de interacción se
concluye que hay dos condiciones de las tres temperaturas que minimizan el número de obleas
rotas: (1, 1, 1) = (–1°C, 98°C, 70°C) y (1, 1, –1) = (–1°C, 98°C, 20°C).
Representación de los efectos principales para obleas Efecto de interacción AC para obleas.
Grafico de cubo y respuesta predicha para obleas.