EXPERIMENTOS FACTORIALES
Dr. Luis Palomares Alvariño
DISEÑOS FACTORIALES
Los diseños de experimentos vistos hasta ahora eran unifactoriales, vale decir que permiten obtener
conclusiones estadísticas acerca de un solo factor. Y si existen variables intervinientes en el experimento,
entonces existe la posibilidad de bloquear la acción de estas variables intervinientes, bajo el supuesto
principal de que entre estas variables intervinientes no hay interacción.
Sin embargo, en algunos experimentos se desea obtener conclusiones acerca de más de un factor o
variable, considerando la posibilidad de que existan interacciones entre los factores..
Un experimento factorial es un diseño experimental que permite obtener, simultáneamente, conclusiones
acerca de dos o más factores y de sus interacciones.
El término factorial se emplea debido a que las condiciones experimentales comprenden todas las
posibles combinaciones de los niveles de los factores. Si se tiene a niveles del factor A y b niveles del
factor B, se obtendrán datos de ab combinaciones de tratamientos.
En cada ensayo se ejecutan todas las posibles combinaciones de los niveles de los factores. Las unidades
son sometidas a los distintos tratamientos en forma completamente aleatoria.
Los diseños factoriales nos permite estimar efectos de un factor a través de distintos niveles de otros
factores, logrando conclusiones válidas en un rango de condiciones experimentales.
Los supuestos básicos de los diseños factoriales son muy semejantes a los del análisis factorial,
destacándose de manera especial dos supuestos:
La independencia de los resultados
La normalidad de los errores, con media cero y varianza fija σ 2
Las dos condiciones básicas para la ejecución de los diseños experimentales, igual que para otros diseños
de esta naturaleza, son:
La aleatoriedad de aplicación de los tratamientos a las unidades experimentales y
La realización de réplicas del experimento.
Generalmente cuando no se realizan réplicas no es posible procesar los resultados del experimento.
EFECTOS DE UNA FUENTE DE VARIACIÓN
En el lenguaje experimental, a las variables independientes se suele denominarlas fuentes de variación de
la variable respuesta o factor.
En un diseño experimental factorial, cada factor tiene un efecto sobre la variable respuesta, efecto que es
importante conocer por cuanto a partir de su valor se podrá interpretar algunos resultados importantes del
experimento.
Una buena manera de reconocer el efecto de un factor es a través de su coeficiente dentro de una
regresión lineal.
TABLERO DE ANOVA
El proceso estadístico utilizado para analizar los resultados de un diseño factorial es el análisis de
varianza a través de su tablero de ANOVA, que se construye siguiendo algoritmos determinados, que
generalmente son de cierta complejidad, razón por la cual se hará uso del MINITAB para realizarlos,
quedando al investigador la función de interpretar los resultados a la luz de la realidad en la que se
encuentra su problema.
EL MODELO DE REGRESIÓN LINEAL
El hecho de trabajar con dos factores A y B, de los cuales se necesita conocer sus efectos (efectos
principales), permite trabajar bajo un modelo de regresión lineal múltiple donde las variables son A y B.
El modelo de regresión lineal de dos variables es:
y = β0 + β1X1+ β2X2 + …. + βnXn + ε
donde:
Xi representa el i-ésimo factor del experimento
βi representa el coeficientes del i-ésimo factor del modelo de regresión
ε representa el error o residuo del modelo
β0 es una constante
El problema siempre será el cálculo de los coeficientes de los factores, dado que éstos nos proporcionan
idea de los efectos de las factores.
Ejemplo 1
Se ha realizado un experimento para establecer la influencia de la temperatura y la presión sobre la dureza
de un material. Los resultados aparecen en el siguiente cuadro:
Temperatura Presión Dureza
100 20 25
100 40 35
200 20 20
200 40 22
Realizando los cálculos respectivos se obtiene la siguiente ecuación de regresión.
Dureza = 30 - 0.09 Temperatura + 0.3 Presión
¿Qué interpretación tiene la contante 30 ?
¿Qué factor tiene mayor impacto en la dureza, la presión o la temperatura?
CODIFICACIÓN DE LAS VARIABLES
Para evitar las interpretaciones incorrectas y compatibilizar las escalas se utiliza un código, el mismo que
permite estandarizar las escalas y hacerlas comparables, con lo que se logra interpretar bien los
resultados.
La codificación se hace usando la fórmula:
(ηi - η)
Xi = -----------
rango
2
donde:
Xi es la variable codificada
ηi es la variable natural
η es el promedio de los niveles de la variable a ser codificada
Nota: Cuando las variables tiene sólo dos niveles, la codificación produce únicamente +1 y -1 como
variables codificadas.
Temperatura Presión Dureza
-1 -1 25
-1 1 35
1 -1 20
1 1 22
Gráfico con variables codificadas
1 35 22
-1 25 20
-1 0 1
La ecuación sería ahora: Dureza = 25.5 - 4.5 Temperatura + 3 Presión
ESTUDIO DE LOS COEFICIENTES
Lo que se quiere es saber si los efectos principales son o no significativos dentro del modelo. La hipótesis
a probar para cualquier coeficiente j, es:
Ho: βj = 0
H1: βj 0
Si esta hipótesis no es rechazada, entonces la variable j, asociada con este coeficiente puede ser eliminada
del modelo.
PROCESO DE UN DISEÑO FACTORIAL CON AYUDA DEL MINITAB
Para resolver el ejemplo 1 procedemos según el siguiente algoritmo:
1. Entrar a Estadística, DOE, Factorial, Creación del diseño factorial, click.
2. Por defecto aparece 2 niveles y 2 factores, igual a lo que necesitamos. Click en Diseño, por
defecto número de puntos centrales 0, número de réplicas 1 y número de bloques 1.Ok.
3. Click en opciones. Eliminar el randomizador. Ok. Ok.
4. Aparece
Results for: Worksheet
Full Factorial Design
Factors: 2 Base Design: 2, 4
Runs: 4 Replicates: 1
Blocks: 1 Center pts (total): 0
All terms are free from aliasing.
5. Regresar a la hoja de trabajo. Crear la columna Dureza. Ingresar los datos en orden.
6. Entrar a Estadística, DOE, Factorial, Análisis del diseño factorial.Click.
7. Aparece
Factorial Fit: Dureza versus A, B
Estimated Effects and Coefficients for Dureza (coded units)
Term Effect Coef
Constant 25.500
A 6.000 3.000
B -9.000 -4.500
A*B -4.000 -2.000
S = * PRESS = *
Analysis of Variance for Dureza (coded units)
Source DF Seq SS Adj SS Adj MS F P
Main Effects 2 117.00 117.00 58.50 * *
A 1 36.00 36.00 36.00 * *
B 1 81.00 81.00 81.00 * *
2-Way Interactions 1 16.00 16.00 16.00 * *
A*B 1 16.00 16.00 16.00 * *
Residual Error 0 * * *
Total 3 133.00
Que no se pueden analizar porque el tablero de ANOVA está incompleto. Esto se debe a que en el
proceso no se realizaron réplicas.
Problema con dos réplicas
Veamos ahora el mismo problema, pero con dos réplicas:
Temperatura Presión Dureza Dureza
-1 -1 25 22
-1 1 35 36
1 -1 20 24
1 1 22 22
El algoritmo es igual al anterior, solo que cuando me solicitan número de réplicas pongo 2.
1. Entrar a Estadística, DOE, Factorial, Creación del diseño factorial, click.
2. Por defecto aparece 2 niveles y 2 factores, igual a lo que necesitamos. Click en Diseño, por defecto
número de puntos centrales 0, número de réplicas 2 y número de bloques 1.Ok.
3. Click en opciones. Eliminar el randomizador. Ok. Ok.
4. Aparece algo semejante al caso anterior.
5. Regresar a la hoja de trabajo. Crear la columna Dureza. Ingresar los datos en orden.
6. Entrar a Estadística, DOE, Factorial, Análisis del diseño factorial.Click.
7. Ingresar a Gráficos. Elegir: Efectos de los plot normal. Normal plot, Residual versus orden. OkOk
8. Aparece
En la hoja de sesión:
Factorial Fit: Dureza versus A, B
Estimated Effects and Coefficients for Dureza (coded units)
Term Effect Coef SE Coef T P
Constant 25.750 0.6374 40.40 0.000
A 6.000 3.000 0.6374 4.71 0.009
B -7.500 -3.750 0.6374 -5.88 0.004
A*B -6.000 -3.000 0.6374 -4.71 0.009
S = 1.80278 PRESS = 52
R-Sq = 95.18% R-Sq(pred) = 80.71% R-Sq(adj) = 91.56%
Analysis of Variance for Dureza (coded units)
Source DF Seq SS Adj SS Adj MS F P
Main Effects 2 184.50 184.50 92.250 28.38 0.004
A 1 72.00 72.00 72.000 22.15 0.009
B 1 112.50 112.50 112.500 34.62 0.004
2-Way Interactions 1 72.00 72.00 72.000 22.15 0.009
A*B 1 72.00 72.00 72.000 22.15 0.009
Residual Error 4 13.00 13.00 3.250
Pure Error 4 13.00 13.00 3.250
Total 7 269.50
Interpretaciones:
1. La constante de regresión es 25.75.
2. El coeficiente de la temperatura es 3 y su efecto 6. El coeficientes de la presión es -3.75 y su
efecto es -7.5. El coeficiente de la interacción es -3 y su efecto -6.
3. Los cuatro coeficientes son significativos. Ninguno es cero a nivel poblacional.
4. La presión tiene mayor efecto y negativo. A medida que aumenta la presión la dureza disminuye.
5. El tablero ANOVA corrobora lo anterior en forma global.
Además aparecen tres gráficos:
Versus Order
(response is Dureza)
1
Residual
-1
-2
1 2 3 4 5 6 7 8
Observation Order
Normal Plot of the Standardized Effects
(response is Dureza, Alpha = 0.05)
99
Effect Ty pe
Not Significant
95 Significant
90 F actor N ame
A A
80 A B B
70
Percent
60
50 AB
40
30
20 B
10
1
-5.0 -2.5 0.0 2.5 5.0
Standardized Effect
Normal Probability Plot
(response is Dureza)
99
95
90
80
70
Percent
60
50
40
30
20
10
1
-4 -3 -2 -1 0 1 2 3 4
Residual
Interpretaciones:
1. El primer gráfico muestra que las observaciones se realizaron al azar, dado que el gráfico no
sigue ninguna ley de formación. Lo que satisface el supuesto de la independencia de los
resultados.
2. El segundo gráfico confirma lo que la regresión dijo. Los tres elementos, el factor temperatura,
el factor presión y la interacción de los dos factores, son significativos en el experimento.
3. El tercer gráfico confirma el segundo supuesto. Los residuales, estimaciones puntuales de los
errores se distribuyen normalmente.
Finalmente, se puede concluir que los resultados obtenidos son confiables para poder tomar decisiones
respecto de la influencia de la temperatura y la presión en la dureza del material en estudio.
DISEÑO DE EXPERIMENTOS FACTORIALES 2k
Son diseños con k factores, cada uno de los cuales tiene 2 niveles. El ejemplo estudiado corresponde al
diseño 22 .
El proceso que se sigue para resolverlos es semejante al descrito en el ejemplo 1.
También se puede hacer uso de ANOVA sobre todas las combinaciones posibles de los factores.
Ejemplo 2
Se está estudiando el efecto que tienen la temperatura, la humedad y la latitud en el grosor de la corteza
de un tipo de árbol. Se ha decidido utilizar un diseño factorial por cuanto se presupone que la interacción
de esos factores puede tener una influencia interesante en el fenómeno.
Cada uno de los factores se ha considerado en dos niveles.
Se determinan cuatro columnas de la hoja de trabajo del MINITAB: Grosor, factor A, factor B y factor C
respectivamente.
Luego se presentan las columnas que muestren las posibles combinaciones de los factores: AB, AC, BC,
ABC. Se presentan los datos codificados.
grosor A B C AB AC ABC
21 -1 -1 -1 1 1 -1
23 -1 -1 1 1 -1 1
23 -1 1 -1 -1 1 1
21 -1 1 1 -1 -1 -1
21 1 -1 -1 -1 -1 1
15 1 -1 1 -1 1 -1
16 1 1 -1 1 -1 -1
17 1 1 1 1 1 1
15 -1 -1 -1 1 1 -1
20 -1 -1 1 1 -1 1
22 -1 1 -1 -1 1 1
22 -1 1 1 -1 -1 -1
19 1 -1 -1 -1 -1 1
18 1 -1 1 -1 1 -1
10 1 1 -1 1 -1 -1
19 1 1 1 1 1 1
El algoritmo es el siguiente:
1. Seleccionar el menú Estadística. Elegir ANOVA. Elegir Modelo lineal general. Click.
2. Ingresar grosor en respuesta. En modelo ingresar A B C AB AC ABC.
3. Ingresar a Gráficos y seleccionar: Normal de residuales y Residuales versus orden. Ok.
4. Ingresar a Estorage y seleccionar Residuales. Ok. Ok.
5. Aparece
General Linear Model: grosor versus A, B, C, AB, AC, ABC
Factor Type Levels Values
A fixed 2 -1, 1
B fixed 2 -1, 1
C fixed 2 -1, 1
AB fixed 2 -1, 1
AC fixed 2 -1, 1
ABC fixed 2 -1, 1
Analysis of Variance for grosor, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
A 1 64.000 64.000 64.000 10.67 0.010
B 1 0.250 0.250 0.250 0.04 0.843
C 1 4.000 4.000 4.000 0.67 0.435
AB 1 25.000 25.000 25.000 4.17 0.072
AC 1 0.250 0.250 0.250 0.04 0.843
ABC 1 42.250 42.250 42.250 7.04 0.026
Error 9 54.000 54.000 6.000
Total 15 189.750
S = 2.44949 R-Sq = 71.54% R-Sq(adj) = 52.57%
Interpretaciones
1. El factor A y la triple interacción son significativas.
2. Muy próximo a ser significativo está la interacción AB.
3. Los demás no son significativos
Versus Order
(response is grosor)
4
1
Residual
-1
-2
-3
-4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Observation Order
Normal Probability Plot
(response is grosor)
99
95
90
80
70
Percent
60
50
40
30
20
10
1
-5.0 -2.5 0.0 2.5 5.0
Residual
Los gráficos muestran que se están cumpliendo los dos supuestos básicos: La independencia de los
resultados y la normalidad de los errores.
Para determinar el efecto de los factores se realiza una regresión múltiple, cuyo resultado es el siguiente:
Regression Analysis: grosor versus A, B, C, AB, AC, ABC
The regression equation is
grosor = 18.9 - 2.00 A - 0.125 B + 0.500 C - 1.25 AB - 0.125 AC + 1.62 ABC
Predictor Coef SE Coef T P
Constant 18.8750 0.6124 30.82 0.000
A -2.0000 0.6124 -3.27 0.010
B -0.1250 0.6124 -0.20 0.843
C 0.5000 0.6124 0.82 0.435
AB -1.2500 0.6124 -2.04 0.072
AC -0.1250 0.6124 -0.20 0.843
ABC 1.6250 0.6124 2.65 0.026
S = 2.44949 R-Sq = 71.5% R-Sq(adj) = 52.6%
Analysis of Variance
Source DF SS MS F P
Regression 6 135.750 22.625 3.77 0.037
Residual Error 9 54.000 6.000
Total 15 189.750
Donde se puede notar que los factores B y C, así como la interacción AC no son significativos, por lo que
podría eliminarse del proceso y volver a encontrar la regresión múltiple.
Eliminamos B, C y AC, la regresión sería la siguiente:
Regression Analysis: grosor versus A, AB, ABC
The regression equation is
grosor = 18.9 - 2.00 A - 1.25 AB + 1.63 ABC
Predictor Coef SE Coef T P
Constant 18.8750 0.5520 34.19 0.000
A -2.0000 0.5520 -3.62 0.003
AB -1.2500 0.5520 -2.26 0.043
ABC 1.6250 0.5520 2.94 0.012
S = 2.20794 R-Sq = 69.2% R-Sq(adj) = 61.5%
Analysis of Variance
Source DF SS MS F P
Regression 3 131.250 43.750 8.97 0.002
Residual Error 12 58.500 4.875
Total 15 189.750
Donde se observa que los tres son significativos a la vez que presentan sus respectivos efectos.
DISEÑO DE EXPERIMENTOS FACTORIALES K2
Son diseños en los que hay 2 factores, cada uno de los cuales puede tener k niveles. Técnicamente serían
diseños factoriales k 2
Su complejidad operativa puede soslayarse usando el ANOVA Tow-way.
Ejemplo 3
Para capacitar a los empleados de una empresa se puede utilizar tres programas:
Una sesión de cuatro horas, en las que se repasan los elementos más importantes de un proceso.
Un programa de un día donde se realizan simulaciones de la prueba de evaluación final.
Un curso de diez semanas en el que se determinan las debilidades de cada empleado y se diseña
un proceso personalizado.
Se quisiera averiguar si el tipo de programa tiene influencia sobre la naturaleza de funciones que realizan
los empleados, entonces se decide evaluar a tres áreas: administración, contabilidad y ventas.
El responsable del proceso considera que un diseño factorial podría ser de mucha utilidad en este caso.
Aleatoriamente se eligen 18 empleados, 6 de cada grupo. A dos empleados de cada grupo se le asigna,
aleatoriamente, uno de los programas. Se realiza la capacitación y se obtienen los siguientes resultados:
Administración Contabilidad Ventas
Programa 1 500 540 480
580 460 400
Programa 2 460 560 420
540 620 480
Programa 3 560 600 480
600 580 410
Los factores son dos: Tipo de programa y Área de trabajo. Cada uno con tres niveles.
El algoritmo de trabajo sería el siguiente:
1. Codificar los niveles de cada factor con 1, 2 y 3 respectivamente
2. Crear tres columnas: C1 puntaje, C2 factor programa y C3 factor área.
3. Ingresar los datos con mucho cuidado, para conservar el código adecuado.
puntaje Factor AFactor B
500 1 1
580 1 1
540 1 2
460 1 2
480 1 3
400 1 3
460 2 1
540 2 1
560 2 2
620 2 2
420 2 3
480 2 3
560 3 1
600 3 1
600 3 2
580 3 2
480 3 3
410 3 3
4. Seleccionar el menú Estadística. Elegir ANOVA. Elegir Two-way. Clik
5. En respuesta ingresar puntaje. En factor fila ingresar programa y en factor columna ingresar
área.
6. Elegir guardar residuales. Ok.
7. Aparece
Two-way ANOVA: puntaje versus Factor A, Factor B
Source DF SS MS F P
Factor A 2 6100 3050.0 1.38 0.299
Factor B 2 45300 22650.0 10.27 0.005
Interaction 4 11200 2800.0 1.27 0.350
Error 9 19850 2205.6
Total 17 82450
S = 46.96 R-Sq = 75.92% R-Sq(adj) = 54.52%
Interpretaciones
1. No aparece la ecuación de regresión, de manera que no se puede saber el efecto de cada factor.
2. El único factor que tiene influencia es el segundo, el área de trabajo.
3. Ni el factor programa, ni la interacción de los dos factores tiene significación.
Ejemplo 4
Se desea averiguar cómo algunas de las piezas de una bicicleta afectan su funcionamiento. En particular
se está interesado en los efectos de variar la altura de la montura, la presión de los neumáticos y el uso del
dinamo.
Se decidió utilizar un diseño factorial 23, para un mismo recorrido. Se midieron dos respuestas: el tiempo
en segundos de hacer el recorrido de la manera más rápida posible. Luego tener una idea de la energía
consumida a base de tomarse el pulso, inmediatamente antes y después de la carrera. Antes de cada
experimento se dio dos vueltas a la manzana a velocidad lenta como precalentamiento. Al acabar el
calentamiento, se esperó a que el pulso bajase a 75-80 pulsaciones por minuto, entonces comenzaba el
recorrido. Al acabar el recorrido se tomó el pulso nuevamente. Para aleatorizar el proceso se tomó 16
trozos de papel enumerados del 1 al 16 y al azar se elegía el experimento.
Los datos originales fueron los siguientes:
Exp Altura Dinamo Presión P. antes P. después Tiempo
1 -1 -1 -1 76 135 51
2 -1 -1 -1 76 133 54
3 1 -1 -1 76 132 41
4 1 -1 -1 79 137 43
5 -1 1 -1 77 134 54
6 -1 1 -1 77 133 60
7 1 1 -1 76 130 44
8 1 1 -1 79 139 43
9 -1 -1 1 76 105 50
10 -1 -1 1 80 144 48
11 1 -1 1 77 139 39
12 1 -1 1 78 139 39
13 -1 1 1 78 137 53
14 -1 1 1 79 125 51
15 1 1 1 80 122 41
16 1 1 1 77 133 44
Desarrollar el diseño y proporcionar todas las interpretaciones posibles.