Unidad 4 Estadística Inferencial 2 Ing.
Industrial
Diseños factoriales
CONCEPTOS BÁSICOS EN DISEÑOS FACTORIALES
Muchos experimentos se llevan a cabo para estudiar los efectos producidos por
dos o más factores. Por factor debemos entender una variable independiente (x),
que influye de alguna manera en la respuesta de otra variable dependiente (y).
Si hablamos de procesos podemos decir que un experimento es una prueba en
la que se inducen cambios deliberadamente, al introducir una variable (x) al
sistema con el propósito de observar los cambios en la respuesta de salida (y).
En el diseño experimental puede interesarnos probar más de una variable “x”, a
las cuales (por conveniencia) llamaremos “factores A, B, C etc.” además
podemos probar diferentes niveles de cada factor (los cuales representamos por
letras minúsculas), por tanto podemos decir que en un diseño experimental nos
interesa probar los “a” niveles del factor “A” y los “b” niveles del factor “B”.
Un diseño factorial es, entonces, aquel en el que se investiga más de un factor
a la vez, además se prueban todas las posibles combinaciones de los niveles de
los factores en cada ensayo o réplica del experimento.
Los diseños factoriales producen experimentos más eficientes, pues cada
observación proporciona información sobre todos los factores, y es factible ver
las respuestas de un factor en diferentes niveles de otro factor. (Kuehl, 2001:
p.175)
El efecto de un factor se define como el cambio en la respuesta producido por
un cambio en el nivel del factor. Esto se denomina un efecto principal porque
se refiere a los factores principales en el estudio. Por ejemplo, consideremos los
datos de la tabla 1.
Factor B
Factor A B1 B2
A1 10 20
A2 30 40
Tabla 1. Experimento factorial con dos factores.
El efecto principal de factor A es la diferencia entre la respuesta promedio en el
primer nivel de A y la respuesta promedio en el segundo nivel de A,
numéricamente tenemos:
30 40 10 20
A 20
2 2
Esto es, el cambio del factor A del nivel 1 al nivel 2 ocasiona un incremento en
la respuesta promedio de 20 unidades. De modo similar, el efecto principal de B
es:
20 40 10 30
B 10
2 2
Existen experimentos en los que la diferencia en la respuesta entre los niveles
de un factor no es la misma en todos los niveles de los otros factores. Cuando
esto ocurre, hay una interacción entre ellos. Por ejemplo, en los datos siguientes:
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 1
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
Tabla 2. Experimento factorial con dos factores
Factor B
Factor A B1 B2
A1 10 20
A2 30 0
En el primer nivel del factor B, el efecto de A es
A = 30 – 10 = 20
y en el segundo nivel del factor B, el efecto de A es:
A = 0 – 20 = -20
Como podemos ver el efecto de A depende del nivel elegido de B, esto indica
que existe una interacción entre A y B. Es posible ver gráficamente esta
interacción, por ejemplo si graficamos los datos de las tablas 1 y 2 tenemos:
Datos de tabla 1
Datos de tabla 2
50
50
B2
40
Observación
40
30 B1 Observación
30
B2
20 B1
20 B2
10 B1 B1
10
0
0
B2
A1 A2
A1 A2
Factor A
Factor A
Figura 1. Representación gráfica de los efectos del factor B.
En la gráfica de los datos de la tabla 1 vemos que las líneas B 1 y B2 son
aproximadamente paralelas, lo que indica que los factores A y B no interactúan
en forma significativa. En cambio en la gráfica de los datos de la tabla dos vemos
que las líneas B1 y B2 no son paralelas, señalando la interacción entre los
factores A y B. Este tipo de gráficos a menudo son útiles en la presentación de
resultados de experimentos.
Cuando una interacción es grande, los efectos principales correspondientes
tienen poca importancia. Por ejemplo, empleando los datos de la tabla 2
encontramos que el efecto principal de A es:
30 0 10 20
A 0
2 2
Si analizamos solamente el efecto de A tendríamos que concluir que no hay
efecto en A. Sin embargo, si examinamos los efectos de A en los diferentes
niveles del factor B, vemos que el efecto del factor A depende de los niveles del
factor B. En estos casos el conocimiento de la interacción AB es más útil que el
conocimiento del efecto principal, ya que una interacción significativa puede
enmascarar la importancia de los efectos principales. (Hines, Montgomery, 1997.
p 454-456)
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 2
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
Ventajas de los diseños factoriales
Si se analizan los datos variando solo un factor a la vez, es necesario tomar en
cuenta que existe el error experimental y se deben realizar al menos dos
observaciones para cada combinación y comparar las respuestas promedio.
La ventaja de trabajar con diseños factoriales es que se requiere de menos
observaciones, ya que se toman todas las combinaciones posibles de los
diferentes niveles y las posibles interacciones al mismo tiempo, esto reduce el
número de observaciones requeridas y al mismo tiempo se aumenta la eficiencia
relativa del análisis.
Los diseños factoriales son necesarios cuando alguna interacción puede estar
presente, con el propósito de evitar hacer conclusiones engañosas. Además los
diseños factoriales permiten estimar los efectos de un factor en diversos niveles
de los otros factores, produciendo conclusiones válidas sobre toda la extensión
de las condiciones experimentales.
DISEÑOS FACTORIALES CON DOS FACTORES
El modelo más sencillo de diseños factoriales es el de dos factores, en el cual
hay a niveles del factor A y b niveles del factor B; este modelo contiene en cada
repetición o réplica, todas las combinaciones de tratamiento ab. En general hay
n repeticiones.
En un diseño completamente aleatorizado, el orden en el que se toman las abn
observaciones es aleatorio.
El modelo estadístico lineal es:
i = 1, 2... a
yijk i j ( ) ij ijk j = 1,2,...,b
k= 1,2,...,n
donde:
— efecto medio general
i — efecto del i-ésimo nivel del factor renglón A
βj — efecto del j-ésimo nivel del factor columna B
( )ij — efecto de la interacción entre i y j
ijk — componente del error aleatorio
Los efectos de tratamiento se definen como desviaciones de la media general,
a b
por lo tanto i 1
i 0 y
j 1
j 0. Se supone que los efectos de interacción son
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 3
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
a
fijos y que se definen de manera que ( )
i 1
ij 0 . Hay un total de an
observaciones porque se realizan n réplicas.
Como los factores de renglón y columna son importantes en un diseño de
bifactorial, interesa probar las hipótesis sobre la igualdad de los efectos de
tratamiento de renglón:
H 0 : 1 2 ... a 0
H 1 : al menos una i 0
y de la igualdad de los efectos de tratamiento de columna:
H 0 : 1 2 ... b 0
H 1 : al menos una j 0
También es interesante determinar si los tratamientos de renglón y columna
interaccionan, esto es:
H 0 : ( ) ij 0 para toda i, j
H 1 : al menos una ( ) ij 0
Análisis estadístico del modelo factorial con 2 factores:
Tabla 1. Elementos para el análisis de variancia en un modelo bifactorial.
Fuente de Suma de cuadrados Grados de Media de
variación libertad cuadrados F0
a 2 2 SS MS
F0
Y i y A A
Tratamiento A SSA= a-1 MSA=
a 1 MS
bn
i 1
abn E
b
Y 2 j y 2 SS B MS B
Tratamiento B SSB=
j 1
an
abn
b-1 MSB=
b 1
F0
MS E
MSAB= MS AB
F0
Interacción SSAB= SS subtotales SS A SS B (a –1)(b –1) SS AB MS E
(a 1)(b 1)
SSE= SS T SS subtotales MSE=
Error ab(n-1) SS E
ab(n 1)
Total a b n
y 2
SST= y
i 1 j 1 k 1
2
ijk
abn
(abn)-1
a b
y 2 ij y 2
Donde: SS subtotales
i 1 j 1
n
abn
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 4
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
Ejemplo 1:
Un ingeniero diseña una batería para su uso en un dispositivo que será sometido
a ciertas variaciones extremas de temperatura. El único parámetro de diseño
que él puede seleccionar en este punto es el material de la cubierta de la batería,
y tiene tres alternativas. Cuando el dispositivo se manufactura y se envía al
campo, el ingeniero no tiene control sobre los extremos de temperatura que será
expuesto el dispositivo, y sabe por experiencia que es probable que la
temperatura influya en la duración efectiva de la batería. Sin embargo, si es
posible controlar la temperatura en el laboratorio de desarrollo de productos para
los fines de ensayo.
El ingeniero decide probar los tres materiales de la cubierta a tres niveles de
temperatura (15, 70 y 125ºF) consistentes en el entorno de uso final del producto.
Se prueban cuatro baterías a cada combinación de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.
Al ingeniero le interesa dar respuesta a las siguientes preguntas:
1.- ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de
la batería?
2.- ¿Existe una elección del material que dé por resultado una duración
uniformemente larga sin importar la temperatura?
En la tabla 4, se registraron los resultados que se obtuvieron después de las
pruebas.
Tabla 2. Datos de duración (en horas) para el problema de diseño de una batería.
Tipo de material Temperatura (ºF) (B)
(A) 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
2 150 188 136 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 5
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
DISEÑOS FACTORIALES CON TRES FACTORES
Un diseño experimental completamente aleatorizado de tres factores tiene A, B
y C factores con a, b y c niveles respectivamente. El análisis de variancia
contempla los tres efectos principales e interacciones que se involucran.
El modelo estadístico para un diseño de tres factores es.
i= 1,2,...,a
yijkl i j k ( ) ij ( ) ik ( ) jk ( )ijk ijkl j= 1,2,...,b
k=1,2,...,c
Donde: l= 1,2,...,n
i , j , k son los efectos principales,
( ) ij , ( ) ik , ( ) jk
son las interacciones de dos factores y ( ) ijk es el efecto de
interacción de tres factores.
El análisis de variancia para el modelo de tres factores es:
Tabla 1. Análisis de variancia para el modelo de tres factores.
Fuente de Suma de cuadrados Grados de Media de
variación libertad cuadrados F0
A a
y 2 i y 2 a-1 SS A MS A
SS A i 1
bcn
abcn a 1 MS E
B b
y 2 j y 2 b-1 SS B MS B
SS B j 1
acn
abcn b 1 MS E
C c
y 2 k y 2 c-1 SS C MS C
SS C k 1
abn
abcn c 1 MS E
AB a b
y 2 ij y 2 (a-1) (b-1) SS AB MS AB
SS AB
i 1 j 1
cn
abcn
SS A SS B (a 1)(b 1) MS E
AC a c
y 2 ik y 2 (a-1) (c-1) SS AC MS AC
SS AC
i 1 k 1
bn
abcn
SS A SS C (a 1)(c 1) MS E
BC b c
y 2 jk y 2 (b-1) (c-1) SS BC MS BC
SS BC
j 1 k 1
an
abcn
SS B SS C (b 1)(C 1) MS E
ABC a b c
y 2ijk y 2 (a-1)(b-1)(c-1) SS ABC MS ABC
SS ABC
i 1 j 1 k 1
n
abcn (a 1)(b 1)(c 1) MS E
SS A SS B SSC SS AB SS AC SS BC
Error SS E SST SS subtotales( ABC ) abc(n-1) SS E
abc(n 1)
Total a b c n
y 2 (abcn)-1
SS T y
i 1 j 1 k 1 l 1
2
ijkl
abcn
Donde:
a b c
y 2 ijk y 2
SS Subtotales( ABC ) i 1 j 1 k 1
n
abcn
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 6
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
Ejemplo:
Problema de embotellamiento de gaseosa
Un embotellador de bebida gaseosa desea obtener mayor uniformidad en la
altura de llenado de las botellas que salen de su proceso de manufactura. En
teoría, la máquina llenadora introduce líquido en cada botella hasta la altura
objetivo correcta, pero en la práctica existe variación alrededor de este objetivo,
y el fabricante quisiera comprender mejor las fuentes de esta variabilidad para
poder reducirla.
El ingeniero de proceso puede controlar tres variables durante el proceso de
llenado: porcentaje de carbonatación (A), presión de trabajo en la llenadora (B)
y número de botellas que se llenan por minuto, o velocidad de la línea (C).
Presión y velocidad son fáciles de controlar, pero el porcentaje de carbonatación
(CO2, gaseoso) es más difícil de regular durante la manufactura real debido a
que varía con la temperatura del producto. Sin embargo, para los fines de un
experimento, el ingeniero puede controlar la carbonatación a tres niveles: 10, 12
y 14%. Elige dos niveles para la presión (25 y 30 Ib/plg2, o psi) y dos para la
velocidad de la línea (200 y 250 botellas por minuto, bpm). Decide hacer dos
réplicas de un diseño.
Presión de operación (B)
% de
25 psi 30 psi
carbonatación
(A) Rapidez de la línea (C ) Rapidez de la línea (C )
200 250 200 250
10 -3 -1 -1 1
-1 0 0 1
12 0 2 2 6
1 1 3 5
14 5 7 7 10
4 6 9 11
H 0 : H 0 : 2 1
1 32 0 0
H 1 : alHmenos nivelab i j 00
para ununnivel
1 : al menos
H0 :1 2 0 H 0 : ( ) ij 0 para toda i, j
H 1 : al menos un nivel c k 0 H 1 : al menos una ( ) ij 0
H 0 : ( )ik 0 para toda i, k H 0 : ( ) jk 0 para toda j, k
H1 : al menos una ( )ik 0 H1 : al menos una ( ) jk 0
H 0 : ( ) jk 0 para toda i, j , k
H 1 : al menos una ( ) jk 0
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 7
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
DISEÑO FACTORIAL GENERAL
Los diseños factoriales de 2 factores se pueden extender al caso general, donde
existen a niveles del factor A, b niveles del factor B, c niveles del factor C y así
sucesivamente, arreglos con un experimento factorial. En general habrá un total
de abc...n observaciones si hay n réplicas del experimento completo. Se deben
recopilar al menos dos réplicas para determinar la suma de cuadrados del error
si todas las posibles interacciones en el modelo son incluidas.
Si los factores del experimento son fijos se pueden probar los efectos principales
y el de la interacción dividiendo la MS de los efectos principales o de la
interacción sobre MSE. Todas estas pruebas F corresponden a pruebas
unilaterales del extremo superior. Los grados de libertad de cualquier efecto
principal son iguales al número de niveles del factor menos uno; y los grados de
libertad de una interacción son el producto de los grados de libertad asociados
con los componentes individuales de la interacción.
Los diseños factoriales simples suelen expresarse en términos multiplicativos,
por ejemplo: el factor A tiene 3 niveles y el factor B tiene 4, podemos expresar
un diseño 3 X 4, significa que tenemos un total de 12 tratamientos. También los
niveles de cada factor tienen un orden, o pueden ser en forma discreta o
continua.
Los diseños factoriales generales involucran en su análisis también a variables
categóricas o donde no hay elementos para definir un orden en sus tratamientos
o niveles. Es importante remarcar que, cuando consideramos variables
categóricas en el análisis, no es conveniente hacer superficies de respuesta, ya
que el modelo o comportamiento observado sería aleatorio y no se podrían
concretar los parámetros para su modelación y simulación.
En ambos diseños se pueden usar todas las herramientas y técnicas estadísticas
para el análisis de las variaciones entre sus tratamientos, sus efectos y
diferencias estadísticamente significativas, con algunas restricciones en los
modelos de regresión y ajustes cuando se consideran variables independientes
de tipo categórico o nominal.
El siguiente es un ejemplo de un diseño factorial general cuyas variables son
categóricas.
Ejemplo 1:
Hines, Montgomery, (1997); Probabilidad y estadística, ejemplo 13-7 p.517
Un artículo de Industrial Quality Control (1956, p 5-8) describe un experimento
para investigar el efecto de dos factores (tipo de vidrio y tipo de fósforo) en la
brillantez de un tubo de televisión. La variable de respuesta medida es la
corriente necesaria (en microamperes) para obtener un nivel de brillantez
especificado. Los datos se muestran a continuación. Analice los datos y extraiga
conclusiones, suponiendo que ambos factores son fijos.
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 8
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
Tabla 1. Datos obtenidos en el ejemplo 1 (microampers)
Tipo de vidrio Tipo de fósforo (factor B)
(Factor A) 1 2 3
280 300 290
A 290 310 285
285 295 290
230 260 220
B 235 240 225
240 235 230
Tabla 3. análisis de variancia para el ejemplo 1.
MODELOS DE EFECTOS ALEATORIOS
Se considera de efectos aleatorios cuando los niveles de los factores A y B se
eligen al azar de poblaciones más grandes. Las inferencias pueden
generalizarse a todos los niveles de las poblaciones en estudio, porque los a
niveles de A y los b niveles de B se eligieron al azar. Las observaciones se
pueden representar mediante el modelo lineal
i = 1,2,….a
yijk i j ( ) ij ijk j = 1,2,….b
k =1,2,….c
Las hipótesis que deben probarse son:
H 0 : 2 0 H0 : 2 0 H 0 : 2 0
Este modelo es muy similar al de efectos aleatorios de clasificación en un
sentido.
El análisis de variancia (SSA, SSB, SSAB, SST, SSE) se calcula de la misma
manera que en el modelo de efectos fijos. Sin embargo la estadística
apropiada para probar la hipótesis H 0 : 0 es
2
MS AB
F0 donde Fo tiene una distribución Fα, (a-i)(b-i), ab(n-i)
MS E
al probar H0: σ 2ґ = 0 debe usarse
MS A
F0 Con F α, a-1,(a-1)(b-1)
MS AB
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 9
Unidad 4 Estadística Inferencial 2 Ing. Industrial
Diseños factoriales
al probar H 0 : 2 0 debe usarse
MS B
F0 Con F α, b-1,(a-1)(b-1)
MS AB
Como ejercicio trabajaremos con el ejemplo 1 de la lectura Diseños factoriales
con dos factores, para esto supondremos que de un número grande de tipos de
material para la cubierta de la batería se eligieron los 3 que se probaron; y los
niveles de temperatura fueron elegidos también en forma aleatoria. En este caso
el modelo resulta ser de efectos aleatorios, y el análisis de variancia resulta ser:
Análisis estadístico del modelo de efectos aleatorios:
Tabla 1. Análisis de variancia para el ejemplo 1 de la lectura Diseños factoriales
con dos factores (problema de las baterías).
Fuente de Suma de Grados de Media de
variación cuadrados libertad cuadrados F0
SSA=10 683.72 a – 1
Tratamiento A 2 MSA=5 341.86 2.22
SSB=39 118.72 b – 1
Tratamiento B 2 MSB=19 558.36 8.13*
(a –1)(b –1)
Interacción SSAB=9 613.78 4 MSAB=2 403.44 3.56
ab(n-1)
Error SSE=18 230.75 27 MSE=675.21
Total SST=77 646.97 (abn)-1
35
* Relación de variancia (F-Fisher) con valor estadístico significativo y con una p≤.05.
Apuntes elaborados por: M.C. Elvia Vásquez Cruz Página 10