Introducción a Diseños Factoriales en Estadística
Introducción a Diseños Factoriales en Estadística
DISEÑOS FACTORIALES
2.1 Historia
Los diseños factoriales fueron utilizados en el siglo XIX por John Bennet Lawes y Joseph
Henry Gilbert de la Estación Experimental Rothamsted.
Ronald Fisher argumentó en 1926 que los diseños "complejos" (como los diseños
factoriales) eran más eficientes que estudiar un factor a la vez. [2]
Fisher pensaba que un diseño factorial permite determinar el efecto de varios factores e
incluso las interacciones entre ellos con el mismo número de ensayos necesarios para
determinar cualquiera de los efectos por sí solo con el mismo grado de precisión.
2.2 Definición
En estadística , un experimento factorial completo es un experimento cuyo diseño consta
de dos o más factores, cada uno con posibles valores o "niveles" discretos, y cuyas
unidades experimentales toman todas las combinaciones posibles de estos niveles en
todos los factores, como se muestra en la Figura 1.1. . Un diseño factorial completo
también puede denominarse diseño completamente cruzado. Un experimento de este tipo
permite al investigador estudiar el efecto de cada factor sobre la variable de respuesta ,
así como los efectos de las interacciones entre factores sobre la variable de respuesta.
Para la gran mayoría de experimentos factoriales, cada factor tiene sólo dos niveles. Por
ejemplo, con dos factores, cada uno de los cuales toma dos niveles, un experimento
factorial tendría cuatro combinaciones de tratamientos en total y generalmente se
denomina diseño factorial 2×2.
Figura 2.1
Probablemente la forma más sencilla de empezar a comprender los diseños factoriales sea
mirando un ejemplo. Imaginemos un diseño en el que tenemos un programa educativo en
el que nos gustaría ver una variedad de variaciones del programa para ver cuál funciona
mejor. Por ejemplo, nos gustaría variar la cantidad de tiempo que los niños reciben
instrucción: un grupo recibe 1 hora de instrucción por semana y otro recibe 4 horas por
semana. Y nos gustaría variar el entorno: un grupo recibe instrucción en clase
(probablemente trasladado a un rincón del aula) y el otro grupo sale del aula para recibir
instrucción en otra sala.
Comencemos por definir algunos términos. En los diseños factoriales, un factor es una
variable independiente importante. En este ejemplo tenemos dos factores: tiempo de
instrucción y entorno. Un nivel es una subdivisión de un factor. En este ejemplo, el
tiempo en la instrucción tiene dos niveles y el entorno tiene dos niveles. A veces
representamos un diseño factorial con notación numérica. En este ejemplo, podemos
decir que tenemos un diseño factorial de 2 x 2 (hablado "dos por dos"). En esta notación,
la cantidad de números te indica cuántos factores hay y los valores numéricos te indican
cuántos niveles. Si dijera que tengo un diseño factorial de 3 x 4, sabrías que tengo 2
factores y que un factor tiene 3 niveles mientras que el otro tiene 4. El orden de los
números no hace ninguna diferencia y fácilmente podríamos denominarlo como un
diseño factorial de 4 x 3. El número de grupos de tratamiento diferentes que tenemos en
cualquier diseño factorial se puede determinar fácilmente multiplicando mediante la
notación numérica. Por ejemplo, en nuestro ejemplo tenemos 2 x 2 = 4 grupos. En
nuestro ejemplo de notación, necesitaríamos 3 x 4 = 12 grupos.
Ahora, veamos una variedad de resultados diferentes que podríamos obtener de este
diseño factorial simple de 2 x 2. Cada una de las siguientes figuras describe un posible
resultado diferente. Y cada resultado se muestra en forma de tabla (la tabla de 2 x 2 con
los promedios de filas y columnas) y en forma gráfica (con cada factor girando en el eje
horizontal). Debes convencerte de que la información de las tablas concuerda con la
información de ambos gráficos. También debes convencerte de que el par de gráficos en
cada figura muestra exactamente la misma información representada de dos maneras
diferentes. Las líneas que se muestran en los gráficos no son técnicamente necesarias: se
utilizan como ayuda visual para permitirle rastrear fácilmente dónde se ubican los
promedios de un solo nivel en los niveles de otro factor. Tenga en cuenta que los valores
que se muestran en las tablas y gráficos son promedios grupales de la variable de
resultado de interés. En este ejemplo, el resultado podría ser una prueba de logros en la
materia que se enseña. Supondremos que las puntuaciones en esta prueba oscilan entre 1
y 10 y que los valores más altos indican un mayor logro. Debe estudiar detenidamente los
resultados de cada figura para comprender las diferencias entre estos casos.
2.3 La ventaja del diseño factorial
Un diseño bidireccional nos permite examinar el efecto conjunto (o interacción)
de las variables independientes sobre la variable dependiente. Una interacción
significa que el efecto que tiene una variable independiente sobre una variable
dependiente no es el mismo para todos los niveles de la otra variable
independiente. No podemos obtener esta información realizando análisis
unidireccionales separados.
Los diseños factoriales se utilizan ampliamente en experimentos que involucran
varios factores.
Hay varios casos especiales del diseño factorial general que son importantes
porque se utilizan ampliamente y forman la base de otros diseños de considerable
valor práctico.
El diseño factorial puede conducir a pruebas más potentes al reducir la varianza
del error (dentro de la celda). Este punto aparecerá claramente cuando se
comparen los resultados de los análisis unidireccionales con los resultados de los
análisis bidireccionales o pruebas t.
Con los diseños factoriales, no tenemos que hacer concesiones al responder estas
preguntas. Podemos tener ambas cosas si cruzamos cada uno de nuestros dos
tiempos en condiciones de instrucción con cada una de nuestras dos
configuraciones.
Si sólo pudiéramos observar los efectos principales, los diseños factoriales serían útiles.
Pero, debido a la forma en que combinamos niveles en los diseños factoriales, también
nos permiten examinar los efectos de interacción que existen entre factores. Un efecto de
interacción existe cuando las diferencias en un factor dependen del nivel en que se
encuentra en otro factor. Es importante reconocer que una interacción se produce entre
factores, no entre niveles. No diríamos que hay una interacción entre 4 horas a la semana
y el tratamiento en clase. En cambio, diríamos que hay una interacción entre el tiempo y
el entorno, y luego pasaríamos a describir los niveles específicos involucrados.
¿Cómo saber si existe una interacción en un diseño factorial? Hay tres formas de
determinar que existe una interacción. Primero, cuando ejecute el análisis estadístico, la
tabla estadística informará sobre todos los efectos e interacciones principales. En segundo
lugar, sabes que hay una interacción cuando no puedes hablar del efecto sobre un factor
sin mencionar el otro factor. Si al final de nuestro estudio puedes decir que el tiempo en
la instrucción marca la diferencia, entonces sabrás que tienes un efecto principal y no una
interacción (porque no tuviste que mencionar el factor de configuración al describir los
resultados del tiempo). Por otro lado, cuando tienes una interacción es imposible describir
tus resultados con precisión sin mencionar ambos factores. Finalmente, siempre puedes
detectar una interacción en las gráficas de medias grupales: siempre que hay líneas que
no son paralelas, ¡hay una interacción presente! Si observa los gráficos de efectos
principales anteriores, notará que todas las líneas dentro de un gráfico son paralelas. Por
el contrario, para todos los gráficos de interacción, verá que las rectas no son paralelas.
En el primer gráfico del efecto de interacción, vemos que una combinación de niveles (4
horas a la semana y ambiente en clase) funciona mejor que las otras tres. En la segunda
interacción tenemos una interacción "cruzada" más compleja. Aquí, con 1 hora a la
semana, el grupo de retiro obtiene mejores resultados que el grupo en clase, mientras que
con 4 horas a la semana ocurre lo contrario. Además, ambas combinaciones de niveles
funcionan igualmente bien.
2.6 Resumen
El diseño factorial tiene varias características importantes. Primero, tiene una gran
flexibilidad para explorar o mejorar la "señal" (tratamiento) en nuestros estudios. Siempre
que estemos interesados en examinar variaciones de tratamientos, los diseños factoriales
deberían ser buenos candidatos como diseños de elección. En segundo lugar, los diseños
factoriales son eficientes. En lugar de realizar una serie de estudios independientes,
podemos combinar estos estudios en uno solo. Finalmente, los diseños factoriales son la
única forma eficaz de examinar los efectos de la interacción.
Hasta ahora, sólo hemos visto una estructura de diseño factorial 2 x 2 muy simple. Es
posible que desees consultar algunas variaciones del diseño factorial para obtener una
comprensión más profunda de cómo funcionan. Quizás también quieras examinar cómo
abordamos
2.7 Cálculos
Un diseño factorial de dos factores es un diseño experimental en el que se recopilan datos
para todas las combinaciones posibles de los niveles de los dos factores de interés.
• Si se toman tamaños de muestra iguales para cada una de las posibles combinaciones
de factores, entonces el diseño es un diseño factorial equilibrado de dos factores.
• Un diseño factorial a×b balanceado es un diseño factorial para el cual hay niveles a del
factor A, niveles b del factor B y n repeticiones independientes tomadas en cada una de
las combinaciones de tratamientos a×b. El tamaño del diseño es N =
abn.
EJEMPLO: (Un diseño equilibrado 2×2): Un virólogo está interesado en estudiar los
efectos de a = 2 medios de cultivo diferentes (M) yb = 2 tiempos diferentes (T) sobre el
crecimiento de un virus en particular.
Tabla 2.2
• Cuando suponemos que no hay interacción entre A y B, decimos que los efectos son
aditivos.
1. Calcule las medias de celda para todas las combinaciones a·b de los niveles de
A y B.
2. Grafique las medias de las celdas frente a los niveles del factor A.
• Los roles de A y B se pueden invertir para hacer una segunda trama de interacción.
• Interpretación del gráfico de interacción: – Las líneas paralelas normalmente indican
que no hay interacción significativa.
• Es posible que haya una interacción significativa entre dos factores, mientras que los
efectos principales de ambos factores no son significativos.
dónde
Suponemos ∑ijk ∼ IID N(0,σ2). Por ahora, también asumiremos que todos los efectos
son fijos. • Si se elimina (αβ)ij de (22), tendríamos el modelo aditivo:
entonces las estimaciones de mínimos cuadrados de los parámetros del modelo son
µ = βj = αi =
αβij=
y··· = 29.625 y1· = 24.6 y2· = 34.586 y·1 = 30.25 y·2 = 29.00
Tabla 2.3
Aquí veremos varios diseños factoriales diferentes. Comenzaremos con un diseño de dos
factores donde uno de los factores tiene más de dos niveles. Luego presentaremos el
diseño de tres factores. Finalmente, presentaremos la idea del diseño factorial incompleto.
Un ejemplo de 2x3
Fig. 2.7 Ejemplo de efecto principal de configuración 2x3
Factor 1: Tratamiento
o psicoterapia
o Modificación de comportamiento
Factor 2: entorno
o paciente interno
o tratamiento diurno
o paciente externo
Tenga en cuenta que el factor de configuración en este ejemplo tiene tres niveles.
La primera figura muestra cómo podría ser un efecto para establecer resultados. Hay que
tener mucho cuidado al interpretar estos resultados porque las puntuaciones más altas
significan que el paciente está peor . Está claro que el tratamiento hospitalario funciona
mejor, el tratamiento ambulatorio es el siguiente mejor y el tratamiento ambulatorio es el
peor de los tres. También está claro que no hay diferencia entre los dos niveles de
tratamiento (psicoterapia y modificación de conducta). Aunque ambos gráficos en la
figura representan exactamente los mismos datos, creo que es más fácil ver el efecto
principal de la configuración en el gráfico de la parte inferior izquierda, donde la
configuración se representa con diferentes líneas en el gráfico en lugar de en diferentes
puntos a lo largo del eje horizontal. .
Las segundas figuras muestran un efecto principal del tratamiento con psicoterapia que
funciona mejor (recuerde la dirección de la variable de resultado) en todos los entornos
que la modificación de la conducta. El efecto es más claro en el gráfico de la parte
inferior derecha donde se utilizan los niveles de tratamiento para las líneas. Tenga en
cuenta que tanto en esta figura como en la anterior las líneas en todos los gráficos son
paralelas, lo que indica que no hay efectos de interacción.
Ahora, veamos algunos de los posibles efectos de interacción. En el primer caso vemos
que el tratamiento diurno nunca es la mejor condición. Además, vemos que la
psicoterapia funciona mejor con la atención hospitalaria y la modificación de la conducta
funciona mejor con la atención ambulatoria.
El otro ejemplo del efecto de interacción es un poco más complicado. Aunque puede
haber algunos efectos principales mezclados con la interacción, lo importante aquí es que
existe una combinación única de niveles de factores que se destaca como superior: la
psicoterapia realizada en un entorno hospitalario. Una vez que identificamos una "mejor"
combinación como ésta, es casi irrelevante lo que sucede con los efectos principales.
Está claro que los diseños factoriales pueden volverse engorrosos y tener demasiados
grupos incluso con sólo unos pocos factores. En muchas investigaciones, no le interesará
un diseño factorial completamente cruzado como los que hemos estado mostrando, que
emparejan cada combinación de niveles de factores. Es posible que algunas de las
combinaciones no tengan sentido desde una perspectiva política o administrativa, o que
simplemente no se cuente con fondos suficientes para implementar todas las
combinaciones. En este caso, es posible que decida implementar un diseño factorial
incompleto. En esta variación, algunas de las celdas se dejan vacías intencionalmente; no
se asignan personas para obtener esas combinaciones de factores.
Uno de los usos más comunes del diseño factorial incompleto es permitir un grupo de
control o placebo que no recibe tratamiento. En este caso, es realmente imposible
implementar un grupo que tenga simultáneamente varios niveles de factores de
tratamiento y no reciba ningún tratamiento. Por lo tanto, consideramos que el grupo de
control es su propia celda en una rúbrica factorial incompleta (como se muestra en la
figura). Esto nos permite realizar comparaciones de tratamientos tanto relativas como
absolutas dentro de un solo estudio y obtener una visión bastante precisa de diferentes
combinaciones de tratamientos.
Ecuación 2.4
Esta materia prima está disponible en lotes que no son lo suficientemente grandes como
para permitir que todas las combinaciones de tratamientos se ejecuten desde el mismo
lote. Sin embargo
Entonces, un diseño alternativo consiste en ejecutar cada una de las n réplicas utilizando
un lote separado de materia prima.
Ecuación 2.5
donde ∆k es el efecto del k-ésimo bloque. Por supuesto, dentro de un bloque el orden en
que se ejecutan las combinaciones de tratamientos es completamente aleatorio. El modelo
(Ecuación 5-37) supone que la interacción entre bloques y tratamientos es insignificante.
Esto se asumió previamente en el análisis de diseños de bloques aleatorios. Si estas
interacciones existen, no pueden separarse del componente de error. De hecho, el término
de error en este modelo realmente consta de las interacciones (1-6),k, ([36)A y (703);k.
El análisis de varianza se describe en la Tabla 5-18 en la página 208. El diseño se parece
mucho al de un diseño factorial, con el error de suma de cuadrados reducido por la suma
de cuadrados de los bloques. Computacionalmente, encontramos la suma de cuadrados de
los bloques como la suma de cuadrados entre los n totales de bloques { y..k }. En el
ejemplo anterior, la aleatorización se limitó a un lote de materia prima. En la práctica,
una variedad de fenómenos pueden causar restricciones de aleatorización, como el
tiempo, los operadores, etc. Por ejemplo, si no podemos ejecutar todo el experimento
factorial en un día, entonces el experimentador podría ejecutar una réplica completa el día
1, una segunda réplica el día 2, y así sucesivamente. En consecuencia, cada día sería un
bloque.
Tabla 2.3 ANOVA para un bloque completo aleatorio factorial de dos factores
El experimento está diseñado utilizando tres niveles de obstáculos del suelo y dos tipos
de filtros. Los consideraremos como factores de tipo fijo. El experimento se realiza
seleccionando aleatoriamente una combinación de tratamiento (nivel de ruido del suelo y
tipo de filtro) y luego introduciendo una señal que representa el objetivo en el
osciloscopio. La intensidad de este objetivo aumenta hasta que el operador lo observa.
Luego se mide el nivel de intensidad en el momento de la detección como variable de
respuesta. Debido a la disponibilidad del operador, es conveniente seleccionar un
operador y mantenerlo en el alcance hasta que se hayan realizado todos los análisis
necesarios. Además, los operadores difieren en su habilidad y capacidad para utilizar el
visor. En consecuencia, parece lógico utilizar los operadores como bloques. Se
seleccionan aleatoriamente cuatro operadores. Una vez elegido un operador, se determina
aleatoriamente el orden en que se ejecutan las seis combinaciones de tratamientos. Por
tanto, tenemos un experimento factorial 3 X 2 ejecutado en un bloque completo aleatorio.
Los datos se muestran en la Tabla 5-19. El modelo lineal para este experimento es
Ecuación 2.6
donde Ti representa el efecto de desorden del suelo, βj representa el efecto del tipo de
filtro, (Ƭβ)ij es la interacción, ∆k es el efecto de bloque y €ijk es el componente de error
NID(0, σ2). Las sumas de cuadrados para el ruido del suelo, el tipo de filtro y su
interacción se calculan de la forma habitual.
Lo que hicimos en el último capítulo fue considerar sólo una réplica de un diseño
factorial completo y ejecutarla en bloques. Las combinaciones de tratamientos en cada
bloque de un factorial completo pueden considerarse como una fracción del factorial
completo.
Al configurar los bloques dentro del experimento, seleccionamos los efectos que sabemos
que serían confusos y luego los usamos para determinar el diseño de los bloques.
Aquí están los dos bloques que resultan usando el ABC como generador:
Tabla 2.5
Bloque 1 2
ar
ABC - +
(1) a
ab b
C.A C
antes de aBC
Cristo
Echemos un vistazo al primer bloque, que es media fracción del diseño completo. ABC
es el generador de la fracción 1/2 del diseño 2 3 . Ahora, tomamos sólo la fracción del
diseño completo donde ABC = -1 y la colocamos dentro de su propia tabla:
Tabla 2.6
trt A B C A C. an AB I
B A. tes C
de
Cr
ist
o
(1) - - - + + + - +
ab + + - + - - - +
C. + - + - + - - +
A
an - + + - - + - +
tes
de
Cr
ist
o
Observe el contraste que define los efectos principales (colores similares): existe un alias
de estos efectos. Observe que las columnas con el mismo color son solo -1 veces entre sí.
En esta media fracción del diseño tenemos 4 observaciones, por lo tanto tenemos 3
grados de libertad para estimar. Los grados de libertad estiman los siguientes efectos: A -
BC, B - AC y C - AB. Por lo tanto, este diseño sólo es útil si las interacciones
bidireccionales no son importantes, ya que los efectos que podemos estimar son el efecto
combinado de los efectos principales y las interacciones bidireccionales.
Esto se conoce como Diseño de Resolución III. Se llama Diseño de Resolución III porque
el generador ABC tiene tres letras, pero las propiedades de este diseño y de todos los
diseños de Resolución III son tales que los efectos principales se confunden con
interacciones bidireccionales.
2.14 Notación
Los diseños fraccionarios se expresan usando la notación l k − p , donde l es el número de
niveles de cada factor investigado, k es el número de factores investigados y p describe el
tamaño de la fracción del factorial completo utilizado. Formalmente, p es el número de
generadores , asignaciones en cuanto a qué efectos o interacciones se confunden , es
decir , no pueden estimarse independientemente unos de otros (ver más abajo). Un diseño
con p tales generadores es una fracción de 1/( l p ) del diseño factorial completo.
Por ejemplo, un diseño 2 5 − 2 es 1/4 de un diseño factorial de dos niveles y cinco factores.
En lugar de las 32 ejecuciones que se requerirían para el experimento factorial completo
de 2 5 , este experimento requiere sólo ocho ejecuciones.
Para ahorrar espacio, los puntos en un experimento factorial de dos niveles suelen
abreviarse con cadenas de signos más y menos. Las cadenas tienen tantos símbolos como
factores, y sus valores dictan el nivel de cada factor: convencionalmente, para el primer
(o bajo) nivel, y para el segundo (o alto) nivel. Los puntos de este experimento pueden
representarse así como , , ,y .
Los puntos factoriales también se pueden abreviar por (1), a, b y ab, donde la presencia
de una letra indica que el factor especificado está en su nivel alto (o segundo) y la
ausencia de una letra indica que el factor especificado está en su nivel bajo (o primero)
(por ejemplo, "a" indica que el factor A está en su nivel alto, mientras que todos los
demás factores están en su nivel bajo (o primero). (1) se utiliza para indicar que todos los
factores están en sus valores más bajos (o primeros).
Generación 2.15
En la práctica, los experimentadores suelen confiar en libros de referencia estadística para
obtener los diseños factoriales fraccionarios "estándar", que consisten en la fracción
principal . La fracción principal es el conjunto de combinaciones de tratamientos para las
cuales los generadores evalúan + según el álgebra de combinación de tratamientos. Sin
embargo, en algunas situaciones, los experimentadores pueden encargarse ellos mismos
de generar su propio diseño fraccionario.
2.16 Resolución
Una propiedad importante de un diseño fraccionado es su resolución o capacidad para
separar los efectos principales y las interacciones de bajo orden entre sí. Formalmente, la
resolución del diseño es la longitud mínima de palabra en la relación definitoria
excluyendo ( 1 ). Los diseños fraccionarios más importantes son los de resolución III, IV
y V: las resoluciones inferiores a III no son útiles y las resoluciones superiores a V son un
desperdicio en el sentido de que la experimentación ampliada no tiene ningún beneficio
práctico en la mayoría de los casos; la mayor parte del esfuerzo adicional se destina a la
resolución III, IV y V. estimación de interacciones de muy alto orden que rara vez
ocurren en la práctica. El diseño 2 5 − 2 anterior es la resolución III ya que su relación
definitoria es I = ABD = ACE = BCDE.
La resolución descrita sólo se utiliza para diseños normales. Los diseños normales tienen
un tamaño de ejecución que equivale a una potencia de dos y solo está presente el alias
completo. Los diseños no regulares son diseños en los que el tamaño del tiraje es múltiplo
de 4; Estos diseños introducen alias parciales y se utiliza resolución generalizada como
criterio de diseño en lugar de la resolución descrita anteriormente.