Diseño de experimentos
Hugo Alexer Pérez Vicente
Diseño totalmente aleatorio
Experimentos de un solo factor
Definición
El Diseño Completamente
Aleatorio (DCA) se utiliza
cuando se quiere realizar un Es el más simple de todos
experimento donde sólo hay los diseños que se utilizan
un factor de interés o una para comparar dos o más
variable de entrada y no se tratamientos, dado que sólo
consideran fuentes de consideran dos fuentes de
variación adicionales al variabilidad: los
factor estudiado. tratamientos y el error
aleatorio.
Este diseño se llama completamente al azar porque todas las
corridas experimentales se realizan en orden aleatorio completo.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Definición
Suponga que se tienen k tratamientos o niveles diferentes
de un factor que quieren compararse. Las poblaciones
pueden ser k métodos de producción, k tratamientos, k
grupos, etc. La respuesta observada de cada uno de los k
tratamientos es una variable aleatoria.
Los datos aparecerán como en la tabla siguiente:
Tratamientos
𝑇1 𝑇2 𝑇3 … 𝑇𝑘
𝑌11 𝑌21 𝑌31 … 𝑌𝑘1
𝑌12 𝑌22 𝑌32 … 𝑌𝑘2
𝑌13 𝑌23 𝑌33 … 𝑌𝑘3
⋮ ⋮ ⋮ ⋱ ⋮
𝑌1𝑛1 𝑌2𝑛2 𝑌3𝑛3 … 𝑌𝑘𝑛𝑘
Diseño de experimentos - Hugo Alexer Pérez Vicente
Modelo estadístico
El modelo estadístico lineal (o modelo de los efectos)
del experimento de un solo factor completamente
aleatorio es:
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗
𝑖 = 1, 2, … , 𝑘 y 𝑗 = 1, 2, … , 𝑛𝑖
Donde,
𝝁 es la media general o global
𝝉𝒊 efecto del tratamiento 𝑖
𝜺𝒊𝒋 error o residual de la observación 𝑗
𝒚𝒊𝒋 es la observación j en el tratamiento i
𝒌 tratamientos
𝒏 es cantidad de réplicas
Diseño de experimentos - Hugo Alexer Pérez Vicente
Gráfico del modelo aditivo
• Si se representa un gráfico para comparar los
tratamientos sería:
𝜏𝑘
• Con las siguientes anotaciones:
Si los datos dentro de cada nivel están bien dispersos el
pronóstico hecho con el modelo va a ser muy pobre.
Por el contrario, si los datos dentro de cada nivel están muy
cercanos mi pronóstico será muy bueno.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• El Análisis de Varianza (ANOVA) es la técnica central
en el análisis de datos experimentales. La idea
general de esta técnica es separar la variación total
en la parte con la que contribuye cada fuente de
variación en el experimento. En el caso del DCA, se
separan la variabilidad debida a los tratamientos y la
debida al error.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• Observa la siguiente figura:
Variabilidad total Variabilidad total
Variabilidad
debida a
error
Variabilidad Variabilidad Variabilidad
debida a debida a debida a
tratamientos error tratamientos
No hay efecto de tratamiento Sí hay efecto de tratamiento
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• El ANOVA es una prueba de hipótesis en la que:
La hipótesis nula dice que los factores tomados en cuenta
no influyen sobre la variable respuesta
La hipótesis alternativa dice que sí influyen
• Decir que un factor no influye es lo mismo que decir
que todos los efectos de sus niveles son iguales a
cero; por tanto la formulación de la hipótesis nula se
hace de la siguiente manera:
𝐻0 : 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 = 0
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• La cual se puede escribir en forma equivalente como:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇
𝐻1 : 𝜏𝑖 ≠ 0 para algún 𝑖
• Para probar las hipótesis anteriores, el ANOVA separa
la variabilidad total de los datos y la mide a través de
la suma total de cuadrados dada por (en notación de
puntos):
𝑘 𝑛𝑖
2
𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌..
𝑖=1 𝑗=1
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• Con algunos artificios matemáticos se puede partir
en dos componentes:
𝑘 𝑘 𝑛𝑖
2 2
𝑆𝐶𝑇 = 𝑛𝑖 𝑌𝑖. − 𝑌.. + 𝑌𝑖𝑗 − 𝑌𝑗.
𝑖=1 𝑖=1 𝑗=1
• El primer componente es la suma de cuadrados del
tratamiento y la segunda la suma de cuadrados del
𝑛𝑖
error. Como hay un total de 𝑁 = 𝑖=1 𝑛𝑖
observaciones, la 𝑆𝐶𝑇 tiene 𝑁 − 1 grados de
libertad.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• Hay 𝑘 tratamientos o niveles del factor de interés, así
que 𝑆𝐶𝑇𝑟𝑎𝑡 tiene 𝑘 − 1 grados de libertad, mientras
que 𝑆𝐶𝐸 tiene 𝑁 − 𝑘.
• Las sumas de cuadrados divididas entre sus
respectivos grados de libertad se llaman cuadrados
medios y es una estimación de la magnitud de su
correspondiente fuente de variabilidad. Los dos que
más interesan son el cuadrado medio de
tratamientos y el cuadrado medio del error.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de varianza
• Entonces bajo el supuesto de que la hipótesis nula es
verdadera, el estadístico:
𝐶𝑀𝑇𝑟𝑎𝑡
𝐹0 =
𝐶𝑀𝐸
• Sigue una distribución F con (k-1) grados de libertad
en el numerador y (N-k) grados de libertad en el
denominador. Así para un nivel de significancia α
prefijado, se rechaza H0 si F0 > Fα, k-1, N-k, donde Fα, k-1,
N-k es el percentil (1- α)x100 de la distribución F.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Tabla de análisis de varianza (ANOVA)
Fuente de Grados de
Suma de cuadrados Cuadrado medio 𝑭𝟎 Valor-p
variabilidad libertad
𝑘
Tratamientos 𝑌𝑖.2 𝑌..2 𝑘−1 𝑆𝐶𝑇𝑅𝐴𝑇 𝐶𝑀𝑇𝑅𝐴𝑇
𝑃 𝐹 > 𝐹0
𝑆𝐶𝑇𝑅𝐴𝑇 = − 𝐶𝑀𝑇𝑅𝐴𝑇 =
𝑛𝑖 𝑁 𝑘−1 𝐶𝑀𝐸
𝑖=1
Error 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑅𝐴𝑇 𝑁−𝑘 𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑁−𝑘
𝑘 𝑛𝑖
2
Total 𝑆𝐶𝑇 = 𝑌𝑖𝑗 − 𝑌.. 𝑁−1
𝑖=1 𝑗=1
Por último es importante resaltar que el ANOVA supone que la variable de
respuesta se distribuye normal, con varianza constante (los tratamientos
tienen varianza similar), y que las mediciones son independientes entre sí.
Estos supuestos deben verificarse para estar más seguros de las conclusiones
obtenidas.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejemplo: Tiempo de
coagulación de la sangre
Se obtuvieron los tiempos de coagulación de muestras
de sangre extraída a 24 animales alimentados con
cuatro dietas diferentes A, B, C y D. Las dietas fueron
asignadas aleatoriamente a los animales y las muestras
de sangre fueron extraídas y analizadas en el orden
aleatorio indicado por los superíndices entre paréntesis
de la tabla siguiente: Dietas (tratamientos)
A B C D
62(20) 63(12) 68(16) 56(23)
60(2) 67(9) 66(7) 62(3)
59(10) 64(14) 67(17) 61(18)
63(10) 65(4) 68(13) 63(22)
59(24) 66(8) 68(21) 64(19)
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejemplo: Tiempo de coagulación de la
sangre
¿Hay evidencia que indique una diferencia real entre
los tiempos de coagulación de las cuatro dietas?
Inicie dándole un vistazo a un gráfico de puntos con sus
medias respectivas:
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejemplo: Tiempo de coagulación de la
sangre
• Realizando el análisis con Minitab 17 se obtienen los
siguientes resultados:
• Con un nivel de significancia de 0.05 y usando como criterio de decisión el valor-p,
se rechaza la hipótesis nula y en consecuencia lo que realmente provocan las
dietas son diferentes tiempos de coagulación.
• Posteriormente se analizarán los resultados obtenidos para el resumen del
modelo.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejercicio
• Para comparar la viscosidad de cuatro diferentes
marcas de aceite casero se realizaron las pruebas de
evaluación en un laboratorio.
• Los resultados registrados en cinco muestras de cada
marca son los siguientes:
marca M1 M2 M3 M4
59 90 77 98
60 71 66 69
58 83 64 93
71 76 75 89
48 90 80 97
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejercicio
• Realizar el planteamiento de hipótesis.
(1) el análisis de varianza realizado con las fórmulas
adecuadas en Excel.
(2) el análisis de varianza con ayuda del complemento de
herramientas de análisis de Excel.
(3) elaborar el diagrama de cajas o gráfico de valor
individual.
(4) dar las conclusiones justificados por el ANOVA y por
el diagrama de cajas.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Estimación de los parámetros del
modelo
• Dado un diseño experimental típicamente existe un
modelo matemático asociado para el DCA que se le
denomina modelo de efectos fijos.
yij i eij
• Este modelo describe adecuadamente las
observaciones del experimento y los errores siguen
una distribución normal e independiente con media
cero y varianza 𝜎 2 constante pero desconocida.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Estimación de los parámetros del
modelo
• Los estimadores razonables de la media global y de
los efectos de los tratamientos están dados por:
𝜇 = 𝑦..
𝜏 = 𝑦𝑖. − 𝑦..
∀𝑖 = 1,2, … , 𝑘
• Una estimación puntual de 𝜇𝑖 sería 𝑦𝑖. dado el
supuesto de normalidad y conocida una varianza 𝜎 2
se puede definir un intervalo de confianza utilizando
𝐶𝑀𝐸 como estimador de 𝜎 2 y basado en la
distribución t.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Intervalo de confianza para la media
• Un intervalo de confianza de 100 × (1 − 𝛼) por
ciento para la media 𝜇𝑖 del tratamiento i-ésimo es:
𝐶𝑀𝐸 𝐶𝑀𝐸
𝑦𝑖. − 𝑡𝛼 2,𝑁−𝑘 ≤ 𝜇𝑖 ≤ 𝑦𝑖. + 𝑡𝛼 2,𝑁−𝑘
𝑛 𝑛
Diseño de experimentos - Hugo Alexer Pérez Vicente
Intervalo de confianza para la
diferencia de medias
• Un intervalo de confianza de 100(1 − 𝛼) por ciento
para la diferencia en las medias de dos tratamientos
cualesquiera es:
2𝐶𝑀𝐸 2𝐶𝑀𝐸
𝑦𝑖. − 𝑦𝑗. − 𝑡𝛼 2,𝑁−𝑘 ≤ 𝜇𝑖 − 𝜇𝑗 ≤ 𝑦𝑖. − 𝑦𝑗. + 𝑡𝛼 2,𝑁−𝑘
𝑛 𝑛
Diseño de experimentos - Hugo Alexer Pérez Vicente
Ejemplo: fibra de algodón
• Los residuales deberán estar sin estructura y sin
patrones obvios.
• Un ingeniero textil tiene interés en investigar la
resistencia a la tensión de una fibra sintética para
una tela de camisa para dama. Se sabe que la
resistencia a la tensión es afectada por el porcentaje
de algodón utilizado en la fibra.
• Por cuestiones de calidad, el contenido de algodón
deberá mantenerse entre 10% y 40%.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Entendimiento
Variable de resistencia a la tensión de una fibra sintética en lb/pulg².
respuesta
Factores un solo factor, peso porcentual de algodón utilizado en la
mezcla de materiales de la fibra.
Niveles del cinco niveles: 15%, 20%, 25%, 30% y 35%.
factor
Tratamiento cinco tratamientos : 15%, 20%, 25%, 30% y 35%.
Cantidad de cinco réplicas. Cada tratamiento tiene una población
réplicas asignada de cinco ejemplares.
Las 25 mediciones de resistencia a la tensión se prueban de
manera aleatoria.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Datos del problema
Peso porcentual del Observaciones
algodón 1 2 3 4 5
15 % 7 7 15 11 9
20 % 12 17 12 18 18
25 % 14 18 18 19 19
30 % 19 25 22 19 23
35 % 7 10 11 15 11
Diseño de experimentos - Hugo Alexer Pérez Vicente
¿Qué hacemos?
• Análisis exploratorio de datos
• Planteamiento de hipótesis
• Calcular la tabla ANOVA
• Estimar los parámetros del modelo
Intervalos de confianza para la media y para la
diferencias de medias
• Verificar la adecuación del modelo
Análisis de residuales
Diseño de experimentos - Hugo Alexer Pérez Vicente
Análisis de residuales
• La prueba propuesta por F-Fisher (ANOVA) para
estudiar la variabilidad para probar estadísticamente
diferencias entre las medias de los tratamientos
requiere que se satisfagan ciertos supuestos sobre
los residuales.
• Los supuestos son: independencia, igualdad de
varianza y normalidad (sobre los residuales).
Diseño de experimentos - Hugo Alexer Pérez Vicente
Verificación de adecuación del
modelo
• Residual de la observación j-ésima en el tratamiento
i-ésimo
eij yij yi .
• Los residuales deberán estar sin estructura, sin
patrones obvios.
• Una anomalía común sucede cuando un residual es
mucho más grande que cualquier otro y se llama
punto atípico.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Verificación de adecuación del
modelo
• Uno de los procedimientos estadísticos formales para
detectar puntos atípicos es examinando los
residuales estandarizados 𝑑𝑖𝑗 ~𝑁(0, 𝜎 2 )
𝑒𝑖𝑗
𝑑𝑖𝑗 =
𝑀𝑆𝐸
• Un residual mayor que tres o cuatro desviaciones
estándar, a partir de cero, es un punto atípico
potencial. Es conveniente analizar las posibles causas
de los puntos atípicos.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Supuesto: normalidad
• Las pruebas de normalidad típicamente son pruebas
de bondad de ajuste a una distribución normal.
𝐻0 : Los datos siguen una distribución normal
𝐻1 : Los datos no siguen una distribución normal
Se usará como criterio de decisión el p-value
Diseño de experimentos - Hugo Alexer Pérez Vicente
Supuesto: normalidad
• En Minitab 17, los métodos son:
Kolmogorov-Smirnov
Anderson-Darling
Shapiro-Wilks
• En todos los casos, los resultados muestran el gráfico
de probabilidad normal.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Supuesto: igualdad de varianzas
• Cuando creemos que la varianza del error, y por lo
tanto de los residuales, pudiera estar afectada por los
niveles del factor, podríamos realizar la siguiente
prueba de hipótesis:
H 0 : 12 12 ... a2
H1 : i2 2j para al menosun par (i, j )
• Un procedimiento muy utilizado es la Prueba de
Bartlett; sin embargo, esta prueba es muy sensible al
supuesto de normalidad. Un procedimiento más
robusto es el de la Prueba de Levene modificada.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Igualdad de varianzas
Peso porcentual del Observaciones
algodón 1 2 3 4 5
ȳi. ỹi
15% 7 7 15 11 9 9.8 9
20% 12 17 12 18 18 15.4 17
25% 14 18 18 19 19 17.6 18
30% 19 25 22 19 23 21.6 22
35% 7 10 11 15 11 10.8 11
Peso porcentual del Desviaciones absolutas dij
algodón 1 2 3 4 5
d i. d i.
15% 2 2 6 2 0 12 2.4
20% 5 0 5 1 1 12 2.4
25% 4 0 0 1 1 6 1.2
30% 3 3 0 3 1 10 2
35% 4 1 0 4 0 9 1.8
49 1.96
Diseño de experimentos - Hugo Alexer Pérez Vicente
Prueba de Levene
H0 : 2
15% 2
20% 2
25% 2
30% 2
35%
H1 : i
2 2
j para al menosun par (i, j )
Diseño de experimentos - Hugo Alexer Pérez Vicente
Prueba de Levene: ejemplo
Tabla ANOVA de la prueba de Levene modificada
Fuente de Suma de Grados de Cuadrado
F0
variación cuadrados libertad medio
% de algodón 4.96 4 1.24 0.318
Error 78 20 3.9
Total 82.96 24
Puesto que F0 (= 0.318) < F0.05, 4, 20 (= 2.87), se acepta H0 y se concluye
que las varianzas de los tratamientos no difieren significativamente.
El valor p = P(F4,20 ≥ 0.318) = 0.863
Diseño de experimentos - Hugo Alexer Pérez Vicente
Supuesto: independencia
• La independencia de los residuales se puede verificar
graficando el residual contra el orden de ejecución
del experimento.
• Aunque existen pruebas para verificarlo,
regularmente si visualmente no se ve un patrón
definido, se da por cumplido dicho supuesto.
Diseño de experimentos - Hugo Alexer Pérez Vicente
Referencias
• Box, G. E., Hunter, J. S. y Hunter, W. (2008). Estadística para Investigadores: diseño,
innovación y descubrimiento. España: Reverté.
• Gutiérrez, H. y de la Vara, R. (2012). Análisis y diseño de experimentos. México: McGraw Hill.
• Montgomery, D. (2007). Design and analysis of experiments. EUA: Limusa Wiley.
Diseño de experimentos - Hugo Alexer Pérez Vicente