Análisis de Varianza y Diseño Experimental
Análisis de Varianza y Diseño Experimental
ANÁLISIS DE VARIANZA
No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada
identidad o propiedad aditiva de la suma de cuadrados:
El análisis de la varianza se puede realizar con tamaños muestrales iguales o distintos, sin
embargo es recomendable iguales tamaños por dos motivos:
Algunas situaciones experimentales pueden requerir el uso de otros diseños tales como:
Parcela dividida
Bloque dividido
Parcela subdividida
Anidado
Bloques incompletos: Balanceados y parcialmente balanceados
Lattices
Greco Latino, etc.
No es apropiado el uso de este diseño cuando existe heterogeneidad entre las unidades
experimentales. Por lo tanto este diseño puede ser usado solamente en laboratorios e
invernaderos, pero en ningún caso será usado en el campo.
Modelo estadístico
Yij = μ + τi + εij
Yi. Y ..
Medias de tratamientos Yi. = Medias general Y .. =
r tr
Regla de decisión:
Si Fc ≥ Fα ,t −1,t ( r −1) se rechaza Ho: τ 1 = τ 2 = .... = τ i = ..... = τ t
Modelo estadístico
Yij = μ + τi + εij
Gran Total ∑r i =1
i =n Y..
Media
Número total de general
datos
Yi.
Medias de tratamientos Yi. = Media general Y .. = Y .. = Y ..
ri t
∑r
n
i
i =1
Cuadro 4.4. Cuadro de análisis de varianza para un diseño Completamente al azar con
diferente número de repeticiones por tratamiento
Fuente de Grados Suma de cuadrados Cuadrados Fc Fα
variación de Medios
libertad
Tratamien t-1 2 SCTrat CMTrat
Yi.2 Y ..
t
F
tos SCTrat = ∑ − CMTrat = Fc = t
i =0 ri n t −1 CMEE α ,t −1, ∑ ri −t
i =1
Error t
SCEE
Experimen ∑r − t i SCEE = SCT − SCTrat CMEE = t
tal i =1
∑r −t
i =1
i
Total t t r
Y ..2
∑r −1
i =1
i SCT = ∑ ∑ Yij 2
−
n
i =0 j =0
Regla de decisión:
Ejemplo 4.4.1
Totales de Medias de
Método de Temperatura de transición Tc (°K) tratamientos tratamiento
preparación Yi. Yi.
1 14.8 14.8 14.7 14.8 14.9 74 14.8
2 14.6 15.0 14.9 14.8 14.7 74 14.8
3 12.7 11.6 12.4 12.7 12.1 61.5 12.3
4 14.2 14.4 14.4 12.2 11.7 66.9 13.38
Gran total Media general
Y.. = 276.4 Y.. = 13.82
SCT = 3849.92 – (276.4)2/(4)(5) = 30.072
SCTrat = (19209.86/5) – (276.4)2/(4)(5) = 22.124
SCEE = 30.072- 22.124= 7.948
ANVA
FV Gl SC CM Fc Fα
Tratamientos 3 22.124 7.37 14.8*
Error 16 7.948 0.4968
experimental
Total 19 30.072
Conclusión:
- Existe diferencia significativa entre los métodos de preparación del compuesto
superconductor en cuanto a la temperatura de transición.
Ejemplo 4.4.2
PROGRAMA DE ENTRENAMIENTO
A B C D
60 80 97 67
80 81 84 84
69 73 93 90
65 69 79 78
75 92 61
72
¿Existe evidencia para concluir que los diferentes programas de entrenamiento ocasionan
que los trabajadores usen diferente tiempo para ensamblar?
Esto hace que el cuadro medio del error sea más grande de lo normal y así la prueba F
tenderá a no rechazar la hipótesis global de igualdad de medias. En este caso es
recomendable utilizar un diseño que controle esta fuente extraña de variación. La variación
es de tipo sistemático y puede ser debida a la naturaleza o ``inducida'' o introducida por el
investigador para ampliar las inferencias acerca de los tratamientos.
Bloque: Es un grupo de unidades experimentales que son homogéneas para una o más
características que podrían afectar la variable respuesta
¿Qué ejemplos de bloques hay de variación sistemática natural?
La situación más común es cuando hay un sólo factor extraño. Aquí la precisión del
estimado de puede mejorarse usando un diseño de bloques al azar. Por medio del
agrupamiento de las unidades experimentales en subgrupos homogéneos, la variación
asociada con este factor puede ser removida del estimado del error experimental. Además,
las comparaciones intrabloques de los tratamientos son insesgadas por el efecto del factor.
Suponiendo que se tiene un experimento con cinco tratamientos (T1, T2, T3, T4, T5),
distribuidos en cuatro bloques, los cinco tratamientos son aleatorizados dentro de cada
bloque:
T5 T2 T4 T1 T3 Bloque 1
T3 T1 T2 T5 T4 Bloque 2
T1 T5 T3 T4 T2 Bloque 3
T4 T2 T1 T5 T3 Bloque 4
Ventajas
Es fácil de analizar, extrae del error experimental la variación debida a los bloques además
de la variación debida a tratamientos.
Desventajas
Restricciones
Modelo estadístico
Yij = μ + τi + RJ + εij
Hipótesis a probar:
Ho : τ 1 = τ 2 = .... = τ i = ..... = τ t (no hay efecto de tratamiento)
Ha : τ i ≠ τ i`
Ho : R1 = R2 = .... = R j = ..... = Rr (no hay efecto de bloque)
Ha : R j ≠ R j`
Bloques r-1 Y . j 2 Y ..
2 SCBloques CMBloques
SCBloques = ∑
r
− CMBloques = Fc = Fα , r −1, ( t −1)( r −
r −1 CMEE
j =0 t tr
Error (t-1)(r-1) SCEE = SCT − SCTrat − SCBloques CMEE =
SCEE
Experimen (t − 1)(r − 1)
tal
Total tr-1 t r
Y ..2
SCT = ∑ ∑ Yij 2 −
i =0 j =0 tr
Regla de decisión:
5.4 Problemas.
Ejemplo 5.4.1
Respuesta:
Totales de Medias de
tratamientos tratamiento
Concentrac I II III IV
ión %
Yi. Yi.
0.02 63 59 65 57 244 61
0.05 78 75 70 74 297 74.25
0.08 80 76 74 79 309 77.25
0.11 65 69 65 68 267 66.75
0.14 58 59 55 53 225 56.25
Totales de Gran total Media general
bloques 344 338 329 331 Y.. = 1 342
Y.. = 67.1
Y.j
ANVA
FV Gl SC CM Fc Fα
Tratamientos 4 1236.8 309.2 36.12* 3.26
Bloques 3 28.2 9.4 1.098ns 3.49
Error 12 102.8 8.56
experimental
Total 19 1367.8
Conclusión:
- Existe diferencia significativa entre las concentraciones de iniciador sobre el
rendimiento del polímero.
- No existe diferencia entre los días de trabajo sobre el rendimiento del polímero.
UNIDAD VI. CUADRO LATINO
Suponga que se desea determinar el efecto diferencial entre cinco lotes de materia prima
que provienen de cinco proveedores y denotadas respectivamente por las letras A, B, C, D
y E, y que nos interesa conocer si los cinco materiales son diferentes en cuanto a sus
efectos sobre la calidad de la producción.
Si se detecta que las máquinas difieren una de otra, entonces se podría tratar de aplicar un
diseño de bloques al azar, aplicando en cada máquina cada una de las materias primas de
manera aleatoria.
Pero es posible que la varianza del error experimental se pueda reducir más mediante una
agrupación doble que utilizando una agrupación sencilla. Un diseño más eficaz se podría
obtener si el producto se agrupa tanto por máquinas como por operadores. Un diseño
especial de agrupamiento doble es el denominado cuadrado latino.
Definición
Modelo estadístico
Yij(k) = μ + Hi + Cj + τk + εij(k)
Hipótesis a probar:
Tk G
Medias de tratamientos Tk = Medias general G =
t t2
I II … j ….. t Hi
Totales de
Columnas Hileras
Hileras
1 Y11(2) Y12(t) Y1j(1) Y1t(k) H1
2 Y21(t) Y22(k) Y2j(2) Y2t(1) H2
.
.
.
I Yi1(1) Yi2(2) Yij(k) Yit(t) Hi
.
.
.
T Yt1(k) Yt2(1) Ytj(t) Ytt(2) Ht
Cj G
Totales de C1 C2 Cj Ct Gran Total
Columnas
1 2 … k ….. t
Y1j(1) Y11(2) Y1t(k) Y12(t)
Y2t(1) Y2j(2) Y22(k) Y21(t)
Column t-1 t Cj
2
G2 CMColumnas =
SCColumnas CMColumnas Fα ,t −1, (t − 2 )( r −1)
as SCColumnas = ∑ − t −1 Fc =
i =0 t t2 CMEE
Tratami t-1 2 SCTrat CMTrat Fα ,t −1, (t − 2)( r −1)
t
Tk G2 Fc =
entos SCTrat = ∑ − 2 CMTrat =
i =0 t t t −1 CMEE
i =0 j =0 t2
Regla de decisión:
6.4 Problemas
Ejemplo 6.4.1
Se probaron diferentes temperaturas de reacción; se sabe que los analistas y los días en
los que se realiza la prueba pueden ser fuente de error, por lo que se bloquearon. Los
tratamientos probados son
A: Temperatura 50° C
B: Temperatura 60° C
C: Temperatura 70° C
D: Temperatura 80° C
E: Temperatura 90° C
Analista
Día de
trabajo
I II III IV V
E = 8.3 A=9 C = 9.3 B = 10.6 D = 11.4
I
Y11(5) Y12(1) Y13(3) Y14(2) Y15(4)
A = 7.5 B = 8.7 D = 9.5 C = 8.2 E = 6.6
II
Y21(1) Y22(2) Y23(4) Y24(3) Y25(5)
C = 8.9 D = 9.2 A = 8.1 E = 7.9 B = 8.7
III
Y31(3) Y32(4) Y33(1) Y34(5) Y35(2)
D=8 E=7 B = 7.0 A = 6.5 C = 7.5
IV
Y41(4) Y42(5) Y43(2) Y44(1) Y45(3)
B = 9.0 C = 10 E = 8.5 D = 10.5 A = 8.4
V
Y51(2) Y52(3) Y53(5) Y54(4) Y55(1)
Respuesta:
Analista Totales de
Día de
hileras
trabajo I II III IV V
Hj
E = 8.3 A=9 C = 9.3 B = 10.6 D = 11.4
I H1 = 48.6
Y11(5) Y12(1) Y13(3) Y14(2) Y15(4)
A = 7.5 B = 8.7 D = 9.5 C = 8.2 E = 6.6
II H2 = 40.5
Y21(1) Y22(2) Y23(4) Y24(3) Y25(5)
C = 8.9 D = 9.2 A = 8.1 E = 7.9 B = 8.7
III H3 = 42.8
Y31(3) Y32(4) Y33(1) Y34(5) Y35(2)
D=8 E=7 B = 7.0 A = 6.5 C = 7.5
IV H4 = 36.0
Y41(4) Y42(5) Y43(2) Y44(1) Y45(3)
B = 9.0 C = 10 E = 8.5 D = 10.5 A = 8.4
V H5 = 46.4
Y51(2) Y52(3) Y53(5) Y54(4) Y55(1)
Totales de
Gran total
columnas
C1 = 41.7 C2 = 43.9 C3 = 42.4 C4 = 43.7 C5 = 42.6 G = 214.3
Cj
T1 T2 T3 T4 T5
9.0 10.6 9.3 11.4 8.3
7.5 8.7 8.2 9.5 6.6
8.1 8.7 8.9 9.2 7.9
6.5 7.0 7.5 8.0 7.0
8.4 9.0 10.0 10.5 8.5
ANVA
FV Gl SC CM Fc F
Tratamientos 5 -1 = 4 13.4824 3.3706 13.291 3.26
(Temperatura)
Hileras (Días 5 -1 = 4 19.6224 4.9056 19.3438
de trabajo)
Columnas 5 -1 = 4 0.6824 0.1706 0.6727
(Analísta)
Error Exp. 12 3.0432 0.2536
Total 24 36.8304
Conclusión:
Existe efecto altamente significativo entre temperaturas.
Los días de trabajo influyen significativamente en el rendimiento de la reacción, sin
embargo los analistas no influyen significativamente.