Diseños Experimentales
Diseños Experimentales
TEMA
DISEÑO Y ANÁLISIS DE EXPERIMENTOS
MONOFACTORIALES
18.1. INTRODUCCIÓN
18.2. DISEÑOS EXPERIMENTALES BÁSICOS
18.2.1.Dispositvo experimental
18.2.1.1. Diseño completamente aleatorizado (DCA)
18.2.1.2. Diseño de bloques completos al azar (DCBA)
18.2.1.3. Diseño cuadrado latino (DCL)
18.2.2. Análisis comparativo de los diseños básicos
18.3. ANÁLISIS DE LOS EXPERIMENTOS MONOFACTORIALES
18.3.1. Análisis de la varianza (ADEVA)
18.3.1.1.Diseño completamente aleatorizado (DCA)
18.3.1.2.Diseño de bloque completo al azar (DCBA).
18.3.1.3.Análisis de la varianza del cuadrado latino (DCL)
18.3.2. Análisis posterior del ADEVA
18.3.2.1.Caso de un factor cualitativo
18.3.2.2. Caso de un factor cuantitativo
18.1. INTRODUCCIÓN
En la Unidad de Inferencia Estadística se presentaron problemas que implican el manejo de
datos numéricos correspondientes a la observación de una o más variables aleatorias, y el interés se
focalizó en efectuar estimaciones puntuales o intervalares y en la aplicación de pruebas de hipótesis
relacionadas con una o más poblaciones. En esta unidad se trata el diseño experimental y el análisis de
los datos experimentales.
El diseño experimental comprende un conjunto de procedimientos que se utilizan para obtener
datos numéricos bajo condiciones controladas. Como ya se sabe sólo es posible realizar inferencias
válidas aplicando un diseño que cumpla con los principios básicos de la experimentación: repetición,
aleatorización y control (por ejemplo, bloqueo). Para esto se requiere planificar la experimentación y
diseñar un dispositivo experimental (esquema de distribución de las unidades experimentales y los
tratamientos) que llevado a la práctica permita obtener datos empíricos apropiados para el análisis
estadístico posterior.
El análisis de los datos experimentales se centra en realizar comparaciones. A partir de
experimentar con diferentes situaciones, los datos correspondientes se analizan mediante los
procedimientos del análisis de la varianza y algunas pruebas complementarias. El concepto fundamental
de los experimentos estadísticos es la varianza residual. Esta es la variación debida al error
experimental (variación dentro) que mide la porción de la variabilidad total de los datos no explicada por
la variación debida a los tratamientos (variación entre)
Se ha visto en el análisis de la varianza que generalmente se utiliza la prueba de F, para tomar
una decisión con respecto a si varias muestras proceden de poblaciones que tienen la misma media
paramétrica. Además que se utilizó el nombre genérico de grupos para referirse a las muestras, pero
en el contexto experimental los grupos se corresponden con tratamientos (j=1,2,…,k) o los bloques
(r=1,2,... , n) y, se presentó la identidad fundamental del ADEVA que hace referencia a la partición
como:
SCG = SC entre grupos + SC dentro de grupos
A partir de las sumas de cuadrados “entre” y “dentro”, se obtuvieron dos estimaciones independientes de
la varianza poblacional σ 2 asociada al primer término de la ecuación, que fueron el cuadrado medio
entre grupos y el cuadrado medio dentro de grupos. Bajo hipótesis nula de que los grupos proceden de
poblaciones con idéntica media (Ho: µ1 = µ2 = … = µk ), los dos cuadrados medios toman el mismo valor,
CM entre grupos
luego la razón F = , que en el muestreo sigue la distribución Fα; ν1 , ν2 , resulta igual a
CM dentro grupos
1. Pero, si los datos observados aportan suficiente evidencia para rechazar Ho, se concluye a favor de la
hipótesis alternativa (H1: al menos existe una media que difiere de las restantes). Evidentemente en este
caso el CM del numerador resulta mayor al CM del denominador, F>1, y el valor resulta tanto mayor a la
unidad cuanto mayor sea la diferencia entre las medias de los grupos (tratamientos o bloques).
En el contexto del análisis experimental se presentarán otras expresiones para explicar la
partición de la SCG, que reflejarán el tipo de dispositivo experimental utilizado y la naturaleza de los
tratamientos. En este capítulo particularmente, se verá la aplicación del ADEVA en el análisis de datos
experimentales (valores observados de una variable respuesta Y) derivados de experimentos
monofactoriales, es decir, que se ha experimentado con un único factor, cuyos tratamientos
297
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
(tratamientos simples) se han distribuido aleatoriamente, con diferente grado de control experimental
(DCA, DBCA y DCL).
No resulta difícil calcular las sumas de cuadrados con una calculadora manual, si se parte de una
tabla con datos correctamente organizados y se aplican fórmulas operativas de cálculo, aunque la tarea
puede resultar algo tediosa. Se pueden diseñar planillas de cálculo MS EXCEL, tanto para realizar el
análisis inicial exploratorio de los datos (análisis descriptivo), que permitirá vislumbrar el cumplimiento de
los supuestos del ADEVA, como para realizar los cálculos que requiere el análisis inferencial (Pruebas
de F y Pruebas de comparaciones múltiples de medias). También se puede recurrir a paquetes
estadísticos para computadoras; en este curso se presentarán ejercicios con salidas obtenidas con el
INFOSTAT para su interpretación.
B1 A1 A2 C1
A3 B2 D1 B3
C2 C3 A4 D2
A5 D3 B4 C4
B5 D4 D5 C5
298
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
en experimentos industriales se puede considerar variaciones por la posición en una cámara frigorífica,
la línea de producción, el turno laboral, etc.
En experimentos a campo con plantas, a veces no hay suficientes unidades experimentales
similares para realizar todas las repeticiones que se desean. Se pueden requerir parcelas grandes, y
entonces sucede que las parcelas adyacentes suelen responder de manera más similar que las que
están distanciadas por diversas razones (gradientes de fertilidad, textura, etc.), de modo que algunos
tratamientos pueden resultar favorecidos y otros perjudicados. También ocurre, en experimentos
realizados en laboratorio, que las observaciones efectuadas en un día dado o usando cierto equipo
pueden parecerse más que las hechas en días diferentes o con diferentes equipos, respectivamente.
En tales situaciones, se puede proceder de una manera análoga a la vista en el muestreo
estratificado. Con las unidades experimentales que presentan condiciones similares, se arman
agrupamientos o bloques, que serían equivalentes a los estratos: las unidades son homogéneos dentro
del bloque, pero hay diferencia entre los bloques. De esta manera, se puede controlar
experimentalmente alguna fuente de variabilidad, que de otro modo perturbaría los resultados
experimentales, porque sus efectos quedarían englobados en el error experimental relacionado con el
denominador de la razón F (mayor valor, en detrimento de la significancia de los efectos de los
tratamientos).
Existen situaciones en las cuales, de entrada resulta que no es posible tener igual número de
unidades experimentales homogéneas para tener una repetición de todos los tratamientos por bloque,
entonces se recurre al diseño de bloques incompletos (no se estudiarán en este curso).
• El objetivo del agrupamiento es lograr unidades en un bloque tan uniformes como sea posible, de
modo que las diferencias observadas se deban sólo a los efectos de tratamientos.
• En promedio, la variabilidad entre unidades de diferentes bloques será mayor que la variabilidad
entre unidades del mismo bloque si no van a aplicarse tratamientos. Idealmente, la variabilidad
entre unidades experimentales se controla (recordar muestreo estratificado) de tal forma que,
simultáneamente:
se maximice la variación entre bloques
se minimice la variación dentro de ellos
• En el DBA, la variación entre bloques no afecta claramente a las diferencias entre las medias de
tratamientos, ya que cada tratamiento aparece el mismo número de veces en cada bloque.
El control del gradiente de heterogeneidad en un área experimental, debe hacerse tal que:
• los bloques resulten perpendiculares al gradiente
• las parcelas dentro de un bloque, resulten paralelas respecto al gradiente (Figura 18.2.)
• En el diseño de bloques completos al azar, cada tratamiento aparece igual número de veces,
usualmente una vez, en cada bloque y cada bloque contiene todos los tratamientos. Bloques y
tratamientos son ortogonales entre sí, esta propiedad matricial lleva a los sencillos cálculos
aritméticos que entran en el análisis de los datos resultantes.
• Cada observación se puede clasificar de acuerdo con:
a) el bloque del que procede y,
b) el tratamiento al que corresponde,
• Esto da lugar a una clasificación doble, de ahí que este diseño también sea conocido como
diseño de clasificación de dos vías o de dos modos.
• Los bloques se pueden mantener:
a) Compactos, disponiendo las parcelas, usualmente de forma larga y estrecha, cercanas a las
de otro bloque
b) no compactos (en diferentes lugares, por ejemplo), pero manteniendo la condición de que sus
unidades experimentales sean homogéneas.
299
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
• El número de tratamientos debe ser lo menor posible; debe ser suficiente para lograr los objetivos
del experimento. Cuando el tamaño del bloque aumenta, se incrementará la variabilidad dentro de
éste.
• Es necesario que los bloques sean de la misma forma, puesto que las diferencias en las formas
de los bloques generalmente incrementan la variabilidad dentro del bloque.
Durante el transcurso del experimento, todas las unidades de un bloque deben tratarse tan
uniformemente como sea posible en todo aspecto diferente del tratamiento. Todo cambio en la técnica u
otra condición, que pueda afectar los resultados deben hacerse en todo en bloque: se trata de que las
diferencias que se observen se deban exclusivamente al efecto del tratamiento recibido. Por ejemplo, si
la cosecha abarca un período de varios días, se harán agrupamientos y los bloques se corresponderán
con lo cosechado el mismo día o bien si personas diferentes hacen observaciones en el material
experimental, en lo posible una persona debe hacer todas las observaciones en un bloque. Así, esta
variación reconocida y controlada por bloqueo, quedará excluidas aritméticamente de la variación
debida al error experimental.
N S
(a)
Aleatorización.
Cuando se han definido las unidades experimentales de los bloques, se numeran en cierto orden
conveniente. Los tratamientos también se numeran y luego se asignan aleatoriamente a las unidades
dentro de un bloque.
300
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
I II III
C A A
A C B
B B C
Fertilidad
• El doble control lleva a disponer los tratamientos en las unidades experimentales de dos maneras
diferentes, por filas y por columna.
• Cada tratamiento se presenta una y sólo una vez en cada fila y columna; cada fila así como cada
columna, es un bloque completo. Mediante un análisis apropiado, es posible eliminar del error la
variabilidad debida a diferencias tanto en filas como en columnas.
• Los términos filas y columnas son términos generales que se refieren a criterios de clasificación.
• El número de tratamientos resulta igual al número de filas y al número de columnas.
• El número de unidades experimentales será igual al cuadrado del número de tratamientos.
• El número de repeticiones resulta igual al de tratamientos
301
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
4º) Tercer cuadrado reordenado: sortear las filas y trasponerlas como columnas, en el orden obtenido
(Fig.f).
IIIv Vv IIv IVv Iv IIv Iv IVv Vv IIIv
Vh D A C E B B C E D A
IIh B D A C E D E B A C
IVh E B D A C A B D C E
Ih C E B D A C D A E B
IIIh A C E B D E A C B D
Fig.e. 2º Cuadrado reordenado Fig. f. 3º Cuadrado reordenado
B C E D A D E B A C A B D C E C D A E B E A C B D
En este caso el criterio para el doble bloqueo ha sido porque se experimenta bajo las siguientes
condiciones: 5 propiedades del Dpto. de Luján de Cuyo (PI, PII, PIII, PIV, PV) y 5 cuadros en cada una
de ellas que se diferencias por la procedencia de las estacas de vid de la variedad Malbec (CI, CII, CIII,
CIV, CV). El factor en estudio es el tipo de fertilización (A, B, C, D, E). Ejemplos análogos podrían
tenerse al analizar la calidad de k diferentes métodos (tratamientos) para recuento de microorganismos
controlando el laboratorio y el analista; o bien en un experimento con vacas lecheras para determinar si
existen diferencias entre las cantidades de leche producidas por el ordeñe de los cuatro pezones de los
cuartos (cuarterones) de sus ubres (tratamientos), controlando una posible variación de la respuesta
(litros diarios) debido a los tiempos de ordeñe y el momento de ordeñe o posición en el tiempo.
302
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
VENTAJAS DESVENTAJAS
a) Al responder todas las unidades experimentales a) No es apropiado para un número elevado de
de cada bloque a un nivel diferente de una fuente tratamientos, debido a que ello aumenta el tamaño
de variabilidad, se elimina la variabilidad total del bloque y, como consecuencia, se incrementa la
existente en todas las unidades la debida a dicha variabilidad dentro de cada bloque y, por ende, el
fuente. Por esta causa, es más eficiente que un error experimental.
DCA. b) Tampoco resulta aconsejable cuando existe gran
variabilidad en el material experimental
b) Se pueden estimar los datos de algunas (interacciones).
unidades experimentales si se pierden a través de c) La principal desventaja de los bloques completos
la técnica de Yates. al azar es que cuando la variación entre unidades
experimentales dentro de un bloque es grande,
resulta un término de error considerable. Eso ocurre
frecuentemente cuando el número de tratamientos
es grande; así puede no ser posible asegurar
grupos de unidades suficientemente uniformes para
los bloques. En tales situaciones, se dispone de
otros diseños para controlar una mayor proposición
de la variación: diseño de bloques incompletos.
Ventajas y desventajas del diseño en DCL
VENTAJAS DESVENTAJAS
a) Mayor precisión que los diseños DCA y DBA; a) como el número de tratamientos depende del de
disminuye el error experimental como consecuencia bloques y columnas y, por consiguiente, del de
de considerar dos fuentes de variabilidad. unidades experimentales, esto le resta flexibilidad al
diseño. Es por esta razón que no se recomienda
para más de 10 tratamientos.
b) A igualdad de número de tratamientos y
b) Análisis numérico sencillo. repeticiones, este diseño tiene menos grados de
libertad para el error experimental que el de DBA y
el DCA, diferencia más pronunciada a medida que
disminuye el número de tratamientos.
c) Si se pierden todas las unidades experimentales c) Si hay interacción entre los efectos de las dos
de un mismo tratamiento, el resto de los fuentes de variación (filas y columnas), entonces el
tratamientos siguen ajustados a un DCL. Si se valor F no se distribuye de acuerdo con el valor
pierden una o varias unidades experimentales del tabular de F y como consecuencia no resulta válida
mismo tratamiento, se pueden estimar sus valores. la prueba de significación.
18.3.1.3. Modelo
= + +
= 1, … , ; = 1, … ,
donde:
Yij : valor de la variable aleatoria respuesta para la unidad experimental que corresponde a la i-ésima
repetición del j-ésimo tratamiento
µ : media general
τ i : efecto del j-ésimo tratamiento
ε ij : error aleatorio de la unidad experimental que corresponde a la i-ésima repetición del j-ésimo
tratamiento
303
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
Suposiciones:
1. Las respuestas provienen de nk muestras aleatorias e independientes de las rk respectivas
poblaciones.
2. Las poblaciones se distribuyen normalmente con medias µ1 , µ2 ,... ... µk.
3. Las varianzas poblacionales son iguales σ11 = σ22 = ... = σ2k = σe2 .
1. Hipótesis estadísticas
H 0 : µ 1 = µ 2 = ... = µ k ∀ j = 1,2,..., k
H 1 : no todas las medias son iguales, esto es, por lo menos una de las medias poblacionales difiere de alguna otra
2. Estadígrafo de prueba:
F= CMT/CME, en donde F se distribuye en el muestreo, bajo el supuesto de que Ho es verdadera,
como una distribución F con grados de libertad υ1 = (k − 1) y υ 2 = (rk − k )
3. Regla de decisión:
La región de rechazo se encuentra en la F (α ;υ1 ;υ 2 ) y satisface la expresión P (F > Fc ) = α , donde Fc
es un percentil que pertenece a la cola superior de la distribución de probabilidad F. La regla de decisión
será: Si Fm > Fc , se rechaza H 0
f(F)
.
f(F)
&(';() ;(* )
0 Fc 6 F
Suma de Cuadrados
Fuente de Grados de Cuadrados
Fórmula procedim. Fórmula procedim. Fm
Variación libertad Medios
directo (definición) abreviado (operativa)
− ••
r k
Total SCG = ∑∑ y ij2 − C rk − 1
i =1 j =1
"!
k
• − ••
!=
∑y 2
( − 1)
•j
Tratamientos j =1 k −1 CMT / CME
SCT = −C
r
"%
− •
%=
( − )
Error SCE = SCG − SCT rk − k
304
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
cepas de Rhizobium meliloti + Cepa de R. trifolii. lo que da seis tratamientos en total. El experimento se
realizó en un invernadero empleando cinco terrinas por tratamiento.
Tabla 18.2. Contenido de nitrógeno, en mg, de plantas de trébol rojo inoculadas con combinaciones de cultivos de
cepas de Rhizobium trifolii y cepas de Rhizobium meliloti + Cepa de R. trifolii.
Tratamientos
Compuest Total
Terrina 3DOk1 3DOk5 3DOk4 3DOk7 3DOk13
o
1 19,4 17,7 17,0 20,7 14,3 17,3
2 32,6 24,8 19,4 21,0 14,4 19,4
3 27,0 27,9 9,1 20,5 11,8 19,1
4 32,1 25,2 11,9 18,8 11,6 16,9
5 33,0 24,3 15,8 18,6 14,2 20,8
y• j 144,1 119,9 73,2 99,6 66,3 93,5 y•• = 596,6
2
∑y 2
ij 4.287,53 2.932,27 1.139,42 1.989,14 887,29 1.758,71 ∑ ∑ y ij = 12,994,36
∑ (y ) 282,93
2
ij − y• j 134,57 57,07 67,77 5,11 8,15 10,26
Para el cálculo de las sumas de cuadrados, grados de libertad y cuadrados medios se procede
según se vió en el capítulo donde se presentó el Análisis de la Varianza, como una prueba para
comparar k grupos. Así se llega a:
Tabla 18.3. Análisis de la varianza de los datos de la tabla 18.2.
Suma de Grados de Cuadrados
Fuentes de variación Fm F0,01; 5, 24
Cuadrados libertad medios
Total 1.129,98 29
El valor muestral del estadígrafo de prueba (Fm) se obtiene dividiendo el cuadrado medio de los
tratamientos por el cuadrado medio del error, esto es, CMT/CME. Estos cuadrados medios son
comparables, cada uno estima en forma independiente la variación entre observaciones individuales. El
F muestral, se compara con el F crítico (percentil de la tabla de distribución F) para grados de libertad υ t
y υ e , y en base a la comparación entre los dos valores del estadígrafo (Fm y Fc) se decide si se rechaza
o no la hipótesis nula, que plantea la no diferencia entre las medias poblacionales. Si el experimento no
aporta suficiente evidencia para sostener la Ho, se pasa a sostener la hipótesis alternativa de que al
menos una diferencia de entre dos medias poblacionales resulta estadísticamente significativa (o por lo
menos hay una media poblacional de tratamiento que difiere de otra).
En el ejemplo Fm= 169,4/11,79 = 14,37 y el valor tabulado Fc para 5 y 24 grados de libertad es
3,90, al nivel de probabilidad del 0,01. Dado que Fm > Fc, se rechaza la Ho para el nivel de α = 0,01 ,
dejándolo indicado cómo 14,37**, donde el doble asterisco indica que el “resultado es altamente
significativo”. En términos del problema, los datos experimentales aportan evidencia de que hay
diferencia real entre al menos entre dos medias de tratamientos de inoculación. Esto significa que por
ejemplo, el contenido medio de nitrógeno, en mg, de plantas de trébol rojo inoculadas, no es idéntico
para todas las combinaciones de a pares con las diferentes cepas de Rhizobium trifolii y el complejo de
cepas de Rhizobium meliloti +Cepa de R. Trifolii. Pero esta es solo una de las varias posibilidades que
se podrían dar.
NOTAR
En términos estadísticos, o sea, en relación a las hipótesis estadísticas y el nivel de significancia
se concluye como sigue:
Si Fm excede el Fc para un nivel de significancia igual a:
a) α = 0,01, se concluye que al menos existe una diferencia altamente significativa entre las medias
poblacionales. Sintéticamente se dice que el estadígrafo muestral tomó un valor altamente
significativo, y se lo deja indicado en la tabla de ADEVA, colocándole a la derecha del valor de Fm
un doble asterisco (ejemplo 14,37**).
b) α = 0,05, se concluye análogamente con relación a una diferencia significativa. Sintéticamente se
dice que el estadígrafo muestral tomó un valor significativo, y se lo deja indicado en la tabla de
ADEVA, colocándole a la derecha del valor de Fm un asterisco (ejemplo 14,37*).
305
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
18.3.2.2. Modelo
Los supuestos para el modelo que explica los datos de un experimento monofactorial con los
tratamientos distribuidos según un DBA son:
a) Distribución normal de la variable en estudio Y ~. n (x; µ , σ 2 ) ;
b) Varianzas y medias no relacionadas o independientes;
c) Errores con distribución normal (0 y σ2);
d) Efectos aditivos en bloques y tratamientos, es decir no hay interacción y si la hay se acumula en el
error experimental.
Una medida o valor esperado se define en términos de una media general µ, una contribución de
tratamiento τi , y una contribución de bloque βj ; Esto es, la media de la celda i, j-ésima es µ + τi + βj . Una
observación está sujeta a un error aleatorio, donde los errores provienen de una sola población con
media cero y varianza fija pero desconocida. Así
Yij = µ + τj + β i + εij
Una media estimada de celda se denota porµij , donde
̂ = • + • − ••
306
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
1. Hipótesis estadísticas:
Para los tratamientos Para los bloques
H0: τ j = 0 ∀j = 1,..., k H0: β i = 0 ∀i = 1,..., n
Para los bloques: F = CMB CME , en donde F se distribuye en el muestreo, bajo el supuesto de
que Ho es verdadera, como una distribución F con grados de libertad υ β = r − 1 y
υ ε = rk − r − k + 1
4. Regla de decisión:
La región de rechazo se encuentra en la F (α ;υ1 ;υ 2 ) y satisface la expresión P (F > Fc ) = α , donde Fc
es un percentil que pertenece a la cola superior de la distribución de probabilidad F, y que se establece
con los correspondientes grados de libertad para tratamientos y error, y para bloques y error. La regla de
decisión será: Si Fm > Fc , se rechaza H 0 , tanto para los tratamientos y los bloques.
f(F)
α
0 Fc 6 F
Bloques k ∑ ( y i • − y •• )
2 ∑y i•
r −1
i SCB = i
−C
k
n ∑ ( y • j − y •• )
2
2
∑ y• j
Tratamiento j
SCT =
j
−C k −1
r
∑∑ (y − y• j − yi• + y•• )
2
Error
i j
ij SCE = SCG − SCT − SCB (r − 1)(k − 1)
Sea Yij la observación del i-ésimo bloque bajo el j-ésimo tratamiento, donde i = 1,2,..., r bloques
y, j = 1,2,..., k tratamientos. La notación de punto se usa siempre que sea posible. Así, ∑ Y•2j quiere
decir que se obtiene la suma total de los cuadrados de los totales de los k tratamientos. Luego
Y•21 + Y•22 + ... + Y•2k indica el cuadrado del total tratamiento 1 + el cuadrado del total tratamiento 2 + … + el
cuadrado del total tratamiento k .
307
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
La media general para los nk datos se representa comoY.. . La varianza de la distribución de las
medias de muestras de tamaño n es σ2/n, siendo σ2 =σe2 .Los cuadrados medios estiman en forma
independiente la misma σ2 y σ2e , cuando no hay efectos de bloques o tratamientos.
Una forma abreviada es la siguiente:
Fuente de Suma de Grados de
Cuadrados medios Fm
variación Cuadrados libertad
Total SCG rk - 1
Bloques SCB r-1 CMB = SCB /( r – 1) CMB/CME
Tratamientos SCT k-1 CMT = SCT / (k – 1 ) CMT/CME
Error SCE rk – r – k + 1 CME= SCE / (rk – r – k + 1)
En la práctica la suma de cuadrados del error se calcula restando a la suma de cuadrados total,
las sumas de cuadrados de bloques y tratamientos. Esto es posible ya que las sumas de cuadrados son
aditivas. La suma de cuadrados del error puede obtenerse directamente por
∑∑ (Y − Yi• − Y• j + Y•• )
r k
2
SC E= ij
i j
Esta fórmula de definición proviene del modelo que define las medias de las varias poblaciones
muestreadas. Hay n medias en el caso del diseño de bloque completo al azar, uno por celda, con sólo
una observación necesariamente hecha en cada población.
Ejemplo ilustrativo de un DBCA
Tabla 18.8. Contenido (%) de aceite de semillas de lino Redwing inoculadas en diferentes estados de
crecimiento (A: plántula, B: Florecimiento temprano, C: Florecimiento completo, D: Florecimiento
completo (1/100), E: Maduración) y sin inocular (F: Control) con S.
Y..2
(132,7) 2
Término común = C = = = 733,72
rk 24
r k
2
A- SC total = ∑∑ Y ij −C = 176,50 + … + 213,09 – 733,72 = 54,51
i i
2
∑Y = 31,6 + ... + 34,5 − 733,72 = 3,14
2 2
i.
SC bloques =
i
−C 6
k
308
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
2
∑Y .j
SC tratamientos = i
−C 20.4 2 + ... + 28,12
r − 733,72 = 31,65
4
Si los efectos de los bloques son significativos, ello indica que la precisión del experimento ha
aumentado debido al uso del diseño en relación con el diseño completamente aleatorizado. En efecto, la
ganancia en eficiencia puede ser de más interés que los resultados de una prueba de significancia; la
eficiencia se estudia según lo visto en el apunte anterior. También el alcance de un experimento puede
haber aumentado cuando los bloques son significativamente diferentes, ya que los tratamientos han sido
probados en condiciones experimentales más amplias. Una palabra de cautela es pertinente aquí: si las
diferencias de bloques son muy grandes, puede haber un problema de heterogeneidad de error.
Si los efectos de bloque son pequeños, ello indica o que el experimentador no tuvo éxito en reducir la
varianza del error agrupando las unidades individuales o que las unidades experimentales eran
esencialmente homogéneas desde un principio.
c) Prueba de F para tratamientos. Para probar la hipótesis nula de que no hay diferencia entre
tratamientos es 6,33/ 1,31 = 4,83** con 5 y 15 grados de libertad es significante al 1 por ciento.
Esto comprueba que hat diferencias reales entre las medias de los tratamientos. Para determinar
donde se encuentran las diferencias, pueden usarse procedimientos generales como los vistos.
, = + - + . + , + ,
Los grados de libertad y las fórmulas para las sumas de cuadrados para un cuadrado latino r x r se dan en
la tabla 18.10. Aquí Yij representa la observación en la intersección de la fila i-ésima (bloques horizontales
o 1º variable controlada) y la columna j-ésima (bloques verticales o 2º variable controlada). Las sumas de
filas y medias se representan como Yi . y Yi . ,para i = 1, ..., k. y las sumas de columnas y medias con Y .j
y Yj . , j = 1, ..., k. Si bien esta notación es adecuada para localizar una observación, no dice nada
respecto al tratamiento recibido, se usa Yijl donde l representa el tratamiento.
309
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
Ejemplo ilustrativo
En El análisis estadístico de un cuadrado latino 4 x 4 se ilustra mediante los datos de rendimiento
en una prueba de evaluación de una variedad de trigo efectuada por Ali A. El Khishen, Escuela de
Agricultura. Universidad de Alejandría, Alejandría, Egipto. Los datos, el análisis y el plan de campo se
presentan en la tabla 18.11. Las variedades están representadas por letras A = Baldi, B = Moktar, C=
Giza 139, y D = Thatcher. Los rendimientos están en kilogramos por parcela de tamaño 42 m2. El
procedimiento de cálculo es como sigue.
Tabla 18.10. Análisis de la varianza para un experimento monofactorial con tratamiento distribuidos según un
cuadrado latino k x k.
Fuente de g.l. Sumas de cuadrados
variación Fórmulas de definición Fórmulas de
cálculo
, − •••
/, −
Total
2
k -1
∑ /••
Columnas
•• − ••• −
k-1
∑ /••
Tratamientos
−
,
(••, − ••• )
k-1
Error
Paso 1. Calcular:
a) los totales de filas Yi ..
b) los totales de columna Y.j.
c) los totales de tratamientos Y..k
d) el total general Y.. . Esta es la suma cuadrados total no ajustada
e) simultáneamente hallar las sumas de los totales al cuadrado de filas, de columnas y de
tratamientos
Tabla 18.11. Plan de campo con los rendimientos de trigo, en kilogramos por
parcela, dispuestos en cuadrado latino 4 x 4.
Columna Totales de fila
2
Fila 1 2 3 4 Yi. ∑Y ij
1 C= 10,5 D= 7,7 B= 12,0 A= 13,2 43,4 487,78
2 B= 11,1 A= 12.0 C= 10,3 D= 7,5 40,9 429,55
3 D= 5,8 C= 12,2 A= 11,2 B= 13,7 42,9 495,61
Totales de /••
4 A= 11,6 B= 12,3 D= 5,9 C= 10,2 40,0 424,70
39,0 44,2 39,4 44,6 162,7 /,
= 1837,64
Columna ∑ /•• 401,66 503,42 410,34 522,22
Totales = /••,
A B C D
Medias = /••,
48,0 49,1 43,2 26,9
12,0 12,3 10,8 6,8
∑y 2
i ••
43,4 2 + ... + 40,0 2
SC Filas= i
−C = − 1,747.24 = 1,95
k 4
∑y
j
2
• j•
39,0 2 + ... + 44,6 2
SC Columnas = −C = − 1,747.24
k 4
El error estándar muestral para una media de tratamientos es sY = √ s2/r = 0,34 kg., donde s2 es
el cuadrado medio del error y r es el número de unidades experimentales por tratamiento. El error
estándar de una diferencia entre dos medias de tratamientos es sYr – Yr. = √ 2s2/r = 0,47 kg. Si se
sospecha heterogeneidad de error, éste no puede dividirse tan fácilmente como en el caso del diseño
de bloques completos al azar.
311
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
α=0,05
Por ejemplo:
a) 18,7 y 19,9 están subrayados por la misma línea, porque hay evidencia muestral de que las
correspondientes dos medias poblacionales son iguales;
b) 14,6 y 19,9 no están unidas por una línea, así que las dos poblaciones deben declararse diferentes;
c) 28,8 aparece solo, así que su media poblacional difiere de todas las otras.
Para los datos de Rhizobium (k = 6; νe = 24; qo.o5 = 4,37 y se = CME r = 11,79 5 = 1,54 ), el
valor crítico para comparar las diferencias de medias es 4,37(1,54) = 6,7mg.
Tabla 18.5. Diferencias entre medias de nitrógeno en un
experimento con Rhizobium.
(6) (5) (4) (3) (2)
(1) 15,5* 10,7* 6,6* 5,4 1,3
(2) 14,2* 9,4* 5,3 4,1
(3) 10,1* 5,3* 1,2
(4) 8,9* 4,1
(5) 4,8
312
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
18.3.4.3.1. Intervalos de confianza de (1 - α) 100% para: 1º) la media de un solo tratamiento y para
2º) las diferencias entre las medias de dos tratamientos a partir de muestras
aleatorias independientes
;
1º) La media de un solo tratamiento:
/• ± 7'⁄
√
2º) La diferencia entre dos medias de tratamientos:
1 1
/• − /•B ± 7'⁄ ;C +
B
donde
; = D; = √ %
y tα/2 se basa en (r – k) grados de libertad.
313
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014
UNIDAD V: DISEÑO EXPERIMENTAL
314
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCuyo / Ciclo 2014