Bloques Completos
Bloques Completos
Diseños en bloques
aleatorizados
5.1. Introducción
En las situaciones que hemos estudiado en el Capítulo 1 hemos supuesto que existe
bastante homogeneidad entre las unidades experimentales, así, por ejemplo, en el caso de la
industria algodonera, hemos supuesto que las parcelas de terreno son de la misma
calidad e igual superficie. Pero, puede suceder que dichas parcelas sean distintas y
contribuyan a la variablidad observada en el rendimiento de la semilla de algodón. Si
en esta situación se utiliza un diseño completamente aleatorizado, las diferencias entre
los rendimientos de dos unidades experimentales sometidas a distintos tratamientos no
sabremos si se deben a una diferencia real entre los efectos de los tratamientos o a la
heterogeneidad de dichas unidades. Como resultado el error experimental reflejará esta
variabilidad entre las parcelas de terreno.
O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo
más homogéneo posible y los bloques entre sí sean heterogéneos.
En esta última situación, cada bloque se divide en I parcelas de terreno, tantas como
tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I
tratamientos, en este caso las I variedades del fertilizante, se asignan al azar a cada una
de las I parcelas del bloque; esto se hace con asignación aleatoria independientemente en
cada bloque. Este
1
2 Diseños en bloques
aleatorizados
Ejemplo 5.1
Una industria algodonera, interesada en maximizar el rendimiento
de la semilla de al- godón, quiere comprobar si dicho rendimiento
depende del tipo de fertilizante utilizado para tratar la planta. A su
disposición tiene 5 tipos de fertilizantes. Como puede haber diferencia
entre las parcelas, el experimentador decide efectuar un diseño en
bloques aleatorizados. Para ello, divide el terreno en 4 bloques2 y
cada bloque en 5 parcelas, fumigando dentro
1
El término bloques aleatorios procede de la experimentación agrícola, en la que pueden usarse
parcelas de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se
supone que las parcelas adyacentes son más semejantes que las alejadas entre sí.
2
El terreno, en cada bloque, debe ser lo más homogéneo posible.
5.2 Diseño en bloques completos 3
aleatorizados
Bloques
Fertilizan A B C D
tes
1 8 86 8 8
7 8 3
2 8 87 9 8
5 5 5
3 9 92 9 9
0 5 0
4 8 97 9 8
9 8 8
5 9 96 9 9
9 1 0
Supondremos que se realiza una observación por tratamiento en cada bloque, por
tanto, hay un total de N = IJ observaciones y que la asignación de los tratamientos a
las unidades experimentales en cada bloque se determina aleatoriamente. También se
supone que tanto los tratamientos como los bloques son factores de efectos fijos y que
no hay interacción entre ellos. Se dice que no hay interacción entre dos factores cuando
el efecto de un factor no depende del nivel del otro factor; en este caso se dice que los
efectos de los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la
siguiente
Tabla 4-2. Diseño en bloques aleatorizado
Bloques
Tratamientos 1 2 ··· j ··· J
1 y11 y12 ··· y 1 ··· y1J
j
··· ···
2 y21 y22 y2j y2J
. .
. . . . .
i yi1 yi2 ··· y ··· yiJ
ij
. . .
. . . .
I yI1 yI2 ··· yIj ··· yIJ
J
Σ
yi. = yij i = 1, 2, · · · , I (5.1)
j=1
I
Σ
y.j = yij j = 1, 2, · · · , J (5.2)
i=1
5.2 Diseño en bloques completos 5
aleatorizados
y¯.j y.j
= I
1Σ 1Σ
I J
y¯ =
. y¯ i = y¯. .
. I . J j
i= j=
1 1
El modelo estadístico para este diseño es:
donde
yij es la variable aleatoria que representa la observación (i)-ésima del bloque (j)-
ésimo.
µ es un efecto constante que mide el nivel promedio de respuesta para todas las
unidades, denominado media global.
τ i es el efecto producido por el nivel i-ésimo del factor principal. Se supone que
Σ
i τ i = 0.
βj es el efecto producido
Σ por el nivel j-ésimo del factor secundario o factor de bloque.
Se supone que j βj = 0.
6 Diseños en bloques
aleatorizados
uij son variables aleatorias independientes con distribución N (0, σ), que engloban el
efecto de todas las restantes fuentes de variabilidad; al igual que en el modelo
com- pletamente aleatorizado, reciben el nombre de perturbaciones o error
experimental.
En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Al
primero es usual llamarlo factor principal mientras que al segundo factor
secundario, puesto que nuestro interés fundamentalmente está centrado en el primero y
el factor bloque se introduce en el modelo para eliminar su influencia en la variable
respuesta.
Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastar
la hipótesis de que todos los niveles del factor principal producen el mismo efecto, frente
a la alternativa de que al menos dos difieren significativamente. También es de interés
contrastar la igualdad de los efectos de los bloques.
La expresión y condiciones de este modelo se resumen en:
1o)yij = µ + τi + βj + uij
ΣI ΣJ
4o) τi = 0 , βj = 0 .
i=1 j=1
−N
2 2
Σ
1
2
Σ I J
L(µ, τ i , β j , ) = (2πσ yij − µ − τ i − , (5.9)
2 exp −
σ ) 2 i=1 βj
2σ j=1
I J
N N
ln(L(µ, τi , jβ , σ2)) = − ln(2π) − ln(σ2) ΣΣ i —µ − i 2
2 2 2σ i=1 y j τ — βj , (5.10)
1 2 j=1
−
y se hallan las primeras derivadas parciales respecto de los parámetros del modelo
I J
Σ Σ
∂ ln L i —µ − i — βj
=
∂µ σ y j τ
2 i=1
1 j=1
∂ ln L Σ
J
= —µ − —β i = 1, · · · , I
1 y τ
∂τ i 2 ij i
σ j j=1
(5.11)
I
∂ ln L Σ
= i —µ − i — βj j = 1, · · · , J
∂β σ i=y j τ
2 1
1
j
I J
∂ ln L 1 ΣΣ i —µ − i 2
∂σ = −2σ + 2(σ2) i=1 y — βj .
N2 2 2
j τ
j=1
µ^ = yij
i=1 j=1
8 Diseños en bloques
= y¯.. , aleatorizados
N
5.2 Diseño en bloques completos 9
aleatorizados
1Σ
J
^τ i = yi — µ^ = i — . , (5.13)
J j j
= y¯ . y¯ .
1
I . (5.14)
— µ^ = —
j 1 Σ i . .
β^ = I i= yj y¯ j y¯ .
1
y Σ
β^j = 0
j
Residuos
Los residuos se definen como las diferencias entre los valores observados yij y los
valores estimados por el modelo y^ij y los denotamos por eij ,
eij = yij − y^ij = yij − µ^ − ^τ i − β^j = yij − y¯i. − y¯.j + y¯.. . (5.16)
ΣΣ
i2
2 ej
σ
^ = i=1 j=1
N
10 Diseños en bloques
aleatorizados
Se verifica que la suma de los residuos por filas y por columnas es cero, en efecto
Σ Σ Σ
eij = − τ i^− β^j ) = J y¯i. − Jy¯.. − Jτ i −
(yij − µ ^ β^j =
j j ^ j
1) Propiedades de µ^
Nµ + J i= τ i +
I j= βj = Nµ =
N 1 1 N
µ independientes las observaciones
b) La varianza de µ es σ2/N , puesto que al ser
^
se verifica:
ΣI J
ΣI J Σ Var [yij ]
yij Va yij =
Var[µ^] = Σ Σ = r =
Var i=1 N i=1 N i, N 2
j=1 j=1 j
Σ σ2 1 2
=
2 =σ
i, N
Nσ
2 N 2 N
j
5.2 Diseño en bloques completos 11
aleatorizados
c) µ
^ se distribuye según una Normal, puesto que dicho estimador es combinación
lineal de variables aleatorias independientes con distribución Normal.
2) Propiedades de τ^i
En efecto
Σ J Σ J
E[y¯i. ] = E j= yij = J E j= µ + τ i + βj + uij =
1 1
J
1 1
ΣJ J
1
Jµ + Jτ i + βj Σ E[uij ] = µ + τ i
J j=+ j=
1 1
2
σ
b) La varianza de τ^i es (I − 1) , puesto
que N
1 1 Σ
— =
Var[^τ
i ]= Vari [y¯ .− y¯ ] = Var
J
i
Σ
. . j y N
i,
y j i
j j
1 Σ 1 2 Σ
Σ Var(yi ) − Cov yij , =
)+ NJ
J2 N j j Σ
2
Var(yij i,j yij
j
i,j
1 Σ 2 1 Σ
σ + 2 2
J22 N σ2 − NJ Jσ =
j i,j
1 2 1 2 2σ 2 2 2
2 σ σ σ
−
σ + σ
J N = − = (I − 1)
N J N (5.17)
c) τ i se distribuye según una Normal, puesto que dicho estimador está
^
expresado como función lineal de variables aleatorias con distribución
Normal.
3) Propiedades de β^j
12 Diseños en bloques
aleatorizados
. i i j i
j I j I j
i i
1Σ 1 Σ
E[y¯ ] = E Σ
y = E µ+τ +β +u =
1
Iµ + τi
I Σ
i + Iβj +
2
σ
^ E[uij ] = µ + βj
b) La varianza de β j es (J − 1)
N i
^
c) β j se distribuye según una Normal.
^2
4) Propiedades de σ
σ^2 no es un estimador insesgado de σ2 puesto que se verifica
2 ΣΣ
I J
(eij ,
N ^σ = 1 (I−1)(J−1)
2 i=1 j=1 )2 2~
σ
σ2 χ
donde los grados de libertad de la distribución χ2 corresponden al número de residuos
independientes, por tanto
N σ^2
2 (I − 1)(J − 1) 2
E σ = (I − 1)(J − 1) ⇒ E[σ^ ] N σ ,
2 =
I J
1 Σ
Σ )2 2~ (I−1)(J−1) .
σ2 χ
(eij
i=1 j=1
Para ello, definamos los siguientes vectores, formado cada uno de ellos por N com-
ponentes:
Denotemos por µ,^ τ , β y e , los vectores obtenidos al sustituir los parámetros por
sus estimadores y las perturbaciones uij por los residuos eij, respectivamente.
Veri- ficándose,^por
^ tanto, la siguiente identidad
Y = µ^ + ^τ + β^ + e (5.20)
U = (µ^ − µ) + (τ − τ ) + (β − β) + e (5.21)
1
dividiendo (5.21) por σ y llamando
^^ Z = U, se tiene la siguiente descomposición
σ
del vector Z, de variables normales (0, 1), en componentes ortogonales.
1 1 1 1
Z= ^ − µ) +
(µ (τ − τ ) + (β − β) + e (5.22)
σ σ σ σ
^
En efecto, los siguientes productos
^ escalares son nulos
∗) ΣΣ
′
µ) − µ) e = (y¯.. −
(µ eij = 0 (5.23)
^
i j
14 Diseños en bloques
aleatorizados
∗) ΣΣ Σ Σ
^ − τ )′e
(τ (τ^i − τ i )eij (τ^i − τ i ) eij = 0 (5.24)
= = i j
i j
∗)
ΣΣ Σ Σ
(β^ − β)′ e (β^j − β j )eij (β^j − eij = 0 (5.25)
= = βj ) i
i j j
De forma similar se comprueba que los restantes productos escalares son nulos. Por
lo tanto, los vectores en que se descompone Z son ortogonales y se verifican las
condiciones del teorema de Cochran cuyo enunciado presentamos en el Capítulo 1.
2
N (y¯−
.. µ)
~ χ2
1
σ2
b) Como (τ^ − τ ) pertenece a un subespacio de dimensión I− 1, al tener I
coorde- nadas distintas y una ecuación de restricción:
1 ′ 1 J Σ 2 2
(τ −
σ^ τ ) × σ(^τ − τ ) =σ (^τi − τi ) ~ χI−
i 1
2
^ − β) pertenece a un subespacio de dimensión J − 1, al tener J coor-
c) Como (β
denadas distintas y una ecuación de restricción:
1 1 I Σ ^
(β^ − β )′ × (β^ − β ) = (βj − jβ )2 ~ J−
χ2
σ σ σ j 1
2
d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas,
como hemos visto, a las ecuaciones de restricción
Σ Σ
eij = 0 ; eij = 0
j i
es decir, la suma de los residuos por filas y por columnas es cero, lo que implica
I + J—1 ecuaciones de restricción e − IJ (I + −J 1) = (I− 1)(J−1) residuos
independientes. Por lo tanto,
5.2 Diseño en bloques completos 15
aleatorizados
ΣΣ
2
ei
j
~2
i j
χ
(I−1)(J−1) .
σ2
En resumen,
µ
^ ~ N (µ, σ2/N )
~ N τ , (I − 1)σ2/N
τ^i i
^j ~ N βj , (J − 1)σ2 /N
β
Nσ2/σ2
^ ~ χ2
(I−1)(J−1)
yij = y¯.. + (y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j + y¯.. ) ,(5.26)
que expresa cada variable yij observada como la suma de cuatro términos:
- El efecto producido por el bloque j-ésimo, (desviación de la media del j-ésimo nivel
del factor bloque respecto de la media total), y¯.j − y¯.. , es decir el estimador de
βj
- La diferencia entre los valores observados yij y los valores previstos por el modelo
y^ij , es decir el estimador de uij .
16 Diseños en bloques
aleatorizados
^τ : Contiene I valore s distintos y¯i. − y¯.. , cada uno repetido J veces. Tiene I −
libertad, ya que Σ
1 grados
de i ^τ i = 0.
Σ^: Contiene J valores distintos y¯.j −y¯.. , cada uno repetido I veces. Tiene J −1
β
grados
^de libertad, ya que
β = 0.
e: Contienejjlos N residuos estimados, que deben sumar cero por filas y por columnas.
Tiene, por tanto, N − (I + J − 1) grados de libertad.
Por lo que, la ecuación (5.26) aplicada a los N datos tomará la siguiente forma (mostra-
da anteriormente):
Y =µ ^+τ +β +e (5.28)
Esta descomposición está formada por
^^componentes ortogonales dos a dos siendo los
grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,
se comprueba directamente que
Σ
I Σ
J
′
µ^ × ^τ = y¯..^ τi = 0
i=1 j=1
Σ I Σ
J
^′
µ^ × β = y¯ βj = 0
^
..
i=1 j=1
I
ΣΣJ
µ^ × e = y¯..
′ eij = 0
i=1 j=1
I J
^τ × β^ = Σ
′ Σ
^τ i β^j = 0
i= j=
1 1
5.2 Diseño en bloques completos 17
aleatorizados
I J
^τ ′ × e = Σ Σ
^τ i eij =0
i= j=
1 1
J I
′ Σ Σ
β^ × e = β^j eij = 0
j=1 i=1
y
N = 1 + (I − 1) + (J − 1) + (I − 1)(J − 1)
La ecuación (5.26) también se puede expresar
yij − y¯.. = (y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j + y¯.. ) , (5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones
tenemos
I
ΣΣJ I
Σ J
(yij − y¯.. ) 2
Σ [(y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j
= + y¯.. )]2 =
i=1 j=1 i=1 j=1
I J
Σ Σ
J (y¯i. − y¯.. )2 + I (y¯.j − y¯.. )2 +
i= j=
1 1
I
Σ J
Σ (yij − y¯i. − y¯.j + y¯.. )2 +
i=1 j=1
(5.30)
I
ΣΣJ
2 (y¯i. − y¯.. )(y¯.j − y¯.. )+
i=1 j=1
I
ΣΣ J
2 (y¯.j − y¯.. )(yij − y¯i. − y¯.j + y¯.. )+
i=1 j=1
I
ΣΣJ
2 (y¯i. − y¯.. )(yij − y¯i. − y¯.j + y¯.. )
i=1 j=1
donde los dobles productos se anulan (ya que los términos son ortogonales, como acabamos
de comprobar), por lo que dicha ecuación queda en la forma
18 Diseños en bloques
aleatorizados
I J I J I J
ΣΣ Σ Σ ΣΣ
(yij − y¯.. )2 = J (y¯i. − y¯.. )2 + I (y¯.j − y¯.. )2 + (yij − y¯i. − y¯.j +
2
y¯.. )
i=1 i= j= i=1
j=1 1 1 j=1
(5.31)
que representa la ecuación básica del análisis de la varianza, que simbólicamente
podemos escribir
I
Σ J
SCT = Σ (yij − y¯.. )2 ,
i=1 j=1
A partir de la ecuación básica del ANOVA se pueden construir los cuadrados medios
definidos como:
I
Σ J
Σ
S^2 = (yij − y¯.. )2
i=1 j=1
T
(5.32)
N −1
5.2 Diseño en bloques completos 19
aleatorizados
S^2 = Σ I
J (y¯i. −
Tr y¯.. )2
∗ Cuadrado medio entre bloques i=1
(5.33)
I −1
ΣJ
I (y¯.j −
SB^2 y¯.. )2
j=1
=l (5.34)
J −1
∗ Cuadrado medio residual
I
ΣΣJ
Una notación muy utilizada también en la práctica para los cuadrados medios
anteri- ores es, respectivamente, CMT , CMTr, CMBl y CMR o CME.
yij = µ + τ i + βj + uij .
Consideremos las expresiones de yi. , y¯i. , y.j , y¯.j , y.. e y¯.. , en función de los
parámetros del modelo,Σcon objetoΣde poder hallar las esperanzas de las varianzas
muestrales. También tengamos en cuenta que i τ i = 0 y j βj = 0 . Así tenemos:
20 Diseños en bloques
aleatorizados
J
Σ
yi. = Jµ + Jτ i + βj + ui. y¯i. = µ + τ i + ui.
;
j=1
I
Σ
y.j = Iµ + τ i + Iβj + u.j y¯.j = µ + β j + (5.36)
; u.j
i=
1
I J
Σ Σ
y.. = Nµ + J τi + I βj + y¯.. = µ + u..
u.. ;
i= j=
1 1
I
Σ ΣI
J (y¯i. − y¯.. )2 J [τ i + (ui. −
S^Tr
2
= i=1
= u..)]2
I−1 i=1
=
I−1
ΣI I
Σ J
J 2
J (ui. − u.. )2 Σ
i
2J τi(ui. − u..)
i=1 i=1 j=1
I −1 + I −1 + I −1
I
I
I
Σ Σ Σ
2 2
i=1
+
i=1
+ i=1 .
E Tr = E JE τ i JE (ui. − u..) 2J τi(ui. − u..)
I−1 I− I −1
S^2 1
I
Σ
2
i i
J τi Σ Σ
J J
E 2 i=1 = E τ 2
= (5.38)
τ
I−1 I−1 I−1
i i
b) Como
^ E [τ i − E [τ^i ]]2 es la Var (τ^i ), cuya expresión, determinada en la
subsec- 2
ción 5.2.2, es (I −
1)σ /N , luego
Σ I
J (ui. − u..)2
I
J Σ
E [ui. − u..]2 =
E =
i=1
I−1 I−1
i=1
I E [(y¯ − y¯ ) − τ ] =
Σ
J
2
I −1 i . i
i= . .
1
J Σ
I
J Σ
I
2
E [^τi − E [τ^
i ]] = Var i(τ^ ) =
I −1 i= I − 1 i=
1 1
I 2 2
Σ
I −J 1 σ J (I − 1)Iσ
i=1(I − 1) N =I − 1 N =
2
σ (5.39)
c) Como E (ui. − u..) = 0, entonces
2J Σ
I
τi(ui. − u..)
E 2
I
Σ
= τ i E [ui. − u..] = 0 . (5.40)
i=1 I −1 J
I−1 i=
1
Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos
que el valor esperado del cuadrado medio entre grupos es:
22 Diseños en bloques
aleatorizados
J Σ
I
E (S^2 ) = τ 2 + σ2 (5.41)
Tr i
I− i=1
1
2o) De la misma forma se comprueba que
I Σ 2
J
E (SB^2 ) = βj + σ2 (5.42)
l J − 1 j=
1
o
3 ) Ya hemos visto en la subsección 5.2.2 que la varianza residual es un estimador ins-
esgado de la varianza poblacional, es decir
^E (S2 2
R )=
σ
4o) Por último, calculemos el valor esperado del cuadrado medio total. Para ello nos
basaremos en la ecuación básica del ANOVA que podemos poner en función de
los cuadrados medios de la siguiente forma:
T Tr B R
(N − 1)E S^2 = (I − 1)E S^2 + (J − 1)El S^2 + (I − 1)(J − 1)E S^2 ,
^2 , obtenemos
E SR
ΣI ΣJ
2 I 2
J i j
j=
E(ST^2 ) i=1
+ 1 2
+σ . (5.43)
= N −1
N −1
Observación
5.1
Hemos visto que al aplicar el método de mínimos cuadrados al
modelo completamente aleatorizado, se obtiene el sistema de
ecuaciones normales (??). En el caso del modelo en bloques
completos aleatorizados, las ecuaciones normales para tratamientos
no contienen
5.2 Diseño en bloques completos 23
aleatorizados
H0β ≡ β1 = β2 = · · · = βJ = 0 (5.45)
c) Si no hay diferencia entre las medias de los J bloques; es decir, si es cierta la hipótesis
de que todo β = 0, el primer sumando de E(S^2 ) es nulo, y
j B B
es un
estimador insesgado de l l
entonces S^2
σ2.
∗ Si existe diferencia en las medias de los tratamientos, el valor esperado deTr S^2
es
2
mayor que σ .
∗ Si existe diferencia en las medias de los bloques, el valor esperado de SB^2 es mayor
que σ2. l
24 Diseños en bloques
aleatorizados
1o) Un contraste para verificar la hipótesis nula de igualdad de medias de los tratamien-
tos puede efectuarse comparando STr ^2 y S^2 .
R
2o) Un contraste para verificar la hipótesis nula de igualdad de medias de los bloques
puede efectuarse comparando SB^2 y RS^2 .
l
Para ello, vamos a estudiar la distribución de SCT , SCTr, SCBl y SCR en las
hipóte- sis de que ni los tratamientos ni los bloques influyen, es decir si las hipótesis (5.44)
y (5.45) son ciertas o equivalentemente, si las N observaciones provienen de la misma
población.
Tipificando las variables aleatorias yij en la descomposición (5.27) , se tiene
1
Z= 1 — µ, . . . , — µ, — µ, . . . , — µ, . . . , — µ, . . . , — µ)′
σ 1
y y y y y
(y 1 2 2J I IJ
J 1 1
1
Z = — µ, . . . . ., y¯ − — µ, . . . . ., y¯ − µ, . . . . ., y¯ − µ, . — µ)′
(y¯ µ, y¯ . . . ., y¯
.. .. .. .. ..
1
..
σ
,, . . . . ., τ , τ
................................ τ , . . . . ., τ , . . . . ., τ )′
Z = 1 (τ
2 ^1 ^1 ^2, ^2 ^I ^I
σ
Z3 = 1 , . . . β^ β , . . . β , . . . β , . . . β^J )′
. ., J , ^ . ., ^J . ., ^ . .,
^ σ 1 1
(β 1
1
Z =
(e ,..., ,e ,... , . . . ., ,..., e )′
e , e e
4 1J 21 2J I1 IJ
σ
donde 11
1
Z: Contiene N términos independientes (y − µ). Tiene, por tanto, N grados de
libertad. ij
σ1
Z : Contiene N coordenadas iguales a (y¯ − µ). Tiene, por tanto, un grado
de
1
..
libertad. σ
5.2 Diseño en bloques completos 25
aleatorizados
1
Z2: Contiene I valores τ^i , cada uno repetido J veces y sujetos a
distintos σ
una
Σ
ecuación de restricción, i ^τ i = 0. Tiene, por tanto, I − 1 grados de libertad.
1
Z3 : Contiene J valores distintos β^j , cada uno repetido I veces y sujetos a
una σ
Σ
^
ecuación de restricción, j β j = 0. Tiene, por tanto, J − 1 grados de libertad.
Bajo las hipótesis nulas hemos realizado una descomposición del vector Z, de variables
N (0, 1) independientes, en componentes ortogonales. Dicha descomposición cumple las
condiciones del Teorema de Cochran, verificándose que:
i)
Σ
J (y i. − y¯.. )2
SCTr i 2
= ~ I−1
σ2 χ
ii)
σ2
Σ
I (y .j − y¯.. )2
SCBl j ~ 2
= J−1
σ2 σ2 χ
iii)
Σ
(yij − y¯i. − y.j + y¯.. )2
SCR i,j
= ~ 2 (I−1)
(J−1)
σ2 σ2 χ
y además estas tres distribuciones son independientes entre sí.
Por una parte, se tiene que SCR/σ2 se distribuye como una χ2 con (I —1)(J − 1)
grados de libertad, se verifique o no la hipótesis nula, como ya vimos en la
subsección 5.2.2
Por otra parte, bajo las hipótesis (5.44) y (5.45), se tiene que SCTr/σ2 y SCBl/σ2
se distribuyen como una χ2 con I − 1 y J − 1 grados de libertad, respectivamente.
26 Diseños en bloques
aleatorizados
Por consiguiente, bajo las hipótesis de igualdad de efectos de los tratamientos y los
bloques, se verifica
SCTr/σ2
^ 2
STr ~ F
Fτ = I−1 (5.48)
2 = ^ (I−1),(I−1)(J−1)
SCR/σ
S
2R
(I − 1)(J − 1)
y
SCBl/σ2
Fβ = J −1 ^2
SBl ~ F(J−1),(I−1)(J−1) . (5.49)
SCR/σ 2 =
S ^
(I − 1)(J − 1) 2R
Estos son los estadísticos de contraste para probar dichas hipótesis nulas. Por lo tanto:
I J 2
ΣΣ y..
SCT =
2 —
IJ
y i
i=1 j=1 j
I 2
1Σ (5.50)
SCTr = J yi.2 − IJ
y
..
i=
1
J 2
1Σ 2 y..
SCBl = I j=y.j − IJ ,
1
y la suma de cuadrados del error se obtiene por diferencia
(I − 1)(J − S^R
Residual 2
SCT − SCTr −
1)
SCBl =
SCR
I J
ΣΣ IJ − 1 S^T
TOTAL 2
(yij − y¯.. )2 = SCT
i=1 j=1
(I − 1)(J − S^R
Residual 2
SCT − SCTr −
1)
SCBl =
SCR
ΣΣ
I J
y2..
IJ − 1 S^T
2 2
TOTAL yij −
i=1 j=1
IJ
Una de las ventajas del diseño en bloques aleatorizados es que se puede transformar
en un diseño unifactorial, simplemente suprimiendo el estudio por bloques y uniendo su
variabilidad a la residual.
Coeficientes de determinación
Al igual que en el modelo completamente aleatorizado, una medida apropiada
para comprobar la adecuación del modelo a los datos es el coeficiente de determinación,
denotado por R2 y definido como el cociente entre la suma de las variabilidades explicadas
por los tratamientos y los bloques, y la variabilidad total
SCTr + SCBl
R2 = SCT .
Llamando
Rτ2 al cociente entre la variabilidad explicada por los tratamientos y la total, es decir
SCTr
Rτ2 = SCT ,
5.2 Diseño en bloques completos 29
aleatorizados
Rβ2 al cociente entre la variabilidad explicada por los bloques y la total, es decir
SCBl
Rβ2 = SCT ,
R2 = R2 + R2 ,
τ β
Para ello, construimos la Tabla 4-5, organizando los datos de la siguiente manera
bloques
Fertilizantes A B C D yi. 2
yi.
1 87 86 88 83 344 118336
2 85 87 95 85 352 123904
3 90 92 95 90 367 134689
4 89 97 98 88 372 138384
5 99 96 91 90 376 141376
y.j 450 458 467 436 1811 656689
Σ 2
y.j 202500 209764 218089 190096 820449
2 40616 42054 43679 38058 164407
yij
siguiente forma:
5 4 2 2
SCT = ΣΣ i (1811)
j2 IJ = 164407 − = 420,95
y − 20
y..
i=1
j=1
5 2 2
656689 (1811)
1Σ
= − 20 = 186,20
SCTr = J yi.2 − IJ 4
y
..
i=
1
4 2 2
1Σ =
820449 (1811)
− = 103,75
.2
SCBl = I yj − IJ 5 20
y
..
j=
1
Tabla 4-6. Análisis de la varianza para los datos del Ejemplo 4-1
SCTr
R2 =
186,2 = = 0,4423
τ
SCT 420,95
SCTBl 103,75
R2β = = 420,95 = 0,2464 ,
que:
SCT
Tabla 4-7. Análisis de la varianza para los datos del Ejemplo 4-1
HSD = qα,I,(I−1) 2
SR = 10,916
6 = (4,51)(1,65) = 7,4415 .
(J−1) q0,05,5,12 J
^ 4
Figura 4-2
Figura 4-3
1 + (I − 1) + (J − 1) + (I − 1)(J − 1) = IJ ,
que, puesto que hay una sola observación por celdilla, coincide con el número de obser-
vaciones, no habiendo suficientes grados de libertad para estimar la varianza residual.
Un procedimiento para solventar este problema consiste en tomar más de una
observación por celdilla.
Tukey (1949) desarrolló un método para determinar si existe interacción entre tratamien-
tos y bloques, cuando sólo hay una observación por celdilla, conocido como el test de
in- teracción de un grado de libertad de Tukey. Este procedimiento supone
que la forma de la interacción es particularmente simple, es decir
(τβ)ij = γτ i β j ,
en donde γ es una constante desconocida. De esta forma las interacciones añaden única-
mente un parámetro, y el modelo resultante es:
34 Diseños en bloques
aleatorizados
N N I J
ln(L(µ, τ , σ2)) = − ln(2π) − ln(σ2) − ΣΣ — µ−τ — γτ
1 −β
2
y β ,
i i j j
i
2 2 2σ2 j i
i=1 j=1
(5.55)
y se hallan las primeras derivadas parciales respecto de los parámetros del modelo,
obtenién- dose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los
parámetros µ, τ i y βj .
ij i j i j i j
de donde ∂γ
i=1 j=1
σ2
I J I J I J J I I J
ΣΣ Σ Σ Σ Σ Σ Σ Σ Σ
2
yijτiβj − µ τi βj − τ βj − β2 τi − γ τ 2
β2 = 0 . i j i j
i=1 i= j= i= j= j=
ij=1
= i1= j1= 1 1 1
1 1 1
5.4 Comprobación de la idoneidad del 35
modelo
Por lo tanto
I J
ΣΣ
Σ τ i β j yij
^
^ j=1
i=1 ^
γ^ = Σ , (5.57)
i=1
I J
j=1 2
2i
τ β^j
i= j=
1 1
Como hemos supuesto la existencia de interacción entre los factores, hay que introducir
en este modelo una suma de cuadrados que represente dicha interacción, esta suma de
cuadrados se denota por SCIT y viene dada por la expresión
ΣΣ 2
SCIT = γ^2i τ^j 2 β^ , (5.59)
i j
i= j=
1 1
Por lo tanto, la ecuación básica del análisis de la varianza para el modelo con inter-
acción (5.53) debe tener un término más que la citada ecuación del modelo en bloques
aleatorizados. Dicha ecuación se expresa simbólicamente en la forma
donde
36 Diseños en bloques
aleatorizados
puesto que, F se distribuye como una F1,IJ−I−J cuando H0 es cierta y puesto que los
valores grandes de Fexp conducen a la conclusión H1, la decisión apropiada para
controlar un riesgo de error de Tipo I igual a α, es:
Bloques
ΣJ
Fert. A B C D y¯ ^τ i ^
2 τ^ β^
τ y
i. i i j ij
j=1
1 87 86 88 83 86,00 −4,55 20,702 −69,16
2 85 87 95 85 88,00 −2,55 6,502 −78,03
3 90 92 95 90 91,75 1,20 1,440 19,62
4 89 97 98 88 93,00 2,45 6,002 91,63
5 99 96 91 90 94,00 3,45 11,902 14,49
y¯.j 90 91,6 93,4 87,2 90,55 = y¯.. 46,55 −21,45
β^2 j −0,55 1,05 2,85 −3,35
β^j 0,302 1,102 8,122 11,222 20,75
Bibliografía utilizada