0% encontró este documento útil (0 votos)
18 vistas39 páginas

Bloques Completos

El capítulo 5 aborda el diseño en bloques aleatorizados, que se utiliza para controlar la variabilidad en experimentos donde las unidades experimentales pueden ser heterogéneas. Se presentan dos tipos de diseño: el diseño en bloques completos aleatorizados, donde todos los tratamientos se aplican en cada bloque, y el diseño por bloques incompletos, donde no todos los tratamientos están presentes en cada bloque. Se formaliza un modelo estadístico para estimar los efectos de los tratamientos y bloques, y se discute la importancia de reducir el error experimental para obtener resultados más precisos.

Cargado por

ELKIN ALBARRACIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
18 vistas39 páginas

Bloques Completos

El capítulo 5 aborda el diseño en bloques aleatorizados, que se utiliza para controlar la variabilidad en experimentos donde las unidades experimentales pueden ser heterogéneas. Se presentan dos tipos de diseño: el diseño en bloques completos aleatorizados, donde todos los tratamientos se aplican en cada bloque, y el diseño por bloques incompletos, donde no todos los tratamientos están presentes en cada bloque. Se formaliza un modelo estadístico para estimar los efectos de los tratamientos y bloques, y se discute la importancia de reducir el error experimental para obtener resultados más precisos.

Cargado por

ELKIN ALBARRACIN
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Capítulo 5

Diseños en bloques
aleatorizados

5.1. Introducción
En las situaciones que hemos estudiado en el Capítulo 1 hemos supuesto que existe
bastante homogeneidad entre las unidades experimentales, así, por ejemplo, en el caso de la
industria algodonera, hemos supuesto que las parcelas de terreno son de la misma
calidad e igual superficie. Pero, puede suceder que dichas parcelas sean distintas y
contribuyan a la variablidad observada en el rendimiento de la semilla de algodón. Si
en esta situación se utiliza un diseño completamente aleatorizado, las diferencias entre
los rendimientos de dos unidades experimentales sometidas a distintos tratamientos no
sabremos si se deben a una diferencia real entre los efectos de los tratamientos o a la
heterogeneidad de dichas unidades. Como resultado el error experimental reflejará esta
variabilidad entre las parcelas de terreno.

En todo diseño de experimento se desea que el error experimental sea lo más


pequeño posible. Por lo tanto, en la situación descrita se debe sustraer del error
experimental la variabilidad producida por las parcelas de terreno. Para ello, el
experimentador puede:

Considerar parcelas de terreno muy homogéneas.

O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo
más homogéneo posible y los bloques entre sí sean heterogéneos.

En esta última situación, cada bloque se divide en I parcelas de terreno, tantas como
tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I
tratamientos, en este caso las I variedades del fertilizante, se asignan al azar a cada una
de las I parcelas del bloque; esto se hace con asignación aleatoria independientemente en
cada bloque. Este

1
2 Diseños en bloques
aleatorizados

diseño se conoce como diseño en bloques1 completos aleatorizados. La palabra


completo
indica que todos los tratamientos se prueban en cada bloque.
Puede suceder, cuando se realizan diseños en bloques aleatorizados, que no puedan
realizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo,
a la escasez de recursos del experimento o al tamaño físico de los bloques. Es decir, no
se puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar
diseños aleatorizados por bloques en los que no todos los tratamientos se encuentran
representados en cada bloque, y aquellos que sí están representados en uno en particular
se ensayan en él una sola vez. Estos diseños se conocen como diseños por bloques
incompletos.
Recordemos que en el diseño completamente aleatorizado asignábamos los
tratamien- tos al azar a las parcelas sin restricción alguna, mientras que en el diseño en
bloques aleatorizados primero agrupamos las parcelas en bloques y a continuación
asignamos los tratamientos a las parcelas en cada bloque. Podemos decir, por tanto, que
un diseño en bloque aleatorizados es un diseño con aleatorización restringida en el cual
las unidades experimentales son primero clasificadas en grupos homogéneos, llamados
bloques, y los tratamientos son entonces asignados aleatoriamente dentro de los
bloques.
Esta estrategia de diseño mejora efectivamente la precisión en las comparaciones al
reducir la variabilidad residual. Dicho diseño es quizás el diseño experimental más ampli-
amente utilizado. En la práctica, las situaciones en las que este diseño se aplica son muy
numerosas y pueden identificarse fácilmente.
Estudiaremos en primer lugar el diseño en bloques completos
aleatorizados, y en la sección ?? el diseño en bloques incompletos.

5.2. Diseño en bloques completos aleatorizados


Para desarrollar esta sección consideramos el siguiente ejemplo al que seguiremos
haciendo referencia en las sucesivas secciones.

Ejemplo 5.1
Una industria algodonera, interesada en maximizar el rendimiento
de la semilla de al- godón, quiere comprobar si dicho rendimiento
depende del tipo de fertilizante utilizado para tratar la planta. A su
disposición tiene 5 tipos de fertilizantes. Como puede haber diferencia
entre las parcelas, el experimentador decide efectuar un diseño en
bloques aleatorizados. Para ello, divide el terreno en 4 bloques2 y
cada bloque en 5 parcelas, fumigando dentro
1
El término bloques aleatorios procede de la experimentación agrícola, en la que pueden usarse
parcelas de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se
supone que las parcelas adyacentes son más semejantes que las alejadas entre sí.
2
El terreno, en cada bloque, debe ser lo más homogéneo posible.
5.2 Diseño en bloques completos 3
aleatorizados

de cada bloque cada una de las parcelas con un fertilizante. Al


recoger la cosecha se mide el rendimiento de la semilla,
obteniéndose las siguientes observaciones.
Tabla 4-1. Rendimiento de la
semilla de algodón

Bloques
Fertilizan A B C D
tes
1 8 86 8 8
7 8 3
2 8 87 9 8
5 5 5
3 9 92 9 9
0 5 0
4 8 97 9 8
9 8 8
5 9 96 9 9
9 1 0

Especificamente, en este experimento, se han considerado 5 tipos de fertilizantes que


se han aplicado aleatoriamente a las parcelas dentro de cada bloque. La variable de interés
o variable respuesta es el rendimiento de la semilla en peso por unidad de superficie. En
este ejemplo hemos supuesto que el tipo de terreno influye en el rendimiento de la semilla
de algodón y decidimos “controlar” estadísticamente sus efectos, mediante la formación de
bloques. Es decir, nuestro propósito es eliminar en el estudio de los efectos del
fertilizante la variabilidad debida al terreno e intentar que de esta forma sean más patentes
las diferencias entre los fertilizantes, si las hay.

5.2.1. Planteamiento del modelo


Todo el planteamiento anterior se puede formalizar de manera general. Supongamos
I tratamientos, (I fertilizantes), y supongamos también que hay otra variable que pueda
influir en la variable respuesta, (por ejemplo, el tipo de terreno) y cuyos efectos
deseamos “controlar” estadísticamente. Para ello, seleccionamos J niveles de esta variable,
J bloques, y aplicamos cada uno de los I niveles del tratamiento en cada bloque. La
figura 4-1 muestra este tipo de diseño.

Bloque 1 Bloque j Bloque J


y1 y1 y1J
1 ··· j ···
.
. . . . yiJ
yi1 . yij .
.
. ··· . ··· yIJ
Figura 4-1. Diseño en bloques completos aleatorizados.
4 Diseños en bloques
aleatorizados

Supondremos que se realiza una observación por tratamiento en cada bloque, por
tanto, hay un total de N = IJ observaciones y que la asignación de los tratamientos a
las unidades experimentales en cada bloque se determina aleatoriamente. También se
supone que tanto los tratamientos como los bloques son factores de efectos fijos y que
no hay interacción entre ellos. Se dice que no hay interacción entre dos factores cuando
el efecto de un factor no depende del nivel del otro factor; en este caso se dice que los
efectos de los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la
siguiente
Tabla 4-2. Diseño en bloques aleatorizado

Bloques
Tratamientos 1 2 ··· j ··· J
1 y11 y12 ··· y 1 ··· y1J
j
··· ···
2 y21 y22 y2j y2J
. .
. . . . .
i yi1 yi2 ··· y ··· yiJ
ij
. . .
. . . .
I yI1 yI2 ··· yIj ··· yIJ

Generalmente no vamos a utilizar el término completo cuando en el contexto esté


claro que todos los tratamientos están incluidos en cada bloque.
Utilizamos la siguiente notación:

N = IJ es el número total de observaciones.

yi. es el total de las observaciones bajo el i-ésimo tratamiento, es decir

J
Σ
yi. = yij i = 1, 2, · · · , I (5.1)
j=1

y.j es el total de las observaciones bajo el j-ésimo bloque, es decir

I
Σ
y.j = yij j = 1, 2, · · · , J (5.2)
i=1
5.2 Diseño en bloques completos 5
aleatorizados

y.. es la suma de todas las observaciones, denominado el total general, es decir


I J I J
ΣΣ Σ Σ
y.. = yij = yi. = y.j (5.3)
i=1 i= j=
j=1 1 1

y¯i. es la media de las observaciones del tratamiento i-ésimo, es decir


y
y¯i. = i.
J

y¯.j es la media de las observaciones del bloque j-ésimo, es decir

y¯.j y.j
= I

y¯.. es la media general de las observaciones, es decir


I J
y.. 1 Σ Σ
y¯ . = = i
. N N i=1 jy ,
j=1
que también se puede expresar como media de las medias parciales, es decir

1Σ 1Σ
I J
y¯ =
. y¯ i = y¯. .
. I . J j
i= j=
1 1
El modelo estadístico para este diseño es:

yij = µ + τ i + βj + uij i = 1, 2, · · · , I ; j = 1, 2, · · · , J , (5.4)

donde

yij es la variable aleatoria que representa la observación (i)-ésima del bloque (j)-
ésimo.

µ es un efecto constante que mide el nivel promedio de respuesta para todas las
unidades, denominado media global.

τ i es el efecto producido por el nivel i-ésimo del factor principal. Se supone que
Σ
i τ i = 0.

βj es el efecto producido
Σ por el nivel j-ésimo del factor secundario o factor de bloque.
Se supone que j βj = 0.
6 Diseños en bloques
aleatorizados

uij son variables aleatorias independientes con distribución N (0, σ), que engloban el
efecto de todas las restantes fuentes de variabilidad; al igual que en el modelo
com- pletamente aleatorizado, reciben el nombre de perturbaciones o error
experimental.
En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Al
primero es usual llamarlo factor principal mientras que al segundo factor
secundario, puesto que nuestro interés fundamentalmente está centrado en el primero y
el factor bloque se introduce en el modelo para eliminar su influencia en la variable
respuesta.
Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastar
la hipótesis de que todos los niveles del factor principal producen el mismo efecto, frente
a la alternativa de que al menos dos difieren significativamente. También es de interés
contrastar la igualdad de los efectos de los bloques.
La expresión y condiciones de este modelo se resumen en:

1o)yij = µ + τi + βj + uij

2o)uij ~ N (0, σ) ∀i, j

3o)uij son independientes entre sí (5.5)

ΣI ΣJ
4o) τi = 0 , βj = 0 .
i=1 j=1

Las hipótesis establecidas para la variable de perturbación pueden ser formuladas


tam- bién en términos de la variable respuesta. Es decir, las observaciones yij son
variables aleatorias independientes con distribución normal, con media
E[yij ] = µ + τ i + β j , (5.6)
y varianza constante
σ2 [yij ] = σ 2 ∀i, j . (5.7)

En este planteamiento, el contraste de hipótesis más importante es


H0 : τ i = 0 ∀i
(5.8)
H1 : τ i =/ 0 por lo menos para algún i .

A continuación, vamos a estudiar la estimación de los parámetros del modelo µ, τ i , βj


y σ2.
5.2 Diseño en bloques completos 7
aleatorizados

5.2.2. Estimación de los parámetros del modelo


Estimación por máxima verosimilitud
Al igual que en modelo completamente aleatorizado se construye la función de
verosimilitud asociada a la muestra y = (y11, · · · , y1J , · · · , yI1, · · · , yIJ ):

−N 
2 2
Σ 
1
2
Σ I J
L(µ, τ i , β j , ) = (2πσ yij − µ − τ i −  , (5.9)
2 exp −
σ ) 2 i=1 βj
2σ j=1

se determina el logaritmo de dicha función

I J
N N
ln(L(µ, τi , jβ , σ2)) = − ln(2π) − ln(σ2) ΣΣ i —µ − i 2
2 2 2σ i=1 y j τ — βj , (5.10)
1 2 j=1

y se hallan las primeras derivadas parciales respecto de los parámetros del modelo
I J
Σ Σ
∂ ln L i —µ − i — βj
=
∂µ σ y j τ
2 i=1
1 j=1

∂ ln L Σ
J
= —µ − —β i = 1, · · · , I
1 y τ
∂τ i 2 ij i
σ j j=1
(5.11)
I

∂ ln L Σ
= i —µ − i — βj j = 1, · · · , J
∂β σ i=y j τ
2 1
1
j

I J

∂ ln L 1 ΣΣ i —µ − i 2
∂σ = −2σ + 2(σ2) i=1 y — βj .
N2 2 2
j τ
j=1

Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones que


proporciona los estimadores máximo verosímiles. Dichos estimadores vienen dados por las
expresiones
ΣΣI J

µ^ = yij
i=1 j=1
8 Diseños en bloques
= y¯.. , aleatorizados
N
5.2 Diseño en bloques completos 9
aleatorizados


J
^τ i = yi — µ^ = i — . , (5.13)
J j j
= y¯ . y¯ .
1
I . (5.14)
— µ^ = —
j 1 Σ i . .
β^ = I i= yj y¯ j y¯ .
1

Por tanto, la media general se estima utilizando el promedio de todas las


observaciones y cualquiera de los efectos de los factores se estiman usando la diferencia
entre el promedio correspondiente al nivel del factor y el promedio total.
Se puede comprobar fácilmente que
Σ
^τ i = 0
i

y Σ
β^j = 0
j

siendo, por tanto, I — 1 y J − 1 los grados de libertad asociados a los tratamientos y a


los bloques, respectivamente.
^ τ i y βj en la última ecuación de (5.11) igualada a cero,
Finalmente, sustituyendo µ,
obtenemos el estimador de máxima verosimilitud para la varianza
^^
2 = 1
ΣIΣ
σ^ yij − µ^ − ^τ i − . (5.15)
N J
2
β^ j
i=1 j=1

Residuos
Los residuos se definen como las diferencias entre los valores observados yij y los
valores estimados por el modelo y^ij y los denotamos por eij ,

eij = yij − y^ij = yij − µ^ − ^τ i − β^j = yij − y¯i. − y¯.j + y¯.. . (5.16)

Por lo tanto, el estimador máximo-verosimil, ^


σ2, se puede escribir como
I J

ΣΣ
i2
2 ej
σ
^ = i=1 j=1
N
10 Diseños en bloques
aleatorizados

Se verifica que la suma de los residuos por filas y por columnas es cero, en efecto
Σ Σ Σ
eij = − τ i^− β^j ) = J y¯i. − Jy¯.. − Jτ i −
(yij − µ ^ β^j =
j j ^ j

J y¯i. − Jy¯.. − J(y¯i. − y¯.. ) = 0 i = 1, · · · , I


Σ Σ Σ
eij = − β^j ) = Iy¯.j − Iy¯.. −
(yij − µ −^ τ i ^ τ i − Iβ^j =
i i ^ i

Iy¯.j − Iy¯.. − I(y¯.j − y¯.. ) = 0 j = 1, · · · , J


por lo tanto hay (I − 1)(J − 1) residuos independientes, ya que
IJ − (I + J − 1) = (I − 1)(J − 1) .

Propiedades de los estimadores máximo verosímiles


A continuación vamos a ver algunas propiedades que verifican los estimadores
del modelo. Concretamente, vamos a determinar su esperanza, su varianza y su
distribución en el muestreo.

1) Propiedades de µ^

a) µ^ es un estimador centrado de µ, puesto que


I J I J +β )=
1 ΣΣ 1 ΣΣ
E[µ^] = E.[y¯ ] = E[yi ] = (µ + i j
τ . N j N
i=1 i=1
j=1 j=1
 
1 1 Σ
I Σ
J

Nµ + J i= τ i +

I j= βj = Nµ =
N 1 1 N
µ independientes las observaciones
b) La varianza de µ es σ2/N , puesto que al ser
^
se verifica:
 
ΣI J
ΣI J Σ Var [yij ]
yij Va yij =
Var[µ^] = Σ Σ = r =
Var  i=1 N i=1 N i, N 2
j=1 j=1 j
Σ σ2 1 2
=
2 =σ
i, N

2 N 2 N
j
5.2 Diseño en bloques completos 11
aleatorizados

c) µ
^ se distribuye según una Normal, puesto que dicho estimador es combinación
lineal de variables aleatorias independientes con distribución Normal.

2) Propiedades de τ^i

a) i es un estimador centrado de τi, puesto que

E[^τ i ] = E[y¯i. ] − E[y¯.. ] = µ + τ i − µ = τ i .

En efecto
  
Σ J Σ J
  
E[y¯i. ] = E  j= yij = J E j= µ + τ i + βj + uij =
1 1
J
1 1
 
ΣJ J
1 
Jµ + Jτ i + βj Σ E[uij ] = µ + τ i
J j=+ j=
1 1

2
σ
b) La varianza de τ^i es (I − 1) , puesto
que N
 
1 1 Σ
 — =
Var[^τ
i ]= Vari [y¯ .− y¯ ] = Var
J
i
Σ
. . j y N
i,
y j i
j j

 
1 Σ 1 2 Σ
Σ Var(yi ) − Cov  yij , =
)+ NJ
J2 N j j Σ
2
Var(yij i,j yij
j
i,j

1 Σ 2 1 Σ
σ + 2 2
J22 N σ2 − NJ Jσ =
j i,j

1 2 1 2 2σ 2 2 2
2 σ σ σ

σ + σ
J N = − = (I − 1)
N J N (5.17)
c) τ i se distribuye según una Normal, puesto que dicho estimador está
^
expresado como función lineal de variables aleatorias con distribución
Normal.

3) Propiedades de β^j
12 Diseños en bloques
aleatorizados

a) β^j es un estimador centrado de β j , puesto que

E[β^j ] = E[y¯.j ] − E[y¯.. ] = µ + β j − µ = β j .


En efecto

. i i j i
j I j I j
i i

1Σ 1 Σ
E[y¯ ] = E Σ
y = E µ+τ +β +u =
1
Iµ + τi
I Σ
i + Iβj +
2
σ
^ E[uij ] = µ + βj
b) La varianza de β j es (J − 1)
N i
^
c) β j se distribuye según una Normal.

^2
4) Propiedades de σ
σ^2 no es un estimador insesgado de σ2 puesto que se verifica
2 ΣΣ
I J
(eij ,
N ^σ = 1 (I−1)(J−1)
2 i=1 j=1 )2 2~
σ
σ2 χ
donde los grados de libertad de la distribución χ2 corresponden al número de residuos
independientes, por tanto

N σ^2
2 (I − 1)(J − 1) 2
E σ = (I − 1)(J − 1) ⇒ E[σ^ ] N σ ,
2 =

luego σ2 no es un estimador insesgado de σ2. Ahora bien, a partir de este


^ se construye fácilmente un estimador centrado simplemente considerando
resultado
2 N 2
˜ =
σ σ^ .
(I − 1)(J − 1)

Dicho estimador recibe el nombre de varianza residual, se denota por ^2 y se


R S
expresa,
por tanto, de la siguiente forma
I J I J
ΣΣ
[yij − y^ij ]2 Σ Σ i 2
je
2 2 i=1
j=1 ^ i=1 j=1
σ˜ = S R= = (I − 1)(J − 1) . (5.18)
(I − 1)(J − 1)
5.2 Diseño en bloques completos 13
aleatorizados

Vamos a demostrar que efectivamente

I J
1 Σ
Σ )2 2~ (I−1)(J−1) .
σ2 χ
(eij
i=1 j=1

Para ello, definamos los siguientes vectores, formado cada uno de ellos por N com-
ponentes:

Y = (y11, · · · , y1J, y21, · · · , y2J , · · · , yI1, · · · , yIJ′ )′ µ


= (µ, . · · · ., µ, µ, . · · · ., µ, . · · · ., µ, . · · · ., µ)
τ = (τ 1, . · · · ., τ 1, τ 2, . · · · ., τ 2, . · · · ., τ I , . · · · ., τ I)′
β = (β1, . · · · ., β J , β1, . · · · ., β J , . · · · ., β1, . · · · ., βJ )′
U = (u11, · · · , u1J , u21, · · · , u2J , · · · , uI1, · · · , uIJ )′ .

De esta forma, el modelo en bloques aleatorizados se puede expresar como:

Y=µ+τ +β+U (5.19)

Denotemos por µ,^ τ , β y e , los vectores obtenidos al sustituir los parámetros por
sus estimadores y las perturbaciones uij por los residuos eij, respectivamente.
Veri- ficándose,^por
^ tanto, la siguiente identidad

Y = µ^ + ^τ + β^ + e (5.20)

De (5.19) y (5.20) se obtiene

U = (µ^ − µ) + (τ − τ ) + (β − β) + e (5.21)
1
dividiendo (5.21) por σ y llamando
^^ Z = U, se tiene la siguiente descomposición
σ
del vector Z, de variables normales (0, 1), en componentes ortogonales.

1 1 1 1
Z= ^ − µ) +
(µ (τ − τ ) + (β − β) + e (5.22)
σ σ σ σ
^
En efecto, los siguientes productos
^ escalares son nulos
∗) ΣΣ

µ) − µ) e = (y¯.. −
(µ eij = 0 (5.23)
^
i j
14 Diseños en bloques
aleatorizados

∗) ΣΣ Σ Σ
^ − τ )′e
(τ (τ^i − τ i )eij (τ^i − τ i ) eij = 0 (5.24)
= = i j
i j

∗)
ΣΣ Σ Σ
(β^ − β)′ e (β^j − β j )eij (β^j − eij = 0 (5.25)
= = βj ) i
i j j

De forma similar se comprueba que los restantes productos escalares son nulos. Por
lo tanto, los vectores en que se descompone Z son ortogonales y se verifican las
condiciones del teorema de Cochran cuyo enunciado presentamos en el Capítulo 1.

Por consiguiente, los cuadrados de los módulos de los vectores de la descomposición


(5.22) seguirán distribuciones χ2 independientes cuyos grados de libertad serán la
dimensión del subespacio al que pertenezca cada vector. De esta forma,

a) Como (µ^ − µ) pertenece a un subespacio de dimensión 1, al tener todas sus


coordenadas iguales:

2
N (y¯−
.. µ)
~ χ2
1
σ2
b) Como (τ^ − τ ) pertenece a un subespacio de dimensión I− 1, al tener I
coorde- nadas distintas y una ecuación de restricción:

1 ′ 1 J Σ 2 2
(τ −
σ^ τ ) × σ(^τ − τ ) =σ (^τi − τi ) ~ χI−
i 1
2
^ − β) pertenece a un subespacio de dimensión J − 1, al tener J coor-
c) Como (β
denadas distintas y una ecuación de restricción:

1 1 I Σ ^
(β^ − β )′ × (β^ − β ) = (βj − jβ )2 ~ J−
χ2
σ σ σ j 1
2
d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas,
como hemos visto, a las ecuaciones de restricción
Σ Σ
eij = 0 ; eij = 0
j i

es decir, la suma de los residuos por filas y por columnas es cero, lo que implica
I + J—1 ecuaciones de restricción e − IJ (I + −J 1) = (I− 1)(J−1) residuos
independientes. Por lo tanto,
5.2 Diseño en bloques completos 15
aleatorizados

ΣΣ
2
ei
j
~2
i j
χ
(I−1)(J−1) .
σ2
En resumen,

µ
^ ~ N (µ, σ2/N )
~ N τ , (I − 1)σ2/N
τ^i i
^j ~ N βj , (J − 1)σ2 /N
β

Nσ2/σ2
^ ~ χ2
(I−1)(J−1)

5.2.3. Descomposición de la variabilidad


Como dijimos en el Capítulo 1, para comparar globalmente los efectos de los
distintos niveles de un factor se emplea la técnica estadística denominada análisis
de la varianza, que está basada en la descomposición de la variabilidad total de los
datos en distintas componentes. En los diseños en bloques aleatorizados también se
emplea esta técnica y para ello consideramos la siguiente identidad:

yij = y¯.. + (y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j + y¯.. ) ,(5.26)

que expresa cada variable yij observada como la suma de cuatro términos:

- La media total y¯.. , es decir el estimador de µ

- El efecto producido por el tratamiento i-ésimo, (desviación de la media del i-ésimo


nivel del factor principal respecto de la media total), y¯i. − y¯.. , es decir el
estimador de τ i

- El efecto producido por el bloque j-ésimo, (desviación de la media del j-ésimo nivel
del factor bloque respecto de la media total), y¯.j − y¯.. , es decir el estimador de
βj

- La diferencia entre los valores observados yij y los valores previstos por el modelo
y^ij , es decir el estimador de uij .
16 Diseños en bloques
aleatorizados

Por tanto, la expresión (5.26) también se puede poner en la forma


yij = µ^ + ^τ i + β^j + eij (5.27)

Considerando esta expresión para todas las observaciones y expresándola en forma


vectorial resultan los siguientes vectores, todos ellos de dimensión N :
Y: Contiene los N términos independientes yij. Tiene, por tanto, N grados de lib-
ertad.
µ^: Contiene N coordenadas iguales a y¯.. . Tiene, por tanto, un grado de libertad.

^τ : Contiene I valore s distintos y¯i. − y¯.. , cada uno repetido J veces. Tiene I −
libertad, ya que Σ
1 grados
de i ^τ i = 0.

Σ^: Contiene J valores distintos y¯.j −y¯.. , cada uno repetido I veces. Tiene J −1
β
grados
^de libertad, ya que
β = 0.
e: Contienejjlos N residuos estimados, que deben sumar cero por filas y por columnas.
Tiene, por tanto, N − (I + J − 1) grados de libertad.
Por lo que, la ecuación (5.26) aplicada a los N datos tomará la siguiente forma (mostra-
da anteriormente):
Y =µ ^+τ +β +e (5.28)
Esta descomposición está formada por
^^componentes ortogonales dos a dos siendo los
grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,
se comprueba directamente que
Σ
I Σ
J

µ^ × ^τ = y¯..^ τi = 0
i=1 j=1

Σ I Σ
J
^′
µ^ × β = y¯ βj = 0
^
..
i=1 j=1

I
ΣΣJ
µ^ × e = y¯..
′ eij = 0
i=1 j=1

I J

^τ × β^ = Σ
′ Σ
^τ i β^j = 0
i= j=
1 1
5.2 Diseño en bloques completos 17
aleatorizados

I J

^τ ′ × e = Σ Σ
^τ i eij =0
i= j=
1 1
J I
′ Σ Σ
β^ × e = β^j eij = 0
j=1 i=1

y
N = 1 + (I − 1) + (J − 1) + (I − 1)(J − 1)
La ecuación (5.26) también se puede expresar

yij − y¯.. = (y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j + y¯.. ) , (5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones
tenemos

I
ΣΣJ I
Σ J
(yij − y¯.. ) 2
Σ [(y¯i. − y¯.. ) + (y¯.j − y¯.. ) + (yij − y¯i. − y¯.j
= + y¯.. )]2 =
i=1 j=1 i=1 j=1

I J
Σ Σ
J (y¯i. − y¯.. )2 + I (y¯.j − y¯.. )2 +
i= j=
1 1
I
Σ J
Σ (yij − y¯i. − y¯.j + y¯.. )2 +
i=1 j=1
(5.30)
I
ΣΣJ
2 (y¯i. − y¯.. )(y¯.j − y¯.. )+
i=1 j=1

I
ΣΣ J
2 (y¯.j − y¯.. )(yij − y¯i. − y¯.j + y¯.. )+
i=1 j=1

I
ΣΣJ
2 (y¯i. − y¯.. )(yij − y¯i. − y¯.j + y¯.. )
i=1 j=1

donde los dobles productos se anulan (ya que los términos son ortogonales, como acabamos
de comprobar), por lo que dicha ecuación queda en la forma
18 Diseños en bloques
aleatorizados

I J I J I J
ΣΣ Σ Σ ΣΣ
(yij − y¯.. )2 = J (y¯i. − y¯.. )2 + I (y¯.j − y¯.. )2 + (yij − y¯i. − y¯.j +
2
y¯.. )
i=1 i= j= i=1
j=1 1 1 j=1
(5.31)
que representa la ecuación básica del análisis de la varianza, que simbólicamente
podemos escribir

SCT = SCTr + SCBl + SCR


,

donde hemos desglosado la variabilidad total de los datos

I
Σ J
SCT = Σ (yij − y¯.. )2 ,
i=1 j=1

denominada suma total de cuadrados, en tres componentes:


I
1) SCTr = JΣ
(y — 2 y¯.. ) , la suma de cuadrados de las diferencias entre las
i=
1
¯i. medias
de los tratamientos y la media general, que expresa la variabilidad explicada por los
tratamientos, denominada suma de cuadrados entre tratamientos.
J
2) SCBl = IΣ
j=
1 (y¯ —y¯..2) , la suma de cuadrados de las diferencias entre las medias
.j
de los bloques y la media general, que expresa la variabilidad explicada por los
bloques, denominada suma de cuadrados entre bloques.
ΣJ
3) SCR = i= j=
(yij − y¯i. − y¯.j + y¯.. )2 , la suma de cuadrados de los residuos,
Σ 1 1 que
I

expresa la variabilidad no explicada por el modelo, denominada suma de


cuadrados
del error.

A partir de la ecuación básica del ANOVA se pueden construir los cuadrados medios
definidos como:

∗ Cuadrado medio total

I
Σ J
Σ
S^2 = (yij − y¯.. )2
i=1 j=1
T
(5.32)
N −1
5.2 Diseño en bloques completos 19
aleatorizados

∗ Cuadrado medio entre tratamientos

S^2 = Σ I
J (y¯i. −
Tr y¯.. )2
∗ Cuadrado medio entre bloques i=1
(5.33)
I −1

ΣJ
I (y¯.j −
SB^2 y¯.. )2
j=1
=l (5.34)
J −1
∗ Cuadrado medio residual

I
ΣΣJ

S^2 = (yij − y¯i. − y¯.j + y¯.. )2


i=1 j=1
R
, (5.35)
(I − 1)(J − 1)

donde los denominadores, corresponden a los grados de libertad de la distribución en el


muestreo de los correspondientes numeradores.

Una notación muy utilizada también en la práctica para los cuadrados medios
anteri- ores es, respectivamente, CMT , CMTr, CMBl y CMR o CME.

A continuación vamos a calcular las esperanzas matemáticas de estos cuadrados medios.


En primer lugar, recordemos la expresión del modelo (5.4)

yij = µ + τ i + βj + uij .

Consideremos las expresiones de yi. , y¯i. , y.j , y¯.j , y.. e y¯.. , en función de los
parámetros del modelo,Σcon objetoΣde poder hallar las esperanzas de las varianzas
muestrales. También tengamos en cuenta que i τ i = 0 y j βj = 0 . Así tenemos:
20 Diseños en bloques
aleatorizados

J
Σ
yi. = Jµ + Jτ i + βj + ui. y¯i. = µ + τ i + ui.
;
j=1

I
Σ
y.j = Iµ + τ i + Iβj + u.j y¯.j = µ + β j + (5.36)
; u.j
i=
1
I J
Σ Σ
y.. = Nµ + J τi + I βj + y¯.. = µ + u..
u.. ;
i= j=
1 1

1o) El cuadrado medio entre grupos se puede expresar

I
Σ ΣI
J (y¯i. − y¯.. )2 J [τ i + (ui. −
S^Tr
2
= i=1
= u..)]2
I−1 i=1
=
I−1
ΣI I
Σ J
J 2
J (ui. − u.. )2 Σ
i
2J τi(ui. − u..)
i=1 i=1 j=1
I −1 + I −1 + I −1

y su esperanza matemática será la suma de las esperanzas matemáticas de cada


sumando; es decir,

 I
  I
  I

Σ Σ Σ
2 2

i=1
+
i=1
+ i=1 .
E Tr = E  JE τ i   JE (ui. − u..)   2J τi(ui. − u..) 
 I−1   I−   I −1
S^2    1   

Ahora bien, puesto que: (5 .37)

a) El modelo es de efectos fijos E[τi] = τ i , entonces


5.2 Diseño en bloques completos 21
aleatorizados

 I

Σ
2
i i
J τi  Σ Σ
J J
E 2 i=1  = E τ 2
= (5.38)
τ
 I−1  I−1 I−1
  i i

b) Como
^ E [τ i − E [τ^i ]]2 es la Var (τ^i ), cuya expresión, determinada en la
subsec- 2
ción 5.2.2, es (I −
1)σ /N , luego
 
Σ I
J (ui. − u..)2
I

  J Σ
E [ui. − u..]2 =
E   =
i=1
 I−1  I−1
i=1 

I E [(y¯ − y¯ ) − τ ] =
Σ
J
2
I −1 i . i
i= . .
1

J Σ
I
J Σ
I
2
E [^τi − E [τ^
i ]] = Var i(τ^ ) =
I −1 i= I − 1 i=
1 1
I 2 2
Σ
I −J 1 σ J (I − 1)Iσ
i=1(I − 1) N =I − 1 N =
2
σ (5.39)
c) Como E (ui. − u..) = 0, entonces


2J Σ
I
τi(ui. − u..)

E  2
I
Σ
= τ i E [ui. − u..] = 0 . (5.40)
i=1 I −1 J
 I−1 i=
  1

Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos
que el valor esperado del cuadrado medio entre grupos es:
22 Diseños en bloques
aleatorizados

J Σ
I
E (S^2 ) = τ 2 + σ2 (5.41)
Tr i
I− i=1
1
2o) De la misma forma se comprueba que

I Σ 2
J
E (SB^2 ) = βj + σ2 (5.42)
l J − 1 j=
1
o
3 ) Ya hemos visto en la subsección 5.2.2 que la varianza residual es un estimador ins-
esgado de la varianza poblacional, es decir

^E (S2 2
R )=
σ
4o) Por último, calculemos el valor esperado del cuadrado medio total. Para ello nos
basaremos en la ecuación básica del ANOVA que podemos poner en función de
los cuadrados medios de la siguiente forma:

(N − 1)S^2T = (I − 1)S^Tr2 + (J − 1)SB^2 + (I − 1)(J − 1)S


R
^2 ,
l

tomando esperanzas matemáticas en ambos miembros y aplicando la linealidad del


valor esperado, tenemos

T Tr B R
(N − 1)E S^2 = (I − 1)E S^2 + (J − 1)El S^2 + (I − 1)(J − 1)E S^2 ,

de donde, sustituyendo los valores obtenidos anteriormente para E S^2 , E S^2


Tr B
y l

^2 , obtenemos
E SR
ΣI ΣJ
2 I 2
J i j
j=
E(ST^2 ) i=1
+ 1 2
+σ . (5.43)
= N −1
N −1
Observación
5.1
Hemos visto que al aplicar el método de mínimos cuadrados al
modelo completamente aleatorizado, se obtiene el sistema de
ecuaciones normales (??). En el caso del modelo en bloques
completos aleatorizados, las ecuaciones normales para tratamientos
no contienen
5.2 Diseño en bloques completos 23
aleatorizados

información con respecto a los efectos de bloques, y recíprocamente,


las ecuaciones nor- males para bloques no contienen información
alguna sobre los efectos de los tratamientos, (la información con
respecto a los tratamientos no se encuentra mezclada con aquella
debida a los efectos de los bloques). Y así, un contraste entre efectos
de tratamientos se realiza comparando las medias de tratamientos e
idénticamente, un contraste entre efectos de bloques se realiza
comparando las medias de los bloques. Cuando esto ocurre, se dice
que los efectos de bloques y tratamientos son ortogonales.

5.2.4. Análisis estadístico


El contraste estadístico de más interés en este modelo, como mencionamos anteri-
ormente, es el que tiene como hipótesis nula la igualdad de medias de los tratamientos:

H0τ ≡ τ 1 =τ 2 =···=τ I =0 (5.44)

También es interesante contrastar la igualdad de medias de los bloques:

H0β ≡ β1 = β2 = · · · = βJ = 0 (5.45)

Como hemos comprobado anteriormente se verifica que:

a) SR^2 = SCR/(I − 1)(J − I) es un estimador insesgado de la varianza σ2 , independi-


entemente de que se verifiquen las hipótesis nulas.

b) Si no hay diferencia entre las medias de los I tratamientos; es decir, si es cierta la


hipótesis de que todo τ i = 0, el primer sumando de E(STr^2 ) es nulo, y entonces
Tr
S^2
es un estimador insesgado de σ2.

c) Si no hay diferencia entre las medias de los J bloques; es decir, si es cierta la hipótesis
de que todo β = 0, el primer sumando de E(S^2 ) es nulo, y
j B B
es un
estimador insesgado de l l
entonces S^2
σ2.

Sin embargo, hay que notar que:

∗ Si existe diferencia en las medias de los tratamientos, el valor esperado deTr S^2
es
2
mayor que σ .

∗ Si existe diferencia en las medias de los bloques, el valor esperado de SB^2 es mayor
que σ2. l
24 Diseños en bloques
aleatorizados

De todo ésto podemos deducir que:

1o) Un contraste para verificar la hipótesis nula de igualdad de medias de los tratamien-
tos puede efectuarse comparando STr ^2 y S^2 .
R

2o) Un contraste para verificar la hipótesis nula de igualdad de medias de los bloques
puede efectuarse comparando SB^2 y RS^2 .
l
Para ello, vamos a estudiar la distribución de SCT , SCTr, SCBl y SCR en las
hipóte- sis de que ni los tratamientos ni los bloques influyen, es decir si las hipótesis (5.44)
y (5.45) son ciertas o equivalentemente, si las N observaciones provienen de la misma
población.
Tipificando las variables aleatorias yij en la descomposición (5.27) , se tiene

yij − µ µ^ − µ τ^i β^j


= + +
. (5.46)
eσij σ σ σ σ
+

Considerando esta descomposición para totas las observaciones y expresándola en for-


ma vectorial, tenemos
Z = Z1 + Z2 + Z3 + Z4 (5.47)
siendo

1
Z= 1 — µ, . . . , — µ, — µ, . . . , — µ, . . . , — µ, . . . , — µ)′
σ 1
y y y y y
(y 1 2 2J I IJ
J 1 1
1
Z = — µ, . . . . ., y¯ − — µ, . . . . ., y¯ − µ, . . . . ., y¯ − µ, . — µ)′
(y¯ µ, y¯ . . . ., y¯
.. .. .. .. ..
1
..
σ
,, . . . . ., τ , τ
................................ τ , . . . . ., τ , . . . . ., τ )′
Z = 1 (τ
2 ^1 ^1 ^2, ^2 ^I ^I
σ
Z3 = 1 , . . . β^ β , . . . β , . . . β , . . . β^J )′
. ., J , ^ . ., ^J . ., ^ . .,
^ σ 1 1
(β 1
1
Z =
(e ,..., ,e ,... , . . . ., ,..., e )′
e , e e
4 1J 21 2J I1 IJ
σ
donde 11
1
Z: Contiene N términos independientes (y − µ). Tiene, por tanto, N grados de

libertad. ij
σ1
Z : Contiene N coordenadas iguales a (y¯ − µ). Tiene, por tanto, un grado
de
1
..
libertad. σ
5.2 Diseño en bloques completos 25
aleatorizados

1
Z2: Contiene I valores τ^i , cada uno repetido J veces y sujetos a
distintos σ
una
Σ
ecuación de restricción, i ^τ i = 0. Tiene, por tanto, I − 1 grados de libertad.
1
Z3 : Contiene J valores distintos β^j , cada uno repetido I veces y sujetos a
una σ
Σ
^
ecuación de restricción, j β j = 0. Tiene, por tanto, J − 1 grados de libertad.

Z4: Contiene N coordenadas 1 eij, sujetas a I + J − 1 ecuaciones de restricción,


σ
Σ Σ
j eij = 0 para i = 1, . . . , I. y i eij = 0 para j = 1, . . . , J. Tiene, por
tanto,
(I − 1)(J − 1) grados de libertad.

Bajo las hipótesis nulas hemos realizado una descomposición del vector Z, de variables
N (0, 1) independientes, en componentes ortogonales. Dicha descomposición cumple las
condiciones del Teorema de Cochran, verificándose que:

i)
Σ
J (y i. − y¯.. )2
SCTr i 2
= ~ I−1
σ2 χ
ii)
σ2
Σ
I (y .j − y¯.. )2
SCBl j ~ 2
= J−1
σ2 σ2 χ
iii)
Σ
(yij − y¯i. − y.j + y¯.. )2
SCR i,j
= ~ 2 (I−1)
(J−1)
σ2 σ2 χ
y además estas tres distribuciones son independientes entre sí.

Hay que notar que:

Por una parte, se tiene que SCR/σ2 se distribuye como una χ2 con (I —1)(J − 1)
grados de libertad, se verifique o no la hipótesis nula, como ya vimos en la
subsección 5.2.2

Por otra parte, bajo las hipótesis (5.44) y (5.45), se tiene que SCTr/σ2 y SCBl/σ2
se distribuyen como una χ2 con I − 1 y J − 1 grados de libertad, respectivamente.
26 Diseños en bloques
aleatorizados

Por consiguiente, bajo las hipótesis de igualdad de efectos de los tratamientos y los
bloques, se verifica
SCTr/σ2
^ 2
STr ~ F
Fτ = I−1 (5.48)
2 = ^ (I−1),(I−1)(J−1)
SCR/σ
S
2R
(I − 1)(J − 1)
y
SCBl/σ2
Fβ = J −1 ^2
SBl ~ F(J−1),(I−1)(J−1) . (5.49)
SCR/σ 2 =
S ^
(I − 1)(J − 1) 2R
Estos son los estadísticos de contraste para probar dichas hipótesis nulas. Por lo tanto:

∗ Si la hipótesis de igualdad de efectos de los tratamientos es cierta, tanto el numerador


como el denominador del estadístico de contraste (5.48) son estimadores
insesgados de σ2, mientras que si dicha hipótesis no es cierta, la esperanza del
numerador del estadístico de contraste (5.48) es mayor que la esperanza del
denominador, por lo que rechazaremos H0 cuando el valor experimental de dicho
estadístico sea mayor que el valor teórico, F(I−1),(I−1)(J−1);α.

∗ Siguiendo el mismo razonamiento anterior, se rechazará la hipótesis nula de igualdad


de efectos de los bloques cuando el valor del estadistico de contraste (5.49) sea mayor
que el valor teórico, F(J−1),(I−1)(J−1);α.
Aunque hemos dicho que el contraste principal es el de la igualdad de medias de los
tratamientos, también es interesante la comparación entre las medias de los bloques, ya
que la eficacia de este diseño depende de los efectos de los bloques. Un valor grande
del cociente (5.49), implica que el factor bloque tiene un efecto grande, es decir que los
bloques realmente influyen mucho. En este caso, este diseño es más eficaz que el diseño
completamente aleatorizado ya que si el cuadrado medio entre bloques,SB^2 , es grande, el
término residual será mucho menor y el contraste principal (5.44) será másl sensible a las
diferencias entre tratamientos.
Si los efectos de los bloques son muy pequeños, el análisis por bloques quizá no sea
necesario y en caso extremo, cuando el cociente (5.49) es próximo a 1, puede llegar a
ser perjudicial, ya que el número de grados de libertad, (I — 1)(J − 1), del denominador
en la comparación de tratamientos (5.48) es menor que el número de grados de libertad
correspondiente, IJ − I = I(J − 1), en el diseño completamente aleatorizado.
Para una mayor sencillez en el cálculo se utilizan las expresiones abreviadas de SCT ,
SCTr, SCBl y SCR, dadas a continuación
5.2 Diseño en bloques completos 27
aleatorizados

I J 2
ΣΣ y..
SCT =
2 —
IJ
y i
i=1 j=1 j

I 2
1Σ (5.50)
SCTr = J yi.2 − IJ
y
..
i=
1
J 2
1Σ 2 y..
SCBl = I j=y.j − IJ ,
1
y la suma de cuadrados del error se obtiene por diferencia

SCR = SCT − SCTr − SCBl . (5.51)

El análisis de la varianza utiliza la descomposición (5.31), ecuación básica del


análisis de la varianza, cuyos términos se pueden disponer de la siguiente manera,

Tabla 4-3. Tabla ANOVA para el modelo de bloques aleatorizados

Fuentes de Suma de Grados de Cuadrados


variación cuadrados libertad medios Fexp
I
Σ S^2 /
I−1 S^Tr
Entre tratam. 2
J (y¯i. − y¯.. )2 = S^2
SCT r Tr R
i=1
J
Σ S^2 /
J −1 S^Bl
Entre bloques 2
S^2
2
I (y¯.j − y¯.. ) =
SCBl Bl R
j=1

(I − 1)(J − S^R
Residual 2
SCT − SCTr −
1)
SCBl =
SCR
I J
ΣΣ IJ − 1 S^T
TOTAL 2
(yij − y¯.. )2 = SCT
i=1 j=1

Alternativamente, utilizando las expresiones abreviadas de SCT , SCTr, SCBl y


SCR, dadas en (5.50), se construye la siguiente Tabla ANOVA.
28 Diseños en bloques
aleatorizados

Tabla 4-4. Forma práctica de la tabla ANOVA


para el modelo de bloques aleatorizados

Fuentes de Suma de Grados de Cuadrados


variación cuadrados libertad medios Fexp
I
1Σ y..2
S^2 /
I −1 S^Tr
2
Entre tratam. y − = SCTr 2
J i=1 i. IJ S^2
Tr R
J
1Σ y 2..
S^2 /
y.j2 − = SCBl J −1 S^Bl
Entre bloques 2
I
j=1
IJ S^2
Bl R

(I − 1)(J − S^R
Residual 2
SCT − SCTr −
1)
SCBl =
SCR
ΣΣ
I J
y2..
IJ − 1 S^T
2 2
TOTAL yij −
i=1 j=1
IJ

Una de las ventajas del diseño en bloques aleatorizados es que se puede transformar
en un diseño unifactorial, simplemente suprimiendo el estudio por bloques y uniendo su
variabilidad a la residual.

Coeficientes de determinación
Al igual que en el modelo completamente aleatorizado, una medida apropiada
para comprobar la adecuación del modelo a los datos es el coeficiente de determinación,
denotado por R2 y definido como el cociente entre la suma de las variabilidades explicadas
por los tratamientos y los bloques, y la variabilidad total

SCTr + SCBl
R2 = SCT .

Llamando

Rτ2 al cociente entre la variabilidad explicada por los tratamientos y la total, es decir

SCTr
Rτ2 = SCT ,
5.2 Diseño en bloques completos 29
aleatorizados

Rβ2 al cociente entre la variabilidad explicada por los bloques y la total, es decir

SCBl
Rβ2 = SCT ,

el coeficiente de determinación también lo podemos expresar como

R2 = R2 + R2 ,
τ β

donde R2 y R2 reciben el nombre de coeficientes de determinación parciales


asociados a los
τ β
tratamientos y a los bloques. Estas cantidades son adimensionales y se interpretan como
la proporción de la variabilidad que es explicada por los tratamientos y por los bloques,
respectivamente.

A fin de ilustrar el análisis de la varianza de bloques aleatorizados vamos a considerar


el Ejemplo 4-1, en el que se desea comprobar si se aprecian diferencias significativas, en
primer lugar, entre los fertilizantes y en segundo lugar, entre los bloques de terreno.

Para ello, construimos la Tabla 4-5, organizando los datos de la siguiente manera

Tabla 4-5. Datos del Ejemplo 4-


1

bloques
Fertilizantes A B C D yi. 2
yi.
1 87 86 88 83 344 118336
2 85 87 95 85 352 123904
3 90 92 95 90 367 134689
4 89 97 98 88 372 138384
5 99 96 91 90 376 141376
y.j 450 458 467 436 1811 656689
Σ 2
y.j 202500 209764 218089 190096 820449
2 40616 42054 43679 38058 164407
yij

Las sumas de cuadrados necesarias para el análisis de la varianza se calculan de la


30 Diseños en bloques
aleatorizados

siguiente forma:
5 4 2 2

SCT = ΣΣ i (1811)
j2 IJ = 164407 − = 420,95
y − 20
y..
i=1
j=1
5 2 2
656689 (1811)

= − 20 = 186,20
SCTr = J yi.2 − IJ 4
y
..
i=
1
4 2 2
1Σ =
820449 (1811)
− = 103,75
.2
SCBl = I yj − IJ 5 20
y
..
j=
1

SCR = SCT − SCTr − SCBl = 131 .

El análisis de la varianza resultante se presenta en la siguiente tabla.

Tabla 4-6. Análisis de la varianza para los datos del Ejemplo 4-1

Fuentes de Suma de Grados de Cuadrados


variación cuadrados libertad medios Fexp
Entre tratamientos 186.20 4 46.5500 4.264
Entre bloques 103.75 3 34.5833 3.168
Residual 131.00 12 10.9166
TOTAL 420.95 19

Realizando los contrastes al nivel de significación del 5 %, se tiene:

1o) Si comparamos el cociente Fτ(exp) = 46,55/10,9166 = 4,264, con el valor de la F


teórica (F0,05,4,12 = 3,26), se concluye que se rechaza H0 (igualdad de medias de
tratamientos); en otras palabras, concluimos que, a un nivel de significación del 5
%, el rendimiento de la semilla de algodón difiere significativamente dependiendo del
tipo de fertilizante utilizado.

2o) Si comparamos el cociente Fβ(exp) = 34,5833/10,9166 = 3,168, con el valor de la


F teórica (F0,05,3,12 = 3,49), se concluye que no hay suficiente evidencia para
rechazar H0 (igualdad de medias de bloques); en otras palabras, concluimos que,
a un nivel de significación del 5 %, los bloques de terreno no son
significativamente distintos.
5.2 Diseño en bloques completos 31
aleatorizados

Comprobamos, mediante los coeficientes de determinación parciales, cuyos valores son

SCTr
R2 =
186,2 = = 0,4423
τ
SCT 420,95

SCTBl 103,75
R2β = = 420,95 = 0,2464 ,
que:
SCT

a) El factor “tipo de fertilizante” explica el 44.23 % de la variabilidad en el rendimiento


de la semilla de algodón.

b) El factor “tipo de terreno” explica el 24.64 % de la variabilidad en el rendimiento


de la semilla de algodón.

Es interesante ver los resultados que se hubiesen obtenido de no haberse realizado


un diseño en bloques aleatorizados. Para ello, supongamos que prescindimos del factor
“tipo de terreno” y realizamos un análisis de la varianza de un factor, obteniéndose la
tabla ANOVA siguiente

Tabla 4-7. Análisis de la varianza para los datos del Ejemplo 4-1

Fuentes de Suma de Grados de Cuadrados


variación cuadrados libertad medios Fexp
Entre tratamientos 186.20 4 46.55 2.974
Residual 234.75 15 15.65
TOTAL 420.95 19

Si efectuamos el contraste al 5 % y comparamos el valor de la Fexp = 2,974, con


el valor de la F teórica (F0,05;4,15 = 3,05), se concluye que no se puede rechazar H0
(igualdad de medias de tratamientos); es decir, no hemos podido encontrar diferencias
significativas entre los distintos tipos de fertilizantes aunque si se detectaron dichas
diferencias al aplicar el modelo en bloques aleatorizados.
Con este ejemplo se ilustra el hecho de que aunque los bloques no resulten
significativa- mente diferentes, en algunas situaciones no es conveniente prescindir de ellos.
Pero ¿cómo saber cuando se puede prescindir de los bloques? La respuesta la tenemos
en el valor de la Fβ(exp), experimentalmente se ha comprobado que si dicho valor es
mayor que 3, no conviene prescindir de los bloques para efectuar los contrastes.
5.3 Comparaciones 31
múltiples

5.3. Comparaciones múltiples


Si el análisis de la varianza confirma la existencia de diferencias significativas entre
los tratamientos o entre los bloques, es conveniente investigar qué medias son distintas
realizando las comparaciones múltiples correspondientes a los tratamientos o a los bloques
o a ambos. Para ello se realizarán cualesquiera de los procedimientos de comparaciones
múltiples estudiados en el Capítulo 2. Simplemente hay que recordar que, en el diseño
en bloques aleatorizados los grados de libertad del error son ((I— 1)(J − 1)) en lugar de
(N −I) del diseño completamente aleatorizado y en el caso de comparaciones de medias
relativas a los tratamientos hay que reemplazar en las fórmulas correspondientes el número
de repeticiones (n) del diseño completamente aleatorizado, por el número de bloques (J ).
Como ilustración vamos a realizar comparaciones entre las medias de los tratamientos
utilizando la prueba de rangos múltiples de Tukey con los datos del ejemplo de referencia.
En este ejemplo, los valores de los cinco promedios de los tratamientos son:

y¯1. = 86 y¯2. = 88 y¯3. = 91,75 y¯4. = 93 y¯5. = 94 .


; ; ; ;

Así, por ejemplo, si realizamos la comparación entre los tratamientos 1 y 2, el valor


crítico HSD correspondiente a un nivel de significación del 5 % se calcula como

HSD = qα,I,(I−1) 2
SR = 10,916
6 = (4,51)(1,65) = 7,4415 .
(J−1) q0,05,5,12 J
^ 4

Puesto que se verifica:


| y¯1. − y¯2. |= 2 < HSD ,
se concluye que las medias 1 y 2 no difieren significativamente.
Además de los procedimientos analíticos de comparaciones múltiples también se puede
adaptar el método gráfico visto en la subsección ?? del Capítulo 2 que nos muestra que
medias son significativamente diferentes. Este procedimiento consiste en utilizar como
distribución de referencia una distribución tν ajustada por el factor de escala SR2 /J,
para la comparación de las medias de los tratamientos, donde ν es el número de grados
de libertad de la varianza residual.
En la Figura 4-2 se representan las 5 medias de los fertilizantes del Ejemplo 4-1 en
√ con la distribución de referencia t con 12 grados de libertad y con un factor de
relación
escala 10,9166/4 = 1,65. Esta figura muestra que los procedimientos gráficos a veces
no son suficientemente claros. Sin embargo, en dicha figura puede observarse que hay
una
32 Diseños en bloques
aleatorizados

gran diferencia entre los tratamientos 1 y 5, como se comprobará posteriormente en la


subsección ?? mediante el procedimiento de Tukey realizado con STiTCRiPHHCS.

Figura 4-2

También se puede comprobar qué bloques son significativamente distintos mediante


un procedimiento gráfico como el anterior, pero con un factor de escala S2R /I, que en
√ ^
nuestro ejemplo tiene el valor 10,9166/5 = 1,47761. Dicho procedimiento se muestra en
la Figura 4-3, donde comprobamos que se confirma el resultado del contraste F del análisis
de la varianza, es decir, no hay diferencias significativas entre los bloques.

Figura 4-3

5.4. Comprobación de la idoneidad del modelo


La comprobación de la idoneidad del modelo requiere contrastar las hipótesis dadas
en (5.5). Los contrastes de normalidad, homocedasticidad e independencia son análogos a
los realizados en el modelo completamente aleatorizado, por lo que remitimos al lector al
Capítulo 3, con la diferencia de que en el modelo en bloques aleatorizados también hay
5.4 Comprobación de la idoneidad del 33
modelo

que estudiar la variabilidad del error por bloques.


En este modelo hemos supuesto otra hipótesis adicional, la aditividad de los efectos
de tratamiento y bloque, es decir, hemos supuesto un modelo en el que el efecto de un
factor no depende del nivel del otro factor. A pesar de que este modelo aditivo es a
menudo útil, existen situaciones en las que resulta inadecuado, por ejemplo, las
diferencias entre dos fertilizantes pueden ser mayores cuando se aplican en el bloque 1 que
cuando se aplican en el bloque 3. Cuando esto ocurre se dice que existe interacción entre
los tratamientos y los bloques, y entonces el modelo de ecuación (5.4) no es adecuado.
Por lo tanto, la hipótesis de aditividad también debe ser contrastada.

5.4.1. Test de Interacción de Tukey


Cuando existe interacción entre tratamiento y bloque, el modelo tendrá en
general la siguiente ecuación

yij = µ + τ i + βj + (τβ)ij + uij i = 1, 2, · · · , I j = 1, 2, · · · , J , (5.52)

donde el término (τβ)ij representa la interacción. Se suponen las siguientes restricciones


para los parámetros
Σ Σ Σ Σ
τi = βj = (τ β)ij = (τ β)ij = 0 ,
i j i j
por lo tanto el número de parámetros independientes de este modelo sería

1 + (I − 1) + (J − 1) + (I − 1)(J − 1) = IJ ,

que, puesto que hay una sola observación por celdilla, coincide con el número de obser-
vaciones, no habiendo suficientes grados de libertad para estimar la varianza residual.
Un procedimiento para solventar este problema consiste en tomar más de una
observación por celdilla.
Tukey (1949) desarrolló un método para determinar si existe interacción entre tratamien-
tos y bloques, cuando sólo hay una observación por celdilla, conocido como el test de
in- teracción de un grado de libertad de Tukey. Este procedimiento supone
que la forma de la interacción es particularmente simple, es decir

(τβ)ij = γτ i β j ,

en donde γ es una constante desconocida. De esta forma las interacciones añaden única-
mente un parámetro, y el modelo resultante es:
34 Diseños en bloques
aleatorizados

yij = µ + τ i + βj + γτ i β j + uij i = 1, 2, · · · , I ; j = 1, 2, · · · , J , (5.53)

siendo las restricciones para este modelo


Σ Σ Σ Σ
τi = βj = γτ i β j = γτ i β j = 0 .
i j i j
En primer lugar abordaremos la estimación de los parámetros del modelo. Para ello,
se construye la función de verosimilitud asociada a la muestra y =(y11, · · · , y1J , · · · ,
yI1 , · · · , yIJ ):

N 1 ΣI J

Σ 2

L(µ, τ i , β j , γ, σ2) = (2πσ2)− 2 exp yij − µ − τ i − βj −  ,



− 2 i=1 γτ i β j
j=1 (5.54)
se determina el logaritmo de dicha función

N N I J
ln(L(µ, τ , σ2)) = − ln(2π) − ln(σ2) − ΣΣ — µ−τ — γτ
1 −β
2
y β ,
i i j j
i
2 2 2σ2 j i
i=1 j=1
(5.55)
y se hallan las primeras derivadas parciales respecto de los parámetros del modelo,
obtenién- dose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los
parámetros µ, τ i y βj .

El estimador máximo verosimil de γ se obtiene realizando la correspondiente derivada


parcial, es decir
I J
∂ ln L ΣΣ —µ − τ − β − γτ β τ =0 (5.56)
= y β
1

ij i j i j i j
de donde ∂γ
i=1 j=1

σ2
I J I J I J J I I J
ΣΣ Σ Σ Σ Σ Σ Σ Σ Σ
2
yijτiβj − µ τi βj − τ βj − β2 τi − γ τ 2

β2 = 0 . i j i j
i=1 i= j= i= j= j=
ij=1
= i1= j1= 1 1 1
1 1 1
5.4 Comprobación de la idoneidad del 35
modelo

Por lo tanto
I J
ΣΣ
Σ τ i β j yij
^
^ j=1
i=1 ^
γ^ = Σ , (5.57)
i=1

I J
j=1 2
2i
τ β^j

y reemplazando ^τ i y β^j por sus respectivos estimadores muestrales, tenemos


I
Σ J
Σ (y¯i. − y¯.. )(y¯.j − y¯.. )yij
i=1 j=1
γ^ = . (5.58)
Σ
I Σ
J
(y¯i. − (y¯.j −
y¯.. )2 y¯.. )2

i= j=
1 1

Como hemos supuesto la existencia de interacción entre los factores, hay que introducir
en este modelo una suma de cuadrados que represente dicha interacción, esta suma de
cuadrados se denota por SCIT y viene dada por la expresión
ΣΣ 2
SCIT = γ^2i τ^j 2 β^ , (5.59)
i j

que recibe el nombre de suma de cuadrados debida a la interacción o no-aditividad del


modelo, que también se puede expresar, sustituyendo los correspondientes estimadores
muestrales, de la siguiente forma
  2
ΣI Σ J
 (y¯i. − y¯.. )(y¯.j − y¯.. )yij 
ΣI ΣJ
i=1
SCIT 2 2 j=1
J
(5.60)
= γ
2
I

i=1 j=1 ^ ) i.=− y¯.. ) (y¯.j −


y¯..(y¯ .
Σ (y¯i. − Σ
(y¯.j − y¯.. )2
y¯.. )2

i= j=
1 1

Por lo tanto, la ecuación básica del análisis de la varianza para el modelo con inter-
acción (5.53) debe tener un término más que la citada ecuación del modelo en bloques
aleatorizados. Dicha ecuación se expresa simbólicamente en la forma

SCT = SCTr + SCBl + SCIT + SCR , (5.61)

donde
36 Diseños en bloques
aleatorizados

SCTr es la suma de cuadrados entre tratamientos

SCBl es la suma de cuadrados entre bloques

SCIT es la suma de cuadrados debida a la interacción por Tukey

SCR es la suma de cuadrados residual que se obtiene como

SCR = SCT − SCTr − SCBl − SCIT .

Se demuestra que si γ = 0, esto es, si no hay interacción del tipo γτ i β j , entonces


SCIT/σ 2 y SCR/σ2 son variables aleatorias independientes distribuidas según una χ2
con 1 y IJ —I − J grados de libertad, respectivamente. Por tanto, si γ = 0, el estadístico
de contraste
SCIT/1
F =
SCR/(IJ − I − , (5.62)
J)

se distribuye según una F de Snedecor con 1, IJ — I − J grados de libertad. Así, para


contrastar
H0 : γ = 0 (no hay interacción)
H1 : γ =/ 0 ( hay interacción del tipo (5.63)
γτ i β j ) ,

puesto que, F se distribuye como una F1,IJ−I−J cuando H0 es cierta y puesto que los
valores grandes de Fexp conducen a la conclusión H1, la decisión apropiada para
controlar un riesgo de error de Tipo I igual a α, es:

Si Fexp ≤ Fα,1,IJ−I−J , se acepta H0

Si Fexp > Fα,1,IJ−I−J , se rechaza (5.64)


H0 ,

donde Fα,1,IJ−I−J es el punto crítico superior de la distribución F con 1 y IJ — I − J


grados de libertad.

A fin de ilustrar este procedimiento utilicemos el Ejemplo 4-1. Para ello,


construimos la Tabla 4-8, organizando los datos de la siguiente manera:
5.4 Comprobación de la idoneidad del 37
modelo

Tabla 4-8. Datos del Ejemplo 4-


1

Bloques
ΣJ
Fert. A B C D y¯ ^τ i ^
2 τ^ β^
τ y
i. i i j ij
j=1
1 87 86 88 83 86,00 −4,55 20,702 −69,16
2 85 87 95 85 88,00 −2,55 6,502 −78,03
3 90 92 95 90 91,75 1,20 1,440 19,62
4 89 97 98 88 93,00 2,45 6,002 91,63
5 99 96 91 90 94,00 3,45 11,902 14,49
y¯.j 90 91,6 93,4 87,2 90,55 = y¯.. 46,55 −21,45
β^2 j −0,55 1,05 2,85 −3,35
β^j 0,302 1,102 8,122 11,222 20,75

En primer lugar calculamos el estimador de γ y la suma de cuadrados de la interacción


SCIT
ΣΣ
^τ i β^j yij
^
γ
i
Σ
j
Σ = −21,45
(46,55)(20,75) = −0,0222
= ^τi 2 j ,
2
β^
ΣΣ 2
i jβj =
i
( −0,022) (46,55)(20,75) = 0,4760 .
SCIT = 2
^γ 2 ^τ 2 ^ i j

Continuamos con la suma de cuadrados debida al error SCR


SCR = SCT − SCTr − SCBl − SCIT = 420,95 − 186,20 − 103,75 − 0,4760 = 130,524
.

Por lo tanto el valor del estadístico de contraste es


SCIT/1 0,4760
Fexp = = = 0,04011 .
SCR∗/(IJ − I − J) 130,524/11

Si realizamos el contraste al nivel de significación del 5 %, como el valor de la F teórica


es F0,05,1,11 = 4,84 y puesto que Fexp = 0,04011 < 4,84 se concluye que no hay
interacción entre los fertilizantes y los bloques de terreno.
38 Diseños en bloques
aleatorizados

Bibliografía utilizada

∗ García Leal, J. & Lara Porras, A.M. (1998). “Diseño Estadístico de


Experimentos.
Análisis de la Varianza.” Grupo Editorial Universitario.

∗ Lara Porras, A.M. (2000). “Diseño Estadístico de Experimentos,


Análisis de la Vari- anza y Temas Relacionados: Tratamiento
Informático mediante SPSS” Proyecto Sur de Ediciones.

También podría gustarte