ING.
ARMANDO VÁSQUEZ RAMIREZ
ALUMNA: YURANI VAZQUEZ AGUILERA
INDICE
INDICE DE FIGURAS ....................................................................................................................3
INDICE DE TABLAS ......................................................................................................................3
INDICE DE ECUACIONES ...........................................................................................................4
INTRODUCCIÓN............................................................................................................................5
DESARROLLO ...............................................................................................................................6
3.1. FUNDAMENTO DEL ANÁLISIS DE VARIANZA (ANOVA) PARA CADA DISEÑO ...6
MODELOS DE ANÁLISIS DE VARIANZA ..........................................................................6
PROCEDIMIENTO GENERAL DEL ANÁLISIS DE VARIANZA ......................................8
3.2. DISEÑO COMPLETAMENTE ALEATORIO (DCA) .......................................................9
3.2.1. CARACTERÍSTICAS DEL DCA ..................................................................................10
3.2.2. ANÁLISIS DEL DCA CON MÁS DE DOS TRATAMIENTOS Y EL MISMO
NÚMERO DE OBSERVACIONES POR UNIDAD EXPERIMENTAL ................................12
3.2.3. DCA CON DIFERENTE NÚMERO DE OBSERVACIONES POR TRATAMIENTO
Y SU ANÁLISIS E INTERPRETACIÓN .................................................................................16
3.3. DISEÑO DE BLOQUES COMPLETOS AL AZAR (DBCA) .........................................17
3.3.1. CARACTERÍSTICAS DEL DBCA ................................................................................18
3.3.2. ANÁLISIS DEL DBCA ...................................................................................................19
3.3.3. DBCA CON VARIAS OBSERVACIONES POR UNIDAD EXPERIMENTAL .........20
3.3.4. DBCA CON DESIGUAL NÚMERO DE OBSERVACIONES POR UNIDAD
EXPERIMENTAL ......................................................................................................................22
3.4. DISEÑO DE CUADRO LATINO (DCL) ..........................................................................23
3.4.1. CARACTERÍSTICAS DEL DCL ...................................................................................23
3.4.2. ANÁLISIS DE VARIANZA DEL DCL ...........................................................................24
CONCLUSIÓN ..............................................................................................................................26
BIBLIOGRAFIA .............................................................................................................................27
2|Page
INDICE DE FIGURAS
Ilustración 1: Representación esquemática de muestreo y distribución aleatoria de
tratamientos a las UE en DCA ............................................................................... 9
Ilustración 2: Esquema de interferencia estadistica bajo el enfoque de un DCA .. 10
Ilustración 3: Validez practica de la inferencia estadistica en el DCA ................... 10
Ilustración 4.......................................................................................................... 18
INDICE DE TABLAS
Tabla 1: Ordenación de los datos para un experimento con un solo factor A, en un
diseño completamente aleatorio con n repeticiones ............................................... 9
Tabla 2: Pesos acumulados (kg) durante 60 días de periodo experimental .......... 12
Tabla 3: Cuadro de analisis de varianza (ANOVA) del DCA................................. 15
Tabla 4: Analisis de varianza de un ejemplo practico de un experimento con un
DCA ..................................................................................................................... 16
Tabla 5: calculo de los grados de libertad (GL) para un DCA con diferente número
de observaciones por tratamiento ........................................................................ 17
Tabla 6 ................................................................................................................. 20
Tabla 7: Tratamientos en un DBA ........................................................................ 20
Tabla 8: Fuentes de variación y estimación de grados de libertad ANOVA de DBA
generalizado ........................................................................................................ 21
Tabla 9: Peso de las frutas después de la cosecha (Resultados en kg de
fruta/árbol) ........................................................................................................... 22
Tabla 10: Distribución aleatoria de los tratamientos en Cuadro Latino ................. 24
Tabla 11: Planteamiento de las hipotesis nula y alternativa (Ho y Ha) para un
diseño en Cuadro Latino ...................................................................................... 24
Tabla 12: Rendimiento de materia seca de Rye grass y alfalfa con diferentes
metodos de corte ................................................................................................. 24
Tabla 13: Totales de tratamientos para el rendimiento de materia seca de Rye
grass y alfalfa ....................................................................................................... 25
Tabla 14: Analisis de varianza (ANOVA) del diseño experimental en Cuadro Latino
............................................................................................................................. 25
3|Page
INDICE DE ECUACIONES
Ecuación 1 ............................................................................................................. 6
Ecuación 2 ............................................................................................................. 7
Ecuación 3 ............................................................................................................. 7
Ecuación 4 ............................................................................................................. 8
Ecuación 5 ............................................................................................................. 8
Ecuación 6 ........................................................................................................... 12
Ecuación 7 ........................................................................................................... 13
Ecuación 8 ........................................................................................................... 13
Ecuación 9 ........................................................................................................... 13
Ecuación 10 ......................................................................................................... 13
Ecuación 11 ......................................................................................................... 14
Ecuación 12 ......................................................................................................... 14
Ecuación 13 ......................................................................................................... 14
Ecuación 14 ......................................................................................................... 15
Ecuación 15 ......................................................................................................... 15
Ecuación 16 ......................................................................................................... 16
Ecuación 17 ......................................................................................................... 16
Ecuación 18 ......................................................................................................... 17
Ecuación 19 ......................................................................................................... 17
Ecuación 20 ......................................................................................................... 23
Ecuación 21 ......................................................................................................... 23
Ecuación 22 ......................................................................................................... 25
4|Page
INTRODUCCIÓN
Las técnicas estadísticas del diseño experimental tienen su razón de ser en
la investigación empírica que trata de indagar cómo ciertas variables, conocidas
como factores, actúan sobre una variable respuesta registrada tras la realización
del experimento.
Es importante hacer destacar que los factores que influyen sobre el valor de
la variable respuesta sólo pueden tomar un número finito de estados o niveles.
Los tests básicos en estos modelos se centran en contrastar si los factores
realmente alteran los resultados de los experimentos al fijarlos en sus diferentes
niveles. La técnica, que consiste en descomponer la variabilidad total en las
variabilidades aportadas por los diferentes factores y sus interacciones mutuas,
recibe el nombre de análisis de la varianza.
Cuando los experimentos se realizan combinados todos los niveles posibles
de los factores, hablamos de diseños completos:
Diseño unifactorial
Diseño bifactorial completo sin réplicas
Diseño bifactorial completo con réplicas
Si el número de factores y de niveles por factor va aumentando, pronto nos
encontraremos en la situación en la que el número de combinaciones se hace
muy grande y el experimento impracticable. Surge entonces la necesidad de
tomar en consideración tan sólo una parte de todas las posibles combinaciones
de niveles y hablamos entonces de diseños incompletos o fraccionales.
EL PRESENTE TRABAJO, ENGLOBA LOS TEMAS RELACIONADOS CON
EL ANALISIS DE LA VARIANZA
5|Page
DESARROLLO
3.1. FUNDAMENTO DEL ANÁLISIS DE VARIANZA (ANOVA) PARA
CADA DISEÑO
El análisis de varianza o ANOVA (del inglés ANalysis Of VAriance) es una
técnica paramétrica utilizada cuando hay más de dos grupos independientes. Se
trata de un método para comparar medias, no varianzas como su nombre podría
sugerir. Su hipótesis nula (H0) establece la igualdad entre las medias de los a
grupos o poblaciones (μ1 = μ2 =…=μa), mientras que la hipótesis alternativa (H1)
establece que al menos una de las medias es distinta. El análisis se completa
cuando se acepta la hipótesis H0, es decir, no hay diferencias entre grupos. En
cambio, cuando se rechaza H0, se sabe que hay diferencias entre grupos, pero
para conocer en concreto cuáles son esas diferencias es necesario continuar con
los procedimientos de separación de medias y contrastes (Fernández, Trapero y
Dominguez 2010)
MODELOS DE ANÁLISIS DE VARIANZA
El modelo matemático que se aplica para el ANOVA en cualquier diseño
experimental es el modelo lineal aditivo, que se formula en forma de suma:
Ecuación 1
Expresando que el valor de cualquier unidad experimental está compuesto
por la media general (μ) más la suma de los efectos de los diferentes factores (α ,
β …) y sus interacciones, [_(αβ) ,…_], y la suma de los diferentes errores (εij…r).
Además de la aditividad, una característica fundamental de este modelo es que
supone que los errores son independientes y se encuentran normalmente
distribuidos con medias cero y varianzas iguales, es decir, εij...r ~ N(0, ζ2) para
toda i,j,..r.
La expresión concreta de este modelo varía con el diseño experimental y
con el número y tipo de factores que intervienen. Cuando hay un solo factor para
analizar se tiene el ANOVA unifactorial o de una vía (One Way ANOVA), mientras
que si intervienen dos o más factores resulta el ANOVA multifactorial o factorial a
secas. El número de factores debe ser limitado porque al aumentar éste se
incrementan las posibles interacciones entre ellos, lo que complica el análisis y su
interpretación.
6|Page
Los factores o variables independientes pueden ser de dos clases, según sean
sus efectos:
Fijos o aleatorios. Ello da lugar a dos tipos de modelos de ANOVA: modelo de
efectos fijos (modelo I) y modelo de efectos aleatorios (modelo II). Ambos
modelos varían en las asunciones, en los propósitos y en la interpretación,
aunque los cálculos y las pruebas de significación son idénticos.
En el modelo de efectos fijos, los diferentes niveles de los factores se
seleccionan de antemano, por lo que se consideran como parámetros fijos tales
que:
Ecuación 2
La hipótesis nula de este modelo establece que todas las medias (factores
e interacciones) son iguales, lo que puede escribirse en términos del modelo
como:
H0:αi = 0 para toda i
H0:βj = 0 para toda j
............................................
H0: (αβ)ij = 0 para toda i y j
En este modelo I, las inferencias estadísticas respecto a los efectos de los
tratamientos pertenecen, de forma exclusiva, a los niveles seleccionados, por lo
que no se pueden extraer conclusiones para otros posibles niveles. Este es el
caso más común de los experimentos agronómicos, donde generalmente estamos
interesados en conocer el efecto de unos niveles concretos de una variable
cualitativa o categórica. Cuando en este modelo se incluyen variables
independientes cuantitativas (temperatura, tiempo, etc.), se supone que sólo
estamos interesados en conocer el efecto de esos niveles concretos, pero no el
de toda la población posible de niveles.
En el modelo de efectos aleatorios, los diferentes niveles de los factores
se seleccionan al azar de una población mayor de posibles niveles. Por tanto,
para cada factor (por ejemplo el factor T) de efectos aleatorios, η1, η2,… ηa son
variables aleatorias independientes con ηj ~ N(0, ) para toda j. La hipótesis nula
en este modelo consiste en la proposición de que la varianza entre los ηj (o los
efectos del tratamiento) es cero; es decir:
Ecuación 3
7|Page
Así, al suponer independencia entre los errores y tratamientos aleatorios,
tenemos que la varianza total es:
Ecuación 4
En este modelo II, el interés recae en conocer cuánto de la varianza en las
observaciones (Var(Yij)) se debe a diferencias reales en las medias de los
tratamientos ( ) y cuánto se debe a errores aleatorios con respecto a estas
medias ( ). Por ello, las inferencias estadísticas con respecto a los niveles del
factor estudiado pertenecen a toda la población posible de niveles de ese factor.
El modelo II es menos habitual en los experimentos agronómicos, pero debería
considerarse sobre todo cuando se incluyen variables cuantitativas como variable
independientes.
Un tercer modelo (modelo III), denominado modelo mixto, resulta cuando
unos factores son de efectos fijos y otros de efectos aleatorios. Otra consideración
sobre los modelos es si el diseño está equilibrado o no. Se dice que está
equilibrado cuando cada combinación del modelo contiene el mismo número de
casos o repeticiones (n1= n2 =…= nj). En cambio, se considera desequilibrado
cuando todos los niveles de los tratamientos no contienen el mismo número de
repeticiones. Estos modelos desequilibrados requieren cálculos más complicados
y dificultan la construcción de los contrastes de hipótesis sobre cada factor, por lo
que no suelen utilizarse en los experimentos agronómicos.
PROCEDIMIENTO GENERAL DEL ANÁLISIS DE VARIANZA
Modelo I: efectos fijos
Para explicar el desarrollo y los cálculos a realizar en el ANOVA se va a
considerar el caso más simple: ANOVA de una vía para un diseño completamente
aleatorio y el modelo de efecto fijos. Tenemos, pues, un solo factor o tratamiento
(A) con a niveles (i = 1, 2….a) y varias observaciones (repeticiones) en cada nivel
(j = 1, 2,….ni). El número de repeticiones en cada nivel de A no tiene por qué ser
igual, pero es conveniente en algunos casos, sobre todo cuando se trabaja con
muestras pequeñas (pocas observaciones). Para esos casos: n1 = n2
=….= ni = n. El número total de casos (N) sería: (Fernández, Trapero y
Dominguez 2010)
Ecuación 5
Los datos se podrían agrupar como se indica en la Tabla 4.1.
8|Page
Tabla 1: Ordenación de los datos para un experimento con un solo factor A, en un diseño completamente
aleatorio con n repeticiones
El modelo lineal aditivo para este supuesto sería:
3.2. DISEÑO COMPLETAMENTE ALEATORIO (DCA)
Es el arreglo de apareamiento de tratamientos y unidades experimentales
más simple que existe en la comparación múltiple de muestras bajo el método de
análisis de varianza. Las muestras experimentales se obtienen en forma
completamente aleatoria del total de elementos de la población normalmente
dispersa; una vez formados los grupos experimentales reciben también los
tratamientos en forma completamente aleatoria, como se observa
Ilustración 1: Representación esquemática de muestreo y distribución aleatoria de tratamientos a las
UE en DCA
A manera de ejemplo, la aleatorización de tratamientos a las unidades
experimentales en campo en un diseño completamente al azar (DCA) para un
experimento agrícola.
9|Page
Retomando la ilustración de la figura anterior, es posible establecer el esquema
de inferencia a partir de la aplicación de un DCA (Fernández, Trapero y
Dominguez 2010)
Ilustración 2: Esquema de interferencia estadistica bajo el enfoque de un
DCA
Ilustración 3: Validez practica de la inferencia estadistica en el DCA
3.2.1. CARACTERÍSTICAS DEL DCA
La población de donde provienen las muestras experimentales debe ser de
naturaleza homogénea, lo cual implica que:
a) Los elementos que pasan a formar parte del material experimental y
por consecuencia de los grupos experimentales a los que se aplican los
10 | P a g e
tratamientos evaluados, muestran características similares en cuanto a
edad, raza, variedad, fertilidad, humedad, etcétera.
b) De acuerdo al punto anterior se puede establecer que todas las
unidades de cada muestra experimental son homogéneas dentro de
grupo y entre grupos, lo que implica que podrán responder de manera
similar al efecto de los tratamientos aplicados.
c) Los tratamientos están siendo evaluados en las mismas
circunstancias, lo cual significa que el error aleatorio (efectos no
controlados) se distribuye en forma homogénea en el conjunto de las
unidades experimentales dentro de grupos y entre grupos experimentales.
Las muestras de material experimental provenientes de la población en
estudio son seleccionadas en forma completamente aleatoria, con lo cual
se busca que todos los niveles de la población estén debidamente
representados en las muestras experimentales. Se espera, por lo tanto,
que los resultados del experimento permitan hacer inferencias válidas
sobre la población original. Esto implica que el comportamiento asumido
por las muestras, después de aplicados los tratamientos a través de los
estimadores obtenidos, es el mismo que asumirán los parámetros de la
población de donde provienen dichas muestras, si a ella se aplican los
mismos tratamientos y en igualdad de condiciones.
El apareamiento entre tratamientos y unidades experimentales se hace en
forma completamente aleatoria, de donde se deriva el nombre del „diseño
completamente al azar‟ o „diseño completamente aleatorizado‟ (DCA), lo
cual equivale a decir que:
a) Cualquiera de las unidades experimentales tiene la misma
probabilidad de recibir cualquiera de los tratamientos evaluados.
b) El error aleatorio o experimental (factores no controlados), se
distribuye en forma homogénea y proporcional entre las unidades
experimentales dentro y entre grupos experimentales (distribución
aleatoria del error).
Suposiciones básicas del DCA:
a) Se asume normalidad en la población de donde proviene el material
experimental, y por consecuencia, también se asume normalidad en las
muestras tomadas aleatoriamente de dicha población.
b) Se asume independencia entre las fuentes de variación que se
liberan y se estiman a partir de la descomposición de la variación total,
durante la aplicación del método de „análisis de varianza‟ a los datos
obtenidos durante el desarrollo del experimento.
c) Se asume inicialmente mínima varianza entre y dentro de las
muestras experimentales durante el montaje del experimento, es decir,
existe distribución aleatoria del error experimental.
d) Se espera que la varianza dentro de grupos experimentales continúe
siendo un buen estimador insesgado de la varianza poblacional (ζ2) de
donde provienen las muestras experimentales, incuso durante la
conducción y al final de la fase experimental.
11 | P a g e
Vale la pena enfatizar que garantizar las suposiciones antes descritas
permitirá que el diseño experimental tenga la sensibilidad para evaluar el efecto
de tratamientos libre de confusiones. (Fernández, Trapero y Dominguez 2010)
3.2.2. ANÁLISIS DEL DCA CON MÁS DE DOS TRATAMIENTOS Y EL
MISMO NÚMERO DE OBSERVACIONES POR UNIDAD EXPERIMENTAL
Ejemplo
Se probaron cinco niveles de pollinaza de (6-30 %) adicionadas a una dieta
base para alimentar a borregas madres de la raza Suffolk. Los animales fueron
sometidos a una etapa de acostumbramiento durante 15 días a las dietas
experimentales. Se determinó la ganancia de peso de los 60 días de
experimentación, consignándose los kg obtenidos durante la fase experimental.
Tabla 2: Pesos acumulados (kg) durante 60 días de periodo experimental
Ecuación 6
Donde: xi. = Σrxij; i = 1…6 tratamientos; j = 1…6 repeticiones
xij= cada observación
xi.= totales parciales por tratamiento
X1. = medias parciales por tratamiento
x.. = Gran total
La variación total del conjunto de los símbolos resumidos en la sección 2
del cuadro, que representan al conjunto de valores reales de la sección 1, puede
ser fraccionada en dos fuentes de variación:
12 | P a g e
Variación dentro de grupos.
Variación entre grupos.
Modelo estadístico
Ecuación 7
yi = variable de respuesta
μ = media general
Ti =efecto del i-ésimo tratamiento
Eij = j-ésimo efecto aleatorio ligado a la i-ésima UE o error experimental
Las hipótesis que se prueban
La hipótesis del investigador se establece en el sentido de que “Los niveles
de pollinaza adicionales a la dieta base afectan significativamente la ganancia de
peso en los borregos de la raza Suffolk”.
El análisis de varianza sobre los datos experimentales permitirá probar la
veracidad o falsedad de la hipótesis del investigador, si se rechaza o no la
hipótesis nula (Ho), de acuerdo al siguiente juego de hipótesis estadísticas:
Ecuación 8
Finalmente, la prueba estadística consiste en comparar un valor calculado
que establece la relación cociente entre la varianza de tratamiento (S2T) y la
varianza de error (S2E), a esto se le denomina “F calculada” (FC ), es decir:
Se rechaza Ho si FC = S2T /S2E ≥ F= (α, gl. t/gl.e); pero si ocurre lo
contrario, entonces no se rechaza Ho.
Partición de la varianza
Ecuación 9
Ecuación 10
13 | P a g e
Esto expresa claramente la varianza total de todas las observaciones Xij con
respecto a la media general del experimento.
Variación entre grupos o SCT= SCT = rΣki=1(Ẋi. - Ẋ..)2|
Ecuación 11
Donde = Factor de corrección (FC) o media cuadrática del experimento (μ2).
De lo anterior se deriva el siguiente desarrollo simbólico de estimación de SCT:
Ecuación 12
A esta también se le conoce como suma de cuadrados de tratamientos, y es de
naturaleza parcialmente de tratamiento ( ), y parcialmente aleatoria o error
aleatorio ( ).
Variación dentro de grupos o SCE = Σki=1 Σrj=1 (xij - ̅ i)2 = Σki=1 Σrj=1(xij - ̅ ..)2 -
rΣki=1( ̅ i. - ̅ ..)2
Es decir: SC de grupos = SC total – SC entre grupos
Nótese que a partir de este objetivo académico se adopta el procedimiento de
descomponer la variación total en las diferentes fuentes de variación a partir del
cuadro de datos. La SCE se obtiene como un residual.
Es decir: ΣΣ(xij - ̅ ..)2 = rΣ( ̅ i - ̅ ..)2 + ΣΣ(xij - ̅ i)2
La anterior igualdad se puede demostrar desarrollando la siguiente igualdad:
Ecuación 13
ΣΣ(xij - ̅ ..)2 = [r Σ( ̅ i - ̅ ..) + ΣΣ(Xij - ̅ i)]2
= Σ( ̅ i - ̅ ..)2 + 2[rΣ( ̅ i - ̅ ..) ΣΣ (xij - ̅ i)] + ΣΣ(xij - ̅ i)2
Pero como ΣΣ(xij - ̅ i) = 0, entonces el segundo término se reduce (se elimina),
quedando finalmente la igualdad antes indicada. Finalmente, la igualdad anterior
se puede expresar apropiadamente en el siguiente modelo lineal estadístico:
yij = μ + Ti + Eij, el cual corresponde al modelo estadístico de un diseño
completamente aleatorizado (DCA) con un solo criterio de clasificación.
14 | P a g e
Tabla 3: Cuadro de analisis de varianza (ANOVA) del DCA
DETERMINACIÓN DE LOS GRADOS DE LIBERTAD PARA FUENTES DE
VARIACIÓN
En el caso de la variación entre grupos, que se deriva de las desviaciones
de los totales cuadráticos de cada grupo experimental respecto a la media general
cuadrática del experimento (comúnmente llamado factor de corrección), se pierde
un grado de libertad, es decir: k–1, como se aprecia en el cuadro 3.9 de análisis
de varianza (corresponde al total de tratamientos menos uno: t-1); mientras que la
varianza común o ponderada que se deduce a partir de los diferentes grupos
experimentales, pierde un grado de libertad en la varianza de cada grupo o
tratamiento. Es decir: ri–1, desde i= 1,…, k tratamientos, de modo que la varianza
común del error tendrá k(r–1) grados de libertad, tal como se asentó previamente
en el cuadro de análisis de varianza. Lo anterior se puede ejemplificar con el
siguiente esquema de datos. Supongamos que se tienen los grupos
experimentales:
Ecuación 14
Nota: cuando r1 = r2 = ... = rk, entonces el modelo anterior tendrá para el error los
siguientes grados de libertad: , y la respectiva varianza del error será:
Ecuación 15
O bien, si se prefiere: glE = kr–k, pero como kr = n, entonces glE = n–k
15 | P a g e
ESTIMACIÓN DE LAS SUMAS DE CUADRADOS
Por lo tanto, retomando el ejercicio planteado anteriormente, el cálculo de
las sumas de cuadrados de las fuentes de variación es.
Ecuación 16
Tabla 4: Analisis de varianza de un ejemplo practico de un experimento con
un DCA
Teoría de la decisión: prueba de hipótesis
La regla de decisión se emplea en el sentido de que se rechaza la Ho si FC
≥ Ftab., en caso contrario no se rechaza. En este caso, FC resultó menor que
Ftab. Por lo tanto, no se rechaza la Ho, ya que el valor calculado quedó dentro del
intervalo de confianza 1-α = 0.95, es decir, la probabilidad de que Ho sea
rechazada es menor a 0.05.
Puede establecerse finalmente, que no existen diferencias significativas
entre los diferentes niveles de pollinaza evaluados, sobre la ganancia de peso
total en los borregos de la raza Suffolk. (Fernández, Trapero y Dominguez 2010)
Precisión del experimento
Ecuación 17
Es un valor alto, lo cual indica que probablemente se cometió error tipo II.
3.2.3. DCA CON DIFERENTE NÚMERO DE OBSERVACIONES POR
TRATAMIENTO Y SU ANÁLISIS E INTERPRETACIÓN
Observemos el siguiente caso, el cual fue tomado de Reyes Castañeda (pp. 122-124):
Tratamientos a: i = 1 . . . α
Repeticiones n: j = 1 . . . ni
16 | P a g e
Ecuación 18
En este caso, el cálculo de la SC se realizaría utilizando las siguientes funciones o calculando
los grados de libertad de la forma que se observa en el cuadro:
Ecuación 19
Tabla 5: calculo de los grados de libertad (GL) para un DCA con diferente número de observaciones por tratamiento
En el cuadro observamos un experimento en el que se aplicaron tres tipos de dietas diferentes a
pollos de engorda, tomemos estos datos como un ejemplo práctico de DCA con diferente número
de observaciones por tratamiento (Reyes Castañeda, 1987). (Tirado y Tirado 2017)
3.3. DISEÑO DE BLOQUES COMPLETOS AL AZAR (DBCA)
Permite realizar pruebas estadísticas mediante el método de análisis de
varianza, aun cuando el material experimental sea heterogéneo, es decir, cuando
la población en estudio sea muy variable y no sea posible cumplir con el supuesto
de mínima varianza dentro de los grupos experimentales, haciendo crecer el error
experimental, el cual puede confundirse con el efecto de los tratamientos,
enmascarando u obscureciendo el efecto de estos y perdiendo notablemente
sensibilidad para detectar significancia entre los tratamientos evaluados, lo cual
propende a la comisión del error tipo II, es decir, aumenta la probabilidad de no
rechazar la hipótesis nula (Ho) cuando esta pudiera ser falsa. Por otra parte,
cuando el error no se distribuye uniforme y proporcionalmente entre los grupos
experimentales, entonces se incrementa notablemente la probabilidad de
rechazar la hipótesis nula, es decir, se incrementa desproporcionadamente la
sensibilidad para detectar diferencias estadísticamente significativas entre los
17 | P a g e
tratamientos evaluados, provocando la comisión del error tipo I, que consiste en
rechazar la hipótesis nula cuando es cierta.
Cuando ocurre lo antes citado, el uso del DCA no es el procedimiento más
indicado, es necesario recurrir a un procedimiento diferente de apareamiento
entre las unidades experimentales y los tratamientos a evaluar. En este caso, el
material experimental se agrupa en estratos o bloques con menor grado de
variación entre unidades, a la vez que se fracciona el gradiente total de variación
para una determinada característica en bloques con un grado de variación del
material intrabloque considerablemente menor. Se espera que los tratamientos se
distribuyan a las unidades experimentales agrupadas en bloques y con ello se
elimine significativamente la variación intragrupo mencionada anteriormente, con
lo cual se garantiza de nuevo una distribución aleatoria y uniforme del error en el
material experimental, cobrando sensibilidad y precisión en la medición y
eliminación del error y en la estimación del efecto verdadero de los tratamientos.
Consecuentemente, mejora la validez y confiabilidad de la prueba de la hipótesis
y objetivos establecidos. Por supuesto, se incrementa la validez práctica de los
resultados obtenidos y de las inferencias hechas sobre la población de estudio.
EL CONCEPTO DE VARIACIÓN INTRABLOQUE
Imaginemos una escala variablemente uniforme con límites extremos de
cero (0) y 100 unidades en escala discreta. Esto dista notablemente de lo que
ocurre con la mayoría de las variables relacionadas a los fenómenos biológicos
ligados a la experimentación agrícola, donde la distribución probabilística de
dichas variables sigue generalmente la forma de la campana de Gauss, es decir,
de la distribución normal y en una escala de variación continua o de densidad. Sin
embargo, el planteamiento anterior permitirá comprender las ventajas de agrupar
el material experimental en estratos con menor gradiente de variación. Así pues,
supongamos la siguiente partición de la escala antes propuesta. (Tirado y Tirado
2017)
Ilustración 4
3.3.1. CARACTERÍSTICAS DEL DBCA
Son niveles específicos de una escala o gradiente de variación mayor.
Dentro de cada nivel o bloque la variación entre unidades experimentales
es significativamente menor, es decir, son homogéneas en cuanto a edad,
peso, variedad, fertilidad, etcétera.
La variación entre bloques es mayor a la variación intrabloque.
18 | P a g e
El número de unidades experimentales dentro de bloques debe ser por lo
mínimo igual al número de tratamientos a evaluar, pero puede haber dos o
más subrepeticiones por tratamiento en cada bloque, dando origen a una
modalidad denominada „bloques generalizados‟, lo que brinda considerable
precisión a la evaluación del efecto de los tratamientos a evaluar, pero puede
complicar el manejo y la conducción del experimento y dificultar el concepto
de mínima varianza intrabloque, a la vez que puede volver muy costoso el
experimento.
Cualquiera que sea la modalidad, en función de lo dicho anteriormente, los
bloques son las repeticiones verdaderas de los tratamientos a evaluar, a
menos que se diga o establezca otra cosa.
Los tratamientos son aleatorizados a las unidades experimentales dentro
de cada bloque, lo que constituye un criterio de restricción al compararse con
la aleatorización libre y total de los tratamientos a las unidades
experimentales en el DCA, visto anteriormente.
Todos los tratamientos seleccionados en el protocolo experimental son
evaluados en igualdad de condiciones en cuanto al grado de variación del
material experimental dentro de cada bloque, es decir, la distribución del error
aleatorio es uniforme entre las unidades intrabloque, garantizando con ello un
error experimental mínimo y una evaluación del efecto verdadero de los
tratamientos precisa y confiable, así como de la prueba de la hipótesis e
inferencias sobre la población de estudio.
Durante el procedimiento de análisis de varianza se separa el efecto de los
bloques, dejando libre el efecto de los tratamientos, a la vez que la
eliminación de la variación debida a los bloques reduce notablemente la
variación del error, dando al diseño bloques al azar mayor precisión en la
evaluación de la significancia de los tratamientos en estudio, lo que indica que
disminuye la probabilidad de cometer error tipo I en la prueba de la hipótesis.
Al diseño bloques al azar también se le conoce como un diseño de
aleatorización de los tratamientos a las unidades experimentales „con un
criterio de restricción‟, ya que la aleatorización no se hace en forma libre y
completa al material experimental, sino que se lleva a cabo sobre grupos de
unidades experimentales dispuestas en bloques. La variable que ha sido
bloqueada es aquella cuyo efecto ha sido fijado o controlado, en este caso el
procedimiento de bloqueo es sistemático y no aleatorizado. (Tirado y Tirado
2017)
3.3.2. ANÁLISIS DEL DBCA
Ejemplo
En cierto rancho un ganadero sometió 36 animales a 4 tratamientos
diferentes consistentes en cuatro fuentes proteicas en la dieta diaria. Se registró
la ganancia de peso total durante 30 días de periodo experimental. Debido a la
variación existente en el peso inicial de los animales se formaron para tal efecto 9
bloques de 4 animales cada uno. Una vez realizadas las observaciones
19 | P a g e
pertinentes se llegó a los resultados que se presentan a continuación. (Tirado y
Tirado 2017)
Tabla 6
3.3.3. DBCA CON VARIAS OBSERVACIONES POR UNIDAD
EXPERIMENTAL
Como se mencionó con anterioridad, una de las ventajas del DBA es que
puede admitir más de una repetición por tratamiento intrabloque, lo cual puede
reducir el error experimental y evaluar con mayor precisión el efecto de los
tratamientos. Para ilustrar la forma en que se puede realizar el análisis de
varianza a esta clase de diseño, usemos el siguiente ejemplo teórico.
Tabla 7: Tratamientos en un DBA
20 | P a g e
Modelo aditivo lineal: Yijk = + μ + ηi + ßj + εij + δijk
i = 1, . . , k
j = 1, . . , r
k = 1, . . , s
Donde:
μ: es la medida general
ηi: es el efecto de tratamiento
βj: es el efecto del bloque
εij: es el error experimental
δijk: es el error de muestreo
SUMAS DE CUADRADOS EN DISEÑO DE BLOQUES CON
SUBREPETICIONES:
La suma de cuadrados totales
La suma de cuadrados de tratamientos y bloque
Suma de cuadrados del error experimental
o también
Donde: es la suma de cuadrados de las unidades experimentales
La suma de cuadrados de error de muestreo es:
Los cálculos de los grados de libertad, suma de cuadrados, cuadrado medio y
probabilidad de los factores, para un DBA generalizado, se han resumido en el
cuadro. (Tirado y Tirado 2017)
Tabla 8: Fuentes de variación y estimación de grados de libertad ANOVA de DBA generalizado
21 | P a g e
3.3.4. DBCA CON DESIGUAL NÚMERO DE OBSERVACIONES POR
UNIDAD EXPERIMENTAL
En ocasiones, el material experimental es escaso o no es conveniente
extender demasiado el tamaño físico de los bloques. Este es un caso en que no
todos los tratamientos están presentes en todos los bloques, originando arreglos
conocidos como diseños aleatorios de Bloques Incompletos. Los puede haber
balanceados cuando para cualquier par de tratamientos ocurre el mismo número
de veces en el experimento que cualquier otro par; o desbalanceados y/o
parcialmente desbalanceados cuando cierto par de tratamientos ocurren n1
veces, otros n2 veces todavía otra(s) nr veces. En el campo de la agronomía la
ocurrencia de bloques incompletos desbalanceados, es decir, bloques con
desigual número de repeticiones por tratamiento es un evento poco frecuente, por
lo que en este apartado trataremos el enfoque que más comúnmente ocurre, que
es el de los bloques incompletos balanceados y que sienta las bases para los
arreglos de látices. (Tirado y Tirado 2017)
BLOQUES INCOMPLETOS BALANCEADOS
El ejemplo que a continuación se utiliza para el desarrollo de este tópico en
particular, a menos que se diga otra cosa, fue tomado y adaptado al enfoque
agrícola con fines académicos y didácticos, del texto “Diseño y análisis de
experimentos”, de Douglas C. Montgomery, pp. 155-161.
“Un fruticultor está interesado en probar cuatro tipos de fertilizantes foliares en un
huerto de manzanas. Cuando se determinan cuatro sitios de muestreo con
mínima variabilidad entre árboles, condición de humedad, etcétera. Se encuentra
que cada sitio sólo dispuso de tres árboles debido a la heterogeneidad del suelo.
Se decidió usar Bloques Incompletos para evaluar los productos y controlar así
las diferencias inherentes a los sitios”
Tabla 9: Peso de las frutas después de la cosecha (Resultados en kg de fruta/árbol)
Se puede notar que en todo bloque falta un tratamiento, pero es distinto
para bloques diferentes. Por ejemplo, las repeticiones faltantes para los
tratamientos A, B, C, D son en los bloques III, I, IV, II respectivamente. Al final
cada tratamiento dispone de tres repeticiones distribuidas aleatoriamente en los
cuatro bloques incompletos. Por lo tanto, existen k tratamientos en cada bloque,
en este caso (k = 3) y como ya se indicó cada ti ocurre r veces en el experimento
(r = 3). Nótese que el número total de observaciones es: ar= bk, de donde se
deduce que a = b y r = k.
22 | P a g e
Ecuación 20
a = b = 4 y r = k = 3 ∴ N = 12 observaciones
Además, el número de veces que cada par de tratamientos cualquiera
ocurre simultáneamente en determinados bloques es un factor llamado λ, que se
obtiene de la forma:
Ecuación 21
Por ejemplo, los tratamientos A y C ocurren en el bloque I y II en forma
total; el B y el D en los bloques III y IV solamente. El A y el D en los bloques I y IV,
y así por el estilo. (Tirado y Tirado 2017)
El modelo estadistico sigue siendo: Yij = μ + ti + Bj + Eij
3.4. DISEÑO DE CUADRO LATINO (DCL)
Este diseño es aquel que tiene dos restricciones en el proceso de
aleatorización de los tratamientos a las unidades experimentales (es decir: un
doble bloqueo). Puede, por lo tanto, controlar dos fuentes de variación a un
mismo tiempo, dejando libre el efecto de los tratamientos. (Tirado y Tirado 2017)
3.4.1. CARACTERÍSTICAS DEL DCL
1 El numero de niveles para cada fuente controlada debe ser el mismo. De
modo que estructuralmente es un cuadrado perfecto: 2 x 2, 3 x 3, 4 x 4,…,
n x n.
2 Cada tratamiento debe aparecer una sola vez en cada renglón y en cada
columna. Esto debe tomarse como una restricción de aleatorización
adicional a las de los dos gradientes que se están controlando. Más
adelante se verá más claramente en que consiste esta restricción.
3 El número de tratamientos a evaluar es igual al número de columnas e
hileras (que representan los dos gradientes de bloqueo doble).
4 El número total de unidades experimentales en el diseño completo
(experimento) es r2.
5 El doble agrupamiento permite restarle al error experimental los efectos de
los dos gradientes o variables a controlar que denominaremos en lo
sucesivo „hileras‟ y „columnas‟.
Condiciones que demandan el uso de un diseño en Cuadro Latino:
Cuando ligado al material experimental se anidan dos fuentes de variación,
las que en lo sucesivo se denominan “gradientes de variación”. Suponga por
ejemplo que se desea evaluar el efecto de cinco sistemas de pastoreo en bovinos
productores de carne en praderas irrigadas (sistema intensivo). Los tratamientos
se pueden designar por: T1, T2, T3, T4, T5.
Además, consideremos que los bovinos son variables en raza y peso de
modo que se puede identificar cada una de las razas como R1, R2, R3, R4, R5;
en tanto que los pesos pueden designarse por P1, P2, P3, P4, P5. De tal manera
que una forma de agrupación de los datos provenientes de un diseño en cuadro
latino (Fernández, Trapero y Dominguez 2010)
23 | P a g e
Tabla 10: Distribución aleatoria de los tratamientos en Cuadro Latino
3.4.2. ANÁLISIS DE VARIANZA DEL DCL
Retomando el ejercicio enunciado, se realizara el procedimiento de análisis
de varianza completo. Para tal efecto recordemos que los tratamientos fueron seis
métodos de muestreo A, B, C, D, E, F (l = 6); las variables de bloqueo fueron el
periodo de corte (r = 6) y el orden de corte (m = 6).
El planteamiento de las hipótesis nula y alternativa (Ho y Ha) se observan
en el cuadro. Se plantea como Ho que todos los tratamientos son iguales vs. la
Ha, en la que se señala que al menos uno de ellos es diferente.
Tabla 11: Planteamiento de las hipotesis nula y alternativa (Ho y Ha) para un diseño en Cuadro Latino
Se concentran los resultados de rendimiento parciales y totales de materia seca de
forraje por ha de Rye grass y alfalfa
Tabla 12: Rendimiento de materia seca de Rye grass y alfalfa con diferentes metodos de corte
24 | P a g e
Tabla 13: Totales de tratamientos para el rendimiento de materia seca de Rye grass y alfalfa
Ecuación 22
Finalmente, el análisis de varianza para un DCL se resume en el cuadro
Tabla 14: Analisis de varianza (ANOVA) del diseño experimental en Cuadro Latino
Se concluye que las diferencias entre los métodos de muestreo son
altamente significativas (P<0.01), también existen diferencias estadísticamente
significativas (P<0.05) para las épocas de corte, no así en el orden de corte donde
tales diferencias no son significativas (P>0.05).
Puede demostrarse que las sumas de cuadrados para las tres fuentes de
variación de mayor interés están dadas por la suma de sus respectivas medias
respecto a la media general y por las repeticiones de dichas fuentes. Es obvio que
en este caso tanto las dos fuentes controladas como los tratamientos evaluados
tienen balanceadamente igual número de repeticiones para cada nivel particular.
(Fernández, Trapero y Dominguez 2010)
25 | P a g e
CONCLUSIÓN
El diseño de un experimento es la secuencia completa de los pasos que se
deben tomar de antemano, para planear y asegurar la obtención de toda la
información relevante y adecuada al problema bajo investigación, la cual será
analizada estadísticamente para obtener conclusiones válidas y objetivas con
respecto a los objetivos planeados.
Un diseño experimental es una prueba o serie de pruebas en las cuales
existen cambios deliberados en las variables de un proceso o sistema, de tal
manera que sea posible observar e identificar las causas de los cambios que se
producen en la respuesta de salida.
26 | P a g e
BIBLIOGRAFIA
Fernández, Escobar R., A. Trapero, y J. Dominguez. Experimentación en agricultura. Sevilla:
Andalucia. Consejeria de Agricultura y Pesca, 2010.
Tirado, Estrada Gustavo, y Gonzalez Deli Nazmin Tirado. Tratado de estadistica experimental.
Guadalajara Jalisco, México: Cenid, 2017.
27 | P a g e