CAPITULO 11
ANÁLISIS DE LA VARIANCIA
100% de todos los desastres son fallas de diseño, no de análisis.
Ron Markls
Proponer que la pobreza del diseño pueda ser corregida por sutiles técnicas de análisis es contrario al
buen pensamiento científico.
Stuart Pocock
I. CONCEPTOS BASICOS
1. Introducción
En términos bastante generales se podría decir que un trabajo
experimental debería seguir más o menos las siguientes etapas:
• Definición del problema u objetivo de estudio
• Revisión de literatura
• Planeamiento y diseño del experimento
• Conducción del experimento
• Recolección de los datos obtenidos
• Análisis de los datos
• Interpretación y evaluación de los resultados
Todas estas etapas son importantes y del cuidado que el investigador le
dé a cada una de ellas dependerá la calidad de los resultados del
experimento. Si bien estas etapas muestran un orden cronológico, es
claro que las mismas no son independientes por lo que el descuido por
parte del investigador en alguna de ellas traerá consecuencias negativas
y a menudo irreparables en el experimento. Así, una vez definido el
problema, el investigador deberá diseñar el experimento, más eficiente
que le permita obtener los datos necesarios para lograr estimaciones
insesgadas de los efectos que desea evaluar.
Por último es conveniente mencionar que quizás la etapa más importante
corresponda al planeamiento y diseño del experimento. Recuerde que
(citando a Pocock) las técnicas de análisis, por más sofisticadas que estas
sean difícilmente podrán corregir la pobreza de un diseño.
El análisis de la varianza - ANVA (o ANOVA: Analysis of variance) es un
método para comparar dos o más medias, que es necesario porque
cuando se quiere comparar más de dos medias es incorrecto utilizar
repetidamente el contraste basado en la t de Student. Es un método que
permite comparar varias medias en diversas situaciones; muy ligado, por
tanto, al diseño de experimentos y, de alguna manera, es la base del
análisis multivariante.
2. Conceptos Generales
¿Qué se entiende por diseño?
Diseño es un plan o estrategia a seguir para responder a las preguntas
de la investigación.
Diseñar significa planear un experimento de manera que se pueda
obtener la información pertinente al problema bajo investigación y así
tomar decisiones correctas.
Diseñar significa planificar la forma de hacer el experimento,
materiales y métodos a usar, etc.
¿Qué se entiende por “El diseño de un experimento”?
El diseño de un experimento es la secuencia completa de los pasos que
se deben tomar de antemano para planear y asegurar la obtención de
toda la información relevante al problema bajo investigación tal que sea
posible realizar inferencias estadísticas válidas con respecto a los
objetivos establecidos en la investigación.
DISEÑO EXPERIMENTAL
El diseño experimental involucra determinar la forma en la que los niveles
de los factores o tratamientos serán asignados a las unidades
experimentales, la elección del tamaño muestral y la disposición de las
unidades experimentales. El diseño experimental determina el modelo
estadístico que se usará para poner a prueba la hipótesis del
investigador.
La utilización de un diseño experimental adecuado permitirá obtener
información válida para responder a las preguntas planteadas como
objetivo de la investigación, así como minimizar el error experimental.
¿Cuál es el propósito de un diseño experimental?
a. Proporcionar una cantidad máxima de información del problema
en investigación.
b. Que el plan sea simple.
c. Conducción eficiente.
d. Ahorro de tiempo, dinero, de personal y de material experimental.
e. Eficiencia estadística y económica de recursos. Proporcionar la
máxima cantidad de información al mínimo costo.
¿Qué pasos de deben seguir para el diseño y análisis de un
experimento?
Para aplicar el enfoque estadístico en el diseño y análisis de un
experimento, es necesario que todos los que participan en el mismo
tengan desde el principio una idea clara de qué es exactamente lo que va
a estudiarse, cómo van a colectarse los datos, y al menos una
comprensión cualitativa de la forma en que van a analizarse estos datos.
Seguidamente se muestra un esquema general del procedimiento
recomendado:
1. Identificación, exposición del problema e hipótesis.
2. Elección de los factores, los niveles y los rangos.a. Planeación previa
3. Selección de la variable de respuesta.a al experimento
4. Elección del diseño experimental.
5. Realización del experimento.
6. Análisis estadístico de los datos.
7. Conclusiones y recomendaciones.
aEn la práctica, los pasos 2 y 3 suelen hacerse simultáneamente o en el orden inverso .
FACTOR O FACTOR DE TRATAMIENTO:
Es una variable independiente controlada que toma diversos valores o
clases cuyo efecto se desea evaluar en el experimento. A los distintos
valores que son estudiados se les llama niveles o tratamientos del
factor. En un experimento se puede evaluar un solo factor o más de uno.
Es importante mencionar sin embargo que la dificultad en la conducción
y análisis de los resultados de un experimento aumentará
considerablemente conforme más factores sean incorporados.
Ejemplos:
- Factor: Dosis de vitamina B12 en la alimentación de niños.
Niveles: 5, 10 y 15 g/lb de ración.
- Factor: Razas fisiológicas de 'Brachybacterium variedad Mn32' para
eliminar metales pesados (manganeso, zinc y níquel) del agua y suelo.
Niveles: Razas A, B, C, D.
TRATAMIENTOS o NIVELES DE UN FACTOR DE TRATAMIENTO:
Es una manifestación específica del factor de tratamiento para ser
incluido en el experimento. Implica el conjunto particular de condiciones
experimentales o procedimientos que deben imponerse a una unidad
experimental, para medir su efecto y compararlo con el de otros
tratamientos.
Un diseño de experimento tendrá dos o más tratamientos seleccionados
por el Investigador, tal que una comparación entre ellos permitirá
resolver los problemas planteados en el objetivo del experimento.
Ejemplo: los tratamientos o niveles del factor razas fisiológicas de
brachybacterium variedad Mn32 pueden ser Raza A, Raza B, Raza C,
Raza D. Como se aprecia para estos factores los tratamientos o niveles
constituyen clases o categorías, por lo que a estos se los llama factores
cualitativos. Para el factor de tratamiento dosis de Vitamina B12 sus
niveles pueden ser: 5, 10 y 15 g/lb de ración. Estos son factores
cuantitativos ya que los tratamientos o niveles toman valores numéricos
TESTIGO
Es un tratamiento de comparación en el que no se aplica procedimiento
alguno. También se le conoce como tratamiento control.
Ejemplos:
- No se aplica vitamina B12 en el alimento.
- No se aplica ninguna droga.
UNIDAD EXPERIMENTAL:
Es el material experimental unitario que recibe la aplicación de un
tratamiento.
Ejemplos:
- Un niño.
- Un metro cúbico de agua.
VARIABLE RESPUESTA
Es la variable dependiente medida en cada unidad experimental a través
de la cual se evaluará los efectos de los tratamientos. Corrientemente su
expresión es numérica. Usualmente se mide varias variables respuestas
en el mismo ensayo.
Ejemplos:
- Ganancia de peso en kg por niño.
- Tiempo hasta lograr la eliminación de metales pesados.
FUENTES DE VARIACIÓN
Una fuente de variación está constituida por cualquier factor (variable
independiente que afecta los resultados del experimento) o conjunto de
factores controlados o no por el investigador. Se distinguen tres tipos:
'
Aquellas cuyo efecto sobre la respuesta es de particular interés para el
experimentador (factores de tratamientos).
Aquellas que no son de interés directo pero que se contemplan en el
diseño para reducir la variabilidad no planificada (por ejemplo, como se
verá más adelante, los bloques).
Aquellas que no son contempladas en el diseño (error experimental).
Por ejemplo, en un experimento en el que se desean evaluar las razas
fisiológicas de brachybacterium variedad Mn32 generarán variabilidad en
una variable respuesta de interés. El interés del investigador está en
evaluar el efecto de las razas fisiológicas de brachybacterium variedad
Mn32, este es un factor tratamiento.
ERROR EXPERIMENTAL:
Una medida de variación que existe entre dos o más unidades
experimentales que han recibido la aplicación de un mismo tratamiento
y que por efectos no controlables reportan ciertas diferencias. Se asume
que esta variable es totalmente aleatoria. El error experimental involucra:
error de experimentación (esto entre unidades experimentales), errores
de observación, errores de medición, errores de variación del material y
otros
Fuentes de Error Experimental
El error experimental proviene de dos fuentes principales:
a. Variabilidad inherente al material experimental al cual se le aplican
los tratamientos.
b. Variabilidad resulte de cualquier falta de uniformidad en la realización
física del experimento.
Por ejemplo, en un experimento en nutrición con ratas, las ratas tendrán
constitución genética diferente; está variabilidad es inherente al material
experimental. Por otra parte, las ratas se colocan en jaulas sujetas a
diferencias de calor, luz y otros factores; esto constituye una falta de
uniformidad en la realización física del experimento.
Los errores de experimentación, observación y medición, así como la no
selección del diseño experimental adecuado, también formarán parte del
error experimental.
Formas de disminuir el Error Experimental
Se debe realizar todo el esfuerzo posible por disminuir el error
experimental ya que de esta manera se aumentará el poder de la prueba
(probabilidad de detectar diferencias existentes entre los efectos de los
tratamientos). Para lograr disminuir el error experimental se debe tener
en cuenta lo siguiente:
a. Seleccionar minuciosamente el material experimental a usar. Esto
permitirá reducir los efectos debidos a la variabilidad inherente.
b. Refinar la técnica experimental. Esto permitirá reducir los efectos
debidos a la variabilidad correspondiente a las condiciones del
experimento.
c. Utilizar el diseño experimental apropiado.
d. Aumentar tanto como sea posible el número de repeticiones en el
experimento.
e. Utilizar observaciones concomitantes cuando sea necesario.
¿Cuáles son las causas del error experimental?
El error experimental puede originarse por:
1. Errores de experimentación.
2. Errores de observación
3. Errores de medición.
4. Variación en el material experimental.
5. Factores extraños que pueden influir las características de la
investigación.
¿Entonces cuál es la ventaja en planear experimentos y usar
estadística ya que siempre va a existir el error experimental?
Existen ventajas y por esta razón usamos Estadística. La metodología
Estadística y un planeamiento adecuado de experimento permitirá
reducir el error experimental en la investigación, y esto en cambio hará
posible que sean detectable las diferencias significativas entre los
tratamientos que han sido usados. Si el investigador no hace el
planeamiento del experimento en forma correcta, el error experimental
del experimento va a ser grande y no se podrán detectar las diferencias
significativas en el experimento. El Investigador concluirá de manera
equivocada que todos los tratamientos tienen el mismo efecto y que
ningún tratamiento es ni mejor y ni peor que los otros tratamientos.
PRINCIPIOS BÁSICOS DEL DISEÑO EXPERIMENTAL
a. REPETICION: (también se llama Replicación)
Es el número de veces que se aplica un tratamiento a las unidades
experimentales.
Permite obtener la estimación del error experimental para
determinar el significado de las diferencias.
b. ALEATORIZACION:
Es el método por el cual las unidades experimentales reciben la
aplicación de tratamientos en forma aleatoria.
El método de aleatorización depende del diseño de experimento que
será usado. El uso de la aleatorización correcta asegura el
cumplimiento del supuesto de independencia del análisis de
variancia.
La randomización en la aplicación de los niveles de un factor a las
unidades experimentales, ocurre solamente si cada unidad
experimental tiene igual e independiente chance de recibir
cualquier nivel del factor y si cada unidad experimental es
manipulada independientemente.
c. CONTROL LOCAL:
Consiste en el uso de técnicas de balanceo, bloqueo y agrupamiento
de las unidades experimentales para asegurar que el diseño usado
sea más eficiente, aunque los tres términos son sinónimos cada
uno explica algo referente a la unidad experimental, así:
Agrupamiento. Es la colocación de un conjunto de unidades
experimentales homogéneas en grupos, de modo tal que a cada
grupo se le aplica un tratamiento. El número por grupo puede ser
diferente.
Bloqueo. Es la distribución de las unidades experimentales en
grupos llamados bloques, de tal manera que las unidades dentro
de un bloque sean relativamente homogéneas; de esta manera, la
mayor parte de la variación predecible entre las unidades quede
confundida con el efecto de los bloques. Bloque es un grupo de
unidades experimentales similares u homogéneas.
Balanceo. Se refiere a la aplicación de los tratamientos a un igual
número de unidades experimentales con el propósito de que todos
los pares de tratamientos a comparar se lo haga con
aproximadamente la misma precisión. Así se dice que un
experimento es balanceado si cada tratamiento tiene el mismo
número de repeticiones o unidades experimentales.
MODELO ESTADÍSTICO
Es una representación matemática de las relaciones existentes entre los
diversos factores o componentes considerados en un diseño
experimental. Por ejemplo:
Yij = + i + eij
Dependiendo de la forma en la que son elegidos los tratamientos, los
modelos pueden ser de tres tipos:
Modelo I (Efectos Fijos): Se presenta cuando los tratamientos son
fijados por el experimentador. En este caso las conclusiones del
experimento solamente son válidas para los tratamientos evaluados. Por
ejemplo, si se desea estudiar el efecto de dietas con diferente nivel
energético en la ganancia de peso en bebés, dosis de un producto
químico, estos factores serian fijos.
Modelo II (Efectos Aleatorios): Se presenta cuando los tratamientos son
escogidos aleatoriamente desde una población de tratamientos. En este
caso las conclusiones del experimento serán válidas para la población de
tratamientos. Por ejemplo, Un ejemplo de modelo II sería: un investigador
está interesado en determinar el contenido, y sus variaciones, de grasas
en las células hepáticas de cobayas; toma del animalario 5 cobayas al
azar y les realiza, a cada una, 3 biopsias hepáticas.
Modelo III (Efectos Mixtos): Se presenta cuando se tiene una
combinación de los dos modelos anteriores, es decir, cuando se tienen
algunos factores con efectos fijos y algunos factores con efectos
aleatorios.
¿Qué es una Hipótesis Estadística?
Es un enunciado o afirmación ya sea acerca de los parámetros de una
distribución de probabilidad o de los parámetros (constante que
caracteriza una población) de un modelo el cual puede ser validado
mediante una prueba estadística.
La hipótesis refleja alguna conjetura acerca de la situación del problema.
Por ejemplo, en el experimento de comparar dos tipos de razas
fisiológicas, puede pensarse que las respuestas son similares. Esto puede
enunciarse formalmente como
H 0 : 1 = 2
H 1 : 1 2
donde 1 es la respuesta promedio de la raza 1 y 2 es el respuesta
promedio de la raza 2. Al enunciado H 0 : 1 = 2 se le llama la hipótesis
nula y H 1 : 1 2 se le llama la hipótesis alternativa. A la hipótesis
alternativa que se especifica aquí se le llama hipótesis alternativa de dos
colas porque sería verdadera si 1 2 o 1 2 .
Para probar una hipótesis se proyecta un procedimiento para tomar una
muestra aleatoria, calcular un estadístico de prueba apropiado para
después rechazar o no estar en posición de rechazar la hipótesis nula Ho.
Parte de este procedimiento consiste en especificar el conjunto de valores
del estadístico de prueba que llevan al rechazo de Ho.
Cuando se tiene t niveles de un factor y el modelo con efectos fijos las
hipótesis son:
a. En términos de las medias de los tratamientos
H 0 : 1 = 2 = ... = t
H 1 : i j Para al menos un par (i, j)
H 0 : i = i
H 1 : i para al menos algún i
o
H 0 : 1 = 2 = ... = t
H 1 : Al menos una i es diferente
b. En términos de los efectos de los tratamientos
Una forma equivalente de escribir las hipótesis anteriores es en términos
de los efectos de los tratamientos i , por ejemplo
H 0 : 1 = 2 = ... = t = 0
H 1 : i 0 Para al menos una i
o
Ho: i = 0 (Los i tratamientos tienen el mismo efecto sobre la variable en estudio)
Ha: i 0 (No todos los tratamientos tienen el mismo efecto sobre la variable en
estudio
o
H 0 : 1 = 2 = ... = t
H 1 : Al menos una i es diferente
c. Literalmente
Ho: Todos los tratamientos tienen el mismo efecto en la variable
respuesta
Ha: Con al menos uno de los tratamientos se obtiene una respuesta
diferente.
Por lo tanto, se habla de probar la igualdad de las medias de los
tratamientos o de probar que los efectos de los tratamientos (las i ) son
cero. El procedimiento apropiado para probar la igualdad de las medias
de los t tratamientos es el análisis de varianza.
¿Qué es el Análisis de la Variancia?
Es una técnica estadística que sirve para analizar la variación total de los
resultados experimentales de un diseño en particular, descomponiéndolo
en fuentes de variación independientes atribuibles a cada uno de los
efectos en que constituye el diseño experimental factor de tratamiento,
bloques, interacciones entre factores, covariables, error experimental)
con la finalidad de compararlas e identificar su importancia relativa en la
explicación de la variabilidad total.
¿Cuáles son los supuestos que deben cumplirse para considerar
cómo válido el Análisis de la Variancia?
Para que el análisis de la variancia de un experimento sea considerado
válido, debe cumplirse ciertos supuestos:
(a) Normalidad. Los valores resultado del experimento proviene de
una distribución “normal” con media µ y variancia 2 . En un
diseño experimental se debe evaluar si la variable respuesta Y
sigue una distribución normal con media µ + τi y variancia σ2
en cada uno de los tratamientos, o si los errores o residuales
siguen una distribución normal com media 0 y variancia σ2.
(b) Independencia. Los resultados observados del experimento son
independientes entre sí.
(c) Aditividad. Los componentes del modelo estadístico son aditivos,
es decir la variable supuesta es la suma de los efectos del modelo
estadístico.
(d) Linealidad. La relación existente entre los componentes del
modelo estadístico es del tipo lineal.
(e) Variancias Homogéneas (Homocedasticidad) entre los
tratamientos, para determinar una variancia común.
Nota: Cuando no se pueden cumplir las condiciones de normalidad o de
independencia de los datos, uno se tiene que remitir a las pruebas no
paramétricas, que no requieren de estas suposiciones.
¿Para qué se usa un método del Análisis posterior?
Se requiere el uso de algún método del análisis posterior para contrastar
diferentes subhipótesis de interés, después de que se verifica que el valor
de F para alguna hipótesis en la tabla de ANVA es significativo. Cada una
de las hipótesis que se rechaza en la tabla ANVA, comprobada por el valor
respectivo de F significativo, le corresponde una o varias subhipótesis
que se deben contrastar por un método apropiado del análisis posterior.
NOTA: El nivel de significación que ha sido usado para determinar la
significación de un valor de F en la tabla de ANVA es el que debe ser usado para
el análisis posterior si se detecta esta significación para el valor de F.
A este análisis posterior al ANVA se le llama Pruebas de Comparación
Múltiples de Medias
¿Qué métodos del análisis posterior existen?
Existen un gran número de métodos de análisis posterior, así:
Para tratamientos cualitativos:
Benferroni.
Duncan.
Dunnett.
Gabriel.
Ryan- Einot-Gabriel-Welsch.
Scheffe.
Sidak.
Student- Newman-Keuls.
LSD (Diferencia Mínima Significativa).
Tukey.
Waller.
Contrastes ortogonales.
Para tratamientos cuantitativos:
Regresión por Polinomios ortogonales.
¿Qué métodos del análisis posterior se usan más comúnmente?
Los métodos de análisis posterior que se usan más comúnmente son los
siguientes:
Duncan.
Tukey.
Dunnett.
Contrastes lineales ortogonales,
Regresión por Polinomios ortogonales.
II. Diseños Experimentales y diseños de
tratamientos
DISEÑO EXPERIMENTAL DISEÑOS DE TRATAMIENTOS
ARREGLO DE LAS UB, ARREGLO DE LOS TRAMIENTOS
PARCELAS
▪ DCR ▪ REGRESION
▪ DBCR ▪ FACTORIAL
▪ DCL ▪
Diseños experimentales Básicos.
Un diseño experimental es una regla que determina la asignación de las
unidades experimentales a los tratamientos. Aunque los experimentos difieren
unos de otros en muchos aspectos, existen diseños estándar que se utilizan con
mucha frecuencia. Algunos de los más utilizados son los siguientes:
Diseño completamente randomizado.
El experimentador asigna las unidades experimentales a los tratamientos al
azar. La única restricción es el número de observaciones que se toman en cada
tratamiento. De hecho si ni es el número de observaciones en el i-ésimo
tratamiento, i = 1,..., t, entonces, los valores n1, n2,..., nt determinan por completo
las propiedades estadísticas del diseño. Naturalmente, este tipo de diseño se
utiliza en experimentos que no incluyen factores bloque.
El modelo matemático de este diseño tiene la forma:
Respuesta = Constante + Efecto tratamiento +error
Diseño en bloques o con un factor bloque.
En este diseño el experimentador agrupa las unidades experimentales en
bloques, a continuación, determina la distribución de los tratamientos en cada
bloque y, por último, asigna al azar las unidades experimentales a los
tratamientos dentro de cada bloque.
En el análisis estadístico de un diseño en bloques, éstos se tratan como los
niveles de un único factor de bloqueo, aunque en realidad puedan venir
definidos por la combinación de niveles de más de un factor nuisance.
El modelo matemático de este diseño es:
Respuesta = Constante + Efecto bloque + Efecto tratamiento + Error
El diseño en bloques más simple es el denominado diseño en bloques
completos, en el que cada tratamiento se observa el mismo número de veces
en cada bloque.
El diseño en bloques completos con una única observación por cada tratamiento
se denomina diseño en bloques completamente randomizado o,
simplemente, diseño en bloques aleatorizado.
Cuando el tamaño del bloque es inferior al número de tratamientos no es posible observar
la totalidad de tratamientos en cada bloque y se habla entonces de diseño en bloques
incompletos.
Diseños con dos o más factores bloque.
En ocasiones hay dos (o más) fuentes de variación lo suficientemente
importantes como para ser designadas factores de bloqueo. En tal caso, ambos
factores bloque pueden ser cruzados o anidados.
Los factores bloque están cruzados cuando existen unidades experimentales en
todas las combinaciones posibles de los niveles de los factores bloques.
Cuando se tiene dos factores bloque el diseño se conoce como Diseño
Cuadrado Latino.
El modelo matemático de este diseño tiene la forma:
Respuesta = Constante + Efecto bloque fila + Efecto bloque columna + Efecto tratamiento + Error
Diseños de tratamientos
Se ha indicado, que diseño es planificar y por lo tanto diseño de tratamientos
es la planificación sobre los factores tratamiento y sus niveles que van a ser
incluidos en el experimento.
La selección del factor tratamiento y sus niveles (tratamientos) a incluir en un
experimento es de vital importancia: Factor cualitativo y factor cuantitativo.
Fijar las condiciones experimentales para que las diferencias entre tratamientos
se expresen es también de primordial importancia.
El uso de tratamientos CONTROLES o TESTIGOS es fundamental en el diseño
de tratamientos para saber si ciertas condiciones realmente existen o no. El
uso de CONTROLES es importante para compararlos con otros tratamientos.
Si se desea estudiar dos o más factores tratamiento, la selección de estos y sus
correspondientes niveles es importante. El estudio de varios factores
tratamiento se llama Factorial. “Un diseño factorial es una estrategia
experimental que consiste en cruzar los niveles de todos los factores tratamiento
en todas las combinaciones posibles Un diseño de tratamiento: factorial
completo de tratamientos consiste en estudiar el efecto de FACTORES presentes
a determinados NIVELES y todas sus posibles interacciones.