Tabla análisis de varianza
¿Qué es?
En estadística, el análisis de la varianza (ANOVA por sus sigloides en
inglés, ANalysis Of VAriance) es una colección de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en ciertos
componentes debidos a diferentes variables explicativas. Se utiliza de forma
intensiva en el análisis y diseño de experimentos para evaluar el efecto de
tratamientos en la variabilidad de la variable respuesta.
El análisis de la varianza parte del concepto de regresión lineal, cuya funcionalidad
amplía. Así, un análisis de la varianza permite determinar, por ejemplo, si
diferentes tratamientos médicos (es decir, un grupo de más de dos tratamientos)
muestran diferencias significativas en sus resultados o si por el contrario puede
suponerse que sus medias poblacionales no difieren. De este modo el análisis de
la varianza permite superar las limitaciones de hacer contrastes bilaterales por
parejas entre todos los tratamientos posibles, lo que sería un mal método para
determinar si un conjunto de variables con n > 2 difieren entre sí. El primer
concepto fundamental es suponer que todo valor observado puede expresarse
mediante la siguiente función:
Tipos de modelos:
o Modelo I: Efectos fijos
El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las
que el experimentador ha sometido al grupo o material analizado a varios factores,
cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable
respuesta" con una distribución normal.
Este modelo se supone cuando el investigador se interesa únicamente por los
niveles del factor presentes en el experimento, por lo que cualquier variación
observada en las puntuaciones se deberá al error experimental.
o Modelo II: Efectos aleatorios (componentes de varianza)
Los modelos de efectos aleatorios se usan para describir situaciones en que
ocurren diferencias incomparables en el material o grupo experimental. El ejemplo
más simple es el de estimar la media desconocida de una población compuesta de
individuos diferentes y en el que esas diferencias se mezclan con los errores del
instrumento de medición.
Este modelo se supone cuando el investigador está interesado en una población
de niveles, teóricamente infinitos, del factor de estudio, de los que únicamente una
muestra al azar (t niveles) están presentes en el experimento.
¿Qué dice la tabla ANOVA?
El modelo ANOVA supone que para cada nivel xi del factor X, se tiene que
Y=μi+ERROR, donde ERROR es una variable aleatoria NORMAL de media 0 y
varianza desconocida, la misma para todos los niveles. Es decir, si X=x1,
entonces Y=μ1+ERROR.
¿Cómo interpretar la tabla?
Paso 1: Determinar si las diferencias entre las medias de los grupos
son estadísticamente significativas
Para determinar si cualquiera de las diferencias entre las medias es
estadísticamente significativa, compare el valor p con el nivel de significancia para
evaluar la hipótesis nula. La hipótesis nula indica que las medias de población son
todas iguales. Por lo general, un nivel de significancia (denotado como α o alfa) de
0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo
de 5% de concluir que existe una diferencia cuando no hay una diferencia real.
Paso 2: Examinar las medias de los grupos
Use la gráfica de intervalo para mostrar la media y el intervalo de confianza para
cada grupo.
Las gráficas de intervalo muestran lo siguiente:
Cada punto representa una media de muestra.
Cada intervalo es un intervalo de confianza de 95 % de la media de un
grupo. Usted puede estar 95% seguro de que una media de grupo está
dentro del intervalo de confianza del grupo.
Paso 3: Comparar las medias de los grupos
Si el valor p del ANOVA de un solo factor es menor que el nivel de significancia,
usted sabrá que algunas de las medias de los grupos son diferentes, pero no
cuáles pares de grupos. Utilice la tabla Información de agrupación y pruebe las
diferencias de las medias para determinar si esas diferencias entre los pares
específicos de grupos son estadísticamente significativas y para estimar qué tan
diferentes son las medias.
Paso 4: Determinar hasta qué punto el modelo se ajusta a sus datos
Para determinar qué tan bien se ajusta el modelo a los datos, examine los
estadísticos de bondad de ajuste en la tabla Resumen del modelo.
Paso 5: Determinar si el modelo cumple con los supuestos del
análisis
Utilice las gráficas de residuos como ayuda para determinar si el modelo es
adecuado y cumple con los supuestos del análisis. Si los supuestos no se cumplen,
el modelo podría no ajustarse adecuadamente a los datos y se debería tener
cuidado al interpretar los resultados.