UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA
“ANTONIO JOSÉ DE SUCRE”
VICERRECTORADO BARQUISIMETO
DEPARTAMENTO DE INGENIERÍA INDUSTRIAL
ANALISIS DE VARIANZA (ANOVA)
Integrantes:
Luis Castillo C.I: 29.868.174; EXP: 20192-0208
Rafael Gómez C.I: 29.970.510; EXP: 20211-0286
Profesor:
Ing. Tamara Fuentes
22 de Julio de 2024
Índice
1- Introducción…………………………………………………………………………………....1
2- ANOVA…………………………………………………………………………………………..2
3- Tipos de ANOVA……………………………………………………………………………….2
3.1- ANOVA de un factor o de una vía………………………………………………………...2
3.2- ANOVA de medidas repetidas o datos variados……………………………………….2
3.3- ANOVA factorial……………………………………………………………………………...2
3.1- MANOVA………………………………………………………………………………………2
4- Suposiciones del ANOVA de un solo factor………………………………………………3
5- ANOVA de un factor……………………………………………………………………………3
6- Modelo de ANOVA para un solo factor……………………………………………………..3
7- Procedimiento de ANOVA……………………………………………………………………..3
8- Tabla (ANOVA de un solo factor)…………………………………………………………….5
9- Problema………………………………………………………………………………………….5
10- Solución del problema………………………………………………………………………..6
11- Conclusión………………………………………………………………………………………7
12- Bibliografía ……………………………………………………………………………………...8
Introducción
Cuando hay más de dos grupos que necesitan ser comparados, podríamos compararlos dos
a dos, esto no es recomendable por ser laborioso y debido al incremento de la probabilidad
de cometer errores de primera especie, es decir, a mayor comparación, más posibilidad de
equivocarnos al rechazar la hipótesis nula (𝐻0 ) siendo que es verdadera, la técnica
recomendada y más usada es el ANOVA.
En este trabajo queremos desarrollar el método de ANOVA, basándonos en el procedimiento
de ANOVA de un factor aplicado a un conjunto de datos, mediante el software computacional
conocido como Microsoft Excel. Nuestro objetivo es conocer la terminología, conceptos,
formulas, teoría y procedimiento de ANOVA de tal manera que podamos comprender e
interpretar los resultados que nos proporciona Excel, para sacar conclusiones de manera
razonable acerca de la variabilidad, o no, de la variable respuesta de los factores
involucrados, en nuestro caso un solo factor.
1
ANOVA
ANOVA (ANalysis Of VAriance) es una técnica estadística para comparar varios grupos en
una variable cuantitativa, establecer semejanzas o diferencias entre tres o más grupos
diferentes, e identificar si estas diferencias son estadísticamente significativas. Su análisis se
basa en análisis de las varianzas, o la variabilidad del conjunto de datos.
¿Cuándo se usa un ANOVA?
• Cuando hay más de dos grupos que necesitan ser comparados. El ANOVA también
puede ser usado para comparar solamente dos grupos.
• Cuando hay mediciones repetidas en más de dos ocasiones o cuando hay dos o más
grupos los cuales se hacen mediciones repetidas en dos ocasiones.
• Cuando los sujetos pueden variar en una o más características que afectan el
resultado y se necesita ajustar su efecto.
• Cuando se desea analizar simultáneamente el efecto de dos tratamientos diferentes,
cuando el efecto de cada uno por separado y su posible interacción es importante.
Tipos de ANOVA
1- ANOVA de un factor o de una vía
Compara tres o más grupos independientes, teniendo una variable clasificatoria
(independiente) y una de resultado (dependiente).
2- ANOVA de medidas repetidas o datos variados
Tiene una variable clasificatoria y una de resultado.
3- ANOVA factorial
Compara varios grupos teniendo más de una variable clasificatoria y una de resultado. Si se
compara la variable cuantitativa dependiente contra dos factores se le llama ANOVA de dos
vías.
4- MANOVA
Compara varios grupos teniendo una variable clasificatoria y varias de resultado.
Suposiciones del ANOVA de un solo factor
2
• Las K poblaciones son independientes.
• Las K poblaciones están distribuidas en forma normal con medias µ1 , µ2 , µ3 , … , µ𝑘.
• Las K poblaciones tienen varianza común 𝜎 2 . La homogeneidad de las varianzas se
conoce como homocedasticidad.
ANOVA de un factor
Parte del objetivo del ANOVA consiste en determinar si las diferencias entre las medias
muestrales son las que se esperan debido solo a la variación aleatoria o se trata de una
variación más allá de los efectos del azar.
La asignación aleatoria de las unidades experimentales elimina el sesgo que puede
originarse con una asignación sistemática. El objetivo es distribuir en forma uniforme entre
los niveles de los factores los riegos que introduce la heterogeneidad de las unidades
experimentales.
Modelo de ANOVA para un solo factor
Cada observación puede escribirse en la forma 𝑌𝑖𝑗 = 𝜇𝑖 + 𝜖𝑖𝑗 , donde 𝜖𝑖𝑗 , mide la desviación
que tiene la observación j-ésima de la i-ésima muestra, con respecto de la media del
tratamiento correspondiente (i-esimo). El termino 𝜖𝑖𝑗 representa el error aleatorio.
Procedimiento de ANOVA
La base de un ANOVA es calcular la media de cada uno de los grupos para, a continuación,
comparar la varianza de estas medias (varianza explicada por la variable grupo,
intervarianza) frente a la varianza promedio dentro de los grupos (la no explicada por la
variable grupo, intravarianza). Asumiendo que las observaciones, de los distintos grupos,
proceden toda la misma población (tienen la misma media y varianza), la varianza ponderada
entre grupos será la misma que la varianza promedio dentro de los grupos. Conforme las
medias de los grupos estén más alejadas las unas de las otras, la varianza entre medias se
incrementará y dejará de ser igual a la varianza promedio dentro de los grupos.
La prueba se basa en una comparación de dos estimados independientes de la varianza
poblacional común 𝜎 2 . Estos estimadores se obtienen haciendo la partición de la variabilidad
total de los datos en dos componentes, según la formula:
3
Identificaremos los términos con la siguiente notación:
La identidad de la suma de los cuadros se puede representar simbólicamente con la
ecuación 𝑆𝑇𝐶 = 𝑆𝐶𝑇 + 𝑆𝐶𝐸.
Esta igualdad expresa como las variaciones, entre los tratamientos y dentro de los
tratamientos, contribuyen a la suma total de cuadrados.
La comparación 𝑆𝐶𝑇 con la 𝑆𝐶𝐸 nos permite estudiar si el tratamiento es, o no, es efectivo.
Para hacer esta comparación cada una de estas sumas de cuadrados se dividen entre sus
grados de libertad obteniéndose unos estadísticos que se conocen como cuadrados medios.
𝑆𝐶𝑇
𝑠12 = = 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
𝑘−1
𝑆𝐶𝐸
𝑠2 = = 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠
𝑘(𝑛 − 1)
Donde n es el número total de datos y k es el número de tratamientos.
Así que el 𝑆𝑇𝐶 es la varianza de los datos observados y el 𝑆𝐶𝐸 es una estimación de la
varianza de las poblaciones muestreadas. Si el efecto no existe en la población el 𝑆𝑇𝐶 es
otra estimación de la variable independiente. Si existe un efecto real poblacional tiende a ser
mayor que la varianza.
4
𝑠12
El valor 2 es el valor F calculado del ANOVA que tiene una distribución F, entonces lo
𝑠
calcularemos con el valor f tabulado con un nivel de significancia ∝ dado y grados de libertad
𝑣1 = 𝑘 − 1 𝑦 𝑣2 = 𝑘(𝑛 − 1).
Cuanto más difieran las medias de los grupos mayor será la varianza entre medias
(intervarianza) en comparación al promedio de la varianza dentro de los
grupos(intravarianza), obteniéndose valores de F superiores a 1 y por lo tanto menor la
probabilidad de que la distribución adquiera valores tan extremos (menor al valor-p).
Los cálculos para un problema de ANOVA por lo general se resumen en una tabla como la
siguiente:
ANOVA de un solo factor
Tabla 1
Problema (Comparación con respecto a la resistencia a la tensión de seis maquinas
diferentes)
Se están considerando seis máquinas diferentes para la fabricación de sellos de goma y se
están comparando con respecto a la resistencia a la tensión del producto. Se utiliza una
muestra aleatoria de cuatro sellos hechos con cada máquina para determinar si la resistencia
media a la tensión varía de una máquina a otra. A continuación, se presentan las medidas de
la resistencia a la tensión en kilogramos por centímetro cuadrado ×10−1 :
Máquina
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 18.9 18.9 20.5 20.1
5
Realice el análisis de varianza a un nivel de significancia de 0.05 e indique si la resistencia
promedio a la tensión de las seis máquinas difiere o no de manera significativa.
Solución: Consideremos Ho = µ1 = µ2 = µ3 = µ4 = µ5 = µ6 y H1 = Al menos dos de las medias
no son iguales. Después de realizar las operaciones correspondientes, obtenemos:
Máquina
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 18.9 18.9 20.5 20.1
Suma(xi.)= 68.8 68.7 72.7 71 73.7 72.1
Media= 17.2 17.175 18.175 17.75 18.425 18.025
Suma total(x..)= 427
ni= 4 4 4 4 4 4
N= 24 k= 6
SCT= 5.338333
STC= 67.97833
SCE= 62.64
Tabla ANOVA
Fuente de variación Suma de Grados de Cuadrado F
cuadrados libertad medio
Entre las muestras 5.3383333 5 1.0676667 0.306800766
Dentro de las muestras 62.6 18 3.48
Total 68.0 23
(Valor crítico) Fα,k-1,N-k = 2.772853153
p-valor= 0.902420515
6
Conclusión
En el ejercicio realizado en este trabajo estudiamos el efecto del factor ´´maquinas´´, con seis
niveles (las maquinas a comparar), sobre la media de la variable respuesta: resistencia a la
tensión de sellos de goma.
Como se pudo apreciar en las últimas dos tablas, el valor de F = 0,30 es menor que el valor
critico de F = 2,77 y por lo tanto la hipótesis H 0 es verdadera, lo que implica que la
resistencia media a la tensión de las maquinas no varían significativamente. Como pudimos
ver, el análisis de varianza (ANOVA) es una herramienta estadística poderosa y ampliamente
utilizada para comparar las medias de tres o más grupos. Permite determinar si existe una
diferencia significativa entre las medias de los grupos y, en caso afirmativo, identificar cuáles
grupos son significativamente diferentes entre sí. Además, el ANOVA proporciona
información valiosa para la toma de decisiones y la interpretación de resultados en diversos
campos como la investigación científica, la industria y la medicina.
Al utilizar el ANOVA, los investigadores pueden obtener información valiosa sobre la
influencia de diferentes variables independientes en las medias de los grupos, lo que les
permite tomar decisiones fundamentadas y realizar interpretaciones significativas de los
resultados. Además, el ANOVA proporciona una forma sistemática de controlar y analizar la
variabilidad dentro y entre los grupos, lo que ayuda a comprender mejor las relaciones
subyacentes entre las variables y, a identificar patrones significativos.
En resumen, el método ANOVA es una herramienta estadística esencial que permite a los
investigadores realizar comparaciones significativas entre múltiples grupos, proporcionando
información crítica para la toma de decisiones informadas y la interpretación precisa de los
resultados en una variedad de contextos de investigación y aplicaciones prácticas.
7
Bibliografía
Devore. J. L. (2018). Probabilidad y estadística para ingeniería y ciencias. Cengage Learning.
Ronald E. Walpole, Raymond H. Myers, Sharon Myers, Keying Y. Probabilidad y estadística
para ingeniería y ciencias, novena edición. 2012.
Suitberto, C. G. (23 de febrero de 2022). ANOVA. Análisis de la varianza con un factor.
Recuperado el 19 de julio de 2024, de Youtube: [Link]
Estadistico, E. T. (6 de octubre de 2021). Análisis de Varianza ANOVA. Recuperado el 20 de
julio de 2024, de Youtube: [Link]