Unidad 2: ANOVA de un factor
Tema: ANOVA de un factor
Bibliografía:
Montgomery, D. y Runger, G. (2005) Probabilidad y estadística aplicadas a la ingeniería. México,
D.F.: Limusa Wiley. Capítulo 12. Sección 12.1 y 12.4
Triola, M. (2013). Estadística. 11va. Edición. Pearson Educación, México, D.F. Capítulo 12. Sección
12.1 y 12.2.
Después de la revisión de la infografía
Actividad estudiante con profesor
Análisis de varianza (Anva o Anova)
Método de prueba de igualdad de tres o más medias poblacionales, por medio del análisis de las
varianzas muestrales. El análisis de varianza de un factor se utiliza con datos clasificados con base en
un tratamiento (o factor), que es una característica que nos permite distinguir entre sí a las distintas
poblaciones. (Triola, 2013, p.629)
Planteamiento de hipótesis
No hay diferencia en las El factor en estudio no afecta a
H0 : µ1 = µ 2 =… = µ k
medias poblacionales la variable respuesta
Al menos un µi es Hay diferencia en al menos El factor en estudio afecta a la
H1 :
diferente una media poblacional variable respuesta
Supuestos del modelo DCA
En el análisis de varianza del modelo simple o de un factor, se supone que las observaciones siguen una
distribución normal e independiente con la misma varianza para cada tratamiento o nivel de factor.
Estos supuestos deberán verificarse examinando los residuales.
(Montgomery, 2003, p.576)
Estadístico de prueba
CM(Tr)
F calculado =
CME
Para obtener el valor del estadístico de prueba, se debe elaborar la tabla del Anova:
32
Fuente de
Grados de libertad Suma de cuadrados Cuadrado medio F Calculado F Crítico
variación
k
y2i. y 2.. SC ( Tr )
Tratamientos k–1 SC ( Tr ) = ∑ - CM ( Tr ) =
i=1 ni n . k-1
SCE CM ( Tr )
Error n. – k SCE = SCT - SC(Tr) CME = F = F( α, k-1, n -k )
n. -k CME .
k n 2
2 y ..
n. – 1
Total k SC ( Tr ) = ∑ ∑ y ij -
donde ( n. = Σ i=1 n i ) i=1 j=1 n.
Criterio de decisión (Región critica)
Criterio basado en Fcal y Fcrítico
Punto crítico:
F (, grado de libertad Tratamiento, grado de libertad Error)
Decisión
Si Fcal > F (, gl Tratamiento, gl error) entonces sí se Rechaza H0
Si Fcal ≤ F (, gl Tratamiento, gl error) entonces no se Rechaza H0
Criterio basado en el valor p (aplica para cualquier tipo de hipótesis):
Si valor p ≤ ⍺ entonces sí se rechaza Ho
Si valor p > ⍺ entonces no se rechaza Ho
Comparación Múltiples:
Los métodos de comparación múltiple son los procedimientos usados para comparar las medias de
tratamientos individuales en el análisis de varianza.
(Montgomery, 2003, p.581)
Prueba de Tukey HSD
Se usará esta prueba para evaluar si existen diferencias significativas entre las medias de cada “par de
tratamientos”.
, Ϭ͗ࣆ ൌ ࣆ
, ϭ͗ࣆ ് ࣆ Para todo i ≠ j
n= número de observaciones por tratamiento
k= número de tratamientos
CME
HSD = qα ( k, n - k )
√
nk
q = es un multiplicador (Tabla de Tukey)
CME = cuadrado medio del error
nk = tamaño de muestra de los grupos (si no es un modelo
Cuando se realiza el análisis con labalanceado se usa el promedio armónico.
probabilidad:
o Si valor p ≤ α Se Rechaza H0 (Existen diferencias significativas)
o Si valor p > α No se Rechaza H0 (No Existen diferencias significativas)
Cuando se realiza el análisis con intervalos: 33
o Si: µi - µj IC(µi - µj)=[LI, LS] =[- , -] µi - µj < 0 µi < µj
De la teoría a la práctica, aprendamos a calcular el
ANOVA
Actividad estudiante con profesor
En la siguiente tabla se presentan las mediciones de desaceleración (en fuerza de gravedad g) de tres
tamaños de automóviles. Los valores más grandes indican mayores cantidades de desaceleración ante un
choque frontal, las cuales suelen provocar lesiones graves en los conductores. Con dicha información calcule
la tabla de ANOVA:
Automóviles compactos 44 43 44 54 38 43 42 45 44 50
Automóviles medianos 41 49 43 41 47 42 37 43 44 34
Automóviles grandes 32 37 38 45 37 33 38 45 43 42
A un nivel de significación del 1%, se quiere probar si existen diferencias en las mediciones de
desaceleración (en g) en pruebas de choque de los tres tipos de automóviles.
Y.. = 1258 ∑ ∑ Y2ij =53452
Factor en estudio Tamaño de automóviles
Tratamientos A. compactos, A. medianos, A. grandes
Variable respuesta Desaceleración (en fuerza de gravedad g)
Unidad experimental Un automóvil
Hipótesis nula
Ho: µC = µM = µG (V)
El tamaño del automóvil no afecta en la desaceleración
Hipótesis alternativa
H1: Al menos un µi es diferente (F)
El tamaño del automóvil afecta en la desaceleración
Cálculo del estadístico de prueba:
Fuente de Grados de Suma de Cuadrado Fcrítico =
F calc p-valor
variación libertad (gl) Cuadrados (SC) medio (SC/gl) F(0.01,2,27)
Tratamientos 2 162.867 81.433 4.094 5.49 0.028
Error 27 537.00 19.889
Total 29 699.867
Gráfica de distribución
F, df1=4, df2=20
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 2.866
X
4.094 5.49
Decisión estadística:
Criterio basado en Fcal y Fcrítico
34
Como Fcal = 4.09 < 5.49 = F crítico entonces no se rechaza Ho
Criterio basado en el valor p (aplica para cualquier tipo de hipótesis):
Como p-valor = 0.028 > 0.01 = alfa entonces no se rechaza Ho
Conclusión estadística: Al 1% de nivel de significancia, la evidencia muestral es INSUFICIENTE para
afirmar el tamaño del automóvil afecta en la desaceleración. (NO ES NECESARIO HACER
COMPARACIONES MÚLTIPLES)
Actividad grupal de los estudiantes
Caso: Resistencia a la tensión de una fibra sintética
El ingeniero de desarrollo de productos desea investigar si el porcentaje de algodón que se incorpora en la
producción de cierta fibra sintética influye en la resistencia a la tensión (lb/pulgada2) de las prendas que se
confeccionan con dicha fibra.
Para tal fin, decide evaluar cinco diferentes niveles de peso porcentual de algodón, estos son: 15%, 20%,
25%, 30% y 35%; donde medirá la resistencia a la tensión en los ejemplares de la fibra sintética. Los datos de
25 prendas se muestran a continuación:
15% 20% 25% 30% 35%
7 12 20 19 7
7 13 18 25 10
15 15 18 22 11
11 14 19 19 9
9 14 19 23 11
A un nivel de significación del 5%, el ingeniero considera que a mayor peso porcentual de algodón mayor
será la resistencia de la fibra. Según el análisis realizado, ¿Qué peso porcentual de algodón sugiere utilizar?
Pregunta 1: Completar los siguientes elementos del experimento:
Factor en estudio Peso porcentual de algodón
Tratamientos 15%, 20%, 25%, 30%, 35%
Variable respuesta Resistencia a la tensión (lb/pulgada2)
Unidad experimental Una prenda
El peso porcentual de algodón afecta a la
Hipótesis alternativa (H1)
resistencia a la tensión (lb/pulgada2)
Ho: El peso porcentual del algodón no afecta a la resistencia a la tensión
H1: El peso porcentual del algodón afecta a la resistencia a la tensión
Pregunta 2: Completar la siguiente tabla de Análisis de Varianza:
Fuente de Grados de Suma de Cuadrado
F calc
variación libertad cuadrados medio
35
Tratamientos 4 578.24 144.56
Error 20 91.20 4.56 31.7018
Total 24 669.44
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
PORCENTAJE 4 578.24 144.560 31.7018 0.000
Error 20 91.20 4.560
Total 24 669.44
Pregunta 3: Completar la siguiente la siguiente gráfica e indique la decisión:
Gráfica de distribución
F, df1=4, df2=20
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 2.866
X
31.7018
Fcalc = 31.7018 Fcritico ( 0.05; 4; 20) = 2.8661
Valor P = 0 < 0.05
Se rechaza Ho
Al 5% de significación se puede afirmar que El porcentaje de algodón afecta la resistencia
promedio a la tensión en las prendas es diferente en algún porcentaje de algodón.
Actividad estudiante con profesor
Verificar los supuestos:
PRUEBA DE NORMALIDAD DE ERRORES
Ho: Los errores tienes distribución normal
H1: Los errores no tienen distribución normal
36
Prueba estadística de Anderson Darling = AD = 0.571
Valor p= 0.124 > 0.05
Decisión: No se rechaza Ho
Conclusión: Al 5% de significación se ASUME que los errores tienes distribución normal
PRUEBA DE HOMOGENEIDAD DE VARIANZAS
Pruebas
Estadística
Método de prueba Valor p
Comparaciones múltiples — 0.138
Levene 1.6667 0.197
Ho: las varianzas son homogéneas en los tres tratamientos
H1: Al menos una varianza es diferente en uno de los tres tratamientos
Prueba estadística de Levene = 1.6667
Valor p= 0.197 > 0.05
Decisión: No se rechaza Ho
Conclusión: Al 5% de significación se ASUME que las varianzas son homogéneas en los tres
tratamientos
¿Qué peso porcentual de algodón sugiere utilizar? LA PRUEBA RESULTÓ SIGNIFICATIVA, DEBEMOS
USAR LA PRUEBA DE TUKEY
El siguiente reporte proviene del programa estadístico MINITAB:
Comparaciones por parejas de Tukey: Nivel Peso%
Agrupar información utilizando el método de Tukey y una confianza de 95%
Nivel
Peso% N Media Agrupación
30.00% 5 21.6 A
25.00% 5 18.8 A
20.00% 5 13.6 B
15.00% 5 9.8 B
35.00% 5 9.6 B
Las medias que no comparten una letra son significativamente diferentes.
ANALISIS
ORDENAR DE MENOR A MAYOR LOS PROMEDIOS
µ35% µ15% µ20% µ25% µ30%
Argumentación
Se sugiere al ingeniero utilizar la resistencia de 25% o 30%, por tener mayores resistencias
promedio
37