FACULTAD CIENCIAS ADMINISTRATIVAS, CONTABLES Y
COMERCIO
CARRERA DE MERCADOTECNIA
TITULO:
ANÁLISIS DE VARIANZA DE DOS FACTORES
AUTORES:
TORRES LLIVIPUMA PATRICIA NOEMI
VERA LOOR JOSELIN ANDREA
PONCE BASURTO JOHAN GEOVANNY
BRAVO VELEZ JHON BRANDON
SOLORZANO FIGUEROA GENDRY ARIEL
GRUPO #4
MATERIA:
ESTADÍSTICA
CURSO
3RO "B”
PERIODO LECTIVO
2024 (1)
MANTA – MANABÍ – ECUADOR
ANÁLISIS DE LA VARIANZA
Como parte introductoria del tema del Análisis de Varianza de dos vías primero
tenemos que conocer conceptos claves en el libro de Estadística aplicada a los Negocios
y Economía, como La distribución F y La prueba ANOVA que según (LIND, MARSHAL,
WATHEN, 2012) Es una variación de la técnica de la varianza en el uso de la distribución
F, aquí se comparan tres o más medias poblacionales para determinar si pueden ser iguales.
Para usar ANOVA se supone: Las poblaciones siguen en distribución normal, tienes
desviaciones estándares iguales y son independientes.
En la prueba ANOVA la estrategia es estimar la varianza de la población
(desviación estándar al cuadrado) de dos formas para después determinar la razón de
dichas estimaciones. Si esta razón es aproximadamente 1, entonces por lógica las dos
estimaciones son iguales, y se concluye que las medias poblacionales no son iguales. La
distribución F sirve como un árbitro para indicar en qué instancia la razón de las varianzas
muestrales es mucho mayor que 1 para haber ocurrido por casualidad.
ANÁLISIS DE LA VARIANZA DE DOS VÍAS
El beneficio al considerar otros factores es que se reduce la varianza del error. Es
decir, si se reduce el denominador del estadístico F (al reducir la varianza del error o, de
manera más directa, el término SSE), el valor de F será mayor, lo que ocasionará el
rechazo de la hipótesis del tratamiento de medias iguales. En otras palabras, si se puede
explicar más la variación, habrá menos “error”. Un ejemplo aclarará la reducción de la
varianza del error.
Un ejercicio del libro que estamos estudiando.
El director de WARTA, Warren Area Transit Authority, considera ampliar el
servicio de autobuses del suburbio de Starbrick al distrito comercial central de Warren.
Se consideran cuatro rutas de Starbrick al centro de Warren: 1) por la carretera 6, 2) por
el West End, 3) por Hickory Street Bridge, y 4) por la ruta 59. El director realizó varias
pruebas para determinar si había una diferencia entre los tiempos de recorrido medios por
las cuatro rutas. Como habrá muchos conductores distintos, la prueba se diseñó para que
cada conductor manejara a lo largo de todas ellas. A continuación, se presenta el tiempo
del recorrido, en minutos, de cada combinación conductor ruta.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 430. (LIND,
MARSHAL, WATHEN, 2012)
A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de
recorrido medios a lo largo de las cuatro rutas? Si elimina el efecto de los conductores,
¿hay alguna diferencia entre los tiempos de recorrido medios?
Para iniciar, realice una prueba de hipótesis con ANOVA de una vía. Es decir, sólo
considere las cuatro rutas. Con esta condición, la variación entre los tiempos del recorrido
se debe a los tratamientos o es aleatoria. La hipótesis nula y la alternativa para comparar
los tiempos de recorrido medios por las cuatro rutas son:
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 430. (LIND,
MARSHAL, WATHEN, 2012)
Hay cuatro rutas, por lo cual los grados de libertad del numerador son k - 1 = 4 -
1 = 3. Hay 20 observaciones. Por consiguiente, los grados de libertad del denominador
son n - k = 20 - 4 - 16. Del apéndice B.4, con el nivel de significancia de 0.05, el valor
crítico de F es 3.24. La regla de decisión es rechazar la hipótesis nula si el valor calculado
de F es mayor que 3.24.
Para realizar los cálculos emplee Excel. El valor calculado de F es 2.482, por lo
que la decisión es no rechazar la hipótesis nula. Concluye que no hay una diferencia entre
los tiempos de recorrido medios a lo largo de las cuatro rutas. No hay una razón para
seleccionar una de las rutas como más rápida que las demás.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 431. (LIND,
MARSHAL, WATHEN, 2012)
De la captura de pantalla de Excel anterior, los tiempos de recorrido medios a lo
largo de las rutas fueron: 20.6 minutos por la carretera 6, 21.4 minutos por la West End,
25.4 minutos por Hickory Street y 23.8 minutos por la ruta 59. Se concluye que es
razonable atribuir estas diferencias a la casualidad. De la tabla ANOVA se observa que:
SST es 72.8, SSE es 156.4 y SS total es 229.2.
En el ejemplo anterior se consideró la variación debida a los tratamientos (rutas)
y se tomó toda variación restante como aleatoria. Si se pudiera considerar el efecto de los
diversos conductores, se podría reducir el término SSE, lo cual generaría un valor mayor
de F. A la segunda variable de tratamiento, en este caso los conductores, se le conoce
como variable de bloqueo.
La VARIABLE DE BLOQUEO “Una segunda variable de tratamiento que,
cuando se incluye en el análisis ANOVA, tendrá el efecto de reducir el término SSE.”
(LIND, MARSHAL, WATHEN, 2012)
En este caso, los conductores son la variable de bloqueo, y al eliminar el efecto de
los conductores del término SSE cambiará la razón F de la variable de tratamiento.
Primero, es necesario determinar la suma de los cuadrados debida a los bloques.
En una ANOVA de dos vías, la suma de los cuadrados debida a los bloques se
determina mediante la siguiente fórmula.
donde:
k es el número de tratamientos.
b es el número de bloqueos.
es la media muestral del bloque b.
es la media global o total.
A partir de los siguientes cálculos, las medias de los conductores respectivos son
19.5 minutos, 21 minutos, 22.5 minutos, 24.75 minutos y 26.25 minutos. La media global
es 22.8 minutos, determinada por la suma del tiempo de recorrido de los 20 conductores
(456 minutos) y su división entre 20.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 432. (LIND,
MARSHAL, WATHEN, 2012)
Al sustituir esta información en la fórmula (12.6), se determina SSB, y la suma de
los cuadrados debida a los conductores (la variable de bloqueo) es 119.7.
Se utiliza el mismo formato en la tabla ANOVA de dos vías, como en el caso de
una vía, excepto que hay una fila adicional para la variable de bloqueo. SS total y SST se
calculan como se hizo antes, y SSB se determina con la fórmula (12-6). El término SSE
se calcula mediante una resta.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 432. (LIND, MARSHAL,
WATHEN, 2012)
Los valores de los varios componentes de la tabla ANOVA se calculan como sigue.
Imagenes obtenida de la bibliografía asignada, Capítulo 12. Página 433. (LIND,
MARSHAL, WATHEN, 2012)
En este punto hay un desacuerdo. Si el objetivo de la variable de bloqueo (los
conductores en este ejemplo) fue sólo reducir la variación del error, no se debe realizar
una prueba de hipótesis de las diferencias entre las medias de los bloques. Es decir, si el
objetivo era reducir el término MSE, no se debe probar una hipótesis respecto de la
variable de bloqueo. Por otro lado, quizá se desee dar a los bloques la misma condición
que a los tratamientos y realizar una prueba de hipótesis. Este último caso, cuando los
bloques son lo bastante importantes para considerarse un segundo factor, se conoce como
un experimento de dos factores. En muchos casos, la decisión no es clara. En este ejemplo
lo importante es la diferencia entre los
tiempos de recorrido de los diversos conductores, por lo que se realizará la prueba
de hipótesis. Los dos conjuntos de hipótesis son:
Primero se pondrá a prueba la hipótesis respecto de las medias de tratamiento. Hay
k – 1=4 – 1= 3 grados de libertad en el numerador y (b – 1)(k – 1) = (5 – 1)(4 – 1) = 12
grados de libertad en el denominador. Con el nivel de significancia de 0.05, el valor crítico
de F es 3.49. La hipótesis nula de que los tiempos medios para las cuatro rutas son iguales
se rechaza si la razón F es mayor que 3.49.
La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que
el tiempo de recorrido medio no es el mismo para todas las rutas. Sería recomendable que
WARTA realizara algunas pruebas para determinar cuáles medias de tratamiento difieren.
En seguida se prueba si el tiempo de recorrido es el mismo para los diversos
conductores. Los grados de libertad en el numerador para los bloques son b - 1 = 5 - 1 =4.
Los grados de libertad para el denominador son los mismos que antes: (b - 1) (k - 1) = (5
- 1) (4 - 1) =12. La hipótesis nula de que las medias de los bloques son iguales se rechaza
si la razón F es mayor que 3.26.
Se rechaza la hipótesis nula y se acepta la hipótesis alternativa. El tiempo medio
no es el mismo para los conductores. Así, la gerencia de WARTA puede concluir, con base
en los resultados de la muestra, que hay una diferencia en las rutas y en los conductores.
Bibliografía
LIND, MARSHAL, WATHEN. (2012). ANÁLISIS DE VARIANZA. En M. W. LIND,
Estadística Aplicada a los Negocios y la economía (págs. 411-460). Mc Grew
Hill.