0% encontró este documento útil (0 votos)
28 vistas7 páginas

Análisis de Varianza de Dos Factores

Cargado por

BrandonBv
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas7 páginas

Análisis de Varianza de Dos Factores

Cargado por

BrandonBv
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

FACULTAD CIENCIAS ADMINISTRATIVAS, CONTABLES Y

COMERCIO

CARRERA DE MERCADOTECNIA

TITULO:

ANÁLISIS DE VARIANZA DE DOS FACTORES

AUTORES:

TORRES LLIVIPUMA PATRICIA NOEMI

VERA LOOR JOSELIN ANDREA

PONCE BASURTO JOHAN GEOVANNY

BRAVO VELEZ JHON BRANDON


SOLORZANO FIGUEROA GENDRY ARIEL

GRUPO #4

MATERIA:

ESTADÍSTICA

CURSO

3RO "B”

PERIODO LECTIVO

2024 (1)

MANTA – MANABÍ – ECUADOR


ANÁLISIS DE LA VARIANZA

Como parte introductoria del tema del Análisis de Varianza de dos vías primero
tenemos que conocer conceptos claves en el libro de Estadística aplicada a los Negocios
y Economía, como La distribución F y La prueba ANOVA que según (LIND, MARSHAL,
WATHEN, 2012) Es una variación de la técnica de la varianza en el uso de la distribución
F, aquí se comparan tres o más medias poblacionales para determinar si pueden ser iguales.
Para usar ANOVA se supone: Las poblaciones siguen en distribución normal, tienes
desviaciones estándares iguales y son independientes.

En la prueba ANOVA la estrategia es estimar la varianza de la población


(desviación estándar al cuadrado) de dos formas para después determinar la razón de
dichas estimaciones. Si esta razón es aproximadamente 1, entonces por lógica las dos
estimaciones son iguales, y se concluye que las medias poblacionales no son iguales. La
distribución F sirve como un árbitro para indicar en qué instancia la razón de las varianzas
muestrales es mucho mayor que 1 para haber ocurrido por casualidad.

ANÁLISIS DE LA VARIANZA DE DOS VÍAS

El beneficio al considerar otros factores es que se reduce la varianza del error. Es


decir, si se reduce el denominador del estadístico F (al reducir la varianza del error o, de
manera más directa, el término SSE), el valor de F será mayor, lo que ocasionará el
rechazo de la hipótesis del tratamiento de medias iguales. En otras palabras, si se puede
explicar más la variación, habrá menos “error”. Un ejemplo aclarará la reducción de la
varianza del error.
Un ejercicio del libro que estamos estudiando.

El director de WARTA, Warren Area Transit Authority, considera ampliar el


servicio de autobuses del suburbio de Starbrick al distrito comercial central de Warren.
Se consideran cuatro rutas de Starbrick al centro de Warren: 1) por la carretera 6, 2) por
el West End, 3) por Hickory Street Bridge, y 4) por la ruta 59. El director realizó varias
pruebas para determinar si había una diferencia entre los tiempos de recorrido medios por
las cuatro rutas. Como habrá muchos conductores distintos, la prueba se diseñó para que
cada conductor manejara a lo largo de todas ellas. A continuación, se presenta el tiempo
del recorrido, en minutos, de cada combinación conductor ruta.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 430. (LIND,
MARSHAL, WATHEN, 2012)

A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de


recorrido medios a lo largo de las cuatro rutas? Si elimina el efecto de los conductores,
¿hay alguna diferencia entre los tiempos de recorrido medios?

Para iniciar, realice una prueba de hipótesis con ANOVA de una vía. Es decir, sólo
considere las cuatro rutas. Con esta condición, la variación entre los tiempos del recorrido
se debe a los tratamientos o es aleatoria. La hipótesis nula y la alternativa para comparar
los tiempos de recorrido medios por las cuatro rutas son:

Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 430. (LIND,


MARSHAL, WATHEN, 2012)
Hay cuatro rutas, por lo cual los grados de libertad del numerador son k - 1 = 4 -
1 = 3. Hay 20 observaciones. Por consiguiente, los grados de libertad del denominador
son n - k = 20 - 4 - 16. Del apéndice B.4, con el nivel de significancia de 0.05, el valor
crítico de F es 3.24. La regla de decisión es rechazar la hipótesis nula si el valor calculado
de F es mayor que 3.24.

Para realizar los cálculos emplee Excel. El valor calculado de F es 2.482, por lo
que la decisión es no rechazar la hipótesis nula. Concluye que no hay una diferencia entre
los tiempos de recorrido medios a lo largo de las cuatro rutas. No hay una razón para
seleccionar una de las rutas como más rápida que las demás.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 431. (LIND,
MARSHAL, WATHEN, 2012)
De la captura de pantalla de Excel anterior, los tiempos de recorrido medios a lo
largo de las rutas fueron: 20.6 minutos por la carretera 6, 21.4 minutos por la West End,
25.4 minutos por Hickory Street y 23.8 minutos por la ruta 59. Se concluye que es
razonable atribuir estas diferencias a la casualidad. De la tabla ANOVA se observa que:
SST es 72.8, SSE es 156.4 y SS total es 229.2.

En el ejemplo anterior se consideró la variación debida a los tratamientos (rutas)


y se tomó toda variación restante como aleatoria. Si se pudiera considerar el efecto de los
diversos conductores, se podría reducir el término SSE, lo cual generaría un valor mayor
de F. A la segunda variable de tratamiento, en este caso los conductores, se le conoce
como variable de bloqueo.

La VARIABLE DE BLOQUEO “Una segunda variable de tratamiento que,


cuando se incluye en el análisis ANOVA, tendrá el efecto de reducir el término SSE.”
(LIND, MARSHAL, WATHEN, 2012)

En este caso, los conductores son la variable de bloqueo, y al eliminar el efecto de


los conductores del término SSE cambiará la razón F de la variable de tratamiento.
Primero, es necesario determinar la suma de los cuadrados debida a los bloques.

En una ANOVA de dos vías, la suma de los cuadrados debida a los bloques se
determina mediante la siguiente fórmula.
donde:

k es el número de tratamientos.

b es el número de bloqueos.

es la media muestral del bloque b.

es la media global o total.

A partir de los siguientes cálculos, las medias de los conductores respectivos son
19.5 minutos, 21 minutos, 22.5 minutos, 24.75 minutos y 26.25 minutos. La media global
es 22.8 minutos, determinada por la suma del tiempo de recorrido de los 20 conductores
(456 minutos) y su división entre 20.

Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 432. (LIND,


MARSHAL, WATHEN, 2012)
Al sustituir esta información en la fórmula (12.6), se determina SSB, y la suma de
los cuadrados debida a los conductores (la variable de bloqueo) es 119.7.

Se utiliza el mismo formato en la tabla ANOVA de dos vías, como en el caso de


una vía, excepto que hay una fila adicional para la variable de bloqueo. SS total y SST se
calculan como se hizo antes, y SSB se determina con la fórmula (12-6). El término SSE
se calcula mediante una resta.
Imagen obtenida de la bibliografía asignada, Capítulo 12. Página 432. (LIND, MARSHAL,
WATHEN, 2012)

Los valores de los varios componentes de la tabla ANOVA se calculan como sigue.

Imagenes obtenida de la bibliografía asignada, Capítulo 12. Página 433. (LIND,


MARSHAL, WATHEN, 2012)
En este punto hay un desacuerdo. Si el objetivo de la variable de bloqueo (los
conductores en este ejemplo) fue sólo reducir la variación del error, no se debe realizar
una prueba de hipótesis de las diferencias entre las medias de los bloques. Es decir, si el
objetivo era reducir el término MSE, no se debe probar una hipótesis respecto de la
variable de bloqueo. Por otro lado, quizá se desee dar a los bloques la misma condición
que a los tratamientos y realizar una prueba de hipótesis. Este último caso, cuando los
bloques son lo bastante importantes para considerarse un segundo factor, se conoce como
un experimento de dos factores. En muchos casos, la decisión no es clara. En este ejemplo
lo importante es la diferencia entre los

tiempos de recorrido de los diversos conductores, por lo que se realizará la prueba


de hipótesis. Los dos conjuntos de hipótesis son:
Primero se pondrá a prueba la hipótesis respecto de las medias de tratamiento. Hay
k – 1=4 – 1= 3 grados de libertad en el numerador y (b – 1)(k – 1) = (5 – 1)(4 – 1) = 12
grados de libertad en el denominador. Con el nivel de significancia de 0.05, el valor crítico
de F es 3.49. La hipótesis nula de que los tiempos medios para las cuatro rutas son iguales
se rechaza si la razón F es mayor que 3.49.

La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que


el tiempo de recorrido medio no es el mismo para todas las rutas. Sería recomendable que
WARTA realizara algunas pruebas para determinar cuáles medias de tratamiento difieren.

En seguida se prueba si el tiempo de recorrido es el mismo para los diversos


conductores. Los grados de libertad en el numerador para los bloques son b - 1 = 5 - 1 =4.
Los grados de libertad para el denominador son los mismos que antes: (b - 1) (k - 1) = (5
- 1) (4 - 1) =12. La hipótesis nula de que las medias de los bloques son iguales se rechaza
si la razón F es mayor que 3.26.

Se rechaza la hipótesis nula y se acepta la hipótesis alternativa. El tiempo medio


no es el mismo para los conductores. Así, la gerencia de WARTA puede concluir, con base
en los resultados de la muestra, que hay una diferencia en las rutas y en los conductores.

Bibliografía

LIND, MARSHAL, WATHEN. (2012). ANÁLISIS DE VARIANZA. En M. W. LIND,

Estadística Aplicada a los Negocios y la economía (págs. 411-460). Mc Grew

Hill.

También podría gustarte