0% encontró este documento útil (0 votos)
42 vistas24 páginas

ANOVA2

Cargado por

ana.amablec
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
42 vistas24 páginas

ANOVA2

Cargado por

ana.amablec
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

La técnica de análisis de varianza (ANOVA)

Desarrollada por Ronald Aylmer Fisher en 1930. Estadístico y biólogo.


Nació en Londres, 1980-1962.
En Rothamsted Research (estación agrícola) 1919 desarrolló ANOVA.
Contribuciones más importantes:

❑ El principio de Fisher: Modelo evolutivo de reproducción:


machos/hembras es 1:1.

❑ Hipótesis del hijo sexy: una hembra realiza su selección intersexual


entre potenciales parejas con genes que producirán descendientes con
las mejores posibilidades de tener éxito.

❑ La ecuación de Fisher, interpreta matemáticamente aspectos de


Dinámica Poblacional . Sinónimos: análisis factorial
ANOVA de un factor: Definición Es una técnica estadística que se utiliza para
comparar la media de tres o más grupos y determinar si existen diferencias
significativas entre ellas.
ANOVA ayuda a saber si hay una diferencia significativa en la media entre los
grupos que estás comparando o si cualquier diferencia que hayas observado se
debe simplemente al azar.

Qué mide el ANOVA de un factor?


El ANOVA de un factor mide los efectos medibles de las variaciones o diferentes
niveles de UNA ÚNICA VARIABLE INDEPENDIENTE sobre una VARIABLE
DEPENDIENTE.

Limitaciones de ANOVA

➢ Útil para investigar un solo factor y una sola variable dependiente.


➢ ANOVA puede demostrar estadísticamente que hay diferencias en por lo menos
una de las medias de tres o más grupos, pero no puede indicar qué par.
➢ Requiere que la variable dependiente esté distribuida de manera normal.
PRESUPUESTOS O REQUISITOS DE ANOVA
➢ Aleatoriedad de las muestras
Aleatoriedad significa que los elementos o unidades experimentales
son asignados de manera aleatoria .
➢ Independencia de las variables
Se refiere a que los resultados observados en un grupo (o tratamiento) no interfieren
en los resultados de otro grupo. El tamaño total de la muestra de cada grupo debe ser
< 10% de la población total a la que representa.
➢ Normalidad de las distribuciones (Prueba de normalidad de Shapiro-Wilk)
La variable de interés se distribuye conforme el modelo Normal en cada
grupo o tratamiento. Si la falta de Normalidad no es muy extrema puede mantenerse
como normal; si es extrema utilizar la Prueba No Paramétrica H de Kruskal-Wallis.
➢ Homocedasticidad de las varianzas (Prueba de Levine)
Las varianzas de los grupos son semejantes, es decir, la amplitud de la Campana de
Gauss es semejante, como se observa:
¿Qué otros supuestos tiene el test ANOVA?
La variable dependiente o respuesta debe ser continua (si es de intervalo, mejor).
▪ El tiempo de revisión (medido en horas)
▪ Inteligencia (medida mediante la puntuación de CI)
▪ Desempeño del examen (medido de 0 a 100)
▪ Peso (medido en kg), etc.

La variable independiente o explicativa.


Debe estar formada por tres o más grupos categóricos e independientes.
▪ La etnicidad (caucásico, afroamericano e hispano)
▪ El nivel de actividad física (sedentario, bajo, moderado y alto)
▪ La profesión (doctor, enfermera, dentista, terapeuta), etc.

Evitar tener valores atípicos (outliers) influyentes.


En un estudio IQ de 100 estudiantes, donde la puntuación media fue de 108 con sólo un sujeto obtuvo un valor
de 156, Los valores atípicos son simplemente valores dentro de sus datos que no siguen el patrón habitual (por
ejemplo,, que es muy inusual incluso en la bibliografía). El problema con los valores atípicos es que pueden
afectar el resultado del ANOVA, reduciendo la validez de sus resultados.

[Link]
¿Qué sucede si mis datos no cumplen estos supuestos?
El ANOVA de una vía se considera una prueba robusta frente a la
falta de normalidad, sin exceso; que la Campana de Gauss no sea
plana.
Dos alternativas:
(1)Transformar los datos para que la forma de la distribución sea normal
(2)Elegir una prueba no paramétrica que no supone normalidad.

Si no existe homogeneidad de variantes?


Podemos aplicar el ANOVA de Welch y una prueba de Games-Howell en
lugar de una prueba post hoc de Tukey. Otra alternativa es aplicar una
prueba no paramétrica.
La falta de independencia de los casos es la más grave. Deberíamos
pensar en otro tipo de prueba para hacer frente a este problema, por ejemplo
un diseño de medidas repetidas.
[Link]
¿Por qué hablamos de "una vía”? Y ¿Qué son los grupos o
niveles?
Una vía significa que tenemos una única variable explicativa o predictor, también
llamada variable independiente. Esta variable debe tener tres o más niveles o
categorí[Link] ejemplo, si queremos analizar el pH de distintas muestras de
jabón de bebé, la marca del jabón es nuestra variable independiente cuyos
niveles podrían ser Baño Dulces Sueños de Johnson’s Baby, Champú-Gel de
Weleda, Gel Champú de Suavinex y Babygel de Mustela Beb.

VI= [ClNa] en 03 marcas de


Shampooes.
Niveles o Categorías de VI:
a) Shampoo A
b) Shampoo B
c) Shampoo C

Shampoo A Shampoo B Shampoo C


DISEÑOS EQUILIBRADOS

En el libro Handbook of Biological Statistics se considera altamente


recomendable emplear diseños equilibrados. Siendo así, consideran
fiable el ANOVA siempre y cuando el número de observaciones por
grupo no sea menor de 10 y la desviación estándar no varíe más de 3
veces entre grupos. Para modelos no equilibrados recomiendan
examinar con detalle la homocedasticidad, si las varianzas de los
grupos no son muy semejantes es mejor emplear Welch’s ANOVA.
ANOVA : Enfoque estadístico matemático

El ANOVA de un factor es un método estadístico de Prueba de


Hipótesis:
(H0) de que tres o más medias poblacionales son iguales frente a la
hipótesis alternativa.
(Ha) de que al menos una de las medias es diferente. Usando la
notación formal de las hipótesis estadísticas con k medias,
escribiríamos:

Ho: µ1= µ2= µ3= µ4=……µk


Ha: No todas las medias son iguales o (Ha: µi ≠ µj para algún i ≠ j)

Aquí μi es la media del i-ésimo nivel del factor.


[Link]
Para qué se usa el Análisis de la Varianza (ANOVA)
[Link]ón de medias: El ANOVA se utiliza para comparar la media de tres o más
grupos y determinar si existen diferencias significativas entre ellas.

[Link] controlados: Se utiliza en experimentos controlados para analizar los


efectos de diferentes tratamientos o intervenciones en los resultados.

[Link]ón de mercados: Se usa en investigación de mercados para analizar la


preferencia de los consumidores por diferentes productos o servicios.

[Link] sociales: Para analizar la relación entre diferentes variables, como la edad, la
educación y los ingresos.

[Link]ón médica: El ANOVA se utiliza en investigación médica para analizar los


efectos de diferentes tratamientos en pacientes con una determinada enfermedad.
¿En práctica cuando necesitaría determinar si las medias de múltiples
poblaciones son iguales o diferentes?
Cuando se sospecha que una variable independiente (VI) de un proceso sea un factor
determinante para un resultado (VD) importante de dicho proceso. Ejemplo: Se desea
COMPARAR LA EFECTIVIDAD en ventas de 04 promociones (1 cada mes) en 05
tiendas.
VARIABLE INDEPENDIENTE sería LA PROMOCIÓN y sus Niveles o Categorías:
(muestra gratis), (regalo de 01 paquete), (descuento), (reembolso en monedero
electrónico) [Variables Categóricas]

Promoción Cantidad de Ventas por Tienda


Tienda 1 Tienda 2 Tienda 3 Tienda 4 Tienda 5
Muestra gratis 78 87 81 89 85
Regalo 01 pqte. 94 91 87 90 88
Descuento 73 78 69 83 76
Reembolso 79 83 78 69 81
ANALISIS DE VARIANZA (ANOVA) CÁLCULO MANUAL PASO A PASO

Paso 1: Leer el enunciado del problema y


Diseñar el experimento con las muestras correspondientes.

Paso 2: Formular las Hipótesis Nula (Ho) e Hipótesis Alterna (Ha).


Paso 3: Formular la Regla de Decisión: Usar Tabla F, GL, α : hallar el F (crítico),
gráfico F.
Paso 4: Calcular: a) TSS o SCT (Total Sum of Squares o Suma de Cuadros Totales.
b) SCF o SCt o SST ( Suma de Cuadros del Factor o Tratamientos)
c) SCE o SCR o SSE ( Suma de Cuadros de Error o Residual)
Paso 5: Elaborar la Tabla ANOVA: reemplazar SCT, SCt, SCE, GL, calcular los CM y
Estadístico F.
Paso 6. Redactar la decisión
Paso 1: Leer el enunciado del problema y
Diseñar el experimento con las muestras correspondientes
Problema: Una empresa farmacéutica fabricante de un producto
ferroso (anti-anémico) consigna en el empaque del producto lo
siguiente: “Contenido aprox. 100 ml”. Recibe algunas observaciones
del ente Supervisor, que se han hallado varios frascos con
cantidades menores (no indican cuánto menos) a lo consignado en el
empaque. El gerente ordena un estudio para investigar el evento.
Los expertos proponen el siguiente plan: Escoger al azar 1 lote cada
semana por 3 semanas, total 03 lotes. De cada lote se escogerán
aleatoriamente 05 frascos y se medirán su contenido.
Paso 1: Leer el enunciado del problema y
Diseñar el experimento con las muestras correspondientes

Lote 1 Lote 2 Lote 3


Frasco 1 120 85 110
Frasco 2 110 88 70
Frasco 3 95 95 85
Frasco 4 90 100 85
Frasco 5 95 75 80
Paso 2: Formular las Hipótesis Nula (Ho) e Hipótesis Alterna (Ha).

Ho : El contenido de jarabe en todos los Lotes son iguales: µ1 = µ2=…µk.

H1: Por lo menos en una muestra el contenido es estadísticamente


diferente. µi ≠ µj
Paso 3: Formular la Regla de Decisión: Usar Tabla F, GL, α : hallar el F
(crítico), gráfico F.

Estadístico de Fisher : F
K = 3 (número de tratamientos)
N = 15 (tamaño de la muestra o nro
de elementos)
Nivel de significancia: α= 0,05

Notación: F (α; k – 1; N – k)
F ( 0,05; 3 – 1; 15 – 3)
F ( 0.05; 2; 12)

Zona de
REGLA DE DECISIÓN: Rechazo
Zona de No Rechazo
Si F ≥ Fc (F calculado), se ACEPTA Ho. de Ho
(aceptación de Ho)
Si F < Fc, se RECHAZA Ho.
F: 3,89
Paso 4: Calcular: a) TSS o SCT (Total Sum of Squares o Suma de Cuadros Totales.
b) SCF o SCt o SST ( Suma de Cuadros del Factor o Tratamientos)
c) SCE o SCR o SSE ( Suma de Cuadros de Error o Residual)

Lote 1 Lote 2 Lote 3 a) Calcular el TSS o SCT:


Frasco 1 120 85 110 Se define como la suma de los cuadrados de las diferencias
de cada observación respecto a la Gran Media de todas las
Frasco 2 110 88 70 observaciones. Los grados de libertad de la suma de
Frasco 3 95 95 85 cuadrados totales es igual al número total de observaciones
menos uno (N-1). Mide la variabilidad total de los datos
Frasco 4 90 100 85
SCT= (120-92,2)² + (110-92,2)² + 95-92,2)² + (90-92,2)² + 95-92,2) +
Frasco 5 95 75 80 (85-92,2)² + (88-92,2)²………… ………………………………(75-92,2)² +
(110-92,2)²+ (70-92,2)²…………………………………………(80-92,2)² =
Medias 102 88,6 86
muestrales 772,84 + 316,84 + 4, 84+ …………7,84= 1,110,2
51,84 + 17,64+ 7,84 + ………… 295,84= 434,0
Media de 102 + 88,6 + 86 = 316,84 + 242,9 + 51,84………….148,84= 811,76
Medias o 276 / 3 = 92,2
Gran Media SCT= 1110,2 + 434 + 811,76 = 2,355,96
b) SCF o SCt o SST ( Suma de Cuadros del Factor o Tratamientos)

Se obtiene como la suma de los cuadrados de las desviaciones de la media de


cada proveedor respecto de la Gran media , ponderando cada diferencia al
cuadrado por el número de observaciones de cada grupo. Los grados de libertad
correspondientes son igual al número niveles del factor menos uno (k-1). Mide la
variabilidad en los datos asociada al efecto del factor sobre la media (la
diferencia de las medias entre los diferentes niveles o grupos).

Lote 1: (102-92,2)² x (5) = 96,04 x 5 = 480,2


Lote 2: (88,6-92,2) x (5) = 12,96 x5 = 64,8
Lote 3: (86-92,2) x (5) = 38,44 x5= 192,2

SCt = 480,2 + 64,8 + 192,2 = 732,2


c) SCE o SCR o SSE ( Suma de Cuadros de Error o Residual)

Mide la variabilidad dentro de cada nivel, es decir, la variabilidad que no es debida a


variable cualitativa o factor. Se calcula como la suma de los cuadrados de las
desviaciones de cada observación respecto a la media del nivel al que pertenece. Los
grados de libertad asignados a la suma de cuadrados residual equivale la diferencia
entre los grados de libertad totales y los grados de libertad del factor, o lo que es lo
mismo (N-k). En estadística se emplea el termino error o residual ya que se considera
que esta es la variabilidad que muestran los datos debido a los errores de medida.

Lote 1: (120-102)² + (110-102)²………….(95-102)² = 630


Lote 2: (85- 88,6)² + (88-88,6)²…………..(75- 88,6)²= 373,2
Lote 3: (110-86)² + (70- 86)²……………….(80-86)² = 870

SCE= 630 + 373,2 + 870 = 1873,2


Paso 5: Elaborar la Tabla ANOVA: reemplazar SCT, SCt, SCE, GL, calcular los CM y
Estadístico F.

Fuente de SUMA DE LOS GRADOS DE CUADRADOS ESTADÍSTICO F


Variación CUADRADOS LIBERTAD DE MEDIAS

Tratamiento SCt = 732,2 K – 1= 3 -1 = 2 CMt = SCt / k – 1 F = CMt / CME=


732,2 / 2 = 366 366 / 156,08 =
F = 2,36

Error SCE= 1873,2 N – k = 15 – 3 = CME = SCE / 12 Fc = 2,36


12 CME = 1873,2 /
12= 156,08

Total SCT = 2,355.96


Paso 6. Redactar la decisión

Con un nivel de confianza del


95% podemos afirmar que las
medias de los contenidos de los
Zona de No rechazo frascos son estadísticamente
o aceptación de Ho similares ; no hay evidencia
estadística que indique lo
contrario. Las diferencias de
Fc= 2,36 F: 3,89 llenado han sido debidos al azar
o variables no conocidas a la
espera de corrección.
Results
ANOVA de Un Factor (Fisher)
F gl1 gl2 p

Contenido/
Tarro 2.37 2 12 0.136
Results
Tukey Post-Hoc Test – Contenido/Tarro
1 2 3
Diferencia
1 — 13.4 16.00
de medias
valor p — 0.246 0.148
Diferencia
2 — 2.60
de medias
valor p — 0.942
Diferencia
3 —
de medias
valor p —
Nota. * p < .05, ** p < .01, *** p < .001

También podría gustarte