ESTADÍSTICA APLICADA A LA ECONOMÍA Y LOS NEGOCIOS I
DISEÑO COMPLETAMENTE AL AZAR
PROF. FERNANDO ROSAS VILLENA
DISEÑO COMPLETAMENTE AL AZAR
Diseño experimental utilizado para comparar tratamientos cuando el investigador
tiene evidencia teórica o empírica de que las unidades experimentales son
uniformes u homogéneas. El número de unidades experimentales por tratamiento
(repeticiones) puede ser igual o diferente.
MODELO ADITIVO LINEAL (POBLACIONAL)
Yij = + i + ij i = 1, 2, ... , t ; j = 1, 2, ... , ni
Yij = Valor de la observación sujeta al i-ésimo tratamiento y a la j-ésima repetición
= Efecto de la media general
i = Efecto del i-ésimo tratamiento
ij = Efecto aleatorio del error experimental en el i-ésimo tratamiento y j-ésima
repetición
MODELO ADITIVO LINEAL (MUESTRAL)
^ ^ ^
Yij = + i + ij
SUPUESTOS O ASUNCIONES
1. Las observaciones siguen una distribución normal y son independientes entre si
2. Las muestras de unidades experimentales por tratamiento son extraídas al azar
3. Existe homogeneidad de variancias entre tratamientos
4. Los ij ~ NI ( 0, 2 )
RESTRICCIONES O PROPIEDADES
nii = 0 nii 0
ij = 0 ij 0
NOTACIÓN PUNTUAL
Cualquier unidad experimental se denota por Yij
Tratamiento Repetición
1 2 3 4 5 Total
1 Y11 Y12 Y13 Y14 Y15 Y1 .
2 Y21 Y22 Y23 Y24 Y25 Y 2.
3 Y31 Y32 Y33 Y34 Y35 Y 3.
4 Y41 Y42 Y43 Y44 Y45 Y 4.
5 Y51 Y52 Y53 Y54 Y55 Y 5.
6 Y61 Y62 Y63 Y64 Y65
Y 6.
Total Y.1 Y.2 Y.3. Y.4. Y.5 Y.. = Yij
Repetición n1 = 5 n2 = 5 n3 = 5 n4 = 5 n5 = 5 n6 = 5 n=ni
_. _
Y = Y.. / n Yi. =Yi. / n i
ESTIMACION DE EFECTOS
La estimación de los efectos de las componentes del modelo se obtienen
mediante la técnica estadística denominada “Estimación de los mínimos
cuadrados”
^ _ ^ _ _ ^ _
= Y.. ; i = Yi. - Y.. ; ij = Yij - Yi.
CUADRO DE ANALISIS DE VARIANCIA
FV GL SC CM F
Tratamientos t–1 SCT CMT CMT/CME
Error experimental n-t SCE CME
Total n-1 SC Total
CUADRO DE ANALISIS DE VARIANCIA
Fuentes de Grados de Sumas de Cuadrados
Fc
Variación Libertad (GL) Cuadrados (SC) Medios (CM)
t
Yi•2 SC(Trat) CM (Trat)
Tratamientos t–1
i =1 ni
− TC
GL(Trat) CM (Error)
Error ri
SC (Error)
t
Yi•2
t
Experimental
n-t
i =1 j =1
Yij −
2
i =1 ni
GL(Error)
t ri
Total n-1
Y
i =1 j =1
2
ij − TC
Cuando el número de repeticiones por tratamiento es igual, los ni pueden ser representados
por r por tanto el número de unidades experimentales sería n =rt y los grados del error
experimental y del total se expresarían por:
GL (E) = t(n – 1)
GL (Total) = tn – 1
1. HIPOTESIS
Hp : 1 = 2 = 3 = ... = t
Ha: Algún i es diferente de los demás
2. NIVEL DE SIGNIFICACION
=0.01 ó =0.05
3. PRUEBA ESTADISTICA
F = CMT / CME ~ F (GLT, GLE)
4. REGIONES CRÍTICAS
Ftab = F(1 -, GLT, GLE)
5. CONCLUSION
Si FCAL F TAB , no se rechaza Hp
Si FCAL > F TAB , se rechaza Hp
EJEMPLO 1:
Con fines de evaluar la fertilidad del suelo se planeó un experimento en el que
sembró y se hizo crecer frijol de la variedad Caraota Venezolano en macetas de 2
Kilogramos de tierra. Los resultados sobre rendimiento de materia seca total por
planta (gramos) se presenta a continuación. Se supone que la variable en estudio
tiene distribución normal.
FERTILIZANTE
Comp. NP NK PK NFe KFe PFe
1.42 1.13 1.42 1.34 1.75 1.64 2.28
1.12 0.74 1.49 1.21 1.81 1.77 2.11
1.31 0.93 1.58 1.28 1.35 1.63 2.33
Total 3.85 2.80 4.49 3.83 4.91 5.04 6.72
MODELO ESTADISTICO
^ ^ ^
Yij = + i + ij
Yij = Rendimiento de materia seca total (grs) de la planta de frijol (Caraota.
Venezolano) sembrada en la j-ésima maceta a la cual se le aplicó el i-ésimo
fertilizante
^
µ = Efecto promedio general de rendimiento de materia seca total (grs) de todas
las plantas de frijol .
^
i = Efecto del i-ésimo fertilizante.
^
ij = Efecto del error experimental en la planta de frijol sembrada en la j-ésima
maceta a la cual se le aplicó el i-ésimo fertilizante.
SUMA DE CUADRADOS
Término de corrección:
TC = (1.42 + 1.12 + ... + 2.33)2 = 47.671
21
Suma de cuadrados total:
SC (Total) = [ 1.422 + 1.122 + ... + 2.332 ] – 47.671 = 3.356
Suma de cuadrados de tratamientos:
SC (T) = (3.85)2 + (2.80)2 + ... + (6.72)2 – 47.671 = 3.049
3 3 3
Suma de cuadrados del error:
SC (E) = SC (Total) – SC (T) = 3.356 – 3.049 = 0.307
CUADRO DE ANALISIS DE VARIANCIA
F.V. G.L. S.C. C.M. Fcal
Tratos. 6 3.049 0.5082 23.205
E. Exp. 14 0.307 0.0219
Total 20 3.356
1. Hp : 1 = 2 = 3 = ... = 7
Ha : Algún i es diferente de los demás
2. = 0.05
3. Fcal = CMT / CME = 23.205
4. Ftab = F(0.95, 6, 14) = 2.85
5. Como FCAL = 23.205 > F TAB = 2.85, entonces, se rechaza Hp, es decir, para un nivel de
significación de 0.05 las evidencias muestrales indican que al menos un tipo de
fertilizante de los 7 estudiados tiene en promedio un efecto diferente de los demás.
EJEMPLO 2:
La vida de anaquel de las carnes almacenadas es el tiempo que un corte previamente
empacado es sano nutritivo y vendible. Un paquete normal expuesto al aire ambiental
tiene una vida aproximada de 48 horas, después de las cuales la carne empieza a
deteriorarse por contaminación de microbios, degradación de color y encogimiento. El
empaque al vacío es efectivo para suprimir el desarrollo de microbios; sin embargo
continúa siendo un problema en otros aspectos. Algunos estudios recientes sugieren las
atmósferas controladas de gas, como alternativa de los empaques actuales.
Algunas formas de empacamiento para carne, son las siguientes:
Empaque 1: Aire ambiental con envoltura plástica.
Empaque 2: Al vacío.
Empaque 3: Mezcla de gases (monóxido de carbono 1%, oxígeno 40% y nitrógeno 59%)
Empaque 4: 100% bióxido de carbono
Tres bistec de res, aproximadamente del mismo tamaño (75 gramos) se asignaron
al azar a cada tratamiento. Cada bistec se empaca separadamente con su condición
asignada. Se mide el número de bacterias psicotrópicas en la carne después de 9
días de almacenamiento a 4ºC; estas bacterias aparecen en la superficie de la carne
y aparecen cuando la carne se echó a perder. La medición fue el logaritmo del
número de bacterias por cm2. Los resultados se muestran a continuación:
bistec Tratamiento Repetición Log(conteo/cm2) Total x Trat
6 1 1 7.66
7 1 2 6.98
1 1 3 7.8 22.44
12 2 1 5.26
5 2 2 5.44
3 2 3 5.8 16.5
10 3 1 7.41
9 3 2 7.33
2 3 3 7.04 21.78
8 4 1 3.51
4 4 2 2.91
11 4 3 3.66 10.08
y ij = 70.8
y 2
ij = 451.5196
Test for Equal Variances for Y
Bartlett's T est
1
T est Statistic 1.21
P-Value 0.751
Levene's T est
2
T est Statistic 0.20
Trat
P-Value 0.894
0 1 2 3 4 5 6
95% Bonferroni Confidence Intervals for StDevs
Probability Plot of RESI1
Normal
99
Mean 3.700743E-17
95 StDev 0.2903
90 N 12
80
AD 0.493
70 P-Value 0.174
Percent
60
50
40
30
20
10
1
-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8
RESI1
a. Verifique los supuestos exigidos para el uso del diseño experimental empleado en el
estudio y pruebe la hipótesis que corresponden al diseño utilizado. De sus
conclusiones de acuerdo al enunciado del problema.
PRUEBA DE ANDERSON DARLING (NORMALIDAD)
Hp: La variable en estudio (las observaciones) se distribuyen normalmente
Ha: La variable en estudio (las observaciones) no se distribuyen normalmente
Hp: Los errores se distribuyen normalmente
Ha: Los errores no se distribuyen normalmente
P valor = P value < α Se Rechaza la Hp
P valor = P value > α No se Rechaza la Hp
PRUEBA DE BARTLETT (HOMOGENEIDAD DE VARIANCIAS)
Hp: Las variancias de los tratamientos son homogéneas
Ha: Las variancias de los tratamientos no son homogèneas
P valor = P value < α Se Rechaza la Hp
P valor = P value > α No se Rechaza la Hp
EJERCICIO 1:
Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se
pueden hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el
mercado. Para hacer ello, prueba los cueros con una máquina que hace pasar los
zapatos por una superficie abrasiva; la suela de los zapatos se desgasta al pasarla
por dicha superficie. Como criterio de desgaste se usa la pérdida de peso después
de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de
cada tipo de cuero. Plantear y probar la hipótesis correspondiente.
Tipo de cuero Pérdida de peso
A 264 260 258 241 262 255
B 208 220 216 200 213 208
C 220 263 219 225 230 228
D 217 226 215 224 220 222
EJERCICIO 2
Un fabricante supone que existe diferencia en el contenido de calcio en lotes de
materia prima que le son suministrados por su proveedor. Actualmente hay una gran
cantidad de lotes en la bodega. Cinco de estos son elegidos aleatoriamente. Un
químico realiza cinco pruebas sobre cada lote y obtiene los siguientes
resultados.
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
Y1 = 117.29 Y2 = 117.46 Y3 = 117.62 Y4 = 116.9 Y5 = 116.82
2
Y.. = 586.09 ∑∑Yij = 13740.2441
EJERCICIO 3
Utilizando la información del ejercicio 2, suponga que se pierde el último dato
del Lote 1 y los dos últimos del Lote 4. Aplique el Diseño Completamente al
Azar y analice las diferencias que tiene con respecto al diseño cuando la
información completa (balanceado).
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.32
23.50 23.49 23.38
Y1 = 93.89 Y2 = 117.46 Y3 = 117.62 Y4 = 70.05 Y5 = 116.82
Y.. = 515.84
EJERCICIO 4:
Los siguientes son los números de hornos de microondas que vende cada uno
de los vendedores de las tres sucursales de una compañía distribuidora de
artículos domésticos:
Sucursal 1 21 11 17 28
Sucursal 2 27 15 18 26 17 21
Sucursal 3 24 17 31 12 15
Efectúe el análisis de variancia y pruebe las hipótesis respectivas con un nivel
de significación de 0.05. Dé sus conclusiones en términos del enunciado del
problema.
Rapta. F = 0.06 ; no se puede rechazar la hipótesis nula
COEFICIENTE DE VARIACIÓN
Es una medida usada por los investigadores para evaluar el grado de
homogeneidad de los resultados de un experimento.
.
CMError
cv = x100 %
Y..
Una escala aproximada de clasificación para experimentos agrícolas es la
siguiente:
0 % - 10% Excelente
11% - 15% Muy bueno
16% - 20% Bueno
21% - 25% Regular
26% - 30% Malo
Más del 30% Muy Malo