Tema
15
Diseño completamente
al azar
DCA
Diseño experimental
⚫ Es la distribución de los tratamientos entre las
unidades experimentales o viceversa teniendo
en cuenta ciertas restricciones en el azar o con
fines específicos que tiendan a minimizar el
error experimental.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Factor
⚫ Es el material o procedimiento sobre el cual el
investigador tiene conocimiento y es de interés
estudiarlo
⚫ Ejemplo : factor riego
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
TRATAMIENTOS
⚫ Son las características o procesos cuyos efectos van a ser
medidos, evaluados y comparados
⚫ El tratamiento establece un conjunto de condiciones
experimentales que deben imponerse a una unidad
experimental dentro de los confines del diseño
seleccionado.
Ejemplos:
⚫ 3 Dosis de fertilizante, 4 densidades de siembra
⚫ 5 ración alimenticia, 3 sistemas de alimentación
⚫ 2 profundidad de sembrado.
⚫ 4 variedades de un cultivo.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
UNIDAD EXPERIMENTAL
La unidad experimental, es el objeto o espacio al cual se
aplica el tratamiento y donde se mide y analiza la
variable que se investiga.
En los experimentos pecuarios la unidad experimental
por lo general esta conformada por un animal (cuye,
cerdo, pato, etc.), en los experimentos forestales la
unidad experimental en la mayoría de los casos esta
conformado por un árbol y en la mayor parte de las
pruebas de campo agrícolas, la unidad experimental es
una parcela de tierra
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
caso 1 caso 2 caso 3
FACTOR Fertilización N Ingresos-Sueldos densidad
TRATAMIENTO N1=30%,N2=50% Bajo-Medio-Alto d1= 5,d2=10,d3=15
VARIABLE ESTUDIO Rendimiento:Kg/ha consumo de carne/fam/mes peso final (gr)
UNIDAD EXPERIM. parcela de 100m2 Caserío con 1500 familias. estanque de 10 m2
DATO ESTADISTICO 34 Kg/ha 2.5 kg 185 gr
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Características del diseño
⚫ Los resultados se clasifican de acuerdo a un
solo criterio, que es el de los tratamientos.
⚫ La variabilidad en todo el material
experimental es relativamente pequeño y
uniformemente repartido
⚫ El medio ambiente que rodea al experimento
actúa en forma uniforme sobre todas la u.e
⚫ Las unidades experimentales son los mas
homogéneamente posible.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Desventajas del diseño
⚫ Se parte de la hipótesis que las varianzas de
todos los tratamientos son homogéneas. Si esta
hipótesis esta en duda hay que comprobarla.
⚫ Ho : Š ² = Š ² = Š ² ( Prueba de F, Chi cuadrado)
1 2 3
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
¿Qué es el ANOVA ANALISIS DE LA
VARIANCIA
Es una técnica estadística que sirve para analizar la
variación total de los resultados experimentales de un
diseño en particular, descomponiéndolo en fuentes de
variación independientes
atribuibles a cada uno de los efectos en que
constituye el diseño experimental. Es un método de
cálculo para probar la hipótesis de que las medias de
dos o mas poblaciones son iguales. Ejemplos:
Comparación de efectos logrado por cinco
clases de antibióticos.
La dosificación de drogas en un paciente.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-8
15.2 Suposiciones del ANOVA
La distribución F también se usa para probar
la igualdad de más de dos medias con una
técnica llamada análisis de variancia
(ANOVA). El ANOVA requiere las siguientes
condiciones:
A. La población que se muestrea tiene
una distribución normal
B. Las poblaciones tienen desviaciones
estándar iguales
C. Las muestras se seleccionan al azar y
son independientes
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-9
15.3 Procedimiento para el análisis de
variancia
⚫ Hipótesis nula: las medias de las poblaciones
son iguales.
⚫ Hipótesis alterna: al menos una de las medias
es diferente.
⚫ Estadístico de prueba: F = (variancia entre
muestras)/(variancia dentro de muestras).
⚫ Regla de decisión: para un nivel de
significación , la hipótesis nula se rechaza si
F calculada es mayor que F tabular con grados
de libertad en el numerador y en el
denominador.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.4 El modelo aditivo lineal : MAL
Se aplica como una suma y los exponentes
son iguales a 1.
Explica cómo está formada una observación
Xi= + i
Donde
i = error, es decir la variabilidad (o diferencia)
entre la observación y el promedio
Xi
i
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
El modelo lineal correspondiente a este tipo de arreglo es el que se
muestra a continuación:
yij = + i + eij donde,
yij = observación correspondiente al tratamiento i, repetición j.
= constante común a todas las observaciones.
i = efecto del tratamiento i.
eij = error experimental correspondiente al tratamiento i, repetición j,
normalmente distribuido con media 0 y varianza homogénea 2.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
El MAL para el ANOVA con un factor:
Xij = + i + ij
Donde
i = efecto del tratamiento
N
X ( + + )
j=1
ij
=i = = + i ij
N N
= + 1
1
= + 2
2
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Si la Hp : 1= 2
Reemplazando tenemos
Hp : + 1= + 2
Hp : 1 = 2
Sólo se prueba la diferencia entre tratamientos
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.5 El modelo de ANOVA con igual número
de repeticiones
T1 T2 T3
X11 X12 X13
X21 X22 X23
X31 X32 X33
X41 X42 X43
X51 X52 X53
X.1 X.2 X.3
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
La tabla del ANOVA
Fuentes de Suma de Cuadrado F F
variabilidad Cuadrados
t
GL Medio calculado teórico
Entre grupos X
j=1
2
•j
X•2• t-1 CMe =
SCtrat Fc =
CMe trat Ft con (t-1) y
(Tratamientos) SC trat = − GL CMe ee (rt-t)
r rt
Dentro de los grupos SC = X2 − X• j r t - t
2
SC
(Error Experimental)
ee ij r CMe = ee
GL
X•2•
= Xij −
2
Total SC total
rt r t -1
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Ejercicio: se comparan 2 dietas para el engorde de cerdos
de igual raza, edad y sexo, midiendo el aumento de peso en
Kg durante el experimento
individuos Dieta A(Aumt.Kg) Dieta B(Aumt, Kg)
1 26 23
2 25 22
3 12 16
4 25 29
5 20 24
6 16 15
7 18 24
8 21 25
9 11 16
10 8 14
N
X
j =1
ij 182 208 390
N
X
j =1
ij
18.2 20.8
N
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
procedimiento
1.- Determinar el grado de libertad para
tratamientos y error experimental
⚫ Gl (t) = t-1= 2-1 = 1
⚫ Gl (e) = r.t- t = 10*2-2= 18
2.- Suma de cuadrados de tratamiento
⚫ = 182² + 208² - (182+208)²
⚫ 10 10*2
⚫ 7638.80 – 7605 = 33.8
⚫ Donde: n¹ = r y N = r.t
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
⚫ 3.- Suma de cuadrados total :
El efecto de la variación total
= (26²+25²+…….16²+14²) – 7605
= 635.00
4.- Suma de cuadrados del error
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Prueba de F
⚫ Se plantea la hipótesis de que no hay diferencias de efectos entre
los tratamientos.
⚫ Se estima Fcalculado con el valor de f tabular a un nivel de
significación de 0.05 o 0.01. Si Fc > f (t) se desecha la hipótesis
planteada.
⚫ Se busca f t en la tabla con grados de libertad del numerador(CM)
en la parte superior y del denominador (Cme) en la parte de la
columna.
⚫ Si Fc > f t0.05 se dice que la prueba es significativa .(*) y si
⚫ Fc> f t 0.01 se dice que la prueba es altamente significativo(**)
⚫ El Coeficiente variabilidad esta dado por CV= S (100)
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-12
Aplicación 1
Se realiza un estudio para comparar la eficacia
de tres programas terapéuticos para el
tratamiento del acné de tipo medio a moderado.
Se emplean tres métodos:
I. Este método, el más antiguo, supone el lavado,
dos veces al día, con un cepillo de polietileno y un
jabón abrasivo, junto con el uso diario de 250 mg.
de tetraciclina.
II. Este método, el utilizado actualmente, consiste, en
la aplicación de crema de tretinoína, evitar el sol,
lavado dos veces al día con jabón emulsionante y
agua, y utilización, dos veces al día, de 250 mg.
De tetraciclina.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-13
III. Este es un método nuevo que consiste en evitar el
agua, lavado dos veces al día con limpiador sin
lípidos, y uso de crema de tretinoína y de peroxido
de benzoilo.
Se comparan estos tres tratamientos en cuanto a su
eficacia en la reducción del número de lesiones de
acné en los pacientes. En el estudio participaban
treinta pacientes. Se les separó aleatoriamente en tres
subgrupos de tamaño 10. A uno de los subgrupos se le
asignó el tratamiento I, a otro el tratamiento II y al
tercero, el tratamiento III. Después de 16 semanas se
anotó para cada paciente la tasa porcentual de
mejoría, medido en número de lesiones.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Se obtuvieron los siguientes datos:
I II III
48.6 68.0 67.5
49.4 67.0 62.5
50.1 70.1 64.2
49.8 64.5 62.5
50.6 68.0 63.9
50.8 68.3 64.8
50.8 71.9 62.3
47.1 71.5 61.4
52.5 69.9 67.4
49.0 68.9 65.4
50.6 67.8 63.2
549.3 755.9 705.1
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Solución
1. Planteamiento de hipótesis:
Hp : 1= 2= 3
Ha : 1≠ 2 ≠ 3 (no todas las medias son iguales)
2. Nivel de significación
= 0.05
3. Prueba estadística
CMe trat
Fc =
CMe ee
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
4. Criterios de decisión
3,3158
Si {Fc>3,3158} se rechaza la Hp, en caso
contrario se acepta.
4. Cálculos
Excel nos brinda los siguientes resultados:
Fuente de
variabilidad SC GL CMe F cal p-valor F teórico
Tratamientos 2107.20727 2 1053.60364 300.680769 1.42117E-20 3.31583294
Error experimental 105.121818 30 3.50406061
Total 2212.32909 32
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
6. Conclusiones
A. Se rechaza la hipótesis planteada, se acepta
la hipótesis alterna a un nivel de significación
de 0,05. La prueba fue significativa.
B. Al menos un método de capacitación es
diferente a los demás
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.6 El modelo de ANOVA con diferente
número de repeticiones
T1 T2 T3
X11 X12 X13
X21 X22 X23
X31 X32 X33
X42 X43
X52
X.1 X.2 X.3
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
La tabla del ANOVA
Fuentes de Suma de Cuadrado F F
variabilidad Cuadrados GL Medio calculado teórico
t X•2j X•2•
= − SCtrat CMe trat
Entre grupos
SC trat
r
j=1 rj j
t-1 CMe = Fc =
CMe ee
Ft con (t-1) y
(Tratamientos) GL (rt-t)
Xij2
Dentro de los SC ee = X − r t - t
2
r
ij SC ee
grupos (Error j CMe =
Experimental) GL
X•2•
= Xij −
2
SC total
Total
rj r t -1
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
ejercicio
⚫ El efecto de la aplicación de tres niveles de nitrógeno sobre el rendimiento de
una variedad de caña de azúcar, se estudió mediante un diseño
Completamente al Azar con cuatro repeticiones en parcelas de 100m2.
⚫ Los tratamientos de referencia fueron :
⚫ A : 165 Kg de Nitrógeno por hectárea
⚫ B : 233 Kg de Nitrógeno por hectárea
⚫ C : 301 Kg de Nitrógeno por hectárea
Los resultados en Kg/ha fueron los siguientes
Repeticiones
I II III IV
⚫ B 186.2 C 142.3 C 140.8 B 193.3
⚫ A 141.5 B 191.1 A 144.4 C 140.9
⚫ C 146.2 A 145.5 B 195.6 A 141.1
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
1.- Con el objetivo de facilitar los cálculos, los rendimientos ordenados
por tratamientos se muestran en el siguiente cuadro :
Repeticiones
I II III IV Total Medias
A 141.5 145.5 144.4 141.1 572.5 143.1
B 186.2 191.1 195.6 193.3 764.2 191.0
C 146.2 142.3 140.8 140.9 570.2 142.6
1906.9
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Calculemos las sumas de cuadrados necesarias para el Análisis
de Varianza :
Suma de cuadrados corregida total :
Suma de cuadrados corregida de tratamientos :
Suma de cuadrados corregida del error :
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
ANALISIS DE VARIANZA
FUENTES DE
VARIACION G.L. S.C. C.M. F Sign.
Total 11 7045.85
Tratamientos 2 6199.18 3099.59 32.97 P<0.001
Error 9 846.18 94.02
El error típico de las medias de tratamientos viene dado por :
− CM E 94.02
E.T .(T ) = = = 4.85
r 4
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Aplicación 2
El director de entrenamiento de una compañía está
tratando de evaluar tres diferentes métodos de
entrenamiento para empleados nuevos. El primer
método consiste en asignar un empleado nuevo con
un trabajador experimentado para que éste lo asista
en la fábrica. El segundo método consiste en ubicar a
todos los empleados nuevos en un salón de
entrenamiento separado de la fábrica, y el tercer
método consiste en utilizar películas de entrenamiento
y materiales de aprendizaje.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
El director de entrenamiento escoge al azar 16
empleados nuevos asignados a los tres métodos y
registra su producción diaria después que
terminaron sus programas de entrenamiento:
Metodo 1 15 18 19 22 11
Metodo 2 22 27 18 21 17
Metodo 3 18 24 19 16 22 15
El director pregunta si existen diferencias en cuanto
a la efectividad entre los tres métodos.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Solución
1. Planteamiento de hipótesis:
Hp : 1= 2= 3
Ha : 1= 2= 3 (no todas las medias son iguales)
2. Nivel de significación
= 0.05
3. Prueba estadística
CMe trat
Fc =
CMe ee
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
4. Criterios de decisión
3,81
Si {Fc>3,3158} se rechaza la Hp, en caso
contrario se acepta.
4. Cálculos
Excel nos brinda los siguientes resultados:
ANÁLISIS DE VARIANZA
Fuentes de Variabilidad SC GL CMe F cal p-valor F tabular
Entre grupos 40 2 20 1.35 0.29 3.81
Dentro de los grupos 192 13 14.7692308
Total 232 15
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
6. Conclusiones
A. Se acepta la hipótesis planteada, se rechaza
la hipótesis alterna a un nivel de significación
de 0,05. La prueba no resultó significativa.
B. Los datos muestrales no proporcionan
evidencia para afirmar que los tratamientos
son diferentes.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.7 Métodos para encontrar
diferencia entre tratamientos
Cuando se rechaza la hipótesis nula de que las
medias son iguales, quizá sea bueno saber qué
medias de tratamiento difieren.
⚫ Diferencia limite de significación (DLS): Para
comparar promedios de tratamientos.
⚫ Prueba de comparaciones múltiples de Duncan:
Para comparar todos contra todos.
⚫ Prueba de comparaciones múltiples de Tuckey
⚫ Prueba de comparaciones múltiples de Student,
Newman y Keuls.
⚫ Prueba de comparaciones de Dunnett: Para
comparar todos contra un testigo.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
2CMe
DLS = t •
Ventajas n
• Fácil de realizar
• De preferencia debe de utilizarse para hacer
comparaciones ortogonales o independientes, sin
embargo su validez no se ve seriamente afectada
cuando algunas comparaciones no son ortogonales,
pero han sido establecidas al momento de instalar el
experimento.
Desventajas
• Por ningún motivo debe usarse DLS para
comparaciones inducidas por los resultados
• No es válida para realizar todas las comparaciones
• Se ve afectada por el número de tratamientos: a
mayor número de tratamientos, se pierde algo de
eficiencia.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-15
15. 8 Inferencias acerca de las medias
de tratamiento
Uno de los procedimientos más sencillo
es el uso de los intervalos de confianza.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-16
Intervalos de confianza para la
diferencia entre dos medias
1 1
( X1 − X 2 ) t MSE n + n
1 2
donde t se obtiene de la tabla con (N - k) grados
de libertad.
MSE = [SSE /(N - k)]
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Las hipótesis se plantean de la siguiente manera:
Ho: Todos los tratamientos son iguales 1 = 2 =.... = n
Ha: Al menos un tratamiento es diferente.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
La técnica consiste en calcular de diferente maneras la
varianza de las muestras.
Existen dos maneras de calcular la varianza:
Dentro SMQD (conocida como varianza no explicada)
Entre SMQE (conocida como varianza explicada)
La prueba estadística que se utiliza es la prueba F
SMQE
Prueba F =
SMQD
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
La distribución F es oblicua hacia la derecha y sus
valores son siempre positivos.
La distribución F depende del nivel y de los
grados de libertad (d.f. = degree of fredom) del
numerador y de los grados de libertad del
denominador.
D.f numerador = C – 1 donde C es el número de
grupos.
D.f. Denominador = C ( n – 1) donde n es el
número de observaciones en cada grupo.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.9 Solución aplicando EXCEL
Como solo estamos evaluando el rendimiento de los
empleados con los diferentes métodos de capacitación,
aplicamos análisis de varianza de un solo factor
Análisis de varianza de un factor
Fuente de variabilidad SC GL CM F calculado p-valor F tabular
Entre grupos 23.44 2 11.719 0.560087 0.5843 3.8056
Dentro de los grupos 272 13 20.923
Total 295.4 15
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
EJEMPLO
Considere un estudio de diez años en el que
se ha observado una muestra de 15 personas
que han usado pastas dentales 1, 2 o 3,
respectivamente. Supongamos que cinco de
los participantes se han asignado
aleatoriamente a cada uno de los tratamientos
y que el estudio ha proporcionado los datos
siguientes:
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Datos: número de caries observados
Tratamiento (tipo de pasta)
Caso
1 2 3
1 19 20 18
2 15 25 12
3 22 22 16
4 17 19 17
5 19 23 15
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003