0% encontró este documento útil (0 votos)
783 vistas35 páginas

DBCA

Este documento describe el diseño de bloques completos al azar (DBCA) para experimentos. En un DBCA, las unidades experimentales se asignan a grupos homogéneos llamados bloques para controlar la variabilidad. Luego, los tratamientos se asignan al azar dentro de cada bloque. El documento explica cómo organizar los datos de un experimento de este tipo y analizarlos mediante un análisis de varianza para determinar si los tratamientos causan diferencias en la variable de respuesta. Finalmente, presenta un ejemplo de un experimento que evalúa el
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
783 vistas35 páginas

DBCA

Este documento describe el diseño de bloques completos al azar (DBCA) para experimentos. En un DBCA, las unidades experimentales se asignan a grupos homogéneos llamados bloques para controlar la variabilidad. Luego, los tratamientos se asignan al azar dentro de cada bloque. El documento explica cómo organizar los datos de un experimento de este tipo y analizarlos mediante un análisis de varianza para determinar si los tratamientos causan diferencias en la variable de respuesta. Finalmente, presenta un ejemplo de un experimento que evalúa el
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Á

DISEÑO EN BLOQUE
COMPLETO AL AZAR
(DBCA)

- Ing. M. Laura Vignera -


Planeación de la investigación
Preguntas: ¿Cuál es mi objetivo? ¿Qué quiero saber? ¿Por qué y para qué
quiero saberlo?
Formulada la Hipótesis de investigación tengo que ver cómo selecciono
apropiadamente los tratamientos y la técnica que voy a usar para responder a esa
hipótesis.

Empleo de BLOQUES para aumentar la precisión


Si el objetivo es realizar comparaciones entre los tratamientos, la bloquización
es un medio para reducir y controlar la varianza del error experimental para así
lograr mayor precisión.

El error experimental describe la variación entre unidades experimentales.


La bloquización es una acción que favorece al control local del ambiente.

El factor de interés es uno sólo, pero se tiene en cuenta otro factor para
controlar la variabilidad extraña y excluirla así del error experimental.
2
¿Cuándo agrupo las unidades experimentales en BLOQUES?
Cuando consideramos por exerimentos anteriores, que las unidades
experimentales no son homogéneas, entonces es conveniente
bloquizar.
Cuando fuentes de variación extrañas e indeseables pueden ser
identificadas, podemos diseñar el experimento de tal forma que
eliminemos su influencia.

Las unidades experimentales se agrupan en conjuntos homogéneos.

Por ejemplo en experimentos agrícolas:


Bl Material homogéneo

Material B ll Pendiente, gradiente,


heterogéneo personas, ubicación, etc

B lll

En experimentos sobre terreno, las parcelas adyacentes suelen


ser más parecidas que las que están a cierta distancia o las
mediciones efectuadas por cierto equipo pueden parecerse más
que las efectuadas con otro equipo. 3
Factores de Bloqueo

En un invernadero:

En un galpón con animales:


Portón

En ocasiones la persona encargada es el bloque.


4
DISEÑO EN BLOQUE COMPLETO AL AZAR (DBCA)

El Diseño en Bloque Completo al Azar es un plan en el cual las unidades


experimentales se asignan a grupos homogéneos, llamados bloques, y los
tratamientos son, luego, asignados al azar dentro de los bloques.
Objetivo del agrupamiento: lograr que las unidades dentro de un bloque
sean lo más uniformes posible con respecto a la variable dependiente, de
modo que las diferencias observadas se deban realmente a los tratamientos.
Al controlar la variación dentro de los bloques reducimos la variabilidad del
error experimental.
Completo: todos los tratamientos están incluidos en cada bloque.

Esquema de Aleatorización: debemos asignar cada tratamiento


a cada bloque.

T3 T2 T4
T1 T1 T2
T2 T4 T1
T4 T3 T3

Cada bloque constituye una replicación o repetición 5


Ventajas
• Puede proveer resultados más precisos que un DCA del mismo tamaño
si los agrupamientos son efectivos.
• Sirve para cualquier nº de tratamientos y replicaciones.
• Los tratamientos no necesitan tener tamaños de muestras iguales.
• El análisis no se complica si se debe descartar, por alguna causa, un
tratamiento o algún bloque.
• Se puede introducir, deliberadamente, variabilidad en las unidades
experimentales para ampliar el rango de validez de los resultados sin
sacrificar la precisión de los resultados.
Desventajas
• Las observaciones faltantes dentro de un bloque requiere cálculos más
complejos.
• Los grados de libertad para el error experimental no son tantos como en
el DCA.
• Se requieran más presunciones para el modelo: no interacción entre
tratamientos y bloques, varianza constante de bloque a bloque. 6
Ejemplo: Los siguientes datos corresponden a los porcentajes de impurezas
medidos por 6 analistas para 4 marcas diferentes de un reactivo. Se desea
evaluar si el porcentaje de impurezas varía de una marca a otra. Debido a que
existe incertidumbre respecto a la homogeneidad en el modo de trabajo de los
analistas, se decide el diseño considerando este factor.

Marca
Analista
A B C D
1 3,92 3,98 4,02 4,13
2 3,93 4,01 4,05 4,22
3 3,96 4,05 4,13 4,35
4 3,99 4,23 4,34 4,42
5 4,29 4,25 4,49 4,59
6 4,36 4,31 4,51 4,6

7
Objetivo: determinar si existe diferencia en el contenido de impurezas entre las
marcas de reactivo o lo que es lo mismo, el contenido de impurezas depende de la
marca?

Variable respuesta: % de impurezas


Tratamientos: las marcas. 4
Repeticiones: 6 analistas
Unidad experimental: cada muestra de reactivo

Aleatorización: debemos asignar cada tratamiento, A, B, C, D a cada bloque.


Es decir aleatorizamos dentro de cada analista.

Analista 1 Analista 2 Analista 3 Analista 4 Analista 5 Analista 6


D C A C D D Posible
B B D A B B esquema de
A D C D C C aleatorización
C A B B A A

8
¿Pero cómo asignamos los tratamientos a las unidades experimentales?

Analista 1 Analista 1
A 0,2705978 D 0,1725953
B 0,2568096 B 0,2568096
C 0,6692298 A 0,2705978
D 0,1725953 C 0,6692298

En excel generamos números aleatorios y


luego podemos ordenarlos de menor a
mayor ampliando la selección. Pero
cualquier otro método es válido.

De acuerdo a esta asignación de tratamientos, el


Analista 1, el primer día analizará la Marca A de
reactivo, el día 2 Marca B, el día 3 Marca C...

O podría ser que a la mañana temprano analice A,


hacia media mañana B, hacia mediodía C…

9
Organizamos los datos
Para trabajar en Infostat:

10
Organizamos los datos
Para trabajar en Excel:

1 2 3 4 5 6
A 3,92 3,93 3,96 3,99 4,29 4,36
B 3,98 4,01 4,05 4,23 4,25 4,31
C 4,02 4,05 4,13 4,34 4,49 4,51
D 4,13 4,22 4,35 4,42 4,59 4,6

Atención!! Los datos deben estar organizados con una


sola fila para el encabezado de los bloques y una sola
columna para el encabezado de los tratamientos (no
más de una).

11
Infostat
Exploramos los datos
• ESTADÍSTICAS----MEDIDAS DE RESUMEN
• GRÁFICOS --- GRÁFICO DE CAJA

Excel
• DATOS ---ANÁLISIS DE DATOS---
ESTADÍSTICA DESCRIPTIVA

Cajas Múltiples

4,63
Observamos que A parece ser la que tiene
menor contenido promedio de impurezas,
4,45
seguida por B. La de mayor contenido

Impurezas
promedio es D. Respecto a la variabilidad,
C tiene mayor varianza, pero no parece 4,26
diferir tanto del resto. También mirando el
gráfico de cajas observamos estas
4,07
cuestiones.

Aquí no estamos considerando los 3,89


A B C D
analistas.
Marca react

12
ANÁLISIS DE LA VARIANZA. En Infostat
ESTADÍSTICAS --- ANÁLISIS DE LA VARIANZA

13
ANÁLISIS DE LA VARIANZA. En Excel
DATOS –ANÁLISIS DE DATOS---

14
El Modelo (de efectos fijos)

yij     i   j  eij Modelo lineal aditivo

Donde yij es la variable respuesta o dependiente, yij es la observación


perteneciente al j-ésima bloque bajo el tratamiento i; las observaciones son
independientes.
• µ es la media general común a todos los bloques y a todos los tratamientos
• αi es el efecto del tratamiento en el nivel i
• βj es el efecto del bloque en el nivel j
• eij es la variable aleatoria del error con distribución normal, con media = 0 y
varianza σ2 N (0 ; σ2 ) e independiente.

Existe una restricción fundamental para este modelo: no debe haber


INTERACCIÓN entre tratamientos y bloques. Esto es cuando los bloques no se
comportan de manera constante frente a los distintos niveles de los
tratamientos. Volveremos más adelante sobre este tema.
15
Si los tratamientos no difieren en cuanto a la variable observada, las
curvas se superpondrían exactamente.

H0 : µA= µB = µC=µD
o
H0 = αA=αB=αc=αD=0

Pero si los tratamientos difieren, pensaríamos que las muestras provienen de


poblaciones diferentes,

H1: algún µi es distinto de los restantes


o
H1: algún αi es distinto de 0

16
Las hipótesis que se están probando son:

• Para los Tratamientos (Marcas)

H0: µA = µB = µC =µD

El contenido de impurezas no depende de la marca


≡ las marcas no difieren significativamente
respecto al contenido de impurezas.

vs

H1: algún µi es diferente

El contenido de impurezas depende de la marca


≡ las marcas difieren significativamente
respecto al contenido de impurezas.

17
• Para los Bloques (Analistas)

H0: µ1 = µ2 = … =µ6

El efecto bloque no es significativo.


≡ el contenido de impurezas detectado es
independiente del analista.

vs

H1: algún µi es diferente

El efecto bloque es significativo.


≡ el contenido de impurezas detectado
depende del analista.

Por lo general, esta no es la hipótesis de interés, ya que nuestro interés es


detectar diferencias entre las marcas, no entre los analistas. Justamente lo
que queremos es aislar la variabilidad incorporada por los analistas.
18
Estimamos los parámetros

Si aplicamos el Método de los Mínimos Cuadrados, para estimar los


parámetros
b t

 y
i 1 j 1
ij
Donde b son los
̂ ..  y ..  media general
bt bloques y t los
tratamientos

ˆ i  y i.  y .. efecto del tratamiento

ˆ j  y. j  y.. efecto del bloque

eˆij  yij  y i.  y . j  y .. residuo

donde por la naturaleza de los datos:  i  0 ,  j  0

Valor predicho yˆ ij  y i.  y . j  y ..
19
Sumas de cuadrados para identificar fuentes de variación

Cada componente del modelo contribuye a la variabilidad total. La partición


de la Suma de Cuadrados Total involucrará tres fuentes de variación.

 ( y
i j
ij  y .. ) 2  b ( y i..  y..) 2  t  ( y . j  y..) 2   ( yij  y i.  y . j  y .. ) 2
i j i j

Variación total Variación debida Variación debida Variación propia de


a los tratamientos a los bloques las observaciones

SCTotal SCTrata SCBloque SCError

SCTotal  SCTrata  SCBloque  SCError

20
Tabla de Análisis de varianza para dos criterios de clasificación

Fuente de Suma de Grados de Cuadrados F calculada


variación Cuadrados libertad Medios
Tratamientos SCTr t- 1 CMTr = SCTr / t-1 CMTr / CME
Bloques SCBl b -1 CMBl = SCBl/ b-1 CMBl / CME
Error Experimental SCE (t - 1)(b-1) CME = SCE / (t-1)(b-1)
Total SCT tb -1

21
En nuestro ejemplo:

• Es importante que los grados de libertad del error sean grandes. Menos
grados de libertad resultan en una disminución de la potencia.
• Recordemos que el Cuadrado Medio del Error es la varianza S2 Lo
importante es que esta sea pequeña.

22
¿Pero cómo llegamos hasta esos valores de la tabla?

Suma de Cuadrados de Tratamientos

SCtrata  b ( y i.  y .. ) 2
la sumatoria tiene tantos términos como
tratamientos
i

Suma de Cuadrados de Bloques

SCbloques  t  ( y . j  y .. ) 2 tiene tantos términos como bloques


j

Suma de Cuadrados Total

SCtotal   ( yij  y .. ) 2 La doble sumatoria indica que tiene tantos términos como
i j cantidad de observaciones.

Suma de Cuadrados del Error Experimental

SCerror   ( yij  y i.  y . j  y .. ) 2 tiene tantos términos como cantidad de observaciones


i j

23
Hacemos los cálculos a mano…

SCtrata  b ( y i.  y .. ) 2
i

 6  (4.08  4.21) 2  (4.14  4.21) 2  ...  (4.39  4.21) 2 


 0.3366

SCbloques  t  ( y . j  y .. ) 2 Medias que necesitaremos


j


 4 4.01  4.21  4.05  4.21  ...  4.44  4.21
2 2 2

 0.663

La media general surge de promediar todas


SCtotal   ( yij  y .. ) 2 las observaciones. En el Infostat, la
i j obtenemos al no pasar ninguna variable
 3.92  4.21  3.93  4.21  ...  4.6  4.21
2 2 2
como criterio de clasificación.
 1.053

SCerror   ( y ij  y i.  y . j  y .. ) 2
i j

 3.92  4.08  4.01  4.21  ...  (4.6  4.39  4.44  4.21) 2


2

 0.052

O dado que es un modelo lineal aditivo, lo calculamos por diferencia:

SCerror SCtotal SCtrata SCbloque


24
Un modo abreviado de cálculo de las Sumas de Cuadrados

( Yij ) 2
Fc 
i j
Factor de corrección
bt
(3.92  3.93  ...  4.6) 2 (101.13) 2
   426.14
64 24

1 1
SCtrata  
b i
T 2
i.  Fc 
6
(24.45 2  ...  26.312 )  426.14

1 1
SCbloque  
t j
T 2
.j  Fc 
6
(16.05 2  ...  17.78 2 )  426.14

SCtotal   Yij2  Fc  (3.92 2  3.932  ...  4.6 2 )  426.14


i j

SCerror  SCtotal  SCtrata  SCbloque

25
Cuadrados Medios

SCtrata SCbloque SCError


CMtrata  CMbloque  CMError 
t 1 b 1 (b  1)(t  1)

Estadístico de Prueba F

CMtrata CMbloque
Fc  Fc 
CMerror CMerror

Valor crítico de F

• Tratamientos

F (gl trata;gl error);  F ((t  1); (b  1)(t  1));  F (3;15);0,05  3.28

• Bloques
F (gl bloque; gl error );  F ((b  1); (b  1)(t  1));  F (5;15);0,05  2.9

26
• Para la hipótesis: H0 : µA= µB = µC=µD ó H0 = αA=αB…=αD=0

Valor–p < α
0,0001 < 0,05 => Rechazo H0 que plantea la igualdad de medias de tratamientos

Conclusión: Existen diferencias significativas en el contenido de impurezas


entre las diferentes marcas, para un nivel de significación del 5%. Podemos
decir que el contenido de impurezas depende de la marca utilizada.

27
• La otra hipótesis que podemos plantear es H0: β1= β 2=…= β j=0
vs H1: al menos un β j≠0
Valor–p < α
0, 0001 < 0,05 => Hay evidencias suficientes para rechazar H0 que plantea la
igualdad de los bloques.

Conclusión: Existen diferencias significativas entre los analistas en el modo de


trabajo al cuantificar el contenido de impurezas en los reactivos de las distintas
marcas, para un nivel de significación del 5%. Podemos decir que el analista es
efectivamente un factor que está incorporando variabilidad adicional.

Generalmente esta no es la hipótesis de interés ya que los bloques son una fuente de
variación reconocida.
• Si los efectos de los bloques son significativos indica que la precisión del experimento ha
aumentado en relación al diseño completamente aleatorizado.
• Si los efectos de bloques no son significativos implica que el investigador no tuvo éxito
en reducir la varianza del error agrupando las unidades en bloques o que las unidades
eran homogéneas.

28
Algunas consideraciones generales

¿Ha sido eficaz la construcción de los bloques?

• En caso afirmativo, la SCBloques explicaría una parte sustancial de la


SCTotal. También se reduce la SCError, dando lugar a un aumento de F0,
posibilitando que se rechace H0, mejorándose la potencia de la prueba.

• La construcción de bloques puede ayudar cuando se comprueba su eficacia,


pero debe evitarse su construcción indiscriminada. Ya que la inclusión de
bloques en un diseño da lugar a la disminución de los grados de libertad para
el error, aumenta el punto crítico y se hace más difícil rechazar H0. La potencia
del contraste es menor.

29
Evaluación gráfica de la interacción Bloque * Tratamiento

Recordemos que en un modelo aditivo, una restricción es que no debe haber


interacción entre los bloques y los tratamientos.

Si la variabilidad total se debiera en parte a la interacción, esta fuente de


variación incrementaría el cuadrado medio del error, lo cual derivaría en un
incremento del error tipo II.

Podemos verificar
esto de manera
gráfica. Si la interacción no es
significativa, las líneas Hacemos
debieran no cruzarse. un gráfico
de medias.

30
Gráfico de medias para evaluar interacción

Gráfico de Medias

4,61 • Observamos que el


Analista 6 es el que detecta
para todas las marcas
4,44 mayor contenido de
impurezas.
Impurezas-6

4,26
• Por el contrario, el Analista
1, siempre detecta menores
4,09 contenidos, tal vez trabaja
con menor precisión.

3,91 • Las líneas no se cruzan.


A B C D
Marca react

Impurezas-1 Impurezas-2 Impurezas-3


Impurezas-4 Impurezas-5 Impurezas-6

GRÁFICOS DE MEDIAS
GRÁFICOS ---DE PUNTOS--- Variable a graficar: Impurezas---Criterio de clasificación: uno de los factores --- En la
solapa Particiones: el otro factor---Aceptar.
Medidas de confianza: Ninguna. Tildar Particiones en el mismo gráfico.
En Herramientas gráficas, con botón derecho ---Conectores---Visibles

Una vez concluido el gráfico recordar sacar al factor de la solapa Particiones.

Terminado el gráfico podemos agregar Leyenda---click botón derecho sobre el gráfico. 31


Cuando el modelo es no aditivo existen efectos que interactúan, decimos que
hay interacción, es decir la diferencia en la respuesta media entre los bloques
no es la misma para todos los tratamientos. Se observa entrecruzamiento en el
gráfico.

Medias marginales estimadas de la


variable respuesta
48

46
bloque

1
44

2
42
3

40
4

38 5

36 6
1 2 3 4

Tratamiento
32
ANÁLISIS DE LOS SUPUESTOS
Los supuestos que deben cumplirse son los mismos que en un DCA.

•Prueba de Normalidad
Shapiro-Wilks sobre los residuos

• Prueba de Homogeneidad de varianzas


Levene sobre los residuos absolutos

•Gráfico para independencia


Gráfico de dispersión

33
Prueba de Comparaciones de a pares

Diferencia mínima significativa • ¿Cómo obtenemos el valor


redondeado realizando Tukey
manualmente?
• ¿Cómo lo empleamos?

Impurezas según Marca

2 * CME
 t  tuk (t ; glee; ) .
4,43
C
r
2 * 0,0035
 tuk ( 4;15;0.05) 
4,33

6
Impurezas

B
4,24  2,88  0,034  0,0984

4,15 A

A
4,06
A B C D
Marca react 34
Finalmente armamos la tabla de descriptivos
Las letras al lado de
los promedios son
Marca Promedio DE CV% Intervalo de confianza las que obtuvimos en
del 95% para la media las pruebas de
Lím Inf Lím Sup comparaciones
A 4,08 a 0,196 0,80 3,87 4,28 múltiples. Letras
iguales indican que no
B 4,14 a 0,141 0,57 3,99 4,29
se observan
C 4,26 b 0,219 0,86 4,03 4,49 diferencias
D 4,39 c 0,191 0,73 4,18 4,59 significativas.

Conclusión:
• Se observan diferencia significativa respecto al contenido de impurezas de las marcas A y B respecto a
C y D.
• Las marcas C y D difieren entre sí.
• Las marcas A y B no difieren significativamente entre sí.
• Podemos afirmar para un α 5% que las marcas más puras son A y B, no observándose diferencia entre
ellas.

Para los INTERVALOS DE CONFIANZA: ESTADÍSTICAS--Inferencia


basada en una muestra– Intervalos de confianza

Variable: impurezas
En solapa Particiones: Marcas
35
¡¡ FIN ¡¡

También podría gustarte