0% encontró este documento útil (0 votos)
33 vistas7 páginas

Unidad 7

Diseño Experimental

Cargado por

pesquivias
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • modelos de efectos fijos,
  • interacción,
  • diseño experimental,
  • análisis de varianza de dos fa…,
  • espectrofotómetro,
  • análisis de varianza,
  • diseños de experimentos aleato…,
  • diseños de experimentos con va…,
  • resultados experimentales,
  • métodos estadísticos
0% encontró este documento útil (0 votos)
33 vistas7 páginas

Unidad 7

Diseño Experimental

Cargado por

pesquivias
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • modelos de efectos fijos,
  • interacción,
  • diseño experimental,
  • análisis de varianza de dos fa…,
  • espectrofotómetro,
  • análisis de varianza,
  • diseños de experimentos aleato…,
  • diseños de experimentos con va…,
  • resultados experimentales,
  • métodos estadísticos

Diseño de Experimentos. Guía docente.

Unidad 7

Introducción
Este guía docente está dedicada a la unidad 7 relacionada con los diseños experimentales con efectos
aleatorios.

Diseños con efectos aleatorios


Los efectos aleatorios son otro enfoque diferente del estudiado hasta el momento para diseñar experimentos
y modelar datos. Los efectos aleatorios son apropiados cuando los tratamientos (los niveles del factor) son
muestras aleatorias de una población de tratamientos potenciales.
Supongamos la siguiente situación experimental. Una empresa cuenta con 50 máquinas que fabrican cajas de
cartón para conservas, y quieren entender la variación en la resistencia de los cartones. Eligen 10 máquinas al
azar de las 50, asignando al azar 400 lotes de materia prima para cartón a las diez máquinas y confeccionando
40 cartones por máquina. Los cartones resultantes se someten a pruebas de resistencia. Esta es un diseño
aleatorizado, con diez tratamientos y 400 unidades.
Podríamos considerar la idoneidad del modelo lineal de un factor fijo estudiado en la unidad 2:

yij = µ + αi + ϵij

En este modelo los parámetros µ y las αi se consideran constantes desconocidas, además se añade la cláusula
que la suma de todos los efectos αi es cero. El objetivo principal del modelo es hacer inferencia sobre
todos estos parámetros. Se denomina de efectos fijos porque los efectos de los tratamientos son parámetros
constantes -aunque desconocidos- de las poblaciones asociadas a cada nivel.
Ahora bien, un modelo de efectos fijos no resulta realmente apropiado para nuestro ejemplo de los cartones.
Sigue teniendo sentido descomponer la variabilidad de los datos en una media general, más el efecto de los
tratamientos más el error aleatorio, pero en cambio la suposición de efectos constantes no es adecuada. Mucho
más útil resulta considerar una inferencia sobre toda la población de máquinas y no sólo sobre aquellas
que hemos escogido (muestreado) al azar. Observemos además que si planteásemos repetir el experimento
una segunda vez, al escoger las máquinas de nuevo al azar tendríamos otro conjunto aleatorio de niveles del
factor. Por ejemplo, la inferencia sobre el parámetro α1 del primer experimento no informaría sobre el α1 del
segundo experimento ya que muy probablemente corresponderían a dos máquinas distintas de la población.
Se plantea una nueva modelización donde los componentes del modelo parecen ser los mismos,

yij = µ + Ai + ϵij

Esto es realmente así para µ que sigue correspondiendo a la media general de todas las poblaciones y a los
términos ϵij que seguimos asumiendo como variables independientes con distribución normal de media cero y
varianza σ 2 , como en el caso de los modelos de efectos fijos.
Sin embargo en el modelo de efectos aleatorios los efectos Ai son variables aleatorias con distribución
normal de media cero y varianza σA 2
. Usamos letras latinas para resaltar que son variables aleatorias y para
distinguirlas de las constantes αi de los modelos de efectos fijos.

1
Otra diferencia importante es que las ϵij y las Ai son variables aleatorias mutuamente independientes. En
consecuencia, la variable respuesta yij tiene varianza σA
2
+ σ 2 , llamamos a σA
2
y σ 2 las componentes de la
varianza.
Hay que destacar que en un modelo de efectos aleatorios de un factor hay solamente tres parámetros: la media
general (µ), la varianza del error (σ 2 ) y la varianza de los efectos (σA
2
). Los efectos Ai son variables aleatorias,
no parámetros. En contraposición, en un modelo de efectos fijos con a niveles hay a + 2 parámetros.
Para contrastar si el factor aleatorio es significativo, planteamos el contraste de hipótesis sobre σA
2
, esto es

H0 : 2
σA =0
H1 : 2
σA >0

La tabla ANOVA en los modelos de un factor con efectos aleatorios, es idéntica a la tabla ANOVA de un
factor con efectos fijos. La tabla ANOVA tiene exactamente las mismas filas -factor, residuo y total-, y las
mismas columnas -Fuente de variación, suma de cuadrados, grados de libertad, cuadrados medios y F-.
Para estimar las componentes de la varianza, σ 2 y σA
2
debemos tener en cuenta la esperanza matemática de
los cuadrados medios del error y del factor A (Display 11.1 del libro). Tenemos que

Tabla 1

Factor E(MS)
A σ 2 + nσA
2

Error σ 2

Por tanto, la estimación de las componentes de la varianza σ 2 y σA


2
se obtiene igualando los E(MS) con los
cuadrados medios respectivos en la tabla ANOVA. Esto es:

σ 2 + nσA
2
= M SA
σ = M SE
2

Aplicando el método de los momentos aislamos los estimadores de las sigmas:

σ̂ 2 = M SE
2
σ̂A = M SA −M SE
n

Sobre la independencia de las observaciones


Las distintas observaciones de la variable respuesta, yij ya no son todas ellas independientes entre sí.
Ciertamente el modelo exigue que los errores ϵij sean independientes pero esto ya no implica que lo sea la
variable respuesta, yij . Para demostrarlo, consideremos la covarianza para dos datos de un mismo nivel i:

cov (yij , yij ′ ) = cov (µ + Ai + ϵij , µ + Ai + ϵij ′ ) = cov (Ai + ϵij , Ai + ϵij ′ ) =
= cov (Ai , Ai ) + cov (Ai , ϵij ′ ) + cov (ϵij , Ai ) + cov (ϵij , ϵij ′ ) =
= cov (Ai , Ai ) = σA
2
si la hipótesis nula no es cierta ̸= 0

En cambio, para dos observaciones de distintos niveles i1 e i2

cov (yi1 j1 , yi2 j2 ) = cov (µ + Ai1 + ϵi1 j1 , µ + Ai2 + ϵi2 j2 ) = cov (Ai1 + ϵi1 j1 , Ai2 + ϵi2 j2 ) =
= cov (Ai1 , Ai2 ) + cov (Ai1 , ϵi2 j2 ) + cov (ϵi1 j1 , Ai2 ) + cov (ϵi1 j1 , ϵi2 j2 ) =
= cov (Ai1 , Ai2 ) = 0 y al ser normales e incorrelacionadas, son independientes

2
Modelo de dos factores aleatorios
La ecuación del modelo y sus componentes son:

yijk = µ + Ai + Bj + ABij + ϵijk

donde i = 1, ..., a, j = 1, ..., b y k = 1, ..., n. Asumimos que los ϵijk son independientes con distribución
normal de media cero y varianza σ 2 , los efectos Ai son variables aleatorias con distribución normal de media
cero y varianza σA 2
, los efectos Bj son variables aleatorias con distribución normal de media cero y varianza
σB y la interacción ABij son variables aleatorias con distribución normal de media cero y varianza σAB
2 2
.
Ahora las componentes de la varianza son σ , σA , σB y σAB . La varianza de la variable respuesta yijk igual
2 2 2 2

a σA
2
+ σB2
+ σAB
2
+ σ2 .
Los contrastes de interés serán ahora:

H0 : 2
σA =0
H1 : 2
σA >0

H0 : 2
σB =0
H1 : 2
σB >0

H0 : 2
σAB =0
H1 : 2
σAB >0

Para resolver dichos contrastes calcularemos la tabla ANOVA correspondiente, pero es importante resaltar
que el denominador del estadístico F ya no será para todos los términos los MS del error. De hecho, si
examinamos la esperanza de los MS (Display 11.2 del libro) tenemos

Tabla 2

Factor E(MS)
A σ 2 + nσAB
2
+ nbσA
2

B σ + nσAB + naσB
2 2 2

AB σ + nσAB
2 2

Error σ2

En cada contraste debemos formar el cociente de la F utilizando en el numerador y el denominador dos


términos cuyas esperanzas de cuadrados medios que sean iguales cuando la H0 sea cierta. Entonces, en el
caso del contraste H0 : σA
2
= 0, estas son las esperanzas de los cuadrados medios de A y de la interacción AB.
Por tanto, calcularemos la F dividiendo los MS de A por los MS de la interacción

M SA
F =
M SAB

En el contraste H0 : σB
2
= 0, estas son las esperanzas de los cuadrados medios de B y de la interacción AB.
Por tanto, calcularemos la F dividiendo los MS de B por los MS de la interacción

M SB
F =
M SAB

En el contraste H0 : σAB
2
= 0, estas son las esperanzas de los cuadrados medios de la interacción AB y del
error. Por tanto, calcularemos la F dividiendo los MS de AB por los MS del error. En esta fila no hay cambios
respecto al diseño de dos factores fijos.

3
M SAB
F =
M SE

En resumen, la tabla ANOVA para un diseño experimental con dos factores aleatorios con interacción es de
la forma

Factor SS gl MS F
A SSA (a-1) M SA F = M SA /M SAB
B SSB (b-1) M SB F = M SB /M SAB
AB SSAB (a-1)(b-1) M SAB F = M SAB /M SE
Error SSE (n-1)ab M SE

Las estimaciones de las varianzas σA2


, σB
2
, σAB
2
y σ 2 las obtendremos identificando los cuadrados medios de
cada factor con las esperanzas de los cuadrados medios (Tabla 2). Resultan las estimaciones

σ̂ 2 = M SE
−σ̂ 2
2
σ̂AB = M SABn2 2
M SB −σ̂ −nσ̂AB
σ̂B2
= na
M SA −σ̂ 2 −nσ̂AB
2
σ̂A2
= nb

Ejemplo
Evaluación del rendimiento de un instrumental especializado con las componentes de la varianza
Un fabricante desarrolla un nuevo espectrofotómetro de uso en laboratorios clínicos. El proceso de desarrollo
estaba en la etapa piloto de ensamblaje, posteriormente deberá evaluarse el rendimiento de cada instrumento
en la línea de producción. Una componente crítica en el rendimiento de instrumentos es la uniformidad de las
mediciones entre los instrumentos y entre los operarios. En este caso específico, el equipo que desarrolló el
instrumento deseaba saber si la variabilidad de las mediciones entre instrumentos y entre operarios estaba
dentro de los estándares aceptables para las aplicaciones clínicas.
Se estableció un diseño factorial de tratamientos con instrumentos y operarios como factores; debían
probarse cuatro instrumentos en cuatro operarios separados. Cada operario realizo dos mediciones con cada
instrumento.
Se seleccionaron cuatro instrumentos al azar de la línea de producción y se eligieron cuatro operarios
especializados al azar de la plantilla. Se prepararon 32 muestras de suero del mismo reactivo, se asignaron al
azar 8 muestras a cada operario que analizo dos de ellas al azar con cada instrumento. La variable respuesta
corresponde a los niveles de triglicéridos (mg/dl) en las muestras de suero.
Lectura de datos y creación del el data.frame
y <- c(142.3, 144.0, 148.6, 146.9,142.9, 147.4, 133.8, 133.2,
134.9, 146.3, 145.2, 146.3, 125.9, 127.6,108.9, 107.5,
148.6, 156.5, 148.6, 153.1, 135.5, 138.9, 132.1, 149.7,
152.0, 151.4, 149.7, 152.0, 142.9, 142.3, 141.7, 141.2)
operario <- rep(1:4, each = 8)
instrumento <- rep(rep(1:4, each = 2), 4)
df <- data.frame(y, operario, instrumento)
df$operario <- as.factor(df$operario)
df$instrumento <- as.factor(df$instrumento)
head(df)

## y operario instrumento
## 1 142.3 1 1

4
## 2 144.0 1 1
## 3 148.6 1 2
## 4 146.9 1 2
## 5 142.9 1 3
## 6 147.4 1 3
Los componentes del modelo son,

yijk = µ + Ai + Bj + ABij + ϵijk

donde i = 1, ..., 4, j = 1, ..., 4 y k = 1, 2, Ai es el efecto operario, Bj es el efecto instrumento y ABij es el


efecto de la interacción operario-instrumento. Además, Ai es N (0, σA 2
), Bj es N (0, σB
2
), ABij es N (0, σAB
2
)
y ϵijk es N (0, σ ), todas ellas variables aleatorias independientes. La variable respuesta es por construcción
2

del modelo un variable aleatoria N (0, σY2 ) donde σY2 = σA 2


+ σB
2
+ σAB
2
+ σ 2 . Asumiremos las suposiciones de
la modelización, y pasaremos a resolver los contrastes de interés. Los contrastes a resolver son: H0 : σA 2
= 0,
H0 : σB = 0 y H0 : σAB = 0, donde las hipótesis alternativas, en cada caso, afirman que la varianza es mayor
2 2

que cero.
Calculemos la tabla ANOVA. Hasta ahora, usábamos la función aov para ajustar el modelo lineal. Pero esta
función no permite especificar qué factores son aleatorios y asume que todos son fijos. Así pues,
deberemos modificar la tabla anova proporcionada.

Solución modificando la tabla proporcionada por defecto

modelo <- aov(y ~ operario*instrumento, data = df)


taov <- anova(modelo)
taov # tabla por defecto

## Analysis of Variance Table


##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## operario 3 1334.46 444.82 24.8569 2.907e-06 ***
## instrumento 3 1647.28 549.09 30.6836 7.192e-07 ***
## operario:instrumento 9 786.04 87.34 4.8805 0.002936 **
## Residuals 16 286.33 17.90
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como hemos indicado los cocientes F de los factores principales son erróneos para este modelo. Calculemos
los correctos de acuerdo con la Tabla 2, así como los p valores correspondientes.
F_A <- taov[1,3]/taov[3,3] # calcula los MS de la fila operario
pval_A <- pf(F_A,taov[1,1],taov[3,1],lower.tail = F) # calcula el p-valor de la fila operario
F_B <- taov[2,3]/taov[3,3] # calcula los MS de la fila instrumento
pval_B <- pf(F_B,taov[2,1],taov[3,1],lower.tail = F) # calcula el p-valor de la fila instrumento

# revertir cálculos a la tabla


taov[1,4] <- F_A
taov[1,5] <- pval_A
taov[2,4] <- F_B
taov[2,5] <- pval_B
taov

## Analysis of Variance Table


##

5
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## operario 3 1334.46 444.82 5.0931 0.024802 *
## instrumento 3 1647.28 549.09 6.2870 0.013724 *
## operario:instrumento 9 786.04 87.34 4.8805 0.002936 **
## Residuals 16 286.33 17.90
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Concluimos que los factores instrumento y operario, y la interacción entre ambos son significativos.
Es importante, resaltar que a diferencia de los modelos de efectos fijos ahora NO haremos comparaciones
múltiples, pasaremos a evaluar las componentes de la varianza.
• Varianza residual: σ̂ 2 = M SE = 17.90
• Varianza de la interacción: σ̂AB
2
= 34.72
• Varianza del factor operario: σ̂A
2
= 44.69
• Varianza del factor tratamiento: σ̂B
2
= 57.72
La estimación de la varianza de la variable respuesta es σ̂Y2 = 44.69 + 57.72 + 34.72 + 17.90 = 155.03 y por
tanto, el porcentaje de las componentes de la varianza son:

2
σ̂A 44.69
= = 0.29 = 29%
2
σ̂Y 155.03

2
σ̂B 57.72
= = 0.37 = 37%
2
σ̂Y 155.03

2
σ̂AB 34.72
= = 0.22 = 22%
2
σ̂Y 155.03

σ̂ 2 17.90
= = 0.12 = 12%
2
σ̂Y 155.03

Concluimos, que el instrumento es la causa principal de variabilidad en la respuesta (37%) , seguido del
factor operario (29%).

Comentarios sobre el temario.


Más adelante, en próximas guía docentes, se estudiará el caso de un factor fijo y el otro aleatorio, los
denominados modelos mixtos. También se analizará el caso de dos factores sin réplicas (es decir, sólo un dato
por combinación experimental). En este último caso, donde no hay más que una réplica (n = 1), no es posible
incluir la interacción en el modelo y las F’s siempre dividirán los cuadrados medios por el término del error
sean los dos factores de tipo fijo, de tipo aleatorio o bien mixtos.

6
Materiales de estudio

Temario del curso Referencia bibliográfica (libro Oehlert)


De 7.1 a 7.4 Páginas de 253 a 267

Temas
• [7.1] Modelos en diseños con efectos aleatorios
• [7.2] Análisis de la varianza en diseños con efectos aleatorios
• [7.3] Test de hipótesis en diseños con efectos aleatorios
• [7.4] Componentes de la varianza

Actividades complementarias
Resolver el problema 11.2 (pág. 277) del libro de Oehlert.

También podría gustarte