0% encontró este documento útil (0 votos)
47 vistas12 páginas

Diseño Experimental y Análisis de Varianza

Este documento introduce el tema del diseño experimental, definiendo conceptos clave como unidad experimental, factor, tratamiento y error experimental. Explica que el análisis de varianza es la herramienta fundamental para discernir las causas de variación en un experimento y comparar medias muestrales. También describe el diseño completamente aleatorio como el diseño más sencillo donde los tratamientos se asignan al azar a las unidades experimentales.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
47 vistas12 páginas

Diseño Experimental y Análisis de Varianza

Este documento introduce el tema del diseño experimental, definiendo conceptos clave como unidad experimental, factor, tratamiento y error experimental. Explica que el análisis de varianza es la herramienta fundamental para discernir las causas de variación en un experimento y comparar medias muestrales. También describe el diseño completamente aleatorio como el diseño más sencillo donde los tratamientos se asignan al azar a las unidades experimentales.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Mgt. Rina M.

Zamalloa Cornejo

DISEÑO EXPERIMENTAL

INTRODUCCIÓN.

Los modelos de “Diseño de experimentos” son modelos estadísticos clásicos cuyo objetivo es
averiguar si unos determinados factores influyen en la variable de interés y, si existe influencia
de algún factor, cuantificarla. Ejemplos donde habría que utilizar estos modelos son los
siguientes:

• En el rendimiento de un determinado tipo de máquinas (unidades producidas por


día) se desea estudiar la influencia del trabajador que la maneja y la marca de la
máquina.
• Se quiere estudiar la influencia del tipo de pila eléctrica y de la marca en la
duración de las pilas.
• Una compañía telefónica está interesada en conocer la influencia de varios
factores en la variable de interés “la duración de una llamada telefónica”. Los factores
que se consideran son los siguientes: hora a la que se produce la llamada; día de la
semana en que se realiza la llamada; zona de la ciudad desde la que se hace la llamada;
sexo del que realiza la llamada; tipo de teléfono (público o privado) desde el que se
realiza la llamada.
• Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello,
se desean controlar diferentes factores: profesor que imparte la asignatura; método de
enseñanza; sexo del alumno

La metodología del diseño de experimentos se basa en la experimentación. Es conocido que si


se repite un experimento, en condiciones indistinguibles, los resultados presentan variabilidad
que puede ser grande o pequeña. Si la experimentación se realiza en un laboratorio donde la
mayoría de las causas de variabilidad están muy controladas, el error experimental será pequeño
y habrá poca variación en los resultados del experimento. Pero si se experimenta en procesos
industriales, administrativos, ... la variabilidad es grande en la mayoría de los casos.

DEFINICION
Un experimento es una prueba o ensayo y un experimento diseñado es una prueba o serie de
pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso

1
Mgt. Rina M. Zamalloa Cornejo

o sistema de manera que sea posible observar e identificar las causas de los cambios en la
respuesta de salida.

El proceso o sistema bajo estudio puede representarse por medio del modelo.

Entonces podemos pensar que el proceso es una combinación de máquinas, métodos, personas
y otros recursos que transforman alguna entrada en una salida que tiene una o más respuestas
observables.
Las causas que influyen en la respuesta de un proceso pueden ser:
• Determinista: Conociendo las entradas se sabe el valor exacto de la salida.
• Aleatorio: La respuesta es variable en función de múltiples factores,
- Factores controlables: Causas que podemos especificar.
- Factores no controlables: Causas que no podemos determinar.
También un diseño experimental, es la distribución de tratamientos en las unidades
experimentales o viceversa, teniendo en cuenta las restricciones al azar con fines específicos
que tienden a disminuir el error experimental, es la secuencia completa de pasos tomados de
antemano para asegurar que se van a tener datos apropiados que permitan un análisis objetivo
y así obtener deducciones válidas con respecto al problema bajo investigación.

La metodología del Diseño de Experimentos estudia cómo variar las condiciones habituales de
realización de un proceso empírico para aumentar la probabilidad de detectar cambios
significativos en la respuesta, de esta forma se obtiene un mayor conocimiento del
comportamiento del proceso de interés.

Unidad experimental

2
Mgt. Rina M. Zamalloa Cornejo

Es el objeto o entidad, al que se le aplica un tratamiento y en el que se mide, evalúa y analiza


el efecto del tratamiento. La unidad puede ser: una parcela, un paciente en un hospital, una
porción de masa, un surco para el cultivo de papas, etc.
Factor
Es todo procedimiento o variables cuyo efecto se desea medir y comparar con los otros factores.
Implica un conjunto particular de condiciones, que se debe imponer a una unidad experimental
dentro de los confines del diseño seleccionado con el objeto de medir y comparar sus efectos.
Los niveles de un factor son los tipos o grados específicos del factor que se tendrán en cuenta
en la realización del experimento.
Tratamiento
Es una combinación específica de los niveles de los factores en estudio. Son, por tanto, las
condiciones experimentales que se desean comparar en el experimento. En un diseño con un
único factor son los distintos niveles del factor y en un diseño con varios factores son las
distintas combinaciones de niveles de los factores.
Error Experimental
Es la medida de la variación existente entre observaciones de las unidades experimentales
tratadas en forma similar, en un diseño experimental se tiene una variabilidad inherente a
la unidad experimental, es decir son las variaciones provocadas por las causas no asignables y
otra variabilidad debida a los tratamientos y la suma de estas dos variabilidades nos da la
variabilidad total.
Un experimento se realiza por alguno de los siguientes motivos:
• Determinar las principales causas de variación en la respuesta.
• Encontrar las condiciones experimentales con las que se consigue un valor extremo en
la variable de interés o respuesta.
• Comparar las respuestas en diferentes niveles de observación de variables controladas.
• Obtener un modelo estadístico-matemático que permita hacer predicciones de
respuestas futuras.
La utilización de los modelos de diseño de experimentos se basa en la experimentación y en el
análisis de los resultados que se obtienen en un experimento bien planificado. En muy pocas
ocasiones es posible utilizar estos métodos a partir de datos disponibles o datos históricos,
aunque también se puede aprender de los estudios realizados a partir de datos recogidos por
observación, de forma aleatoria y no planificada.

ANÁLISIS DE VARIANZA

3
Mgt. Rina M. Zamalloa Cornejo

Los modelos de ANVA son la herramienta fundamental para adentrarse en la naturaleza de la


variación de los acontecimientos; permiten discernir mejor las causas de los fenómenos y los
efectos de los factores involucrados. No solo lo introduce en la misma Naturaleza de las cosas,
sino que es la herramienta básica para el diseño de experimentos. Toda vez que necesite buscar
las causas que hayan descontrolado sus técnicas de laboratorio o de producción, podrá usar la
filosofía de estos modelos para realizar su investigación.
El ANVA puede ser considerado como una manera de verificar si dos o más medias muestrales
fueron extraídas de una misma población o de poblaciones con el mismo valor esperado. En
consecuencia, cuando estas medias muestrales no sean coincidentes habrá que suponer que
provienen de poblaciones diferentes por el efecto causado por un factor en estudio. Como por
ejemplo, comparar las medias muestrales de un placebo versus las medias de muestras con
diferentes dosis de un medicamento. O bien, la comparación entre sí de varias marcas
comerciales, proveedoras de drogas o kits de medición, como además comparar varios
operadores, o equipos, o pipetas entre sí, etc.
Cuando se trabaja con dos muestras se usa el modelo de Student para muestras independientes
como se vio en los temas anteriores. El ANVA es un método más general, que se extiende a
más de dos muestras y se puede demostrar que coincide con Student si se aplica a solo dos
muestras. Es decir, el modelo de Student es un caso particular del ANVA.
Estos modelos desarrollados por R. A. Fisher a principios de este siglo, tienen una distribución
teórica esperada: la función F, tabulada por G. W. Snedecor.

Sir Ronald Aylmer Fisher, matemático inglés nacido en


Londres el 17 de Febrero de 1890 y fallecido en Adelaida,
Australia, el 29 de Julio de 1962.

El análisis de varianza es la técnica mediante el cual se mide los


efectos de los tratamientos, puesto que descompone la varianza
total en diferentes fuentes de variabilidad definida por el modelo.
Si se desea comparar a tratamientos o niveles de un factor único, la respuesta que se observa en
cada uno de los a tratamientos es una variable aleatoria.

4
Mgt. Rina M. Zamalloa Cornejo

Datos Típicos para un Experimento Unifactorial

1 2 ….. j ….. n Total


T1 y11 y12 ….. y1 j ….. y1n y1•

T2 y21 y22 ….. y2 j ..... y2n y2 •

.
.
.
Ti yi1 yi 2 ….. yij ….. yin yi•

.
.
.
Ta ya1 ya2 ….. yaj ….. yan ya•

DISEÑO COMPLETAMENTE ALEATORIZADO

Es el diseño experimental más sencillo, es aquel en el que los tratamientos están


asignados completamente al azar a las unidades experimentales.
La objeción principal a los diseños completamente al azar estriba en su grado de
precisión. Ya que la aleatorización, no se restringe en ninguna forma para asegurar que las
unidades que reciben un tratamiento, sean similares a aquellas que reciben otro tratamiento,
toda la variación que existe entre las unidades pasa a formar parte del error experimental.
a) Cuando el material experimental es homogéneo.
b) Donde es posible la pérdida de unidades experimentales.
c) Cuando el material experimental es pequeño, por eso su uso en condiciones de campo
es limitado.

CARACTERÍSTICAS
- Los tratamientos se distribuyen al azar en todas las unidades experimentales y el número
de repeticiones o unidades por tratamiento puede ser igual o diferente.

5
Mgt. Rina M. Zamalloa Cornejo

- Este diseño es muy útil cuando las unidades experimentales tiene una variabilidad
uniformemente repetida.

VENTAJAS
a) Este diseño es fácil de planear.
b) Permite el máximo número de grados de libertad para el error.
c) Su análisis es sencillo.
d) Puede utilizarse desigual número de repeticiones sin complicar el análisis.

DESVENTAJAS
1.- La principal desventaja es que es más apropiado para pequeño número de tratamiento
y para un material experimental homogéneo y uniformemente repartido.
2.- El error experimental incluye toda la variabilidad posible debido a otros factores.

MODELO ESTADÍSTICO LINEAL PARA EL DISEÑO COMPLETAMENTE


ALEATORIZADO

El modelo estadístico del diseño completamente aleatorizado es:

yij =  +  i +  ij con i = 1, 2, ..., a j = 1, 2, ..., n

donde:

yij : representa la j – ésima observación del tratamiento i

 : media de la población total


 i : efecto del tratamiento i – ésimo
εij: representa al error experimental ó componente aleatorio del error.

Análisis del Modelo de Efectos Fijos


El modelo estadístico describe situaciones con respecto al efecto de los tratamientos, en este
caso particular los tratamientos podrían haber sido seleccionados específicamente por el
experimentador.
En esta situación, se desea probar hipótesis sobre las medias de los tratamientos y las
conclusiones se aplican solo a los niveles del factor considerados en el análisis.

SUPOSICIONES PARA EL DISEÑO COMPLETAMENTE ALEATORIZADO

6
Mgt. Rina M. Zamalloa Cornejo

a) Cada yij que se observa constituye una muestra aleatoria de una de las poblaciones

representadas.
b) Las observaciones yij también son independientes y se encuentran distribuidos con

 +  i y varianza  2 .
c) Los εij son independientes y se encuentran normalmente distribuidos con media cero y
varianzas iguales, es decir:
 ij ~ N ( 0,  2 ) i, j

d) Los tratamientos en este caso son de efectos fijos, más aun los efectos de los tratamientos se
consideran como desviaciones con respecto a la media general, es decir
t


i =1
i =0

HIPÓTESIS DEL DISEÑO COMPLETAMENTE ALEATORIZADO


Se desea probar la igualdad de las medias de los tratamientos:
H 0 : 1 = 2 = .... = a

H1: al menos algún  i diferente

Puesto que los efectos son considerados desviaciones de la media general entonces:

i =  +  i
Una forma equivalente de expresar las hipótesis son:

H0: 1 =  2 =  3 = ... =  a = 0

H1:  i ≠ 0 para algún i = 1, 2, ..., a

CÁLCULO Y ANÁLISIS DE VARIANZA PARA EL DISEÑO COMPLETAMENTE


ALEATORIZADO
El análisis de varianza consiste en dividir la variación total según sus orígenes de variación y
consideran cada uno de ellos como estimadores de  2 , teniendo en cuenta los supuestos que
acompañan al diseño y considerando que se cumple la hipótesis nula, es decir que todas las
medias son iguales, esto es que las poblaciones se centran en un mismo punto (la media común)
y solo restara demostrar que poseen la misma varianza, caso contrario Ho es falsa porque será
diferente.
Ahora describiremos este método y para ello utilizaremos la siguiente simbología
n
Sea. yi . =  yij ; el total del i – ésimo tratamiento
j =1

7
Mgt. Rina M. Zamalloa Cornejo

a n a
y.. =  yij =  yi . ; el total de todas las observaciones
i =1 j =1 i =1

además:
yi .
yi . = ; promedio de la observación del i – ésimo tratamiento.
n
y..
y .. = ; promedio de todas las observaciones.
an
La suma total de desvíos al cuadrado puede dividirse del modo siguiente
2

 ( yij − y..) =  ( yi. − y..) + ( yij − yi. )


a n a n
2

i =1 j =1 i =1 j =1

=  ( yi . − y ..) + 2 ( yi . − y ..) ( yij − yi .) + ( yij − yi .) 


a n
2 2

i =1 j =1  

=  ( yi . − y ..) + 2 ( yi . − y ..) ( yij − yi .) +  ( yij − yi .)


a n a n a n
2 2

i =1 j =1 i =1 j =1 i =1 j =1

De donde el producto cruzado: 2 ( yi . − y ..) ( yij − yi .) = 0


a n

i =1 j =1

Por lo tanto

 ( yij − y..) =  ( yi . − y..) +  ( yij − yi .)


a n a n a n
2 2 2

i =1 j =1 i =1 j =1 i =1 j =1

Donde :

SCT =  ( yij − y ..) ; suma de cuadrados total


a n
2

i =1 j =1

a n
SC =  ( yi . − y ..) ; suma de cuadrados debido a los tratamientos
2

i =1 j =1

SCE =  ( yij − yi .)
a n
2
; suma de cuadrados debido al error
i =1 j =1

La descomposición de la suma de cuadrados es:


SCT = SC + SCE
Desarrollando la suma de cuadrados de cada uno de los términos
a
yi .2 y 2 ..
PARA LOS TRATAMIENTOS: SC =  −
i =1 n N

a n
y 2 ..
PARA EL TOTAL SCT =  yij 2 −
i =1 j =1 N

Donde N = an

8
Mgt. Rina M. Zamalloa Cornejo

PARA EL ERROR

Puesto que SCT = SC + SCE entonces SCE = SCT − SC

ANÁLISIS DE LOS GRADOS DE LIBERTAD PARA EL DISEÑO


COMPLETAMENTE ALEATORIZADO

Cuando un estadístico se usa para estimar un parámetro, el número de grados de libertad


disponible depende de las restricciones impuestas sobre las observaciones, por cada restricción
impuesta se pierde un grado de libertad; es así que en este diseño en la suma de cuadrados del
total se estima y.. por tanto tendrá (an-1) grados de libertad; la suma de cuadrados de los
tratamientos tiene (a-1) grados de libertad. Además:
glSCT = glSC + glSCE
de donde:
glSCE = glSCT − glSC

glSCE = ( an − 1) − ( a −1)
glSCE = a ( n −1)

ESTADÍSTICO DE PRUEBA PARA EL DISEÑO COMPLETAMENTE


ALEATORIZADO

La suma de cuadrados divididos entre sus grados de libertad da origen a lo que se conoce como
cuadrados medios; entonces:
SC SC
CM = = ; cuadrado medio del tratamiento
gl ( SC ) a − 1

SCE SCE
CME = = ; cuadrado medio del error
gl ( SCE ) t ( r − 1)

SC SCE
, 2 son variables aleatorias independientes con (t – 1) y t(r – 1) grados de libertad
2

respectivamente.
a
n i2
y E CM   =  2 + i =1 indica que el CM es un estimador sesgado de 2 y
a −1

E CME  =  2 indica que

9
Mgt. Rina M. Zamalloa Cornejo

CME es un estimador insesgado de  2 .

El estadístico de prueba apropiado es el cociente de los cuadrados medios:


SC
CM 
FC = = a −1
CME SCE
a (n − 1)

El cual tiene una distribución F con ( a − 1, a(n − 1) ) grados de libertad.

DECISIÓN:
CM 
Puesto que FC = y F0 = F  , (a − 1), a (n − 1) 
CME
a) Si FC < F0 no se rechaza la hipótesis nula

b) Si FC > F0 entonces se rechaza la hipótesis nula, es decir se acepta la hipótesis alterna;

además para α = 0.05 se dice que la diferencia es significativa “*” y para α = 0.01 se dice
que la diferencia es altamente significativa “**”.
El cuadro que refleja la metodología se denomina cuadro de análisis de varianza (ANVA)
y es el siguiente :

FUENTES GRADOS DE SUMA DE CUADRADOS FC

DE VARIABILIDAD LIBERTAD CUADRADO MEDIOS


S
TRATAMIENTO a −1 SC CMTr =
SC CM 
a −1
FC =
CME

ERROR a(n − 1) SCE CME =


SCE
a ( n − 1)

TOTAL an − 1 SCT

METODOS DE COMPARACION MULTIPLE


Si al efectuar un análisis de varianza para un modelo de efectos fijos la igualdad de
medias es rechazada y se acepta la diferencia de estas, no se especifica exactamente cuál de
ellas es diferente.
En esta situación es útil realizar comparaciones adicionales entre grupos de medias de los
tratamientos.

10
Mgt. Rina M. Zamalloa Cornejo

METODO DE LA MINIMA DIFERENCIA SIGNIFICATIVA (LSD)


Este procedimiento fué sugerido por Fisher en 1935 y es el primer método de
comparaciones múltiples que vamos a utilizar. Dicho procedimiento consiste en una prueba de
hipótesis por parejas basada en la distribución t.
Se desea probar H 0 : i =  j para todo i  j (i,j =1,..,a)

La variable
(y
i• − y j • ) − ( i −  j )
ta ( n −1) gl , así un intervalo de confianza al 100 % para
1 1
CME  + 
 ni n j 
 
i −  j está dado por:

  
 LI = yi• − y j • − t0 CME  1 + 1 
 n n 
 i j 
IC ( i −  j ) =
100 %
 1 1
 LI = yi• − y j • + t0 CME  + 
  ni n j 
De aquí:

1 1
LSD = t0 CME  +  y t0 = t  , a (n − 1) gl  prueba de dos colas
n n 
 i j 

Por lo tanto se rechaza H 0 y se acepta que hay diferencia de medias si yi• − y j •  LSD

PRUEBA DE TUKEY
Cuando realizamos un análisis de varianza, un valor de F significativo nos indica que no
todas las condiciones producen el mismo efecto sobre la variable independiente. Con el fin de
tener mayores elementos para la toma de decisiones es importante saber donde se encuentran
dichas diferencias significativas y si éstas siguen una tendencias que nos permitan una mejor
toma de decisiones.
Una prueba que nos permite evaluar dicha diferenciación es la prueba deTukey, que mide
la diferencia de los valores de la medias de dos grupos en términos de la varianza intragrupal.

PRUEBA DE INTERVALOS MULTIPLES DE DUNCAN


Un procedimiento usado ampliamente para comparar todas las parejas de medias es el
de la prueba de intervalos múltiples desarrollado por Duncan (1955).

11
Mgt. Rina M. Zamalloa Cornejo

La prueba de rango múltiple Duncan es una comparación de las medias de tratamientos todos
contra todos de manera que cualquier diferencia existente entre cualesquier tratamiento contra
otro se verá reflejado en este análisis. Utiliza un nivel de significancia variable que depende del
número de medias que entran en cada etapa de comparación. La idea es que a medida que el
número de medias aumenta, la probabilidad de que se asemejen disminuye. Para obtener los
comparadores Duncan, se toman de la tabla de Duncan los valores de acuerdo al número de
tratamientos y con los grados de libertad del error. Cada uno de estos valores será multiplicado
por el error estándar de la media y éstos serán los comparadores para determinar cuales
diferencias son significativas.
Para aplicar dicha prueba en muestras del mismo tamaño, se disponen en orden
ascendente los a promedios de tratamientos y se determina el error estándar de cada promedio,
usando.
CME
S yi• =
n
Se prueban las diferencias entre las medias empezando con la media más grande contra la
segunda más grande, y así sucesivamente,
comparando en cada caso con un valor crítico obtenido por tablas.
Es muy eficaz y popular debido a su poder de discriminación.
Si el nivel de protección es α, entonces las pruebas de las medias tienen un nivel de significación
igual o mayor que α.

COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad relativa (sin unidades de medida) cuyo uso es para
cuantificar en términos porcentuales la variabilidad de las unidades experimentales frente a la
aplicación de un determinado tratamiento. En experimentación no controlada (condiciones de
campo) se considera que un coeficiente de variabilidad mayor a 35% es elevado por lo que se
debe tener especial cuidado en las interpretaciones y ó conclusiones; en condiciones controladas
(laboratorio) se considera un coeficiente de variabilidad mayor como elevado. La expresión
estimada del coeficiente de variabilidad es:
S
CV =  100%
X

12

También podría gustarte