Diseño Experimental en Ingeniería Metalúrgica
Diseño Experimental en Ingeniería Metalúrgica
FACULTAD DE INGENIERIA
ESCUELA DE FORMACION PROFESIONAL
INGENIERIA METALURGICA
MODULO
OBJETIVOS
UNIDAD I: EXPERIMENTOS POR COMPOSICION SIMPLE Y DE UN SOLO FACTOR
Objetivo Especfico: explicar, analizar e identificar los conceptos de experimentos de composicin simple y
experimentos de un solo factor.
Semana Sesin Contenido Estrategias Indicadores de logro Instrumentos
1 1 Diseo experimental: Clase magistral Describe las etapas Dinmica de
Diseo dinmico diseo esttico. Ilustraciones del experimento. grupo
Aplicaciones, directrices para el Organizadores Explica las Mapas
2 diseo de experimentos. previos. aplicaciones del conceptuales
Etapas de una investigacin. diseo experimental. Exposicin.
Examen escrito
2 3 Experimentos de comparacin Clase magistral Compara si dos Dinmica de
simple. Ilustraciones. condiciones de grupo
Conceptos bsicos. Organizadores tratamientos producen Mapas
Muestreo y distribucin de previos. resultados iguales. conceptuales
muestreo. Exposicin.
Examen escrito
3 4 Inferencia de las medias diseos Clases Aplica la inferencia Dinmica de
aleatorizados. magistral estadstica. grupo
Dinmica Utiliza graficaos para Examen escrito
grupal analizar T.
4 5 Experimentos de un solo factor. Clases Disea y analiza los Dinmica de
Anlisis de varianza. magistral. experimentos de un grupo
Anlisis de efectos fijos: Resmenes. solo factor en el Mapas
Descomposicin SST, anlisis Dinmica campo prctico. conceptuales
estadstico. grupal Exposicin.
Examen escrito
Lectura: Investigacin en la Ingeniera
Actividades: Diseo de un experimento de comparacin simple
UNIDAD II: BLOQUES ALEATORIOS, BLOQUES ALEATORIOS COMPLETO E INCOMPLETO
Objetivo Especfico: Explicar, analizar e identificar los diseos de bloques aleatorios, diseos de imitacin, diseo de
bloques completos e incompletos.
5 6 Bloques Latino Clase magistral Disea bloquea Dinmica de
Anlisis estadstico. Ilustraciones. aleatorios. grupo
Calculo de los efectos. Organizadores Describe y compara Mapas
Anova. previos. dos condiciones o mentales
tratamientos. Exposicin.
Examen escrito
Concepto
En un Experimento, el experimentador escoge ciertos factores para su estudio, los altera
deliberadamente de forma controlada y despus, observa el efecto resultante.
El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la fbrica, en unos
almacenes, en los locales del usuario, etc.
Concepto
El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos mnimos:
Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir por variables
insospechadas (=ruido), como errores de medida desproporcionados, etc.
Debe poder revelar la existencia de cualquier causa importante de variacin, aunque no haya
sido adelantada como hiptesis.
Debe mantener los costos de experimentacin a un nivel razonable, en comparacin con el
problema objeto de estudio.
Debe tener un alto grado de seguridad en las respuestas.
Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las variables
estudiadas, un buen indicador de las pruebas que se obtendran en el taller o "in situ".
Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr
adems cuidado de interferir lo menos posible en el trabajo normal y protegerse de las
interferencias no autorizadas o involuntarias en la prueba por parte del personal adepto.
Ejemplo 1.1
Caracterizacin de un Proceso.
Se utiliza una mquina de soldar en onda en el proceso de manufactura de tarjetas de circuitos
impresos. La mquina limpia las tarjetas en un bao de fundente, las precalienta y las hace pasar
en banda transportadora a travs de una onda de soldadura fundida. Este proceso de soldadura
forma las conexiones elctricas y mecnicas entre los componentes de las tarjetas.
En la actualidad, el proceso opera a un nivel de defectuosos aproximado de 1%. Es decir, alrededor
del 1 % de los puntos de soldadura, en una tarjeta son defectuosos y requieren retoque manual.
Sin embargo, dado que en promedio una tarjeta de circuito impreso contiene ms de 2000 uniones
de soldadura. Incluso un nivel de defectuosos de 1% significa que demasiadas uniones de
soldadura requieren trabajo. El ingeniero de proceso responsable de esta rea quisiera emplear
un experimento diseado a fin de determinar que parmetros de la mquina Influyen en la
ocurrencia de defectos de soldadura y que ajustes deben hacerse en dichas variables para reducir
tales defectos.
La mquina de soldar en onda tiene varias variables que pueden controlarse. Entre ellas se
incluyen:
1. Temperatura de la soldadura
2. Temperatura de precalentamiento
3. Velocidad de banda transportadora
4. Tipo fundente
5. Densidad relativa del fundente
6. Profundidad de la onda de soldadura
7. Angulo de la banda transportadora
Adems de estos factores controlables, existen varios otros cuyo control no es fcil durante el
proceso de manufactura ordinario, aunque podran controlarse para los fines de una prueba. Ellos
son:
1. Espesor de la tarjeta de circuitos impresos.
2. tipos de componentes usados en la tarjeta.
3. Disposicin de los componentes en la tarjeta.
4. Operario.
5. Ritmo de produccin.
En estas circunstancias el ingeniero est interesado en caracterizar la mquina de soldadura en
onda; es decir, desea determinar los factores (controlables e incontrolables) que influyen en la
ocurrencia de defectos en las tarjetas de circuitos impresos. Para lograrlo puede disear un
experimento que le permita estimar la magnitud y direccin de los efectos del factor: esto es,
cuanto cambia la variable de respuesta (defectos por unidad) cuando se modifica cada factor, y si
cambian los factores simultneamente produce resultados distintos de los que se obtienen con
ajustes de factores individuales Algunas veces, esto se denomina experimento de escrutinio.
La informacin que se obtiene de este experimento de escrutinio o caracterizacin se utiliza
entonces para identificar los factores crticos del proceso y determinar la direccin de ajuste de
estos factores a fin de reducir an ms el nmero de defectos por unidad. El experimento tambin
puede proporcionar informacin acerca de cules factores deben controlarse con ms cuidado
durante el proceso ordinario de manufactura a fin de evitar altos niveles de productos defectuosos
y comportamiento errtico del proceso. De este modo un resultado del experimento podra ser la
aplicacin de tcnicas tales como los diagramas de control a una o ms variables del proceso
como temperatura de la soldadura, as como a su salida. Con el tiempo, si el proceso mejora lo
suficiente, suele ser posible basar la mayor parte del plan de control del proceso en la regulacin
de sus variables de entrada en vez de hacerlo en el anlisis de diagramas de control de la salida.
Ejemplo 1.2
Optimizacin de un Proceso
En un experimento de caracterizacin, normalmente nos interesa determinar cules variables, del
proceso influyen en la respuesta. Un siguiente paso lgico es optimizar esto es, determinar en qu
regin los procesos importantes conducen a la mejor respuesta posible. Por ejemplo, si la
respuesta es rendimiento, buscaramos una regin en que este fuera mximo mientras que si la
respuesta es variabilidad en una dimensin critica de un producto, buscaramos una regin de
variabilidad mnima.
Supngase que nos interesa mejorar el rendimiento de un proceso qumico. Sabemos, con base
en los resultados de un experimento de caracterizacin, que las dos ms importantes variables de
proceso que influyen en el rendimiento son temperatura y tiempo de reaccin. En la actualidad el
proceso ocurre a 155 F en un tiempo de reaccin de 1.7 h, con rendimiento aproximada de 75%.
En la Fig. 1-2 es una vista en planta desde arriba de la regin tiempo-temperatura. En dicha grfica,
las lneas de rendimiento constante se unen para formar contornos de respuesta, de los cuales se
muestran los de 60, 70, 80, 90 y 95 % de rendimiento.
Fig. 1-2 Diagrama de contornos de rendimiento en funcin del tiempo y la temperatura de reaccin, para ilustrar un
experimento de optimizacin.
Estos contornos son proyecciones en la regin al tiempo temperatura de cortes transversales de
la superficie de rendimiento que corresponden a los rendimientos antes mencionados. Dicha
superficie se denomina en ocasiones superficie de respuesta. La verdadera superficie de
respuesta real correspondiente a la Fig. 1-2 es desconocida para el personal de proceso, de modo
que se requerirn mtodos experimentales a fin de optimizar el rendimiento con respecto a tiempo
y temperatura.
Para localizar el intervalo ptimo, es necesario realizar un experimento en el que se hagan variar
simultneamente tiempo y temperatura. Esto se denomina experimento factorial; la Fig. 1-2 es un
ejemplo de los resultados que se obtienen cuando tiempo y temperatura varan en dos niveles,
Las respuestas observadas en las cuatro esquinas del cuadrado indican que debemos
desplazarnos en la direccin general de aumento en la temperatura y descenso en el tiempo de
reaccin con objeto de incrementar el rendimiento. Podran efectuarse algunas pocas variaciones
ms en esta direccin, lo cual bastara para localizar la zona de mximo rendimiento.
Ejemplo 1.3
Diseo de un Producto
A menudo es posible aplicar los mtodos del diseo experimental en el proceso de diseo de un
producto. Para ilustrar lo anterior, supngase que un grupo de ingenieros disea una bisagra para
la puerta de un automvil. La caracterstica de calidad de inters es el esfuerzo de cierre, o sea la
capacidad de retencin del picaporte de la puerta lo cual impide que esta se cierre cuando se le
tiene abierta estando el vehculo estacionado en una pendiente. El mecanismo de cierre consiste
en un resorte de hojas y un rodillo. Cuando la puerta se abre, el rodillo describe un arco hacienda
que el resorte de hojas se comprima. Para cerrar la puerta, el resorte debe ser forzado a
desplazarse a un lado, y esto crea el esfuerzo de cierre. El equipo tcnico considera que este
esfuerzo es funcin de los siguientes factores:
1. Distancia de recorrido del rodillo.
2. Altura del resorte, del pivote a la base.
3. Distancia horizontal del pivote al resorte.
4. Altura libre del resorte de refuerzo.
5. Altura libre del resorte principal.
Los ingenieros pueden construir un mecanismo de bisagra prototipo en el cual todos estos factores
pueden hacerse varan entre ciertos intervalos. Una vez que se han identificado niveles apropiados
para estos cinco factores, es posible disear un experimento que consiste en diversas
combinaciones de niveles de los factores, y probar la bisagra prototipo a estas combinaciones.
Ello proporcionar informacin acerca de los cuales factores influyen ms en el esfuerzo de cierre
del picaporte, y mediante el anlisis de esta informacin es posible mejorar el diseo de este
ltimo.
Sesin II
1.5 DIRECTRICES PARA EL DISEO DE EXPERIMENTOS (segn Duglas Montgomery)
Para usar un enfoque estadstico al disear y analizar un experimento se requiere que todos los
participantes en el tengan de antemano una idea clara de que es exactamente o que se va a
estudiar, como se van a recopilar los datos y, al menos, una idea cualitativa de cmo se van a
analizar. A continuacin, se ofrece una gua del procedimiento recomendado:
1. Comprensin y planteamiento del problema. Este punto pudiera parecer obvio, sin embar-
go, en la prctica no es sencillo darse cuenta de que existe un problema que requiere
experimentacin, ni disear un planteamiento claro y aceptable del mismo. Es necesario
desarrollar todas las ideas sobre los objetivos del experimento. Suele ser importante solicitar
la opinin de todas las partes implicadas: cuerpo tcnico, aseguramiento de la calidad,
manufactura, divisin comercial, direccin, clientes y personal operativo (quienes
normalmente saben mucho del asunto pero con demasiada frecuencia son ignorados). Un
planeamiento claro del problema contribuye a menudo en forma sustancial a un mejor
conocimiento del fenmeno y de la solucin final del problema.
4. Eleccin del diseo experimental. Para elegir el diseo es necesario considerar el tamao
de muestra (nmero de repeticiones), seleccionar un orden, adecuado para los ensayos
experimentales, y determinar si hay implicado bloqueo u otras restricciones de aleatorizacin.
6. Anlisis de datos. Deben emplearse mtodos estticos para analizar los datos, de modo
que los resultados y conclusiones sean objetivos ms que apreciativos. Hay que recordar que
los mtodos estadsticos. Solo proporcionan directrices para la veracidad y validez de los
resultados. Los mtodos estadsticos, slo hacen posible obtener el probable error de una
conclusin, o asignar un nivel de confiabilidad a los resultados. Las tcnicas estadsticas,
aunadas a un buen conocimiento tcnico o del proceso y al sentido comn, suelen llevar a
conclusiones razonables.
a) El experimento.
El experimento no es otra cosa que la definicin del problema a estudiar, constituye un punto de,
partida tan importante, que el xito de la investigacin est basado en gran parte en l, en otras
palabras, en esta etapa" es necesario considerar:
Una comprensin profunda del problema a estudiar, es decir, considerar todos los antecedentes
tericos y bibliogrficos que nos aclaren perfectamente lo que deseamos obtener y los elementos
que entran en juego. La seleccin de variables dependientes (respuestas) a ser estudiadas, como
pueden ser ellas medidas, la disponibilidad de instrumentos de medicin y control, al mismo tiempo
la precisin de estos instrumentos.
Es necesario tambin definir las variables independientes o factores que pueden afectar la
respuesta o variable dependiente. Los niveles o valores que le daremos a estos factores, en caso
de que estos sean cuantitativos, por ejemplo temperatura, pH, etc., o algunas decisiones si, estos
son de tipo cualitativo, por ejemplo: diferentes operadores.
b) El diseo.
Consiste en disear todas las experiencias a ser realizadas, no solo en cuanto a su nmero sino,
a las condiciones de operacin para cada una de ellas.
c) El anlisis.
Consiste en la recoleccin de resultados, la reduccin de datos y la computacin de ciertos tests
estadsticos, que sern usados para hacer decisiones acerca de los distintos aspectos del
experimento, de acuerdo a los objetivos de este. En el anlisis se incluye el clculo de los tests "t"
y F principalmente para nuestro estudio.
Causa Efecto
(Variable Independiente) (Variable Dependiente)
X Y
Un experimento se lleva a cabo para analizar si una o ms variables independientes afectan a una
variable dependiente y por qu lo hacen. Por ahora, simplifiquemos el problema de estudio a una
variable independiente y una dependiente. En un autntico experimento, la variable independiente
resulta de inters para el investigador por ser la variable que se hipotetiza, que ser una de las
causas que producen el efecto supuesto. Para obtener evidencia de esta relacin causal supuesta,
el investigador manipula la variable independiente y observa si el dependiente vara o no.
XA Y
XB
.
1.8 VARIABLES DE UN PROCESO.
En general, en un sistema multivariable disponemos de dos tipos de variables, de cuyo
conocimiento depende el control, que sobre el proceso podemos ejercer:
a) Variables de entrada.
Son las variables independientes del proceso, definen las caractersticas de este y segn sus
valores relativos determinan los valores de las otras variables del sistema.
b) Variables de salida
Son, las variables dependientes del proceso y pueden considerarse como efectos o respuestas a
las variables de entrada.
Clasificacin de Variables
I. Variables Independientes II. Variables Dependientes
A. Controlables A. De rendimiento
1. Bsicas o primarias 1. Econmicas
2. Transformadas 2. Contreidas
B. Incontrolables B. 1. Cualitativas
1. Materias primas 2. Cuantitativas
2. Condiciones ambientales a) Fsicas
3. Condiciones de operacin b) Operacionales
4. Factores econmicos C. Intermedias
Como ejemplo de lo dicho anteriormente, tomaremos el caso de un proceso de flotacin, en el cual
se dispone de ciertas variables caractersticas cuya, clasificacin se presenta a continuacin y la
cual puede extenderse, a otros; procesos mineralurgicos.
Clasificacin:
A. Variables incontrolables de entrada
1) Ley de minerales primarios % (fino)
2). Ley de minerales secundarios % (fino)
3) impurezas
4) Ganga
5) Grado de oxidacin
B. Variables controlables de entrada
1) Tonelaje alimentacin
2) Dosificacin de reactivos
o Tiempo
o pH
o Colector.
o Espumante
3) Agua de alimentacin
4) Recirculacin de pulpa,
5) Aireacin
C. Variables de salida
1) Cantidad de concentrado producido
2) Contenido fino del concentrado
3) Granulometra del concentrado
4) Cantidad de relaves producidos
5) Contenido-fino de los relaves
6) Granulometra de los relaves.
7) Concentracin de reactivos residuales
D. Variables de rendimiento
1) Constantes dinmicas de flotacin
2) Recuperacin de minerales tiles
3) Recuperacin de minerales intiles (impurezas)
4) Ley de concentrados.
5) Prdidas en las colas
6) Valor del concentrado producido
7) Consumo por tonelada beneficiada
8) Consumo por da
SESION III
Esta discusin conduce a una revisin de los conceptos bsicos de la estadstica, tales como
variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones mustrales
y pruebas de hiptesis.
2-1 INTRODUCCION
La resistencia adhesiva a la tensin del mortero de cemento Portland es una caracterstica
importante del producto. Un ingeniero est interesado en comparar la resistencia de una formula
modificada, a la que se han agregado emulsiones de polmeros de latex durante el
mezclado, contra la resistencia de la argamasa hecha con la formula no modificada. El
experimentador ha recolectado 10 observaciones de la resistencia de la formula modificada y otras
10 de la formula no modificada. Los datos aparecen en la Tabla 2-1. Las dos frmulas pueden
considerarse como dos tratamientos, o dos niveles de las formulaciones de factor.
Los datos de este experimento se grafican en la Fig. 2-1. Esta representacin grfica se denomina
diagrama de puntos. A primera vista, estos datos dan la impresin de que la resistencia del mortero
no modificado es mayor que la del modificado.
Esta impresin se refuerza al comparar los valores medios de la resistencia a la tensin, es decir
1 = 16.76 kgf/cm2, del mortero modificado contra 2 = 17.92 kgf/cm2, del mortero no,
modificado. Los promedios de la resistencia a la tensin en estas dos muestras difieren en una
cantidad que parece ser significativa. Sin embargo, no es evidente que esta diferencia sea
suficientemente grande como para implicar que las dos frmulas son realmente distintas. Quizs
la diferencia que se observa en el promedio de las resistencias es resultado de las fluctuaciones
en el muestreo, siendo en realidad las dos frmulas idnticas. Posiblemente otras dos muestras
produzcan resultados contrarios, cuando la resistencia de la frmula modificada supera a la de la
frmula original.
El diagrama de puntos, es un medio til para representar una serie pequea de datos (hasta de
unas 20 observaciones). El diagrama de puntos permite al experimentador ver rpidamente la
localizacin general o tendencia central de las observaciones y su dispersin.
Por ejemplo, en el experimento sobre la resistencia a la tensin del cemento portland, el diagrama
de puntos revela que las dos formulaciones probablemente difieren en resistencia media pero que
ambos tienen aproximadamente la misma variacin en esta propiedad.
El histograma se utiliza cuando los datos son numeroso, se representa la tendencia central, la
dispersin y la forma general de la distribucin de los datos. Un histograma se construye dividiendo
el eje horizontal en intervalos (por lo regular de la misma longitud) y trazando sobre el j-esimo
intervalo un rectngulo con rea proporcional a ni, el nmero de observaciones que caen en ese
intervalo. A continuacin en la Fig. 2-2 se presenta el histograma de 200 observaciones de la
recuperacin de metal (rendimiento) en un proceso de fundicin.
El diagrama de caja es un medio muy til para representar grficamente datos. En dicho diagrama,
los valores mnimo y mximo, los cuartiles inferior y superior (percentiles 25 y 75, respectivamente)
y la mediana (percentil 50) se representan en una caja rectangular alineada ya sea horizontal o
verticalmente. La caja se extiende del cuartil inferior al superior, y es atravesada de un lado al otro
por la mediana. A partir de los extremos de la caja se extienden lneas ("bigotes") hasta los valores
mnimo y mximo.
En la Fig. 2-3 se presentan los diagramas de caja para las dos probetas de resistencia adhesiva a
la tensin del experimento con mortero de cemento portland. Esta representacin revela claramente
la diferencia de resistencia media entre las dos formulaciones. Tambin indica ambas formulaciones
producen distribuciones simtricas de resistencia con similar variabilidad o dispersin.
Distribucin de Probabilidad
La estructura probabilstica de una variable aleatoria, digamos y, se describe por su distribucin
de probabilidad. A menudo, la distribucin de probabilidad de y, representada por p(y), se
denomina funcin de probabilidad y es discreta. Si y es continua, usualmente la distribucin de
probabilidad de y, es, f(y), se denomina funcin de densidad de probabilidad de y.
En la figura 2-4 se ilustra dos distribuciones de probabilidad hipottica, una discreta y la otra
continua. Obsrvese que en la distribucin de probabilidad discreta es la altura de la funcin p(yj)
la que representa la probabilidad, mientras que en el caso continuo, es el rea bajo la curva f(y)
asociada con un intervalo dado la que representa la probabilidad.
Fig. 2-4. Distribucin de probabilidad continua y discreta
2-1
y la variancia muestral
2-2
son estadsticos. Estas cantidades son medidas de la tendencia central y la dispersin de muestra,
respectivamente. Algunas veces S=S2, llamada desviacin estndar muestral, se usa como
medida de dispersin. A menudo, los ingenieros prefieren el uso de la desviacin estndar como
medida de dispersin porque sus unidades son las mismas que las de la variable de inters y.
Se requieren ciertas propiedades para tener varios estimadores puntuales. Dos de las ms
importantes son las siguientes:
1. El estimador puntual debe ser insesgado. Es decir, el parmetro que se est estimando
deber ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la
ausencia de sesgo es deseable, esta propiedad por s sola no siempre hace que un estimador
sea adecuado.
2. El estimador insesgado deber tener variancia mnima. Esta propiedad establece que el
estimador puntual de varianza mnima tiene una varianza que es menor que la varianza de
cualquier otro estimador del parmetro en cuestin.
donde SS = n i=1(yi-)
2
es la suma corregida de los cuadrados de las observaciones yi.
Entonces
2-3
Por lo tanto,
2-4
Grados de Libertad
La cantidad n-1 de la ecuacin 2-4 se denomina grados de libertad de la suma de cuadrados SS.
Este es un resultados muy general; si y es una variable aleatoria con variancia 2 y SS = n i=1(yi-
)2 tiene grados de libertad.
2-5
2-6
donde - < < es la media de la distribucin, y 2> 0 es la variancia. En la figura 2-6 se ilustra
la distribucin normal.
Debido a que las corridas muestrales que difieren, como resultado del error experimental a menudo
se encuentra descritas adecuadamente en la distribucin normal, esta desempea un papel
fundamental en el anlisis de los datos de experimentos diseados. Tambin es posible definir
muchas distribuciones de muestreo importantes en trminos de variable aleatorias normales. Con
frecuencia se usa la notacin y ~ N(,2) para denotar que y sigue una distribucin normal con
media y varianza 2
.. 2-7
sigue una distribucin normal estndar, denotada por z ~ N(0, 1). A la operacin ilustrada en
la Ecuacin 2-7 suele llamarse la estandarizacin de la variable aleatoria normal y.
En muchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin normal.
El teorema del lmite central es con frecuencia una justificacin de la normalidad aproximada.
SESION IV
2.8
donde yij, es la observacin j-esima del nivel i del factor, ; es la media de la respuesta para el nivel
i-esimo del factor, y ij; es una variable aleatoria normal asociada con la observacin ij-esima. Se
supone que las ij son NID(0,2), i = 1, 2. Se acostumbra hacer referencia a ij como el componente
del error aleatorio del modelo. Puesto que las medias 1, y 2, son constantes, se observa
directamente a partir del modelo que las yij son NID(0, 2), i = 1, 2, como se acaba de suponer arriba.
Hiptesis estadsticas
Una hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parmetros de una
distribucin de probabilidad o de los parmetros de un modelo. La hiptesis refleja alguna conjetura
acerca de la situacin del problema. Por ejemplo, en el experimento del cemento portland, puede
pensarse que las fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero
son iguales. Esto puede enunciarse formalmente como
Para probar una hiptesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular
un estadstico de prueba apropiado para despus rechazar o no estar en posicin de rechazar la
hiptesis nula Ho. Parte de este procedimiento consiste en especificar el conjunto de valores del
estadstico de prueba que llevan al rechazo de Ho. A este conjunto de valores se le llama la regin
critica o regin de rechazo de la prueba.
Puede cometerse dos tipos de errores cuando se prueban hiptesis. Si la hiptesis nula se rechaza
cuando es verdadera, ha ocurrido un error tipo I. Si la hiptesis nula no se rechaza cuando es falsa
se ha cometido un error tipo II. Las probabilidades de estos dos errores se expresan con smbolos
especiales:
. 2-9
donde 1, y 2, son las medias muestrales, n1 y n2 son dos tamaos de las muestras, S2p es una
estimacin de la varianza comn 21 = 22 = 2 calculada a partir de
2.10
y S21, y S22; son las dos varianzas mustrales individuales. Para determinar si deber rechazarse Ho:
1= 2, se comparara to con la distribucin t con n1 + n2 - 2 grados de libertad. Si I to I > donde
t/2,n1+n2-2 es el punto porcentual /2 superior de la distribucin t con n1+n2-2 grados de libertad,
entonces se rechazara Ho y se concluira que las fuerzas promedio de las dos formulaciones del
mortero de cemento portland difieren. A este procedimiento de prueba se le llama generalmente la
prueba t de dos muestras.
Este procedimiento puede justificase de la siguiente manera. Si el muestreo se est haciendo de
distribuciones normales independientes, entonces la distribucin de 1-2 es N[1 - 2,2(1/n1 + 1/n2)].
Por lo tanto, si se conociera 2, y si Ho: 1= 2 fuera verdadera, la distribucin de
Seria N(0,1). Sin embargo, al sustituir con Sp en la ecuacin 2-11, la distribucin de Zo cambia de
la normal estndar a la distribucin t con n1 +n2- 2 grados de libertad. Ahora bien, si Ho es verdadera,
to de la ecuacin 2-9 se distribuye como tn1+n2-2 y, por consiguiente, se esperara que 100(1- ) por
ciento de los valores de to estn entre - t/2,n1+n2-2 y t/2,n1+n2-2. Una muestra que produjera un valor de
to que estuviera fuera de estos lmites seria inusual si la hiptesis nula fuera verdadera y es evidente
de que Ho deber rechazarse. Por lo tanto, la distribucin t con n1 +n2 - 2 grados de libertad es la
distribucin de referencia apropiada para el estadstico de prueba to. Es decir, describe el
comportamiento de to cuando la hiptesis nula es verdadera. Observe que es la probabilidad del
error tipo I de la prueba.
En algunos problemas quiz quiera rechazarse Ho nicamente si una de las medias es mayor que la
otra. Por lo tanto, se especifican a una hiptesis alternativa de una cola H1:1>2 y Ho solo se
rechazara si to > t/2,n1+n2-2. Si se desea rechazar Ho solo si, es menor que 1 entonces la hiptesis
alternativa es H1: 1<2, y Ho se rechazara si to < t/2,n1+n2-2
Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos
datos, se encuentra que
y el estadstico de prueba es
Puesto que to = -9.13 < - t0,025, 18 = -2.101, se rechazara Ho y se concluira que las fuerzas de la
tensin de adhesin promedio de las dos formulaciones del mortero de cemento Portland son
diferentes.
Este modelo es el ms sencillo del diseo de experimentos, en el cual la variable respuesta puede
depender de la influencia de un nico factor, de forma que el resto de las causas de variacin se
engloban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las unidades
experimentales han sido asignadas al azar a los tratamientos.
En la sesin anterior se consideraron mtodos para comparar dos condiciones o tratamientos. Por
ejemplo, en el experimento de la resistencia adhesiva a la tensin del cemento Portland participaban
dos formulaciones (clases) distintas de mortero. Otra forma de describir este experimento es como
uno unifactorial con dos niveles del factor, donde el factor es formulacin del mortero y los dos
niveles son los dos mtodos distintos de formulacin. Muchos experimentos de este tipo implican
ms de dos niveles del factor.
3.1 UN EJEMPLO
Un ingeniero de desarrollo de productos est interesado en maximizar la resistencia a la tensin de
una nueva fibra sinttica que se empleara en la manufactura de tela para camisas de hombre. El
ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodn presente
en la fibra. Adems, el sospecha que elevar el contenido de algodn incrementara la resistencia, al
menos inicialmente. Tambin sabe que el contenido de algodn debe variar aproximadamente entre
10 y 40% para que la tela resultante tenga otras caractersticas de calidad que se desean (como
capacidad de recibir un tratamiento de planchado permanente. El ingeniero decide probar muestras
(o probetas) a cinco niveles de porcentaje de algodn: 15, 20, 25, 30 y 35%. As mismo, decide
ensayar cinco muestras a cada nivel de contenido de algodn.
Ahora se elige un nmero aleatorio entre 1 y 25, supngase que este nmero es 8. Entonces la
observacin nmero 8(20% de algodn) se ejecuta (corre) primero. El proceso se repite hasta que
se ha asignado una posicin en la secuencia de prueba a cada una de las 25 observaciones.
Supngase que la secuencia de prueba obtenida es
Esta secuencia de prueba aleatorizada es necesaria para evitar que los resultados sean
contaminados por los efectos de variables inconvenientes desconocidas, que pueden salir de control
durante el experimento. Para ilustrar esta situacin, supngase que se corren las 25 muestras de
prueba en el orden no aleatorizado original (esto es, las cinco muestras con 15% de algodn, se
prueban primero, luego las cinco muestras con 20% de algodn, y as sucesivamente). Si la maquina
probadora de la resistencia a la tensin presenta un efecto de calentamiento tal que a mayor tiempo
de funcionamiento menores lecturas de resistencia a la tensin, entonces dicho efecto potencial-
mente contaminara los datos de resistencia e invalidara el experimento.
Supngase ahora que el ingeniero ejecuta la prueba en el orden aleatorio que hemos determinado
Las observaciones que el obtiene acerca de la resistencia a la tensin se presentan en la Tabla 3-
1.
Siempre es una buena idea representar grficamente los datos experimentales. En la Fig. 3-1 se
muestran diagramas de caja para resistencia a la tensin a cada nivel de porcentaje de algodn, y
la Fig. 3-2 es un diagrama de dispersin para resistencia contra porcentaje de algodn. En esta
ltima figura, los crculos negros son Las observaciones individuales, y los blancos son los valores
medios de las resistencias observadas Ambas graficas indican que la resistencia a la tensin
aumenta con el contenido de algodn, hasta un valor aproximado de este ultimo de 30%. Ms all
del 30% de algodn, ocurre un notable decremento en la resistencia. No hay una fuerte evidencia
que sugiera que la variabilidad en la resistencia alrededor del promedio dependa del porcentaje de
algodn. Con base en este sencillo anlisis grfico, sospechamos fuertemente que:
El procedimiento apropiado para probar la igualdad de varias medias es el anlisis de variancia. Sin
embargo, este anlisis tiene aplicaciones adicionales a la del problema descrito con anterioridad.
Probablemente es la tcnica ms til en el campo de la inferencia estadstica.
. 3-1
en donde y ij, es la ( ij )-sima observacin, , es la media del nivel del factor o tratamiento
i-simo, y ij es un componente del error aleatorio que incorpora todas las dems fuentes
de variabilidad del experimento, incluyendo las mediciones, la variabilidad que surge de
factores no controlados, las diferencias entre las unidades experimentales (como los
materiales de prueba, etc) a las que se aplican los tratamientos, y el ruido de fondo general
en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables ambientales,
etc). Es conveniente considerar que los errores tienen media cero, de tal modo que
E(y ij )= i . A la ecuacin 3-1 se le llama el modelo de las medias. Una forma alternativa
de escribir un modelo de los datos es definiendo
3-2
En esta forma del modelo, es un parmetro comn a todos los tratamientos al que se
llama media global, y i es un parmetro nico del tratamiento i-simo al que se le llama
el efecto del tratamiento i-simo. A la ecuacin 3-2 se le llama por lo general el modelo
de los efectos.
Tanto el modelo de las medias como el de los efectos son modelos estadsticos lineales;
es decir, la variable de respuesta y ij es una funcin lineal de los parmetros del modelo.
A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza
simple o de un solo factor (o direccin), por que nicamente se investiga un factor.
Adems, ser un requisito que el experimento se lleve a cabo en orden aleatorio para que
el ambiente en el que se apliquen los tratamiento (llamados con frecuencia unidades
experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo experimental es un
diseo completamente aleatorizado. Nuestro objetivo ser probar las hiptesis
apropiadas con respecto a los efectos del tratamiento y hacer una estimacin de ellos.
Para probar las hiptesis, se supone que los errores del modelo son variables aleatorias
independientes con distribucin normal, con media cero y variancia 2 Se supone que
esta ltima es constante para todos los niveles del factor.
Alternativamente, los a tratamientos pueden ser una muestra aleatoria de una poblacin
mayor de tratamientos. En esta situacin sera deseable generalizar las conclusiones
(basadas en la muestra de tratamientos), a todos los tratamientos de la poblacin, ya sea
que hayan sido explcitamente considerados, en el anlisis o no. En este caso, las i son
variables aleatorias y resulta relativamente intil conocer sus, valores particulares para
los tratamientos investigados. En su lugar, se prueban hiptesis con referencia a la
variabilidad de las i y se intenta dicha variabilidad. Esto se conoce como modelo de
efectos aleatorios o de componentes de variancia.
que si H 0 es verdadera, todos los tratamientos tienen la media comn . Una forma
equivalente de expresar las hiptesis anteriores es en trminos de los efectos de
tratamiento i, o sea
Por tanto, es posible hablar de probar la igualdad de las medias de los tratamientos, bien
de probar que los efectos de tratamiento (las i ) son cero. El procedimiento apropiado para
probar la igualdad en el nivel medio de a tratamientos en el anlisis de variancia
se usa como medida de la variabilidad total de los datos. Intuitivamente esto parece
razonable, ya que si se divide SS T , entre el nmero apropiado de grados de libertad (en
este caso entre (a.n - 1 = N -1), se obtiene la variancia muestral de y. Obviamente, la
variancia muestral es una medida estndar de la variabilidad.
Debe observarse que la suma total de cuadrados corregida SS T (notacin proveniente
de sum of square, SS) puede escribirse como
.3-4
o bien
..3-5
Sin embargo, el trmino del producto de cruz en la ecuacin 3-5 es cero. ya que
Por tanto, se tiene
..3-6
La Ecuacin 3-6 muestra que la variabilidad total de los datos, medida por la suma total
de cuadrados corregida, puede descomponerse en la suma de cuadrados de l as
diferencias entre los promedios de los tratamientos y el promedio general, y en la suma
de cuadrados de las diferencias entre las observaciones dentro del tratamiento y el
promedio del mismo. La diferencia entre los promedios observados de los tratamientos y
el promedio general constituye una medida de la diferencia entre las medias de
tratamiento, mientras que la causa de las diferencias de las observaciones den tro de los
tratamientos con respecto al promedio del tratamiento puede ser solamente el err or
aleatorio. Por tanto, simblicamente la ecuaci6n 3-6 puede ser escrita como
en donde SS Tratamiento se denomina suma de cuadrados debida a los tratamientos (es decir,
entre tratamientos) y SS E se llama suma de cuadrados debida al error (es decir, dentro
de los tratamientos). SS T tiene N - 1 grados de libertad porque hay un total de an=N
observaciones. Por otra parte, existen a niveles del factor (y a medias de tratamiento), de
manera que SS Tratamiento tiene a-1 grados de libertad. Finalmente, existen n replicas dentro
de cada tratamiento, las cuales proporcionan n-1 grados de libertad para estimar el error
experimental. Como hay a tratamientos, se tienen a(n-1)=an- a=N-a grados de libertad
para el error.
En esta forma es fcil observar que el termino ubicado entre los parntesis rectangulares,
dividido entre n-1, es la variancia muestral del i-esimo tratamiento, o
Ahora bien, es posible combinar a variancias muestrales para producir una estimacin de
la variancia poblacional comn como se muestra a continuacin:
Por tanto, SS E /(N-a) es una estimacin de la variancia comn a cada uno de los a
tratamientos.
Igualmente, si no hay diferencia entre las medial de los a tratamientos, puede usarse la
variacin de los promedios de los tratamientos con respecto al promedio general para
estimar 2 . Especficamente.
es una estimacin de 2 si las medias de los tratamientos son iguales. Intuitivamente, la
razn de esto se presenta a continuacin: una estimacin para 2 /n, la variancia de los
promedios de los tratamientos es a i=1 (i .-..)2 /(a-1); por tanto, na i=1 (i.-..)2 /(a-1) debe
estimar 2 si no hay diferencia en el nivel medio de los tratamientos.
Puede observarse que la identidad del anlisis de variancia (Ecuacin 3-6), proporcin
dos estimaciones para 2 - una basada en la variabilidad propia e interna de los
tratamientos, y otra en la variabilidad entre los mismos. Si no existe diferencia en el nivel
medio de los tratamientos, estas dos estimaciones deben ser similares; de no ser as, se
sospechara que la diferencia observada puede ser el resultado de una diferencia entre
las medias de los tratamientos. A pesar de haber proporcionado un argumento intuitivo
para desarrollar este resultado, es posible un enfoque ms formal.
Las cantidades
Ahora bien, cuando se elevan al cuadrado las cantidades entre parntesis rectangulares
y se toma su valor esperado, los trminos que contienen 2 ij y 2 i deben remplazarse por
y n 2 respectivamente, porque E( ij)=0. Ms aun, todos los productos de cruz que
contienen poseen una expectativa igual a 0. Por tanto, al elevar al cuadrado y tomar
valor esperado, la ltima ecuacin se transforma en
O bien
Resulta claro que una prueba para la hiptesis de la igualdad en el nivel medio de
tratamientos puede efectuarse comparando MS Tratamiento y MS E . A continuacin se muestra
como realizarse tal comparacin.
Puesto que se ha supuesto que los errores ij son independientes y estn normalmente
distribuidos con media cero y variancia 2 , las observaciones y ij tambin son
independientes y se encuentran normalmente distribuidos con media + i y variancia 2 .
Es posible demostrar que SS E / 2 tiene una distribucin ji cuadrada con N-1 grados de
libertad porque SS T , es una suma de cuadrados de variables aleatorias normalmente
distribuidas. Tambin se puede mostrar que SS E / 2 tiene una distribucin ji cuadrada con
N-a grados de libertad y que si la hiptesis nula H0 : i=0 es verdadera, SS Tratamiento / 2 tiene
una distribucin ji cuadrada con a-1 grados de libertad. Sin embargo, estas tres sumas de
cuadrados no son independientes ya que SS T es igual a SS Tratamiento ms SS E . El siguiente
teorema, que es un caso particular de otro atribuido a Cochran, es til para establecer la
independencia entre SS E y SS Tratamiento .
..3-7
tiene una distribucin F con a-1 y N-a grados de libertad. La Ecuacin 3-7 es la estadstica
para probar la hiptesis de igualdad de medias de los tratamientos.
Las sumas de cuadrados requeridas para el anlisis de variancia se calculan como sigue:
El anlisis de variancia se resume en la Tabla 3-4. Hay que notar que la media de
cuadrados entre tratamientos (118.941) es mucho mayor que la media de cuadrados
dentro de tratamientos (8.06). Esto indica que es improbable que las medias de
tratamientos sean iguales. Mas formalmente, es posible calcular la razn F, o sea
Fo =118.94/8.06=14.76, y compararla con F ,4,20 Como F .01,4,20 = 4.43, debe rechazarse Ho
y concluir que las medias de tratamientos difieren; en otras palabras, el algodn en la
fibra afecta significativamente su resistencia media.
Una Advertencia Acerca de los Clculos: Seguramente el lector alerta habr notado
que aqu se defini la suma de cuadrados en trminos de promedios; esto es, a partir de
la Ecuacin 3-6,
pero que las frmulas para el clculo se dedujeron utilizando totales. Por ejemplo, para
calcular SS Tratamaientos emplearamos la Ecuacin 3-9:
Ejemplo 3.2
Codificacin de Observaciones. A menudo, los clculos del anlisis de variancia pueden
hacerse ms precisos o ser simplificados si se codifican los datos. Por ejemplo
consideremos los datos de la resistencia a la tensin en el Ejemplo 3 -1. Supngase que
a cada observacin se le resta 15. Los datos codificados aparecen en la Tabla 3-5.
Al comparar estas sumas de cuadrados con las del Ejemplo 3 -1, se observa que no
quedan afectadas si se resta una constante a los datos originales.
Ahora supongamos que se multiplica por 2 cada observacin del Ejemplo 3 -1. Es fcil
verificar que las sumas de los cuadrados en los datos transformados son SS T =2547.84,
SS Tratamientos =1903.04, y SS E =644.80. A primera vista parece ser que hay mucha
diferencia entre estas sumas de cuadrados y las calculadas en el Ejemplo 3.1, Sin
embargo, si se las divide entre 4 (en otras palabras, 2 2 ), los resultados son idnticos. Por
ejemplo, para la suma de cuadrados de tratamiento, 1903.04/40=475.76. Por tanto, para
los datos codificados la razn F es F= (1903.04/4)/(644.80/20)=14.76, resultado que es
idntico al de los datos originales. De esta forma los anlisis de variancia resultan ser
equivalentes.
UNIDAD II
En el tema anterior se introdujo el diseo aleatorizado por bloques completos como un diseo para
reducir el error de los residuos de experimento, al sustraer la variabilidad debida a las unidades
experimentales. Hay otros diseos que usan el principio de anlisis por bloques. Por ejemplo,
supongamos que un experimentador est estudiando el efecto de cinco formulas diferentes de la
mezcla de dinamita sobre la fuerza explosiva observada. Cada Formula se prepara usando un lote
de materia prima, lo suficientemente grande para solo se haga cinco mezclas. Ms aun, las
mezclas las preparan varios operadores, pudiendo existir una diferencia sustancial en la habilidad
y experiencia entre ellos. Al parecer hay dos efectos extraos que se deben cancelar en el diseo:
lotes de materia prima y operadores. El diseo apropiado para este problema consiste, en probar,
cada frmula exactamente una vez, utilizando cada lote de materia prima, y en que cada formula
sea preparada exactamente una vez por cada uno de cinco operadores. El diseo que resulta
aparece en la Tabla 5-9 y se llama diseo de cuadros latinos. Hay que notar que este diseo es
un arreglo cuadrado y que las cinco formulas (o tratamientos) se representan mediante las letras
latinas A, B, C, D y E. de ah el hombre de cuadrado latino. Se observa que tanto los lotes de
materia prima (renglones) como los operadores (columna) son ortogonales a los tratamientos.
El diseo de cuadrado latino se usa para eliminar dos fuentes de variabilidad problemtica; en
otras palabras, permite analizar sistemticamente por bloques en dos direcciones. En este diseo,
los reglones y columnas representan, en realidad, dos restricciones a la aleatorizacin. En
general, un cuadrado latino para p factores, o un cuadrado latino p x p, es un cuadrado que
contiene p renglones y p columnas. Cada una de las p 2 celdas contiene una de las p letras que
corresponde a un tratamiento, y cada letra aparece una sola vez en cada regln y columna. A
continuacin, se presenta algunos ejemplos de cuadrados latinos.
4-22
en donde Yijk es la observacin correspondiente al i-simo regln, k-sima columna y el j-simo
tratamiento: es la media general, i, es el i-simo efecto de rengln, j es el j-simo efecto de
tratamiento, k es el k-simo efecto de columna y ijk es el error aleatorio. El modelo es
completamente aditivo, en otras palabras, no existe interaccin entre los reglones, las columnas
y los tratamientos. Solo 2 de los tres subndices i, j, y k se requieren para especificar una
observacin en particular porque nicamente hay una observacin en cada celda. Por ejemplo,
haciendo referencia al problema de la frmula de la dinamita en la Tabla 4-9, si i = 2 y k = 3,
automticamente j = 4 (formula D), y si i = 1 y j = 3 (formula C), k = 3. Est es una consecuencia
de que cada tratamiento aparece exactamente una vez en cada regln y en cada columna.
4-23
Bajo la suposicin usual de que ijk es NID(0,2), cada una de las sumas de cuadrados del
miembro derecho de la Ecuacin 4-23 son, al dividir entre 2, variables aleatorias independientes
con distribucin ji cuadrada. El estadstico apropiado para probar la igualdad de medias en los
tratamientos
que tiene una distribucin Fp-1,(p-2)(p-1) si la hiptesis nula es verdadera. Es posible probar que no
existen efectos de reglones o de columnas si se toma la razn de MSReglones y MSColumnas contra la
MSE. Sin embargo, posiblemente estas pruebas no sean apropiadas por que los reglones y las
columnas representan restricciones de aleatorizacin.
Ejemplo '
Considrese el problema de las formulas de la dinamita descrito anteriormente. Se supone que
tanto los lotes de materia prima como los operadores representan restricciones en la
aleatorizacin. El diseo para este experimento mostrado en la tabla 4-9 es un cuadrado latino 5
x 5. Despus de codificar las observaciones, restando 25, se obtuvieron los datos de la tabla 4-
11. Las sumas de cuadrados para los totales, lotes (renglones) y operadores (columnas) se
calculan a continuacin.
Tabla 4-9. Las sumas de cuadrados para los totales, lotes o (renglones) y operadores (columnas)
se calculan a continuacin.
Los totales de tratamiento (letras Latinas) se presentan a continuacin:
En la Tabla 4-12 de datos codificado se resume el anlisis de variancia. Se concluye que existe
una diferencia significativa en la fuerza explosiva media debido a las cinco formulas diferentes.
Tambin hay una indicacin de diferencia entre los operadores, por lo tanto, controlar este factor
fue una buena precaucin. No existe una evidencia fuerte de que haya una diferencia entre los lotes
de materia prima, y al parecer, en este experimento hubo una inquietud innecesaria en cuanto a
esta fuente de variabilidad. Sin embargo controlar localmente los lotes de materia prima siempre
resulta adecuado.
El lector debe determinar los residuos del ejemplo y construir las grficas apropiadas.
PROBLEMA 1.
Un Ing. Qumico desea probar el efecto que tienen cuatro agentes qumicos sobre la resistencia
de un tipo particular de tela. Como puede haber variabilidad entre un rollo de tela y otro, decide
utilizar un diseo aleatorizado por bloques, considerando los rollos de tela como bloques. Ella
selecciona cinco rollos y les aplica los cuatro agentes qumicos en orden aleatorio. A continuacin,
se proporcionan los resultados de la resistencia a la tensin.
Se pide:
1. Analice estos datos y haga las conclusiones apropiadas.
2. Identificar los Elementos del experimento: variable dependiente, independiente y
variable respuesta, factores bloques, etc.
PROBLEMA 2.
Se encuentra bajo estudio el efecto que tiene cinco reactivos distintos (A, B, C, D y E) sobre el
tiempo de reaccin de un proceso qumico. Cada lote de material nuevo es lo suficientemente
grande para permitir que solo se realice cinco ensayos. Ms an, cada ensayo tarda,
aproximadamente, una hora y media, por lo que solo pueden realizarse cinco ensayos por das, la
investigadora decide efectuar el experimento usando un diseo de cuadrado latino, con el fin de
controlar sistemticamente las variables lote material y da. Ella recolecta los siguientes datos.
Analice y obtenga las conclusiones.
Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de ensamblaje (A,
B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se
seleccionan cuatro operadores para realizar este estudio. Por otra parte, el ingeniero sabe que
cada mtodo de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el ltimo
ensamblaje puede ser mayor que el primero, independientemente del mtodo. En otras palabras,
se produce un patrn en el tiempo de ensamblaje. Para controlar esta posible fuente de
variabilidad, el ingeniero utiliza el diseo de cuadrados latinos que aparece a continuacin. Analice
y haga las conclusiones apropiadas.
Se realiza un estudio para comparar los ndices de monxido de carbono en 5 puntos estratgicos
de una ciudad. (N-norte, S-sur, E-este, O-oeste, C-centro). Los conjuntos de bloques involucrados
son determinados das de la semana y distintos horarios del da. El cuadrado obtenido y los datos
(ppm) registrados se presenta a continuacin. Realizar la comparacin.
BLOQUES ALEATORIZADOS
DISEO ALEATORIZADO POR BLOQUES COMPLETOS
Este es el ms simple y quizs el ampliamente usado de los diseos de bloques al azar que es
definido por Hinkelman (1994) as: El material experimental es dividido en a grupos de b unidades
experimentales (UE) cada uno, donde a es el nmero de tratamientos, tales que las UE dentro de
cada grupo son lo ms homognea posible y las diferencias entre las UE sea dada por estar en
diferentes grupos. Los conjuntos son llamados bloques. Dentro de cada bloque las UE son
asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un bloque.
En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los
resultados. En general, un factor perturbador puede dividirse como un factor del diseo que
probablemente tenga un efecto sobre la respuesta, pero en el que no existe un inters especfico.
En ocasiones un factor perturbador es desconocido y no controlable; es decir; se desconoce la
existencia de ese factor e incluso puede tener niveles variables mientras se est realizando el
experimento. La aleatorizacin es la tcnica de diseo que se utiliza para protegerse contra estos
factores perturbadores que estn al acecho. En otros casos, el factor perturbador es conocido
pero no controlable. Si por lo menos puede observarse el valor que asume el factor perturbador
en cada corrida del experimento, es posible hacer la compensacin correspondiente en el anlisis
estadstico mediante el uso del anlisis de covarianza. Cuando la fuente de variabilidad
perturbadora es conocida y controlable, puede usarse una tcnica de diseo llamada formacin
de bloques para eliminar de manera sistemtica su efecto sobre las comparaciones estadsticas
entre los tratamientos. La formacin de bloques es una tcnica de diseo en extremo importante
que se utiliza ampliamente en la experimentacin industrial, y es la materia de esta sesin.
Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes
producen o no lecturas diferentes en una mquina para probar la dureza. Un experimento como
este podra ser parte de un estudio de la aptitud en la calibracin de los instrumentos. La mquina
funciona presionando la punta sobre una probeta de metal y determinando la dureza de la probeta
a partir de la profundidad de la marca que se produce. El experimentador ha decidido obtener
cuatro observaciones para cada punta. Solo existe un factor tipo de punta -, y el diseo de un
factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 4 x 4 = 16
ensayos a una unidad experimental, o sea a una probeta de metal, y tomar las lecturas de la
dureza correspondientes. Por lo tanto, se requeriran 16 probetas de metal para realizar este
experimento, una para cada ensayo.
En principio existe un problema serio con el diseo completamente aleatorizado en esta situacin.
Si las probetas son ligeramente distintas en cuanto a dureza, como sera el caso si proviniera de
diferentes vaciados, las unidades experimentales (probetas o especmenes) contribuyen a la
variabilidad observada en las lecturas de la dureza Como resultado, el error experimental reflejara
tanto el error aleatorio como la variabilidad entre las probetas.
Se desea que el error experimental sea lo ms pequeo posible; en otras palabras, se busca
sustraer del error experimental la variabilidad producida por las probetas. Un diseo que logre esto
requiere que el experimentador pruebe cada punta, una vez, en cada una de las cuatro probetas
diferentes. Este diseo, que aparece en la Tabla 4.1, se conoce coma diseo aleatorizado por
bloques completos. La respuesta observada es la dureza en la escala C de Rockwell menos 40.
La palabra "completo" Indica que todos los tratamientos puntas son probadas en cada bloque
(probetas). Si se usa este diseo, los bloques o probetas forman una unidad experimental ms
homognea con la cual comparar las y puntas. Esta estrategia de diseo mejora efectivamente la
precisin de las comparaciones al eliminar la variabilidad entre las probetas. El orden en que las
cuatro puntas deben ser probadas en cada bloque se determina aleatoriamente. Hay que notar la
similitud que hay entre este diseo y el presentado en el diseo comparacin por pares cuando
se discuti la prueba t de diferencias aparejadas. El diseo aleatorizado por bloques completos es
una generalizacin de aquel concepto.
Dicho diseo es quizs el diseo experimental ms ampliamente utilizado. En la prctica, las
situaciones en las que este diseo se aplica son muy numerosas y pueden detectarse fcilmente.
A menudo, las unidades de equipo de prueba o maquinaria son diferentes en sus caractersticas
de operacin y constituyen un factor tpico que es necesario controlar. Lotes de materia prima,
personas o tiempo, tambin constituyen fuentes de variabilidad en un experimento, las cuales
pueden ser controladas sistemticamente mediante el anlisis por bloques
Anlisis Estadstico
Supongamos que en general se tienen a tratamientos (que deben ser comparados) y b bloques.
En la Fig. 4.1 aparece el diseo aleatorizado por bloques completos. Se realiza una observacin
por tratamiento en cada bloque, y el orden en que los tratamientos son medidos en cada bloque
se determina aleatoriamente. A menudo, se dice que los bloques representan una restriccin en
la aleatorizacin por que la nica aleatorizacin de los tratamientos ocurre dentro de los bloques.
.4-1
En donde es una media general, i, es el efecto del i-simo tratamiento, i, es el efecto del j-
simo bloque y ij es el termino usual NID(0,2) de error aleatorio. Inicialmente se considera que
tanto los tratamientos como los bloques son factores fijos. Ms aun, los efectos de tratamiento y
de bloque se consideran como desviaciones de la media general, por lo tanto
Se desea probar la igualdad de las medias de tratamiento. As, la hiptesis nula de inters es.
Como la media del i-simo tratamiento es 1 = (1/b)bi=1(++)= +ij una forma equivalente de
expresar las hiptesis anteriores es en trminos de los efectos de tratamiento.
Sea yi el total de las observaciones del tratamiento i, y.i, el total de las observaciones del bloque j,
y.. el total de todas las observaciones, y N = ab el nmero total de observaciones.
Matemticamente,
4-2
4-3
4-4
4-5
.. 4-6
Al desarrollar el segundo miembro de la ecuacin 4-6, se obtiene
Despus de algunos pasos algebraicos simples pero tediosos, se comprueba que los tres trminos
que contienen productos cruzados son iguales a cero. Por lo tanto,
.. 4-7
4-8
Por lo tanto, para probar la igualdad en las medias de tratamiento, hay que usar la estadstica
que tiene una distribucin F,a-1,(a-1)(b-1) si la hiptesis nula es verdadera. La regin critica es el
extremo superior de la distribucin F y se debera rechazar Ho si Fo > F,a-1,(a-1)(b-1).
Tambin puede ser de inters la comparacin entre las medias de los bloques, porque si no hay
gran diferencia entre ellas, el anlisis por bloques quizs no sea necesario en experimentos
futuros. Al analizar los valores esperados de las medias de cuadrados, puede parecer que la
hiptesis Ho: i = 0 puede probarse comparando la estadstica Fo = con F, a-1,(a-1)(b-1).
Sin embargo, debe recordarse que la aleatorizacin fue aplicada solo a los tratamientos dentro de
los bloques; en otras palabras, estos ltimos representan una restriccin para la aleatorizacin.
Qu efecto tiene esto sobre la estadstica Fo = MSBloques/MSE? Existen diferentes respuestas a
esta pregunta. Por ejemplo. Box. Hunter y Hunter (1978) argumentan que la prueba F del anlisis
de variancia puede justificarse solamente con base en la aleatorizacin sin necesidad de usar a
su posicin de normalidad. Ellos concluyen que la prueba para comparar bloques no puede ser
incluida bajo este argumento a consecuencia de la restriccin de aleatorizacin; pero que si los
errores son NID(O,2) la estadstica Fo = MSBloques/MSE, puede usarse para comparar las medias
de bloques.
Tabla 4-2. Anlisis de variancia para un diseo aleatorizado por bloques completos
Por otra parte. Anderson y McLean (1974) argumentan que la restriccin de aleatorizacin impide
que esta estadstica pueda ser til para comparar las medias de los bloques y que la estadstica
F, en realidad, es una prueba para la igualdad de las medias de los bloques ms la restriccin
de aleatorizacin a la que llaman error de restriccin; consltense Anderson y McLean (1974)
para mayores detalles.
Qu hay que hacer, pues, en la prctica? Como la suposicin de normalidad a menudo queda
en tela de juicio, tomar Fo = MSBloques/MSE como una prueba F exacta, en general, no es
conveniente. Por eso, esta prueba se excluye de la tabla de anlisis de variancia. Sin embargo,
ciertamente el examen de la razn entre MSBloques y MSE puede ser un procedimiento aproximado
para investigar el efecto del variable bloque. Un valor grande de esa razn, implica que el factor
bloque tiene un efecto grande y que la reduccin de ruido obtenida al analizar por bloques
probablemente fue til, al mejorar la precisin de las comparaciones entre las media de
tratamiento.
4-9
4-10
4-11
4-12
Ejemplo 1
Considerar el experimento sobre la lectura de la dureza descrita en la Secc. 4-1. Hay cuatro
puntas y estn disponibles cuatro probetas de metal. Cada punta es probada una vez en cada
probeta, resultando un diseo aleatorizado por bloques completos. Recordar en el orden en que
se prueban las puntas sobre una probeta en particular se determina aleatoriamente.
Para simplificar los clculos, se codifican los datos originales restando 9.5 de cada observacin
y multiplicando despus por 10.
Es interesante observar los resultados. Suponga que se usaran cuatro ejemplares, asignado al
azar las puntas a cada una de ellos, y que resultara (por casualidad) el mismo diseo que el de la
tabla 4-3. El anlisis incorrecto de estos datos como un diseo completamente aleatorizado de un
solo factor se presenta en la tabla 4-6
Puesto que F0.05,3,12 = 3.49, no puede rechazarse la hiptesis de la igualdad de las mediciones de
la dureza media de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce lo
suficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas sean
detectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formacin
de bloques cuando debera haberlo hecho, el efecto puede ser inflar el error experimental a tal
grado que las diferencias importantes entre las medias de los tratamientos sean indetectables.
Por otra parte, se considera que no existe interaccin entre el laboratorio y la amasada (factor
y bloque).
En este tipo de experimento, la medicin ser el resultado del efecto del tratamiento
(laboratorio) donde se encuentre, del efecto del bloque al que pertenece (amasada) y de cierto
error que se espera que sea aleatorio. La hiptesis de que las medias son iguales se va a
analizar con el anlisis de la varianza (ANOVA), con dos criterios de clasificacin.
A parte de los supuestos de normalidad, igualdad de varianzas y de independencia, aqu se
aade otro que es que no existe interaccin entre el factor y el bloque.
Para los curiosos, despus de haber analizado los datos, diremos que en este caso, con una
seguridad del 95%, se aprecian diferencias significativas entre las resistencias medidas por
los laboratorios 1 y 3, entre los laboratorios 1 y 4, y entre los laboratorios 2 y 4.
Como ejemplo, supngase que con ingeniero qumico cree que el tiempo de reaccin en un
proceso qumico es funcin del catalizador empleado. De hecho cuatro catalizadores estn siendo
investigados. El procedimiento experimental consiste en seleccionar un lote de materia prima,
cargar una planta piloto, aplicar cada catalizador a ensayos separados de dicha planta y observar
el tiempo de reaccin. Debido a que las variaciones en los lotes de materia prima puedan afectar
el comportamiento del catalizador, el ingeniero decide controlar este factor por medio de bloques.
Sin embargo, cada lote es lo suficientemente grande para permitir el ensayo de tres, catalizadores
nicamente. Por lo tanto, es necesario utilizar un diseo aleatorizado por bloques incompletos. El
diseo balanceado por bloques incompletos, junto con las observaciones recopiladas aparece en
la Tabla 4.22. El orden en que se ensayan los catalizadores dentro de cada bloque es aleatorio.
7.1. Anlisis Estadstico
Como es usual, suponemos que existen a tratamientos y b bloques. Se supone adems, que se
prueban k tratamientos en cada bloque, que cada tratamiento sucede r veces en el diseo (o se
repite r veces) y que hay un total de N = ar = bk observaciones. Ms aun, el nmero de veces que
cada par de tratamientos ocurre en el mismo bloque es
El modelo estadstico es
(4-26)
en donde yij es i-esima observacin del j-simo bloque, es la media general, i es el efecto del i-
esimo tratamiento, j, es el efecto del j-esimo bloque, y ij, es la componente del error aleatorio
NID(O,2). La variacin total en los datos se expresa mediante la suma total de cuadrados
corregidos (o ajustados)
(4-27)
La variabilidad total puede ser descompuesta
en donde se corrige la suma de cuadrados de tratamiento para separar los efectos de tratamiento
y de bloque. Esta correccin es necesaria porque cada tratamiento ocurre en un conjunto diferente
de r bloques. Por esta razn las diferencias entre los totales de tratamiento no corregidos. y1., y2.,
....ya, tambin son afectadas por las diferencias entre los bloques.
4-28
en donde yij, es el total del i-esimo bloque. La SSBloques, tiene b - 1 grados de libertad. La suma de
cuadrados de tratamiento corregida (o ajustada) es
4-29
en donde Qi es el total corregido del i-simo tratamiento, el cual se calcula mediante
4-30
con nij = 1 Si el tratamiento i ocurre en el bloque j, y nij = 0 en otro caso. Por lo tanto. (1/k).nijy.j
es el promedio de los totales de los bloques en los que se aplica el tratamiento i. La suma de los
totales de tratamiento corregidos siempre ser cero. La SSTratamientos(ajustados) tiene a -1 grados de
libertad. La suma de cuadrados del error se calcula por diferencia y tiene N - a - b + 1 grados de
libertad.
4-31
Ejemplo 5-1
Considrese los datos de la Tabla 4-23 para el experimento de los catalizadores. Este es un diseo
balanceado por bloques incompletos con a = 4, b = 4, k = 3, r = 3, = 2 y N = 12.
Para calcular la suma de cuadrados de tratamientos corregida que tome en cuenta los bloques,
primero hay que determinar los totales de tratamientos corregidos usando la Ecuacin 4-30
El anlisis de variancia se muestra en la Tabla 5-3. Como Fo > F0.05,3,5 = 5.41, se concluye que el
catalizador empleado tiene un efecto significativo sobre el tiempo de reaccin.
UNIDAD III
DISEO EXPERIEMENTAL
La optimizacin por diseos experimentales de acuerdo a un esquema del mbito del diseo
experimental, es posible distinguir dos grandes rutas excluyentes entre s.
1. Los DISEOS DINAMICOS, que son factoriales secuenciales, entre ellos el EVOP, SSEVOP
y que son pequeas variaciones en el rango de las variables para lograr mejorar resultados
sucesivamente iniciando de un simplejo o prueba con variables codificadas en un tringulo
Descarta en una vez la peor respuesta siguiendo la ruta contrapuesta conformando
nuevamente otro simplejo y as avanzando hasta una respuesta mejorada paulatinamente
(normalmente la secuencia termina en una figura poligonal cerrada) Para lograr resultados
favorables es necesario que la materia prima sea constante, equivalente en mineral a que la
ley de cabeza sea constante y ello es difcil de lograr generalmente.
PRIMERA ETAPA:
SELECCIN DE VARIABLE
Para esta etapa se cuenta con los DISEOS FACTORIALES 2k si las variables son 2 y 3, al
incrementar el nmero de variables entre 4 y 5 se usan los FACTORIALES FRACCIONADOS
MITAD Y UN CUARTO (son diseos factoriales recortados en bloques y que evitan hacer un
mayor nmero de pruebas como lo indicara un factorial 2k).
Si el nmero de variables crece ms, ser necesario usar plantillas de diseo tipo
PLANCKETT-BURMANN que permiten estudiar hasta 20 variables con un mnimo de 22
pruebas, pero el criterio de las plantillas es el mismo: evitar un gran nmero de pruebas de
factorial 2k por bloqueo de columnas codificadas que tienen la misma distribucin de signos
(en el lenguaje tcnico se conoce como aliases). Las plantillas normalmente aparecen en
variable codificada siendo 1 el rango real inferior elegido y +1 el rango superior, 0 expresa el
punto central y la relacin entre variable real y codificada es la siguiente:
Donde:
Vcod = es el valor codificado
Vreal = valor de la variable en unidades reales elegidas
Valor Central = el centro del rango real elegido
Radio = distancia en el rango del centro a un extremo en valor real.
Se reconoce una plantilla porque cada columna correspondiente a cada variable suma siempre
CERO. El anexo II muestra plantillas de diseos a los que nos estamos refiriendo.
En el caso de un diseo factorial 2n, es econmico usarlo solo hasta 3 variables con un mximo de 8
pruebas, constituyndose una plantilla en variable codificada del siguiente modo
Para 2 variables.
Variable Rango Central
X1 < 6 - 12 > 9
X2 <3-7> 5
Los rangos reales elegidos al ser codificados serian -1, 0, +1 para el rango mnimo, valor central y valor
mximo respectivamente en cada una de las variables. Despus, un juego de experimentos 22 tendra 4
pruebas, cuya secuencia y orden seria:
Prueba X1 X2
1 - -
2 + -
3 - +
4 + +
Se confecciona intercalando en la primera columna valores -1 y +1; para la otra columna se hace el doble
de la anterior y as sucesivamente hasta, completar el nmero de, pruebas indique el diseo 2 en n.
Prueba X1 X2 X3
1 - - -
2 + - -
3 - + -
4 + + -
5 - - +
6 + - +
7 - + +
8 + + +
Si:
X1 = A
X2 = B
X3 = C
Existe una manera de representar estas plantillas con solo letras minsculas figurando la correspondiente
en la prueba en que la variable participa con signo +. En caso contrario se entiende que participa con el
valor mnimo del rango
Por lo tanto:
1 2 3 4 5 6 7 8
(1) A ab ab c Ac bc abc
El termino (1) indica que todas las variables participan con el rango mnimo.
Cuando son ms de cuatro variables se usan diseos factoriales fraccionados para evitar hacer un mayor
nmero de pruebas:
Prueba X1 X2 X3 X4
1 - - - -
2 + + - -
3 + - + -
4 - + + -
5 + - - +
6 - + - +
7 - - + +
8 + + + +
Para 5 variables.
El factorial 25 = 32 pruebas se fracciona en un diseo fraccionado (1/4 (2)5) = 8 pruebas, cuya plantilla es
la-que sigue:
Prueba X1 X2 X3 X4 X5
1 + + - + -
2 + + + - -
3 + - - - +
4 - + - + +
5 + - + + +
6 - - + + -
7 - + + - +
8 - - - - -
Prueba X1 X2 X3 X4 X5 X6 X7
1 +1 +1 +1 -1 +1 -1 -1
2 +1 +1 -1 +1 -1 -1 +1
3 +1 -1 +1 -1 -1 +1 +1
4 -1 +1 -1 -1 +1 +1 +1
5 +1 -1 -1 +1 +1 +1 -1
6 -1 -1 +1 +1 +1 -1 +1
7 -1 +1 +1 +1 -1 +1 -1
8 -1 -1 -1 -1 -1 -1 -1
El ms importante de estos casos especiales ocurre cuando se tienen k factores, cada uno con dos
niveles. Estos niveles pueden ser cuantitativos como sera el caso de dos valores de temperatura,
presin o tiempo. Tambin pueden ser cualitativos como sera el caso de dos mquinas, dos
operadores, los niveles "superior a "inferior" de un factor o, quizs, la ausencia o presencia de un
factor. Una rplica completa de tal diseo requiere que se recopilen 2 x 2 x.. ... x 2 = 2k
observaciones y se conoce como diseo factorial 2k. El segundo caso especial es el de k factores
con tres niveles cada uno, conocido como diseo factorial 3 k.
En este captulo se presentan mtodos especiales para el anlisis de estas dos tiles series de
diseos Se supone. 1) que los factores son fijos. 2) que los diseos son completamente
aleatorizados, y 3) que se satisface la suposicin usual de normalidad.
El diseo 2k es particularmente til en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor nmero de corridas con los
cuales pueden estudiarse k factores en un diseo factorial completo. Debido a que solo hay dos
niveles para cada factor, debe suponerse que la respuesta es aproximadamente lineal en el
intervalo de los niveles elegidos de los factores.
Como Diseo Factorial se entiende a todas las posibles combinaciones: de los niveles de los factores en
cada prueba completa o replica investigada. Los niveles son los diferentes valores que pueden tomar las
variables. Si se considera dos niveles, el diseo se denomina Diseo Factorial a dos niveles, o diseo
factorial 2n, el cual se emplea en el presente trabajo, por lo que detallaremos este modelo.
N = 2n ..2
Donde:
n = Numero de variables.
N = Nmero de experimentos.
DISEO FACTORIAL 22 SIMPLE
Se estudian dos factores a dos niveles (22 = 4), con sus combinaciones respectivas:
COMBINACIN
PUNTO
X1 X2
1 - -
2 + -
3 - +
4 + +
Prueba A B Y
Se quiere evaluar de una manera directa
cul de los factores 1 5 35 39.3 tiene mayor
significancia 2 10 35 40.9 (influencia) en un
proceso y si estos 3 5 70 40.0 interactan (uno
depende del otro) 4 10 70 41.5 entre s.
Una vez desarrollado prueba por prueba se obtiene el vector respuesta, el cual se adjunta al
cuadro:
Para evaluar cualquier proceso de una manera directa deber desarrollarse los siguientes pasos.
Primero: visualizamos los valores numricos de los niveles y establecemos si existe interaccin
entre los valores de los diferentes factores,
A B
5 10 35 70
Vemos que no existe interseccin con los valores numricos, sin importar la magnitud de cada uno
de ellos, por lo tanto en el anlisis resultara que no existe interaccin.
Segundo: Analizamos los efectos de los factores principales a fin de direccionar la orientacin de
la ptima y la influencia de estos en el proceso, se desarrolla el clculo de los efectos con la
siguiente relacin:
Calculo de efectos:
Grficamente podemos visualizar que el efecto medio del vector respuesta nos indica que en el
orden de mayor significancia est el factor de concentracin, seguido de la temperatura (por la
pendiente ms pronunciada).
En este caso solamente estamos evaluando y no as optimizando, para desarrollar la optimizacin
deber seguirse otro camino, el cual ser desarrollado en el prximo acpite.
a) Caso Maximizacin:
Indica que la variable se encuentra al nivel mnimo y (+) debe ser maximizado hasta el
(+) ptimo y establecer su rango de trabajo.
(-) Indica, que el factor ya no es una variable, por lo tanto viene a ser una constante en el
proceso, por lo que se encuentra en el nivel mximo y debe mantenerse como tal.
b) Caso Minimizacin
Indica que el factor ya no es una variable, por lo tanto viene a ser una constante en el
(+) proceso por lo que se encuentra en el nivel mximo y debe mantenerse como tal.
(-) Indica que la variable se encuentra al nivel mnimo y debe ser maximizado hasta el ptimo
y establecer, su rango de trabajo.
Tercero: a fin de ver la influencia de los factores, se analiza la interaccin de los factores, quiere
decir si, existe cruce de informacin entre los factores y a la vez estos puedan controlarse de una
manera independiente a fin de manipular el proceso.
Interpretacin de la interaccin:
Notamos que el signo de la interaccin AB es negativo, esto nos indica que no existe interaccin,
lo cual lo hemos deducido al visualizar que no existe interseccin entre los valores numricos, por
lo tanto no existe significancia entre los factores en estudio.
a) Caso Maximizacin:
(+) Indica que si existe interaccin entre las variables, uno depende del otro.
(-) Indica que no existe interaccin entre las variables.
b) Caso Minimizacin:
(+) Indica que no existe interaccin entre las variables.
(-) Indica que si existe interaccin entre las variables, uno depende del otro.
Como notara en este tipo de diseo no se han corrido pruebas centrales, en este caso se asume
que la interaccin representa el error acumulativo del proceso desarrollado, siempre y cuando no
exista interaccin o que el valor de significancia sea muy pequeo.
Para corroborar los anlisis desarrollados es que aplicamos el Anlisis de Varianza del proceso
(ANAVA, ANOVA, ANVA).
En el mismo cuadro notamos el valor del Mean Square del Error (0.0025), el cual viene a ser la
varianza del error, dicho valor es menor que uno por lo cual la variabilidad de los datos es
adecuado para el trabajo realizado.
La suma de cuadrados del total nos sirve para comprobar que los valores: suma de cuadrados
de los factores e interacciones, ms el error deben ser igual a dicho valor numrico.
Tal como se visualiza en el presente ejemplo, en donde se asume que el error experimental es la
interaccin por no ser significativo dentro del proceso.
El valor de F de tabla para un 95% de significancia es 161, vemos que el F-Ratio de los factores
principales son mayores por lo tanto ambos factores son significativos, por lo que corroboramos
que los efectos principales estn en su mnimo debiendo ser maximizados y a la vez son variables
en el proceso.
Siendo el modelo matemtico para el presente anlisis:
a) Caso Maximizacin:
(+) Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.
(-) Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor, ms
al contrario se puede bajar.
b) Caso Minimizacin
(+) Indica que es el mximo valor del vector respuesta, no se puede subir sobre dicho valor, ms
al contrario se puede bajar.
(-) Indica que dicho valor es el inicio del proceso y se encuentra en su mnimo y debe ser
maximizado hasta el ptimo.
En el modelo matemtico tambin podemos visualizar que la interaccin es negativa, o sea que no
tiene influencia en el proceso. Adems podemos visualizar que los factores principales son positivos
tal como se visualiz en el anlisis de los factores principales.
El punto ptimo del presente proceso viene establecido por la tendencia de la hiptesis planteada
en un principio, siendo estos que estn en el mnimo debiendo maximizarse, sea que son variables
y su tendencia es subir de nivel y avanzar al mximo, obtenindose un valor ptimo de 41,5 en l
vector respuesta.
En el grfico podemos visualizar que no existe interaccin de los factores en el proceso por lo que
cada variable es independiente.
Nota: Es importante que no exista interaccin, y de esa manera podamos trabajar con los factores
principales.
La superficie respuesta nos indica que las pendientes son negativas por lo que visualizando el
grfico (isolineas), podemos interpretar lo siguiente: el valor ptimo de 41,5 est a una concentracin
de 10 y una Temperatura de 70.
La superficie respuesta a nivel espacial nos muestra la forma en que estn ubicados los puntos
experimentales, as mismo la direccin en la cual se orienta el proceso.
Notamos que la zona de mayor recuperacin se ubica a la mxima concentracin y temperatura.
DISEO FACTORIAL 2K CON REPLICA EN TODOS LOS PUNTOS DE DISEO
A modo de ejemplo considere una investigacin llevada a cabo para estudiar el efecto que tienen la
concentracin de un reactivo y la presencia de un catalizador sobre el tiempo de reaccin de un
proceso qumico. Sea la concentracin del reactivo el factor A con dos niveles de inters, 15 y 20
%. El catalizador constituye al factor B; el nivel alto (o superior denota el uso de dos sacos de
catalizador y el nivel bajo (o inferior) denota el uso de solo un saco. El experimento se realiza
(replica o repite) tres veces, y los datos son como sigue:
Las cuatro combinaciones de tratamientos en el diseo suelen representarse por letras minsculas,
como se muestra en la Fig. 6-1. En esta figura se aprecia que el nivel superior de cualquier factor
de una combinacin de tratamientos est representado por la presencia de la letra minscula
correspondiente, mientras que la ausencia de esta ltima representa el nivel inferior del factor. As
a representa la combinacin de tratamientos, en la que A se encuentra en el nivel superior y B en el
inferior; b representa aquella en la que A se halla en el nivel inferior y B en el superior, y ab
representa a ambos factores en el nivel superior. Por convencin (1) se usa para representar a
ambos factores en el nivel inferior. Esta notacin se usara a lo largo de toda la serie 2k.
El efecto promedio de un factor se define como el cambio en la respuesta producida por un cambio
en el nivel de ese factor, promediado sobre los niveles del otro factor. Como se ilustra en la Figura
6-1, las letras minsculos (1), a, b y ab tambin se usan para representar los totales de las n rplicas
de las combinaciones de tratamientos correspondientes. Ahora bien,
El efecto de A en el nivel inferior de B es [a -(1) ]/n, mientras que en el nivel superior de B es [ab -
b]/n.
Tomando el promedio de estas dos cantidades se obtiene
6-1
6-2
El efecto de interaccin AB se define como la diferencia promedio entre el efecto de A en el nivel
superior de B y su efecto en el nivel inferior de B. As,
6-3
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el nivel superior
de A y el efecto de B en el nivel inferior de A. Esto conduce a la misma Ecuacin 6-3.
Las frmulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto de A puede
hallarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos en
la mitad derecha de la Fig. 6-1 (que llamaremos A+, puesto que es la respuesta promedio para, las
combinaciones de tratamientos a las que A se encuentra en el nivel alto) y las dos combinaciones
de tratamientos en la mitad izquierda (o A-). Esto es,
Este es exactamente el mismo resultado que en la Ecuacin 6-1. El efecto de B (Ecuacin 6-2) se
encuentra como la diferencia mire el promedio de las dos combinaciones de tratamientos en la parte
superior del cuadrado (B+) y el promedio de las dos combinaciones de tratamiento en la parte
inferior (B-), 0
El efecto de A (concentracin de reactivo) es positivo esto sugiere que elevar A del nivel bajo (15%)
al nivel alto (25%) incrementara el rendimiento. El efecto de B (catalizador) es negativo; esto
sugiere que elevarla cantidad de catalizador agregada al proceso reducir el rendimiento. Al
parecer, el efecto de interaccin AB es pequeo comparado con los dos efectos principales.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese a partir de la Ecuacin 6-1 que
se utiliza un contraste para estimar A; esto es,
6-4
Este contraste suele llamarse efecto total de A. A partir de las ecuaciones 6-2 y 6-3, puede apre-
ciarse que tambin se usan contrastes para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos puede calcularse usando la Ecuacin
6-5. Esta ecuacin establece que la suma de cuadrados de un contraste es igual al contraste ele-
vado al cuadrado entre el producto del nmero de las observaciones de cada total del contraste por
la suma de los cuadrados de los coeficientes del mismo. En consecuencia, se obtiene que las sumas
de cuadrados de A, B y AB son
6-5
6-6
6-7
Con los datos de la Fig. 9-1, las sumas de cuadrados se pueden calcular aplicando las Ecuaciones
6-5, 6-6 y 6-7, obtenindose
6-8
6-9
En general SST tiene 4n - 1 grados de libertad. La suma de cuadrados del error, con 4(n - 1) grados
de libertad, se puede calcular en la forma usual, por diferencia mediante
6-
10
Con los datos de la Fig. 6-1 y los resultados de la Ecuacin 6-8 se obtiene
al utilizar SSA, SSB y SSAB de la ecuacin 6-8. En la tabla 6-1 se resume el anlisis de varianza
completo. Con base en los valores P, se concluye que los efectos principales son estadsticamente
significativos al 1% y que no hay interaccin entre estos factores. Esto confirma la interpretacin de
los datos que se hizo originalmente con base en las magnitudes de los efectos de los factores.
Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1),
a, b, ab. Se hace referencia a esto como el orden estndar (u orden de Yates, por el Dr. Frank
yates). Al utilizar este orden estndar, se observa que los coeficientes de los contrastes usados para
estimar los efectos son
Observe que los coeficientes de los contrastes par estimar el efecto de la interaccin son solo el
producto de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un
contraste es siempre +1 o -1, y puede usarse una tabla de signos positivos y negativos como la
tabla 6-2 para determinar el signo correcto para cada combinacin de tratamientos. Los
encabezados de las columnas de la tabla 6-2 son los efectos principales (A y B), la interaccin AB
e I, que representa el total o promedio del experimento completo. Obsrvese que la columna que
corresponde a I incluye nicamente signos positivos. Las etiquetas de los reglones son las
combinaciones de los tratamientos. Para encontrar el contraste para estimar cualquier efecto,
simplemente se multiplican los signos de la columna apropiada de la tabla por la combinacin de
tratamientos correspondientes y se hace la suma. Por ejemplo, para estima A, el contraste es (1)
+ a b + ab, que concuerda con la ecuacin 6-1.
El modelo de regresin
En el diseo factorial 2k es sencillo expresar los resultados del experimento en trminos de un
modelo de regresin. Puesto que 2k es tan slo un diseo factorial, podra usarse un modelo de
los efectos o de las medias, pero el enfoque del modelo de regresin es mucho ms natural e
intuitivo.
Donde x1 es una variable codificada que representa la concentracin del reactivo y x2 es una
variable codificada que representa la cantidad del catalizador y las son los coeficientes de
regresin. La relacin entre las variables naturales la concentracin del reactivo y la cantidad de
catalizador y las variables codificadas es
y
Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar
notacin para los niveles de las variables codificadas. Para ilustras esto en el ejemplo, observe
que
Por tanto, si la concentracin est en el nivel alto (Concentracin = 25%), entonces x1 = +1; si la
concentracin est en el nivel bajo (Concentracin = 15%), entonces x1 = -1. Adems,
Por tanto, si el catalizador estas en el nivel alto (Catalizador = 2 libras), entonces x2 = +1; si el
catalizador est en el nivel bajo (Catalizador = 1 libra), entonces x2 = -1.
El modelo de regresin ajustado es
Ahora bien, el valor de F para = 0.01, f1 =1 y f2=8 es 11.3; cmo podemos observar X1 y X2 son
significativos, mientras que la interaccin X1X2 no es significativa.
Modelo matemtico
Una vez determinados los efectos, por lo tanto, las influencias que resultan significativas. El siguiente paso
es obtener un modelo matemtico, que represente al proceso investigado, con el diseo factorial a dos
niveles. nicamente podemos estimar modelos matemticos lineales de la siguiente forma:
6-12
Para estimar los coeficientes bj, buj, se hace uso de la formula matricial utilizada para la estimacin de los
coeficientes del modelo.
6-13
La propiedad de ortogonalidad de la tabla de indicadores de nivel reduce la dificultad en la estimacin de
los coeficientes del modelo matemtico 13 porque el producto [X]T[X] es igual a una matriz cuyos
elementos de la diagonal es igual al nmero de experimentos (N). As los elementos de la diagonal de la
matriz inversa ([X]T[X])-1 son:
6-14
Como consecuencia, los coeficientes del modelo matemtico son definidos como el producto escalar de
la columna Y por la respectiva columna X1, dividida entre el nmero de experimentos (N) del diseo:
6-15
Otra relacin importante, resulta de comparar las ecuaciones 5.5 con 15 de lo cual resulta:
6-16
Utilizando la ltima relacin procedemos a calcular los coeficientes de modelo lineal
Por lo tanto, el modelo matemtico en escala codificada sin considerar la interaccin X1X2, que result
no significativa, es:
Como se recuerda, definimos un modelo como una representacin matemtica de un proceso o de algn
fenmeno que se investiga. Por lo tanto, el objetivo de hallar un modelo matemtico es predecir
satisfactoriamente el fenmeno estudiado. Es decir, que reemplazando valores de X1 y X2 en el rango
investigado (-1 a +1), prediga valores similares a los datos observados, lo que puede ser calculado
matricialmente:
6-17
Siendo la matriz [X], la matriz de variables independientes menos la columna X1X2 que resulto no
significativa y el vector [B] son los coeficientes del modelo matemtico. Siendo Y los valores predichos por
el modelo, llamado tambin Yestimado, o simplemente Yest.
Podemos hacer en este punto un anlisis de residuos, es decir, saber cuan distanciados estn las
predicciones de los valores iniciales mediante la diferencia (Y- Yest.) denotado comnmente como ei.
Con estos elementos podemos calcular la suma de cuadrados de residual del modelo, mediante la
siguiente ecuacin:
18
Donde:
Y = Yest.
Y = Yobservado
Nr = Nmero total de experimentos
I = Numero de parmetros del modelo matemtico.
La diferencia (Nr- I) se denomina grados de libertad del residual, el cual denotaremos como f4.
Ahora bien, para saber estadsticamente si el modelo matemtico hallado representa adecuadamente a
los datos experimentales mediante el test F.
20
Donde:
= es el nivel de confianza, generalmente del 95% (0.05).
De la tabla de Anlisis de Variancia, SCME = 3.92; por lo tanto Fo ser: Fo= 4.40/3.92 = 1.12
Para un nivel de confianza del 95% (0.05), para 9 y 8 grados de libertad F de tabla es 3.39. Por lo tanto,
el modelo matemtico representa adecuadamente al fenmeno investigado.
Donde:
Zj : Centro del diseo para la variable j (Zmax + Zmin)/2
Zj : Radio del diseo para la variable j (Zmax - Zmin)/2
: Resultado de la divisin de Zj entre Zj
Como sabemos, en el diseo factorial a dos niveles, asume que la relacin entre las variables y la
respuesta es representada por un modelo matemtico lineal. De ser cierta dicha linealidad, el modelo debe
predecir adecuadamente todos los puntos del diseo, inclusive el punto central del diseo. Por supuesto,
es innecesaria la linealidad perfecta y el sistema 2k funcionara bastante bien incluso cuando la suposicin
de linealidad se cumple solo de manera aproximada. De no ser cierta esta hiptesis, es decir que no
prediga adecuadamente, especialmente el punto central del diseo, podemos afirmar que el modelo
matemtico lineal no es suficiente para explicar las respuestas en dicha regin experimental y podemos
asumir una posible existencia de curvatura. Para ello la adicin de pruebas en el punto central del diseo
nos sirve para dar una estimacin promediada del efecto curvatura.
El clculo de los efectos e interacciones es el mismo que en el aplicado en la seccin 5.1 (diseo factorial
2k con replica en todos los puntos del diseo, siendo r=1) excepto para el clculo de la suma de cuadrados
del error (SSE), el cual est definido por:
21
Donde:
SSE = Suma de cuadrados del error
Yo = Replicas en el punto central del diseo
no = Numero de rplicas en el centro del diseo.
Y = Promedio de todas las rplicas.
22
Donde:
Yo = Promedio de los puntos exteriores del diseo
Ejemplo 1
Un ingeniero qumico se encuentra estudiando el rendimiento de un proceso. Existen dos variables de
inters, tiempo y temperatura de reaccin. Debido a que tiene duda de la suposicin de la linealidad en
la regin que explore, ella decide realizar un diseo 2 2 (con una Sola replica en cada corrida) aumentada
con cinco puntos centrales. El diseo y los datos de rendimiento se muestran en figura 2.
Fig. 2
En la matriz de variables independientes que se muestra en la siguiente tabla, ntese que los puntos
replicados en el centro del diseo no entran en el clculo de los efectos e interacciones, pero si para
hallar la suma de cuadrados del error.
Modelo Matemtico.
SESION XIII
Suponga que se encuentran en estudio tres factores A, B y C, cada uno con dos niveles. Este diseo se
conoce como diseo factorial 23, y las ocho combinaciones de tratamientos pueden representarse
grficamente mediante un cubo, tal como se muestra en la Fig 6-4a. El orden estndar de las
combinaciones de tratamientos seria (1), a, b, ab, c, ac, bc y abc. Se debe recordar que las letras
minsculas tambin representan los totales de la n observaciones recopiladas bajo la combinacin
particular de tratamientos.
Existen en realidad tres notaciones distintas que se usan ampliamente para las corridas o ejecuciones en
el diseo 2k. La primera es la notacin "+, -", a menudo llamada "notacin geomtrica". La segunda
consiste en el uso de letras minsculas para identificar las combinaciones de tratamientos. En la tercera
notacin se utilizan los dgitos 1 y 0 para denotar los niveles alto y bajo del factor, respectivamente, en %
es de los signos + y -. Estas distintas notaciones se ilustran enseguida para el diseo 23
Existen siete grados de libertad entre las ocho combinaciones de tratamientos en el diseo 23. Tres de
esos grados de libertad se asocian con los principales efectos de A, B y C. Cuatro se asocian con
interacciones (AB, AC, BC y ABC), uno para cada una.
y B en el bajo es [ac - c]/n. Por ltimo, el efecto de A cuando B y C estn ambos en el nivel alto es [abc-
bc]/n. De este modo, el efecto promedio de A es simplemente el promedio de estos cuatro efectos, o sea.
Esta ecuacin tambin puede deducirse como un contraste entre las cuatro combinaciones de tratamientos
en la cara derecha del cubo de la Fig. 9-4a (donde A se halla en el nivel alto) y las cuatro de la izquierda
(donde A se encuentra en el nivel bajo). Es decir, el efecto de A es simplemente el promedio de las cuatro
corridas en que A se encuentra en el nivel alto A+ menos el promedio de las cuatro corridas en que A esta
en el nivel bajo A- , o
Esta ecuacin puede agruparse como sigue
En forma similar, el efecto de B es un contraste entre las cuatro combinaciones de tratamientos de la cara
anterior del cubo y las de la cara posterior. Esto conduce a
El efecto de C es un contraste entre las cuatro combinaciones de tratamientos en la cara superior del cubo
y las de la cara inferior; esto es
Los efectos de la interaccin de dos factores pueden calcularse fcilmente. Una media de la interaccin
AB es la diferencia entre los efectos promedio de A a los dos niveles de B. Por convencin, la mitad de
esta diferencia se denomina interaccin AB. En trminos matemticos,
Dado que la interaccin AB es la mitad de esta diferencia,
De esta forma es fcil ver que la interaccin AB es la diferencia de promedios entre corridas en dos planos
diagonales del cubo de la Fig. 9-4. Aplicando un razonamiento similar y haciendo referencia a la Fig. 9-4b,
las interacciones AC y BC son
La interaccin ABC se define como la diferencia promedio entre la interaccin AB para dos niveles distintos
de C. De este modo,
Como antes, la interaccin ABC puede considerarse la diferencia de dos promedios. Si las corridas de los
dos promedios se aslan, definen los vrtices de los dos tetraedros que comprenden el cubo de la Fig. 9-
4c.
En las Ecuaciones 1 al 7, las cantidades entre parntesis son contrastes entre las combinaciones de
tratamientos. En la Tabla 9-3 aparece una tabla de signos positivos y negativos desarrollada a partir de las
constantes de los contrastes. Los signos de los efectos principales se determinan asignando un signo
positivo con el nivel superior y uno negativo con el inferior. Una vez que se han establecido estos signos,
los de las columnas restantes pueden obtenerse multiplicando rengln por rengln las columnas
apropiadas que le preceden. Por ejemplo, los signos de la columna AB corresponden al producto de los
signos de las columnas A y B en cada uno de los renglones. Fcilmente se puede determinan el contraste
de cualquier efecto a partir de esta tabla.
La Tabla 9-3 tiene algunas propiedades interesantes.
1) Excepto por la columna cada columna tiene un nmero igual de signos positivos v negativos.
2) La suma de los productos de los signos de cualquier par de columnas siempre es cero.
3) El producto de la columna por cualquier otra columna dela a dicha columna sin cambios. En otras
palabras, es el elemento de identidad.
4) El producto de cualquier par de columnas produce otra columna que pertenece a la tabla. Por ejemplo,
A x B = AB, y
Es posible apreciar que los exponentes de los productos se forman usando aritmtica. Mdulo 2
(el exponente solo puede ser cero o uno; si es mayor que uno se reduce mediante mltiplos de
dos hasta que sea cero o uno). Todas estas propiedades son consecuencia de la ortogonalidad
de los contrastes usados para estimar los efectos.
Fcilmente se puede determinar las sumas de cuadrados de los efectos, porque a cada una le
corresponde un contraste de un solo grado de libertad. En el diseo 23 con n replicas, la suma de
cuadrados de cualquier efecto es
El ingeniero del proceso puede controlar tres variables durante el proceso de llenado; el porcentaje
de carbonatacin (A), la presin de operacin en el llenador (B) y las botellas producidas por minuto
o rapidez de lnea (C). Es sencillo controlar la presin y la rapidez, pero el porcentaje de
carbonatacin es ms difcil de controlar durante la manufactura real debido a que vara con la
temperatura. Sin embargo, para los fines de un experimento, el ingeniero puede controlar la
carbonatacin en tres niveles; 10, 112 y 14 por ciento. Elige dos niveles para la presin (25 y 39 psi)
y dos niveles para la rapidez de lnea (200 y 250 bpm). El ingeniero decide correr dos rplicas de
un diseo factorial con estos tres factores, hacindolas 24 corridas de manera aleatoria. La variable
de respuesta observada es la desviacin promedio de la altura del llenado objetivo que se observa
en una corrida de produccin de botellas con cada conjunto de condiciones. En la Tabla 5-13 se
muestran los datos que resultaron de este experimento. Las desviaciones positivas son alturas de
llenado arriba del objetivo. Los nmeros encerrados en crculos de la tabla 5-13 son totales de las
celdas de tres vas yijk.
Para calcular las sumas de cuadrados de las interacciones de dos factores, se debe encontrar los
totales de las celdas de dos vas. Por ejemplo, para encontrar la carbonatacin presin o
interaccin AB, se necesitan los totales de las celdas A x B (yij..) que se muestran en la tabla 5-13.
Utilizando la ecuacin 5-31, se encuentra que la suma de cuadrados son
Para la carbonatacin rapidez o interaccin AC se usan los totales de las celdas A x C {y i.k.} que
se muestran en la tabla 5-13 y la ecuacin 5-32:
La presin-rapidez o interaccin BC se encuentra con los totales de las celdas B x C {y. jk.} que se
muestra en la tabla 5-13 y la ecuacin 5-33
La suma de cuadrados de la interaccin de los tres factores se encuentra con los totales de las
celdas A x B x C {yijk.}, los cuales estn encerrados en un crculo en la tabla5-13. Por la ecuacin
5-3 se encuentra.
Se tiene
Como ayuda para la interpretacin prctica de este experimento, en la figura 5-16 se grafican los
tres efectos principales y la interaccin AB (carbonatacin-presin). Las representaciones de los
efectos principales son solo graficas de los promedios de las respuestas marginales para los
niveles de los tres factores. Observe que las tres variables tiene efectos principales positivos; es
decir, el incremento de la variable mueve hacia arriba la desviacin promedio del llenado objetivo.
La interaccin entre la carbonatacin y la presin es bastante pequea, como lo indica la forma
similar de las dos curvas de la figura 5-16d.
Puesto que la empresa quiere que la desviacin promedio del llenado objetivo est cerca del cerco,
el ingeniero decide recomendar el nivel bajo de la presin de operacin (25psi) y el nivel alto de la
rapidez de lnea (250bpm, que maximizar la rapidez de produccin). En la figura 5-17 se grafica
la desviacin.
Figura 5-16 Graficas de los efectos principales y la interaccin del ejemplo 5-3, a) porcentaje de carbonatacin (A),
b) presin (B), c) rapidez de la lnea (C), d) interaccin carbonatacin-presin.
Promedio observada de la altura de llenado objetivo con los tres diferentes niveles de
carbonatacin para este conjunto de condiciones de operacin. Ahora, el nivel de la carbonatacin
no puede actualmente controlarse perfectamente en el proceso de manufactura, y la distribucin
normal indica con la lnea continua de la figura 5-17 es una aproximacin de la variabilidad de los
niveles de carbonatacin que se Registran actualmente.
Como el proceso es impactado por los valores del nivel de carbonatacin sacado de esta
distribucin, la fluctuacin de las alturas de llenado ser considerable. Esta variabilidad de las
alturas de llenado podra reducirse si la distribucin de los valores del nivel de carbonatacin
siguieran la distribucin normal indicada con la lnea punteada de la figura 5-17. La reduccin de
la desviacin estan dar de la distribucin del nivel de carbonatacin se consiguio finalmente
mejorando el control de la temperatura durante la manufactura.
Ejemplo N 2
Un ingeniero est interesado en el efecto que tiene la rapidez de corte X1, la configuracin X2 y el
ngulo de corte X3 sobre la duracin de una herramienta. Se eligen dos niveles de cada factor y
se realiza un diseo 23 con tres replicas. Los resultados se muestran a continuacin. Analice los
datos de este experimento.
a) Estime los efectos de los factores. Cules de esos efectos resultan ser mayores?
b) Utilice el anlisis de variancia a fin de confirmar sus conclusiones para en caso (a).
c) Analice el modelo matemtico obtenido.
d) Cules de los niveles de X1, X2 y X3 recomendara el lector?
Solucin.
La matriz de variables independientes se muestra en la siguiente tabla. Como se mencion
anteriormente, la formula matricial ecuacin 7 es muy cmodo para hallar los efectos y ayuda al
anlisis de variancia. La parte inferior de la tabla muestra el producto de la matriz [X]T[Y]
seguidamente el efecto a cada variable correspondiente a la columna indicada. Los efectos de
las variables e interacciones estn divididas entre 12 ((N/2)r =(8/2)*3 = 12).
El valor de F es tabulado pare un nivel de significancia del 99% y para f1=1 y f2=16 tenemos:
Por lo tanto podemos hacer las siguientes conclusiones:
La suma de cuadrado medio del error es 30.3 con 16 grados de libertad. As el valor de F o es:
Como puede observarse en la figura 1, el termino interaccin le da cierta curvatura al modelo, por
lo que, un modelo en el cual el trmino interaccin est presente se le puede considerar como un
modelo matemtico de segundo orden,
Fig. 1 Representacin grfica de un modelo lineal con interaccin
SESION XIV
Donde:
k: Es el nmero de factores a estudiar.
p: Es el nmero de factores a confundir.
De esta manera es posible estudiar por ejemplo el efecto de cuatro o ms factores, realizando un mnimo
de ocho experiencias. Para esto se requiere que algunas de las interacciones de orden superior sean nulas
o despreciables.
Se estudia a partir de k=3 factores en dos niveles cada uno, para lo cual utilizaremos un diseo factorial
fraccionado del tipo (1/2)n2k, donde n es la cantidad que debe disminuirse la fraccin. Mediante esta
ecuacin se puede generar factoriales de , 1/8, 1/16 etc.
Ejemplo 5: se desea evaluar un diseo 23=8 pero queremos una media fraccin, por lo tanto tendremos
(1/2)123=4 combinaciones de tratamiento.
Notase que el diseo 23-1 se forma al seleccionar slo las combinaciones de tratamiento que producen la
multiplicacin de signos, donde C=AB.
Es posible construir la combinacin de tratamientos del diseo 2k-1 completo igualando el factor C por la
interaccin AB, de amplia aplicacin cuando los efectos principales son negativos pero tienen una gran
influencia en el proceso.
Ecuacin Generatriz (I= X1X2X3)
En un diseo 23 = 8 experiencias, existe una interaccin de tercer orden, X1X2X3 que puede considerarse
nula o despreciable y lo cual puede ser utilizado para examinar otro factor como X4, igualando X4 a X1X2X3
(lo que puede hacerse como X4 =+/- X1X2X3). Si se tiene conocimiento previo de la no existencia de
interacciones entre los factores X1 X2 se puede suponer, por ejemplo, que la interaccin X1X2 es nula o
despreciable y puede utilizarse para estimar el efecto de un quinto factor X5, igualando X5 = +/- (X1X2) y as
sucesivamente.
De este modo un diseo factorial fraccional con ocho observaciones puede ser til para:
a) Estimar los efectos de tres factores y todas las interacciones entre ellos (diseo 23 completo).
b) Estimar los efectos de cuatro factores y tres interacciones de segundo orden, todas las restantes se
consideran nulas o despreciables.
c) Estimar los efectos de cinco factores y 2 interacciones de segundo orden, todas las restantes se
consideran nulas o despreciables.
d) Estimar los efectos de seis factores y una interaccin de segundo orden, todos las restantes se
consideran nulas o despreciables.
e) Estimar los efectos de los siete factores, todas las interacciones se consideran nulas o despreciables.
SESION XV
Un diseo factorial con ocho observaciones puede ser suficiente (por ejemplo un diseo 2 3). Como
mencionamos arriba, podemos asumir que la interaccin de tercer orden X1X2X3 es aproximadamente igual
a cero o despreciable, e igualando a un cuarto factor o variable obtenemos:
X 4 = X 1 X 2X 3
Aplicando la ley de multiplicacin de factores, multiplicando ambos lados de la relacin de generacin por
X. obtenemos:
Seguidamente, para ver cul es lo que estamos midiendo y que efectos estamos perdiendo, se construye
una tabla denominada Tabla de aliases, esto es, multiplicando la definicin de contraste con la
combinacin de factores del diseo base (23), como puede observarse en la tabla. Por ejemplo:
En la prctica las interacciones de tercer orden son aproximadamente iguales a cero, ms frecuentes que
las interacciones de segundo orden.
Por lo tanto, la relacin de generacin escogida (X4 = X1X2X3) es apropiada para la estimacin de efectos
principales o trminos lineales del modelo matemtico.
Si seleccionamos ahora una nueva relacin de generacin:
X4 = X 1X2
La tabla de aliases se muestra en la tabla siguiente, se obtiene multiplicando la definicin de contraste por
la columna correspondiente al diseo base.
Interpretacin: Utilizando la relacin de generacin (X4 = X1X2), obtenemos es un buen estimado de los
coeficientes de los trminos de interaccin doble del modelo matemtico, lo que puede utilizarse si el
inters es investigar las interacciones dobles entre las variables.
Existen numerosas alternativas para el fraccionamiento de un diseo. La tabla (*) resume las distintas
posibilidades de investigar ms de 3 variables, tomando diferentes combinaciones de definicin de
contrataste, utilizando la siguiente notacin:
3 1/2 Igualar C con - Todos los efectos principales estn confundidos con
interacciones de segundo orden, dan efectos principales
AB
cuando todas las interacciones se suponen
despreciables.
8 3 Completo -- Todos los efectos principales e interacciones se obtienen
en forma independiente.
5 1/4 Igualar D=ABC Todos los efectos principales estn confundidos con
y E=-BC interacciones de segundo. Las restantes interacciones de
segundo orden estn confundidas unas con otras; dan
efectos principales y las interacciones de segundo orden.
Las restantes interacciones se suponen despreciables.
16 4 Completo -- Todos los efectos principales e interacciones se obtienen
en forma independiente.
Podemos estudiar cuatro variables (k=4) utilizando 8 pruebas experimentales, es decir, que podemos
fraccionar para p=1:
Como mencionamos anteriormente, podemos elegir como relacin de generacin a: X4=X1X2X3 si nuestro
inters fundamental es investigar el efecto de cada una de las variables independientemente.
La programacin de las pruebas experimentales y las respuestas pare el diseo factorial fraccionado se
muestra en la tabla 1
Los clculos para hallar los efectos principales e interacciones de las variables son los mismos que se usan
para el anlisis de un diseo factorial completo.
Calculo de Efectos
F de tabla para un nivel de significancia de 0.01 y para 1 y 2 grados de libertad es 98.5. Por lo tanto, las
variables en forma independiente, tempo de molienda y dosificacin de colector son significativas, mientras
que el pH y la adicin de espumante resultaron insignificantes
Modelo Matemtico
Yest. = 87.65 + 1.6 X1 - 1.75 X3
SCMR= 0.748
La suma del cuadrado medio del error as 0.04 con 2 grados de libertad. As el valor de Fo es:
Como ya se analiz, las variables principales X1 y X3 son significativas. Ahora analicemos que factores estn
confundidos y que es lo que estamos midiendo:
Como mencionamos anteriormente, en la prctica los trminos de interaccin de tercer orden son iguales a
cero, por lo que tendremos un buen estimado de las variables o factores principales X1 y X3, as decir:
SESION XVI
Este es un tipo de diseo de experimentos muy importante, desafortunadamente hay solamente pocas
referencias de aplicacin prctica en procesamiento de minerales y en metalurgia. Esto se debe
probablemente a que los Ingenieros no han reconocido todava la verdadera utilidad de este diseo,
especialmente en la etapa de Screening, para la determinacin de las variables ms importantes que
afectan la respuesta o respuestas de un proceso bajo estudio.
El diseo Plackett y Burman es un tipo especial del diseo factorial fraccionado, donde se puede construir
diseos apropiados para el estudio de k variables en N pruebas experimentales, donde N>k. Como pueden
estudiarse con N experimentos hasta N-1 variables, la diferencia se asigna a variables denominadas
ficticias (no representan a ninguna variable experimental), cuya utilidad bsica es la determinacin de la
variancia del error experimental, como veremos ms adelante. Por esta razn es conveniente que se
apliquen o empleen al menos 02 variables ficticias.
Existen modelos para 8, 12, 16, 20, 24,...100 en mltiplos de 4. Las experiencias de estos arreglos se
definen en la primera fila y a partir de estos se construye el conjunto de arreglos experimentales, rotando
en forma cclica cada columna anterior.
Por ejemplo para k=4, el nmero de pruebas es 8, como se muestra en la matriz de diseo de la tabla 6.8
Podemos escoger arbitrariamente que las variables a investigar son X1, X2, X4, X7 y las variables
ficticias pueden ser X3, X5, X6. La ltima fila (8) se completa con (-).
N=8 :+++-+--
Por ejemplo, supongamos que deseamos investigar 8 variables, segn lo anterior tendramos que elegir 12
pruebas experimentales y designar 3 variables ficticias para evaluar el error experimental, como se
muestra en la tabla.
De la misma manera que los diseos factoriales, la matriz del diseo cumple las mismas propiedades:
Para la estimacin de la suma de cuadrados del error del sistema se emplean las variables ficticias. Para
ello, se hace una estimacin de sus efectos, los cuales en teora deben ser nulos; de no ser as, es de
suponer que su valor se debe puramente al error experimental. La suma de cuadrados del error est dado
por la siguiente ecuacin:
Donde:
Ef: Son los efectos mostrados por las variables ficticias la suma de cuadrados medios est definida por:
Donde:
nf = Numero de variables ficticias.
Modelo Matemtico
Con un modelo P&B se puede estimar modelos de primer orden, solamente para los trminos lineales,
mas no para evaluar interacciones entre las variables. Como todo diseo de primer orden, la evaluacin
de los coeficientes del modelo sigue el mismo procedimiento. El siguiente modelo podr ser estimado para
un diseo P&B.
Cabe sealar que solamente formaran parte del modelo matemtico final los coeficientes que resulten
significativas al proceso bajo estudio. La validez del modelo se prueba siguiendo el mismo mtodo del
diseo factorial.
Ejemplo del diseo Plackett y Burman
En el estudio de la separacin de Cu-Mo por flotacin de un concentrado bulk se parte de las siguientes
premisas:
Investigo el efecto del NaHS como depresor del Cu (CuFeS2), la influencia de esta variable se estima
en trminos de estabilidad de HS-, por lo cual fue necesario controlar el potencial redox, segn el
diagrama Eh-pH.
Asimismo, se evalu el uso del N2 como gas de flotacin, no solo porque reduce el consumo de NaHS
sino tambin, para averiguar si tena algn efecto en la eficiencia de separacin.
Adems se evalu otras dos variables tpicas de la flotacin como son el tiempo de
acondicionamiento y el tiempo de flotacin.
Antes de realizar la experimentacin se defini la funcin objetivo o lo que es lo mismo, el criterio o los criterios
de optimizacin; en este caso se consider tres:
a) Eficiencia de separacin.
b) Eficiencia de concentracin.
c) consumo de NaHS.
Los niveles para las variables consideradas, incorporando dos variables ficticias en el estudio, se muestran
en la tabla siguiente:
Una vez definido, los niveles para cada factor, y considerando dos variables ficticias, se procedi a efectuar
las pruebas; para cada prueba se midi los tres criterios de optimizacin como se muestra en la tabla
siguiente:
Y 1 = Eficiencia de separacin
Y2 = Eficiencia de concentracin de MoS2
Y 3 = Consumo de NAHS.
Nota: El factor ms importante en la primera evaluacin es el potencial redox, como puede observarse al
pasar de un valor inferior de (-400 v) a un valor superior de (- 200 v), la eficiencia de separacin disminuye
en 49.48%. Esto puede interpretarse de una manera opuesta, o sea que, al pasar de un nivel inferior de
(-200v) a otro superior de (-400 v) la eficiencia de separacin aumenta en 49.48%. Por consiguiente,
podemos afirmar que valores ms negativos del potencial redox mejoran la eficiencia de separacin.
Para un nivel de significancia de 99% y para 1 y 2 grados de libertad, respectivamente, F de tabla es 98.50.
Como podemos observar, para el nivel de significancia indicado solamente el potencial redox es significativo.
Considerando ahora un nivel de significancia menor (97.5%) F de tabla, para este caso es 38.51,
consiguientemente el potencial redox, adicin de carbn activado y el tiempo de flotacin, resultaron
significativos.
Modelo Matemtico
Yest = 36.34 - 24.74 X1 + 8.64 X2 + 9.59 X5
F = 53.81/11.14=4.82
Para un nivel de significancia del 95% el valor de F de tabla es 18.5, y esta es mayor que 4.82. Por lo
tanto, el modelo matemtico ajusta o representa adecuadamente a los datos experimentales.
Como puede observarse, hay en total 4 variables, para poder visualizar necesitamos hacer cortes en uno
de los ejes
Para X5= 0: Yest = 36.34 - 24.74 X, + 8.64 X2 (1)
Para X2= 0: Yest = 36.34 - 24.74 X, + 9.59 X 5 (2)
Para X1= 0: Yest = 36.34 - 8.64 X1 + 9.59 X5 (3)
YEST = -46.52 -0.247 Z1 + 8.64 Z2 La representacin grfica puede apreciarse en la figura 6.2.
A un nivel de significancia de 97.5% y para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
el potencial redox, adicin de carbn activado y tiempo de flotaci6n, son significativas.
Modelo matemtico
Yest = 6.63 - 5.77 X, + 3.65 X 2 + 3.70 X 5
F de tabla para un nivel del 95% y 4 y 2 grados de libertad, respectivamente es 18.5, por tanto 3.28 es
menor que 18.5 y por lo cual, el modelo matemtico estimado ajusta o representa adecuadamente a los
datos experimentales.
A un nivel de significancia de 97.5% y Para 1 y 2 grados de libertad el F de tabla es 38.51, por lo cual
ninguna de las variables es significativa. Por lo tanto, no podemos estimar un modelo matemtico que sea
vlido para el estudio.
Pero algo importante, que debemos observar es que el use de nitrgeno como gas disminuye el consumo
de NaHS en 6.40 lb/tn siendo esencial en la reduccin de costos del proceso.
Conclusin
En las tres corridas experimentales un factor importante es el potencial redox, que en valores ms negativos
a 400 mv es beneficiosa para la eficiencia de separacin, as como para la eficiencia de concentracin del
MoS2, siendo su efecto en el consumo de NaHS de regular importancia. Otra conclusin, es que el uso del
gas nitrgeno es beneficioso porque reduce el consumo de NaHS y esto puede redundar en mejoras
econmicas para el proceso.
El estudio consiste en recuperar cobre de los residuos de gas de chimenea en la fundicin de cobre por el
mtodo de Tostacin-Segregacin. El material contiene, adems del cobre, otras impurezas como el
arsnico, bismuto, etc.
El objetivo del estudio consiste en recuperar al menos el 85% de cobre presente en el material inicial y
eliminar en lo posible el 75% de impurezas en el residuo. Otros estudios previos a este trabajo, lograron
una recuperacin mxima de cobre de 60%.
Basados en estudios previos de tostacin-segregacin se defini las siguientes variables controlables:
En el estudio aplicaremos el diseo P&B.
La tabla muestra los resultados del diseo de Plackett y Burman, considerando tres variables ficticias.
Como podemos observar, los efectos ms grandes son la adicin de cal, adicin de coque X2, tiempo de
segregacin y temperatura. El efecto de la adicin de cal X1 es negativo, lo que significa que en su nivel
inferior ( - ) esta variable resulta significativa.
Anlisis de Varianza
SSERROR = (8.53)2 + (1.17)2 + (-1.67)2 = 76.966
SSM = 76.966 / 3 = 25.652
Para un nivel de significancia del 95% y para 1 y 3 grados de libertad respectivamente, Ftablas = 18.5 Por lo
cual, la adicin de cal, la adicin de coque, tiempo de segregacin y temperatura de segregacin son
significativos.
Modelo Matemtico
Yest =19.87 10.07X1 + 6.82X5 + 6.77X7 + 14.32X8
Nota: El modelo matemtico incluye solamente las variables que resultaron significativas. As:
Para un nivel de significancia del 95%, para 7 y 3 grados de libertad, respectivamente, FTablas = 8.89. Por lo
tanto, 4.81 es menor que 8.89, entonces el modelo representa adecuadamente a los datos experimentales.
Es importante tener para la etapa de escalamiento, en el prximo tema, el modelo matemtico obtenido.
Conclusin
Como puede observarse en los resultados obtenidos, la mayor recuperacin de cobre en esta etapa fue de
67% de cobre, lo cual nos indica que an estamos lejos del objetivo trazado (recuperacin mnima 85% de
cobre). Por lo que la aplicacin de la etapa de escalamiento se hace necesaria.
Tambin podemos concluir que las variables: adicin de cal en su nivel inferior mejoran la recuperacin de
cobre; en tanto que, la cantidad de coque, tiempo de segregacin y temperatura de segregacin en su nivel
superior mejoran notablemente la recuperacin de cobre.
UNIDAD IV
Sesin 17: Diseo Hexagonal
Sesin 18: Diseo Octogonal
SESION XVII
OPTIMIZACIN
En el caso ms simple, un problema de optimizacin consiste en maximizar o minimizar una funcin real
eligiendo sistemticamente valores de entrada (tomados de un conjunto permitido) y computando el valor
de la funcin. La generalizacin de la teora de la optimizacin y tcnicas para otras formulaciones
comprende un rea grande de las matemticas aplicadas. De forma general, la optimizacin incluye el
descubrimiento de los "mejores valores" de alguna funcin objetivo dado un dominio definido, incluyendo
una variedad de diferentes tipos de funciones objetivo y diferentes tipos de dominios.
DISEOS ROTABLES
Un diseo experimental rotable es aquel en el cual se tiene igual facultad de prediccin en todas las
direcciones a partir de un punto experimental central y donde los otros puntos experimentales estn a una
distancia constante del punto central. Esto significa que la variancia (Se2) depende solamente de la distancia
del punto (X1X2,...Xk) al punto central del diseo (Xo). El hecho de que la variancia dependa solamente de
la distancia, significa que el diseo permanece inalterado si este es rotado a un ngulo arbitrario tomando
como eje de rotacin el punto central. Esta caracterstica es muy til cuando las unidades de las variables
controlables estn dadas en escala natural, en este caso, evidentemente, la distancia depender de las
unidades en las cuales las variables controlables son las medidas, y que cambios en la magnitud de estas
unidades cambiaran la localizacin de los puntos a una distancia constante del origen.
Los cuales son presentados como polgonos regulares inscritos en una circunferencia cuyo centro es el
origen del sistema de coordenadas, de radio unitario o de radio (2)1/2.
Diseo Pentagonal
Este modelo se utiliza para estimar modelos matemticos de segundo orden, consiste en cinco puntos de
un pentgono ms los puntos necesarios replicados en el centro del diseo para estimar la variancia del
error experimental.
La matriz del diseo puede deducirse de la figura, tal como se observa en la tabla.
Diseo Hexagonal
Es el diseo ms popular utilizado por los investigadores, muy til para estimar modelos de segundo orden,
el cual consiste en seis puntos experimentales correspondientes a un hexgono regular, ms los puntos
necesarios replicados en el centro para estimar la variancia del error experimental. Este diseo se muestra
grficamente en la figura.
La matriz del diseo hexagonal puede deducirse de la figura, cuyos resultados se muestran en la tabla.
Diseo Octogonal
Este diseo es el ms confiable, debido a que utiliza un mayor nmero de observaciones (nmero de
pruebas experimentales). Este diseo consiste en ocho vrtices correspondientes a un octgono regular,
ms los puntos centrales necesarios para estimar la variancia de error experimental. El diseo
esquemticamente se muestra en la figura.
La matriz del diseo octogonal puede deducirse de la figura anterior, el cual se muestra en la tabla
Analizaremos, para este propsito, el ejemplo que venimos tratando (recuperacin de cobre por tostacin-
segregacin). En las etapas anteriores, Screening y escalamiento, se identific las variables que son
significativas para el proceso, y se ubic la regin donde se encuentra, el ptimo.
En esta etapa, de optimizacin final, vamos a describir la regin experimental donde se ubican las
condiciones ptimas, utilizando uno de los diseos rotarles. Para lo que se considera las dos variables ms
significativas, como son:
Adicin de cal y Temperatura de segregacin.
Donde:
Zj: Centro del diseo
Zj: El radio del diseo queda definido por
Por lo tanto, los valores de las variables en escala natural quedan definidos por la ecuacin siguiente:
Utilizando la formula bj*Zj y la tabla anterior se confecciona la matriz de diseo a escala codificado y a
escala natural para los diseos rotables descritos.
a) Diseo Pentagonal:
CODIFICADO NATURAL
N X1 X2 Z1 Z2
1 1 0 90 750
2 0.309 0.951 67.5425 845.1
3 -0.809 0.588 31.2075 808.8
4 -0.809 -0.588 31.2075 691.2
5 0.309 -0.951 67.5425 654.9
6 0 0 57.5 750
7 0 0 57.5 750
b) Diseo Hexagonal:
CODIFICADO NATURAL
N X1 X2 Z1 Z2
1 1 0 90 750
2 0.5 0.866 73.75 836.6
3 -0.5 0.866 41.25 836.6
4 -1 0 25 750
5 -0.5 -0.866 41.25 663.4
6 0.5 -0.866 73.75 663.4
7 0 0 57.5 750
8 0 0 57.5 750
9 0 0 57.5 750
c) Diseo Octogonal
N CODIFICADO NATURAL
X1 X2 Z1 Z2
1 1 0 90 750
2 0.707 0.707 80.4775 820.7
3 0 1 57.5 850
4 -0.707 0.707 34.5225 820.7
5 -1 0 25 750
6 -0.707 -0.707 34.5225 679.3
7 0 -1 57.5 650
8 0.707 -0.707 80.4775 679.3
9 0 0 57.5 750
10 0 0 57.5 750
11 0 0 57.5 750
12 0 0 57.5 750
Los diseos rotables y compuestos son diseos que tienen tres niveles en cada variable, por lo cual
podemos estimar modelos matemticos de segundo orden, segn la serie de Taylor estudiada
anteriormente.
= 0 + + + 2
=1 =1 =1
Los coeficientes del modelo matemtico de segundo orden pueden ser estimados por varios mtodos, entre
los que podemos mencionar a la tcnica de regresin mltiple por mnimos cuadrados, tanto en la forma
ecuaciones normales, forma matricial y el mtodo de correlacin mltiple. En cuanto a otras tcnicas
podemos mencionar a la tcnica de bsqueda directa (por ejemplo la tcnica de Nelder y Mead), o tambin
a la tcnica conocida como los polinomios de Chevyshev, entre otras ms. Desde el punto de vista de la
facilidad, para poder programar en computadoras, el mtodo matricial es el ms recomendable, y que est
definido por la siguiente frmula matricial:
Donde:
X: Matriz de diseo.
XT: Transpuesta de la matriz de diseo.
Y: Los datos observados (respuestas).
CODIFICADO NATURAL
N X1 X2 Z1 Z2 y
1 1 0 90 750 64.1
2 0.5 0.866 73.75 836.6 61.8
3 -0.5 0.866 41.25 836.6 55.3
4 -1 0 25 750 77.3
5 -0.5 -0.866 41.25 663.4 63.2
6 0.5 -0.866 73.75 663.4 39.1
7 0 0 57.5 750 87.9
8 0 0 57.5 750 89.9
9 0 0 57.5 750 88.3
As, el modelo matemtico para el diseo hexagonal propuesto en escala codificada es la siguiente.
El modelo matemtico sirve para predecir los valores de la recuperacin de cobre, reemplazando valores
codificados de las variables en el rango de (-1 a +1). Sin embargo, en muchos casos es preferible expresar
el modelo matemtico en escala natural, especialmente cuando se desea graficar el modelo usando
cualquier software, para ello se debe proceder a decodificar el modelo segn las ecuaciones siguientes.
0 = 0
2
=1 ,=1 =1
Donde:
i: es el cociente de dividir el centro del diseo (Zi ) y el radio del diseo (Zj).
ao: termino independiente del modelo matemtico en escala natural.
El tercer trmino de la ecuacin anterior, por comodidad asignaremos la siguiente notacin para tres
variables: cuando i=1, los valores de j, u son (1,2) y (1,3), cuando i=2 j, u son (1,2) y (2,3) y cuando i=3 j, u
son (1,3) y (2,3). Se puede extender para ms de tres variables, haciendo en anlisis correspondiente.
aij : son los coeficientes del termino interaccin del modelo en escala natural.
Aplicando las ecuaciones para el modelo, al ejemplo que venimos analizando, tenemos la siguiente tabla
de datos:
N Z1 Z2
(-) 25 650
( +) 90 850
Z 57.5 750
Z 32.5 100
1.769 7.5
Termino independiente
0 = 88.7 (7.331.769) (4.277.5) + (181.7692 ) + (397.52 )
+ [17.66(1.769)(7.5)]
0 = 1833.48
Trminos lineales
7.5 18 17.67
1 = 2( ) 1.769 ( ) 7.5 = 2.349
32.5 32.5 32.5
4.27 39.13 17.67
2 = 2( ) 7.5 ( ) 1.769 = 5.5996
100 100 100
Trmino cuadrticos
18
11 = = 0.017
32.52
39
22 = = 0.0039
1002
Termino Interaccin
17.67
12 = = 0.0054
(32.5100)
El modelo debe predecir valores de Y (% de recuperacin de cobre), reemplazando valores naturales de las
variables, del mismo que el modelo matemtico codificado, reemplazando valores codificados de las variables.
Sin embargo, se espera un poco de variacin en los valores, principalmente debido a la exactitud de los
clculos durante la decodificacin.
Los coeficientes de los modelos matemticos son evaluados para analizar su significancia mediante el test
de Student, definido por:
(8.8)
La variancia asociada a cada coeficiente es:
(8.9)
Donde:
Sbj : Desviacin standard asociado a los coeficientes
Cjj : Son los elementos de la diagonal de la matriz de correlacin (XTX)-l.
Se: Desviacin standard del error experimental, que se estima de acuerdo a las ecuaciones 8.10:
0 0
=1
= 0
0
2
= (0 0 ) (8.10)
=1
=
2
Las respuestas en el centro del diseo del ejemplo que venimos tratando son:
Para analizar la significancia de los coeficientes se compara el test t-calculado, con el T tablas, para un nivel de
significancia de 95% (p=0.05) y dos grados de libertad (f=2), el valor de T0.05,2 = 4.3; si T-calculado es
mayor que el t-tabla (Tc >Tt), la variable en cuestin es significativa para el proceso estudiado. Como
puede observarse, en la tabla anterior todos los coeficientes del termino independiente, trminos lineales,
trminos cuadrticos y el termino interaccin resultaron significativos.
De la misma manera el modelo matemtico, derivada de los diseos rotables y compuestos, es avaluado
estadsticamente para ver el grado de ajuste a los datos experimentales, de la siguiente manera:
Se comienza con la suma de cuadrados del residual, que est definido por:
=
=1( )
2
(8.11)
De las observaciones repetidas en el punto central del diseo encontramos la suma de cuadrados del error:
0 2
= =1 (0 0 ) (8.13)
El paso siguiente es hallar la Falta de Ajuste de la suma de cuadrados, tanto del error como del residual. Definido
por:
= (8.15)
3 = 1 2 (8.16)
Aplicando las frmulas para ver la falta de ajuste del modelo matemtico, seguiremos los siguientes pasos:
La suma de cuadrado medio del error es 1.12 (Ver seccin 8.1.4), por lo tanto el valor de F del modelo es:
Fo =3.226/1.12 = 2.88
El valor de F de tablas, para un nivel de significancia del 95% y para 1 y 2 grados de libertad,
respectivamente es:
F0.05, 1, 2= 18.5
Por lo tanto, F del modelo es menor que F de tablas, entonces el modelo ajusta o representa adecuadamente
a los datos experimentales.
DISEO OCTOGONAL
Este diseo utiliza un mayor nmero de pruebas experimentales. Este diseo consiste en ocho
vrtices correspondientes a un octgono regular, ms los puntos centrales para estimar la varianza
de error experimental. Los puntos experimentales se muestran esquemticamente en la fig. 12.3,
se sabe que la suma de los ngulos exteriores de un polgono es de 360 y podemos calcular su
ngulos central segn la siguiente ecuacin.
Para n=8 lados, el valor del ngulo central es de 45, haciendo coincidir uno de los lados que
forma el ngulo central con el eje de las abscisas y los vrtices del octgono correspondera a los
puntos experimentales
La matriz del diseo puede deducirse a partir de la figura 12.3
h) El punto experimental (1)
Como el radio (R=1), tenemos el par ordenado (X1, X2)= (1,0)
i) EI punto experimental (2)
Ejemplo, de aplicacin
En un proceso de flotacin de un mineral sulfurado de cobre, despus de las etapas de screening
y escalamiento se determin que las variables ms significativas son la dosificacin del colector y
el porcentaje de slidos, se desea determinar el mximo porcentaje de recuperacin de cobre: La
siguiente tabla muestra los rangos de operacin.
En la planificacin de las pruebas experimentales, se tiene que encontrar el valor de las variables
en escala natural por medio de la siguiente ecuacin:
N Codificado Natural
X1 X2 Z1 Z2 Y
1 1.0000 0.0000 0.0350 27.5000 92.2
2 0.7071 0.7071 0.0320 29.2677 94.0
3 0.0000 1.0000 0.0250 30.0000 93.6
4 -0.7071 0.7071 0.01793 29.2677 93.5
5 -1.0000 0.0000 0.0150 27.5000 90.9
6 -0.7071 -0.7071 0.0179 25.7322 92.2
7 0.0000 -1.0000 0.0250 25.0000 92.8
8 0.7071 -0.7071 0.0320 25.7322 93.3
9 0.0000 0.0000 0.0250 27.5000 94.1
10 0.0000 0.0000 0.0250 27.5000 94.3
11 0.0000 0.0000 0.0250 27.5000 93.9
12 0.0000 0.0000 0.0250 27.5000 94.0
Tabla 12.3 Planificacin de las pruebas
Los coeficientes del modelo matemtico de segundo orden pueden ser estimados por varios
mtodos entre los que podemos mencionar la tcnica de regresin mltiple por mnimos
cuadrados, tanto en forma de ecuaciones normales, forma matricial y el mtodo de correlacin
mltiple, desde el punto de vista de facilidad, para poder programar en computadoras, el mtodo
matricial es el ms recomendable, y el cual est definida por la (Ec. 70 )
La matriz [X] est definida por los valores de las variables codificadas, que corresponden a sus
respectivos coeficientes de regresin segn el modelo matemtico. La matriz completa del diseo
octagonal es el siguiente:
La matriz transpuesta de X est definida por
El clculo de la matriz inversa ([X]T* [X])-1 denominada tambin matriz de correlacin es constante
en el diseo octagonal siempre y cuando tenga doce pruebas experimentales es decir cuatro
repeticiones en el punto central del diseo, la diagonal de esta matriz inversa es importante en la
determinacin del anlisis de significancia de los coeficientes del modelo matemtico, luego la
matriz es la siguiente:
El producto de la matriz transpuesta de [X]T por el vector de respuestas [Y] es equivalente a la
sumatorias del producto escalar de la matriz [X] por el vector [Y], recordando que el mtodo
matricial es el ms conveniente por su facilidad de clculo:
El modelo matemtico sirve para predecir los valores de recuperacin de cobre, reemplazando
valores codificados de las variables en el rango de (-1 a +1).En muchos casos es preferible
expresar el modelo en escala natural, especialmente cuando se desea graficar, para ello se debe
proceder a decodificar el modelo segn las ecuaciones descritas para los diseos de segundo
orden.
Para el trmino independiente: Segn la (Ec.72)
Antes de proseguir aplicando las actuaciones para la decodificacin del modelo es necesario
conocer los siguientes datos, que se resumen en la siguiente tabla:
El modelo matemtico a escala natural es:
Donde:
Sbj : Desviacin estndar asociado a los coeficientes
Se: Es la desviacin estndar del error experimental.
Cij : Son los elementos de la diagonal de la matriz de correlacin ([X] T [X])-1
Para los datos del problema del diseo octogonal para doce pruebas experimentales su diagonal
siempre ser:
Para calcular el error experimental se hace a partir de las respuestas en el centro del diseo cuyos
valores se dan en la tabla siguiente:
c) calculamos primer o el promedio delas respuestas en el centro del diseo, empleando la (Ec.
82 )
A hora podemos calcular la Desviacin estndar asociada a los coeficientes, mediante la (Ec.86):
a) Clculo de los valores predichos por el modelo [Y] (valor de la variable respuesta estimada),
hallaremos sus valores mediante la frmula matricial:
La media de cuadrados del residual se calcula aplicando la (Ec. 88), teniendo en cuenta que los
parmetros del modelo son seis y se hizo doce pruebas experimentales por lo tanto los grados de
libertad son (12 - 6 = 6)
Recordando que la suma de cuadrados del error experimental se calcula cuando se determina la
significancia de los coeficientes, su valor es (SSE = 0.0875) y su media de cuadrados
MSE = 0.0291667.
La media de cuadrados de la falta de ajuste se calcula con la (Ec. 93), y sus grados de libertad f3
es la diferencia de los grados de libertad del residual (f1) menos los grados de libertad del error
experimental (f2), luego:
f3 = (6 3 = 3)
Este valor los comparamos con el F de tablas, para un nivel de confianza del 95% es decir un nivel
de significacin = 5% para 3,3 grados de libertad es: F(3,3)99% = 29.46
Vemos que el coeficiente b11 y b22 son negativos, por lo tanto, su curva se asemeja a un Elipse.
Como podemos observar, el signo de las determinantes es alternativo (H11 = -4.175) (H22 =
+3.563).
Continuando con el ejemplo del problema que se est desarrollando, vamos a encontrar los valores
ptimos para las variables: (X1: dosificacin de colector) y (X2: % de slidos). Y encontrar la
mxima respuesta (% de recuperacin de cobre), se puede trabajar con el modelo a escala
codificada o a escala natural.
Aplicando las ecuaciones (Ec. 67) y (Ec. 68) hallamos el centro y radio del diseo Octogonal.
El valor de las variables en escala natural se halla por medio de la (Ec. 69)