Tema 1.
Introducción al diseño de
experimentos
Introducción
Las señales de que se
está produciendo un cambio real en el enfoque de planificación de negocios han
sido visibles durante algún tiempo en el desempeño de algunas corporaciones
multinacionales grandes y complejas, queda claro que la toma de decisiones no
puede estar basada en mera observación, intuición o a prueba y error.
Las organizaciones exitosas a menudo basan sus logros en el emprender
estrategias de competitividad inteligentes, las cuales comienzan identificando de
forma clara, certera y realista sus metas y objetivos de acuerdo a planes dirigidos
en el cumplimiento de su misión y visión. Desarrollando estrategias eficaces,
efectivas y eficientes, sin perder de vista metodologías, técnicas y prácticas de
negocio comprobadas por décadas.
Sin duda, uno de los pilares es la mejora continua de la calidad, la cual comienza
asegurando el cumplimento de los estándares de calidad definidos y requeridos
para sus clientes, de forma controlada, planificada y monitoreada. La metodología
de diseño de experimentos (DOE) es una herramienta utilizada frecuentemente
para el diseño consistente de condiciones ideales de un proceso, dando como
resultado productos y servicios que cumplen con los requerimientos y procesos
cuyas operaciones agregan valor a las empresas.
Explicación
1.1 Conceptos básicos
Domínguez y Castaño (2016) definen el diseño de experimentos como “una
metodología que permite planear distintas estrategias para seleccionar, controlar,
analizar e interpretar diferentes condiciones de estudio de una manera objetiva y
sistemática”.
Ronald Fisher publicó en 1935 su libro “The design experiments”, donde a partir de
su experiencia, da cuenta que las fallas en la forma de realizar experimentos
obstaculizaban el análisis de los resultados experimentales, y además proporcionó
métodos para diseñar experimentos destinados a investigar la influencia
simultánea de varios factores.
En 1951, George Box y Wilson desarrollaron algunas experimentaciones
secuenciales en la industria química con gran éxito, por tanto, el diseño de
experimentos se convirtió en una herramienta frecuente para la investigación y
desarrollo. Entre 1970 y 1980 la aplicación se generalizó en las plantas
manufactureras debido al impulso de la calidad en Japón, donde destaca los
conceptos y desarrollo de Genichi Taguchi.
Pero por principio es importante conocer algunos conceptos básicos para entender
y perseguir el objetivo del diseño de experimentos:
Un experimento es una serie de pasos a través de los cuales se trata de probar
una o varias posibilidades en la que se encuentra una determinada situación.
Durante estas pruebas existe un cambio planeado y controlado en las condiciones
de operación de un sistema o proceso, con el objetivo de medir el efecto del
cambio sobre una o varias propiedades del producto o resultado.
A través de una o varias pruebas se determinan los parámetros estadísticos que
nos muestren la aproximación entre el modelo supuesto del proceso (industrial u
otro) y el mundo real, conocido aproximadamente a través de datos obtenidos por
mediciones.
El modelo puede ser:
a. Una relación funcional, en general a través de una ecuación que aproxime la
relación entre las variables (x, y), de tal forma que y = f(x) y algún indicador
que nos muestra qué tan ajustada es la aproximación del modelo con el
proceso físico.
b. Simplemente un conjunto de indicadores estadísticos, como la media, la
varianza, la propia distribución de probabilidad de la población estudiada,
etc.
Así que, tomando en cuenta los conceptos anteriormente expuestos, un diseño
estadístico de experimentos se refiere al proceso que hay que seguir para
determinar las relaciones entre el supuesto modelo y el fenómeno físico real.
1.2 Definiciones elementales
“Experimentar tiene como finalidad entender causas de por qué un fenómeno
varía. La aleatorización es la base para establecer si las variaciones observadas se
deben al error experimental o a efectos debidos a factores de control en un
sistema experimental” (Domínguez y Castaño, 2016).
i. Unidad experimental: pieza(s) o muestra(s) representativa del proceso o
producto a analizar, cuyo resultado será representativo de la población.
ii. Variables: una variable estadística es una función que asigna valores a la(s)
característica(s) analizada.
En todos los procesos intervienen distintos tipos de variables o factores. Según su
valor y la fase de proceso donde intervienen se les llama variables de entrada (X),
las cuales suelen ser independientes, y variables de salida o respuesta (Y), las
cuales son dependientes de las variables de entrada.
Figura 1.1 Variables de entrada y salida del proceso.
De salida
Dado que se busca una relación y = f(x) es necesario identificar las variables de
salida (dependientes) y, que se medirán en cada experimento.
De entrada
Dado que se busca una relación y = f(x) es necesario identificar también las
variables de entrada (independientes) x, que influyen principalmente en la salida.
III Factores: es una variable de interés controlada hasta cierto punto por el
experimentador, de la que se desea estudiar sus efectos en una o varias
respuestas.
Controlables
Son todas las variables que pueden llegar a ser motivo de estudio, ya que forman
parte del proceso en experimentación. El control que se tenga sobre ellas depende
del tipo de variable manejada: eléctrica, mecánica, química, dureza, etc.
Mensurando
Se refiere a la variable en particular, que va a ser motivo de estudio durante el
experimento.
Figura 1.2 Factores y variables en la fabricación de un envase de
plástico. Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de
experimentos (3ª ed.). México: McGraw-Hill.
IV Perturbaciones:
Haz clic en los botones para revisar la información.
Ruido
Se refiere a las variables aleatorias, de diferente naturaleza a la variable en
estudio, externas al proceso en estudio y que por lo tanto no son controlables; sin
embargo, al llegar a determinar su influencia en el proceso, con el adecuado
sistema de control se puede llegar a darle estabilidad al experimento.
Interferencia
Se refiere a las variables aleatorias de la misma naturaleza a la variable en
estudio, externas al proceso en estudio y que por lo tanto no son controlables; sin
embargo, al llegar a determinar su influencia en el proceso, con el adecuado
sistema de control se puede llegar a darle estabilidad al experimento.
Distorsión
Se refiere a las variables aleatorias internas al proceso en estudio, y que, aunque
tampoco pueden ser totalmente controlables, pueden ser disminuidas con un
rediseño del proceso
El ruido a su vez se compone de tres fuentes: error experimental, el error de
medición y el error ambiental.
a. El error experimental es aquel que cada unidad experimental aporta de
manera natural en un estudio, la diferencia que exista entre unidades de
una muestra al medir cierta característica, refleja los errores del
experimentador en la planeación y ejecución del experimento.
b. El error de medición es aquel que debe ser acotado mediante prácticas
efectivas de evaluación del sistema de medición; siempre existirá, como en
todo proceso, cierta variación natural.
c. El error ambiental se refiere a cómo se realiza el experimento hasta caer en
una asignación no objetiva de las muestras, por lo tanto, la mejor forma de
enfrentar éste es la llamada aleatorización.
Proceso: máquina extrusora
Factor Factor de
Variable Nivel
controlable ruido
Velocidad del husillo SI NO Dado por el proceso
Temperatura del SI NO Dado por el proceso
cañón
Presión en el molde SI NO Dado por el proceso
Color SI NO Dado por el proceso
NO SI Dentro de las especificaciones
Calidad del plástico
del proveedor
Temperatura NO SI Semicontrolada por
ambiental ventiladores
Humedad ambiental NO SI Sin control
Tabla 1: Máquina extrusora
Otro concepto importante en la medición es la incertidumbre de la medición,
cuando son varios los factores que intervienen en el proceso. La incertidumbre es
un parámetro que nos indica la variabilidad del proceso, debida a varios factores
involucrados.
V. Niveles: son los diferentes valores o coeficientes que acompañan a cada factor
involucrado en el proceso, y que va ser estudiado en un diseño experimental. Por
ejemplo, Si fuera el tiempo de operación el factor de interés, suponiendo que se
quiere estudiar las respuestas de la productividad en 10, 30 y 60 segundos,
entonces se dice que el factor de tiempo de operación tiene 3 niveles.
VI.Tratamientos: una combinación de niveles de todos los factores.
Por ejemplo, si en un experimento se estudia la influencia de la velocidad y la
temperatura, y se decide probar cada una en dos niveles, entonces cada
combinación de niveles (velocidad, temperatura) es un tratamiento.
VII. Niveles y tratamientos: los diferentes valores que se asignan a cada factor
estudiado en un diseño experimental se llaman niveles. Una combinación de
niveles de todos los factores estudiados se llama tratamiento o punto de diseño.
Por ejemplo, en este caso habría cuatro tratamientos:
Tabla 1.1 Tratamientos por factor. Gutiérrez, H., y De la Vara, R. (2012). Análisis y
diseño de experimentos (3ª ed.). México: McGraw-Hill.
1.3 Usos de los modelos experimentales
Una característica de un experimento bien realizado es que sigue un modelo de
diseño.
El modelo se debe escoger de acuerdo a las características que se desean
observar.
Para ello es necesario tomar en cuenta, entre otros, los siguientes
cuestionamientos:
Los factores a diversos niveles, ¿qué efecto tienen sobre las variables de
salida?
Al utilizar varios factores, ¿se van a comparar entre sí?
¿Coinciden el valor máximo o mínimo del modelo con los valores del
proceso?
¿Se desea rediseñar el modelo?
¿Se desea “controlar” factores, no ruido?
Comparaciones simples:
Comparaciones simples
Cierre
El diseño de experimentos resulta una de las prácticas indispensables para el
conocimiento y mejora de los procesos tanto industriales como de servicios,
basado en el estudio estadístico de datos, análisis, interpretación y control,
resultando una pieza clave para el cumplimiento de la estrategia de competitividad
inteligente de las organizaciones.
Todo análisis y diseño está fundamentado en la aplicación que va a tener una
teoría bien fundamentada. Es por esto que debemos tener claros los conceptos
involucrados en nuestro experimento, a través del cual se pretende probar una o
varias hipótesis.
Igualmente, si pretendemos generar o analizar un modelo, debemos definir una
serie de términos y variables que nos ayuden a caminar por el proceso de
experimentación.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías.México: Alfaomega.
Gutiérrez, H. y De la Vara, R. (2008). Análisis y diseño de experimentos (2ª
ed.). México: McGraw Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley.
Checkpoint
Asegúrate de:
Comprender los conceptos de experimento, modelo y variable.
Saber el concepto de diseño de experimentos.
Conocer los conceptos de factor, nivel y tratamiento.
Tema 2. Modelos experimentales
Introducción
Para Gutiérrez (2012), un aspecto fundamental del diseño de experimentos es
decidir cuáles pruebas o tratamientos se van a realizar y cuántas repeticiones de
cada uno se requieren, de manera que se obtenga la máxima información al
mínimo costo posible. Además, indica que el arreglo formado por los diferentes
tratamientos que serán corridos, incluyendo las repeticiones, recibe el nombre de
matriz de diseño o solo diseño.
De esta forma se construye el modelo de diseño de experimentos, como verás en
el tema, se realiza a través de etapas, principios y consideraciones.
Explicación
2.1 Metrología: etapas del diseño experimental
Domínguez y Castaño (2016) muestran un enfoque sistemático para planear y
realizar un experimento que consta de seis etapas. Gutiérrez (2012), por su parte,
clasifica el enfoque teniendo una guía muy clara para la realización del diseño de
experimentos:
Haz clic en cada una para revisar la información
Planeación y realización
Etapa 1
Reconocimiento y/o planteamiento del problema
Entender y delimitar el problema o situación de estudio, identificando el objetivo
del estudio, si es un problema o una mejora al producto o proceso, por qué es
importante estudiarlo, la magnitud del mismo y el posible impacto de las
consecuencias de los resultados. Establecer qué datos se esperan como efecto o
variable de salida, los cuales deben ser claros, medibles y específicos. Conocer qué
conocimiento y/o tecnología puede ser necesaria o ser obtenida como resultado.
Etapa 2 y 3
Etapa 2. Selección de la variable de respuesta
Etapa 3. Selección de factores, niveles y rangos
Se deben reconocer los objetivos de la experimentación, identificar aquellos
mecanismos que afecten, así se podrá tener claridad en los efectos principales.
La selección de variables de respuesta es vital, pues será medida en cada punto
del diseño y verifica que esta medición es confiable, reflejando el resultado de las
pruebas y el objeto de estudio.
De tal forma que al elegir la variable de respuesta sea clara, para tal motivo se
recomienda que la variable de respuesta sea:
1. Numérica.
2. Completa, que provee toda la información necesaria para entender el
cumplimiento de la meta.
3. Práctica (fácil de medir).
4. Elemental, que no tenga influencia de condiciones ajenos al sistema.
5. Independientes de valores impuestos.
El experimentador debe elegir aquellos factores que considera tendrán un impacto
de mayor influencia en las variables de salidas, se debe tomar en cuenta que parte
del experimento consiste en saber cuáles de ellas son significativas y en qué
grado.
Los factores de control y de ruido deben ser identificados; en el caso de los de
control nos interesan aquellos que son muy influyentes en la variable de respuesta
y son controlables en la práctica. En el caso de los factores de ruido que son
influyentes pero que no pueden ser controlados en la vida real, deben ser
considerados para bloquear sus efectos o cuantificarlos, o bien aprovechar los
efectos de interacción para robustecer el sistema.
Este paso implica determinar cuántas repeticiones (réplicas) se harán para cada
tratamiento, tomando en cuenta el tiempo, costo y precisión deseada. Es muy
importante diferenciar si se requiere repetición o solo una submuestra, lo cual
explicaremos más adelante.
Es importante considerar si existen restricciones sobre el experimento,
preocupaciones sobre los métodos de control, material, costos o cambios en los
factores de control, incluso la legalidad en algunos casos, tener en cuenta para el
diseño del experimento y su realización en la práctica.
Etapa 4
Selección del diseño experimental
En función de los tratamientos, se selecciona el diseño, se organiza y planea con
detalle el trabajo práctico experimental. Considera si por algún criterio existen
preferencias en los diseños estadísticos preestablecidos, por ejemplo, en el área de
experimentación con animales de granja se establece como uno de los más
utilizados el diseño en bloques en parcelas divididas.
Una vez que se termina la planeación previa al experimento, hay que determinar:
a. Tamaño de la muestra.
b. Orden de ejecución.
c. Restricciones.
d. Pruebas iniciales o pilotos.
e. Persona responsable del experimento.
f. Forma de reportar y manejar la información.
El diseño experimental también puede ser realizado utilizando algún paquete
estadístico, que “decidirá” el mejor diseño en función de datos de entrada como
son los factores, niveles y rangos.
Etapa 5
Realizar el experimento
Al realizar el experimento se ha de seguir el plan previamente realizado; sin
embargo, si al realizar el experimento se ve conveniente redefinir el plan, este
debe ser redefinido.
Análisis e Interpretación
Etapa 6
Análisis estadístico de los datos
Como en la etapa 4, para realizar el análisis estadístico de los datos el diseño
experimental puede utilizar algún paquete estadístico, que realizará cálculos y
gráficas de forma automática.
No se debe perder de vista que los resultados responden a observaciones
muestrales no poblacionales, por esta razón se debe recurrir a métodos
estadísticos inferenciales para ver si las diferencias o efectos son significativos. La
técnica estadística central es el análisis de varianza llamado ANOVA por sus siglas
en ingles.
Interpretación
Uno de los pasos primordiales es la interpretación de los resultados; con el
respaldo del análisis estadístico formal se debe analizar y entender a detalle el
efecto del resultado del experimento, observando nuevos aprendizajes que se
desconocían del comportamiento del proceso y/o producto, establecer el
comportamiento de la variable de respuesta con respecto al de los tratamientos,
contrastar conjeturas iniciales con los resultados reales del experimento y
entender que la diferenciación de estos no debe perder de vista el objetivo de
estudio.
Etapa 7
Etapa 7. Conclusiones y recomendaciones
Para concluir es necesario que el experimentador que participó en la realización
del experimento muestre sus propias conclusiones, y de acuerdo a estas y a
problemas que quedaron pendientes de especificar realice las recomendaciones
que crea conveniente.
No es fuera de lo común que dentro de la conclusión se plantee la necesidad de
realizar nuevas investigaciones.
Las primeras tres etapas son en realidad una planeación previa al experimento.
Las etapas 2 y 3 pueden realizarse simultáneamente o en orden inverso (primero
la etapa 3 y después la etapa 2).
2.2 Principios básicos del diseño experimental
Gutiérrez (2012) argumenta que “el punto de partida para una correcta planeación
es aplicar los principios básicos del diseño de experimentos: aleatorización,
repetición y bloqueo, los cuales tienen que ver directamente con que los datos
obtenidos sean útiles para responder a las preguntas planteadas”. Por tanto,
propone los siguientes principios básicos para el diseño de experimentos:
2.3 Proceso de experimentación
Es muy
importante tomar en cuenta la mención que realizan Domínguez y Castaño (2016)
con respecto a la exactitud de técnicas experimentales: “Ningún análisis
estadístico o de ningún otro tipo puede mejorar los datos obtenidos de un
experimento pobremente realizado”. Y recomiendan los siguientes puntos para
eliminar las variaciones en las técnicas:
Aplicar técnicas estandarizadas.
Ejercer control sobre las influencias o factores ambientales.
Asegurar un sistema de medición confiable (Gage R&R).
Adicionalmente, Gutiérrez (2016) establece: “Es necesario reconocer que las
metodologías estadísticas por sí solas no garantizan investigaciones exitosas”, por
ello es importante considerar:
Que el experimentador tenga un buen nivel de conocimiento técnico y
práctico sobre el fenómeno o proceso que estudia, conociendo previamente
comportamientos.
Que el experimentador reconozca la importancia estadística, ya que en
algunos casos las diferencias significativas no necesariamente son una
importancia en la práctica.
Una experimentación secuencial dividida en fases siguiendo una estrategia
bien definida y pensada; por lo tanto, en cada fase se obtienen resultados y
conclusiones importantes que permiten generar soluciones y conocimiento
más refinado para plantear de mejor manera la siguiente fase de
experimentación, y no un solo largo y costoso experimento.
Cierre
Es necesario seguir etapas bien definidas para llevar a cabo un experimento: las
primeras etapas para realizar una planeación previa al experimento; y las etapas
subsecuentes para llevarlo a cabo.
Terminando con las conclusiones y recomendaciones pertinentes al proceso
llevado, siempre cuidando que durante todo el proceso de experimentación se
respeten los principios básicos del diseño experimental.
En el siguiente tema repasaremos conceptos básicos estadísticos en los cuales se
basa el diseño de experimentos.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Checkpoint
Asegúrate de:
Comprender las etapas del diseño experimental y sus principios básicos.
Saber el proceso de experimentación.
Tema 3. Conceptos básicos para la prueba de hipótesis
Introducción
Como lo mencionamos
en el tema 2, la planeación es la primera fase del diseño de experimentos, donde
el problema a resolver es descrito, ya sea para implementar con éxito un nuevo
producto o proceso, o bien la mejora; es vital identificar las variables o factores
que intervienen buscando cuáles variables de entrada X son significativas para la
variable de salida o respuesta Y.
El objetivo primordial de un diseño de experimentos es dirigir con intención los
factores para descubrir cuáles tienen un efecto óptimo en la respuesta, y en el
conjunto se maneje de forma que gastemos menos recursos y se obtenga una
mejor calidad a menor precio.
Hay que reconocer que difícilmente se pueden saber las condiciones originales de
los procesos, así como la estimación puntual de los costos al iniciar un
experimento, puesto que es común que se tenga una gran cantidad de datos para
iniciar, por ello se toman para su estudio estimadores puntuales, los cuales son un
valor numérico de estimación a los parámetros de una población.
El comportamiento de la población puede ser descrito mediante un parámetro, el
cual a partir de inferencia estadística puede ser representado por un estimador
llamado puntual de una muestra representativa.
Las técnicas estadísticas confiables son la estimación de parámetros y la prueba
de hipótesis.
En este tema estudiaremos el cálculo de los parámetros y estimadores puntuales
con base en las distribuciones más utilizadas.
Explicación
3.1 Conceptos básicos de estadística
Lo primero que nos interesa conocer de la información o datos son sus parámetros
de centralización y de dispersión, pues nos indicará el comportamiento de la
población con respecto a su distribución. Para esto debemos suponer que x es una
variable aleatoria que sigue una distribución normal con media µ y varianza σ 2, por
tanto sus cálculos se llevan de la siguiente manera:
Media o valor esperado:
a. Para un conjunto de datos discretos x1, x2, ..., xn, con probabilidad p(xi ), se
calcula con la sumatoria mostrada a continuación:
b. Para un conjunto de datos continuos representados por su función de
probabilidad, f(x), se calcula con la integral mostrada a continuación:
Varianza: equivale a la media del error cuadrático; el error cuadrático de cada i-
ésimo valor está dado por (xi- µ)2.
a. Para un conjunto de datos discretos x1, x2, ..., xn, con probabilidad p(xi ), se
calcula como la suma de todos los errores respecto a la media poblacional
µ (donde n es el número de datos):
b. Para un conjunto de datos continuos representados por su función de
probabilidad f(x), se calcula con la integral mostrada a continuación:
Desviación estándar: es la raíz cuadrada de la varianza.
Histograma: es una gráfica en forma de barras, en la que el área de cada barra es
proporcional a la frecuencia con que se repite una variable (Ver el ejemplo).
Distribución de probabilidad continua: dado que una variable continua tiene
infinidad de valores posibles, no se puede deducir la probabilidad de un valor
específico de la variable. Es por esto que la probabilidad se calcula a partir del
intervalo dentro de la distribución de probabilidad (ver el siguiente Ejemplo).
Gráfica de caja: es una gráfica, dividida en cuarteles. Al rectángulo se le llama
caja y a los dos brazos se les llama bigotes. El valor central es la mediana (ver el
Ejemplo 1).
3.2 Muestreo
Una forma de que la muestra sea representativa de la población, es diseñar de
manera adecuada un muestreo aleatorio (azar), donde la selección no se haga en
una dirección que favorezca a ciertos elementos en particular.
Figura 3.3 Población y muestra.
Muestreo aleatorio: de acuerdo a Montgomery, D. (2012), se le llama al proceso
en el cual una muestra de tamaño n puede ser sacada de una población de tamaño
N con un número de combinaciones sin repetición:
Por ejemplo: una muestra de tamaño n = 3 sacada de una población de tamaño N
= 100, se puede realizar de:
Dada la gran cantidad de muestras posibles es necesario disponer de algún
mecanismo para obtener dicha muestra: este mecanismo puede ser el uso de
tablas de números aleatorios o la utilización de funciones de alguna hoja de datos.
Por ejemplo: con Excel podemos incluir la fórmula =FACT(100)/(FACT(100-
3)*FACT(3)) y así obtener el resultado.
Si se toma una muestra aleatoria de n observaciones, entonces la media
muestral y la varianza muestral S2, son estimadores puntuales de la media
poblacional µ y de la varianza poblacional σ , las cuales se calculan de la siguiente
manera:
Media o valor esperado:
De acuerdo a Montgomery, D. (2012), para un conjunto de datos
muestrales x1, x2, ..., xn se calcula como la suma de todos los valores dividida entre
n grados de libertad (donde n es el número de datos):
Varianza: equivale a la media del error cuadrático; el error cuadrático de cada i-
ésimo valor está dado por (xi - µ)2
Para un conjunto de datos discretos x1, x2, ..., xn, se calcula como la suma de todos
los errores respecto a la media muestral , dividida entre n - 1 grados de libertad
(donde n es el número de datos):
Desviación estándar: es la raíz cuadrada de la varianza:
Por ejemplo: deseamos obtener la media y la desviación estándar de una muestra
n = 20:
1 1 1 1 1 1 1 1 1 1
x 1 2 3 4 5 6 7 8 9 20
0 1 2 3 4 5 6 7 8 9
2 3 2 2 2 2 2 2 3 2 3 2 2 3 2 2 3 2 3
y 31
8 3 6 6 7 7 8 8 0 5 2 6 5 0 9 7 2 7 1
Utilizando Excel, obtenemos = 28.4 y S = 2.458
3.3 Distribuciones muestrales
Histograma: es una gráfica en forma de barras en la que el área de cada barra es
proporcional a la frecuencia con que se repite una variable.
Gutiérrez (2012) establece que la distribución de probabilidad o distribución de una
variable aleatoria X relaciona el conjunto de valores posibles de X (rango de X),
con la probabilidad asociada a cada uno de estos valores y los representa a través
de una tabla o por medio de una función planteada como una fórmula.
Las distribuciones de probabilidad que más se usan en intervalos de confianza y
pruebas de hipótesis son las distribuciones: normal, T de Student, ji-cuadrada y F
(Fisher).
Los parámetros que definen las distribuciones T de Student son muestras tomadas
para el experimento.
La distribución normal:
Para Montgomery, D. (2012), la siguiente es la expresión de la distribución normal
de una variable aleatoria x, perteneciente a una población de media µ y varianza
σ2 :
Si la media µ = 0 y la varianza σ2 = 1 tenemos la distribución normal estándar. Si
sustituimos:
Queda la siguiente fórmula:
Figura 3.3 Gráfica de distribución
Teorema del límite central: si x1, x2, ..., xn, es una muestra de n variables
aleatorias e independientes, con media , extraídas de una población con media
µ y varianza σ2, entonces existe una variable aleatoria z que tiende a la normalidad
(distribución gaussiana) cuando n → ∞:
Ejemplo 1
Ejemplo: durante 10 días, se tomaron 200 muestras (20 por día) del denier de
rafia de polipropileno producido por una máquina extrusora de plástico.
Notas:
1 denier = 1 gramo por 9.000 metros
Rafia (los hilos que salen del proceso de extrusión)
Obtener:
a. La media del denier
b. La desviación estándar del denier
c. El histograma del denier con ajuste a la distribución normal
d. La grafica de caja (denier vs día)
Solución 1
Solución: utilizando el programa Minitab se obtuvieron los siguientes resultados
(resaltando con negritas los solicitados en el ejemplo):
Media
del
Desv.Est Mínim
Variable N N* media error Q1| Mediana
. o
estánda
r
2499. 2456.
Denier 200 0 3.79 53.6 2400 2503.0
7 0
Figura 3.1 Histograma de Denier
Figura 3.2 Gráfica de caja de Denier
La distribución Ji cuadrada ( ):
Las distribuciones ji-cuadrada y F son sesgadas y solo toman valores positivos.
La siguiente, según Montgomery, D. (2012), es expresión de la distribución Ji
cuadrada para una muestra de tamaño n: x1, x2, ..., xn
Ejemplo: determinar el valor de X2 a partir de una muestra de tamaño n = 100
obtenida de una población de varianza conocida σ = 3.
Solución:
a. Generamos en una hoja de datos una columna con 100 muestras aleatorias
=10*ALEATORIO()
b. Obtenemos la media , con lo datos de la primera columna utilizando la
función = PROMEDIO (número 1: número 100) = 4.658
c. En la segunda columna calculamos los correspondientes valores de (xi - )2
d. Obtenemos la suma , con los datos de la segunda
columna utilizando la función: = SUMA (número 1: número 100) = 668.9
e. Calculamos el valor de , con la fórmula = 223
La distribución t para dos muestras, es según Montgomery, D. (2012):
Cuando n ≥ 45, la distribución T de Student es prácticamente igual a la
distribución normal estándar.
Ejemplo 2
Ejemplo: determinar el grado de normalidad que tienen:
a. Los números aleatorios generados con una hoja de cálculo (en este ejemplo
con Excel)
b. El promedio de los mismos números
Nota: la prueba de normalidad de Anderson-Darling la presenta Minitab al realizar
el análisis. No es interés de este tema demostrar dicha prueba.
Solución 2
a. Generamos en una hoja de datos 300 muestras aleatorias (3 columnas de
100 valores cada una) con la función = 100*ALEATORIO()
b. Obtenemos la media µ, con la función = PROMEDIO (número 1: número 300)
y la desviación estándar σ, con la función = DESVEST (número 1: número
300)
c. En una cuarta columna calculamos el promedio de tres muestras, , con la
función = PROMEDIO (número 1: número 3)
d. En la quinta columna calculamos los correspondientes valores de z con la
ecuación
e. Copiamos los 300 valores de x a una columna de Minitab
f. Copiamos los 100 valores de z a otra columna de Minitab
g. Realizamos la prueba de normalidad de Anderson-Darling con la siguiente
secuencia de funciones de Minitab: Estadísticas > Estadísticas básicas >
Resumen gráfico
Figura 3.4 Diagrama de control de un proceso
h. Observamos los resultados: la distribución de los 300 números x tiene un A-
cuadrado = 4.44, por lo tanto se aleja de la normalidad; la distribución de
los 100 números z tiene un A-cuadrado = 0.23, por lo tanto se acerca a la
normalidad.
Cierre
La estimación de los parámetros y estimadores puntuales exigen entendimiento de
cómo se puede calcular y cuáles son sus fórmulas, las cuales nos ayudan a
fundamentar el razonamiento de los cálculos. Sin embargo, en la actualidad se
realizan con programas computacionales, tales como Excel, Minitab u otros, por
ejemplo, los límites de tolerancia de los errores para poder después utilizar las
distribuciones en el análisis de datos, lo cual es muy importante para la decisión
del resultado del experimento.
Importante: para el cálculo de medias se utilizan la distribución normal Z y T de
Student, para los cálculos de varianzas se utiliza la distribución ji-cuadrada y si
necesitamos comparar entre varias varianzas, la distribución F resulta una clave
para el diseño de experimentos.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H. y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley.
Checkpoint
Asegúrate de:
Comprender las características que deben tener los parámetros del
muestreo.
Conocer la importancia de uso y la representación gráfica de los diferentes
tipos de distribuciones muestrales.
Tema 4. Pruebas de hipótesis
Introducción
Definimos que la estimación de parámetros y la prueba de hipótesis son las
técnicas de inferencia estadística más eficaces que existen. Recordemos que la
inferencia nos permite conocer el comportamiento que tiene una muestra que
representa a la población, es decir, podemos tener la conclusión de cómo se
comporta la población con respecto a un dato a partir del comportamiento de la
muestra.
En el diseño de experimentos las pruebas de hipótesis son un enunciado acerca de
los valores de los parámetros de una distribución de probabilidad. La probabilidad
en las hipótesis es si el enunciado se cumple o no, depende si el valor de la
información está dentro de cierto intervalo de valor o fuera de este.
En este tema explicaremos cómo plantear los valores, intervalos y las hipótesis, así
como interpretar el resultado de la hipótesis, y cómo esta información impacta a
nuestro experimento.
Explicación
Las hipótesis son enjuiciamientos que se desean comprobar, se comienza con una
aseveración a la que se le llama “planteamiento de una hipótesis”, la cual se busca
comprobar en relación con datos adquiridos de la muestra representativa, logrando
deducir que dicho comportamiento ya lo esperamos en la población.
4.1 Pruebas de hipótesis sobre dos medias
Para realizar las pruebas de hipótesis sobre dos medias, existen dos
procedimientos en general, las que se refieren a las pruebas con varianza conocida
y con varianza desconocida, las que se estudiarán en los siguientes apartados.
Suponiendo que tomamos dos muestras, desde diferentes poblaciones, calculamos
sus medias y sus desviaciones estándar. Iniciamos nuestro modelado suponiendo
que tienen distribución normal, así que graficamos ambas distribuciones para ver
gráficamente sus relaciones:
Figura 4.1 Distribuciones estadísticas de dos muestras
Una prueba estadística para verificar con mejor precisión la relación que existe
entre las dos poblaciones desde las cuales se extrajeron las muestras, puede ser la
verificación respecto a la diferencia de ambas medias:
Llamamos la hipótesis nula a la igualdad entre las medias en estudio: µ1 = µ2
Llamamos la hipótesis alterna o alternativa a la desigualdad entre las medias
en estudio.
Puede ser de tres tipos:
Cuando suponemos que son simplemente diferentes
Cuando suponemos que una de ellas es menor que la otra
Cuando suponemos que una de ellas es mayor que la otra
Se determina un criterio de aceptación o rechazo para hipótesis nula. Si la
hipótesis nula es aceptada, hay en automático un rechazo a la hipótesis alterativa
y, por el contrario, si no existe suficiente evidencia estadística para aceptar la
hipótesis nula, aceptamos la alternativa. a= nivel de significancia y rr= zona de
rechazo.
Se plantean las hipótesis nula (Ho) y alternativa (Ha). Por ejemplo, si se requiere
asegurar que la longitud de una barra sea de 1.50 metros, entonces el enunciado
de la hipótesis se declara:
Ho : µ = 1.50
Ha : µ¹ ≠1.50
En nuestro ejemplo estamos planteando el comprobar que la media de las barras
de metal fabricadas sea o igual a 1.50 m, o bien como marca la hipótesis
alternativa menor o mayor a 1.50 m.
En general, la estrategia a seguir para probar una hipótesis es suponer que la
hipótesis nula es verdadera, y que en caso de ser rechazada por la evidencia que
aportan los datos, se estará aceptando la hipótesis alternativa. La hipótesis
alternativa puede ser unilateral (de un solo lado, como solamente mayor que o
menor que el valor buscado), o bien bilateral (con valor menor y mayor que el
valor buscado), lo cual dependerá del planteamiento y objetivo de la hipótesis.
Intervalo de confianza:
Según Montgomery (2012) un intervalo de confianza se fija de acuerdo al
coeficiente de confianza (1 - ). Si tomamos una muestra aleatoria de tamaño n,
con media de una población con varianza conocida σ 2, entonces el intervalo de
confianza está dado por la expresión:
El teorema del límite central nos dice que las sumas de números tienden a ser de
distribución normal, incluso si la distribución original de los datos no se comporte
normal.
Este teorema comprueba si la estimación puntual de un parámetro es
representante certero del parámetro poblacional, a partir de que la estimación
puntual es tomada de una muestra aleatoria y considerando que al tomar
diferentes muestras tengan variación en los valores entre y dentro de las unidades
experimentales de estudio.
Entender qué tan grande es la diferencia entre los valores, se establece por el
cálculo de la desviación estándar o error estándar y demostrar si se encuentran en
un rango “aceptable” llamado intervalo de confianza, entendiendo que el resultado
es la probabilidad de que nuestro valor se encuentre en dicho rango preestablecido
= “donde puede estar el parámetro”.
Lo que buscamos encontrar es la probabilidad de que el intervalo de confianza
incluye la media y que ésta representa el nivel de confianza deseado.
El nivel de confianza está representado por 100 (1 - ) y su interpretación sería: si
tuvieran 100 muestras independientes de la misma población o proceso, cada una
de tamaño n, para cada muestra tuviéramos un intervalo de confianza del 95%,
entonces esperaríamos que 95 de los 100 intervalos contengan el valor verdadero
del parámetro poblacional. La región de no rechazo representa dónde quedarían
los valores al probar la Ho, mientras no aceptar la Ho sería aceptar la hipótesis
alternativa, la cual se encuentra en la región de rechazo llamada también región
crítica.
Figura 4.2 Distribución normal y límites de confianza
Cuando se prueban hipótesis pueden cometerse dos tipos de errores:
El procedimiento general de la prueba de hipótesis es especificar un valor de la
probabilidad a del error tipo I y controlarlo, generalmente el riesgo ß se puede
controlar con el tamaño de la muestra.
P Value: se define como la probabilidad de obtener un resultado al menos tan
extremo como el que realmente se ha obtenido (valor del estadístico calculado) en
Ho.
Si Pvalue es ˃ la Ho se acepta, por el contrario, si Pvalue es ˂ se acepta la
Ha.
4.2 Pruebas de hipótesis sobre dos medias con varianza conocida
Figura 4.3 Hipótesis sobre dos medias.
El estadístico de prueba, sobre una media poblacional µ 0, que representa nuestra
media objetivo o el requerimiento, con varianza σ 2 conocida respecto a otra
media , de una muestra de tamaño n:
Esta fórmula se utiliza en las siguientes pruebas:
Prueba sobre una media
Prueba H:0 H:1 Criterio de rechazo
1 µ≠µ 0
2 µ=µ 0
µ>µ 0
3 µ<µ 0
El estadístico de prueba, sobre una media 1 , de tamaño n1 con varianza
σ12 conocida, respecto a otra media 2 , de tamaño n2 con varianza, σ22 conocida:
Se utiliza en las siguientes pruebas:
Prueba sobre dos medias
Prueba H: 0 H: 1 Criterio de rechazo
1 µ ≠µ
1 2
2 µ =µ
1 2 µ >µ
1 2
3 µ <µ
1 2
Ejemplo: probar la hipótesis de que H0: µ1 = µ2 y H1: µ1 > µ2 respecto a dos
poblaciones de varianzas conocidas σ 12 = 8.4 y σ22 = 7.2.
Solución:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.
2. Se calculan las medias muestrales: 1 = 102.5 y 2 = 99.6
3. Se calcula:
4. Se determina: para = 0.05
5. Se realiza la comparación: >
4.3 Pruebas de hipótesis sobre dos medias con varianza desconocida
Para Montgomery (2012) el estadístico de prueba sobre una media poblacional µ,
con varianza desconocida respecto a otra media , de tamaño n, se representa
con la siguiente fórmula:
Esta fórmula se utiliza en las siguientes pruebas:
Prueba sobre una media
Prueba H:0 H:
1 Criterio de rechazo
1 (dos colas) µ≠µ 0
2 (una cola) µ=µ 0 µ>µ 0
3 (una cola) µ<µ 0
El estadístico de prueba, sobre una muestra de media 1 , de tamaño n1 y con
varianza S12, respecto a otra muestra de media 2, de tamaño n2 y con
varianza, S22, representa los grados de libertad.
Esta fórmula se utiliza en la siguiente prueba:
Prueba sobre dos medias
Prueba H: 0 H: 1 Criterio de rechazo
1 µ <µ
1 2
µ =µ
1 2
2 µ >µ
1 2
Si en el caso anterior S12 = S22 = S el estadístico de prueba, sobre una muestra de
media 1, de tamaño n1 respecto a otra muestra de media 2 , de tamaño n2,
representa los grados de libertad.
= n1 + n2 - 2
Esta fórmula se utiliza en la siguiente prueba:
Prueba sobre dos medias
Prueba H: 0 H: 1 Criterio de rechazo
1 µ =µ
1 2 µ ≠µ
1 2
Ejemplo: probar la hipótesis de que H0: µ1 = µ2 y H1: µ1 > µ2 respecto a dos
poblaciones de varianzas desconocidas.
Solución:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.
2. Se calculan las medias muestrales: 1 = 102.5 y 2 = 99.6
3. Se calculan las varianzas muestrales: S1 = 8.4 y S2 = 7.2
4. Se calcula:
5. Se determina: para = 0.05
6. Se realiza la comparación: <-
Ejemplo
×
Ejercicio
Se desea conocer si se está cumpliendo la especificación de alquitrán en la
fabricación de cigarrillos, la cual es de 14 mg con un intervalo del 95%. Por lo
tanto, se toma una muestra de producción obteniendo las siguientes mediciones
de alquitrán: 14.5, 14.2, 14.4, 14.3, 14.6.
pótesis y el nivel de significancia α
Ho = 14 Ha ≠ 14 α=.05
µ ≠ µ0 |t | ˃t
0 α/2 ,n-1
ra aleatoria y calcular estadísticos básicos. Identificar que necesitamos encontrar si la media
a la media de la muestra, por otro lado, desconocemos la varianza poblacional y nuestra muestra
piezas, por tanto, calculamos:
= (14.5+14.2+14.4+14.3+14.6 ) /5 = 14.4
ndar (raíz cuadrada de la varianza)
ca, la cual es a partir de los límites conforme la fórmula.
de t buscándolo en las tablas t-Student, tomando un α=.05.
α/2 = t .025 (grados de libertad n -1 = 5-1=4)
76
stro límite es de 2.776, el punto de proceso cae en zona de rechazo, por tanto, no se acepta la Ho,
ta Ha donde nos expresa que la media es diferente a 14.
El mismo ejercicio realizado en Minitab:
Stat ˃ basic stadistics ˃Display Descriptive stadistics
Esta pantalla se obtuvo directamente del software que se está explicando en la
computadora, para fines educativos.
Seleccionando la columna de los datos como variable, nos desplegará el valor de la
media y desviación estándar:
Descriptive Statistics: Alquitran
Enseguida buscaremos respuesta a la prueba t. Por tanto, seleccionamos Stat ˃
basic stadistics ˃ One simple t
Elegimos la columna donde estan nuestros datos de la medicion de alquitran de la
muestra, seleccionamos donde solicitamos que se realice la prueba de hipotesis
(perform hypothesis test) y en este caso al tener la media objetivo o requerimiento
vamos a escribirlo en “Hypothesized mean” en este caso 14
En “options” u opciones asegurarse que el nivel de confianza es 95% por eso el
α=1-.95 α=.05 y nos aseguramos que la hipótesis alternativa será que la media no
es igual a la hipótesis nula que sostiene que la media de la muestra es igual a la
media objetivo.
Al hacer clic en Ok, Ok, se despliega la prueba de hipótesis en resultados:
One-Sample T: Alquitran
Así que al obtener que el p value o valor P es .005 ˂ .05 de α, podemos definir, por
tanto, no se acepta la Ho, lo cual establece que la media de las muestras no es
igual de la media objetivo y podemos entonces inferir que es algo que ocurre con
toda la población.
Cierre
Todo diseño de experimentos comienza con la etapa de análisis de datos a través
de una hipótesis estadística, la cual revela el nivel de confianza que tenemos en
los datos de nuestro proceso y nos ayuda a entender el comportamiento de la
media y variación que existe. En el siguiente tema veremos cómo realizar la
distribución de los datos para comprender qué tanta dispersión existe entre ellos.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley.
Checkpoint
Asegúrate de:
Entender los conceptos de intervalos de confianza, valor de P, valor de a,
error tipo I y error tipo II.
Comprender cómo distinguir entre utilizar una prueba de medias con
varianza conocida o varianza desconocida.
Saber cómo distinguir entre utilizar una prueba de dos colas o de una cola.
Tema 5. Pruebas de hipótesis 3
Introducción
Un paso muy importante en el análisis y diseño de experimentos, después de la
planeación preexperimental, es la selección del diseño experimental; en el cual
hay que seleccionar la prueba de hipótesis que más convenga para el caso en
estudio.
Debido a lo anterior, es necesario tener a la mano el abanico de posibilidades.
En este tema veremos las pruebas respecto a la varianza de la población o de la
muestra, según convenga.
Este análisis se realiza de acuerdo a si queremos comparar la varianza con un
valor preestablecido o si lo queremos hacer comparando dos varianzas.
Explicación
5.1 Pruebas de hipótesis sobre una varianza
El hecho de que tengamos dos números diferentes de varianza, por ejemplo, uno
que obtenemos de la muestra y una varianza dada por el cliente o proveedor, no
significa que sean estadísticamente diferentes, la hipótesis es la manera en la que
se puede comprobar si esta diferencia es estadísticamente significativa, bajo el
supuesto de la distribución normal y para comprobar esta hipótesis se utiliza el
siguiente estadístico de prueba:
Donde n es el tamaño de la muestra. Si H 0: α2 = α02 y Ha: σ2 ≠σ02, suponiendo que
H0 es verdadera X02 sigue una distribución ji-cuadrada con n -1 grados de libertad.
Por ello, se rechaza Ho si X02 ˃ X2α.
Esta fórmula se utiliza en las siguientes pruebas:
Prueba sobre una media
Prueba H: 0 H: 1 Criterio de rechazo
1 σ≠σ 0
2
2 σ =σ
2
0
2
σ >σ
2
0
2
3 σ <σ
2
0
2
Ejemplo:
Un proveedor de material asegura que los costales en los que entrega el producto
pesan en promedio 50.1 kg, con una varianza de σ 2 = 0.5, sin embargo, al medir
nuestro proceso nos arroja nuestra varianza muestral S2 = 1.2, probar la hipótesis
de que H0 : σ2 = σ2 y H1 : σ2>σ2.
Solución:
H0 : σ 2 = σ 2
H1 : σ2>σ2.
Figura 5.1 Gutiérrez, H.(2012)
1. Se toman unas muestras: n = 15
2. Se calcula: = = 33.6
3. Se determina: X α,n-1 para α = 0.05 (dentro de la tabla Ji-cuadrada) = 23.68
2
4. Se realiza la comparación: X20 : X2α,n-1 = 33.6 ˃ 23.68, con lo cual no se tiene
suficiente evidencia estadística para aceptar Ho, lo cual demuestra que las
varianzas son significativamente diferentes. Es decir, la variabilidad de peso
de los costales efectivamente es mayor que la que reportó el proveedor.
5.2 Pruebas de hipótesis sobre dos varianzas
La comparación de varianzas sostiene un interés independiente de las medias,
puesto que éstas son determinantes en cualquier proceso o tratamiento al
referenciar qué tanta variabilidad existe en el proceso, pues mide la dispersión de
los datos, por esto, considera que, a menor varianza, implica potencialmente mejor
calidad.
Para Montgomery, D. (2012) el estadístico de prueba, sobre una varianza S 12,
obtenida de una muestra de tamaño n1, respecto a otra varianza S22, obtenida de
una muestra de tamaño n2 es:
Esta fórmula se utiliza en las siguientes pruebas:
Prueba sobre una media
Prueba H:
0 H:1 Criterio de rechazo
Ejemplo: probar la hipótesis de que H0: σ12 = σ22 y H1: σ12 > σ22 respecto a dos
poblaciones con distribución normal.
Solución:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10
2. Se calculan las varianzas muestrales: S1 = 8.4 y S2 = 7.2
3. Se calcula = =1.335
4. Se determina para = 0.05, el valor de F0.05,9,9
= 3.179
5. Se realiza la comparación , 1.335<3.179, por tanto,
se acepta la Ho, donde vemos que las varianzas son estadísticamente
iguales o sus diferencias no son significativas.
5.3 Prueba de hipótesis sobre dos poblaciones
El objetivo de este tema tiene dos partes:
1. Recapitular, en forma de diagramas de flujo, las pruebas de hipótesis
estudiadas en los temas anteriores.
2. Reflexionar sobre la dependencia e independencia de las variables, así
como de su correspondiente intervalo de confianza.
Haz clic en cada botón para revisar la información.
Parte 1. Diagramas de flujo de las pruebas de hipótesis:
Diagrama de flujo 5.1 Pruebas de hipótesis sobre las medias
Diagrama de flujo 5.2 Pruebas de hipótesis sobre las varianzas
Parte 2. Reflexionar sobre la dependencia e independencia
de las variables, así como de su correspondiente intervalo de confianza:
a. Definición: dos o más muestras son dependientes si se han obtenido de
entre los mismos individuos.
b. Diferencia de medias en dos muestras dependientes:
c. Diferencia de medias en dos muestras independientes
El intervalo de confianza, a nivel de confianza = 1 - , para µA - µB viene dado
por la ecuación:
Gutiérrez (2012) instruye que, en el método del intervalo de confianza, se rechaza
H0 si el valor del parámetro declarado en la hipótesis nula se encuentra fuera del
intervalo de confianza para el mismo parámetro. Cuando la hipótesis planteada es
de tipo bilateral, se utiliza directamente el intervalo al 100 ( 1 - )% de confianza.
Si la hipótesis es unilateral, se requiere el intervalo al 100 ( 1 – 2 )% para que el
área bajo la curva, fuera de cada extremo del intervalo, sea igual a . Por
ejemplo, en el caso de la hipótesis unilateral sobre la media del peso de costales
dada por la expresión: µ= 50.1 se debe construir el intervalo al 100(1 – (2 × 0.05))
% = 90% de confianza para aplicar este criterio con una significancia a = 0.05. El
intervalo al 90 % de confianza para la media m está dado por:
De las tablas de la distribución T de Student con n – 1 = 14 grados de libertad,
para a = 0.05, se obtiene el valor crítico t0.05, 14 = 1.76. Como t0 = –2.47 < –1.76
= –t0.05, 14, no se tiene suficiente evidencia estadística para aceptar la hipótesis
H0, como consecuencia podemos rechazar la información del vendedor de que los
bultos tienen un peso medio de 50.1 y, además, la evidencia señala que dicho peso
es menor que el declarado.
Cierre
Aquí se presentaron diversas pruebas de hipótesis para la toma de decisiones,
también con mayor certeza al seleccionarla para prueba que más convenga para el
caso en estudio.
Así pues, con estas pruebas se amplía el criterio necesario de pruebas que pueden
ser realizadas y que hay que tener a la mano cuando, de acuerdo al proceso en
estudio, se desee probar la variabilidad de alguna de sus variables. Es muy
importante comenzar el análisis del experimento mediante estas pruebas, donde
revisaremos el comportamiento de los factores de estudio y podremos tener
respuesta en la comparación, ya sea de un indicador buscado o bien simplemente
entre dos grupos de muestras o poblaciones. De esta forma podremos continuar
con el experimento buscando cuál de las variables es la que afecta a la variable de
salida.
Referencias bibliográficas
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías.México: Alfaomega.
Juan, A. (s. f.). Contraste de hipótesis de dos poblaciones. Recuperado de
http://www.uoc.edu/in3/emath/docs/CH_2Pob.pdf
Checkpoint
Asegúrate de:
Comprender cómo distinguir entre utilizar una prueba sobre una varianza o
sobre dos varianzas.
Saber cómo distinguir entre utilizar una prueba de dos colas o de una cola.
Interpretar los resultados y búsquedas de las pruebas de varianza, así como
del intervalo de confianza.
Explicación del tema 6
Tema 6. Diseño completamente aleatorio 1
Introducción
En las primeras fases del diseño de experimentos, una de las trascendentes es el
elegir el adecuado para la evaluación y análisis del problema a resolver, por tal
motivo, es preciso conocer cómo es que se clasifican los diseños de acuerdo con su
objetivo y su alcance.
Según Gutiérrez y De la Vara (2013), los cinco aspectos que más influyen en la
selección de un diseño experimental son los siguientes:
1. El objetivo del experimento.
2. El número de factores a estudiar.
3. El número de niveles que se prueban en cada factor.
4. Los efectos que interesa investigar (relación factores-respuesta).
5. El costo del experimento, tiempo y precisión deseada.
Mencionan también que el primer punto es lo que guía a la clasificación del diseño
de experimentos, que en general son los que enseguida se enumeran:
1. Diseños para comparar dos o más tratamientos.
2. Diseños para estudiar el efecto de varios factores sobre la(s) respuesta(s).
3. Diseños para determinar el punto óptimo de operación del proceso.
4. Diseños para la optimización de una mezcla.
5. Diseños para hacer el producto o proceso insensible a factores no
controlables.
Hay que considerar que en este tipo de diseño se asume que los datos son
obtenidos de una población con distribución normal.
6.1 Características de diseño y notación
Características
Como podemos observar en la parte de planeación y diseño es la fase en la cual se
debe identificar y seleccionar el diseño experimental eficiente según las variables y
lo anteriormente analizado. Recordemos que en general varios autores hablan de
las mismas siete etapas, las cuales podemos resumir en las siguientes:
Haz clic en cada una para revisar la información
Sección 1: Planeación y diseño
a. Definir el problema o el objetivo.
b. Hacer un esquema del estudio donde se señale el problema planteado.
c. Determinar los factores que deben investigarse, de acuerdo a su posible
impacto en el problema.
d. Elegir las variables de respuesta que serán medidas en cada punto del
diseño, y verificar que se miden de manera confiable.
e. Seleccionar el diseño experimental adecuado a los factores que se tienen y
al objetivo del experimento.
f. Planear y organizar el trabajo experimental.
g. Realizar el experimento.
Sección 2: Análisis e interpretación
h. Hacer un análisis detallado de los resultados experimentales.
i. Interpretar resultados.
j. Hacer corridas confirmatorias del proceso en el mejor tratamiento.
Sección 3: Conclusiones finales
k. Cerrar y concluir el proyecto adecuadamente.
Notación
Al considerar varios tratamientos, la representación de las variables, los factores,
los estadísticos, de manera abreviada y no con toda la extensión de la palabra,
tiene una representación especial.
Existe un tipo de notación consistente en colocar en el subíndice un punto. En este
tipo de notación, el punto significa que se está realizando la suma sobre la
variable mostrada en el mismo subíndice.
Algunas de estas representaciones son las siguientes:
i es el número del tratamiento que se esté realizando de entre k
tratamientos y puede tener el valor: i = 1, 2, …, k.
j es el número de observación que se está tomando de entre las
niobservaciones a llevar a cabo dentro de cada uno de los k tratamientos;
esto es, estamos dentro del i-ésimo tratamiento, y puede tener el valor: j =
1, 2, …, ni.
Yij es la j-ésima observación en el tratamiento i.
Yi• es la suma de las observaciones del tratamiento i, y se calcula con la
fórmula siguiente:
es la media de las observaciones del i-ésimo tratamiento, y se calcula
con la fórmula siguiente:
Y•• es la suma total de las N = n1 + n2 +… + nk mediciones, y se calcula con
la fórmula siguiente:
es la media global o promedio de todas las observaciones, y se calcula
con la fórmula siguiente:
Ejemplo
Para realizar un experimento, se toman 3 tratamientos. Para cada tratamiento
existen las observaciones mostradas en la siguiente tabla:
Tratamiento Observaciones
7, 1, 3, 5, 8, 2, 3, 5, 6,
1 10
1
4, 4, 3, 2, 1, 5, 7, 1, 1,
2 12
8, 2, 5
3 8 1, 6, 8, 4, 4, 2, 3, 1
Tabla 1. Tratamientos y observaciones
1. ¿Qué valor tiene k?
2. Si consideramos el tratamiento i = 3, ¿qué valor tiene n?
3. ¿Qué valor tiene Y36?
4. Para las condiciones de la pregunta 2, ¿qué valor tiene Yi•?
Solución:
1. Dado que existen 3 tratamientos, k = 3.
2. Dado que el tratamiento i = 3, tiene o observaciones, n = 8
3. Dado que en el tratamiento k = 3, el 6° elemento es un 2, Y36 = 2
4. Dado que la suma de todos los elementos de la muestra del tratamiento k =
3: 1+ 6+ 8+ 4+ 4+ 2+ 3+ 1 = 29, resulta que Y3• = 29
6.2 Modelo de un factor de efectos fijos balanceados
A lo largo del módulo 1 se aplicaron métodos estadísticos para el diseño de
experimentos, basados en la comparación de dos poblaciones diferentes, tanto en
su comparación de medias (con varianza conocida o desconocida), como en su
comparación de varianzas (bajo el supuesto de normalidad en la distribución de las
poblaciones puestas a prueba).
También podemos realizar nuestras comparaciones, si consideramos no ya dos
factores a comparar, sino un solo factor pero con dos o más niveles.
Así, cuando las observaciones , que siguen el modelo
(dependen de la media poblacional de los tratamientos, y del error, debido
a la medición), se observan después de utilizar todos los tratamientos posibles,
decimos que se trata de un modelo de efectos fijos.
Este modelo se utiliza cuando son pocos los tratamientos, de tal forma que se
puedan utilizar todos ellos. Al utilizar todos los tratamientos, los parámetros de
nuestra ecuación se ajustarán mejor a la realidad.
Dentro del análisis de datos, para entender el comportamiento de las diferentes
variables es relevante conocer la variación total con respecto a la media. Para
iniciar este estudio es importante comprender los tipos de variación que se
buscan:
La variación total (SST - "total sum of squares") se puede dividir en dos partes:
SSA y SSW (suma de cuadrados entre los grupos y suma de cuadrados
dentro de los grupos, respectivamente).
El SSA mide la variación entre los grupos, mientras que el SSW mide
la variación dentro de los grupos.
SSTro conocida también como SSA (among) es la varianza del
error entre tratamientos, y se obtiene con la expresión:
Figura 1. Diagrama de la variación entre grupos.
Levine, M., Krehbiel, C., y Berenson, L. (2006). Business Stadistics, A First course (4th ed.). Estados
Unidos: Pearson Prentice Hall.
SSE es la varianza del error dentro de los tratamientos, y se obtiene con la
expresión:
Figura 2. Diagrama de la variación dentro de grupos.
Levine, M., Krehbiel, C., y Berenson, L. (2006). Business Stadistics, A First course (4th ed.). Estados
Unidos: Pearson Prentice Hall.
SST = SSTr + SSE
MSTr = SSTr / (a - 1) donde a - 1 son los grados de libertad.
MSE = SSE / (N - a) donde N - a son los grados de libertad.
Ejemplo
Una empresa productora de bolsas de plástico está interesada en probar si una
nueva cantidad de carbonato de calcio (CaCO3) —para una nueva aplicación—
hace que aumente la dureza (Mohs) de las bolsas. En pruebas anteriores se ha
observado que la modificación en la cantidad de carbonato hace variar la dureza, y
se sospecha que a mayor cantidad de carbonato, la dureza aumenta. Por la
experiencia se sabe que para el tipo de bolsa realizada hasta el momento (PEAN-
APM) una cantidad del 8% al 15% es suficiente, pero para el nuevo tipo de bolsa
(PEBDL) aumentará la dureza de 14 al 20%.
Solución:
Se decide realizar un experimento con:
1. Cuatro niveles a = 4.
2. Tres pruebas n = 3, para cada uno de los cuatro niveles, a*n = 12.
3. Esto nos da que hay que realizar 12 corridas, a*n = 12, como se muestra en
las columnas 2, 3 y 4 de la Tabla 2.
4. En orden aleatorio, como se muestra en las columnas 5, 6 y 7 de la misma
tabla. Así, la corrida experimental 12 será la primera en ser realizada,
después será la corrida 6, etc., y al final la corrida 11.
La generación de números aleatorios se realizó utilizando Minitab: Calc >
Datos aleatorios > Muestreo por columnas.
Orden de
% de Corrida
ejecución
CaCO3 Experimental
(aleatorio)
14 1 2 3 3 5 7
16 4 5 6 11 8 2
18 7 8 9 4 9 6
20 10 11 12 10 12 1
Tabla 2. Corridas experimentales
Prueba
% de
CaCO3
1 2 3 Total Promedio
14 9 10 4 23 7.667
16 8 3 12 23 7.667
18 5 16 3 24 8
20 9 4 11 24 8
Suma: 94 7.834
Tabla 3. Resultados
6.3 Estimación puntual de los efectos y de la variable de respuesta
Una población se define por sus parámetros estadísticos:
1. La media, cuyo símbolo es la letra griega .
2. La desviación estándar, cuyo símbolo es la letra griega s, o en su caso por la
varianza, cuyo símbolo es la letra griega .
3. La proporción de artículos defectuosos, cuyo símbolo es la letra p.
Sin embargo, es frecuente que, ante un proceso industrial, estos parámetros sean
desconocidos; lo que dificulta la toma de decisiones.
La alternativa es realizar una estimación de estos estadísticos, para lo cual se
cuenta con dos procedimientos.
Haz clic en cada una para revisar la información
1. Estimación puntual
1. Estimación puntual
Se estiman los parámetros por medio de una muestra de tamaño “n”, siguiendo los
siguientes procedimientos:
La media se estima por medio de la media de la muestra , que se
representa con el símbolo .
La varianza se estima por medio de la varianza de la muestra S2, que se
representa con el símbolo .
La proporción p se estima por medio de la proporción de elementos
defectuosos x, tomados de una muestra de tamaño n, en la que .
Ejemplo: se cuenta con una máquina de empaquetado de café en bolsas de 1 kg,
pero no se conocen los parámetros estadísticos, por lo que se desea realizar un
experimento para conocerlos.
Solución:
Para conocer los datos estadísticos de la máquina de empaquetado automático de
café, se siguió el siguiente procedimiento:
a. Se registró el peso de 100 paquetes de café: n = 100.
b. Se calculó la media de la muestra: 1.00382 kg. Esta media se puede
utilizar como una estimación puntual de la media del proceso.
c. Se calculó la varianza de la muestra: S2 = 0.000545 kg, la cual se puede
utilizar como una estimación puntual de la varianza del proceso.
d. Se registró el número de bolsas defectuosas x = 2. Se hace una estimación
puntual de la proporción de defectuosos del proceso = x/n = 2/100 =
0.02.
2. Estimación por intervalo
×
2. Estimación por intervalo
Para verificar los datos estadísticos de la máquina de empaquetado automático de
café se repitió el procedimiento, registrando el peso de 100 paquetes de café: n =
100, obteniendo los siguientes resultados:
Se calculó la media de la muestra: =1.00243 kg., así como la varianza de la
misma: S2 =0.000504 kg.
Como se puede observar, al repetir el procedimiento anterior para estimar
puntualmente los estadísticos, es probable que no se obtengan los mismos
resultados. El propósito es generar un parámetro desconocido , de tal forma que
este se encuentre dentro de un intervalo de confianza 100( ) %, y determinar
dos valores (L y U), de tal forma que la probabilidad de que se encuentre entre
estos dos valores sea igual a , que puede ser expresado por medio de la
ecuación:
Cierre
Aunque se tengan los escalones de la escalera de la experimentación
perfectamente ensamblados, no todo experimento se resuelve en forma
automática. Existe el riesgo de querer subir de dos en dos y saltar escalones
intermedios.
Diversos autores nos han presentado una ruta a seguir para proceder al análisis y
diseño de experimentos. Sin embargo, si no se tiene bien planteado el problema a
analizar, además de las variables involucradas y los factores de mayor impacto con
todos sus niveles, va a ser muy deficiente el planteamiento del diseño
experimental y, por lo tanto, su solución. Al dar mal el primer paso va a ser muy
difícil corregir una vez avanzado el proceso.
Además, hay que tener a la mano los conceptos estadísticos para realizar un
correcto análisis y una acertada interpretación.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Levine, M., Krehbiel, C., y Berenson, L. (2006). Business Stadistics, A First
course (4th ed.). Estados Unidos: Pearson Prentice Hall.
Checkpoint
Asegúrate de comprender:
Aspectos para definer el diseño de experimentos.
Los conceptos: tratamiento, observación, factor de efectos fijos
balanceados, estimación puntual y estimación por intervalo.
Entender diferencia de variación entre y dentro del grupo.
Tema 7. Diseño completamente aleatorio 2
Introducción
En el tema 6 vimos las notaciones, fórmulas para la representación y orden de los
datos experimentales, para entender y plantear experimentos con un solo factor
en el diseño completamente al azar (DCA).
El diseño completamente al azar se cataloga como el más sencillo de todos los
diseños, ya que solo tomaremos en cuenta un factor (variable de interés de la cual
se desea conocer sus efectos) y tiene como objetivo comparar dos o más
tratamientos (cada combinación de los niveles del factor de estudio).
El DCA centra el estudio del experimento en separar la variación total observada,
para lo cual considera solo dos fuentes de variación: debida a los tratamientos y
debida al error. Se le llama completamente al azar porque las corridas
experimentales se realizan en orden aleatorio completo, es decir, al azar, como
cuando se decide escuchar un listado de tus canciones favoritas de forma
aleatoria, se puede escuchar en diferente orden cada vez que las escuchas.
Por lo general, el interés del experimentador está centrado en comparar los
tratamientos en cuanto a sus medias poblacionales y a sus varianzas.
Estadísticamente, la hipótesis a probar cuando se comparan varios tratamientos
es:
H0 : µ1 = µ2 = … = µk = µ
HA : µi ≠ µj para algún i ≠ j
Con la cual se quiere decidir si los tratamientos son iguales con la comparación de
sus medias, frente a la alternativa de que al menos dos de ellos son diferentes. La
estrategia estadística dicta que debemos obtener una muestra representativa de
mediciones en cada uno de los tratamientos, y construir un estadístico de prueba
para decidir el resultado de dicha comparación. Como lo vimos en los temas
anteriores, utilizaríamos el probabilístico T de Student aplicados a todos los
posibles pares de medias; sin embargo, aumentaría la probabilidad del error tipo I
(rechazar H0 siendo verdadera).
Gutiérrez y De la Vara (2012) mencionan que existen métodos capaces de probar
no solo la hipótesis de igualdad de las medias de los tratamientos, sino la variación
que existe entre y dentro de los datos con respecto a la media global, como se
establece en el tema 6 los diagramas de variación entre y dentro de grupos en las
figuras 1 y 2.
Los métodos de análisis de varianza ANOVA, Diagrama de cajas y Gráfico de
medias o también llamado Diagrama de intervalos, nos permiten identificar y
concluir si existe igualdad o desigualdad entre las medias de los tratamientos y
determinar si estas diferencias son significativas, lo cual es relevante para elegir
qué tratamiento es idóneo para el efecto buscado.
Explicación
7.1 Análisis de varianza (One Way ANOVA)
En el análisis de varianza el investigador controla una o más de las variables
independientes, a las cuales también se les conoce como "factores" o “grupos”, y
cada uno de estos factores contiene dos o más niveles o categorías. Se observan
los efectos en la variable dependiente mediante un diseño experimental.
Las hipótesis del investigador en ANOVA son las siguientes:
En el caso de que la hipótesis nula sea cierta, el investigador estaría observando
algo como esto:
Figura 1. Igualdad de medias.
En el caso de que la hipótesis alternativa sea cierta, el investigador estaría
observando algo como esto:
Figura 2. Desigualdad de medias.
Además de presentar los resultados del análisis en una tabla o por medio de una
gráfica, es posible representarlos con un modelo, una ecuación que relacione los
resultados. Por ejemplo, se toma una muestra y, y se presenta en la siguiente
tabla:
x 1 2 3 4 5
y 1 2 4 8 16
Se analizan los datos y se determina que y es una función de x dada por la
ecuación y=0.5 (2x), la cual puede ser representada con la siguiente gráfica:
Figura 3. Función de tratamientos relación X-Y.
Si queremos relacionar la ij_ésima observación yij con la media obtenida en el
tratamiento i y con la muestra j, la forma más sencilla de realizar esta relación está
dada por medio de la siguiente ecuación:
Ecuación lineal 1
En la que es el error aleatorio de la medición.
Esta ecuación es un modelo de medias.
Si consideramos que la media de los errores es cero, entonces el valor esperado de
la ij_ésima observación será: .
Una forma alternativa es relacionar la observación con , el efecto del i_ésimo
tratamiento, en lugar del error aleatorio.
Tomando esto en consideración, otra forma lineal y, por lo tanto, la forma más
sencilla de realizar esta relación está dada con la siguiente ecuación:
Ecuación lineal 2
Esta ecuación es entonces un modelo de efectos.
Desde luego, esta ecuación supone que:
Dado que en estas ecuaciones lineales, 1 y 2, la variable dependiente yij depende
de una sola variable independiente (desde el punto de vista de la definición de una
función), ya sea el error aleatorio, para la primera ecuación, o del efecto
del i_ésimo tratamiento, para la segunda ecuación, son llamadas como análisis de
varianza de un solo factor (tratamiento) o de una sola vía.
En estos modelos observamos dos parámetros:
1. La media que viene a ser el valor esperado de la observación.
2. El error aleatorio de la medición que es la diferencia entre
medición y el valor esperado y los parámetros asociados a los
tratamientos .
Como se va a ver en los siguientes temas, el análisis de varianza (ANOVA) es el
método más utilizado en el análisis experimental. Está basado en el estadístico F,
que viene a ser la relación entre dos variables aleatorias ji cuadradas divididas
entre sus correspondientes grados de libertad. A su vez, el estadístico ji cuadrado
depende de un solo parámetro: sus grados de libertad. Por lo que se concluye que
ANOVA simplifica mucho las decisiones.
Domínguez y Castaño (2016) nos exponen un ejemplo muy claro de un
experimento de un factor y varios tratamientos a partir de dos o más niveles:
Una compañía necesita aumentar la resistencia de un papel para envoltura de
dulces, por lo cual cambiará la fórmula de la sustancia con la que se fabrica, pues
se sabe que el uso de cierto sólido repercute en la resistencia, por lo que se decide
experimentar cambiando la concentración de este sólido a la sustancia de
fabricación del papel de envoltura, y se probará cuál concentración es la que
concede mejor resistencia.
La resistencia del papel se mide en tensión del papel y se mide en psi. Se dirige el
experimento hasta agregar alternativamente cuatro diferentes concentraciones del
sólido, lo cual permite controlar el experimento.
Así identificamos la estructura del experimento:
Objetivo: evaluar el efecto de las concentraciones del sólido sobre la
resistencia del papel de envoltura.
Factor: la fórmula de la sustancia.
Respuesta: tensión del papel.Niveles: cuatro niveles de concentración del
sólido.
El objetivo del análisis de ANOVA es comparar dos o más tratamientos,
considerando tan solo dos fuentes de variabilidad: los tratamientos y el error
aleatorio.
Cuando hablamos de la variabilidad de los tratamientos hablamos de la
variabilidad que existe entre los tratamientos, y al hablar del error aleatorio es la
variabilidad dentro de cada uno de los tratamientos.
Se requieren los grados de libertad para la obtención de la suma de cuadrados,
donde:
“c” (algunos autores lo toman como k) es el número de factores.
“n” es el número de observaciones.
Nota para obtener los grados de libertad del error o dentro de los grupos se
resta el número de observaciones con los grados de libertad obtenidos de la
variación de los tratamientos.
Dentro del análisis de ANOVA se obtiene un cuadro de valores en los cuales se
calcula el total de la suma de variaciones:
El resultado esperado es el valor de F para entonces compararlo con el límite de
rechazo –aceptación. La estadística F del resultado de la tabla ANOVA es la que
determina la validez de la hipótesis nula, que no es más que la razón entre el
estimado de la variación entre los grupos y el estimado de la variación dentro de
los grupos.
Si F es mayor que el valor obtenido de la distribución F, entonces decimos que
existe poca o ninguna evidencia a favor de la hipótesis nula.
En el Minitab es un análisis que se realiza de forma automática, simplemente
teniendo los datos y seleccionar:
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
Dentro de los resultados sería el cuadro ANOVA:
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
Del cual lo importante será tomar el P-Value, el cual si es menor que el nivel de
significancia 1-a (0.05), tú puedes rechazar la hipótesis nula.
Dentro de este análisis también es importante el diagrama de caja, de intervalos y
datos individuales para su análisis e interpretación.
7.2 Diagrama de cajas
Un diagrama de caja es una forma gráfica de representar la mediana, los
cuarteles y los extremos de los datos. La distancia entre la media y los cuarteles se
representan por un rectángulo o caja, y la distancia entre los cuarteles y los
valores extremos se representan por líneas rectas que se conocen como bigotes
por la apariencia que da en los diagramas.
Ejemplo:
Realiza el diagrama de caja, con los datos de los tres tratamientos del ejemplo de
la sección 6.1 de este curso, registrados en la Tabla 1 (Tratamientos y
observaciones).
Solución:
Sobre una tabla:
1. Registramos los datos.
2. Ordenamos por rango (de menor a mayor).
3. Observamos y registramos el mínimo, el máximo y la mediana.
4. Para el tratamiento 1, observamos y calculamos Q1=2-0.25=1.75 y
Q3=6+0.25=6.25.
5. Para el tratamiento 2, observamos y calculamos Q1=1.5-0.25=1.25 y Q3=5.
6. Para el tratamiento 3, observamos y calculamos Q1 = 1.5-0.25=1.25 y
Q3=5.
7. Copiamos los datos a Minitab, generando tres columnas.
8. Comprobamos los resultados: Estadísticas > Estadísticas básicas > Mostrar
estadísticas descriptivas.
9. Generamos el diagrama de caja: Gráfica > Gráfica de caja.
Ordenados Q2:
Tratamiento Datos Mínimo Q1 Q3 Máximo
por rango Mediana
11233 |
1 135823561 1 1.75 4 6.25 8
55678 =
111 | 223 |
2 443215711825 1 1.25 3.5 5 8
445 | 578
11 | 23 | 44
3 16844231 1 1.25 3.5 5 8
| 68
Tabla 1. Pasos para realizar el diagrama de caja
10. Estadísticas descriptivas generadas con Minitab:
11. Diagrama de caja:
Gráfica de caja
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
7.3 Gráficas de medias
Además de presentar los datos métricos en una tabla o por medio de una fórmula
lineal, existen otras opciones que pueden ser muy significativas.
La gráfica de intervalos: se utiliza para graficar medias e intervalos de
confianza o barras de error para una o más variables. Una gráfica de intervalo
ilustra una medida de la tendencia central y la variabilidad de los datos.
Nota: por opción predeterminada, Minitab muestra intervalos de confianza de 95%.
Para cambiar el tipo de presentación o la configuración de una gráfica específica,
utilice Editor > Editar barra de intervalo > Opciones.
Para cambiar el tipo de presentación o la configuración de todas las gráficas de
intervalo futuras, utilice Herramientas > Opciones > Gráficas individuales >
Gráficas de intervalo.
También se pueden generar con las instrucciones: Estadísticas > ANOVA >
Gráficas de intervalo.
Gráfica > Gráfica de intervalos.
Gráfica de intervalos
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
La gráfica de valores individuales: se utiliza para evaluar y comparar las
distribuciones de muestra, al graficar valores individuales para cada variable o
grupo en una columna vertical, con lo cual resulta más fácil detectar valores
atípicos y ver la distribución (ayuda de Minitab).
Nota: si varios puntos tienen el mismo valor, por opción predeterminada Minitab
los desplaza simétricamente desde el centro, de modo que cada punto idéntico se
pueda ver.
Gráfica > Gráfica de valores individuales.
Gráfica de valores individuales
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
Cierre:
La utilización de tablas, ecuaciones o diagramas para representar nuestros datos
es importante, pero hay que recordar que la interpretación de los datos
involucrados es el objetivo principal del investigador. No hay que perderse en el
proceso, sino ir al fondo del contenido de la información.
Recuerda, no es que nos interese conocer unos datos perfectamente
organizados yij, una ecuación que nos represente funcionalmente las variables
dependientes en función de las independientes y=f(x), o una gráfica que
visualmente nos impresione la pupila, lo que nos interesa es conocer y comprender
la informacióncontenida en esas representaciones.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Levine, M., Krehbiel, C., y Berenson, L. (2006). Business Stadistics, A First
course (4th ed.). Estados Unidos: Pearson Prentice Hall.
Checkpoint
Asegúrate de comprender:
Las representaciones por medio de ecuaciones lineales y los modelos
ANOVA, medias y efectos.
Los conceptos de error aleatorio de la medición, valor esperado, diagrama
de cajas, datos métricos, datos categóricos y datos ordenados por rango, las
gráficas de medias, las gráficas de intervalos y las gráficas de valores
individuales.
Explicación del tema 8
Tema 8. Pruebas de rangos múltiples
Introducción
En los temas 6 y 7 referimos a los diseños completamente al azar (DCA): ANOVA y
los diagramas de cajas y de intervalos, cuyo objetivo es comprobar si hay o no
diferencia significativa entre las medias de diferentes tratamientos con niveles,
tipos o categorías diferentes, a experimentar, mediante el análisis de varianza,
luego mediante el diagrama de cajas (boxplot) se puede representar de forma
descriptiva visual la comparación de los tratamientos, donde se observa la
variabilidad, mientras en los intervalos se muestra la tendencia central y
variabilidad de distribuciones de muestra.
Recuerda que lo que analizamos es si existe un comportamiento o efecto distinto a
partir de diferente nivel de un factor de entrada. Es importante resaltar que el
ANOVA supone que la variable de respuesta se distribuye de forma normal y con
varianza constante, así como que las mediciones son independientes entre sí.
El resultado del ANOVA si bien es informativo, no basta, pues es necesario obtener
más detalle con la finalidad de descubrir cuál(es) tratamiento(s) es (son) mejor(es)
o peor(es).
Si en el análisis de varianza ANOVA no se rechaza la Ho, se concluirá que las
medias de los tratamientos no son significativamente diferentes y el objeto del
análisis está cubierto, es decir, el cambio de nivel del factor no es un factor
significativo para la respuesta o efecto de salida. Sin embargo, cuando se rechaza
la Ho mediante el ANOVA, por consiguiente se acepta la Ha, donde se concluye que
no hay igualdad entre las medias de los tratamientos, la pregunta es ¿cuáles
tratamientos resultaron diferentes o provocaron esa diferencia?
Los métodos de comparaciones múltiples pueden responder a esta interrogante,
probando la igualdad de todos los posibles pares de medias o rangos múltiples, de
las cuales estudiaremos en este tema.
Explicación
Recordemos el experimento planteado en el tema 7 con respecto a la resistencia
del papel:
Una compañía necesita aumentar la resistencia de un papel para envoltura de
dulces, para lo cual cambiará la fórmula de la sustancia con la que se fabrica, ya
que se sabe que el uso de cierto sólido repercute en la resistencia, por lo cual se
decide experimentar cambiando la concentración de este sólido a la sustancia de
fabricación del papel de envoltura y se probará cuál concentración es la que
concede mejor resistencia.
Una vez que se mide la resistencia de tres papeles realizados con las cuatro
diferentes concentraciones de sólido en la sustancia fabricante, se obtienen los
siguientes resultados:
Para los ejemplos de los subtemas 8.1, 8.2 y 8.3, utilizaremos las siguientes tablas:
Grados
Suma de Cuadrados Estadístico
de
cuadrados medios F
libertad
0
Tratamiento SSTr =62 3 20.6667 1.7841727
SSE =
Error 8 11.5833
92.6667
SST
Total 11
=154.667
Tabla 2. Tabla ANOVA de resultados.
j= n=
Niveles
(diferente
concentración 1 2 3 Promedio Suma S2
de sustancia
sólida)
i= 1 A 14 17 12 14.3 43 4.22
2 B 10 10 16 12 36 8
3 C 10 19 10 13 39 18
C(k)
4 D 17 18 19 18 54 .667
=
30.89
Tabla 1. Datos de medición de la tensión del papel medido en psi.
Primero es importante calcular la media de
medias:
En la que:
a. SSTr es la varianza del error entre tratamientos, que es la variación de los
tratamientos y se obtiene con la fórmula:
El cálculo se realiza de suma de cuadrado de los tratamientos= 186 para
calcular el cuadrado medio se divide entre c-1
b. SSE es la varianza del error dentro de los tratamientos, y se obtiene con la
fórmula:
Ejemplo para la concentración de sólido A, se calcula la desviación dentro
del grupo:
Luego, cada resultado de suma de varianza del error se multiplica por la
cantidad de observaciones: 3(4.22)+3(8)+3(18)+3(.667) = 92.667
c. SST = SSTr + SSE es la varianza del error total, y se obtiene con la
fórmula:
SST = SSTr + SSE: 154.667=62+92.667
d. Para calcular el estadístico F sería:
Para los ejemplos de los subtemas 8.1, 8.2 y 8.3, utilizaremos las siguientes tablas:
Grados
Suma de Cuadrados Estadístico
de
cuadrados medios F0
libertad
Tratamiento SSTr =62 3 20.667 1.7841727
SSE =
Error 8 11.5833
92.6667
SST
Total 11
=154.667
Tabla 2. Tabla ANOVA de resultados.
Si revisamos el valor Fcalculada = Fc = 1.7841 vs. valor de la tabla F
(3,8,0.05) obtenemos que:
.78 > 8.85, por tanto, se rechaza la Ho, o bien si utilizas Minitab, se puede calcular
a partir de conocer que el Pvalue: 0.000 es menor que el valor de α 0.05 se
rechaza Ho.
La interpretación de rechazar Ho denota que al menos un tratamiento tiene una
media con diferencia significativa.
8.1 Pruebas de comparaciones múltiples (LSD).
La prueba de comparaciones múltiples —también conocida como método
Fisher de diferencia mínima significativa (Least Significant Difference) — consiste
en probar que las medias de dos poblaciones con “a”tratamientos son
significativamente diferentes. De tal forma que la hipótesis nula se plantea con la
expresión siguiente:
Realizamos una prueba de una cola, de tal forma que la hipótesis alterna se
plantea con la expresión siguiente:
El procedimiento para realizar la prueba es el siguiente:
1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos
fijos balanceados (ver tema 6.2).
2. Definir el nivel de significancia para realizar la prueba.
3. Obtener a partir de una tabla. Por ejemplo la Tabla A.4 de Walpole
(2012).
4. Calcular MSE.
5. Calcular el valor del estadístico LSD:
Si las muestras son del mismo tamaño, n = n 1 = n2, es decir, el diseño está
balanceado (como en nuestro ejemplo para todas las concentraciones A,B,C
y D se tomaron tres muestras), calculamos el estadístico LSD con la
siguiente fórmula:
Si el diseño no está balanceado, es decir, para muestras de tamaño diferente n 1 y
n2, calculamos el estadístico LSD con la siguiente fórmula:
6. A continuación realizamos una tabla con el valor absoluto de las diferencias
entre tratamientos:
7. Rechazamos la hipótesis nula si:
Ejemplo
Probar que las medias de dos poblaciones con 4 tratamientos son
significativamente diferentes si ya disponemos de las medias de los 4
tratamientos realizados en un experimento anterior: ver Tabla 2 (Resultados del
ANOVA).
Solución:
1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n =
12:
2. Definimos que , por lo tanto .
3. De la Tabla A.4 de Walpole (2012) obtenemos que .
4. MSE = 11.5833.
5. Calcular el valor del estadístico LSD:
6. Tabla con el valor absoluto de las diferencias entre tratamientos (sin
repetición):
µB- | 1 < Se
µC 12 9.526 acepta
–
13
|
|
12
µB- < Se
– 2
µA 9.526 acepta
14
|
|
12
µB- < Se
– 2
µC 9.526 acepta
18
|
|
13
µC- < Se
– 1
µA 9.526 acepta
14
|
|
13
µC- < Se
– 5
µD 9.526 acepta
18
|
|
14
µA- < Se
– 4
µD 9.526 acepta
18
|
Tabla 3. Tabla de Resultados
7. Rechazamos la hipótesis nula y, por lo tanto, aceptamos la hipótesis alterna
sí:
En este caso no tenemos suficiente evidencia estadística para rechazar Ho. Quiere
decir que en el ejemplo expuesto el grado de diferencia no es significativo.
8.2 Prueba de Tukey
La prueba de Tukey consiste en probar que las medias de dos poblaciones con
“a” tratamientos son significativamente diferentes. La prueba de Tukey permite
comparar dos a dos todos los tratamientos, está diseñada para garantizar que
todas las comparaciones tengan en global una confianza del 100 (1- α) %.
De tal forma que la hipótesis nula se plantea con la expresión siguiente:
Realizamos una prueba de dos colas, de tal forma que la hipótesis alterna se
plantea con la expresión siguiente:
El procedimiento para realizar la prueba es el siguiente:
1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos
fijos balanceados (ver tema 6.2).
2. Definir el nivel de significancia para realizar la prueba.
3. Obtener a partir de una tabla. Por ejemplo, Domínguez y Castaño
(2016). (Ver los rangos estandarizados, Tabla F en la sección de tablas) en
la que f son los grados de libertad asociados con MSE.
4. Calcular MSE.
5. Calcular el valor del estadístico con la siguiente fórmula:
6. A continuación realizamos una tabla con el valor absoluto de las diferencias
entre tratamientos:
7. Rechazamos la hipótesis nula y, por lo tanto, aceptamos la hipótesis alterna
sí:
Ejemplo
Probar que las medias de dos poblaciones con 4 tratamientos son
significativamente diferentes si ya disponemos de las medias de los 4
tratamientos realizados en un experimento anterior; ver Tabla 2 (resultados del
ANOVA).
Solución:
1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n =
12: Tabla 2. (cálculos previos).
2. Definimos que
3. De la Tabla F obtenemos que .
4. MSE = 11.5833
5. .
6. Tabla con el valor absoluto de las diferencias entre tratamientos:
|
12
µB- < Se
– 1
µC 8.91 acepta
13
|
|
12
µB- < Se
– 2
µA 8.91 acepta
14
|
|
12
µB- < Se
– 2
µC 8.91 acepta
18
|
|
13
µC- < Se
– 1
µA 8.91 acepta
14
|
µC- | 5 < Se
µD 13
–
18 8.91 acepta
|
|
14
µA- < Se
– 4
µD 8.91 acepta
18
|
Tabla 4. Tabla de Resultados
7. Rechazamos la hipótesis nula y, por lo tanto, aceptamos la hipótesis alterna
sí:
; ver resultados en la Tabla 1. Tabla de Resultados.
8. En el ejercicio se acepta la hipótesis nula, ya que ninguna comparación nos
da como resultado que la diferencia sea mayor al indicador de 8.91. Esto
quiere decir que la diferencia no es significativa.
9. En el caso que alguna diferencia hubiera sido > 8.91, este tratamiento sería
el que tiene una diferencia significativa a los demás tratamientos. En el caso
del ejercicio se traduciría a que la concentración de tal sólido hace que la
resistencia fuese mejor. En el caso real de nuestro análisis nos demuestra
que la concentración del sólido no tiene relevancia para la resistencia del
papel.
NOTA: se observa que los resultados coinciden con la prueba LSD.
En Minitab, al correr la prueba de tukey visualmente se puede verificar las
comparaciones entre medias, si algún intervalo de comparación tiene un punto de
media en el cero esto significaría que tiene una diferencia significativa, de lo
contrario no se encuentra diferencia significativa.
Figura1. Prueba de Tukey en Minitab.
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
8.3 Prueba de rangos de Duncan
La prueba de rangos de Duncan consiste en probar que las medias de dos
poblaciones con “a” tratamientos son significativamente diferentes a través de los
rangos mínimos significativos (LSR, Least Significant Ranges).
El procedimiento para realizar la prueba es el siguiente:
1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos
fijos balanceados (ver tema 6.2).
2. Se ordenan por rango (de menor a mayor).
3. Se calcula MSE.
4. Calcular el error estándar con la siguiente fórmula:
5. Definir el nivel de significancia para realizar la prueba.
6. Obtener , para p = 2,3,…,a partir de una tabla. Por ejemplo, la
Tabla VII de Montgomery (2012).
7. Calcular los n - 1 LSR con la siguiente fórmula:
8. A continuación realizamos una tabla con las diferencias entre las medias de
los tratamientos (mayor menos menor):
e incluimos en cada línea la comparación con
los Rp.
9. Rechazamos la hipótesis nula y, por lo tanto, aceptamos la hipótesis alterna
si existen diferencias significativas:
Ejemplo
Probar que las medias de dos poblaciones con 4 tratamientos son
significativamente diferentes si ya disponemos de las medias de los 4
tratamientos realizados en un experimento anterior; ver Tabla 1 (resultados del
ANOVA).
Solución:
1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n =
12; ver la Tabla 1. (Cálculos previos).
2. Se ordenan por rango (de menor a mayor); ver la Tabla 5 (cálculos).
Paso 2: Paso 6: Paso 7: LSRs Paso 8: Diferencias y comparaciones
R = 4 vs.3: 18- 3 vs.2: 2 vs.1:
R (2,8) =
2
3.26*1.965 = 14.34= 14.34-3= 13-12=
0.05
3.26
6.41 4.34 < 6.41 1.34 < 6.41 1 <6.41
R (3,8) =
0.05 R =
3 4 vs.3: 18- 3 vs.1:
3.39*1.965 = 13= 14.34-12=
3.39
6.67 5.34 < 6.67 2.34 < 6.67
R = 4 vs.1: 18-
R (4,8) =
4
3.47*1.965 = 12=
0.05
3.47
6.82 6 < 6.82
Tabla 5. Cálculos
3. Observamos en la Tabla 1 (resultados del ANOVA) que MSE = 11.5833.
4. Calcular: .
5. Definimos que .
6. A partir de la Tabla VII de Montgomery obtenemos los rangos significativos.
Ver la Tabla 3 (cálculos).
7. Calcular los (n – 1) LSR. Ver la Tabla 5 (cálculos).
8. Diferencias entre las medias de los tratamientos (mayor menos menor):
e incluimos en cada línea la comparación
con los Rp.
9. Dado que en todas las desigualdades:
aceptamos la hipótesis nula de que si existen diferencias
significativas.
Cierre
Al realizar la comparación entre pares de medias de tratamientos con cualquiera
de las tres pruebas estudiadas, hay que efectuar los procedimientos con mucho
cuidado para poder tomar la mejor decisión posible.
De tal suerte que las pruebas de hipótesis que se realicen sean significativamente
diferentes, y así lleguen a ser aceptadas o rechazadas con toda certeza.
Por ejemplo: para probar que la eficiencia de una gasolina con dos aditivos A y B
son significativamente diferentes, podemos hacer uso de las pruebas sobre la
diferencia de medias con comparaciones múltiples (LSD), Tukey o rangos de
Duncan.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa
Wiley.
Checkpoint
Asegúrate de comprender:
La varianza del error entre, dentro y total, y los grados de libertad para
los tratamientos.
Las pruebas de comparaciones múltiples (LSD, Least Significant Difference),
de Tukey y Rangos de Duncan.
Explicación del tema 9
Tema 9. Pruebas para la adecuación del modelo
Introducción
En el análisis de varianza tiene validez exclusivamente si se cumplen los tres
supuestos:
Normalidad: los datos se distribuyen de forma normal, con una tendencia central.
La razón de verificar la normalidad en los residuos está basada a que se están
comparando medias, es válido aplicar el teorema central a datos procedentes de
una distribución no normal.
Varianza constante: se le llama homocedasticidad. Es importante determinar si la
varianza permanece constante a través de los distintos grupos.
Independencia: se verifica que se han obtenido muestras aleatorias
independientes dentro de cada uno de los grupos.
¿Y si no se cumplen los tres supuestos ?:
1. Que la expresión nos describa a cada una de las
observaciones.
2. Que los errores tengan una Distribución Normal con media
cero y varianza constante, aunque sea desconocida.
Nota: .
3. Que la distribución de los errores está bajo el supuesto de Independencia.
Las pruebas estudiadas, de diferencia entre las medias, no son procedimientos
exactos al aplicar el análisis de varianza. ¿Qué se puede hacer en este caso?
Dado que por lo general no se cumplen estos supuestos, NID (Normal, Independent
Distribution), se realiza un análisis sobre los residuos.
Explicación
9.1 Normalidad
Domínguez y Castaño (2016) mencionan que la verificación de las tres
suposiciones se traduce en la validación del modelo estadístico:
El modelo indica que la j-ésima observación del tratamiento i está alrededor de la
media µi más el error €ij, que constituye la parte aleatoria de la yij. Como todos los
modelos es una aproximación a lo real y como tal siempre debe diagnosticarse el
ajuste de los datos al modelo.
En un análisis de residuales se busca detectar:
1. Si existen dentro del conjunto de datos valores atípicos respecto a algún
patrón por el modelo.
2. Si la variabilidad de los errores se muestra no constante.
3. Si hay evidencia de que la distribución de los errores se desvíe con respecto
a la normalidad.
El histograma es una de las herramientas de uso práctico para representar los
residuales, en el cual permite indagar si no hay desviaciones a otra centrada en
cero. También si existen residuales atípicos respecto al grupo principal.
Para realizar una prueba para saber si los datos de una muestra provienen de una
distribución específica se utiliza la prueba de Anderson-Darling. Esta es una prueba
no paramétrica que se obtiene con la fórmula:
El valor de AD se puede obtener fácilmente desde algún software como Minitab,
como veremos en el siguiente ejemplo:
La gráfica 1 nos presenta un histograma de los residuos de 166 observaciones
respecto a su media, con una aproximación a la
normal ; observamos que con media
cero y varianza constante .
Gráfica 1. Histograma de frecuencia de los residuos
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
La gráfica 2 nos presenta una aproximación a la probabilidad normal de los
residuos dada por el coeficiente de Anderson-Darling = 0.639.
Observamos en la gráfica una función de aproximación lineal, obtenida a través de
un modelo de regresión lineal simple.
Gráfica 2. Porcentaje contra probabilidad de residuos.
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
9.2 Varianza constante e independencia
Existen varios estadísticos para probar la hipótesis de igualdad de varianzas, en
especial se utiliza la prueba de Hartley. Es importante la comprobación de
homogeneidad, por naturaleza en los procesos aparecen datos que tienen el error
experimental con variabilidad no homogénea entre tratamientos, y de esta manera
aplicar ajustes dado su análisis.
Para verificar el supuesto de varianza constante, se puede realizar la prueba de
hipótesis:
.
El estadístico propuesto por Hartley es el siguiente:
La decisión es rechazar Ho si H>H tablas para algún valor establecido de α,
considerando el número de tratamientos y los grados de libertad para el error.
Tabla E Distribución H, prueba Harley de Domínguez y Castaño (2016).
Tomando el ejemplo del tema 8 Tabla 1. Datos de medición de la tensión del papel
en psi, entonces:
Si α=0.05, valor de Htablas = (3,12,0.95) = 4.16, este valor de H no es menor al
de H tablas, por tanto se rechaza Ho, por lo que se tiene evidencia estadística que
no existe homogeneidad en las varianzas, es decir, no permanecen estables. Tal
parece que esto nos explica los resultados previos.
Si por el contrario, el resultado del valor de H fuera menor al de Htablas se
aceptaría Ho y se consideraría la homogeneidad de varianzas.
La prueba de Bartlett se utiliza para comprobar la hipótesis anterior y consiste
en el siguiente procedimiento:
1. Calcular la varianza de cada tratamiento.
2. Calcular el Sp, la estimación combinada con la fórmula:
3. Calcular b, el valor de una variable aleatoria B (con distribución de Bartlett)
con la fórmula:
4. Obtener el valor crítico de alguna tabla, por ejemplo la tabla A.10
de Walpole (2012).
5. Comparar rechazamos H0 y
aceptamos H1.
Ejemplo
n= Paso 1
i= j= 1 2 3 s2
1 A 14 17 12 6.34
2 B 10 10 16 12
3 C 10 19 10 27
a= 4 D 17 18 19 1
Tabla 1. Datos y resultados parciales
Tomando los datos del tema 8, determinar sí:
Con un nivel de significancia .
Si tenemos que existen 4 tratamientos, A, B, C y D, cada uno con n1 = n2 = n3 =
n4 =3 elementos, de tal forma que N = n1 + n2 + n3 + n4 = 12; ver columnas 1 a 6
de la Tabla 1 (Datos y resultados parciales):
1. Calcular la varianza de cada tratamiento, ver la columna 7 de la Tabla 1
(Datos y resultados parciales).
2. Calcular la estimación combinada:
Sp2 = [(3-1) (6.34)+ (3-1) (12)+ (3-1) (27)+ (3-1) (1)] / (12 - 3) = 10.298
Paso
n= Paso 3: Paso 4:
2:
i= j= 1 2 3 Media ei1 ei2 ei3 d i1 di2 di3
- - - -
1 A 14 17 12 14.33 2.67 0.785
0.330 2.33 0.097 0.685
2 B 10 10 16 12 -2 -2 4 - - 1.18
0.588 0.588
- -
3 C 10 19 10 13 -3 6 -3 1.76
0.882 0.882
-
a= 4 D 17 18 19 18 -1 0 1 0 0.294
0.294
Tabla 2. Datos y resultados parciales
3. Calcular el valor de b, la variable aleatoria B (con distribución de Bartlett):
b = [(6.34)2 + (12)2 + (27)2 + (1)2)]1/(12-4) / 10.298 = 0.2277
4. Obtener, de la tabla A.10 de Walpole (2012), el valor crítico:
b4(0.05; 12) = 0.8317
5. Comparar b con b4:
Dado que b = 0.2277 < b4 = 0.8317, rechazamos H0 y aceptamos H1; los cuatro
tratamientos no son significativamente diferentes.
9.3 Residuos
Para ilustrar un posible análisis de residuos, lo iremos haciendo a través de
un ejemplo directamente:
1. Tomamos los datos de la sección anterior, ver las columnas 1 a 6 de la
Tabla 2 (datos y resultados parciales).
2. Calculamos la media de cada tratamiento, ver la columna 7 de la Tabla 2
(Datos y resultados parciales).
Sabiendo que MSE =11.5833
3. Calculamos los residuos (el error eij de cada elemento yij respecto a su
correspondiente media): .
Ver las columnas 8 a 10 de la Tabla 2 (Datos y resultados parciales).
La siguiente gráfica nos presenta los residuos respecto al orden de observación:
Gráfica 1. Residuos contra orden de observación: R = f [ k ]
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
4. Calculamos los residuos estándar ; observamos que el mayor
valor atípico d32 = 1.76 es menor que 3 o 4 desviaciones estándar, por lo
que no nos debe de preocupar.
Ver d32 en la columna 12 de la Tabla 2. (Datos y resultados parciales).
5. Finalmente, podemos observar gráficamente en la Gráfica 4. Residuos
contra valor ajustado, que no hay alguna concentración de residuos, lo que
nos hace ver que se cumple muy probablemente la condición
.
Gráfica 4. Residuos contra valor ajustado
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
Cierre
En la imagen se presenta una báscula, que nos determina el peso del objeto
medido, sin embargo:
No nos dice la distribución de probabilidad que tiene la población de donde
se sacaron los objetos medidos. Por ejemplo, si la población sigue una
distribución normal.
No nos dice si la población tiene una media constante o de acuerdo a
especificaciones.
No nos dice si la población tiene una varianza constante, que no se ve
afectada por factores como la temperatura, la humedad, etc.
Tampoco nos dice la cantidad de residuos, es decir, los valores que salen
del promedio ni si se sigue el concepto de independencia.
Sin embargo, con los conceptos estudiados en este tema podemos realizar varias
pruebas para la adecuación del modelo que nos lleve a obtener la información y
datos importantes para la toma de decisiones.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México:
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Alfaomega.Montgomery, D. (2012). Diseño de experimentos (2ª ed.).
México. Limusa Wiley.
Checkpoint
Asegúrate de comprender:
Los conceptos de normalidad e independencia, residuos y la
condición .
El coeficiente de Anderson-Darling y la prueba de Bartlett.
xplicación del tema 10
Tema 10. Tamaño de la muestra
Introducción
Una vez llevados a cabo las hipótesis, ANOVA y análisis de la información, llegamos
a la etapa 4, la selección del diseño experimental, que comienza con la
determinación del tamaño de la muestra.
Ciertamente buscamos que el esfuerzo de realizar un experimento nos arroje
información precisa y adecuada para mejorar nuestro producto y/o proceso,
debemos considerar que la muestra sea representativa y arroje información
correcta, completa y clara, apegándonos además a cierta restricción de tiempo
total y costos del experimento.
Definiremos que el tamaño de la muestra de un experimento está basado en el
número de réplicas que se hará por cada tratamiento.
¿Qué condiciones debemos considerar para determinar el tamaño de la muestra
(cantidad de réplicas), para obtener la precisión requerida en un experimento?
En este tema revisaremos las condiciones a tomar en cuenta y el plan de muestreo
de las curvas de operación en la estrategia del plan experimental exitoso.
Explicación
Es importante conocer el nivel de calidad en función de defectos tolerados, los
cuales están divididos en dos medibles: AQL (nivel de calidad aceptable) y LTPD (el
nivel de porción defectuosa tolerable).
El AQL generalmente se encuentra definido en contratos y/o órdenes de compra,
para entender mejor, si el consumidor define un AQL =0.001, significa la
probabilidad, la cual se traduce en permitir más de una unidad defectuosa en 1000
unidades/piezas.
El LTPD es la porción defectuosa tolerable en el lote y esto define el nivel de
calidad más pobre que el consumidor tolerará.
El riesgo del productor a es la posibilidad de un falso rechazo que el plan de
muestreo no logre asegurar que la cantidad es aceptable en el lote. Si no está
definido, entonces se toma AQL=5.
El riesgo del consumidor es llamado el riesgo β y en general suele ser del 10 % =
0.10.
Todos los planes de muestreo tienen el propósito de establecer un riesgo
especificado para el productor y consumidor. Las curvas características de
operación son una representación gráfica trazando la probabilidad de que el lote
sea aceptado, para toda una gama de proporciones de unidades defectuosas.
Figura 1. Curvas características de operación
La determinación del tamaño de la muestra o número de réplicas de los
tratamientos tiene mucho que ver con el análisis de la información. Por ejemplo, si
se esperan diferencias grandes entre los tratamientos, el número de réplicas
puede ser menor que si las diferencias son muy pequeñas, de tal manera
necesitaremos tomar más muestras para poder detectar esas diferencias.
Los expertos mencionan que en la mayoría de los experimentos de un factor varía
entre 5 y 10 réplicas, y en algunos casos puede llegar hasta 30.
Hay algunas consideraciones que mencionan:
Entre menor sea la desviación de la hipótesis nula a ser medida, el tamaño
de la muestra crecerá.
Cuando en el experimento se tienen varios tratamientos (cuatro o más) se
reduce el tamaño de la muestra.
Si se espera mucha variabilidad en fuentes no controladas, como métodos
de medición, materias primas, etc., mayor debe ser el tamaño de la
muestra.
De los métodos más utilizados para determinar el tamaño de la muestra se
encuentra el uso de curvas características:
10.1 Curvas características
Podemos determinar el tamaño de las corridas necesarias de un experimento,
obteniendo el valor de la potencia de la prueba , en la que es la
probabilidad de error tipo II:
, por lo que la potencia de la prueba:
El valor de lo obtenemos a través de curvas características, por ejemplo las
que presenta Montgomery (2012) en la Tabla V.
La utilización de las tablas la demostraremos a través del siguiente ejemplo:
Se desea estudiar la resistencia de fluencia del acero A36 producido, utilizando
cuatro técnicas diferentes A, B, C y D; rechazamos la
hipótesis utilizando un nivel de significancia .
Solución:
Paso 1. Se realiza el experimento con los cuatro tratamientos - k (técnicas),
obteniendo los resultados mostrados en las columnas 3 a 6 de la Tabla 1.
Resultados preliminares.
S (resistencia de fluencia
y
i Técnica
(MPa)
1 1 285 250 254 251 260 5.8125
2 2 254 251 250 254 252.25 -1.9375
3 3 250 253 251 254 252 -2.1875
4 4 252 253 253 252 252.5 -1.6875
=
1016.75 =45.172
= 254.2
Tabla 1. Resultados preliminares
Paso 2. Calculamos:
a) La media de cada tratamiento
b) La suma de todas ellas
c) La media de las medias , obteniendo los resultados mostrados en la columna 7
de la Tabla 1 (resultados preliminares).
Paso 3. Calculamos:
a)
b) La suma de todas ellas, obteniendo los resultados mostrados en la columna 7 de
la Tabla 1 (Resultados preliminares).
Paso 4. Suponiendo que obtenemos que:
Y calculamos, para valores de n = 2 en adelante, aquel valor obteniendo los
resultados mostrados en la columna 2 de la Tabla 2 (Resultados finales).
2.5 1.587
2 3 4 0.6 0.4
2 5
3.7 1.944
3 3 8 0.29 0.71
8 2
5.0 0.05
4 2.245 3 12 0.946
4 4
0.03
5 6.3 2.51 3 16 0.968
2
Tabla 2. Resultados finales
Paso 5. Buscamos en la curva característica de la Tabla V de Montgomery (2012)
para con [
grados de
libertad, ver Curvas 1 (Operating characteristics curves for the fixed-effects model
analysis of variance).
Figura 1. Curva de operación característica para el análisis de varianza del modelo con efectos fijos.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa Wiley.
Obteniendo los resultados mostrados en la columna 7 de la Tabla 2 (resultados
finales).
Paso 6. Observamos en la Tabla 2 (Resultados finales) que con valores
de , por lo que rechazamos H0.
Paso 7. Observamos que con valores de , y aceptamos H0,
así que tomamos como tamaño mínimo n = 4 ( ).
10.2 Desviación estándar
Montgomery (2012) propone el cálculo de de acuerdo a la siguiente fórmula:
Fórmula en la que el término se refiere a la desviación
estándar de un conjunto de muestras aleatórias, , respecto a la
varianza .
Ejemplo:
Si tomamos los datos de la resistencia de fluencia del acero A36, y calculamos el
valor de suponiendo que se desea detectar un incremento de 20%, con una
probabilidad de al menos 0.90 y utilizando un nivel de significancia .
Solución:
Paso 1. Realizar el experimento; ver tabla 1 del ejemplo anterior.
Paso 2. Calculamos:
a) La media de cada tratamiento.
b) La suma de todas ellas.
c) La media de las medias, - ; ver tabla 1 del ejemplo anterior.
Paso 3. Calculamos:
a) .
b) La suma de todas ellas: Ver Tabla 1 del ejemplo anterior.
Paso 4. Suponiendo que obtenemos que:
Y con esto calculamos valores de para n = 8, 9, 10 y 11, obteniendo los
resultados mostrados en la columna 2 de la Tabla 3 (resultados finales):
8 1.8668 3 28 0.21 0.79
9 1.98 3 32 0.12 0.88
10 2.0871 3 36 0.083 0.917
11 2.189 3 40 0.053 0.947
Tabla 3. Resultados finales
Paso 5. Buscamos en la curva característica de la Tabla V de Montgomery (2012)
para
con [
grados de
libertad.
Ver Curvas 2 (Operating characteristics curves for the fixed-effects model analysis
of variance).
Figura 2. Curva de operación característica para el análisis de varianza del modelo con efectos fijos.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa Wiley.
Obteniendo los resultados mostrados en la columna 6 de la Tabla 3. (Resultados
finales).
Paso 6. Observamos en la Tabla 3 (resultados finales), que con valores
de , por lo que rechazamos H0.
Paso 7. Observamos que con valores de ,y
aceptamos H0, así que tomamos como tamaño mínimo n = 10 (
).
Observamos que, al considerar la desviación estándar, aumenta el tamaño de la
muestra.
10.3 Intervalo de confianza
Además del cálculo del tamaño de la muestra, utilizando las curvas características
a partir de o a partir de al considerar un incremento en la desviación
estándar, es posible realizar el cálculo considerando al estadístico t de Student:
En un intervalo de confianza para de tal forma que puede
ser estimada a partir de la varianza deseada quedando, para fines
de cálculo, la fórmula:
Para utilizar esta metodología, hay que seguir los siguientes pasos:
Paso 1. Obtener el valor del número de tratamientos k, y asignar un valor al nivel
de significancia .
Paso 2. Calcular los grados de libertad para diversos valores de n.
Paso 3. Obtener de tablas, el valor de
Paso 3. Calculamos . . Ver resultados en la columna 4 de la tabla
3. (Resultados).
Paso 4. Tomar una decisión; comparar y seleccionar el
valor de n cuya diferencia, a partir de La comparación, sea la menor.
Ejemplo:
Si tomamos los datos de la resistencia de fluencia del acero A36, calculamos el
valor del intervalo , N-k para diferentes valores den.
Solución:
Paso 1. Obtenemos que el valor del número de tratamientos k=4, y asignamos un
valor al nivel de significancia .
Paso 2. Calculamos los grados de libertad . Ver resultados
en la columna 2 de la Tabla 3 (Resultados).
4 12 2.175 4.61 1.61
3 8 2.306 5.65 2.65
2 4 2.776 8.33 5.33
Tabla 3. Resultados
Paso 3. Obtenemos de tablas el valor de para { y para los
valores de previamente calculados, ver resultados en la columna 3 de la Tabla 3
(Resultados).
Paso 4. Calculamos , ver resultados en la columna 4 de la Tabla
3 (Resultados).
Paso 5. Decisión. Dado que todos los valores calculados de son
mayores que 3, seleccionamos el valor de n = 4, ya que nos da una diferencia
menor, ver resultados en la columna 5 de la Tabla 3 (Resultados).
10.4 Determinación del número de réplicas por método de la diferencia
mínima a ser detectada
Paso 1. Determinar la menor diferencia entre medias que se desea detectar D
Paso 2. Estimar la varianza σ:
Del análisis del estudio inicial.
Usando el dato histórico del proceso.
De una muestra aleatoria del proceso.
Paso 3. Calcular la relación entre la diferencia mínima deseada de las medias y la
desviación estándar:
Paso 4. Buscar en la tabla la intersección de la relación Ф y el número de
tratamientos k. Ahí obtendrás el número de réplicas sugerido.
Tabla 1. Número de replicaciones para un diseño completamente al azar.
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y análisis en ciencias e
ingenierías. México: Alfaomega.
Ejemplo
Paso 1. Supongamos que se desea detectar una diferencia de
Paso 2. Estimar la varianza σ: 4.5
Paso 3. Calcular la relación entre la diferencia mínima deseada de las medias y la
desviación estándar:
Paso 4. Buscar en la tabla la intersección de la relación Ф y el número de
tratamientos k. Ahí obtendrás el número de réplicas sugerido: se aproxima a 2.
Suponiendo que tienes cuatro tratamientos K=4, sugiere que realices 9 réplicas,
n=9.
Cierre
Para retomar la pregunta que nos hacíamos en la introducción referente al tamaño
que deben de tener las muestras, podemos ver que existen varios procedimientos
para responder esta pregunta.
Sin embargo, ahora surge una nueva pregunta: ¿qué beneficios trae poder usar
estos procedimientos para definir la muestra?
Con las curvas características se combinan ecuaciones con métodos
gráficos.
Con el intervalo de confianza, en la que se combinan las ecuaciones de
decisión con valores en tablas.
Con la referencia de la diferencia mínima.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa
Wiley.
Checkpoint
Asegúrate de comprender:
Los procedimientos de curvas características, desviación estándar e
intervalo de confianza.
Los conceptos de potencia de la prueba, desviación estándar de un conjunto
de muestras aleatorias y el estadístico t de Student.
El proceso de numero de réplicas mediante la diferencia mínima deseada.
Explicación del tema 11
Tema 11. Diseños de bloques completos
Introducción
Hasta el momento hemos estudiado diseños experimentales donde solamente un
factor es de interés en estudio para conocer cómo afecta o varía nuestro efecto
hacia la variable de respuesta. Sin embargo, en la mayoría de los experimentos
son varios los factores que suelen afectar la variable de respuesta. Ustedes podrán
pensar que se podría estudiar uno a la vez, pero es importante entender que estos
factores tienen interacciones entre sí, es decir, que uno afecta el comportamiento
del otro, generando diferente resultado en nuestro efecto principal.
Los diseños de bloques completos se utilizan en casos en donde dos o más
factores influyen en la respuesta.
Recordemos que un factor es aquella variable de interés de la cual queremos
estudiar el efecto que tiene sobre la variable de respuesta.
El diseño de bloques completos es muy útil para resolver este tipo de problemas
con multi-parámetros.
Explicación
Los factores pueden ser de dos tipos de variables:
Los factores pueden tener valores específicos, así que para el experimento se toma
el valor mayor que se expresa con (+) y un valor menor que se expresa con (-). A
estos valores les llamamos niveles.
Los tratamientos son el total de combinaciones que podemos obtener de factores
con sus niveles.
Por ejemplo, en el proceso de pasteurizado los factores de interés son la
temperatura y el tiempo, donde los niveles comúnmente utilizados son (100oC y
63oC) y (1 segundo y 30 minutos). Tenemos que son dos factores con dos niveles
cada uno.
Supongamos que también se tomará en cuenta la presión, por tanto, nuestros
factores aumentan a tres con dos niveles, lo cual se ilustra como un diseño
experimental 23, la reducción de agentes perniciosos podría ser el efecto buscado.
Entonces tendremos (2x2x2) = 8 diferentes tratamientos, lo cual nos daría ciertas
combinaciones para cada factor, de las cuales tendremos una respuesta:
Tratamiento Tempetatura Tiempo Presión
1 T+ Ti+ P+
2 T- Ti- P-
3 T+ Ti+ P-
4 T+ Ti- P-
5 T+ Ti- P+
6 T- Ti+ P+
7 T- Ti- P+
8 T- Ti+ P-
De tal forma que tendríamos 3 X 8 = 24 combinaciones en total. Si fuese el caso
que se requirieran hacerse réplicas, se multiplicarían por el número de réplicas (n).
En este módulo veremos la aplicación en el diseño de experimentos factoriales.
11.1 Diseños de bloques completos aleatorios
Si por la presencia de ruido experimental se espera que no exista homogeneidad
entre las unidades experimentales, teniendo la posibilidad de incrementar el error,
se tienen dos estrategias para contrarrestar estos efectos:
1. Formar bloques o grupos controlados de tal forma que las unidades
experimentales queden definidas por algún patrón.
2. Realizar un análisis de covarianza.
El diseño de bloques completos aleatorios se utiliza cuando queremos comparar
tratamientos o determinar el efecto de un factor en especial.
El diseño conserva la aleatorización, aunque esta tiene una restricción en cuanto a
que las unidades experimentales son clasificadas y se forman grupos homogéneos
a los que llamamos bloques. Una vez organizados, los tratamientos son asignados
aleatoriamente a estos bloques.
Por ejemplo, supongamos que el resultado de interés de un experimento sea el
identificar de los fertilizantes en el mercado cuál tiene un efecto de mayor
producción en el campo; de los diferentes tipos de fertilizantes existen varios
fabricantes, y está demostrado que la región de la tierra donde está la siembra
tiene un efecto en la producción, por tanto, se busca eliminar una interferencia con
los datos buscados exclusivamente en el estudio del fertilizante, de modo que se
dividen en bloques por el tipo o ubicación del campo y se construyen los
tratamientos de forma aleatoria.
La Tabla 1 nos muestra el lugar en que hay que colocar los factores para el análisis
de varianza para el diseño de bloques completos aleatorios:
Fuente
de Suma de Grados de Cuadrados
F
variació cuadrados libertad medios
0
Tratamie
ntos
Bloques
Error
Total
Tabla 1. Análisis de varianza para el diseño de bloques completos aleatorios
Cada factor de la Tabla 1 se calcula según las fórmulas descritas en la siguiente
tabla (Tabla 2):
Tabla 2. Fórmulas
Ejemplo: Un ingeniero desea probar el efecto de colocar cuatro diferentes tipos de
capacitores en la frecuencia de oscilación de un oscilador, que espera sea de 100
MHz. Para la prueba, el ingeniero decide realizar un análisis de varianza para el
diseño de bloques completos aleatorios que consiste en utilizar cada tipo de
capacitor en cinco osciladores diferentes y realizar la decisión con un nivel de
significancia .
Solución.
Paso 1. El orden en que se elige el amplificador y su correspondiente capacitor es
al azar.
En la siguiente tabla (Tabla 3) se muestra la frecuencia de oscilación (en MHz) de
los cinco amplificadores con los cuatro capacitores:
Amplificador
Capacitor 1 2 3 4 5
1 98.9 97.3 102.6 104.1 103.2
2 104.0 103.4 100.5 97.0 98.0
3 98.3 101.3 101.2 95.5 100.9
4 104.4 101.5 98.7 101.8 97.0
Tabla 3. Frecuencia de oscilación (en MHz)
Paso 2. Para simplificar el procedimiento le restamos 100 a cada valor medido y
calculamos (Tabla 4).
Amplificador (a=5)
Capacitor
1 2 3 4 5
(b=4)
1 -1.1 -2.7 2.6 4.1 3.2 6.2 38.36
2 4.0 3.4 0.5 -3.0 -2.0 2.9 8.17
3 -1.7 1.3 1.2 -4.5 0.9 -2.8 7.77
4 4.4 1.5 -1.3 1.8 -3.0 3.4 11.71
5.6 3.5 3.1 -1.6 -0.9 66.0
31.5 12.3 9.3 2.6 0.81 56.51
Tabla 4. Frecuencias relativas a 100 MHz
Recordemos los cálculos siguiendo las fórmulas:
Paso 3. Realizamos los cálculos utilizando las fórmulas de las tablas 1 y 2. Las
operaciones y los resultados se muestran en la siguiente tabla (Tabla 5):
Fuen
Grados
te de Suma de Cuadrados
de F 0
varia cuadrados medios
libertad
ción
Trat
amie
ntos
Bloq
ues
Erro
r
Tota
l
Tabla 5. Operaciones y resultados
Paso 4. Dado que es mayor que concluimos que
los diferentes tipos de capacitores no afectan a la frecuencia de oscilación.
En Minitab,
Paso 1: Se debe colocar una columna para los capacitores, amplificador y las
lecturas son las respuestas:
Esta pantalla se obtuvo directamente del software que se está explicando en la
computadora, para fines educativos.
Paso 2: Elige: Estadísticas > ANOVA > Modelo lineal general > Ajustar modelo
lineal general.
Paso 3: En Respuestas, ingresa columna de respuesta. En Factores, ingresa
columnas de Capacitor y Amplificador
*Revisa el nivel de confianza en opciones.
Paso 4: Selecciona OK.
Paso 5: Interpreta por el valor de P value, donde si Pvalue >.05 (α – nivel de
significancia) se concluye que estadísticamente los efectos no son significativos.
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Capacitor (b=4) 3 8.396 2.799 0.27 0.844
Amplificador 4 9.387 2.347 0.23 0.917
Error 12 123.349 10.279
Total 19 141.132
Tabla 6. Resultados del análisis de varianza en Minitab.
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
11.2 Diseño de cuadro latino
Como una extensión del modelo de bloques tenemos el diseño de cuadro latino, el
cual se desea comparar tres factores, dos de ellos ( ) llamados de bloque y
el tercero ( ) llamado de tratamiento.
Cambiaremos la notación k a p (niveles) para conveniencia de aprendizaje de otro
modelo.
El modelo estadístico está dado por la expresión:
Se le llama cuadro latino, ya que además de los dos factores a comparar se
realiza un tercer cotejo de acuerdo a la letra latina correspondiente.
El cuadro latino se utiliza cuando requieres el estudio del efecto que se tiene sobre
un factor en especial y como tienes más variables que pudieran meter ruido a los
datos, lo que hacemos es que les buscamos tener bajo control.
Por ejemplo, si nuestro estudio fuera entre dos marcas de llantas (p=2), la
ubicación de las llantas podría ser una influencia en el efecto, ya fuera derecha o
izquierda, y además agregamos el efecto posición trasera o delantera, de tal forma
que, utilizando este método podríamos asegurar que solamente cubriremos para el
estudio la marca y tendríamos bajo control los demás factores.
A continuación se incluyen dos ejemplos de dicho orden (que puede ser diferente):
uno para p=4: cuadro 4 X 4 y otro para p=5: cuadro 5 X 5.
4X4 5X5
A B C D A B C D E
B C D A B C D E A
C D A B C D E A B
D A B C D E A B C
E A B C D
NOTA: el valor de p puede ser mayor a 5.
La Tabla 6 nos muestra los factores para el análisis de varianza en el diseño de
cuadro latino:
Fuen Grados
Cuadra
te de de
Suma de cuadrados dos F
varia liberta
0
medios
ción d
Trata
mien
tos
(Letr
as
latin
as)
Reng
lones
Colu
mnas
Error
Total
Tabla 6. Análisis de varianza para el diseño de cuadro latino
Ejemplo: para el ejemplo de la sección anterior, el ingeniero desea probar el
efecto de colocar cuatro diferentes tipos de resistencias además de los cuatro
diferentes tipos de capacitores en la frecuencia de oscilación de un oscilador, que
espera sea de 100 MHz. Para la prueba el ingeniero decide llevar a cabo un
análisis de varianza en el diseño de cuadro latino y realizar la decisión con un nivel
de significancia .
Solución.
Paso 1. El orden en que se elige el amplificador y su correspondiente capacitor es
al azar.
En la siguiente tabla (Tabla 7) se muestra la frecuencia de oscilación (en MHz) con
los cuatro capacitores y las cuatro resistencias:
Resistencia
Capacitor 1 2 3 4
1 98.17 98.04 99.40 96.11
2 98.81 101.42 97.57 100.53
3 103.33 103.96 104.29 102.59
4 95.02 101.57 107.24 96.55
Tabla 7. Frecuencia de oscilación (en MHz) con los cuatro capacitores y las cuatro resistencias
Paso 2. En la siguiente tabla (Tabla 8), se codifican los datos, respecto a la
frecuencia deseada y se asignan las letras latinas.
Resistencia
Capacitor k=1 k=2 k=3 k=4
i=1 A -1.83 B -1.96 C -0.60 D -3.89
i=2 B -1.19 C 1.42 D -2.43 A 0.53
i=3 C 3.33 D 3.96 A 4.29 B 2.59
i=4 D -4.98 A 1.57 B 7.24 C -3.45
Tabla 8. Datos codificados y letras latinas
Paso 3. Calculamos SS, MS y F0 para p=4.
Para realizar las operaciones utilizamos la hoja de cálculo anexa, colocando los
datos registrados con fondo amarillo.
Paso 4. Comparar el valor obtenido
de y tomar una decisión: Dado
que concluimos que no hay una diferencia
significativa en el uso de diferentes marcas de resistencias y capacitores en la
frecuencia obtenida de los osciladores.
11.3 Diseño de cuadro grecolatino
El diseño de cuadro grecolatino se utiliza cuando se desea controlar 3 factores, (qi
- β- y) llamados de bloque y un tratamiento y se identifican con letras
griegas y latinas
El modelo estadístico está dado por la expresión:
Se le llama cuadro grecolatino ya que además de los dos factores a comparar se
realiza una tercera comparación de acuerdo a la combinación de letra griega y
latina correspondiente.
A continuación se incluyen dos ejemplos de dicho orden (que puede ser diferente):
uno para p=4: cuadro 4 X 4 y otro para p=5: cuadro 5 X 5.
4X4 5X5
NOTA: el valor de p puede ser mayor a 5.
El procedimiento para el análisis de varianza en el diseño de cuadro grecolatino se
muestra en la siguiente tabla (Tabla 9):
Fuente de Grados de
Suma de cuadrados
variación libertad
Tratamien
tos (letras
latinas)
Tratamien
tos (letras
griegas)
Renglones
Columnas
Error
Total
Tabla 9. Análisis de varianza para el diseño de cuadro grecolatino
Ejemplo: Para el ejemplo de la sección anterior, el ingeniero desea probar la
influencia del procedimiento de ensamble de los osciladores además del efecto de
los cuatro diferentes tipos de resistencias y de los cuatro diferentes tipos de
capacitores en la frecuencia de oscilación de un oscilador, que espera sea de 100
MHz. Para la prueba, el ingeniero desea llevar a cabo un análisis de varianza para
el diseño de cuadro grecolatino y realizar la decisión con un nivel de
significancia .
Solución.
Paso 1. El amplificador y su correspondiente capacitor se eligen al azar.
En la siguiente tabla (Tabla 10) se muestra la frecuencia de oscilación (en MHz)
con los cuatro capacitores y las cuatro resistencias:
Resistencia
Capacitor 1 2 3 4
1 98.17 98.04 99.40 96.11
2 98.81 101.42 97.57 100.53
3 103.33 103.96 104.29 102.59
4 95.02 101.57 107.24 96.55
Tabla 10. Frecuencia de oscilación (en MHz) con los cuatro capacitores y las cuatro resistencias
Paso 2. Se codifican los datos, respecto a la frecuencia deseada y se asignan las
letras griegas y latinas.
Resistencia
Capacitor k=1 k=2 k=3 k=4
i=1 -1.83 -1.96 -0.60 -3.89
i=2 -1.19 1.42 -2.43 0.53
i=3 3.33 3.96 4.29 2.59
i=4 -4.98 1.57 7.24 -3.45
Tabla 11. Datos codificados y letras grecolatinas
Paso 3. Calculamos SS, MS y F0 para p=4.
Para realizar las operaciones utilizamos la hoja de cálculo anexa, colocando los
datos registrados con fondo amarillo.
Paso 4. Comparar el valor obtenido
de y tomar una decisión: dado
que concluimos que no hay una diferencia
significativa en el uso de diversos procedimientos de ensamble y de las diferentes
marcas de resistencias y capacitores en la frecuencia obtenida de los osciladores.
Cierre:
Al utilizar los bloques completos, disponemos de una buena variedad de métodos:
de inicio el diseño de bloques completos y en general para determinar la relación
que dos factores tienen con la variable de respuesta.
Si deseamos aumentar un factor, podemos utilizar los diseños de cuadro latino y
basados en los bloques completos incluimos en ellos un nuevo parámetro, indicado
a base de letras latinas.
Y si deseamos aumentar un factor más, podemos utilizar los diseños de cuadro
grecolatino, que basados en los diseños de cuadro latino incluimos en ellos un
nuevo parámetro, indicado a base de letras griegas.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa
Wiley.
Checkpoint
Asegúrate de comprender:
El diseño de experimentos con base en los diseños de bloques y factoriales.
Los conceptos: tratamiento con base en letras latinas, tratamiento con base
en letras griegas, renglones, columnas y total.
Explicación del tema 12
Tema 12. Diseños factoriales 2k y 3k
Introducción
Hasta el momento hemos hecho referencia al diseño de factores simple
(completamente aleatorio) y por bloques, cuya característica más importante es
que el estudio se basa en analizar qué efecto existe de un factor o incluso más de
un factor, sobre la variable de salida; estudiando nivel por nivel o bloque por
bloque, por medio del análisis ANOVA, en el cual se determina si existe alguna
variación tomando de base la diferencia entre sus medias, lo cual nos lleva a
concluir si son significativamente o no diferentes entre sí. Partiendo de ahí, hemos
estudiado que de la prueba LSD, Tukey o Duncan podemos verificar cuál de estos
niveles o secciones se diferencia de los demás de estudio.
Recordemos el ejemplo donde buscamos evidencia estadística que demuestre si
distintos niveles de solución concentrada tienen algún efecto en aumentar o
disminuir la resistencia de la envoltura de los dulces.
Los resultados de resistencia se comparan por cada nivel de concentración de
sustancia, de tal forma que se podría identificar si alguno demuestra como efecto
de incrementar o disminuir la resistencia de la envoltura.
El diseño factorial completo analiza las interacciones de los factores y niveles,
aunado al estudio de estos en lo particular con base a la respuesta.
Un ejemplo muy básico es el efecto que obtenemos al agregar a un metal
bicarbonato en polvo o jugo de limón, solamente el efecto es muy diferente a que
si agregamos la mezcla de ambos.
De tal forma que es importante verificar el comportamiento de la interacción de los
niveles y factores para poder tomar la decisión que más convenga al proceso,
producto o servicio estudiado.
En los siguientes temas estudiaremos respecto al diseño factorial completo, su
manejo e interpretaciones, lo cual te abrirá una mejor oportunidad para tomar
decisiones acertadas, basando tu trabajo en datos y observaciones estadísticas y
resoluciones inteligentes.
12.1 Definiciones básicas
Un punto de partida es estar conscientes que el interés primordial del
experimentador es conocer las causas que contribuyen a algún cambio en cierto
efecto, donde supone que para tener un enfoque experimental dirigido debe aislar
el factor considerado más importante y mantener constantes los demás para tener
el control y observar de forma plena el efecto principal. En conclusión, se pueden
sugerir cambios o no de dicho factor y luego repetir el experimento de uno a uno
con los demás factores (OFAT -One factor at a time).
Sin embargo, existen varias desventajas en los experimentos tipo OFAT contra el
diseño factorial:
En el experimento se le llama efecto principal cuando derivado de un cambio en un
factor de interés obtenemos un cambio en la respuesta producida.
El diseño factorial enfoca el estudio de los efectos principales e interacciones de
factores y niveles de forma general. Es importante que comprendas que en este
tema estamos estudiando diseños factoriales balanceados, los cuales se
caracterizan por tener la misma cantidad de tratamientos.
Por ejemplo, el experimento de la Figura 12.1 tiene dos factores y cada factor con
dos niveles: bajo (-) y alto (+).
Entonces tendríamos una tabla de resultado de observaciones en relación con la
respuesta como sigue:
Figura 12.1 Experimento factorial de dos factores con la respuesta (y) indicada en los vértices
Figura 12.2 Experimento factorial de dos factores con interacción
5. Incremento de la respuesta promedio, en la operación anterior,
decimos que hay un incremento de la respuesta promedio de A = 21,
cuando el factor A cambia del nivel bajo al nivel alto o decimos que hay un
incremento de la respuesta promedio de B = 21, cuando el factor B cambia
del nivel bajo al nivel alto.
6. Interacción, ocurre cuando en un experimento encontramos que la
diferencia en la respuesta entre los niveles de un factor no es la misma que
entre los niveles del otro factor, por ejemplo, el experimento de la Figura 2
en el nivel bajo del factor B (B-) el efecto A es:
A = 50 – 20 = 30
Y en el nivel alto del factor B (B+) el efecto A es:
A = 12 – 40 = -28
Es decir, al incremento del factor B hay un decremento significativo del efecto A y
viceversa.
7. La magnitud del efecto de interacción: Se calcula con el promedio de
los dos efectos anteriores:
|A| = (- 28 -30)/2 = -29
Gráficamente podemos ver en la Figura 12.3 un experimento factorial sin
interacción mientras que en las Figura 12.4 podemos ver un experimento factorial
con interacción
Figura 12.3. Experimento factorial sin interacción
Figura 12.4. Experimento factorial con interacción
8. Factor cuantitativo, son las variables las que se les puede asignar una
cantidad analógica, como a la temperatura, presión, tiempo, etc.
9. Modelo de regresión, un factor cuantitativo que puede ser representado
con una función:
10. Gráfica de superficie de respuesta: Se le llama así a la representación
gráfica de un modelo de regresión.
Ejemplo: Graficar la función:
Solución:
Utilizando el software WolframAlpha, obtenido de WolframAlpha (2013) se graficó
la función:
Gráfica 1. Superficie de respuesta del modelo de regresión
12.2 Ventajas del diseño factorial
Puede ser estudiado el efecto individual y de interacción de cada factor.
Pueden cambiar de tamaño sobre la marcha a medida que el experimento
lo requiera.
Se pueden correr los diseños factoriales en forma fraccionada.
Se pueden combinar con diseños de bloques si así lo requiere el
experimento.
No requiere de matemáticas complicadas, la mayoría de las veces se
trabajan con base en representaciones de funciones lineales.
Domínguez y Castaño (2016) ilustran el siguiente ejemplo para comprender cómo
se grafica un proceso donde tenemos interactuando tres factores con dos niveles
cada uno:
Presión (700 – 600psi)
Velocidad (rápido – lento)
Rev. Por minuto (0.3 – 1)
Corrobora que la presión es el factor de primer interés y los otros dos factores se
condicionan a ser controlados, estableciéndose sin cambio de condición estándar
velocidad rápida y a 1rpm y la velocidad de rápida a lenta.
Los números que vemos en los cuadros blancos son resultantes de interacciones
calculadas de cada nivel de los factores, en este caso representan defectos en el
proceso, por tanto, el experimentador, al tener como objetivo disminuir los
defectos, ciertamente concluye que 600psi, en el caso de la presión, es el nivel
elegido, ya que es en el cual tenemos menos defectos (11) que en las otras dos
interacciones (25 y 37), rpm es elegido el 0.3 y a velocidad lenta.
Figura 12.5. Ejemplo de diseño factorial
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora, para
fines educativos.
12.3 Estimación puntual de los efectos promedio y de las variables de
respuesta
En el subtema 6.3 vimos algunos conceptos de la estimación puntual de los efectos
promedio y de las variables de respuesta, ahora relacionaremos estos conceptos
con el diseño por bloques:
Una población analizada por bloques, puede ser definida por una función; en el
caso del diseño de cuadro grecolatino esta función es:
En donde:
a. es la media de las observaciones .
b. es el parámetro asignado a los renglones.
c. es el parámetro asignado a los tratamientos (letra latina).
d. es el parámetro asignado a los tratamientos (letra griega).
e. es el parámetro asignado a las columnas.
f. es el error debido a la diferencia entre la media de las observaciones y
la influencia de los tratamientos.
Como se había mencionado en el subtema 6.3, es frecuente que ante un proceso
industrial, estos parámetros sean desconocidos, lo que dificulta la toma de
decisiones.
Una alternativa es realizar una estimación puntual de estos estadísticos.
En la estimación puntual, se evalúan los parámetros por medio de una muestra
de tamaño, p, siguiendo los siguientes procedimientos:
a. La media, , se estima a través de la media de la muestra, , que se
representa con el símbolo .
b. El parámetro , se estima a través de la media de la muestra , dado por
, que se representa con el símbolo .
c. El parámetro , se estima a través de la media de la muestra , dado por
, que se representa con el símbolo .
d. El parámetro , se estima a través de la media de la muestra , dado
por , que se representa con el símbolo .
e. El parámetro , se estima a través de la media de la muestra , dado por
, que se representa con el símbolo .
Ejemplo: Realiza una estimación puntual tomando como referencia los parámetros
calculados en el subtema 11.2 (Diseño de cuadro latino)
Solución:
Tomando los datos del ejemplo anterior, calculamos los parámetros deseados.
Tabla 1. Cálculos para la estimación de parámetros
Cierre:
En este tema se han visto las bases del diseño factorial, repasando algunos
conceptos básicos como:
1. Factores cruzados
2. Efecto principal
3. Incremento de la respuesta promedio
4. Interacción
5. Magnitud del efecto de interacción.
6. Factor cuantitativo
7. Modelo de regresión
8. Gráfica de superficie de respuesta
Además, has visto que el diseño factorial presenta algunas ventajas como:
1. El estudio del efecto individual y de interacción de cada factor
2. El tamaño variable
3. El fraccionamiento
4. La combinación con diseños de bloques
5. Las matemáticas sencillas
Ahora sabes realizar la estimación puntual de algunos parámetros, de modo que ya
tienes las bases necesarias para iniciar el estudio de los diseños factoriales.
Referencias bibliográficas
Gutiérrez, H. y De la Vara, R. (2008). Análisis y diseño de experimentos (2ª
ed.). México: McGraw Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa
Wiley.
Wolfram Alpha LLC. (2013). Wolfram|alpha: Computational knowledge
engine. Recuperado de http://www.wolframalpha.com/
Checkpoint
Asegúrate de comprender:
Las definiciones básicas y ventajas del diseño factorial 2 k y 3k.
Las ventajas del diseño factorial y cómo realizar una estimación puntual de
los efectos promedio y de las variables de respuesta.
Tema 13. Diseños factoriales 2k
Introducción
Para cerrar nuestro estudio de diseño de experimentos, analizaremos las
estructuras de las unidades experimentales y sus tratamientos tomando en cuenta
múltiples factores y sus niveles, ya que son los más comunes.
Recordemos que en la estructura 2k, k es el número de factores, en este caso el 2
es el número de niveles, por tanto, N= 2 k, donde N será entonces la representación
de todas las combinaciones o tratamientos de este experimento. Por ejemplo: si
k=4, entonces estaríamos experimentando con 16 combinaciones o tratamientos.
Comenzaremos por ejemplificar un diseño completo de factoriales 2 k, lo cual nos
indica que buscaremos el estudio de 2 niveles de k factores como estrategia para
encontrar la precisión requerida del proceso o producto al mínimo costo.
Al tomar en cuenta el enfoque económico, el diseño 2 2, donde tendríamos el
estudio de 2 niveles de 2 factores y su interacción. De tal forma que es importante
seleccionar cuáles de todos los factores que afectan al resultado tienen un efecto
relevante, causen efecto diferente o de mayor importancia para la respuesta de
interés.
En este tema abundaremos en el estudio del diseño factorial 2 2, dando un ejemplo
completo con la interpretación de sus resultados.
13.1 Diseños factoriales 22
El caso más general, conocido como 22, es cuando tenemos solo dos factores, A y
B, de tal suerte que la combinación de ellos estará dada por su correspondiente
producto: . De tal forma que cada réplica (n) consistirá en 2 x 2 = 4
tratamientos. Es decir, si en el experimento se decide que de cada tratamiento se
llevará a cabo la medición tres veces, decimos que tenemos un experimento de 3
réplicas, por tanto, tendríamos que analizar 4 (tratamientos) x 3 (réplicas) = 12
tratamientos en total.
De aquí que este tipo de diseño experimental es llamado diseño factorial .
Como en todo sistema binario, los niveles pueden ser designados como”0 (cero)” o
“1 (uno)”, “alto” o “bajo”, “+” o “-“, A o B, etc.
La representación gráfica del diseño factorial 22 está representada por un
cuadrado conocido como región experimental y en cada uno de los vértices se
representa un punto del diseño y su interacción.
Como vimos en el ejemplo del tema anterior, tenemos dos factores: presión, con
dos niveles continuos (700 – 600psi) y velocidad, con dos niveles categóricos o de
atributo (rápido – lento).
Veremos los pasos para poder diseñar a partir de la selección de los factores,
niveles y réplicas el diseño de experimentos, cómo realizarlo e interpretarlo.
Tenemos en cuenta que nuestro interés se enfoca al interés de 3 efectos: efecto A,
efecto B y la interacción de éstos AB.
Gutiérrez (2012) propone la siguiente secuencia para llegar al ANOVA:
Diagrama 1. Proceso para llegar al ANOVA
Notación de Yates Efecto en A Efecto en B Efecto en AB
(tomando 1 grado de
libertad)
(1) - - +
a + - -
b - + -
ab + + +
Tabla 1. Notación de Yates y signos para calcular los efectos en el diseño factorial 2 2
En la tabla de signos se establece el contraste de los efectos tanto principales más
la interacción y es la resultante de la multiplicación de los signos, por ejemplo, en
el primer renglón tenemos que en 1 el efecto A tiene signo – o representa el nivel
bajo y lo mismo ocurre en 1 con el efecto B donde el signo es –, por tanto, al
multiplicar el efecto de la interacción nos arroja un + o efecto mayor. De ahí que
podemos entonces reescribir los llamados contraste por cada efecto, obteniendo:
Contrastes por efecto
Contraste A [a – b + ab – (1)]
Contraste B [-a + b + ab – (1)]
Contraste AB [-a – b + ab + (1)]
Tabla 2. Contrastes para realizar la prueba de un experimento a base de diseños factoriales 2 2
Dado que los diseños factoriales 22 suponen que k=2,para obtener el efecto medio
de cada contraste se toma la fórmula:
Asignamos a cada factor la siguiente notación estandarizada:
Efect
Factor Efecto medio
o
Factor A A
Factor B B
Interacció
n del
factor A AB
con el
factor B
Tabla 3. Efectos medios de los diseños factoriales 22
Para obtener las sumas de cuadrados en los efectos:
en este caso:
en la tabla resumimos con los
contrastes:
Suma de Cuadrado
Grados de libertad
cuadrados medio
Tabla 4. Fórmulas para los conceptos de la tabla ANOVA
Para realizar la prueba de un experimento a base de diseños factoriales 2 2 se
utiliza la tabla ANOVA mostrada a continuación:
Fuente Suma Grad
Cuadrad
de de os de
os
varian cuadrad libert
medios
za os ad
A P(F>F0)
B P(F>F0)
AB P(F>F0)
Error
Total
Tabla 5. Tabla ANOVA para realizar la prueba de un experimento a base de diseños factoriales 2 2
Ejemplo: Se desea estudiar el efecto del diámetro de un cilindro neumático (factor
A) y la presión (factor B) sobre la fuerza de carga del cilindro (respuesta). La
prueba será con 3 réplicas. Se utilizará para la prueba cilindros de 20mm y 25mm
y presiones de 400kPa y 600kPa.
Solución:
Factor Niveles Unidad
A Diámetro 20 25 mm
B Presión 400 600 kPa
Tabla 6. Propuesta de estudio.
Una vez que se tienen seleccionados los factores y los niveles, así como
determinadas las réplicas, se realiza físicamente la presión sobre los cilindros de
los dos diferentes diámetros, ya sea tres veces y se toman las medidas, las cuales
se organizan en la tabla de observaciones donde corresponde. Después, al ser tres
réplicas, se suman obteniendo el total.
A: B:
A B x1 X2 Fuerza, N Total
Diámetro Presión
333
20mm 400kPa - - -1 -1 113 104 116
(1)
25mm 400kPa + - +1 -1 174 151 162 487(a)
20mm 600kPa - + -1 +1 145 169 138 452(b)
25mm 600kPa + + +1 +1 244 226 276 746
(ab)
Tabla 7. Diseño y datos
Una vez con la tabla de Diseño y datos podemos calcular mediante las fórmulas o
bien el uso de algún software como Excel, Design Expert o bien Minitab, nuestro
cuadro ANOVA.
Solo para referencia por ejemplo en el caso de el efecto A los cálculos serían a
partir de los siguientes:
Haz clic para ver la información.
Pasos en Minitab para un diseño factorial
¿Es el proceso de los diseños factoriales 2 2 más complicado que, por ejemplo, los
cuadros latinos? Dado que este tipo de problemas se resuelve a través de un
cuadro ANOVA, la complejidad viene a ser la misma. Además, al
utilizar software como el Design Expert® los cálculos se simplifican muchísimo.
Esto no quiere decir que el problema no se pueda resolver con una hoja de cálculo.
Sin embargo, utilizando Design Expert® es posible obtener otros resultados:
1. En forma de ecuación como por ejemplo el modelo de regresión.
2. En forma de tabla como por ejemplo, los valores para el modelo de
regresión.
3. En forma gráfica como por ejemplo: la curva normal de los residuos o los
residuos en función de los predecibles o de contorno o en 3D para
superficies de respuesta.
13.2 Diseños factoriales 23
Aunque el caso más general es cuando tenemos solo dos factores, A y B, se
pueden dar dos situaciones:
1. Se puede desear estimar la respuesta al aumentar un factor adicional.
2. De origen el problema presenta no dos sino tres factores.
Por ejemplo: la velocidad del motor del automóvil depende del octanaje de la
gasolina, de la chispa de las bujías y del grado de mezcla con el aire.
De tal suerte que la combinación de ellos estará dada por su correspondiente
producto: .
De aquí que este tipo de diseño experimental es llamado diseño factorial 23.
Como en todo sistema binario, los niveles pueden ser designados como “0 (cero)”
o “1 (uno)”, “alto” o “bajo”, “+” o “-“, A o B, etc.
I A B C AB AC BC ABC
(1) + - - - + + + -
a + + - - - - + +
b + - + - - + - +
ab + + + - + - - -
c + - - + + - - +
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +
Tabla 2. Signos para calcular los efectos en el diseño factorial 2 2
Fuente
de Grados
Suma de Grados
variación de F 0 Valor_P
cuadrados medios
libertad
AB
AC
BC
ABC
Error
Total
Tabla 3. Tabla ANOVA para realizar la prueba de un experimento a base de diseños factoriales 2 2
Fuente
de Contraste
variación
AB
AC
BC
ABC
Tabla 4. Contrastes para realizar la prueba de un experimento a base de diseños factoriales 2 3
Tabla 5. Fórmulas para los conceptos de la tabla ANOVA
Para solucionarlo en Minitab se tienen que seguir los mismos pasos, incluso en la
interpretación, simplemente establecer si algún factor tiene un efecto
significativamente diferente que el resto.
13.3 Diseños factoriales
Pareciera que andar en bicicleta es solo un deporte de pista o de montaña, pero
además de lo deportivo ¿Qué experimentación puede realizarse “pedaleando” una
bicicleta?
Sería prácticamente interminable si nos ponemos a contar los factores que afectan
la velocidad de una bicicleta y por lo tanto el tiempo del recorrido.
Afortunadamente se cuenta con diseños factoriales mayores a oa .
Este es el diseño factorial en la que se supone que k es mayor a tres.
Significa k factores con 2 niveles cada uno.
efectos.
Montgomery (2012) propone el siguiente procedimiento para realizar el análisis
:
Estima los efectos de los
1
factores
2 Forma el modelo inicial
3 Realiza la prueba estadística
4 Refina el modelo
5 Analiza resultados
6 Interpreta resultados
Tabla 8. Procedimiento de análisis para un diseño 2k
El cálculo del k_ésimo contraste se calcula con la fórmula:
La fuente de variación, la suma de cuadrados y los grados de libertad para el
diseño se presentan en la siguiente tabla:
Grad
Suma de os de
Fuente de variación
cuadrados libert
ad
Tabla 9. Tabla ANOVA para un diseño 2k (parcial)
Ejemplo: Kandaswamy y Selvaraj (2000) nos presentan un ejemplo del diseño
factorial 2k para k=4 a través de un diseño experimental que determina los
factores que afectan el tiempo para andar en bicicleta a través de un experimento
“bicicletero”.
Solución:
Los factores y sus niveles están descritos en la siguiente tabla:
Niveles
Factor Unidad
Bajo Alto
Presión en las
A 40 60 psi
llantas
B Engranaje Bajo Alto
Altura del
C 36 42 Pulgadas
asiento
Dirección del En A
D
viento contra favor
Tabla 11. Los factores y sus niveles están descritos en la siguiente tabla
La ecuación de regresión obtenida con el Design
Expert® se muestra a continuación:
Tiempo = 134.55 - 6.34*A – 9.69*B – 4.49*C –
2.16*D – 2.41*AB – 1.52*BD
El ANOVA obtenida con el Design Expert® se muestra a continuación:
Grados Prob
Suma de Cuadrados Valor
de >F
Fuente Cuadrados libertad Medios F
Bloque 6.5664063 1 6.56640625
<
Modelo 2674.1984 6 445.6997396 87.76338 significant
0.0001
<
A 644.01751 1 644.0175063 126.8144
0.0001
<
B 1502.1438 1 1502.143806 295.7893
0.0001
<
C 322.83106 1 322.8310563 63.56913
0.0001
D 74.952306 1 74.95230625 14.75897 0.0049
AB 93.074256 1 93.07425625 18.32739 0.0027
BD 37.179506 1 37.17950625 7.32107 0.0268
Residuos 40.6274 8 5.078425
Total 2721.3922 15
Tabla 12. Tabla ANOVA con los resultados de la prueba del experimento a base de diseños factoriales
24
Conclusiones: Dado que todos los valores de (Prob > F) < 0.05 se concluye que
todos los factores son significativos.
Se recomienda consultar a Kandaswamy y Selvaraj (2000) para un análisis más
detallado de:
1. Media gráfica normal.
2. Gráfica normal de residuos.
3. Gráfica de residuos contra corridas.
4. Gráfica de residuos contra predichos.
5. Gráfica de residuos contra presión del aire.
6. Gráfica de residuos contra engranaje.
7. Gráfica de residuos contra altura del asiento.
8. Gráfica de residuos contra presión del aire.
9. Gráfica de residuos contra dirección del viento.
10. Gráficas de interacciones.
11. Tabla de factores R.
Cierre:
Es cierto que cuando realizamos
experimentos factoriales esperamos que alguno de los efectos fuera más
importante que otro, trabajando con todas las combinaciones posibles y
valorándolas a través de los tratamientos donde la estadística habla, podemos
obtener resultados precisos y sustentados. Como pudimos ver en ocasiones
factores que no precisábamos tan importantes, juegan papeles de cambio y otras
todos los factores estimulan un efecto en la respuesta. También es posible que la
interacción entre dos factores indique que el efecto que tenga uno de los factores
puede depender de del nivel de otro factor en observación, es decir la interacción
tiene un efecto más significativo que los factores trabajando de forma
independiente. Una estrategia de suma importancia es la habilidad que desarrolle
el experimentador para una buena interpretación de los datos, sin perder de vista
el objetivo de estudio y el resultado deseado.
Referencias bibliográficas:
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª
ed.). México: McGraw- Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa
Wiley.
Kandaswamy, P. y Selvaraj, V. (2000). Estudio de los factores que afectan el
tiempo para andar en bicicleta a través de un experimento bicicletero.
Recuperado de
http://www.wiley.com/legacy/college/engin/montgomery316490/proj/bikes.d
oc
Checkpoint
Asegúrate de comprender:
Los conceptos relacionados con los diseño factoriales 2 k.
Los procedimientos para realizar el análisis del diseño factorial 2 2, 23 y 2k y
su solución con el softwareMinitab.
Tema 14. Diseños factoriales 3k
Introducción
Un diseño factorial en el que se tengan
más de 2 factores con más de 3 niveles, puede ser resuelto con un diseño factorial
3k. Así que, si deseamos fabricar un pastel de más de 2 pisos y con más de 10
ingredientes diferentes puede ser que la receta 2 k no sea suficiente, así que
optamos por cambiar de opción: el diseño factoriales 3 k.
Igual que con el diseño 2k los diseños factoriales 3k se utilizan sí:
1. Hay más factores que en el 2k.
2. Deseamos conocer la respuesta en función de la combinación de varios
factores.
3. Si existen factores cuantitativos y cualitativos.
Si consideramos tres niveles en cada factor y tomamos k factores en
consideración, la combinación de ellos estará dada por su correspondiente
producto: .
Explicación:
14.1 Diseños factoriales 32
significa que el experimento se realiza con 2 factores (A y B) y con 3 niveles
cada uno (0, 1 y 2).
Para este diseño el número de efectos se calcula con la fórmula:
Donde yi está representando el efecto del factor A en el nivel i, δ representan a B
en el nivel j y, por supuesto, la intersección.
Una estructura de diseño factorial 3k establece que el experimento se llevará a
cabo tomando en cuenta dos factores con tres niveles cada uno y las
combinaciones entre estos, de tal forma que serían 3 x 3 = 9 tratamientos.
El diseño factorial 3k tiene una gran ventaja frente al diseño factorial 2 k, al permitir
estudiar los efectos cuadráticos en añadidura a los efectos lineales, no identifica
cuáles son los factores más importantes y define con precisión el efecto sobre la
resultante.
Otra característica por la que resulta ser una alternativa muy completa es por su
dinámica al examinar datos continuos o datos categóricos:
a. En el caso de tener datos continuos se pueden, si se requiere, estudiar
efectos cuadráticos (A2, B2, A2B, B2A, A2B2…).
b. En el caso de datos categóricos, se pueden estudiar tres niveles, que en
general se tienen, como, por ejemplo, tres proveedores, tres distintas
marcas, máquinas, etcétera.
El siguiente dibujo nos muestra las posibles combinaciones y los efectos:
Dibujo 1. Combinación de tratamientos en un diseño 32
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México. Limusa Wiley.
Gutiérrez y De la Vara (2012), organizan la información con una tabla de tres
notaciones, donde los factores son A - B y los niveles (alto, medio y bajo).
Tratamiento A B A B A B
1 Bajo Bajo -1 -1 0 0
2 Medio Bajo 0 -1 1 0
3 Alto Bajo 1 -1 2 0
4 Bajo Medio -1 0 0 1
5 Medio Medio 0 0 1 1
6 Alto Medio 1 0 2 1
7 Bajo Alto -1 1 0 2
8 Medio Alto 0 1 1 2
9 Alto Alto 1 1 2 2
Tabla 1. Grados de libertad en un diseño 32
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª ed.). México: McGraw-Hill.
Para realizar la prueba de un experimento a base de diseños factoriales 32 se
utiliza la tabla ANOVA mostrada a continuación:
Fuente de Suma de Grados de Cuadrados
F0 Valor _P
varianza cuadrados libertad medios
A SSA 2 MSA P(F>F0)
B SSB 2 MSB P(F>F0)
AB SSAB 4 MSAB P(F>F0)
Error SSE 32 (n-1) MSR
Total SST n32-1
Tabla 2. ANOVA Diseño factorial 32
De tal forma que la suma de cuadrados se calculará:
La suma de cuadrados total se obtiene:
El error cuadrático se obtiene:
Ho: A = 0 no hay efecto significativo en el factor A sobre la variable de respuesta.
Ho: B = 0 no hay efecto significativo en el factor B sobre la variable de respuesta.
Ho: AB = 0 no hay efecto de la interacción de los factores A y B sobre la variable
de respuesta.
Ha: Sí hay efecto significativo en el factor observado sobre la variable de
respuesta.
Solución:
Ejemplo: En una empresa de empastado de libros desean realizar un experimento
para asegurar una mejor adherencia del pegamento realizando un estudio del
efecto que puede ejercer la temperatura y la humedad para tal caso. Se buscó
como resultante la fuerza necesaria para despegar las hojas de la pasta. Los
resultados se muestran en la siguiente tabla:
Temperatura (A)
Humedad (B) Caliente Medio Frío Total
40% 13.2 12.9 12.3 75.5
13.2 12.5 11.4
65% 14.7 14.5 14 86.8
15 14.5 14.1
90% 16 14.6 13.3 88.2
16.1 14.3 13.9
TOTAL 88.2 83.3 79 250.5
Tabla 3.
Enseguida, calcular el cuadrado medio de suma de cuadrados, divides entre los
grados de libertad de cada factor, el resultado lo divides entre la suma de
cuadrados del error correspondiente y obtendrás la que llamamos F calculada (F0).
Este valor se compara con la F de la tabla Fisher y utilizas los criterios expuestos
en la tabla.
Como hemos comentado, hay varios softwares que puedes utilizar, como SPSS,
Design expert, el mismo Excel y, por supuesto, Minitab.
Haz clic para ver la información.
Pasos en Minitab para un diseño factorial
14.2 Diseños factoriales 33
significa 3 factores con 3 niveles cada uno, efectos.
Dibujo 1. Combinación de tratamientos en un diseño 33
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa Wiley.
Grados de libertad:
1. Observamos que existen 27 combinaciones de tratamientos lo que nos da
26 grados de libertad.
2. Cada efecto medio tiene 2 grados de libertad.
3. Cada interacción de dos factores tiene 4 grados de libertad.
4. Cada interacción de tres factores tiene 8 grados de libertad.
5. En total existen grados de libertad para n réplicas.
6. Para el error existen grados de libertad.
Ejemplo: Purvis y Gallagher (2000) nos presentan el siguiente ejemplo del diseño
factorial 33 a través de un diseño experimental para establecer unos valores
nuevos de la potencia, la presión y la relación de gas que serán utilizados en un
nuevo ajuste de 1.2cm.
Solución:
Se establecen los niveles bajo, medio y alto:
Niveles
Unida
Factor
d
Baj Medi Alt
o o o
A Potencia 600 750 900 W
B Presión 300 385 470 mT
CF4:CHF
C 1.8 2.2 2.6
3
Tabla 4. Los factores y sus niveles están descritos en la siguiente tabla.
Se introducen los datos en el Design Expert® obteniendo el siguiente resultado:
Grados
Fuente de Suma de de Cuadrados Valor_
F
variación cuadrados liberta medios p
d
Bloque 43560.00 1 43560.00
9.315E+00 4.657E+00 242.9 < significativ
Modelo 2
6 6 3 0.0001 o
1.674E+00 1.674E+00
A 1 87.34 0.0002
6 6
7.640E+00 7.640E+00 398.5 <
B 1
6 6 3 0.0001
NO
Curvatur
4120-90 1 4120-90 0.21 0.6624 significativ
a
o
Residuos 95855.00 5 19171.00
9.458E+00
Cor Total 9
6
Tabla 5. Resultado del ANOVA
Se genera el modelo de regresión:
Conclusiones:
1. Dado que (Valor_p del Modelo) < 0.01 se concluye que es significativo.
2. Dado que (Valor_p de A) < 0.01 se concluye que es significativo.
3. Dado que (Valor_p de B) < 0.01 se concluye que es significativo.
4. Dado que (Valor_p de la Curvatura) > 0.01 se concluye que es no es
significativo.
Se recomienda consultar el documento original (Purvis y Gallagher, 2000) para un
análisis más detallado.
14.3 Diseños factoriales 3k
significa k factores con 3 niveles cada uno. efectos.
Lo estudiado en los diseños 32 y 33 puede ser utilizado para el diseño factorial 3 k.
Montgomery (2012) nos indica que en el caso de k = 4, se utiliza la notación 0120
para la combinación de tratamientos con los factores A y D a los niveles bajos, B al
nivel medio y C al nivel alto.
Existen combinaciones de tratamientos.
Existen grados de libertad entre ellos.
Ejemplo: Crear un diseño factorial para k = 4.
Solución:
Utilizando Minitab, seguimos la secuencia:
Estadísticas → DOE → Factorial → Crear diseño factorial:
1. Diseño factorial completo general
2. Número de factores = 4
3. Diseños:
a. Número de niveles (A=3; B=3; C=3; D=3)
b. Número de réplicas = 1
c. Aceptar
4. Factores:
a. Introducir los 12 valores
b. Aceptar
5. Resultados
a. Tabla de resumen y tabla de diseño
b. Aceptar
6. Aceptar
Resultados:
Diseño factorial de múltiples niveles
Factores: 4 Réplicas: 1
Corridas base: 81 Total de corridas: 81
Bloques base: 1 Total de bloques: 1
Número de niveles: 3, 3, 3, 3
Tabla de diseño (aleatorizada)
Una vez organizado el diseño se procede al análisis de varianza, como se ha visto
en los temas anteriores.
Cierre
Como puedes observar, una de las desventajas de utilizar el diseño 3k es que se
necesitan más pruebas para poder realizar los análisis, un ejemplo sería si se
realizara un experimento con 4 factores y 3 niveles (34), dictarían 81 tratamientos.
Como comentamos, la posibilidad que ofrece este tipo de diseños factoriales, en
los cuales se evalúa no solo el efecto lineal, sino que mediante el estudio de
contrastantes de promedios puedes determinar la existencia de efectos
cuadráticos en tu experimento y la interpretación de este.
Es muy importante, como has notado, identificar muy bien el objetivo del
experimento para poder, entonces, una vez en conocimiento que los factores sí
son significativos, interpretar los resultados y de aquí definir cuál combinación es
la más eficiente y adecuada para el efecto del resultado deseado.
Referencias bibliográficas
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías. México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley.
Pitarque, A. (2003). Métodos y diseños de investigación. Recuperado de
http://www.uv.es/pitarque/TRANSPARENCIAS.pdf
Purvis, D. y Gallagher, M. (2000). Plasma etch tool gap distance DOE final
report. Recuperado de
http://www.wiley.com/legacy/college/engin/montgomery316490/proj/plasma
_text.doc
Checkpoint
Asegúrate de comprender:
Los conceptos relacionados con los diseños factoriales 3 k.
Los procedimientos para realizar el análisis del diseño en simuladores.
Los procedimientos para realizar el análisis del diseño factorial 3 2 , 33 y 3k y
su solución con el softwareMinitab.
Explicación del tema 15
Tema 15. Diseños factoriales fraccionados
Introducción
Algunos experimentos se ven limitados por el recurso disponible, en especial el
presupuesto económico y el tiempo que demandan, puesto que requiere el estudio
de gran cantidad de factores. El diseño factorial fraccionado facilita el desarrollo en
estos casos, mediante la reducción de tratamientos estudiados.
Esta reducción no se puede realizar simplemente al azar, es importante que sean
seleccionadas aquellas fracciones de tratamientos relevantes para estimar los
efectos de notable interés.
Es decir, se utiliza una “fracción” de los tratamientos.
Estas pantallas se obtuvieron directamente del software que se está explicando en la computadora,
para fines educativos
1. La fracción ½ del diseño 2k.
2. La fracción ¼ del diseño 2k.
3. Y aún decidir por un diseño factorial fraccionado general 2 k-p si la cantidad de
factores y sus relaciones lo justifican.
Explicación:
15.1 Fracción ½ del diseño 2k
Cuando crece el número de factores, de tal forma que por ejemplo si k = 6 se
necesitan 64 corridas con 63 grados de libertad distribuidos de la siguiente forma:
1. 6 para los efectos medios.
2. 15 para las interacciones entre dos factores.
3. 42 para las interacciones entre tres factores.
Podemos observar que la mayoría de los grados de libertad corresponden a las
interacciones entre tres factores (42), de tal forma que el diseñador puede llegar a
considerar que no son significativos y realizar el diseño solo con los efectos medios
y las interacciones entre dos factores; a este tipo de diseño se le conoce como
fracción ½ del diseño 2k-1, es decir, que la fracción a tomar del diseño factorial
completo será la mitad.
Gutiérrez y De la Vara (2012) muestran la siguiente tabla donde expresan los
efectos que pueden ser ignorados sin perder información clave para la eficiente
interpretación del experimento:
Diseño 2 k
Total de efectos Efectos no Efectos ignorables
ignorables
22
3 3 0
23
7 6 1
24
15 10 5
25
31 15 16
26
63 21 42
27
127 28 99
Tabla 1. Efectos en los factoriales 2k
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª ed.). México: McGraw-Hill.
A partir del diseño de 5 factores, vemos que los efectos ignorables que
representan a los importantes potenciales, son mayores a los efectos no
ignorables, esto manifiesta que al fraccionarse no pierden información relevante.
Ejemplo: un laboratorio químico-biológico se interesa en experimentar para
conocer la reacción que causan 5 diferentes factores sobre un antídoto. Al no
contar con los recursos para el experimento completo, entonces se decide correr
un diseño factorial fraccionado, por tanto, se decide disminuir de un experimento
factorial 25, donde se tendría que estudiar 32 tratamientos a fraccionar, tomando
entonces 25-2 y se construye la factorial fraccionado 2 3 = 8 tratamientos, podemos
ver que se tomarán solamente ¼ del diseño completo, quedando el experimento
constituido de la siguiente manera:
Tratamiento A B C AB AC BC ABC Yijl
1 -1 -1 -1 1 1 1 -1 Y111
2 1 -1 -1 -1 -1 1 1 Y211
3 -1 1 -1 -1 1 -1 1 Y121
4 1 1 -1 1 -1 -1 -1 Y221
5 -1 -1 1 -1 1 -1 1 Y112
6 1 -1 1 -1 1 -1 -1 Y212
7 -1 1 1 -1 -1 1 -1 Y122
8 1 1 1 1 1 1 1 Y222
Tabla 2. Esquema completo codificado de factorial 23
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y análisis en ciencias e
ingenierías. México: Alfaomega.
Entonces podemos observar que nuestro experimento consta de tres factores y
dos niveles (1 y -1); para fraccionar buscaremos ignorar algunos tratamientos
marcados en la interacción ABC con el nivel menor -1. De tal forma que solamente
tomamos en cuenta las lecturas del nivel mayor +1, los cuales son tratamientos: 2,
3, 5 y 8, esto se plantea como “generador I = +ABC”.
Por tanto, una vez contemplando únicamente los tratamientos dentro del
generador +ABC, realizamos la tabla codificado a partir de la vista anteriormente:
Tratamiento A B C AB AC BC ABC Yijl
2 1 -1 -1 -1 -1 1 1 Y211
3 -1 1 -1 -1 1 -1 1 Y121
5 -1 -1 1 -1 1 -1 1 Y112
8 1 1 1 1 1 1 1 Y222
Tabla 2. Esquema completo codificado de factorial 23
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y análisis en ciencias e
ingenierías. México: Alfaomega.
Consideremos que los factores y niveles son los siguientes:
Factor Nivel mayor 1 Nivel menor -1
A: Temperatura 60 oC 85 oC
B: Fermento 15 35
C: Elemento reactivo 10% 30%
D: Adición de componentes 65.88 60.75
E: Tiempo de mezclado 180 90
Haz clic para ver la información.
Pasos en Minitab para un diseño factorial
15.2 Fracción ¼ del diseño 2k
Otro diseño factorial para un gran número de factores es el de la fracción ¼ del
diseño 2k.
Debido a que la fracción ¼ del diseño 2k contiene 2k-2 corridas se le conoce como
diseño factorial fraccionado 2k-2.
Ejemplo: Tomando como referencia el ejemplo que presenta Montgomery (2012),
se decide hacer un diseño para determinar los factores que influyen en la merma
del proceso de inyección por molde.
Solución:
Primero determinó los factores a analizar:
1. A: Temperatura del molde.
2. B: Velocidad del tonillo.
3. C: Tiempo de retención.
4. D: Tiempo del ciclo.
5. E: Tamaño de la compuerta.
6. F: Presión de sujeción.
Como segundo paso decidió realizar un diseño
Primero se realiza la tabla para la construcción del diseño con los
Generadores I=ABCE e I=BCDF:
Diseño Básico
Merma
Corrida E=ABC F=BCD
(x10)
A B C D
- - - - - - -
- + - - - + -
- - + - - + +
+ + + - - - +
+ - - + - + +
+ + - + - - +
+ - + + - - -
8 + + + - + -
9 - - - + - +
10 + - - + + +
11 - + - + + -
12 + + - + - -
13 - - + + + -
14 + - + + - -
15 - + + + - +
16 + + + + + +
Tabla 2. Construcción del diseño con los Generadores I=ABCE e I=BCDF
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa Wiley.
A continuación se realizan las observaciones de la merma y se registran en la
columna Merma (x10).
Se introducen los datos a nuestro sistema de cálculo y obtenemos los resultados:
1. Función de regresión:
2. Para un análisis más detallado de los Efectos, Suma de Cuadrados y los
demás Coeficientes de Regresión se recomienda consultar la referencia de
Montgomery (2012).
15.3 Diseño factorial fraccionado general 2k-p
En el caso de necesitar o separar los tratamientos en fracciones más pequeñas se
denomina 2k-p, donde p=1 se dice que tenemos un generador y se obtendrá media
corrida para el experimento, en el caso en que p=2, podremos tener dos
generadores, lo cual nos permite un cuarto de tratamientos a estudio. Cabe
mencionar que son múltiplos de 4.
Debido a que la fracción ½ p del diseño 2k contiene 2k-p corridas, se le conoce como
diseño factorial fraccionado 2k-p.
Pensemos en una fábrica de barredoras industriales, cuyo objetivo es remover el
material de rebabas remanente en el maquinado, la barredora que realiza dicha
labor se mide por la cantidad de basura retirada del área; cinco factores son
expuestos como significativos para el buen funcionamiento de las barredoras y se
contemplan dos niveles.
El diseño nos indica un factorial tipo 25, lo cual indica 32 tratamientos, si solo se
autoriza un presupuesto y el tiempo para poder realizar máximo 8 corridas, la
opción será fraccionar a ¼ : teniendo la opción de obtener dos
generadores de control.
Haz clic para ver la información.
Pasos en Minitab para un diseño factorial
Cierre:
¡Felicidades!
Has terminado el estudio de los temas de la materia de Diseño de experimentos.
A través del curso de Diseño de experimentos podemos entender la importancia
del estudio de productos, procesos e información para la mejora continua,
podemos lograr una operación efectiva, eficiente con mejores resultados en
calidad y productividad a partir de diferentes experimentos, encontrando la mejor
interacción de los factores y los niveles para incluir en el proceso aquellos
tratamientos que afecten al resultado de la forma esperada.
Esta competencia hará que tomes mejores y prácticas decisiones mediante el
desarrollo de tu capacidad de análisis e interpretación, por lo cual es importante
que busques poner en práctica tus habilidades. Recuerda que el integrar
conocimientos te dará oportunidad de sobresalir y dirigirte con facilidad al
cumplimiento de tus objetivos, por lo tanto, de tu propósito. ¡Ánimo!
Referencias bibliográficas:
Domínguez, J., y Castaño, E. (2016). Diseño de Experimentos: Estrategias y
análisis en ciencias e ingenierías.México: Alfaomega.
Gutiérrez, H., y De la Vara, R. (2012). Análisis y diseño de experimentos (3.ª
ed.). México: McGraw-Hill.
Montgomery, D. (2012). Diseño de experimentos (2ª ed.). México: Limusa
Wiley.
Checkpoint
Asegúrate de comprender:
Los conceptos: fracción ½ p del diseño 2k, 2k-p corridas, fuente de variación,
suma de cuadrados, grados de libertad, el estadístico F y el valor_p.
Los conceptos relacionados con los diseños factoriales fracción ½ p del
diseño, con 2k-p corridas.
Los procedimientos para realizar el análisis del diseño factorial fracción ½
del diseño 2k, fracción ¼ del diseño 2k, diseño factorial fraccionado general
2k-p y su solución con el Minitab.