MINITAB
MINITAB
• Estadísticos Descriptivos
• Una Muestra
• Varias Muestras
• Tablas con Resúmenes
Sesión 1
Interfaz y
Generalidades
de Minitab
¿Qué es Minitab?
• Minitab es un software estadístico creado hace más de 50 años por Bárbara Ryan y dos
colegas de la Universidad de Penn State, con el objetivo de realizar cálculos estadísticos de
manera que los estudiantes pudieran concentrarse más en las aplicaciones estadísticas y
menos en los cálculos matemáticos.
• Se ha convertido en el líder del mercado en cuanto a la analítica que se aplica en las áreas de
calidad y mejora continua.
• Hasta el día de hoy, las soluciones de Minitab ayudan a las empresas a abordar una amplia
gama de desafíos, que van desde las iniciativas de transformación digital a gran escala hasta
proyectos centrados en la mejora de la cadena de suministro o la eliminación de costos en un
área específica.
Productos de Minitab
Interfaz y Generalidades de Minitab
Interfaz y Generalidades de Minitab
Barra de Menús
Botones Acceso Rápido
Historial
Área de Resultados
Hoja de Trabajo
Botones de Acceso Rápido
Estadísticos
Descriptivos
para una
Muestra
Clasificación de la Estadística
• Estadística Descriptiva
• Proporciona un resumen conciso de los datos, los cuales se pueden de
forma numérica o gráfica
• Estadística Inferencial
• Utiliza una muestra aleatoria de datos tomada de una población para
describir y hacer inferencias acerca de la población. Los estadísticos
inferenciales son valiosos cuando no es conveniente o posible examinar
cada miembro de una población entera.
Estadísticas Básicas
Estadísticas Básicas
• Mostrar Estadísticos Descriptivos
• Permite resumir datos numéricos con una variedad de estadísticos, como el tamaño de la
muestra, la media, la mediana y la desviación estándar. Este análisis también proporciona
gráficas de los datos.
• Almacenar Estadísticos Descriptivos
• Además de mostrar los estadísticos descriptivos, permite almacenar los resultados en la
hoja de trabajo.
• Resumen Gráfico
• Además de presentar un resumen con los estadísticos descriptivos más relevantes, permite
describir la distribución de los datos con gráficas, realiza una prueba de normalidad
Anderson-Darling y obtiene intervalos de confianza para la media, la desviación estándar y
la mediana.
Mostrar Estadísticos Descriptivos
Ruta: Estadísticas / Estadísticas Básicas / Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
• Media
• Describe la muestra con un solo valor que representa el centro de los datos. Muchos
análisis estadísticos utilizan la media como una medida estándar del centro de la
distribución de los datos.
• Error Estándar de la Media
• Determina el grado de precisión con el que la media de la muestra estima la media de la
población.
• Desviación Estándar
• Determina qué tan dispersos están los datos con respecto a la media.
• Varianza
• Determina qué tan dispersos están los datos con respecto a la media. La varianza es igual a
la desviación estándar elevada al cuadrado.
Mostrar Estadísticos Descriptivos
• Coeficiente de Variación
• Es una medida de dispersión que describe la variación en los datos en relación con la
media. El coeficiente de variación se ajusta de manera que los valores estén en una escala
sin unidades. Gracias a este ajuste, es posible utilizar el coeficiente de variación en lugar de
la desviación estándar para comparar la variación de los datos que tienen unidades
diferentes o medias muy diferentes.
• Rango
• Diferencia entre los valores más grande y más pequeño de los datos. El rango representa el
intervalo más pequeño que contiene todos los valores de los datos.
• Suma
• Total de todos los valores de los datos.
Mostrar Estadísticos Descriptivos
• Mínimo
• Valor de datos más pequeño en la muestra. Se puede utilizar para identificar un posible
valor atípico o un error de entrada de datos. Una de las maneras más sencillas de evaluar la
dispersión de los datos consiste en comparar el mínimo y el máximo.
• Primer Cuartil
• 25% de los valores de los datos en la muestra son menores que el valor del primer cuartil.
• Mediana
• La mediana es otra medida del centro de la distribución de los datos. Por lo general, los
valores atípicos influyen menos en la mediana que en la media. La mitad de los valores de
los datos es mayor que el valor de la mediana y la mitad de los valores de los datos es
menor que el valor de la mediana.
Mostrar Estadísticos Descriptivos
• Tercer Cuartil
• El 25% de los valores de datos de la muestra son mayores que el valor del tercer cuartil.
• Máximo
• El máximo es el valor de datos más grande en la muestra. Es posible emplear el máximo
para identificar un posible valor atípico o un error de entrada de datos. Una de las maneras
más sencillas de evaluar la dispersión de los datos consiste en comparar el mínimo y el
máximo.
• Rango Intercuartílico
• El rango intercuartil (IQR) es la distancia entre el primer cuartil (Q1) y el tercer cuartil (Q3).
Se puede emplear para describir la dispersión de los datos. A medida que aumenta la
dispersión de los datos, el IQR se hace más grande
Mostrar Estadísticos Descriptivos
• Moda
• Describe un conjunto entero de observaciones con un valor individual que representa el
valor más común en la muestra. Es posible emplearla con la media y la mediana para
obtener una caracterización general de la distribución de los datos.
• N Valores Presentes
• El número de valores presentes en la muestra. Minitab muestra este valor en la salida
como N.
• N Valores Ausentes
• El número de valores faltantes en la muestra. El número de valores faltantes se refiere a las
celdas que contienen el símbolo de valor faltante *. Minitab muestra este valor en la salida
como N*.
Mostrar Estadísticos Descriptivos
• N Total
• El número total de observaciones en la columna. Se usa para representar la suma de N
valores faltantes y N valores presentes. Minitab muestra este valor en la salida como
Conteo total.
• N Acumulado
• Total acumulado del número de observaciones en categorías sucesivas.
• Por Ciento
• Representa la contribución de una categoría al todo. El porcentaje se calcula
dividiendo la frecuencia de esa categoría entre la frecuencia total y multiplicándola
por 100.
Mostrar Estadísticos Descriptivos
• Porcentaje Acumulado
• Es la suma de todos los valores porcentuales hasta esa categoría, en comparación con los
porcentajes individuales de cada categoría.
• Media Recortada
• Se emplea para eliminar el impacto de los valores muy grandes o muy pequeños sobre la
media. Cuando los datos contienen valores atípicos, la media recortada puede ser una
mejor medida de la tendencia central que la media.
• Suma de Cuadrados
• La suma de los cuadrados no corregida se calcula elevando al cuadrado cada uno de los
valores de la columna y luego sumando esos valores elevados al cuadrado. A diferencia de
la suma de los cuadrados corregida, la suma de los cuadrados no corregida incluye el error.
Los valores de datos se elevan al cuadrado sin antes restar la media
Mostrar Estadísticos Descriptivos
• Asimetría
• Determina el grado en que los datos no son simétricos.
• Curtosis
• Determinar el grado en que los datos alcanzan su valor máximo, en comparación con una
curva normal.
• Media de las Diferencias Sucesivas Cuadráticas (MSSD)
• Es una estimación de la varianza. Un posible uso de la MSSD es para probar si una
secuencia de observaciones es aleatoria. En control de calidad, un posible uso de la MSSD
es para estimar la varianza cuando el tamaño del subgrupo = 1
Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
• Histograma de Datos
• Se emplean para evaluar la forma y
dispersión de los datos. Funcionan mejor
cuando el tamaño de la muestra es
mayor que 20.
• Histograma de Datos con Curva
Normal
• Además de presentar el histograma
general, La curva normal sobrepone una
curva de distribución normal a los datos.
Mostrar Estadísticos Descriptivos
• Gráficas de Valores Individuales
• Permite examinar la dispersión de los
datos e identificar cualquier posible
valor atípico. Funcionan mejor cuando el
tamaño de la muestra es menor que 50.
• Gráfica de Caja de Datos
• Permite examinar la dispersión de los
datos e identificar cualquier posible
valor atípico. Funcionan mejor cuando el
tamaño de la muestra es mayor que 20.
Estadísticos Descriptivos
• Práctica 1
• Estadísticos Descriptivos para una Muestra
Estadísticos Descriptivos para una Muestra
• Volvemos en 15 minutos
Mostrar Estadísticos Descriptivos
• Por Variables
• Si existen grupos en los datos,
ingresar “Por variables” para
explorar las diferencias entre los
grupos. Minitab calcula los
estadísticos descriptivos para cada
grupo por separado.
Estadísticos Descriptivos
• Práctica 2
• Estadísticos Descriptivos para Varias Muestras
Estadísticos Descriptivos para Varias Muestras
Calcule para cada muestra (sin envejecimiento y con envejecimiento), así como
para la totalidad de datos los estadísticos descriptivos manejados por Minitab y
obtenga conclusiones al respecto.
Estadísticos Descriptivos para Varias Muestras
• En el botón “Estadísticas…”
seleccionar los estadísticos
que se desea obtener.
• En el botón “Gráficas…”
seleccionar los gráficos que
se desea obtener.
• Dar clic en “Aceptar”
Estadísticos Descriptivos para Varias Muestras
Adultos Jóvenes
81 423 266 175 550 372
233 113 500 284 192 590
417 254 147 518 316 209
107 490 283 183 557 401
251 147 507 284 202 594
Calcule para cada muestra (sin envejecimiento y con envejecimiento), así como
para la totalidad de datos los estadísticos descriptivos manejados por Minitab y
obtenga conclusiones al respecto.
Estadísticos Descriptivos para Varias Muestras
Estadísticos Descriptivos
• Práctica 3
• Tablas con Resúmenes de Estadísticos Descriptivos y de Conteos Individuales
Tablas con Resúmenes de Estadísticos Descriptivos
• Preguntas
• Comentarios
• Quejas
• Sugerencias
• Traumas Estadísticos
Gracias Por su Asistencia
¡Excelente Lunes!
Sesión 2
• Análisis de Gráficos
• Relaciones entre pares de variables
• Comparación de distribuciones
• Comparación de resúmenes o valores individuales de una variable
• Evaluación de distribución de conteos
• Serie de datos en el tiempo
• Relaciones entre tres variables
Menú Gráfica
Gráficos para
examinar
relaciones entre
pares de variables
Gráficos para examinar relaciones entre pares de variables
El empleo de estas gráficas es explorar las relaciones entre uno o más pares de variables.
Por ejemplo, se puede evaluar lo siguiente:
➢ Gráfica de Dispersión *
➢ Gráfica de Matriz
➢ Gráfica de Burbujas
➢ Gráfica Marginal
Gráficos para examinar relaciones entre pares de variables
✓ Gráfica de Dispersión
• Práctica 4
• Gráficos para examinar relaciones entre pares de variables.
Gráfico de Dispersión
✓ Tipos
Gráficos para
examinar y
comparar
distribuciones
Gráficos para examinar y comparar distribuciones
El empleo de estas gráficas es evaluar y comparar propiedades de distribuciones, tales como:
✓ Dónde se centran los valores de la muestra.
✓ Si una distribución de muestra es simétrica o asimétrica.
✓ Si los datos de la muestra siguen una distribución específica.
✓ Cuántos picos existen en la distribución de muestra (más de un pico puede indicar que los
datos provienen de múltiples poblaciones).
✓ Cuáles son los valores observados más comúnmente en la muestra.
➢ Histograma *
➢ Gráfica de Puntos *
➢ Tallo y Hoja
➢ Gráfica de Probabilidad *
➢ CFD Empírica
➢ Gráfica de Distribución de Probabilidad
Gráficos para examinar y comparar distribuciones
✓ Histograma
• Práctica 5
• Gráficos para examinar y comparar distribuciones.
Histograma
✓ Tipos
• Un ingeniero especializado en control de calidad debe garantizar que las tapas de las
botellas de champú queden ajustadas correctamente. Si las tapas quedan flojas,
podrían caerse durante el envío. Si se aprietan demasiado, será difícil retirarlas. El
valor objetivo del par de torsión para ajustar las tapas es 18. El ingeniero recolecta una
muestra aleatoria de 68 botellas y prueba la cantidad de par de torsión que se necesita
para quitar las tapas.
• Como parte de la investigación inicial, se busca crear un histograma del par de torsión
para evaluar la distribución de los datos. Realice el gráfico correspondiente con apoyo
de Minitab.
Histograma Simple
• Como parte de la investigación inicial, se decide crear una gráfica de puntos para
comparar la elasticidad de las muestras. Realice la gráfica correspondiente con ayuda
del software Minitab.
Gráfica de Puntos (Una Y, Con Grupos)
Individual Múltiple
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Probabilidad Individual
• Un científico que trabaja para una empresa que produce alimentos procesados desea
evaluar el porcentaje de grasa de la salsa embotellada de la empresa. El porcentaje
anunciado es de 15%. El científico mide el porcentaje de grasa en 20 muestras
aleatorias.
• Como parte de la investigación inicial, se desea crear una gráfica de probabilidad para
verificar la normalidad y para evaluar la distribución. Realice la gráfica correspondiente
empleando el software Minitab.
Gráfica de Probabilidad Individual
Gráficos para
comparar
resúmenes o
valores individuales
de una variable
Gráficos para comparar resúmenes o valores individuales de una variable
Se emplean para comparar valores de resumen o valores de datos individuales. Por ejemplo,
se puede comparar lo siguiente:
✓ Las ventas medias trimestrales de cada uno de los productos de la compañía, por región.
✓ La viscosidad de la pintura producida en la planta de su compañía, por método de
mezclado.
➢ Gráfica de Caja *
➢ Gráfica de Intervalo
➢ Gráfica de Valores Individuales *
➢ Gráfica de Línea *
Gráficos para comparar resúmenes o valores individuales de una variable
✓ Gráfico de Caja
✓ Gráfico de Intervalos
✓ Gráfica de Líneas
• Práctica 6
• Gráficos para comparar resúmenes o valores individuales de una variable.
Gráfica de Caja
✓ Tipos
✓ Una Y
➢ Como parte de la investigación inicial, se crea una gráfica de valores individuales para
comparar la elasticidad de las muestras. Realizar el gráfico correspondiente
empleando Minitab.
Gráfica de Valores Individuales (Una Y – Con Grupos)
➢ El ingeniero crea una gráfica de línea con símbolos para comparar la resistencia media
de las fibras de los grupos y buscar posibles interacciones. Obtenga el gráfico
correspondiente empleando el software Minitab.
Gráfica de Líneas (Con Símbolos – Una Y)
➢ El ingeniero crea una gráfica de línea sin símbolos para comparar los patrones de
respuesta de las muestras de diferentes octanos.
Gráfica de Líneas (Sin Símbolos – Series o Columnas)
Gráficos para
evaluar la
distribución de
conteos
Gráficos para evaluar la distribución de conteos
Se emplean para graficar conteos de valores únicos. Por ejemplo, puede graficar lo siguiente:
✓ El número de cada tipo de defectos que causó el rechazo de las partes fabricadas.
✓ El número de votos que cada candidato recibió en una elección.
➢ Gráfica de Barras *
➢ Gráfica Circular *
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras
• Práctica 7
• Gráficos para evaluar la distribución de conteos.
Gráfica de Barras
✓ Tipos
Conglomerado Pila
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras (Conteo de Valores Únicos - Simple)
➢ En una fábrica de paraguas, los mangos de los paraguas se miden y luego se retiran de
la línea de ensamble si no cumplen con las especificaciones. Un informe diario indica
cuántos mangos rechazados fueron producidos por cada una de las tres prensas de la
fábrica durante cada uno de los tres turnos. Un ingeniero especializado en calidad
quiere determinar si la prensa y el turno están asociados. Como parte de la
investigación inicial, el ingeniero crea una gráfica de barras para comparar el número
de mangos rechazados para cada máquina y turno. Genere el gráfico correspondiente
empleando Minitab.
Gráfica de Barras (Valores Tabla 2 Factores - Conglomerado)
Gráficos para
analizar una serie
de datos en el
tiempo
Gráficos para analizar una serie de datos en el tiempo
Se emplean para ver patrones en los datos en el tiempo. Por ejemplo, es posible utilizar
estas herramientas para examinar las ventas mensuales de una empresa.
• Práctica 8
• Gráficos para analizar una serie de datos en el tiempo.
Gráfica de Series de Tiempo
✓ Tipos
Gráficos para
examinar
relaciones entre
tres variables
Gráficos para examinar relaciones entre tres variables
Se emplean para ver tres variables en una misma gráfica. Por ejemplo, puede evaluar cómo
la temperatura y la humedad afectan los tiempos de secado de una pintura.
➢ Gráfica de Contorno
➢ Gráfica de Dispersión 3D
➢ Gráfica de Superficie 3D *
Gráficos para examinar relaciones entre tres variables
✓ Gráfica de Contorno
• Práctica 9
• Gráficos para examinar relaciones entre tres variables.
Gráficos para examinar relaciones entre tres variables.
✓ Gráfica de Superficie 3D – Superficie
• Preguntas
• Comentarios
• Quejas
• Sugerencias
• Traumas Gráficos
Gracias Por su Asistencia
Hasta Mañana
Sesión 4
Regresión
Lineal
Simple
Regresión Lineal Simple
• Regresión Lineal Simple
• Examina la relación lineal entre dos variables continuas: una respuesta (Y) y un
predictor (X).
• Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta
a partir de un valor predictor con una exactitud mayor que la asociada únicamente a
las probabilidades.
• La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se
puede utilizar después para:
• Examinar cómo cambia la variable de respuesta a medida que cambia la variable
predictora.
• Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora
(X).
Regresión Lineal Simple
• Método de Mínimos Cuadrados
• Práctica 14
• Análisis de Regresión Lineal Simple
Regresión Lineal Simple
4. Gráficas Factoriales
Prueba Uso
Detectar desviaciones en las colas de la
Anderson-Darling
distribución
Muestras menores o iguales a 50
Ryan-Jones (similar a Shapiro-Wilk)
elementos
Kolmogorov-Smirnov Muestras mayores a 50 elementos
• Hipótesis
• 𝐻0 : Los datos siguen la distribución especificada
• 𝐻1 : Los datos no siguen la distribución especificada
Prueba de Normalidad
Decisión Estadística:
𝑯𝟎 se acepta, dado que
𝒑 > 𝜶 (. 𝟕𝟑𝟕 >. 𝟎𝟓)
Conclusión:
Los datos presentan
una distribución normal
Gráfica de Línea Ajustada
Observaciones:
• Correlación Lineal
Negativa
• Correlación entre
moderada y fuerte
• Algunos datos dispersos
• Coeficiente de
Correlación de Pearson
−. 𝟖𝟏𝟐 . 𝟔𝟔
Ajustar Modelo de Regresión
Análisis:
• Ecuación: 𝒚
ෝ = 𝟗𝟎. 𝟖𝟗 − 𝟎. 𝟎𝟓𝟏𝟑𝟑𝒙
• Ambos términos son significativos en el
modelo, dado que 𝒑 < 𝜶, por lo cual, se
justifica su presencia en la ecuación de
regresión.
• El ajuste del modelo no es adecuado, dado
que únicamente el 65.99% de la variación de
la variable respuesta se atribuye al predictor
analizado (mínimo debe ser 70%).
Ajustar Modelo de Regresión
Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶. En este caso como sólo
tiene un predictor, sus valores son similares
al modelo.
• La suma de cuadrados del error es alta; por
ello la falta de ajuste del modelo.
• Se presentan observaciones atípicas en el
modelo, ya sea con residuos grandes o bien,
poco comunes.
Ajustar Modelo de Regresión
Análisis:
• El predictor es significativo
en el modelo de regresión.
Ajustar Modelo de Regresión
Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Gráficas Factoriales
Análisis:
• La correlación lineal es
negativa, de forma que
conforme aumenta el
tiempo en segundos,
disminuye el volumen
máximo de O2.
Predictor
• En “Respuestas”, seleccionar
“Volumen Máximo de O2”;
en “Tiempo en Segundos”,
ingresar el valor de “x” del
cual se quiere obtener la
predicción.
Predictor
Análisis:
• El modelo indica que a los 58
segundos, se tendría un volumen
máximo de O2 de 87.9130.
• Es posible encontrar dicho valor en un
intervalo de 75.3034 a 100.523, con un
95% de confiabilidad.
• Para observaciones futuras, es posible
encontrar el valor O2 a los 58 segundos
en un intervalo de 75.3705 a 102.456.
Optimizador de Respuesta
Análisis:
• El valor mínimo de O2 se dará a los 1045
segundos, con un valor de 37.25.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 33.39 y
41.10, a los 1045 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 29.04 y 45.45.
Optimizador de Respuesta – Maximizar
Análisis:
• El valor máximo de O2 se dará a los 683
segundos, con un valor de 55.83.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 53.06 y
58.60, a los 683 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 48.07 y 63.58.
Receso
• Volvemos en 15 minutos
Regresión Lineal Simple
Correlación
Correlación
• Correlación
• Se emplea para medir la fuerza y la dirección de la asociación entre dos variables.
• La correlación de Pearson (también conocida como r), que es el método más común,
mide la relación lineal entre dos variables continuas. Una relación es lineal cuando un
cambio en una variable se asocia con un cambio proporcional en la otra variable.
• La correlación de Spearman mide la relación monótona entre dos variables continuas
o dos variables ordinales. En una relación monótona, las variables tienden a cambiar
al mismo tiempo, pero no necesariamente a un ritmo constante. El coeficiente de
correlación de Spearman se basa en los valores jerarquizados de cada variable y no en
los datos sin procesar.
Correlación
• Consideraciones
• Los datos deben incluir al menos 2 columnas de datos numéricos o de fecha/hora.
• Los datos deben ser continuos u ordinales.
• El tamaño de la muestra debe ser de medio a grande, n ≥ 25.
• La relación entre las variables debe ser lineal (Pearson) o monótona (Spearman).
• Los valores poco comunes pueden tener un gran efecto en los resultados.
• La correlación de Pearson es más sensible a las desviaciones de la normalidad, en
tanto que la correlación de Spearman es más robusta a éstas.
Correlación
• Correlación Lineal • Correlación Monótona
Correlación
• Interpretación Coeficiente de Correlación de Pearson
Correlación
• Interpretación Coeficiente de Correlación de Spearman
Correlación
• Práctica 15
• Análisis de Correlación
Correlación
• Los solicitantes de préstamo deben proporcionar a un banco los ocho datos siguientes:
ingresos, nivel de educación, edad, tiempo viviendo en la residencia actual, tiempo
trabajando para el empleador actual, ahorros, deuda y número de tarjetas de crédito.
El administrador del banco desea analizar estos datos para determinar la mejor
manera de agruparlos y comunicarlos. El administrador recopila esta información para
30 solicitantes de préstamo.
Análisis:
• Correlaciones positivas fuertes:
• Residencia – Edad (.838)
• Empleo – Edad (.848)
• Empleo – Residencia (.952)
• Correlaciones negativas:
• Tarj. Crédito – Edad (-.130)
• Deuda - Ahorros (-.393)
• Tarj. Crédito – Ahorros (-.410)
Correlación
Correlación
Análisis:
• Correlación positiva muy
fuerte (.967)
Dudas
• Preguntas
• Comentarios
• Quejas
• Sugerencias
• Traumas de Regresión
Gracias Por su Asistencia
Regresión
Lineal
Múltiple
Regresión Lineal Múltiple
• Regresión Lineal Múltiple
• Examina las relaciones lineales entre una respuesta continua y dos o más predictores.
• Si el número de predictores es grande, antes de ajustar un modelo de regresión con
todos los predictores, se deberían utilizar las técnicas de selección de modelo paso a
paso o de los mejores subconjuntos para excluir los predictores que no estén
asociados con las respuestas.
• Práctica 16
• Análisis de Regresión Lineal Múltiple
Regresión Lineal Múltiple
• El químico realiza un análisis de regresión múltiple para ajustar un modelo con los
predictores y eliminar los predictores que no tienen una relación estadísticamente
significativa con la respuesta. Realice el análisis correspondiente.
Regresión Lineal Múltiple
1. Prueba de Normalidad
3. Gráficas Factoriales
4. Predictor
5. Optimizador de Respuesta
Prueba de Normalidad
Prueba Uso
Detectar desviaciones en las colas de la
Anderson-Darling
distribución
Muestras menores o iguales a 50
Ryan-Jones (similar a Shapiro-Wilk)
elementos
Kolmogorov-Smirnov Muestras mayores a 50 elementos
• Hipótesis
• 𝐻0 : Los datos siguen la distribución especificada
• 𝐻1 : Los datos no siguen la distribución especificada
Prueba de Normalidad
Decisión Estadística:
𝑯𝟎 se rechaza, dado
que 𝒑 < 𝜶
Conclusión:
Los datos no presentan
una distribución normal
Ajustar Modelo de Regresión
Análisis:
• Ecuación: 𝒚ෝ = −. 𝟕𝟓𝟔+. 𝟏𝟓𝟒𝟓𝒙𝟏+. 𝟐𝟏𝟕𝟏𝒙𝟐+. 𝟎𝟏𝟎𝟖𝟏𝒙𝟑+. 𝟎𝟗𝟒𝟔𝒙𝟒
• Los términos significativos en el modelo son: la
concentración, la relación y la temperatura,
dado que 𝒑 < 𝜶; el término constante y el
tiempo no son significativos.
• El ajuste del modelo no es adecuado, dado que
únicamente el 68.90% de la variación de la
variable respuesta se atribuye al predictor
analizado (mínimo debe ser 70%).
Ajustar Modelo de Regresión
Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶. En este caso como sólo
tiene un predictor, sus valores son similares
al modelo.
• Los predictores significativos del modelo
son: concentración, relación y temperatura.
• La suma de cuadrados del error es alta; por
ello la falta de ajuste del modelo.
Ajustar Modelo de Regresión
Análisis:
• Los predictores significativos
son los factores A, B y C.
Ajustar Modelo de Regresión
Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Ajustar Modelo de Regresión
Análisis:
• Ecuación: 𝒚
ෝ =. 𝟏𝟒𝟎𝟏𝒙𝟏 +. 𝟐𝟏𝟑𝟑𝒙𝟐 +. 𝟎𝟎𝟖𝟖𝟔𝒙𝟑
• Los términos significativos en el modelo son: la
concentración, la relación y la temperatura,
dado que 𝒑 < 𝜶.
• Existen variables que presentan
multicolinealidad.
• El ajuste del modelo es adecuado, dado que el
94.99% de la variación de la variable respuesta
se atribuye a los predictores analizados.
Ajustar Modelo de Regresión
Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶.
• La suma de cuadrados del error es baja; se
presenta un alto ajuste del modelo.
• Existe una observación con residuo grande.
Ajustar Modelo de Regresión
Análisis:
• Los predictores significativos
son los factores A, B y C.
Ajustar Modelo de Regresión
Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Ajustar Modelo de Regresión
Análisis:
• Ecuación: 𝒚
ෝ =. 𝟐𝟐𝟓𝟑𝒙𝟐 +. 𝟎𝟏𝟒𝟎𝟓𝒙𝟑
• Los términos significativos en el modelo son: la
relación y la temperatura, dado que 𝒑 < 𝜶.
• Existen variables que presentan
multicolinealidad.
• El ajuste del modelo es adecuado, dado que el
94.26% de la variación de la variable respuesta
se atribuye a los predictores analizados.
Ajustar Modelo de Regresión
Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶.
• La suma de cuadrados del error es baja; se
presenta un alto ajuste del modelo.
• Existe una observación con residuo grande.
Ajustar Modelo de Regresión
Análisis:
• Los predictores significativos
son los factores B y C.
Ajustar Modelo de Regresión
Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Gráficas Factoriales
Análisis:
• Ambos predictores son
positivos, de forma que a
mayor valor del predictor,
mayor será también la
variable respuesta.
Predictor
• Volvemos en 15 minutos
Sesión 5
Modelos de
Regresión No Lineal
– Regresión
Múltiple con
Interacciones
Dudas
• Preguntas
• Comentarios
• Quejas
• Sugerencias
• Traumas Múltiples
Gracias Por su Asistencia
¡Felicidades! Terminamos