0% encontró este documento útil (0 votos)
76 vistas255 páginas

MINITAB

El taller se compone de cinco sesiones que abarcan desde generalidades de Minitab y estadísticos descriptivos hasta regresión lineal múltiple y modelos no lineales. Se requiere una asistencia mínima del 80% y cumplimiento de entregables para la acreditación. Minitab es un software estadístico que facilita el análisis de datos en diversas aplicaciones, especialmente en calidad y mejora continua.

Cargado por

Joss Sanz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
76 vistas255 páginas

MINITAB

El taller se compone de cinco sesiones que abarcan desde generalidades de Minitab y estadísticos descriptivos hasta regresión lineal múltiple y modelos no lineales. Se requiere una asistencia mínima del 80% y cumplimiento de entregables para la acreditación. Minitab es un software estadístico que facilita el análisis de datos en diversas aplicaciones, especialmente en calidad y mejora continua.

Cargado por

Joss Sanz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Contenido del Taller

• Sesión 1: Generalidades de Minitab y Estadísticos Descriptivos

• Sesión 2: Análisis de Gráficos

• Sesión 3: Estimación y Pruebas de Hipótesis

• Sesión 4: Regresión Lineal Simple y Correlación

• Sesión 5: Regresión Lineal Múltiple y Modelos de Regresión no Lineal


Requisitos de Acreditación

• Asistencia a las sesiones por lo menos del 80%

• Cumplimiento de entregables por lo menos del 80%

• Código Classroom: iya7fri


Sesión 1

• Interfaz y Generalidades de Minitab

• Estadísticos Descriptivos
• Una Muestra
• Varias Muestras
• Tablas con Resúmenes
Sesión 1

Interfaz y
Generalidades
de Minitab
¿Qué es Minitab?

• Minitab es un software estadístico creado hace más de 50 años por Bárbara Ryan y dos
colegas de la Universidad de Penn State, con el objetivo de realizar cálculos estadísticos de
manera que los estudiantes pudieran concentrarse más en las aplicaciones estadísticas y
menos en los cálculos matemáticos.

• Se ha convertido en el líder del mercado en cuanto a la analítica que se aplica en las áreas de
calidad y mejora continua.

• Hasta el día de hoy, las soluciones de Minitab ayudan a las empresas a abordar una amplia
gama de desafíos, que van desde las iniciativas de transformación digital a gran escala hasta
proyectos centrados en la mejora de la cadena de suministro o la eliminación de costos en un
área específica.
Productos de Minitab
Interfaz y Generalidades de Minitab
Interfaz y Generalidades de Minitab
Barra de Menús
Botones Acceso Rápido

Historial
Área de Resultados

Hoja de Trabajo
Botones de Acceso Rápido

Abrir Imprimir Copiar Deshacer Buscar Cancelar Insertar Insertar Borrar


Celda Columna
Guardar Cortar Pegar Rehacer Buscar Ayuda Insertar Mover
Proyecto Siguiente Fila Columnas

Editar Asignar Ir a Fila


Último Fórmula a Anterior
Cuadro de Columna Destacada
Diálogo
Ir a Fila
Anterior
Destacada
Barras de Menús
Barras de Menús
Barras de Menús
Proyectos y Hojas de Trabajo
Proyectos Hojas de Trabajo
• Almacenan los siguientes elementos: • Almacenan los siguientes elementos:
- Hojas de trabajo - Columnas de datos
- Gráficos - Constantes
- Salidas de la ventana “sesión” - Matrices
- Configuración de los cuadros de diálogo - Objetos de diseño
- Diseño de la ventana - Descripciones de columnas
- Opciones - Descripciones de hojas de trabajo
• Se pueden manipular datos, realizar análisis y
generar gráficos.
• Contienen una o más hojas de trabajo.
Tipos de Datos
Numéricos Texto (T) Fecha/Hora (D)
• Números enteros o • Letras • Fecha
decimales, tales como • Números • Hora
123 o 3.141597 • Espacios • Fecha/Hora
• Caracteres especiales • Tiempo Transcurrido
Sesión 1

Estadísticos
Descriptivos
para una
Muestra
Clasificación de la Estadística

• Estadística Descriptiva
• Proporciona un resumen conciso de los datos, los cuales se pueden de
forma numérica o gráfica
• Estadística Inferencial
• Utiliza una muestra aleatoria de datos tomada de una población para
describir y hacer inferencias acerca de la población. Los estadísticos
inferenciales son valiosos cuando no es conveniente o posible examinar
cada miembro de una población entera.
Estadísticas Básicas
Estadísticas Básicas
• Mostrar Estadísticos Descriptivos
• Permite resumir datos numéricos con una variedad de estadísticos, como el tamaño de la
muestra, la media, la mediana y la desviación estándar. Este análisis también proporciona
gráficas de los datos.
• Almacenar Estadísticos Descriptivos
• Además de mostrar los estadísticos descriptivos, permite almacenar los resultados en la
hoja de trabajo.
• Resumen Gráfico
• Además de presentar un resumen con los estadísticos descriptivos más relevantes, permite
describir la distribución de los datos con gráficas, realiza una prueba de normalidad
Anderson-Darling y obtiene intervalos de confianza para la media, la desviación estándar y
la mediana.
Mostrar Estadísticos Descriptivos
Ruta: Estadísticas / Estadísticas Básicas / Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
• Media
• Describe la muestra con un solo valor que representa el centro de los datos. Muchos
análisis estadísticos utilizan la media como una medida estándar del centro de la
distribución de los datos.
• Error Estándar de la Media
• Determina el grado de precisión con el que la media de la muestra estima la media de la
población.
• Desviación Estándar
• Determina qué tan dispersos están los datos con respecto a la media.
• Varianza
• Determina qué tan dispersos están los datos con respecto a la media. La varianza es igual a
la desviación estándar elevada al cuadrado.
Mostrar Estadísticos Descriptivos
• Coeficiente de Variación
• Es una medida de dispersión que describe la variación en los datos en relación con la
media. El coeficiente de variación se ajusta de manera que los valores estén en una escala
sin unidades. Gracias a este ajuste, es posible utilizar el coeficiente de variación en lugar de
la desviación estándar para comparar la variación de los datos que tienen unidades
diferentes o medias muy diferentes.
• Rango
• Diferencia entre los valores más grande y más pequeño de los datos. El rango representa el
intervalo más pequeño que contiene todos los valores de los datos.
• Suma
• Total de todos los valores de los datos.
Mostrar Estadísticos Descriptivos
• Mínimo
• Valor de datos más pequeño en la muestra. Se puede utilizar para identificar un posible
valor atípico o un error de entrada de datos. Una de las maneras más sencillas de evaluar la
dispersión de los datos consiste en comparar el mínimo y el máximo.
• Primer Cuartil
• 25% de los valores de los datos en la muestra son menores que el valor del primer cuartil.
• Mediana
• La mediana es otra medida del centro de la distribución de los datos. Por lo general, los
valores atípicos influyen menos en la mediana que en la media. La mitad de los valores de
los datos es mayor que el valor de la mediana y la mitad de los valores de los datos es
menor que el valor de la mediana.
Mostrar Estadísticos Descriptivos
• Tercer Cuartil
• El 25% de los valores de datos de la muestra son mayores que el valor del tercer cuartil.
• Máximo
• El máximo es el valor de datos más grande en la muestra. Es posible emplear el máximo
para identificar un posible valor atípico o un error de entrada de datos. Una de las maneras
más sencillas de evaluar la dispersión de los datos consiste en comparar el mínimo y el
máximo.
• Rango Intercuartílico
• El rango intercuartil (IQR) es la distancia entre el primer cuartil (Q1) y el tercer cuartil (Q3).
Se puede emplear para describir la dispersión de los datos. A medida que aumenta la
dispersión de los datos, el IQR se hace más grande
Mostrar Estadísticos Descriptivos
• Moda
• Describe un conjunto entero de observaciones con un valor individual que representa el
valor más común en la muestra. Es posible emplearla con la media y la mediana para
obtener una caracterización general de la distribución de los datos.
• N Valores Presentes
• El número de valores presentes en la muestra. Minitab muestra este valor en la salida
como N.
• N Valores Ausentes
• El número de valores faltantes en la muestra. El número de valores faltantes se refiere a las
celdas que contienen el símbolo de valor faltante *. Minitab muestra este valor en la salida
como N*.
Mostrar Estadísticos Descriptivos
• N Total
• El número total de observaciones en la columna. Se usa para representar la suma de N
valores faltantes y N valores presentes. Minitab muestra este valor en la salida como
Conteo total.
• N Acumulado
• Total acumulado del número de observaciones en categorías sucesivas.
• Por Ciento
• Representa la contribución de una categoría al todo. El porcentaje se calcula
dividiendo la frecuencia de esa categoría entre la frecuencia total y multiplicándola
por 100.
Mostrar Estadísticos Descriptivos
• Porcentaje Acumulado
• Es la suma de todos los valores porcentuales hasta esa categoría, en comparación con los
porcentajes individuales de cada categoría.
• Media Recortada
• Se emplea para eliminar el impacto de los valores muy grandes o muy pequeños sobre la
media. Cuando los datos contienen valores atípicos, la media recortada puede ser una
mejor medida de la tendencia central que la media.
• Suma de Cuadrados
• La suma de los cuadrados no corregida se calcula elevando al cuadrado cada uno de los
valores de la columna y luego sumando esos valores elevados al cuadrado. A diferencia de
la suma de los cuadrados corregida, la suma de los cuadrados no corregida incluye el error.
Los valores de datos se elevan al cuadrado sin antes restar la media
Mostrar Estadísticos Descriptivos
• Asimetría
• Determina el grado en que los datos no son simétricos.
• Curtosis
• Determinar el grado en que los datos alcanzan su valor máximo, en comparación con una
curva normal.
• Media de las Diferencias Sucesivas Cuadráticas (MSSD)
• Es una estimación de la varianza. Un posible uso de la MSSD es para probar si una
secuencia de observaciones es aleatoria. En control de calidad, un posible uso de la MSSD
es para estimar la varianza cuando el tamaño del subgrupo = 1
Mostrar Estadísticos Descriptivos
Mostrar Estadísticos Descriptivos
• Histograma de Datos
• Se emplean para evaluar la forma y
dispersión de los datos. Funcionan mejor
cuando el tamaño de la muestra es
mayor que 20.
• Histograma de Datos con Curva
Normal
• Además de presentar el histograma
general, La curva normal sobrepone una
curva de distribución normal a los datos.
Mostrar Estadísticos Descriptivos
• Gráficas de Valores Individuales
• Permite examinar la dispersión de los
datos e identificar cualquier posible
valor atípico. Funcionan mejor cuando el
tamaño de la muestra es menor que 50.
• Gráfica de Caja de Datos
• Permite examinar la dispersión de los
datos e identificar cualquier posible
valor atípico. Funcionan mejor cuando el
tamaño de la muestra es mayor que 20.
Estadísticos Descriptivos

• Práctica 1
• Estadísticos Descriptivos para una Muestra
Estadísticos Descriptivos para una Muestra

1. Los siguientes datos son las mediciones del diámetro de 36 cabezas de


remache en centésimos de una pulgada.
6.72 6.66 6.66 6.72 6.70 6.70
6.66 6.68 6.70 6.72 6.80 6.79
6.76 6.67 6.76 6.78 6.76 6.75
6.76 6.76 6.70 6.73 6.81 6.76
6.66 6.82 6.76 6.72 6.62 6.78
6.77 6.64 6.62 6.74 6.72 6.78

Calcule para los datos de la muestra los estadísticos descriptivos manejados


por Minitab y obtenga conclusiones al respecto.
Estadísticos Descriptivos para una Muestra

• Capturar los datos de la muestra en


una sola columna.
• Abrir “Estadísticas / Estadísticas
Básicas / Mostrar Estadísticos
Descriptivos”
• En el cuadro “Variables”, seleccionar
la columna donde se encuentran los
datos
Estadísticos Descriptivos para una Muestra

• En el botón “Estadísticas…” seleccionar los estadísticos que se desea obtener.


• En el botón “Gráficas…” seleccionar los gráficos que se desea obtener.
• Dar clic en “Aceptar”
Estadísticos Descriptivos para una Muestra

2. La Citizens Banking Company estudia la cantidad de veces que se utiliza al día el


cajero automático ubicado en uno de los supermercados de Loblaws, sobre
Market Street. Enseguida figuran las cantidades de ocasiones que se utilizó la
máquina al día durante los pasados 30 días.
83 84 84 75 70
63 84 68 65 52
95 78 59 95 87
64 76 54 59 61
80 73 52 90 77
36 61 84 47 60
Calcule para los datos de la muestra los estadísticos descriptivos manejados por
Minitab y obtenga conclusiones al respecto.
Estadísticos Descriptivos para una Muestra
Receso

• Volvemos en 15 minutos
Mostrar Estadísticos Descriptivos

• Por Variables
• Si existen grupos en los datos,
ingresar “Por variables” para
explorar las diferencias entre los
grupos. Minitab calcula los
estadísticos descriptivos para cada
grupo por separado.
Estadísticos Descriptivos

• Práctica 2
• Estadísticos Descriptivos para Varias Muestras
Estadísticos Descriptivos para Varias Muestras

1. Se utiliza cierto polímero para los sistemas de evacuación de los aviones. Es


importante que el polímero sea resistente al proceso de envejecimiento. Se
utilizaron veinte especímenes del polímero en un experimento. Diez se
asignaron aleatoriamente para exponerse a un proceso de envejecimiento
acelerado del lote, el cual implica la exposición a altas temperaturas durante
10 días. Se hicieron las mediciones de resistencia a la tensión de los
especímenes y se registraron los siguientes datos sobre resistencia a la
tensión en psi.
Estadísticos Descriptivos para Varias Muestras

227 222 218 217 225


Sin Envejecimiento
218 216 229 228 221
219 214 215 211 209
Con Envejecimiento
218 203 204 201 205

Calcule para cada muestra (sin envejecimiento y con envejecimiento), así como
para la totalidad de datos los estadísticos descriptivos manejados por Minitab y
obtenga conclusiones al respecto.
Estadísticos Descriptivos para Varias Muestras

• Capturar los datos de la muestra en una sola


columna.
• Capturar en otra columna el grupo al cual
pertenece cada dato
• Abrir “Estadísticas / Estadísticas Básicas /
Mostrar Estadísticos Descriptivos”
• En el cuadro “Variables”, seleccionar la
columna donde se encuentran los datos.
• En el cuadro “Por Variables”, seleccionar la
columna donde se encuentran los grupos.
Estadísticos Descriptivos para Varias Muestras

• En el botón “Estadísticas…”
seleccionar los estadísticos
que se desea obtener.
• En el botón “Gráficas…”
seleccionar los gráficos que
se desea obtener.
• Dar clic en “Aceptar”
Estadísticos Descriptivos para Varias Muestras

2. La industria disquera de Estados Unidos lleva a cabo un estudio sobre el


número de discos compactos de música que poseen las personas de la
tercera edad y los adultos jóvenes. La información aparece enseguida.

Adultos de la Tercera Edad


28 180 140 81 158
118 41 187 147 98
177 133 52 97 162
35 180 145 153 99
132 48 188 98 174
Estadísticos Descriptivos para Varias Muestras

Adultos Jóvenes
81 423 266 175 550 372
233 113 500 284 192 590
417 254 147 518 316 209
107 490 283 183 557 401
251 147 507 284 202 594

Calcule para cada muestra (sin envejecimiento y con envejecimiento), así como
para la totalidad de datos los estadísticos descriptivos manejados por Minitab y
obtenga conclusiones al respecto.
Estadísticos Descriptivos para Varias Muestras
Estadísticos Descriptivos

• Práctica 3
• Tablas con Resúmenes de Estadísticos Descriptivos y de Conteos Individuales
Tablas con Resúmenes de Estadísticos Descriptivos

1. Un investigador médico desea estudiar los efectos de diversos factores en las


frecuencias del pulso. El investigador registra la estatura, peso, sexo,
preferencia de fumar o no fumar, nivel de actividad y la frecuencia del pulso
en reposo de 91 estudiantes de grado. El investigador luego divide a los
estudiantes en dos grupos de manera aleatoria. El primer grupo corre en el
lugar durante un minuto mientras el otro grupo se queda quieto. Después, el
investigador vuelve a registrar las frecuencias del pulso de los estudiantes. El
investigador desea resumir los estadísticos de conteo y los datos del pulso de
los estudiantes incluidos en el estudio, clasificados por sexo y estatus de
fumador.
Tablas con Resúmenes de Estadísticos Descriptivos
Ruta: Estadísticas / Tablas / Estadísticos descriptivos
Tablas con Resúmenes de Estadísticos Descriptivos

• Abrir “Estadísticas / Tablas /


Estadísticos Descriptivos”

• En la opción “Filas”, seleccionar la


columna “Sexo”.

• En la opción “Columnas”, seleccionar


la columna “Fuma”.
Tablas con Resúmenes de Estadísticos Descriptivos

• En el botón “Variables • En el botón “Variables Asociadas…”


Categóricas…” seleccionar agregar “Pulso 1” y en “Mostrar”
“Conteos” y “Porcentaje de Filas”. seleccionar “Medias”.
Tablas con Resúmenes de Estadísticos Descriptivos
Tablas de Cuenta de Variables Individuales

2. Un analista de mercados que trabaja para una empresa de chocolates desea


determinar si existe una asociación entre el sexo de la persona y el tipo de
chocolate preferido (Negro, Con leche o Blanco). El sexo de las personas y la
preferencia de chocolate se registran para 400 clientes seleccionados de
manera aleatoria. El analista desea calcular el número y el porcentaje de
encuestados que prefieren el chocolate oscuro, el chocolate con leche y el
chocolate blanco antes de comprobar una asociación.
Tablas de Cuenta de Variables Individuales
Ruta: Estadísticas / Tablas / Estadísticos descriptivos
Tablas de Cuenta de Variables Individuales

• En la opción “Variables”, seleccionar


la columna “Preferencia”.

• En “Mostrar”, seleccionar “Conteos”,


“Porcentajes”, “Conteos acumulados”
y “Porcentajes acumulados”.
Tablas de Cuenta de Variables Individuales
Dudas

• Preguntas

• Comentarios

• Quejas

• Sugerencias

• Traumas Estadísticos
Gracias Por su Asistencia

¡Excelente Lunes!
Sesión 2

• Análisis de Gráficos
• Relaciones entre pares de variables
• Comparación de distribuciones
• Comparación de resúmenes o valores individuales de una variable
• Evaluación de distribución de conteos
• Serie de datos en el tiempo
• Relaciones entre tres variables
Menú Gráfica

➢ Gráficos para examinar relaciones entre pares de variables

➢ Gráficos para examinar y comparar distribuciones

➢ Gráficos para comparar resúmenes o valores individuales de una variable

➢ Gráficos para evaluar la distribución de conteos

➢ Gráficos para analizar una serie de datos en el tiempo

➢ Gráficos para examinar relaciones entre tres variables


Sesión 2

Gráficos para
examinar
relaciones entre
pares de variables
Gráficos para examinar relaciones entre pares de variables
El empleo de estas gráficas es explorar las relaciones entre uno o más pares de variables.
Por ejemplo, se puede evaluar lo siguiente:

✓ La relación entre el pH del suelo y el crecimiento de las plantas.

✓ Las relaciones entre la viscosidad, antigüedad y temperatura del aceite y la aceleración


y el desgaste de los motores de los autos de carrera.

➢ Gráfica de Dispersión *
➢ Gráfica de Matriz
➢ Gráfica de Burbujas
➢ Gráfica Marginal
Gráficos para examinar relaciones entre pares de variables
✓ Gráfica de Dispersión

Se emplea para evaluar la relación entre


dos variables. Los valores de las dos
variables funcionan como las coordenadas
X e Y para graficar cada observación.
Gráficos para examinar relaciones entre pares de variables
✓ Gráfica de Matriz

Se emplea para evaluar las relaciones


entre varios pares de variables al mismo
tiempo. Una gráfica de matriz es un
arreglo de gráficas de dispersión
individuales.
Gráficos para examinar relaciones entre pares de variables
✓ Gráfica de Burbujas

Se emplea para explorar las relaciones


entre tres variables en una misma
gráfica. Igual que una gráfica de
dispersión, una gráfica de burbujas
grafica una variable Y en función de una
variable X. Sin embargo, los símbolos
(también llamados burbujas) en la gráfica
de burbujas varían de tamaño. El área de
cada burbuja representa el valor de una
tercera variable.
Gráficos para examinar relaciones entre pares de variables
✓ Gráfica Marginal

Se emplea para evaluar las


distribuciones de dos variables, así
como la relación entre ellas. Una gráfica
marginal es una gráfica de dispersión
con histogramas, gráficas de caja o
gráficas de puntos en los márgenes.
Análisis de Gráficos

• Práctica 4
• Gráficos para examinar relaciones entre pares de variables.
Gráfico de Dispersión
✓ Tipos

Simple Con Grupos Con Regresión

Con Regresión y Grupos Con Línea de Conexión Con Conexión y Grupos


Gráficos para examinar relaciones entre pares de variables
✓ Gráfico de Dispersión Simple

• Un investigador médico estudia la obesidad en las chicas adolescentes. Puesto que el


porcentaje de grasa corporal es difícil y costoso de medir directamente, el investigador
desea determinar si el índice de masa corporal (IMC), una medición que es fácil de
tomar, es un predictor adecuado del porcentaje de grasa corporal. El investigador
recopila el IMC, el porcentaje de grasa corporal y otras variables personales de 92
chicas adolescentes.

• Como parte de la investigación inicial, el investigador busca crear una gráfica de


dispersión simple del porcentaje de grasa corporal vs. el IMC para evaluar la relación
entre las dos variables. Realice el gráfico e interprételo a detalle.
Gráfica de Dispersión Simple

• Abrir “Gráfica” / • Seleccionar la opción • En “Variables Y”, ingresar


“Gráfica de “Simple”. “%Grasa”; en “Variables
Dispersión” “X”, ingresar “IMC”
Gráfica de Dispersión Simple
Gráficos para examinar relaciones entre pares de variables
✓ Gráfico de Dispersión con Regresión y Grupos
• Un ingeniero especializado en calidad que trabaja para un fabricante de cámaras desea
acortar el tiempo de recuperación del flash(la menor cantidad de tiempo que se necesita
entre los destellos). El ingeniero quiere determinar si existe una relación entre el voltaje que
queda en la batería de la cámara inmediatamente después de un flash y el tiempo de
recuperación del flash, así como también si existen diferencias en el tiempo de recuperación
del flash entre la formulación anterior de la batería y la nueva formulación. Se recolectan
muestras aleatorias de baterías hechas con la formulación anterior y la formulación nueva y
se miden los voltios que quedan inmediatamente después de un flash y el tiempo de
recuperación del flash para cada una.
• Como parte de la investigación inicial, se busca crear una gráfica de dispersión de los voltios
restantes después del flash vs. el tiempo de recuperación del flash, agrupados por
formulación de batería, para evaluar la relación entre las dos variables para las dos
formulaciones. Realice el gráfico e interprete resultados.
Gráfica de Dispersión con Regresión y Grupos

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables Y”, ingresar


de Dispersión” “Con Regresión y “RecupFlash”; en “Variables
Grupos”. “X”, ingresar “VoltDespués”;
en “Variables categóricas”
ingresar “Formulación”.
Gráfica de Dispersión con Regresión y Grupos
Sesión 2

Gráficos para
examinar y
comparar
distribuciones
Gráficos para examinar y comparar distribuciones
El empleo de estas gráficas es evaluar y comparar propiedades de distribuciones, tales como:
✓ Dónde se centran los valores de la muestra.
✓ Si una distribución de muestra es simétrica o asimétrica.
✓ Si los datos de la muestra siguen una distribución específica.
✓ Cuántos picos existen en la distribución de muestra (más de un pico puede indicar que los
datos provienen de múltiples poblaciones).
✓ Cuáles son los valores observados más comúnmente en la muestra.
➢ Histograma *
➢ Gráfica de Puntos *
➢ Tallo y Hoja
➢ Gráfica de Probabilidad *
➢ CFD Empírica
➢ Gráfica de Distribución de Probabilidad
Gráficos para examinar y comparar distribuciones
✓ Histograma

Se emplea para examinar la forma y


dispersión de los datos. Un histograma
divide los valores de la muestra entre
muchos intervalos y representa la
frecuencia de los valores de datos en cada
intervalo con una barra. Funciona mejor
cuando el tamaño de la muestra es al
menos de 20. Sin embargo, un tamaño de
muestra que sea mayor que 20 puede
representar mejor la distribución.
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Puntos

Se emplea para evaluar y comparar las


distribuciones de datos de la muestra.
Una gráfica de puntos divide los valores
de la muestra en pequeños intervalos y
representa cada valor o pequeño grupo
de valores con un punto a lo largo de una
línea de número. Funciona mejor cuando
el tamaño de la muestra es menor que 50
aproximadamente.
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Tallo y Hoja

Se emplea para examinar la forma y dispersión


de los datos de muestra. Una gráfica de tallo y
hoja es similar a un histograma que se gira sobre
su lateral. Sin embargo, en lugar de mostrar
barras, una gráfica de tallo y hoja muestra los
dígitos de los valores de datos reales para
denotar la frecuencia de cada recipiente (fila).
Funciona mejor cuando el tamaño de la muestra
es menor que 50 aproximadamente.
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Probabilidad

Se emplea para evaluar el ajuste de una


distribución a los datos, estimar
percentiles y comparar distribuciones de
muestras. Una gráfica de probabilidad
muestra cada valor versus el porcentaje
de valores de la muestra que son menores
o iguales a este valor, a lo largo de una
línea de distribución ajustada. El eje y se
transforma para que la distribución
ajustada forme una línea recta.
Gráficos para examinar y comparar distribuciones
✓ Gráfica de CFD Empírica

Se emplea para evaluar el ajuste de una


distribución a sus datos, para observar
percentiles estimados de la población y
percentiles reales de los valores de la
muestra, y para comparar distribuciones
de muestras. La gráfica CDF empírica es
similar a una gráfica de probabilidad, a
excepción de que ambos ejes son lineales,
lo que puede hacer que la gráfica CDF
empírica sea más intuitiva para
interpretarla.
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Distribución de Probabilidad

Se emplea para ver las curvas de


distribución que se especifiquen. Cuando
se crea una gráfica de distribución de
probabilidad, se especifica una o más
distribuciones y parámetros de manera
que se pueda visualizar y comparar las
distribuciones. También se puede
sombrear el área en la curva de
distribución para representar un valor que
se especifique.
Análisis de Gráficos

• Práctica 5
• Gráficos para examinar y comparar distribuciones.
Histograma
✓ Tipos

Simple Con Ajuste

Con Grupos Con Ajuste y Grupos


Gráficos para examinar y comparar distribuciones
✓ Histograma Simple

• Un ingeniero especializado en control de calidad debe garantizar que las tapas de las
botellas de champú queden ajustadas correctamente. Si las tapas quedan flojas,
podrían caerse durante el envío. Si se aprietan demasiado, será difícil retirarlas. El
valor objetivo del par de torsión para ajustar las tapas es 18. El ingeniero recolecta una
muestra aleatoria de 68 botellas y prueba la cantidad de par de torsión que se necesita
para quitar las tapas.

• Como parte de la investigación inicial, se busca crear un histograma del par de torsión
para evaluar la distribución de los datos. Realice el gráfico correspondiente con apoyo
de Minitab.
Histograma Simple

• Abrir “Gráfica” / • Seleccionar la opción • En “Variables de gráficas”,


“Histograma” “Simple”. ingresar “Torsión”.
Histograma Simple
Gráficos para examinar y comparar distribuciones
✓ Histograma con Líneas Ajustadas y Grupos

• Un ingeniero especializado en calidad desea comparar los pistones de dos


proveedores. El ingeniero mide las longitudes de una muestra aleatoria de 100
pistones de cada proveedor. Se busca crear un histograma con ajuste y grupos para
comparar las distribuciones de los datos de las muestras. Realice el gráfico empleando
para ello el software Minitab.
Histograma con Líneas Ajustadas y Grupos

• Abrir “Gráfica” / • Seleccionar la opción • En “Variables de gráficas”,


“Histograma” “Con ajuste y grupos”. ingresar “Longitud”; en
“Variables categóricas”,
ingresar “Proveedor”
Histograma con Líneas Ajustadas y Grupos
Gráfico de Puntos
✓ Tipos
✓ Una Y

Simple Con Grupos Apilar Grupos


✓ Múltiples Y

Simple Apilar Y’s Apilar Grupos


Gráficos para examinar y comparar distribuciones
✓ Gráfica de Puntos (Una Y, Con Grupos)

• Un ingeniero químico evalúa la calidad del plástico que se utiliza en la manufactura de


bolas de billar. Debido a que es mejor una mayor elasticidad, el ingeniero desea
determinar si cualquiera de dos aditivos mejora la elasticidad del plástico. El ingeniero
prepara 10 muestras con cada uno de los dos aditivos y 10 muestras que no tienen
ningún aditivo y mide la elasticidad de cada una.

• Como parte de la investigación inicial, se decide crear una gráfica de puntos para
comparar la elasticidad de las muestras. Realice la gráfica correspondiente con ayuda
del software Minitab.
Gráfica de Puntos (Una Y, Con Grupos)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Puntos” “Con Grupos” en el ingresar “Elasticidad”; en
apartado de “Una Y”. “Variables categóricas”,
ingresar “Aditivo”.
Gráfica de Puntos (Una Y, Con Grupos)
Gráfico de Probabilidad
✓ Tipos

Individual Múltiple
Gráficos para examinar y comparar distribuciones
✓ Gráfica de Probabilidad Individual

• Un científico que trabaja para una empresa que produce alimentos procesados desea
evaluar el porcentaje de grasa de la salsa embotellada de la empresa. El porcentaje
anunciado es de 15%. El científico mide el porcentaje de grasa en 20 muestras
aleatorias.

• Como parte de la investigación inicial, se desea crear una gráfica de probabilidad para
verificar la normalidad y para evaluar la distribución. Realice la gráfica correspondiente
empleando el software Minitab.
Gráfica de Probabilidad Individual

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Probabilidad” “Individual”. ingresar “Pct. grasa”.
Gráfica de Probabilidad Individual
Sesión 2

Gráficos para
comparar
resúmenes o
valores individuales
de una variable
Gráficos para comparar resúmenes o valores individuales de una variable

Se emplean para comparar valores de resumen o valores de datos individuales. Por ejemplo,
se puede comparar lo siguiente:

✓ Las ventas medias trimestrales de cada uno de los productos de la compañía, por región.
✓ La viscosidad de la pintura producida en la planta de su compañía, por método de
mezclado.

➢ Gráfica de Caja *
➢ Gráfica de Intervalo
➢ Gráfica de Valores Individuales *
➢ Gráfica de Línea *
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfico de Caja

Se emplea para evaluar y comparar la


forma, la tendencia central y la
variabilidad de las distribuciones de la
muestra, y para buscar valores atípicos.
Una gráfica de caja funciona mejor
cuando el tamaño de la muestra es al
menos de 20. Por opción predeterminada,
una gráfica de caja muestra la mediana, el
rango intercuartil, el rango y los valores
atípicos de cada grupo.
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfico de Intervalos

Se emplea para evaluar y comparar los


intervalos de confianza de las medias de
los grupos. Una gráfica de intervalo
muestra un intervalo de confianza de 95 %
de la media de cada grupo. Una gráfica de
intervalo funciona mejor cuando el
tamaño de la muestra es de por lo menos
10 para cada grupo. Generalmente,
mientras más grande es el tamaño de
muestra, más pequeño y más preciso es el
intervalo de confianza.
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Valores Individuales

Se emplea para evaluar y comparar las


distribuciones de datos de la muestra.
Una gráfica de valores individuales
muestra un punto para el valor real de
cada observación en un grupo, lo que
hace que sea más fácil determinar los
valores atípicos y ver la dispersión de la
distribución. Una gráfica de valor
individual funciona mejor cuando el
tamaño de la muestra es menor que 50
aproximadamente.
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Líneas

Se emplea para comparar patrones de


respuesta de una función o de una serie.
Se puede crear una gráfica de línea con
símbolos o sin símbolos, dependiendo del
número de grupos y la longitud de las
series que se desea comparar.
Análisis de Gráficos

• Práctica 6
• Gráficos para comparar resúmenes o valores individuales de una variable.
Gráfica de Caja
✓ Tipos
✓ Una Y

Simple Con Grupos


✓ Múltiples Y

Simple Con Grupos


Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Caja (Una Y – Con Grupos)


• Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante
que produzca el mayor aumento en la altura de las plantas. Para probar las fórmulas
de fertilizantes, un científico prepara tres grupos de 50 plántulas idénticas: un grupo
de control sin ningún tipo de fertilizante, un grupo con el fertilizante del fabricante,
llamado GrowFast, y un grupo con un fertilizante llamado SuperPlant, de un fabricante
de la competencia. Después de que las plantas han permanecido tres meses en un
ambiente de invernadero controlado, el científico mide la altura de las plantas.
• Como parte de la investigación inicial, se crea una gráfica de caja de las alturas de las
plantas de los tres grupos para evaluar las diferencias en el crecimiento entre las
plantas que no recibieron fertilizante, las plantas tratadas con el fertilizante del
fabricante y las plantas que recibieron el fertilizante del fabricante de la competencia.
Desarrolle el gráfico a través de Minitab.
Gráfica de Caja (Una Y – Con Grupos)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Caja” “Con Grupos” en el ingresar “Altura”; en
apartado de “Una Y”. “Variables categóricas”,
ingresar “Fertilizante”.
Gráfica de Caja (Una Y – Con Grupos)
Gráfica de Valores Individuales
✓ Tipos
✓ Una Y

Simple Con Grupos


✓ Múltiples Y

Simple Con Grupos


Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Valores Individuales (Una Y – Con Grupos)


➢ Un ingeniero químico evalúa la calidad del plástico que se utiliza en la manufactura de
bolas de billar. Debido a que es mejor una mayor elasticidad, el ingeniero desea
determinar si cualquiera de dos aditivos mejora la elasticidad del plástico. El ingeniero
prepara 10 muestras con cada uno de los dos aditivos y 10 muestras que no tienen
ningún aditivo y mide la elasticidad de cada una.

➢ Como parte de la investigación inicial, se crea una gráfica de valores individuales para
comparar la elasticidad de las muestras. Realizar el gráfico correspondiente
empleando Minitab.
Gráfica de Valores Individuales (Una Y – Con Grupos)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Valores Individuales” “Con Grupos” en el ingresar “Elasticidad”; en
apartado de “Una Y”. “Variables categóricas”,
ingresar “Aditivo”.
Gráfica de Valores Individuales (Una Y – Con Grupos)
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Valores Individuales (Múltiples Y – Simple)


➢ Un ingeniero especializado en calidad que trabaja en una empresa que produce tubos
de plástico está preocupado por la consistencia de los diámetros de los tubos. El
ingeniero mide 10 tubos por semana de cada una de las dos máquinas utilizadas,
durante tres semanas.

➢ Como parte de la investigación inicial, el ingeniero crea una gráfica de valores


individuales para comparar los diámetros de los tubos medidos cada semana. Genere
el gráfico correspondiente empleando el software Minitab.
Gráfica de Valores Individuales (Múltiples Y – Simple)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Valores Individuales” “Simple” en el apartado ingresar “Semana 1”,
de “Múltiples Y”. “Semana 2”, “Semana 3”.
Gráfica de Valores Individuales (Múltiples Y – Simple)
Gráfico de Líneas
✓ Tipos
✓ Con Símbolos

Una Y Múltiples Y Series en Filas o Columnas


✓ Sin Símbolos

Una Y Múltiples Y Series en Filas o Columnas


Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Líneas (Con Símbolos – Una Y)


➢ Un ingeniero especializado en calidad que trabaja en una empresa de textiles desea
determinar los factores que afectan la resistencia de una fibra sintética a la rotura. El
ingeniero selecciona de forma aleatoria una muestra de la producción de cuatro
máquinas y tres operadores.

➢ El ingeniero crea una gráfica de línea con símbolos para comparar la resistencia media
de las fibras de los grupos y buscar posibles interacciones. Obtenga el gráfico
correspondiente empleando el software Minitab.
Gráfica de Líneas (Con Símbolos – Una Y)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Líneas” “Una Y” en el apartado ingresar “Resistencia”; en
“Con símbolos”. “Variables categóricas (Escala X)”,
ingresar “Operador”; en
“Variables categóricas
(Leyendas)”, ingresar “Máquina”.
Gráfica de Líneas (Con Símbolos – Una Y)
Gráficos para comparar resúmenes o valores individuales de una variable

✓ Gráfica de Líneas (Sin Símbolos – Series o Columnas)


➢ Un ingeniero especializado en calidad desea comparar los perfiles de cromatograma
de muestras de gasolina a diferentes octanajes. Un perfil irregular indica posibles
problemas de calidad. El ingeniero evalúa muestras de nueve octanajes y registra los
valores de 36 componentes diferentes.

➢ El ingeniero crea una gráfica de línea sin símbolos para comparar los patrones de
respuesta de las muestras de diferentes octanos.
Gráfica de Líneas (Sin Símbolos – Series o Columnas)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Líneas” “Series en filas o ingresar “900 - 1600”; en
columnas” en el “Columna de etiquetas”, ingresar
apartado “Sin símbolos”. “Octanaje”; en “Organización de
series”, seleccionar “Cada fila
forma una serie”.
Gráfica de Líneas (Sin Símbolos – Series o Columnas)
Sesión 2

Gráficos para
evaluar la
distribución de
conteos
Gráficos para evaluar la distribución de conteos
Se emplean para graficar conteos de valores únicos. Por ejemplo, puede graficar lo siguiente:

✓ El número de cada tipo de defectos que causó el rechazo de las partes fabricadas.
✓ El número de votos que cada candidato recibió en una elección.

➢ Gráfica de Barras *
➢ Gráfica Circular *
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras

Se emplea para comparar los conteos, las


medianas u otras estadísticas resumen,
utilizando barras para representar grupos
o categorías. La altura de las barras
muestra el conteo, la función variable
(mediana, suma, desviación estándar y así
sucesivamente) o el valor resumen del
grupo.
Gráficos para evaluar la distribución de conteos
✓ Gráfica Circular

Se emplea para comparar la proporción


de datos en cada categoría o grupo. Una
gráfica de pastel es una circunferencia
("pastel") que se divide en segmentos
("rebanadas") para representar la
proporción de observaciones que están en
cada categoría.
Análisis de Gráficos

• Práctica 7
• Gráficos para evaluar la distribución de conteos.
Gráfica de Barras
✓ Tipos

• Conteo de Valores Únicos

Simple Conglomerado Pila


Gráfica de Barras
✓ Tipos
• Una Función de una Variable (Una Y)

Simple Conglomerado Pila


• Una Función de una Variable (Múltiples Y)

Simple Conglomerado Pila


Gráfica de Barras
✓ Tipos
• Valores de una Tabla (Una Columna de Valores)

Simple Conglomerado Pila


• Valores de Una Tabla (Tabla de Dos Factores)

Conglomerado Pila
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras (Conteo de Valores Únicos - Simple)

➢ Un ingeniero especializado en calidad que trabaja para un proveedor de partes para


automóviles desea reducir el número de paneles para puertas de automóvil que son
rechazados debido a defectos de pintura. Como parte de la investigación inicial, el
ingeniero crea una gráfica de barras para comparar los conteos de defectos de
pintura. Genere el gráfico correspondiente empleando el software Minitab.
Gráfica de Barras (Conteo de Valores Únicos - Simple)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables categóricas”,


de Barras” “Simple” en el apartado ingresar “Defectos”.
“Conteos de Valores
Únicos”.
Gráfica de Barras (Conteo de Valores Únicos - Simple)
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras (Función Variable Una Y - Conglomerado)

➢ Una ingeniera de diseño electrónico estudia el efecto de la temperatura de operación


y de tres tipos de cristal de placa frontal en la salida de luz de un tubo de osciloscopio.
Como parte de la investigación inicial, la ingeniera crea una gráfica de barras para
comparar la salida de luz que se produce con diferentes combinaciones de
temperatura y tipo de cristal. Genere el gráfico correspondiente usando Minitab.
Gráfica de Barras (Función Variable Una Y - Conglomerado)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Barras” “Conglomerado” en el ingresar “SalidaLuz”; en
apartado “Una Y” de “Variables categóricas”, ingresar
“Una función de una “Temperatura” y “TipoVidrio”.
variable”.
Gráfica de Barras (Función Variable Una Y - Conglomerado)
Gráficos para evaluar la distribución de conteos
✓ Gráfica de Barras (Valores Tabla 2 Factores - Conglomerado)

➢ En una fábrica de paraguas, los mangos de los paraguas se miden y luego se retiran de
la línea de ensamble si no cumplen con las especificaciones. Un informe diario indica
cuántos mangos rechazados fueron producidos por cada una de las tres prensas de la
fábrica durante cada uno de los tres turnos. Un ingeniero especializado en calidad
quiere determinar si la prensa y el turno están asociados. Como parte de la
investigación inicial, el ingeniero crea una gráfica de barras para comparar el número
de mangos rechazados para cada máquina y turno. Genere el gráfico correspondiente
empleando Minitab.
Gráfica de Barras (Valores Tabla 2 Factores - Conglomerado)

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variables de gráficas”,


de Barras” “Conglomerado” en el ingresar “1er turno”, “2do turno”,
apartado “Tabla de 2 “3er turno”; en “Etiquetas de
factores” de “Valores de filas”, ingresar “Máquina”.
una tabla”.
Gráfica de Barras (Valores Tabla 2 Factores - Conglomerado)
Gráficos para evaluar la distribución de conteos
✓ Gráfica Circular

➢ Un ingeniero especializado en calidad que trabaja para un proveedor de partes para


automóviles desea reducir el número de paneles para puertas de automóvil que son
rechazados debido a defectos de pintura. Como parte de la investigación inicial, el
ingeniero crea una gráfica de pastel para comparar los conteos de defectos en cada
categoría. Desarrolle el gráfico correspondiente empleando Minitab.
Gráfica Circular

• Abrir “Gráfica” / • En “Variables categóricas”, ingresar “Defectos”.


“Gráfica Circular”
Gráfica Circular
Sesión 2

Gráficos para
analizar una serie
de datos en el
tiempo
Gráficos para analizar una serie de datos en el tiempo
Se emplean para ver patrones en los datos en el tiempo. Por ejemplo, es posible utilizar
estas herramientas para examinar las ventas mensuales de una empresa.

➢ Gráfica de Series de Tiempo *


➢ Gráfica de Área
Gráficos para analizar una serie de datos en el tiempo
✓ Gráfica de Series de Tiempo

Se emplea para buscar patrones en datos


a lo largo del tiempo, como son
tendencias o patrones estacionales. Una
gráfica de serie de tiempo ayuda a elegir
un análisis de serie de tiempo para
modelar los datos.
Gráficos para analizar una serie de datos en el tiempo
✓ Gráfica de Área

Se emplea para representar en una gráfica


la suma acumulada de los grupos en
orden cronológico y evaluar cómo
contribuye cada grupo a la totalidad. Las
gráficas de área muestran múltiples series
de tiempo apiladas en el eje Y versus
intervalos de tiempo con igual separación
en el eje X. Cada línea de la gráfica
representa la suma acumulada, de
manera que es posible ver la contribución
de cada serie a la suma y cómo cambia la
composición de la suma en el tiempo.
Análisis de Gráficos

• Práctica 8
• Gráficos para analizar una serie de datos en el tiempo.
Gráfica de Series de Tiempo
✓ Tipos

Simple Con Grupos

Múltiple Múltiple Con Grupos


Gráficos para evaluar la distribución de conteos
✓ Gráfica de Series de Tiempo – Múltiple

➢ Un corredor de bolsa compara el rendimiento mensual de dos acciones durante los


últimos dos años. El corredor de bolsa crea una gráfica de series de tiempo para
visualizar el rendimiento de las dos acciones. Realice el gráfico empleando el software
Minitab.
Gráfica de Series de Tiempo – Múltiple

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Serie”, ingresar “Empresa A”


de Serie de Tiempo” “Múltiple”. y “Empresa B”
Gráfica de Series de Tiempo – Múltiple
Sesión 2

Gráficos para
examinar
relaciones entre
tres variables
Gráficos para examinar relaciones entre tres variables
Se emplean para ver tres variables en una misma gráfica. Por ejemplo, puede evaluar cómo
la temperatura y la humedad afectan los tiempos de secado de una pintura.

➢ Gráfica de Contorno
➢ Gráfica de Dispersión 3D
➢ Gráfica de Superficie 3D *
Gráficos para examinar relaciones entre tres variables
✓ Gráfica de Contorno

Se emplea para examinar la relación entre


una variable de respuesta y dos variables
predictoras. En una gráfica de contorno,
los valores para dos variables predictoras
se representan en los ejes X e Y, y los
valores para la variable de respuesta se
representan mediante regiones
sombreadas, llamadas contornos. Una
gráfica de contorno es como un mapa
topográfico en el cual se grafican los
valores X, Y y Z, en lugar de la longitud, la
latitud y la altitud.
Gráficos para examinar relaciones entre tres variables
✓ Gráfica de Dispersión 3D

Se emplea para examinar la relación entre


una variable de respuesta (Z) y dos
variables predictoras (X y Y) observando
los datos en los tres ejes.
Gráficos para examinar relaciones entre tres variables
✓ Gráfica de Superficie 3D

Se emplea para examinar la relación entre


una variable de respuesta (Z) y dos
variables predictoras (X e Y) en una
superficie tridimensional de la respuesta
pronosticada. Es posible elegir
representar la respuesta pronosticada
como una superficie suave o de malla.
Análisis de Gráficos

• Práctica 9
• Gráficos para examinar relaciones entre tres variables.
Gráficos para examinar relaciones entre tres variables.
✓ Gráfica de Superficie 3D – Superficie

➢ Un científico de alimentos desea determinar el tiempo y la temperatura óptimos para


calentar una cena congelada. El científico prepara 14 muestras con diferentes tiempos
y temperaturas y luego pide a degustadores profesionales de alimentos que califiquen
la calidad general de cada muestra. El científico crea una gráfica de superficie 3D para
examinar los resultados. Genere el gráfico empleando Minitab.
Gráfica de Superficie 3D – Superficie

• Abrir “Gráfica” / “Gráfica • Seleccionar la opción • En “Variable Z”, ingresar


de Superficie 3D” “Superficie”. “Calidad”; en “Variable Y”,
ingresar “Temp.”; en “Variable X”,
ingresar “Tiempo”.
Gráfica de Superficie 3D – Superficie
Dudas

• Preguntas

• Comentarios

• Quejas

• Sugerencias

• Traumas Gráficos
Gracias Por su Asistencia

Hasta Mañana
Sesión 4

• Regresión Lineal Simple


• Prueba de normalidad
• Gráfica de línea ajustada
• Ajuste de modelo de regresión
• Gráficas factoriales
• Predicción
• Optimizador de respuesta
• Correlación
• Pearson
• Spearman
Regresión Lineal
• Análisis de Regresión

• Un análisis de regresión genera una ecuación para describir la relación estadística


entre uno o más predictores y la variable de respuesta y para predecir nuevas
observaciones.

• La regresión lineal generalmente utiliza el método de estimación de mínimos


cuadrados ordinarios, del cual se obtiene la ecuación al minimizar la suma de los
residuos al cuadrado.
Regresión Lineal
• Análisis de Regresión
• Los resultados de la regresión identifican la dirección, el tamaño y la significancia
estadística de la relación entre un predictor y una respuesta.
• El signo de cada coeficiente indica la dirección de la relación.
• Los coeficientes representan el cambio medio en la respuesta para una unidad de
cambio en el predictor mientras se mantienen constantes otros predictores incluidos
en el modelo.
• El valor p de cada coeficiente prueba la hipótesis nula de que el coeficiente es igual a
cero (sin efecto). Por lo tanto, los valores p bajos indican que el predictor es una
adición significativa al modelo.
• La ecuación predice nuevas observaciones dados los valores predictores
especificados.
Sesión 4

Regresión
Lineal
Simple
Regresión Lineal Simple
• Regresión Lineal Simple
• Examina la relación lineal entre dos variables continuas: una respuesta (Y) y un
predictor (X).
• Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta
a partir de un valor predictor con una exactitud mayor que la asociada únicamente a
las probabilidades.
• La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se
puede utilizar después para:
• Examinar cómo cambia la variable de respuesta a medida que cambia la variable
predictora.
• Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora
(X).
Regresión Lineal Simple
• Método de Mínimos Cuadrados

• Modelo de Regresión Lineal Simple


𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
Regresión Lineal Simple
• Consideraciones
• Los predictores pueden ser continuos o categóricos.
• La variable de respuesta debe ser continua.
• La recolección de datos debe ser adecuada.
• La correlación entre los predictores, también conocida como multicolinealidad (FIV), no
debe ser severa.
• El modelo debe proveer un ajuste adecuado a los datos.
• Se posee un tamaño de muestra adecuado.
• Normalidad en los datos.
Regresión Lineal Simple

• Práctica 14
• Análisis de Regresión Lineal Simple
Regresión Lineal Simple

• La prueba de acondicionamiento físico es un aspecto importante del entrenamiento


atlético. Una medida común para determinar la aptitud cardiovascular es el volumen
máximo de oxígeno que se inhala al realizar un ejercicio extenuante. Se realizo un
estudio con 24 hombres de mediana edad para analizar como el tiempo que les
tomaba correr una distancia de dos millas influía en el oxígeno que consumían, el cual
se midió con métodos estándar de laboratorio mientras los sujetos se ejercitaban en
una banda sin fin. El trabajo fue publicado en el artículo “Maximal Oxygen Intake
Prediction in Young and Middle Aged Males”, Journal of Sports Medicine 9, 1969, 17-
22. Realice un análisis completo de regresión e interprételo a detalle.
Regresión Lineal Simple
1. Prueba de Normalidad

2. Gráfica de Línea Ajustada

3. Ajustar Modelo de Regresión

4. Gráficas Factoriales

5. Predictor y Optimizador de Respuesta


Prueba de Normalidad

Prueba Uso
Detectar desviaciones en las colas de la
Anderson-Darling
distribución
Muestras menores o iguales a 50
Ryan-Jones (similar a Shapiro-Wilk)
elementos
Kolmogorov-Smirnov Muestras mayores a 50 elementos

• Hipótesis
• 𝐻0 : Los datos siguen la distribución especificada
• 𝐻1 : Los datos no siguen la distribución especificada
Prueba de Normalidad

• Abrir “Estadísticas” / • Introducir en “Variable”, • Seleccionar la prueba de


“Estadísticas Básicas” / la columna “Volumen normalidad a emplear
“Prueba de Normalidad” Máximo de O2” (en este caso, usaremos
“Anderson-Darling”)
Prueba de Normalidad

Decisión Estadística:
𝑯𝟎 se acepta, dado que
𝒑 > 𝜶 (. 𝟕𝟑𝟕 >. 𝟎𝟓)

Conclusión:
Los datos presentan
una distribución normal
Gráfica de Línea Ajustada

• Abrir “Estadísticas” / • Introducir en “Respuesta (Y)”, la columna


“Regresión” / “Gráfica “Volumen Máximo de O2”; en “Predictor (X)”,
de Línea Ajustada” la columna “Tiempo en Segundos”; en “Tipo
de modelo de regresión”, seleccionar “Lineal”
Gráfica de Línea Ajustada

Observaciones:
• Correlación Lineal
Negativa
• Correlación entre
moderada y fuerte
• Algunos datos dispersos
• Coeficiente de
Correlación de Pearson
−. 𝟖𝟏𝟐 . 𝟔𝟔
Ajustar Modelo de Regresión

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Ajustar Modelo de Regresión”


Ajustar Modelo de Regresión

• En “Respuestas”, introducir “Volumen Máximo de O2”; en “Predictores Continuos”, introducir


“Tiempo en Segundos”
Ajustar Modelo de Regresión

• En la opción “Gráficas”, seleccionar “Pareto”;


en “Residuos para Gráficas” seleccionar
“Estandarizado” y en “Gráficas de residuos”,
seleccionar “Residuos vs ajustes”
Ajustar Modelo de Regresión

Análisis:
• Ecuación: 𝒚
ෝ = 𝟗𝟎. 𝟖𝟗 − 𝟎. 𝟎𝟓𝟏𝟑𝟑𝒙
• Ambos términos son significativos en el
modelo, dado que 𝒑 < 𝜶, por lo cual, se
justifica su presencia en la ecuación de
regresión.
• El ajuste del modelo no es adecuado, dado
que únicamente el 65.99% de la variación de
la variable respuesta se atribuye al predictor
analizado (mínimo debe ser 70%).
Ajustar Modelo de Regresión

Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶. En este caso como sólo
tiene un predictor, sus valores son similares
al modelo.
• La suma de cuadrados del error es alta; por
ello la falta de ajuste del modelo.
• Se presentan observaciones atípicas en el
modelo, ya sea con residuos grandes o bien,
poco comunes.
Ajustar Modelo de Regresión

Análisis:
• El predictor es significativo
en el modelo de regresión.
Ajustar Modelo de Regresión

Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Gráficas Factoriales

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Gráficas Factoriales”


Gráficas Factoriales

• En “Respuestas”, seleccionar “Volumen Máximo • En el botón “Gráficas”, seleccionar


de O2”; en “Variables que serán incluidas en las “Gráfica de efectos principales”
gráficas”, seleccionar “Tiempo en Segundos”
Gráficas Factoriales

Análisis:
• La correlación lineal es
negativa, de forma que
conforme aumenta el
tiempo en segundos,
disminuye el volumen
máximo de O2.
Predictor

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Predecir”


Predictor

• En “Respuestas”, seleccionar
“Volumen Máximo de O2”;
en “Tiempo en Segundos”,
ingresar el valor de “x” del
cual se quiere obtener la
predicción.
Predictor

Análisis:
• El modelo indica que a los 58
segundos, se tendría un volumen
máximo de O2 de 87.9130.
• Es posible encontrar dicho valor en un
intervalo de 75.3034 a 100.523, con un
95% de confiabilidad.
• Para observaciones futuras, es posible
encontrar el valor O2 a los 58 segundos
en un intervalo de 75.3705 a 102.456.
Optimizador de Respuesta

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Optimizador de respuesta”


Optimizador de Respuesta

• En “Meta”, seleccionar alguna de las


cuatro opciones disponibles:
• No optimizar
• Máximo
• Mínimo
• Objetivo
Optimizador de Respuesta – Minimizar

Análisis:
• El valor mínimo de O2 se dará a los 1045
segundos, con un valor de 37.25.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 33.39 y
41.10, a los 1045 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 29.04 y 45.45.
Optimizador de Respuesta – Maximizar

Análisis:
• El valor máximo de O2 se dará a los 683
segundos, con un valor de 55.83.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 53.06 y
58.60, a los 683 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 48.07 y 63.58.
Receso

• Volvemos en 15 minutos
Regresión Lineal Simple

• En una industria se desea investigar Temperatura Presión


cómo influye la temperatura (°C) en la 13 2.9
presión del vapor de B-trimetilboro, los 19.5 5.1
datos obtenidos para tal propósito se 45.7 30.5
muestran en la siguiente tabla. 56.1 51.4
64.4 74.5
71.4 100.2
• Realice un análisis completo de 80.5 143.7
regresión e interprételo a detalle. 85.7 176.9
22.5 8.5
27.2 10.3
31.8 14.6
Sesión 4

Correlación
Correlación
• Correlación
• Se emplea para medir la fuerza y la dirección de la asociación entre dos variables.
• La correlación de Pearson (también conocida como r), que es el método más común,
mide la relación lineal entre dos variables continuas. Una relación es lineal cuando un
cambio en una variable se asocia con un cambio proporcional en la otra variable.
• La correlación de Spearman mide la relación monótona entre dos variables continuas
o dos variables ordinales. En una relación monótona, las variables tienden a cambiar
al mismo tiempo, pero no necesariamente a un ritmo constante. El coeficiente de
correlación de Spearman se basa en los valores jerarquizados de cada variable y no en
los datos sin procesar.
Correlación
• Consideraciones
• Los datos deben incluir al menos 2 columnas de datos numéricos o de fecha/hora.
• Los datos deben ser continuos u ordinales.
• El tamaño de la muestra debe ser de medio a grande, n ≥ 25.
• La relación entre las variables debe ser lineal (Pearson) o monótona (Spearman).
• Los valores poco comunes pueden tener un gran efecto en los resultados.
• La correlación de Pearson es más sensible a las desviaciones de la normalidad, en
tanto que la correlación de Spearman es más robusta a éstas.
Correlación
• Correlación Lineal • Correlación Monótona
Correlación
• Interpretación Coeficiente de Correlación de Pearson
Correlación
• Interpretación Coeficiente de Correlación de Spearman
Correlación

• Práctica 15
• Análisis de Correlación
Correlación

• Los solicitantes de préstamo deben proporcionar a un banco los ocho datos siguientes:
ingresos, nivel de educación, edad, tiempo viviendo en la residencia actual, tiempo
trabajando para el empleador actual, ahorros, deuda y número de tarjetas de crédito.
El administrador del banco desea analizar estos datos para determinar la mejor
manera de agruparlos y comunicarlos. El administrador recopila esta información para
30 solicitantes de préstamo.

• El administrador del banco utiliza la correlación de Pearson para examinar la fuerza y la


dirección de la relación lineal entre cada par de variables. Realice el análisis
empleando Minitab.
Correlación

• Abrir “Estadísticas” / • En el cuadro de blanco, • En “Opciones”,


“Estadísticas Básicas” / introducir desde “Edad” hasta seleccionar el método
“Correlación” “Tarj Crédito”. de “Pearson”.
Correlación

Análisis:
• Correlaciones positivas fuertes:
• Residencia – Edad (.838)
• Empleo – Edad (.848)
• Empleo – Residencia (.952)
• Correlaciones negativas:
• Tarj. Crédito – Edad (-.130)
• Deuda - Ahorros (-.393)
• Tarj. Crédito – Ahorros (-.410)
Correlación
Correlación

• Las cifras que se listan en la tabla Contenido de Contenido de


siguiente, publicadas por la Comisión Marca
Alquitrán Nicotina
Federal de Comercio, muestran los Viceroy 14 0.9
miligramos de alquitrán y nicotina que Marlboro 17 1.1
se encontraron en 10 marcas de Chesterfield 28 1.6
cigarrillos. Calcule el coeficiente de Kool 17 1.3
correlación de rangos para medir el Kent 16 1.0
grado de relación entre el contenido de Raleigh 13 0.8
alquitrán y de nicotina en cigarrillos, Old Gold 24 1.5
Philip Morris 25 1.4
empleando Minitab.
Oasis 18 1.2
Players 31 2.0
Correlación

• Abrir “Estadísticas” / • En el cuadro de blanco, • En “Opciones”,


“Estadísticas Básicas” / introducir “Contenido de seleccionar el método
“Correlación” Alquitrán” y “Contenido de de “Spearman”.
Nicotina”.
Correlación

Análisis:
• Correlación positiva muy
fuerte (.967)
Dudas

• Preguntas

• Comentarios

• Quejas

• Sugerencias

• Traumas de Regresión
Gracias Por su Asistencia

¡Ya casi terminamos!


Sesión 5

• Regresión Lineal Múltiple


• Prueba de normalidad
• Ajuste de modelo de regresión
• Gráficas factoriales
• Predicción
• Optimizador de respuesta
• Modelos de Regresión No Lineal
• Regresión Múltiple con Interacciones
Sesión 5

Regresión
Lineal
Múltiple
Regresión Lineal Múltiple
• Regresión Lineal Múltiple
• Examina las relaciones lineales entre una respuesta continua y dos o más predictores.
• Si el número de predictores es grande, antes de ajustar un modelo de regresión con
todos los predictores, se deberían utilizar las técnicas de selección de modelo paso a
paso o de los mejores subconjuntos para excluir los predictores que no estén
asociados con las respuestas.

• Modelo de Regresión Lineal Múltiple


𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑛 𝑥𝑛 + 𝜀
Regresión Lineal Múltiple
• Consideraciones
• Los predictores pueden ser continuos o categóricos.
• La variable de respuesta debe ser continua.
• La recolección de datos debe ser adecuada.
• La correlación entre los predictores, también conocida como multicolinealidad (FIV), no
debe ser severa.
• El modelo debe proveer un ajuste adecuado a los datos.
• Se posee un tamaño de muestra adecuado.
• Normalidad en los datos.
Regresión Lineal Múltiple

• Práctica 16
• Análisis de Regresión Lineal Múltiple
Regresión Lineal Múltiple

• Un investigador químico desea entender cómo se asocian diferentes predictores y la


resistencia a las arrugas de la tela de algodón. El químico examina 32 piezas de
celulosa de algodón a diferentes configuraciones de tiempo de curado, temperatura de
curado, concentración de formaldehído y relación de catalizador. Se registró la
calificación del planchado permanente, una medida de resistencia a las arrugas, para
cada producto.

• El químico realiza un análisis de regresión múltiple para ajustar un modelo con los
predictores y eliminar los predictores que no tienen una relación estadísticamente
significativa con la respuesta. Realice el análisis correspondiente.
Regresión Lineal Múltiple
1. Prueba de Normalidad

2. Ajustar Modelo de Regresión

3. Gráficas Factoriales

4. Predictor

5. Optimizador de Respuesta
Prueba de Normalidad

Prueba Uso
Detectar desviaciones en las colas de la
Anderson-Darling
distribución
Muestras menores o iguales a 50
Ryan-Jones (similar a Shapiro-Wilk)
elementos
Kolmogorov-Smirnov Muestras mayores a 50 elementos

• Hipótesis
• 𝐻0 : Los datos siguen la distribución especificada
• 𝐻1 : Los datos no siguen la distribución especificada
Prueba de Normalidad

• Abrir “Estadísticas” / • Introducir en “Variable”, • Seleccionar la prueba de


“Estadísticas Básicas” / la columna “Calificación” normalidad a emplear
“Prueba de Normalidad” (en este caso, usaremos
“Anderson-Darling”)
Prueba de Normalidad

Decisión Estadística:
𝑯𝟎 se rechaza, dado
que 𝒑 < 𝜶

Conclusión:
Los datos no presentan
una distribución normal
Ajustar Modelo de Regresión

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Ajustar Modelo de Regresión”


Ajustar Modelo de Regresión

• En “Respuestas”, introducir “Calificación”; en “Predictores Continuos”, introducir desde


“Concentración” hasta “Tiempo”
Ajustar Modelo de Regresión

• En la opción “Gráficas”, seleccionar “Pareto”;


en “Residuos para Gráficas” seleccionar
“Estandarizado” y en “Gráficas de residuos”,
seleccionar “Residuos vs ajustes”
Ajustar Modelo de Regresión

Análisis:
• Ecuación: 𝒚ෝ = −. 𝟕𝟓𝟔+. 𝟏𝟓𝟒𝟓𝒙𝟏+. 𝟐𝟏𝟕𝟏𝒙𝟐+. 𝟎𝟏𝟎𝟖𝟏𝒙𝟑+. 𝟎𝟗𝟒𝟔𝒙𝟒
• Los términos significativos en el modelo son: la
concentración, la relación y la temperatura,
dado que 𝒑 < 𝜶; el término constante y el
tiempo no son significativos.
• El ajuste del modelo no es adecuado, dado que
únicamente el 68.90% de la variación de la
variable respuesta se atribuye al predictor
analizado (mínimo debe ser 70%).
Ajustar Modelo de Regresión

Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶. En este caso como sólo
tiene un predictor, sus valores son similares
al modelo.
• Los predictores significativos del modelo
son: concentración, relación y temperatura.
• La suma de cuadrados del error es alta; por
ello la falta de ajuste del modelo.
Ajustar Modelo de Regresión

Análisis:
• Los predictores significativos
son los factores A, B y C.
Ajustar Modelo de Regresión

Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Ajustar Modelo de Regresión

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Ajustar Modelo de Regresión”


Ajustar Modelo de Regresión

• En “Respuestas”, introducir “Calificación”; en “Predictores Continuos”, introducir desde


“Concentración” hasta “Tiempo”
Ajustar Modelo de Regresión

• En “Modelo”, desmarcar “Incluir el • En “Paso a paso”, elegir “Eliminación hacia


término de constante en el modelo”. atrás”, con un alfa a retirar de “.05”.
Ajustar Modelo de Regresión

• En la opción “Gráficas”, seleccionar “Pareto”;


en “Residuos para Gráficas” seleccionar
“Estandarizado” y en “Gráficas de residuos”,
seleccionar “Residuos vs ajustes”
Ajustar Modelo de Regresión

Análisis:
• Ecuación: 𝒚
ෝ =. 𝟏𝟒𝟎𝟏𝒙𝟏 +. 𝟐𝟏𝟑𝟑𝒙𝟐 +. 𝟎𝟎𝟖𝟖𝟔𝒙𝟑
• Los términos significativos en el modelo son: la
concentración, la relación y la temperatura,
dado que 𝒑 < 𝜶.
• Existen variables que presentan
multicolinealidad.
• El ajuste del modelo es adecuado, dado que el
94.99% de la variación de la variable respuesta
se atribuye a los predictores analizados.
Ajustar Modelo de Regresión

Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶.
• La suma de cuadrados del error es baja; se
presenta un alto ajuste del modelo.
• Existe una observación con residuo grande.
Ajustar Modelo de Regresión

Análisis:
• Los predictores significativos
son los factores A, B y C.
Ajustar Modelo de Regresión

Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Ajustar Modelo de Regresión

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Ajustar Modelo de Regresión”


Ajustar Modelo de Regresión

• En “Respuestas”, introducir “Calificación”; en “Predictores Continuos”, introducir desde


“Concentración” hasta “Tiempo”
Ajustar Modelo de Regresión

• En “Modelo”, eliminar “Conc” de “Términos en el modelo”.


Ajustar Modelo de Regresión

Análisis:
• Ecuación: 𝒚
ෝ =. 𝟐𝟐𝟓𝟑𝒙𝟐 +. 𝟎𝟏𝟒𝟎𝟓𝒙𝟑
• Los términos significativos en el modelo son: la
relación y la temperatura, dado que 𝒑 < 𝜶.
• Existen variables que presentan
multicolinealidad.
• El ajuste del modelo es adecuado, dado que el
94.26% de la variación de la variable respuesta
se atribuye a los predictores analizados.
Ajustar Modelo de Regresión

Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶.
• La suma de cuadrados del error es baja; se
presenta un alto ajuste del modelo.
• Existe una observación con residuo grande.
Ajustar Modelo de Regresión

Análisis:
• Los predictores significativos
son los factores B y C.
Ajustar Modelo de Regresión

Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Gráficas Factoriales

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Gráficas Factoriales”


Gráficas Factoriales

• En “Respuestas”, seleccionar “Calificación”; en • En el botón “Gráficas”, seleccionar


“Variables que serán incluidas en las gráficas”, “Gráfica de efectos principales”
seleccionar todas las variables.
Gráficas Factoriales

Análisis:
• Ambos predictores son
positivos, de forma que a
mayor valor del predictor,
mayor será también la
variable respuesta.
Predictor

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Predecir”


Optimizador de Respuesta

• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Optimizador de respuesta”


Receso

• Volvemos en 15 minutos
Sesión 5

Modelos de
Regresión No Lineal
– Regresión
Múltiple con
Interacciones
Dudas

• Preguntas

• Comentarios

• Quejas

• Sugerencias

• Traumas Múltiples
Gracias Por su Asistencia

¡Felicidades! Terminamos

También podría gustarte