Sesión 3
Sesión 3
CARLOS GRAJEDA R.
Contenido
• Etapa Analizar
• Diagrama Causa-Efecto y 5 Por qué
• Regla de Pareto o regla del 80-20
• Regresión y correlación lineal simple y múltiple
Fase Analizar
• Para el proceso seleccionado, identificar las brechas del desempeño actual y el desempeño
deseado.
• Analizar las fuentes de variación que contribuyen en la brecha.
• Determinar los impulsores/drivers. Las pequeñas x que se correlacionan con los requisitos del
cliente (CTQ, CTS, CTC, etc.) e influyen significativamente en el proceso seleccionado.
• Emplear técnicas de bechmarking para identificar las mejores practicas del sector o de otros
sectores.
Fase Analizar
“En esta etapa mediante los datos analizados se puede revelar la naturaleza y el
comportamiento básico del proceso, y mostrar que tan capaz y estable es el
proceso en el tiempo. Por ejemplo, ¿el problema es esporádico o persistente? O el
problemas ¿Esta relacionado con la tecnología o con el proceso mismo?”
Tomado de: Munro, R. A., Maio, M. J., Nawaz, M. B., Ramu, G. & Zrymiak, D. J. (2008). The Certified
Six Sigma Green Belt Handbook. Milwaukee, Wisconsin. ASQ Quality Press.
Diagrama de Causa – Efecto / Ishikawa / FishBone
Es una técnica gráfica que enumera y organiza las posibles causas o contribuciones a un
problema.
Utilidad
«Problema»
Síntoma o
efecto
1. Definir clara y
concretamente el
problema
«Problema»
Síntoma o
efecto
2. Asegurarse que
el problema es
medible /
cuantificable
Segundo Paso. Generar ideas
«Problema»
Síntoma o
efecto
Generar ideas, hipótesis
o supuestos que
generan el problema
Tercer Paso. Los seis factores de variación
«Problema»
Síntoma o
efecto
Técnica de los 5 Por qué?
Factor 1 2 3 4 5
¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué?
Hombre
Maquina
Método
Materiales
Medición
Medioambiente
Video de Jefferson Memorial
Análisis de causa raíz en el Jefferson Memorial
Demoras en la entrega
de pizzas a domicilio
los viernes y sábados
Métodos Materiales
Diagrama de causa - efecto
Métodos Materiales
Diagrama de causa - efecto
Métodos Materiales
Complemento
Condiciones de variación
• Perfil de puesto definido = competencias mínimas. • ¿Se ha definido el flujo de trabajo del proceso?
• ¿Personal conoce sus funciones y objetivos del puesto? • ¿Se han definido procedimientos o instrucciones de
• Habilidad (¿los operadores han demostrado tener • ¿Documentos de trabajo: formatos, plantillas,
especificaciones, etc.?
habilidad para el trabajo que realizan?).
• ¿Especificaciones de los productos intermedios y final?
• ¿La gente está motivada?
• ¿Especificaciones de almacenamiento de materiales?
• ¿Conocen la importancia de su trabajo por la calidad?
• ¿ Se han definido acciones frente a situaciones
atípicas?
Condiciones de variación
• ¿Las maquinas tienen mantenimiento preventivo? • ¿Se han identificado los materiales/proveedores
• ¿Las maquinas han sido modificadas? críticos?
• ¿Se mide y mejora la eficiencia de las maquinas? • ¿Se tienen las especificaciones de los materiales
• ¿Las maquinas están correctamente instaladas? críticos?
• ¿Existen procedimientos/especificaciones de • ¿ Se conocen las condiciones optimas de
operación? almacenamiento y transporte de los materiales?
• ¿Se han definido las especificaciones mínimas de • ¿Se conoce cómo afectan los materiales de
los materiales/insumos para el optimo diferentes proveedores en el desempeño del
funcionamiento de los equipos? procesos/maquinas?
Condiciones de variación
Es una gráfica de barras en las que se acomodan en orden descendente. El orden de las barras
refleja la importancia de las causas o categorías que se asocian con las barras.
Utilidad
• Ayuda a establecer prioridades respecto a los problemas a resolver en primer lugar.
• Ayuda a identificar el 80 % de los problemas que resultan solamente del 20 % de sus causas
potenciales.
• Enfoca en la “vitalidad” de los pocos y no en la “trivialidad” de los muchos.
Proporciones de la Regla de Pareto
Causas
Causas
20% Causas
30%
40%
Problemas Problemas Problemas
80% 70% 60%
2. Con respecto al problema vital, haga Paretos de segundo nivel (causas) tanto
para máquina como para turno.
3. Vuelva a realizar los análisis anteriores, pero considerando que la gravedad del
problema desde el punto de vista del cliente es la siguiente: falta de vacío (6),
mancha verde (10), mancha amarilla (8).
PROBLEMA Y NUMERO DE PAQUETES
Máquina
Turno DEFECTUOSOS
empacadora
Falta de vacío Mancha verde Mancha amarilla
I 4300 700 700
A
II 6300 650 650
I 3500 700 400
B
II 6600 500 420
I 8500 800 324
C
II 9120 655 345
Total 38,320 4,005 2,839 45,164
Porcentaje 85% 9% 6% 100%
% acum 85% 94% 100%
Máquina
Total % % Acum.
empacadora
C 17,620 46% 46%
• Definición
• Regresión Lineal Simple
• Regresión Lineal Múltiple
Análisis del Proceso
Entradas Salidas
Tangibles o A1 A2 A3 Tangibles o
Intangibles Intangibles
Procesos
Y = f (x)
Análisis de regresión
CORRELACION POSITIVA
Un incremento en “Y” depende de un incremento en “X”.
Entrenamiento vs. Desempeño.
Tipos de Correlación
CORRELACION NEGATIVA
Un aumento en “X” causará una disminución en “Y”, por lo tanto,
como en el punto 1, “X” puede ser controlada en lugar de “Y”.
Tipos de Correlación
NO HAY CORRELACION
No hay correlación. “Y” puede depender de otra variable
0.94
0.93
0.92 y = mx + b
0.91
0.9
0.89
0.88
0.87
0.86
8 8.2 8.4 8.6 8.8 9 9.2 9.4 9.6
Donde:
y = variable dependiente o respuesta
OJO
x = variables independiente o predictora
Emplear misma cantidad de datos para las
𝛽1 = pendiente de la recta variables X y Y.
𝛽0 = intersección de la recta. Si, x = 0
Interpretación del valor de “R”. Coeficiente de correlación
“Un valor grande de R2 no implica necesariamente que el modelo de regresión sea adecuado.
Siempre que se agregue una variable al modelo, R2 se incrementará, independientemente de la
variable adicional sea estadísticamente significativa o no. Por lo tanto, es posible que modelos
que tienen valores grandes de R2 produzcan predicciones pobres de nuevas observaciones o
estimaciones pobres de la respuesta media”.
Tomado de: Tomado de: Montgomey, D. (2013). Diseño y análisis de experimentos. Segunda edición. México DF, México. Limusa Wiley.
Signo de Coeficiente de Correlación (R)
Que el coeficiente de correlación entre dos variables sea significativo, no implica que entre
ellas haya una relación causa-efecto
Tomado de: Kume, H. (1992). Herramientas estadísticas básicas para el mejoramiento de la calidad
Consideraciones acerca de los datos
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
• Asegúrese de que los datos representen a la población de interés.
• Recolecte suficiente datos para proporcionar la precisión necesaria.
• Mida las variables con tanta exactitud y precisión como sea posible.
• Registre los datos en el orden de recolección.
• La correlación entre los predictores, también conocida como multicolinealidad, no debe ser
severa.
• Si la multicolinealidad es severa, es probable que usted no pueda determinar cuáles predictores
incluir en el modelo. Para determinar la severidad de la multicolinealidad, utilice los Factores de
Inflación de la varianza (FIV) indicados en la tabla Coeficientes de la salida.
Ejemplo N ° 1: Regresión lineal simple
Porcentaje
Resistencia
Un fabricante de bolsas desea identificar la relación de la de fibra
4 134
cantidad de fibra (madera) en la pulpa con la resistencia del 6 145
producto (papel). Los datos se muestran en la tabla 8 142
10 149
siguiente: 12 144
14 160
16 156
18 157
20 168
22 166
24 167
26 171
28 174
30 183
Pruebas de un análisis de regresión lineal simple
1. Grafica de dispersión y línea de regresión
OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Analysis of Variance
Analysis of Variance
OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Análisis de los Varianza Constante. Residuos vs. estimados (y)
La prueba Durbin – Watson permite verificar la independencia de los residuos. Es decir, que los residuos
no cumplen ningún patrón o secuencia, son aleatorios.
dL dU 4-dU 4-dL
1.08 1.36 2.64 2.92
0 dl du 2 4-du 4-dl 4
7. Capacidad de predicción
Analysis of Variance
Model Summary
S R-sq R-sq(adj) PRESS R-sq(pred) Condición: PRESS/SCE debe de ser menor a 2 o 2.5 para
3.87648 93.01% 92.43% 242.685 90.60% tener buena capacidad de predicción
Nota:
PRESS: suma de los cuadrados de error de predicción
PRESS: Prediction Error Sum of Squares
1. Pendiente positiva, relación directa. Cuando aumenta el porcentaje fibra aumenta la resistencia
del papel.
2. Coeficiente de determinación (93 %) superior al 80 %
3. Coeficiente de correlación igual a 0.96
4. Prueba del intercepto. Pvalue menor a alfa (0.05)
5. Prueba de significancia de la ecuación. Pvalue menor a alfa (0.05)
6. Prueba de residuales
• Normalidad de los residuales: residuales normales
• Varianza constante: residuales con comportamiento aleatorio
• Prueba de independencia: residuales con comportamiento aleatorio
6. Prueba Durbin-Watson: confirma prueba de independencia de residuales
7. Capacidad de predicción del modelo: igual a 1.3 menor a 2.
Ejemplo N° 2: Regresión lineal simple
Un Gerente de ventas tiene una fuerza de ventas muy grande y desea determinar si
hay alguna relación entre el número de llamadas de ventas en un mes y el número
de copiadoras que se vendieron.
70 S 9.90082
R-Sq 57.6%
R-Sq(adj) 52.3%
Número de copiadoras vendidas
60
50
40
30
10 15 20 25 30 35 40
Número de llamadas
Análisis de la hoja de sesión
Analysis of Variance
Source DF SS MS F P
Regression 1 1065.79 1065.79 10.87 0.011
Error 8 784.21 98.03
Total 9 1850.00
OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Regresión Lineal Múltiple
La regresión lineal múltiple examina las relaciones lineales entre una respuesta
continua y dos o más predictores.
Si el número de predictores es grande, antes de ajustar un modelo de regresión con
todos los predictores, se deberían utilizar las técnicas de selección de modelo paso
a paso o de los mejores subconjuntos para excluir los predictores que no estén
asociados con las respuestas.
Regresión Simple Regresión Múltiple
Coefficients
OJO
Model Summary
Si P < alfa. Se rechaza Ho
S R-sq R-sq(adj) R-sq(pred) Si P > alfa. No se rechaza Ho
5.36604 81.66% 74.78% 43.04%
Prueba de normalidad de los residuales
OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Análisis de los Varianza Constante. Residuos vs. estimados (y)
dL dU 4-dU 4-dL
0.82 1.75 3.18 2.25
0 dl du 2 4-du 4-dl 4
Capacidad de predicción
Analysis of Variance
Model Summary
Condición: PRESS/SCE debe de ser menor a 2 o 2.5 para tener buena capacidad de predicción
Nota:
PRESS: suma de los cuadrados de error de predicción
Colinealidad de los Predictores. Diagnóstico de multicolinealidad
Tomado de: Szretter, M. (2017).Apunte de Regresión Lineal. Facultad de Ciencias Exactas y Naturales. UBA
Cuando las variables predictoras incluidas en el modelo están correlacionadas entre ellas, decimos que existe
intercorrelación o multicolinealidad. Algunos de los problemas típicos que aparecen cuando las variables
regresoras están fuertemente correlacionadas son:
1. Los coeficientes de regresión estimados se modifican sustancialmente cuando se agregan o se quitan
variables del modelo.
2. Los errores estándares de los estimadores de los coeficientes aumentan espúreamente cuando se incluyen
covariables muy correlacionadas en el modelo.
Esto se denomina inflar la varianza estimada de los estimadores.
3. Los coeficientes pueden ser no significativos aún cuando exista una asociación verdadera entre la variable de
respuesta y el conjunto de variables regresoras.
Prueba de Multicolinealidad (VIF – Factor de Inflación de Varianza)
Coefficients
Regression Equation
Si todos los FIV son 1, no hay multicolinealidad, pero si algunos FIV son mayores que 1, los predictores están
correlacionados. Cuando un FIV es > 5, el coeficiente de regresión para ese término no se estima adecuadamente.
NOTA : Si el VIF es mayor a 5 se debe eliminar un factor del modelo de regresión y volver a determinar la ecuación.
Prueba de Mejores sub conjuntos
T
e
m P
p r
e e
Cuant r s NOTA Cp:
o a i
• Un valor del Cp de Mallows que esté cerca del número de
t ó
meno u n predictores más la constante indica que el modelo produce
Cuanto más s r
a ( estimaciones relativamente precisas y no sesgadas.
alto mejor mejor p
( s • Un valor del Cp de Mallows que sea mayor que el número de
° i
predictores más la constante indica que el modelo es sesgado
R-Sq R-Sq Mallows C g
Vars R-Sq (adj) (pred) Cp S ) ) o no se ajusta adecuadamente a los datos.
1 53.1 48.4 6.4 15.0 7.6740 X
1 21.5 13.7 0.0 30.4 9.9274 X
2 81.6 77.5 56.9 3.0 5.0654 X X