0% encontró este documento útil (0 votos)
66 vistas84 páginas

Sesión 3

CCC

Cargado por

randydtincof
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
66 vistas84 páginas

Sesión 3

CCC

Cargado por

randydtincof
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

SESIÓN N° 3: ETAPA ANALIZAR

CARLOS GRAJEDA R.
Contenido

• Etapa Analizar
• Diagrama Causa-Efecto y 5 Por qué
• Regla de Pareto o regla del 80-20
• Regresión y correlación lineal simple y múltiple
Fase Analizar

• Para el proceso seleccionado, identificar las brechas del desempeño actual y el desempeño
deseado.
• Analizar las fuentes de variación que contribuyen en la brecha.
• Determinar los impulsores/drivers. Las pequeñas x que se correlacionan con los requisitos del
cliente (CTQ, CTS, CTC, etc.) e influyen significativamente en el proceso seleccionado.
• Emplear técnicas de bechmarking para identificar las mejores practicas del sector o de otros
sectores.
Fase Analizar

“En esta etapa mediante los datos analizados se puede revelar la naturaleza y el
comportamiento básico del proceso, y mostrar que tan capaz y estable es el
proceso en el tiempo. Por ejemplo, ¿el problema es esporádico o persistente? O el
problemas ¿Esta relacionado con la tecnología o con el proceso mismo?”

Tomado de: Munro, R. A., Maio, M. J., Nawaz, M. B., Ramu, G. & Zrymiak, D. J. (2008). The Certified
Six Sigma Green Belt Handbook. Milwaukee, Wisconsin. ASQ Quality Press.
Diagrama de Causa – Efecto / Ishikawa / FishBone

Es una técnica gráfica que enumera y organiza las posibles causas o contribuciones a un
problema.

Utilidad

• Determinar las categorías (6Ms) principales de las causas.

• Preparar categorías de causa y efecto.

• Colocar las causas en forma gráfica o esquemática.

• Ayuda a identificar las causas más probables.


Los seis factores de variación

Hombre Maquina Método

«Problema»
Síntoma o
efecto

Medición Materiales Medioambiente


Primer Paso. Definir el Problema

1. Definir clara y
concretamente el
problema

«Problema»
Síntoma o
efecto

2. Asegurarse que
el problema es
medible /
cuantificable
Segundo Paso. Generar ideas

«Problema»
Síntoma o
efecto
Generar ideas, hipótesis
o supuestos que
generan el problema
Tercer Paso. Los seis factores de variación

Hombre Maquina Método

Asociar las ideas por «Problema»


cada categoría o “M” Síntoma o
efecto

Medición Materiales Medioambiente


Cuarto Paso. Técnica de los 5 Por qué?

«Problema»
Síntoma o
efecto
Técnica de los 5 Por qué?

Factor 1 2 3 4 5
¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué? ¿Por qué?

Hombre

Maquina

Método

Materiales

Medición

Medioambiente
Video de Jefferson Memorial
Análisis de causa raíz en el Jefferson Memorial

Problema: el mármol en el monumento


a Jefferson en EE.UU. se estaba deteriorando

¿Por qué? El deterioro se debía a las frecuentes


lavadas del monumento con detergentes

¿Por qué? El detergente era usado para


limpiar el excremento de los gorriones

¿Por qué? Los gorriones fueron atraídos


por las arañas

¿Por qué? Las arañas fueron atraídas por


los insectos que merodeaban el lugar.

¿Por qué? Los insectos fueron atraídos


por las intensas luces que iluminan el lugar
Ejemplo N° 1: Uso de la técnica de los cinco Por qué
Tomado y adaptado de: Caso HBS 9-606-S29. Toyota Motor Manufacturing U.S.A., Inc.

Pregunta 1: ¿Por qué se detuvo la maquina?


Respuesta 1: Porque se fundió el fusible por una sobrecarga.
Pregunta 2: ¿Por qué hubo una sobrecarga?
Respuesta 2: Porque la lubricación del cojinete era inadecuada.
Pregunta 3: ¿Por qué era inadecuada la lubricación?
Respuesta 3: Porque la bomba de lubricación no funcionó en forma correcta.
Pregunta 4: ¿Por qué la bomba de lubricación no funcionó de forma correcta?
Respuesta 4: Porque el eje de la bomba estaba gastado.
Pregunta 5: ¿Por qué el eje de la bomba estaba gastado?
Respuesta 5: Porque le entró basura.
Ejemplo N° 2: Uso de la técnica de los cinco Por qué
Tomado y adaptado de: Caso HBS 9-606-S29. Toyota Motor Manufacturing U.S.A., Inc.

Pregunta 1: ¿Por qué hay errores en el proceso de pagos?


Respuesta 1: Porque se ingresa información incompleta.
Pregunta 2: ¿Por qué se ingresa información incompleta?
Respuesta 2: Porque no se especifico que debe estar completa.
Pregunta 3: ¿Por qué no se especifico que la información debe ser completa?
Respuesta 3: Porque en la capacitación no se definió ese detalle.
Pregunta 4: ¿Por qué no se especifico la información completa?
Respuesta 4: Porque el procedimiento de pagos no lo mencionada a detalle.
Pregunta 5: ¿Por qué el procedimiento no definió la información completa
Respuesta 5: Porque no se valido el procedimiento.
Ejemplo N° 3: Uso de la técnica de los cinco Por qué
Tomado y adaptado de: Liker, J. (2004). Las claves del éxito de Toyota

Pregunta 1: ¿Por qué hay aceite en el suelo del taller?


Respuesta 1: Porque la maquina tiene una fuga.
Pregunta 2: ¿Por qué tiene una fuga la maquina?
Respuesta 2: Porque la empaquetadura no dura (baja calidad).
Pregunta 3: ¿Por qué se compra empaquetaduras de baja calidad?
Respuesta 3: Porque se consiguen a buen precio.
Pregunta 4: ¿Por qué se compra por precio y no por calidad?
Respuesta 4: Porque el comprador es evaluado por reducción de costos.
Pregunta 5: ¿Por qué el comprador es evaluado así?
Respuesta 5: Porque es la Política de reducción de costos.
¿ Cual es el problema ?

Demoras en la entrega de pizzas a domicilio, los viernes y


sábados
Diagrama de causa – efecto

Maquinaria Mano de obra

Demoras en la entrega
de pizzas a domicilio
los viernes y sábados

Métodos Materiales
Diagrama de causa - efecto

Maquinaria Mano de obra


Vehiculos no La gente no se
confiables presenta a trabajar
Hornos demasiado
Los choferes
pequeños
se pierden Demoras en la entrega
de pizzas a domicilio
los viernes y sábados
Mal manejo de Mal
los pedidos despacho Agotamiento de
grandes los ingredientes

Métodos Materiales
Diagrama de causa - efecto

Maquinaria Mano de obra


No hay capacidad para Carros no confiables No hay programación
períodos de mayor
afluencia Baja paga
No conocen la ciudad La gente no se presenta a trabajar
Hornos demasiado Los empleados Baja paga
pequeños tienen carros que Alta fluctuación del
no funcionan bien personal
Los choferes se pierden Alta fluctuación
No hay del personal
Mala distribucion Capacitación Obtienen
de la planta información
incorrecta Demoras en la entrega
de pizzas a domicilio
los viernes y sábados
Mal manejo de los No conocen los
pedidos grandes procedimiento Agotamiento de ingredientes
Alta fluctuación Alta fluctuación
del personal del personal
No hay una adecuada programación
Falta de Mal despacho Falta de capacitación
Pedidos
experiencia
Muchas calles nuevas inexactos

Métodos Materiales
Complemento
Condiciones de variación

Mano de obra o gente Método

• Perfil de puesto definido = competencias mínimas. • ¿Se ha definido el flujo de trabajo del proceso?
• ¿Personal conoce sus funciones y objetivos del puesto? • ¿Se han definido procedimientos o instrucciones de

• ¿Procedo de inducción y capacitación eficaz? trabajo?

• Habilidad (¿los operadores han demostrado tener • ¿Documentos de trabajo: formatos, plantillas,
especificaciones, etc.?
habilidad para el trabajo que realizan?).
• ¿Especificaciones de los productos intermedios y final?
• ¿La gente está motivada?
• ¿Especificaciones de almacenamiento de materiales?
• ¿Conocen la importancia de su trabajo por la calidad?
• ¿ Se han definido acciones frente a situaciones
atípicas?
Condiciones de variación

Máquinas o equipos Material

• ¿Las maquinas tienen mantenimiento preventivo? • ¿Se han identificado los materiales/proveedores
• ¿Las maquinas han sido modificadas? críticos?
• ¿Se mide y mejora la eficiencia de las maquinas? • ¿Se tienen las especificaciones de los materiales
• ¿Las maquinas están correctamente instaladas? críticos?
• ¿Existen procedimientos/especificaciones de • ¿ Se conocen las condiciones optimas de
operación? almacenamiento y transporte de los materiales?
• ¿Se han definido las especificaciones mínimas de • ¿Se conoce cómo afectan los materiales de
los materiales/insumos para el optimo diferentes proveedores en el desempeño del
funcionamiento de los equipos? procesos/maquinas?
Condiciones de variación

Medicione Medio ambiente


• ¿Los equipos de medición se calibran o verifican? • ¿Se han identificado las condiciones optimas de
• ¿El personal que opera los instrumentos de producción y almacenamiento?
medición ha sido capacitado? • Temperatura
• ¿Se han definido procedimientos de muestreo? • Humedad
• ¿Se conoce la calidad del sistema de medición? • Iluminación
Gage R & R. • Vibración
• Ruido.
Los Seis Factores de Variación Vs. ISO 9001:2015

7.1.2 Personas 7.1.3 Infraestructura 7.1.6 Conocimiento de la


7.2 Competencia organización
7.3 Toma de conciencia 7.5 Información documentada

Hombre Maquina Método

Medición Materiales Medioambiente

7.1.5 Recursos de 8.4 Control de los procesos, 7.1.4 Ambiente para la


seguimiento y productos y servicios operación de los procesos
medición suministrados externamente
N° Factor Acciones para reducir variabilidad Disciplina
• Perfil del puesto (soft y hard skills)
• Inducción
Hombre Gestión de
1 • Capitación
(Man) RR.HH.
• Entrenamiento
• Motivación
• Mantenimiento (preventivo y correctivo)
Maquina Gestión de
2 • Confiabilidad
(Machine) Mantenimiento
• Capacidad (Cp y Cpk)
• Matariles críticos
Materiales
3 • Proveedores críticos Gestión de Compras
(Materials)
• Materiales y proveedores sustitos
• Normalización de actividades /tareas
Método
4 • Procedimientos documentados Calidad / O y M
(Method)
• Procesos definidos y mapeados
• Calibración
Medición • Verificación
5 Metrología
(Measurement) • Estabilidad
• Lineabilidad
Medio ambiente • Control de temperatura, humedad, luz, aire, presión, etc. Infraestructura /
6
(Milieu/Environment) Operaciones
Diagrama de Pareto

Es una gráfica de barras en las que se acomodan en orden descendente. El orden de las barras
refleja la importancia de las causas o categorías que se asocian con las barras.
Utilidad
• Ayuda a establecer prioridades respecto a los problemas a resolver en primer lugar.
• Ayuda a identificar el 80 % de los problemas que resultan solamente del 20 % de sus causas
potenciales.
• Enfoca en la “vitalidad” de los pocos y no en la “trivialidad” de los muchos.
Proporciones de la Regla de Pareto

Causas
Causas
20% Causas
30%
40%
Problemas Problemas Problemas
80% 70% 60%

La Ley del Mínimo Esfuerzo


28
Ejemplo N° 1. Elaboración de Diagrama de Pareto
Ejemplo N° 2

En una empresa procesadora de carnes frías mediante una inspección al 100% se


detectaron problemas en las salchichas. A continuación se muestran los resultados
de una semana.

PROBLEMA Y NUMERO DE PAQUETES DEFECTUOSOS


Máquina
Turno
empacadora Mancha
Falta de vacío Mancha verde
amarilla
I 4300 700 700
A
II 6300 650 650
I 3500 700 400
B
II 6600 500 420
I 8500 800 324
C
II 9120 655 345
Ejemplo N° 2

En una empresa procesadora de carnes frías mediante una inspección al 100% se


detectaron problemas en las salchichas. A continuación se muestran los resultados
de una semana.

PROBLEMA Y NUMERO DE PAQUETES DEFECTUOSOS


Máquina
Turno
empacadora Mancha
Falta de vacío Mancha verde
amarilla
I 4300 700 700
A
II 6300 650 650
I 3500 700 400
B
II 6600 500 420
I 8500 800 324
C
II 9120 655 345
Ejemplo de priorización con Pareto

1. Considere que la gravedad de los tres problemas es la misma, realice un análisis


de Pareto para problemas y detecte cuál es el más significativo.

2. Con respecto al problema vital, haga Paretos de segundo nivel (causas) tanto
para máquina como para turno.

3. Vuelva a realizar los análisis anteriores, pero considerando que la gravedad del
problema desde el punto de vista del cliente es la siguiente: falta de vacío (6),
mancha verde (10), mancha amarilla (8).
PROBLEMA Y NUMERO DE PAQUETES
Máquina
Turno DEFECTUOSOS
empacadora
Falta de vacío Mancha verde Mancha amarilla
I 4300 700 700
A
II 6300 650 650
I 3500 700 400
B
II 6600 500 420
I 8500 800 324
C
II 9120 655 345
Total 38,320 4,005 2,839 45,164
Porcentaje 85% 9% 6% 100%
% acum 85% 94% 100%
Máquina
Total % % Acum.
empacadora
C 17,620 46% 46%

A 10,600 28% 74%

B 10,100 26% 100%


38,320 100%
Turno Suma % % Acum
II 22020 57% 57%
I 16300 43% 100%
38320
Regresión Lineal Simple y Múltiple
Contenido

• Definición
• Regresión Lineal Simple
• Regresión Lineal Múltiple
Análisis del Proceso

Entradas Salidas
Tangibles o A1 A2 A3 Tangibles o
Intangibles Intangibles
Procesos

X´s x´s = Parámetros del proceso Y´s

Y = f (x)
Análisis de regresión

Técnica estadística para relacionar a través de un modelo matemático, una variable


independiente (X) con otra variable dependiente (respuesta o Y).
• Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta (Y)
a partir de un valor predictor (X) con una exactitud mayor que la asociada únicamente a
las probabilidades.
• La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se puede
utilizar después para: Examinar cómo cambia la variable de respuesta a medida que
cambia la variable predictora.
• Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora (X).
Análisis de regresión

“Los métodos de regresión se utilizan con frecuencia para analizar datos de


experimentos no planeados, como podría ser el caso de observaciones de
fenomenos no controlados o registros históricos. Los métodos de regresión son
también muy útiles en Diseño de Experimentos cuando algo “salió mal”.
Tomado de: Montgomey, D. (2013). Diseño y análisis de experimentos. Segunda edición. México DF, México.
Limusa Wiley.
Ejemplos de variables

Variables dependientes Variables independiente


(y) (x)
1. Ventas 1. Gastos en publicidad
2. Productividad 2. Horas hombre / horas máquina /
Capacitación
3. Productividad por hectárea 3. Clima
4. Utilidad 4. Inversión
5. Venta de helados / gaseosas 5. Temperatura ambiental (°C)
Tipos de Correlación

POSIBLE CORRELACION POSITIVA


Si “X” aumenta, “Y” incrementará un poco, positivamente
aunque “Y” parece tener otras causas diferentes a “X”.

CORRELACION POSITIVA
Un incremento en “Y” depende de un incremento en “X”.
Entrenamiento vs. Desempeño.
Tipos de Correlación

POSIBLE CORRELACION NEGATIVA


Un aumento en “X” causará una tendencia negativa al disminuir
“Y”, por ejemplo:

CORRELACION NEGATIVA
Un aumento en “X” causará una disminución en “Y”, por lo tanto,
como en el punto 1, “X” puede ser controlada en lugar de “Y”.
Tipos de Correlación

NO HAY CORRELACION
No hay correlación. “Y” puede depender de otra variable
0.94

0.93

0.92 y = mx + b
0.91

0.9

0.89

0.88

0.87

0.86
8 8.2 8.4 8.6 8.8 9 9.2 9.4 9.6

Donde:
y = variable dependiente o respuesta
OJO
x = variables independiente o predictora
Emplear misma cantidad de datos para las
𝛽1 = pendiente de la recta variables X y Y.
𝛽0 = intersección de la recta. Si, x = 0
Interpretación del valor de “R”. Coeficiente de correlación

Valor de “r” Significado


+/- 1 Correlación perfecta
+/- 0.60 a +/-0.95 Alta correlación
+/- 0.35 a +/- 0.59 Baja correlación
0 No existe correlación
Interpretación del valor de “R”. Coeficiente de correlación

“Un valor grande de R2 no implica necesariamente que el modelo de regresión sea adecuado.
Siempre que se agregue una variable al modelo, R2 se incrementará, independientemente de la
variable adicional sea estadísticamente significativa o no. Por lo tanto, es posible que modelos
que tienen valores grandes de R2 produzcan predicciones pobres de nuevas observaciones o
estimaciones pobres de la respuesta media”.
Tomado de: Tomado de: Montgomey, D. (2013). Diseño y análisis de experimentos. Segunda edición. México DF, México. Limusa Wiley.
Signo de Coeficiente de Correlación (R)

Que el coeficiente de correlación entre dos variables sea significativo, no implica que entre
ellas haya una relación causa-efecto
Tomado de: Kume, H. (1992). Herramientas estadísticas básicas para el mejoramiento de la calidad
Consideraciones acerca de los datos

Para asegurar que los resultados sean válidos, considere las siguientes pautas:
• Asegúrese de que los datos representen a la población de interés.
• Recolecte suficiente datos para proporcionar la precisión necesaria.
• Mida las variables con tanta exactitud y precisión como sea posible.
• Registre los datos en el orden de recolección.
• La correlación entre los predictores, también conocida como multicolinealidad, no debe ser
severa.
• Si la multicolinealidad es severa, es probable que usted no pueda determinar cuáles predictores
incluir en el modelo. Para determinar la severidad de la multicolinealidad, utilice los Factores de
Inflación de la varianza (FIV) indicados en la tabla Coeficientes de la salida.
Ejemplo N ° 1: Regresión lineal simple

Porcentaje
Resistencia
Un fabricante de bolsas desea identificar la relación de la de fibra
4 134
cantidad de fibra (madera) en la pulpa con la resistencia del 6 145
producto (papel). Los datos se muestran en la tabla 8 142
10 149
siguiente: 12 144
14 160
16 156
18 157
20 168
22 166
24 167
26 171
28 174
30 183
Pruebas de un análisis de regresión lineal simple
1. Grafica de dispersión y línea de regresión

R-cuad = Se utiliza para regresión


simple (1 variable)

R-cuad.(ajustado) = Se utiliza para


regresión Múltiple (más de una
variable)

Para considerar que le modelo es


de calidad el coeficiente de
determinación debe ser mayor a
80%
2. Coeficiente de Determinación y Correlación

El Coeficiente de Determinación (𝐑𝟐 ) indica en El Coeficiente de Correlación (R) indica el grado


que porcentaje la variables estimulo explica la de asociación lineal entre las dos variables.
variable de respuesta.

La variación en la cantidad de fibra explica el 93 El grado de asociación entre la cantidad de fibra


% de la resistencia. y la resistencia es de 0.96.
3. Prueba con respecto al intercepto

Ho: El intercepto no es significativo (𝛽0 = 0). La recta no pasa por el intercepto


Ha: El intercepto es significativo (𝛽0 ≠0). La recta pasa por el intercepto

OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Regression 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Porcentaje de fibra 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Error 12 180.3 6.99% 180.3 15.03
Total 13 2580.9 100.00%

Term Coef SE Coef 95% CI T-Value P-Value VIF


Constant 130.67 2.42 (125.41, 135.94) 54.05 0.000
Porcentaje de fibra 1.624 0.129 ( 1.344, 1.904) 12.64 0.000 1.00
4. Determinar significancia de la ecuación de regresión

Ho: No hay relación lineal entre x e y (𝛽1 = 0) OJO


Si P < alfa. Se rechaza Ho
Ha: Hay relación lineal entre x e y (𝛽1 ≠0)
Si P > alfa. No se rechaza Ho

Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Regression 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Porcentaje de fibra 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Error 12 180.3 6.99% 180.3 15.03
Total 13 2580.9 100.00%

Term Coef SE Coef 95% CI T-Value P-Value VIF


Constant 130.67 2.42 (125.41, 135.94) 54.05 0.000
Porcentaje de fibra 1.624 0.129 ( 1.344, 1.904) 12.64 0.000 1.00
5. Prueba de Residuales. Prueba de normalidad de los residuales

P value > a 0.05 no se rechaza la


hipótesis nula. Residuales siguen
un comportamiento normal.

OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Análisis de los Varianza Constante. Residuos vs. estimados (y)

Dispersión de los puntos o


datos no sigue ningún
comportamiento o secuencia.
Es aleatorio.
Prueba de independencia. Análisis de residuos vs. pulpa (x)

La grafica no refleja ninguna


secuencia o comportamiento
cíclico. Lo cual refleja una
buena prueba de
independencia.
6. Prueba Durbin-Watson para verificar el supuesto de independencia

La prueba Durbin – Watson permite verificar la independencia de los residuos. Es decir, que los residuos
no cumplen ningún patrón o secuencia, son aleatorios.

Durbin-Watson Statistic 2.86579

dL dU 4-dU 4-dL
1.08 1.36 2.64 2.92

Autocorrelación Indecisión No existe Indecisión Autorrelación


positiva autocorrelación negativa

0 dl du 2 4-du 4-dl 4
7. Capacidad de predicción
Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Regression 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Porcentaje de fibra 1 2400.5 93.01% 2400.5 2400.53 159.75 0.000
Error 12 180.3 6.99% 180.3 15.03
Total 13 2580.9 100.00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred) Condición: PRESS/SCE debe de ser menor a 2 o 2.5 para
3.87648 93.01% 92.43% 242.685 90.60% tener buena capacidad de predicción
Nota:
PRESS: suma de los cuadrados de error de predicción
PRESS: Prediction Error Sum of Squares

Condición: PRESS/SCE debe de ser menor a


2 a 2.5 para tener buena capacidad de
predicción
Conclusiones del ejercicio

1. Pendiente positiva, relación directa. Cuando aumenta el porcentaje fibra aumenta la resistencia
del papel.
2. Coeficiente de determinación (93 %) superior al 80 %
3. Coeficiente de correlación igual a 0.96
4. Prueba del intercepto. Pvalue menor a alfa (0.05)
5. Prueba de significancia de la ecuación. Pvalue menor a alfa (0.05)
6. Prueba de residuales
• Normalidad de los residuales: residuales normales
• Varianza constante: residuales con comportamiento aleatorio
• Prueba de independencia: residuales con comportamiento aleatorio
6. Prueba Durbin-Watson: confirma prueba de independencia de residuales
7. Capacidad de predicción del modelo: igual a 1.3 menor a 2.
Ejemplo N° 2: Regresión lineal simple

Un Gerente de ventas tiene una fuerza de ventas muy grande y desea determinar si
hay alguna relación entre el número de llamadas de ventas en un mes y el número
de copiadoras que se vendieron.

El Gerente selecciona una muestra aleatoria de 10 representantes de ventas y


determina el número de llamadas de ventas que cada uno hizo el mes pasado y el
número de copiadoras que vendió.
Número de
Número de
Vendedor copiadoras
llamadas
vendidas
1 20 30
2 40 60
3 20 40
4 30 60
5 10 30
6 10 40
7 20 40
8 20 50
9 20 30
10 30 70
Generación de grafica de dispersión

Fitted Line Plot


Número de copiadoras vendidas = 18.95 + 1.184 Número de llamadas

70 S 9.90082
R-Sq 57.6%
R-Sq(adj) 52.3%
Número de copiadoras vendidas

60

50

40

30

10 15 20 25 30 35 40
Número de llamadas
Análisis de la hoja de sesión

The regression equation is


Número de copiadoras vendidas = 18.95 + 1.184 Número de llamadas

S = 9.90082 R-Sq = 57.6% R-Sq(adj) = 52.3%

Analysis of Variance

Source DF SS MS F P
Regression 1 1065.79 1065.79 10.87 0.011
Error 8 784.21 98.03
Total 9 1850.00

OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Regresión Lineal Múltiple

La regresión lineal múltiple examina las relaciones lineales entre una respuesta
continua y dos o más predictores.
Si el número de predictores es grande, antes de ajustar un modelo de regresión con
todos los predictores, se deberían utilizar las técnicas de selección de modelo paso
a paso o de los mejores subconjuntos para excluir los predictores que no estén
asociados con las respuestas.
Regresión Simple Regresión Múltiple

1. Grafica de dispersión 1. Ecuación de regresión lineal


2. Ecuación de regresión lineal 2. Significancia de la ecuación de regresión
3. Significancia de la ecuación de regresión 3. Prueba del intercepto
4. Prueba del intercepto 4. Coeficiente de Determinación
5. Coeficiente de Determinación 5. Coeficiente de Correlación
6. Coeficiente de Correlación 6. Prueba de los Residuales
7. Prueba de los Residuales Normalidad
• Normalidad Varianza constante
• Varianza constante Independencia
• Independencia 6. Prueba de Durbin-Watson
6. Prueba de Durbin-Watson 7. Capacidad de predicción
7. Capacidad de predicción 8. Prueba de Multicolinealidad
Ejemplo N° 3. Regresión Multiple

Una organización dese identificar la variable que mejor influye en el


comportamiento de sus ventas de un producto determinado. Para lo cual identifica
tres variables independientes; precio, cantidad de productos y número de visitas.
Ventas precio productos Visitas
80 1.5 12 6
80 1.4 13 6
115 1.15 15 5
65 1.7 10 4
70 1.55 12 4
100 1.25 15 4
120 1.15 16 3
150 1.1 15 3
190 1.05 17 3
200 1 15 3
60 1.75 10 2
70 1.6 11 2
Análisis de regresión lineal múltiple
Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 3 22759.3 7586.4 19.85 0.000
precio 1 4127.3 4127.3 10.80 0.011
productos 1 601.4 601.4 1.57 0.245
Visitas 1 1220.4 1220.4 3.19 0.112
Error 8 3057.4 382.2
Total 11 25816.7
OJO
Model Summary
Si P < alfa. Se rechaza Ho
S R-sq R-sq(adj) R-sq(pred) Si P > alfa. No se rechaza Ho
19.5493 88.16% 83.72% 66.18%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 635 222 2.86 0.021
precio -259.1 78.8 -3.29 0.011 12.61
productos -10.98 8.75 -1.25 0.245 12.61
Visitas -7.77 4.35 -1.79 0.112 1.00
Regression Equation
Ventas = 635 - 259.1 precio - 10.98 productos - 7.77 Visitas
Ejemplo N° 4. Regresión Multiple

En un proceso industrial se desea identificar los factores que influyen en el


rendimiento del proceso. Identificándose los factores temperatura, presión y
concentración de la materia prima.
En la tabla se presentan los factores y el rendimiento asociado. Identificar la
relación de los factores con respecto al rendimiento.
Ejemplo N° 4. Regresión Multiple

Rendimeinto Temperatura Presión Concentración


(Y) (°C) (psig) (g/l)
32 125 41 14
46 158 10 15
57 121 82 15
65 160 80 15
36 118 39 33
48 163 40 30
57 122 80 30
68 165 83 30
50 140 60 22.5
44 140 60 22.5
53 140 60 22.5
56 140 60 22.5
Ejemplo N° 4. Regresión Multiple
Ejemplo N° 4. Regresión Multiple
Regression Analysis: Rendimeinto versus Temperatura ,
Presión (psi, Concentració
Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 3 1025.64 341.882 11.87 0.003
Temperatura (°C) 1 357.73 357.726 12.42 0.008
Presión (psig) 1 750.72 750.720 26.07 0.001
Concentración (g/l) 1 0.57 0.573 0.02 0.891
Error 8 230.36 28.794
Lack-of-Fit 5 151.61 30.321 1.16 0.483
Pure Error 3 78.75 26.250
Total 11 1256.00

OJO
Model Summary
Si P < alfa. Se rechaza Ho
S R-sq R-sq(adj) R-sq(pred) Si P > alfa. No se rechaza Ho
5.36604 81.66% 74.78% 43.04%
Prueba de normalidad de los residuales

P value > a 0.05 no se rechaza


la hipótesis nula. Residuales
siguen un comportamiento
normal.

OJO
Si P < alfa. Se rechaza Ho
Si P > alfa. No se rechaza Ho
Análisis de los Varianza Constante. Residuos vs. estimados (y)

Dispersión de los puntos o datos


no sigue ningún comportamiento
o secuencia. Es aleatorio.
Prueba de independencia. Análisis de residuos vs. Precio, producto y
visitas(x)

La grafica no refleja ninguna


secuencia o comportamiento
cíclico. Lo cual refleja una
buena prueba de
independencia.
Prueba Durbin-Watson para verificar el supuesto de independencia

Durbin-Watson Statistic = 1.99659

dL dU 4-dU 4-dL
0.82 1.75 3.18 2.25

Autocorrelación Indecisión No existe Indecisión Autorrelación


positiva autocorrelación negativa

0 dl du 2 4-du 4-dl 4
Capacidad de predicción
Analysis of Variance

Source DF Seq SS Contribution Adj SS Adj MS F-Value P-Value


Regression 2 1025.07 81.61% 1025.07 512.54 19.98 0.000
Temperatura (°C) 1 270.47 21.53% 357.98 357.98 13.95 0.005
Presión (psig) 1 754.61 60.08% 754.61 754.61 29.41 0.000
Error 9 230.93 18.39% 230.93 25.66
Lack-of-Fit 6 152.18 12.12% 152.18 25.36 0.97 0.558
Pure Error 3 78.75 6.27% 78.75 26.25
Total 11 1256.00 100.00%

Model Summary

S R-sq R-sq(adj) PRESS R-sq(pred)


5.06544 81.61% 77.53% 541.721 56.87%

Condición: PRESS/SCE debe de ser menor a 2 o 2.5 para tener buena capacidad de predicción
Nota:
PRESS: suma de los cuadrados de error de predicción
Colinealidad de los Predictores. Diagnóstico de multicolinealidad
Tomado de: Szretter, M. (2017).Apunte de Regresión Lineal. Facultad de Ciencias Exactas y Naturales. UBA

Cuando las variables predictoras incluidas en el modelo están correlacionadas entre ellas, decimos que existe
intercorrelación o multicolinealidad. Algunos de los problemas típicos que aparecen cuando las variables
regresoras están fuertemente correlacionadas son:
1. Los coeficientes de regresión estimados se modifican sustancialmente cuando se agregan o se quitan
variables del modelo.
2. Los errores estándares de los estimadores de los coeficientes aumentan espúreamente cuando se incluyen
covariables muy correlacionadas en el modelo.
Esto se denomina inflar la varianza estimada de los estimadores.
3. Los coeficientes pueden ser no significativos aún cuando exista una asociación verdadera entre la variable de
respuesta y el conjunto de variables regresoras.
Prueba de Multicolinealidad (VIF – Factor de Inflación de Varianza)

La prueba de multicolinealidad busca identificar la independencia o no dependencia de las variables


independientes (x) entres si. (VIF = Factor de Inflación de Varianza)

Coefficients

Term Coef SE Coef 95% CI T-Value P-Value VIF


Constant -17.5 13.6 ( -48.3, 13.2) -1.29 0.229
Temperatura (°C) 0.3328 0.0891 (0.1312, 0.5344) 3.74 0.005 1.01
Presión (psig) 0.3733 0.0688 (0.2176, 0.5290) 5.42 0.000 1.01

Regression Equation

Rendimeinto (Y) = -17.5 + 0.3328 Temperatura (°C) + 0.3733 Presión (psig)

Si todos los FIV son 1, no hay multicolinealidad, pero si algunos FIV son mayores que 1, los predictores están
correlacionados. Cuando un FIV es > 5, el coeficiente de regresión para ese término no se estima adecuadamente.
NOTA : Si el VIF es mayor a 5 se debe eliminar un factor del modelo de regresión y volver a determinar la ecuación.
Prueba de Mejores sub conjuntos

Best Subsets Regression: Rendimeinto versus Temperatura , Presión (psi


Response is Rendimeinto (Y)

T
e
m P
p r
e e
Cuant r s NOTA Cp:
o a i
• Un valor del Cp de Mallows que esté cerca del número de
t ó
meno u n predictores más la constante indica que el modelo produce
Cuanto más s r
a ( estimaciones relativamente precisas y no sesgadas.
alto mejor mejor p
( s • Un valor del Cp de Mallows que sea mayor que el número de
° i
predictores más la constante indica que el modelo es sesgado
R-Sq R-Sq Mallows C g
Vars R-Sq (adj) (pred) Cp S ) ) o no se ajusta adecuadamente a los datos.
1 53.1 48.4 6.4 15.0 7.6740 X
1 21.5 13.7 0.0 30.4 9.9274 X
2 81.6 77.5 56.9 3.0 5.0654 X X

También podría gustarte