0% encontró este documento útil (0 votos)
30 vistas73 páginas

Sesión 14

El documento aborda la aplicación de la estadística, específicamente el análisis de regresión lineal simple y múltiple, en el contexto de la ingeniería industrial. Se explican conceptos clave como la predicción de variables dependientes a partir de variables independientes, los supuestos del modelo de regresión, y se presentan ejemplos prácticos relacionados con costos de mantenimiento y preparación de pedidos. Además, se discuten los métodos para verificar la validez del modelo y la interpretación de los resultados obtenidos.

Cargado por

tlongobardi
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
30 vistas73 páginas

Sesión 14

El documento aborda la aplicación de la estadística, específicamente el análisis de regresión lineal simple y múltiple, en el contexto de la ingeniería industrial. Se explican conceptos clave como la predicción de variables dependientes a partir de variables independientes, los supuestos del modelo de regresión, y se presentan ejemplos prácticos relacionados con costos de mantenimiento y preparación de pedidos. Además, se discuten los métodos para verificar la validez del modelo y la interpretación de los resultados obtenidos.

Cargado por

tlongobardi
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Estadística aplicada a la

Ingeniería Industrial

Edgar Stalin Paz Muro


epazmu@[Link]
CONTENIDOS / ESTRATEGIAS EVIDENCIAS DE
SESIÓN
TEMÁTICAS DIDÁCTICAS APRENDIZAJE

Clase expositiva
Regresión lineal simple Aprendizaje Estudio de casos
14 y múltiple. Ejercicios de con situaciones
basado en
aplicación reales
problemas.
MODELO DE REGRESIÓN
LINEAL
Predice o explica la influencia (cambio) de la variable dependiente “Y” por una variable
1
independiente X.
El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir de una muestra
de n pares de valores (x1,y1),…,(xn,yn).
Ejemplos:

Estimar el precio de una Predecir el gasto Prever el tiempo de


vivienda en función de su económico familiar de computación de un
superficie cierta zona en función del programa en función de la
número de familias velocidad del procesador
MODELO DE
REGRESIÓN
2. Ecuación de regresión poblacional
Si la variable dependiente (Y) está relacionada con la variable independiente (X), entonces la relación funcional
o ecuación de regresión entre Y y X tiene la siguiente forma:
ANÁLISIS DE REGRESIÓN

II. Funciones del análisis de regresión:

 Determinar si las variables independientes y la variable dependiente presentan fuerzas de


relación.
 Determinar la estructura o la ecuación matemática que relaciona las variables independientes
con las dependientes.
 Pronosticar o predecir los valores de la variable dependiente en función de la variable
independiente.
 Controlar otras variables independientes al evaluar las contribuciones de una variable
especifica o un conjunto de variables.
DIAGRAMA DE DISPERCIÓN
MODELO DE REGRESIÓN

Ecuación de Regresión Estimada

: Intercepto con el eje y cuando x=0. Es el valor de Y que se obtiene cuando x = 0.

: Pendiente de la recta. Mide el cambio que se producirá en la variable.

La relación entre X e Y puede ser:


REQUISITOS

1. La muestra de datos apareados (x, y) es una muestra aleatoria de datos cuantitativos.


2. El examen visual del diagrama de dispersión indica que los puntos se aproximan al patrón de una
línea recta.
3. Se debe eliminar cualquier valor extremo, si se sabe que es un error.
Es importante tomar en cuenta los efectos de cualquier valor extremo que no sea un error conocido.

Nota: Los requisitos 2 y 3 representan una verificación simplificada de los siguientes requisitos formales del
análisis de regresión:
• Para cada valor fijo de x, los valores correspondientes de y tienen una distribución en forma de campana.
• Para los distintos valores fijos de x, las distribuciones de los valores correspondientes de “y” tienen la
misma varianza.
• Para los distintos valores fijos de x, las distribuciones de los valores correspondientes de y tienen medias
que se ubican en la misma línea recta.
REQUISITOS
SUPUESTOS DEL MODELO

Primer Supuesto
Normalidad de los errores (Kolmogorov – Smirnov o Shapiro Wilk )
H0 : Los errores se distribuyen normalmente
H1 : Los errores no se distribuyen normalmente
KOLMOGOROV- SMIRNOV SHAPIRO - WILK
(CORRECCIÓN DE
SIGNIFICACIÓN DE LILLIEFORS)
Para muestras grandes (n≥50) Cuando la muestra es pequeña
(n<50)

Importante: REGLA DE DECISION


Cuando p (SIG) >0.05 Aceptamos la Hipótesis Nula
Cuando p (SIG) <0.05 Rechazamos la Hipótesis Nula de manera significativa
Cuando p(SIG) <0.01 Rechazamos la Hipótesis Nula de manera altamente significativa
SUPUESTOS
Segundo
Supuesto:
Autocorrelación de los errores (Durbín - Watson: DW)

Es que los residuos sucesivos deberán ser independientes. Esto significa que
los residuos no tienen un patrón, que no están muy correlacionados, y que no
hay corridas largas de residuos positivos o negativos. Cuando los residuos
sucesivos están correlacionados, a esta condición se le conoce como
autocorrelación.
SUPUESTOS
Tercer Supuesto:
Validez el modelo de regresión lineal simple. Use un
alfa=0.05.
H0: β1=0 (No existe relación lineal entre X e Y).
H1: β1≠0
Estadístico de(Existe
prueba: relación lineal entre X e Y)
SUPUESTOS

Cuarto Supuesto:
Determine e interprete el coeficiente de correlación “r” (BONDAD DE AJUSTE)
y determinación “r2”.

El coeficiente de correlación (r) consiste en determinar el grado de relación entre dos variables.
El coeficiente de correlación es un número comprendido entre: -1≤ r ≤ 1

Se define:
SUPUESTOS
CASO: COSTO DE
MANTENIMIENTO DE MÁQUINAS
CASO: COSTO DE MANTENIMIENTO
DE MÁQUINAS

EJERCICIOS DE APLICACIÓN:

Se tienen información de los costos de mantenimiento de 06 maquinas llenadoras


de gaseosas de distintas edades de la Empresa Enrique Cassinelli e Hijos S.A. La
Gerencia desea hacer estimaciones o pronósticos acerca del costo de mantenimiento en
función del tiempo operativo de la máquina. La información que se tienen es la
siguiente:
CASO: COSTO DE MANTENIMIENTO
DE MÁQUINAS

Maquina 1 2 3 4 5 6

Tiempo operativo en
1 1 2 2 3 3
Años (X)
Costo de
30 40 70 80 100 100
mantenimiento $ (Y)

1. Determinar la ecuación de regresión. Interpretar sus coeficientes


2. Pronosticar el costo de mantenimiento para una máquina que tienen 10 años operativos.
CASO: COSTO DE
MANTENIMIENTO DE MÁQUINAS

Por lo tanto, la ecuación de regresión es:


Y = 5 + 32.5 X
Interpretación:
β0 = 5: Cuando la máquina no tiene ningún año de funcionamiento su
costo de mantenimiento SE ESTIMA que es de 5 dólares.
β1 = 32.5: Por cada año de funcionamiento de la maquina su costo de
mantenimiento aumenta en 32.5 dólares.
CASO: COSTO DE
MANTENIMIENTO DE MÁQUINAS

2. Pronóstico cuando la máquina tienen 4 años de


funcionamiento:

Y=5+32.5*4=135, que significa, que el costo de


mantenimiento para la maquina si tiene 4 años de
funcionamiento es de 135$.
PREPARACIÓN DE PEDIDOS
PREPARACIÓN DE PEDIDOS

Para determinar el modelo de regresión lineal que explique el tiempo


que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los siguientes
resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
PREPARACIÓN DE PEDIDOS

Para determinar el modelo de regresión lineal que explique el tiempo


que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los siguientes
resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos

Variable dependiente: Y: Tiempo


Variable independiente: X: Número de productos
PREPARACIÓN DE PEDIDOS

Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.
• Verifique los supuestos del modelo, asumiendo un 5% de significancia.
• Determine e interprete el coeficiente de correlación y determinación.
PREPARACIÓN DE PEDIDOS

Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos

• Realice un ajuste de regresión del tiempo y el número de productos e


interprete los coeficientes calculados.
• Verifique los supuestos del modelo, asumiendo un 5% de significancia.
• Determine e interprete el coeficiente de correlación y determinación.
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el


número de productos e interprete los
coeficientes calculados.

La ecuación del
 modelo es:
y  10.732  10.390 X
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el número


de productos e interprete los coeficientes calculados.
La ecuación del modelo es:
   
y  0   1 X  y  10.732  10.390 X
Interpretación

de los coeficientes:
0 : El tiempo que se demora en alistar un pedido,
cuando la cantidad de productos solicitados por el cliente
es cero, es de -10.732 minutos (tener en cuenta que la
interpretación carece de sentido)
PREPARACIÓN DE PEDIDOS

• Realice un ajuste de regresión del tiempo y el número


de productos e interprete los coeficientes calculados.
La ecuación del modelo es:
   
y  0   1 X  y  10.732  10.390 X
Interpretación

de los coeficientes:
1 : Por cada producto adicional que se registra en el
pedido, el tiempo que se demora en alistar un pedido,
aumenta en 10.390 minutos.
PREPARACIÓN DE PEDIDOS

• Verifique los supuestos del modelo, asumiendo


un 5% de significancia.
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
PREPARACIÓN DE PEDIDOS

• Verifique los supuestos del modelo, asumiendo


un 5% de significancia.
n  50 ,Shapiro  Wilk
Primer Supuesto:
Normalidad de Errores n 50, Kolmogorov  Smirnov
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
PREPARACIÓN DE PEDIDOS

Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Como el p-valor de significancia de la prueba de normalidad Shapiro-Wilk


para muestras pequeñas (menor que 50), es mayor que 0.05 (p=0.595>0.05),
se concluye que los errores presentan distribución normal.
PREPARACIÓN DE PEDIDOS

Segundo Supuesto:
Autocorrelación de los Errores (Durbín-Watson)

Como el valor de Durbín-Watson=2.092, está en el intervalo [1;3],


por lo tanto, se cumple el supuesto. Es decir, los errores no están
autocorrelacionados.
PREPARACIÓN DE PEDIDOS

Tercer Supuesto:
Validez el modelo de regresión lineal simple. Use
un alfa=0.05.
H0: β1=0 (No existe dependencia lineal del tiempo de
demora respecto al número de productos).
H1: β1≠0 (Existe dependencia lineal del tiempo de
demora respecto al número de productos)
PREPARACIÓN DE PEDIDOS

Tercer Supuesto:
Validez el modelo de regresión lineal simple. Use
un alfa=0.05.
H0: β1=0 (No existe dependencia lineal del tiempo de
demora respecto al número de productos).
H1: β1≠0 (Existe dependencia lineal del tiempo de
demora respecto al número de productos)
PREPARACIÓN DE PEDIDOS

Tercer Supuesto:
Valide el modelo de regresión lineal simple. Use un
alfa=0.05.

Decisión: Como Sig.(0.000) < α (0.05) → Se Rechaza H0


Conclusión: Como sig.(p=0.000<0.05), se rechaza la hipótesis nula, por
tanto, existe relación lineal entre el número de productos del pedido y el
tiempo que demoran en alistar el pedido, es así que se concluye que el
modelo es válido.
PREPARACIÓN DE PEDIDOS

• Determine e interprete el coeficiente de correlación y


determinación.

r = 0.887; existe una correlación alta positiva entre el número de


productos del pedido y el tiempo que demoran en alistar el pedido.
r 2 0.787 ; El 78.7% de la variabilidad del tiempo que demoran en alistar el
pedido, se encuentra explicada por número de productos del pedido.
PREPARACIÓN DE PEDIDOS
CASOS

CASO Nº 01: Edad Precio


N° de
(en Venta
El propietario de TOYOTA quiere auto
años) (miles de $)
estudiar la relación entre la edad de
1 9 8.1
los autos y su precio de venta. Para lo
2 7 6
cual damos una lista de 12 autos
3 11 3.6
usados, tomados aleatoriamente y
4 12 4
vendidos el año pasado.
5 8 5
a. Realice el diagrama de dispersión
6 7 10
y analice.
7 8 7.6
b. Determine el grado de relación
8 11 8
entre las variables e interprete.
9 10 8
c. Estime la ecuación de regresión e
10 12 6
interprete cada uno de los
11 6 8.6
parámetros.
12 6 8
REGRESIÓN MÚLTIPLE

Regresión
Lineal Múltiple
REGRESIÓN MÚLTIPLE
El análisis de regresión múltiple es una extensión del análisis de
regresión simple a aplicaciones que implican dos o más
variables independiente: X1, X2,…Xk (k≥2), que se relaciona con
una variable dependiente Y, mediante el modelo matemático:

Y  0  1 X 1   2 X 2  ...   k X k  
Donde:
 0 , 1 ,  2 ,...,  k
son los parámetros desconocidos.
 , el término error, es una variable aleatoria que se supone
tiene distribución normal con media 0 y varianza
2
.
REGRESIÓN MÚLTIPLE
El modelo estadístico de la regresión es equivalente al
modelo matemático de la regresión:

E Y   0  1 X 1   2 X 2  ...   k X k

j
Los coeficientes de regresión
Xi de indican el cambio
promedio de Y correspondiente a un incremento
Xi unitario X i
en cuando las demás permanecen constantes.
REGRESIÓN MÚLTIPLE
Estimación del modelo de regresión:
El primer objetivo del estudio de la regresión es estimar el modelo
de regresión, denominado ecuación de regresión muestral.


Y b0  b1 X 1  b2 X 2  ...  bk X k
Donde:
Y es la estimación de Y.
b0 , b1 ,..., bk j j
, (denotados por ) son las estimaciones de los
j 0,1,2,..., k .
parámetros
con
REGRESIÓN MÚLTIPLE
Estimación del modelo de regresión:
El primer objetivo del estudio de la regresión es estimar el modelo
de regresión, denominado ecuación de regresión muestral.

Y b0  b1 X 1  b2 X 2  ...  bk X k
Nota: La lista de variables independientes puede incluir
variables cualitativas (o categóricas), como por ejemplo,
género. En este caso, los valores de la variable, llamada
también variable indicadora, deben ser codificados. La
codificación de la variable género, por ejemplo, puede ser
0=mujer, 1 hombre (o viceversa).
CASO APLICATIVO:
DISTRIBUIDORA “DELIVERY”
CASO APLICATIVO:
DISTRIBUIDORA “DELIVERY”
El gerente de ventas de la distribuidora “Delivery” realiza un estudio del
sistema de reparto de sus pedidos considerando las variables:

Y: Tiempo en minutos que demora la entrega del pedido.


X1: Peso en kilogramos de los pedidos.
X2: Distancia recorrida en kilómetros.

Su objetivo es determinar una relación lineal para predecir el tiempo de


reparto de un pedido utilizando la información proporcionada por el peso
del pedido y la distancia de la entrega. Para esto, seleccionó una
muestra al azar de 10 repartos observando los siguientes resultados: ver
base_delivery.sav
CASO APLICATIVO:
DISTRIBUIDORA “DELIVERY”
a) A) Describa el modelo de regresión lineal de los tiempos de
reparto con respecto al peso de los pedidos a domicilio y al
recorrido de la entrega.

b) B) Calcule la ecuación de regresión estimada, y estime el


tiempo que demoraría el reparto de un pedido de X1=20
kilogramos para un recorrido de X2=10 kilómetros.
CASO APLICATIVO:
DISTRIBUIDORA “DELIVERY”

Hay dependencia lineal positiva entre las variables Tiempo de reparto y Peso del pedido, Tiempo de
reparto y Distancia recorrida, así, si se produce un aumento/disminución en una de ellas la otra
también aumenta/disminuye.
CASO APLICATIVO: DISTRIBUIDORA
“DELIVERY”

El valor de R cuadrado ajustado, alcanza un valor de 0.986 este


valor revela que las variables independientes explican casi un
98.6% de la variación en los Tiempos que demora la entrega del
pedido .
CASO APLICATIVO: DISTRIBUIDORA
“DELIVERY”

Decisión: Como p=0.000< 0.05 → Se Rechaza Ho


Conclusión: Al 95.0% de confianza, se concluye que existe relación lineal entre las
variables las variables independiente y Tiempos que demora la entrega del pedido, es
así que se concluye que el modelo es válido, es decir, existe evidencia significativa que
al menos una de las variables independientes explica de manera significativa a la
variable dependiente.
CASO APLICATIVO: DISTRIBUIDORA
“DELIVERY”

Las variables independientes presentaron una significación


inferior a 0.05, lo que muestra que estas variables presentan
importancia significativa para explicar el comportamiento de los
Tiempos que demora la entrega del pedido.
Caso Aplicativo: Distribuidora
“Delivery”

Del análisis efectuado concluimos que la recta de regresión que


tiene utilizar la empresa para pronosticar el Tiempo que demora la
entrega del pedido.

y 0.396  0.785 X 1  2.852 X 2
Tiempo 0.396  0.785Peso  2.852 Dis tan cia
Caso Aplicativo: Distribuidora
“Delivery”

y 0.396  0.785 X 1  2.852 X 2
Tiempo 0.396  0.785Peso  2.852 Dis tan cia

Para el reparto de 20 kilos y un recorrido de 10 kilómetros, esto es,


si X1=20, X2=10, la predicción del tiempo en minutos que demoraría
el reparto es:

y 0.396  0.785 X 1  2.852 X 2
Tiempo 0.396  0.785Peso  2.852 Dis tan cia
Tiempo 0.396  0.78520  2.85210

y 44.616
Caso Aplicativo: Empresa De
Alimentos
Caso Aplicativo: Empresa De
Alimentos
En el siguiente caso (base_ventas.sav), se presenta la información relativa
a:

• Las ventas (en soles) realizadas a cada cliente por parte de una empresa
de alimentos (Venta).
• La oportunidad de venta a cada cliente, que refleja su potencial de compra
(Oportunidad).
• Fortaleza de la empresa en cada cliente, es decir, el grado en que la
empresa vendedora tiene una buena posición en la empresa compradora
(Fortaleza).
• El número de visitas que ha tenido cada cliente por parte del vendedor de
la empresa (Visitas).
• El valor de la cifra de promoción de productos expresada en soles para
cliente. (Promoción).
Caso Aplicativo: Empresa
De Alimentos
En el siguiente caso, se presenta la información
relativa a:
La variable Oportunidad y Fortaleza son evaluadas
por el vendedor con un puntaje que varía del 1 a 7,
siendo 1 poca fortaleza o potencial y 7 mucha
fortaleza o potencial. Estúdiese entre que variables
existe una mayor dependencia lineal. Determínese si
las variables influyen y pueden predecir las ventas de
la empresa.
Caso Aplicativo: Empresa De
Alimentos
Para estudiar la dependencia lineal calculamos el
coeficiente de correlación lineal de Pearson entre cada
par de variable, mediante
Analizar/Correlaciones/Bivariadas. Se obtiene una
tabla, en la que aparecen, además del coeficiente de
correlación de Pearson entre cada par de variables (en la
tabla basta fijarse sólo en la diagonal superior o inferior
de la misma, pues es simétrica), el nivel de significación
del mismo y el número de datos.
Caso Aplicativo: Empresa De
Alimentos

Hay dependencia lineal positiva entre las variables Ventas y Oportunidad, Ventas y Fortaleza, Venta y
Promoción, así, si se produce un aumento/disminución en una de ellas la otra también
aumenta/disminuye.
Caso Aplicativo: Empresa De
Alimentos

Al tener más de una variable independiente, para poder determinar la


bondad de ajuste, hay que fijarse en el valor de R cuadrado ajustado. El
ajuste es aceptable al ser 0.812, este valor revela que las variables
independientes explican casi un 81.2% de la variación en las ventas.
Caso Aplicativo: Empresa De
Alimentos

La tabla del análisis de la varianza, con el estadístico F, nos muestra que


la regresión, en su conjunto , es significativa a un nivel superior al 99%
de confianza (el modelo explica muy bien la variabilidad de las ventas).
Caso Aplicativo: Empresa De
Alimentos

Las únicas variables con una significación inferior a 0.05 son las variables
Oportunidad y promoción, lo que muestra que sólo estas variables sirven
para explicar el comportamiento de las Ventas.
Caso Aplicativo: Empresa De
Alimentos

Con los datos de este ejemplo no hay una relación lineal entre el número de
las visitas que se hacen a los clientes y las ventas que se consiguen. Esto
puede ocurrir, ya que es posible que a partir de un determinado número de
visitas el cliente haya llegado a su volumen máximo de compras y un
incremento en las visitas no se traslada en un incremento lineal en las
compras.
Caso Aplicativo: Empresa De
Alimentos

La posición fortaleza de la empresa vendedora no garantiza una


relación lineal con el volumen de las ventas, pues los clientes
industriales prefieren tener siempre un determinado número de
proveedores para hacer sus compras con el fin de romper su
proceso productivo si alguno de ellos falla.
Caso Aplicativo: Empresa De
Alimentos

Como las Ventas sólo dependen de las variables Oportunidad y


promoción, se debe realizar una nueva regresión en la que sólo se
incluyan estas dos variables y poder ajustar mejor el coeficiente de cada
variable independiente.
Caso Aplicativo: Empresa De
Alimentos

En esta nueva regresión la bondad del ajuste es buena (R cuadrado corregida=0.820

La variable Oportunidad y
promoción son significativas.
Caso Aplicativo: Empresa De
Alimentos

Del análisis efectuado concluimos que la recta de regresión que tiene utilizar la empresa
para pronosticar futuras ventas a los clientes es la siguiente:

Ventas  33631.026  19297.408Oportunidad  26.782 Pr omoción


Caso Aplicativo: Empresa De
Alimentos
Ventas  33631.026  19297.408Oportunidad  26.782 Pr omoción

Supongamos que se quieren estimar las ventas futuras a un cliente potencial al que
se le ha otorgado una oportunidad (potencial de compra) de 5 y vamos a hacer una
promoción de 1500 soles en su empresa en el próximo año. Las ventas para el año
serían.

Ventas  33631.026  19297.4085 26.7821500


Ventas 1030029.01

Por lo que las ventas esperadas para esta situación ascienden a 103 029.01 soles. La
fiabilidad de esta predicción es muy buena pues, como ya hemos indicado
anteriormente, las variables independientes explican el 82.0% (R cuadrado).

También podría gustarte