Toma de Decisiones
Objetivos De La Sesión
Al finalizar la sesión el estudiante estará en la
capacidad de:
• Identificar correctamente una variable dependiente y
una variable independiente.
• Determinar la ecuación de regresión lineal.
• Conocer y verificar el cumplimiento de los supuestos.
Regresión Lineal
El análisis de regresión es una estimación de la relación entre una
variable dependiente y una o más variables independientes. Se estiman
los coeficientes de la ecuación lineal. Las variables dependientes e
independientes deben ser cuantitativas. Si alguna variable fuera
cualitativa, debería ser recodificada a la variable dummy (este tipo de
variables presenta las categorías 0 y 1, donde el 1 representa presencia
de alguna cualidad y el 0 ausencia de la misma)
Regresión Lineal
Se deben dar los siguientes supuestos; para cada valor de la variable
independiente, la dependiente debe ser normal; la varianza de
distribución de la variable dependiente ha de ser constante para todos
los valores de la variable independiente; la relación entre la variable
dependiente y cada variable independiente debe ser lineal; todas las
observaciones tienen que ser independientes.
Regresión Lineal
Estimación del modelo de regresión Yij 0 1 X eij
La estimación del modelo de regresión (poblacional)
es la ecuación de regresión muestral (o de estimación o de predicción):
Y ij a bX
Donde:
Y ij : Representa la estimación de Yij.
a y b: Son las estimaciones de los parámetros 0 y 1 , respectivamente.
Regresión Lineal
• Cálculo de la pendiente.
n xi yi xi yi
b
n x xi
2 2
i
• Cálculo de la ordenada.
a y bx x
x i
y
y i
n n
Caso Aplicativo: Ventas Anuales
Caso Aplicativo: Ventas Anuales
Abajo están los datos recopilados por un gerente de ventas en los
reportes anuales y años de experiencia.
Vendedor Años de experiencia Ventas anuales ($ miles)
1 1 80
2 3 97
3 4 92
4 4 102
5 6 103
6 8 111
7 10 119
8 10 123
9 11 117
10 13 136
Caso Aplicativo: Ventas Anuales
Para determinar el modelo de regresión lineal que explique las ventas
anuales en función de los años de experiencia del vendedor. Se toma
una muestra con lo siguiente:
Variable dependiente: Y:
Variable independiente: X:
Caso Aplicativo: Ventas Anuales
Para determinar el modelo de regresión lineal que explique las ventas
anuales en función de los años de experiencia del vendedor. Se toma
una muestra con lo siguiente:
Variable dependiente: Y: Ventas anuales
Variable independiente: X: Años de experiencia
Caso Aplicativo: Ventas Anuales
Vendedor Años de experiencia Ventas anuales ($ miles) • Elabore un diagrama de
dispersión.
1 1 80 • Realice un ajuste de regresión de
2 3 97 los años de experiencia y las
ventas anuales e interprete los
3 4 92 coeficientes calculados.
4 4 102 • Verifique los supuestos del
modelo, asumiendo un 5% de
5 6 103 significancia.
6 8 111 • Determine e interprete el
coeficiente de correlación y
7 10 119 determinación.
8 10 123 • Use la ecuación estimada de
regresión para predecir las ventas
9 11 117 anuales de un vendedor con 9
10 13 136 años de experiencia.
Caso Aplicativo: Ventas Anuales
• Elabore un diagrama de
dispersión.
• Realice un ajuste de regresión de
los años de experiencia y las
ventas anuales e interprete los
coeficientes calculados.
• Verifique los supuestos del
modelo, asumiendo un 5% de
significancia.
• Determine e interprete el
coeficiente de correlación y
determinación.
• Use la ecuación estimada de
regresión para predecir las ventas
anuales de un vendedor con 9
años de experiencia.
Caso Aplicativo: Ventas Anuales
Elabore un diagrama de
dispersión.
La nube de puntos
(diagrama de dispersión)
nos permite dar a
conocer que existe una
relación directa o
positiva entre las
variables años de
experiencia y ventas
anuales.
Caso Aplicativo: Ventas Anuales
El p-valor de significancia de la prueba de correlación resultó menor que 0.01
(p=0.000<0.01), indicando que existe una relación significativa al 1% de
significancia, entre las variables Años de experiencia y Ventas anuales, así mismo,
el coeficiente de correlación presentó un signo positivo (r=0.965), dando a
conocer que existe una relación directa entre las variables, cuya fuerza de
asociación es bien alta positiva (ver anexo).
Caso Aplicativo: Ventas Anuales
Anexo
Caso Aplicativo: Ventas Anuales
Variables Normalidad Coeficiente
V1 Cumple
Coeficiente de correlación de Pearson
V2 Cumple
Al menos una variable no
Coeficiente de correlación de Spearman
cumple con la normalidad
Pruebas de Normalidad
Hipótesis a contrastar:
H0: Los datos analizados siguen una distribución Normal.
H1: Los datos analizados no siguen una distribución Normal .
KOLMOGOROV- SMIRNOV SHAPIRO - WILK
(Corrección de significación
de lilliefors)
Para muestras grandes (n≥50) Cuando la muestra es
pequeña (n<50)
*Garza (2013)
Importante:
Cuando p >0.05 Aceptamos la Hipótesis Nula
Cuando p <0.05 Rechazamos la Hipótesis Nula de manera significativa
Cuando p <0.01 Rechazamos la Hipótesis Nula de manera altamente
significativa
* Análisis Estadístico Multivariante Un enfoque teórico y práctico. Jorge de la Garza García
Caso Aplicativo: Ventas Anuales
El p-valor de significancia de la prueba de normalidad para muestras pequeñas es
mayor que 0.05, tanto para la variable Años de experiencia (p=0.678>0.05), como
para la variable Ventas anuales ($ miles) (p=0.998>0.05), dando a conocer que se
cumple el supuesto de normalidad para ambas variables, por tanto, para
cuantificar la relación entre variables, se hará uso del coeficiente de correlación de
Pearson.
Caso Aplicativo: Ventas Anuales
• Realice un ajuste de regresión de los años de experiencia y las ventas
anuales e interprete los coeficientes calculados.
La ecuación del modelo es:
y 80 4 X
Caso Aplicativo: Ventas Anuales
• Realice un ajuste de regresión de los años de experiencia y las ventas
anuales e interprete los coeficientes calculados.
La ecuación del modelo es:
y a bX y 80 4 X
Interpretación de los coeficientes:
a : La interpretación que tiene “a” es solo matemática, esto es el
punto de corte con el eje y. (tener en cuenta que en la mayoría de los
casos la interpretación carece de sentido).
Caso Aplicativo: Ventas Anuales
• Realice un ajuste de regresión de los años de experiencia y las ventas
anuales e interprete los coeficientes calculados.
La ecuación del modelo es:
y a bX y 80 4 X
Interpretación de los coeficientes:
b : Por cada año de experiencia adicional, se espera un incremento de
$4 mil dólares en las ventas anuales.
Caso Aplicativo: Ventas Anuales
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Caso Aplicativo: Ventas Anuales
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
n 50 ,Shapiro Wilk
Primer Supuesto:
Normalidad de Errores n 50, Kolmogorov Smirnov
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Caso Aplicativo: Ventas Anuales
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Como el p-valor de significancia de la prueba de normalidad Shapiro-Wilk
para muestras pequeñas (menor que 50), es mayor que 0.05
(p=0.595>0.05), se concluye que los errores presentan distribución normal.
Caso Aplicativo: Ventas Anuales
Segundo Supuesto:
Validez el modelo de regresión lineal simple. Use un alfa=0.05.
H0: β=0 (No existe dependencia lineal de los años de experiencia y las
ventas anuales).
H1: β≠0 (Existe dependencia lineal de los años de experiencia y las
ventas anuales).
Caso Aplicativo: Ventas Anuales
Segundo Supuesto:
Valide el modelo de regresión lineal simple. Use un alfa=0.05.
Decisión: Como Sig.(0.000) < α (0.05) → Se Rechaza H0
Conclusión: Como sig.(p=0.000<0.05), se rechaza la hipótesis nula, por tanto, existe
relación lineal entre los años de experiencia y las ventas anuales, es así que se
concluye que el modelo es válido.
Caso Aplicativo: Ventas Anuales
• Determine e interprete el coeficiente de correlación y determinación.
r 2 0.93 ; el 93.0% de la variabilidad de las ventas anuales, se encuentra explicada
por los años de experiencia.
Caso Aplicativo: Ventas Anuales
• Use la ecuación estimada de regresión para predecir las ventas
anuales de un vendedor con 9 años de experiencia.
y a bX y 80 4 X
Para predecir las ventas anuales de un vendedor con 9 años de experiencia,
reemplazamos en la ecuación de regresión.
y a bX y 80 49
y 116
Entonces, podemos decir que con 9 años de experiencia se esperaría que un
vendedor tenga $116 mil dólares de ventas anuales.
Caso Aplicativo: Preparación De Pedidos
Caso Aplicativo: Preparación De Pedidos
Para determinar el modelo de regresión lineal que explique el tiempo
que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
Caso Aplicativo: Preparación De Pedidos
Para determinar el modelo de regresión lineal que explique el tiempo
que se demora en alistar un pedido en función de la cantidad de
productos que solicita el cliente. Se toma una muestra con los
siguientes resultados:
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
Variable dependiente: Y: Tiempo
Variable independiente: X: Número de productos
Caso Aplicativo: Preparación De Pedidos
Tiempo
20 38 12 55 80 35 15 40 55 100 10 45
(minutos)
Número de
3 7 2 8 7 4 3 5 5 9 2 6
productos
• Realice un ajuste de regresión del tiempo y el número de productos e
interprete los coeficientes calculados.
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
• Determine e interprete el coeficiente de correlación y determinación.
Caso Aplicativo: Preparación De Pedidos
• Realice un ajuste de regresión del tiempo y el número de productos
e interprete los coeficientes calculados.
La ecuación del modelo es:
y 10.732 10.390 X
Caso Aplicativo: Preparación De Pedidos
• Realice un ajuste de regresión del tiempo y el número de productos e
interprete los coeficientes calculados.
La ecuación del modelo es:
y a bX y 10.732 10.390 X
Interpretación de los coeficientes:
a : El tiempo que se demora en alistar un pedido, cuando la cantidad
de productos solicitados por el cliente es cero, es de -10.732 minutos
(tener en cuenta que la interpretación carece de sentido)
Caso Aplicativo: Preparación De Pedidos
• Realice un ajuste de regresión del tiempo y el número de productos e
interprete los coeficientes calculados.
La ecuación del modelo es:
y a bX y 10.732 10.390 X
Interpretación de los coeficientes:
b : Por cada producto adicional que se registra en el pedido, el tiempo
que se demora en alistar un pedido, aumenta en 10.390 minutos.
Caso Aplicativo: Preparación De Pedidos
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Caso Aplicativo: Preparación De Pedidos
• Verifique los supuestos del modelo, asumiendo un 5% de
significancia.
n 50 ,Shapiro Wilk
Primer Supuesto:
Normalidad de Errores n 50, Kolmogorov Smirnov
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Caso Aplicativo: Preparación De Pedidos
Primer Supuesto:
Normalidad de Errores
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Como el p-valor de significancia de la prueba de normalidad Shapiro-Wilk
para muestras pequeñas (menor que 50), es mayor que 0.05
(p=0.595>0.05), se concluye que los errores presentan distribución normal.
Caso Aplicativo: Preparación De Pedidos
Segundo Supuesto:
Validez el modelo de regresión lineal simple. Use un alfa=0.05.
H0: β=0 (No existe dependencia lineal del tiempo de demora respecto
al número de productos).
H1: β≠0 (Existe dependencia lineal del tiempo de demora respecto al
número de productos)
Caso Aplicativo: Preparación De Pedidos
Segundo Supuesto:
Valide el modelo de regresión lineal simple. Use un alfa=0.05.
Decisión: Como Sig.(0.000) < α (0.05) → Se Rechaza H0
Conclusión: Como sig.(p=0.000<0.05), se rechaza la hipótesis nula, por tanto, existe
relación lineal entre el número de productos del pedido y el tiempo que demoran en
alistar el pedido, es así que se concluye que el modelo es válido.
Caso Aplicativo: Preparación De Pedidos
• Determine e interprete el coeficiente de correlación y determinación.
r = 0.887; existe una correlación alta positiva entre el número de productos del
pedido y el tiempo que demoran en alistar el pedido.
r 2 0.787 ; El 78.7% de la variabilidad del tiempo que demoran en alistar el pedido, se
encuentra explicada por número de productos del pedido.
Caso Aplicativo: Preparación De Pedidos
SPSS