Lee con atención plena el siguiente caso y realiza lo que se te pide:
El banco local está evaluando a nuevos clientes para otorgarles crédito, para ello
ha decidido realizar un análisis de regresión lineal considerando tres variables de
sus actuales cuentahabientes; la muestra que ha considerado es de 20 personas
concentrada en la siguiente tabla:
Utiliza Minitab o en dado caso Excel, pero considera que puede haber tablas que
no se obtengan en el programa.
1. Elabora un análisis de regresión múltiple considerando a la “Edad” como
variable dependiente y al resto como variables independientes.
Construye la ecuación lineal.
Obtén el gráfico de probabilidad normal.
Gráfico de probabilidad
normal
100
Edad Y
50
0
0 20 40 60 80 100 120
Muestra percentil
Presenta los gráficos de residuales.
Ingreso X1 Gráfico de los
residuales
10
Residuos
0
8000 100001200014000160001800020000220002400026000
-10
Ingreso X1
Línea de crédito X2 Gráfico
de los residuales
10
Residuos
0
0 5000 10000 15000 20000 25000 30000 35000 40000
-10
Línea de crédito X2
Obtén la tabla de coeficientes.
Obtén la matriz de correlación.
Explica e interpreta los puntos anteriores.
- Ecuación de regresión
La ecuación está conformada por una variable dependiente (Edad) y dos
variables dependientes (Línea de crédito e Ingreso). La constante de
2.67 representa el valor estimado cuando la línea de crédito y el ingreso
tienen un valor igual a 0. El valor de 0.000987 es el cambio promedio de
la edad por cada unidad de la línea de crédito, y por ultimo los 0.000998
es el cambio promedio en la edad por cada unidad adicional de ingreso.
- Gráfico de probabilidad
Los datos de la grafica se muestran de manera constante y va en aumento
sobre una línea recta, por lo que se considera que siguen una distribución
normal.
- Gráficos de residuos
En las graficas podemos observar que los residuos se encuentran
distribuidos de forma aleatoria, por lo que se considera que el modelo que
se utilizó representa de buena manera la relación entre la variable
independiente y la dependiente. No se observan patrones claros por lo no
se considera como un problema grave.
- Tabla de coeficientes
El valor de nuestro coeficiente 3.67 es el valor de la edad estimada cuando
las variables independientes son igual a 0. Nuestro segundo coeficiente
(0.000987) representa que, por cada unidad adicional en la línea de crédito,
la edad aumenta un 0.000987. Y por último por cada unidad adicional en el
ingreso, la edad aumenta un 0.000998.
- Matriz de correlación
En el caso de las tres variables podemos observar que tienen una
correlación positiva bastante fuerte, por lo que podemos determinar que
existe una fuerte relación entre las variables independientes y la
dependiente, lo cual nos dice que, si una aumenta, las demás también lo
harán.
2. Elabora un análisis de regresión múltiple considerando a la “Línea de
crédito” como variable dependiente y al resto como variables
independientes.
1. Obtén las gráficas y tablas de resultados que se piden en
el inciso a.
Gráfico de probabilidad
normal
Línea de crédito X2
40000
20000
0
0 20 40 60 80 100 120
Muestra percentil
Ingreso X1 Gráfico de los
residuales
Residuos
5000
-5000 0 0 0 0 0 0 0 0 0 0
80
0
000 200 400 600 800 000 200 400 600
1 1 1 1 1 2 2 2 2
Ingreso X1
Edad Y Gráfico de los re-
siduales
10000
Residuos
5000
0
-5000 10 20 30 40 50 60 70 80
Edad Y
2. Explica e interpreta los puntos anteriores.
- Ecuación de regresión
En este caso la variable dependiente es la línea de crédito, las variables
independientes son la edad y los ingresos. Nuestro valor -6943 representa
el valor estimado de la variable dependiente cuando las variables
dependientes tienen un valor igual a cero. El -0.449 indica el cambio
promedio de la línea de crédito por cada unidad de los ingresos, y por
último, el 827.1 indica el cambio promedio en la línea de crédito por cada
unidad en la edad.
- Grafica de probabilidad
Los puntos de la grafica van de manera ascendente y en línea recta, por lo
que se deduce que los datos siguen una distribución normal.
- Gráficos de residuos
Estos gráficos son bastante similares a los del modelo A, por lo que
podemos decir que no hay un patrón que indique que los residuos se
presenten como un problema grave.
- Tabla de coeficientes
El coeficiente -6943 es el valor de la línea de crédito cuando las variables
independientes tienen un valor igual a cero. El segundo coeficiente -0.449
nos indica que por cada unidad adicional en los ingresos hay una
disminución del 0.449 en la línea de crédito. Y el tercer coeficiente nos
indica que por cada unidad adicional en la edad hay un aumento de 827.1
en la línea de crédito.
2. Evalúa ambos modelos, modelo a y modelo b, mediante el error
estándar de estimación, el coeficiente de determinación y la prueba F
del análisis de varianza. Explica detalladamente cada uno de ellos.
Modelo A
Error estándar de estimación
Coeficiente de determinación
Prueba F del análisis de varianza
Modelo B
Error estándar de estimación
Coeficiente de determinación
Prueba F del análisis de varianza
3. Realiza las pruebas de multicolinealidad en ambos modelos, tanto la
del rango de correlaciones como la prueba del factor de inflación de
la varianza, y explica los resultados.
4. Considerando la “Edad” como variable dependiente, ¿qué línea de
crédito le puedes otorgar a una persona de 60 años y a una de 20?
5. Tomando como variable dependiente a la “Línea de crédito”,
¿cuántos años deberá tener una persona para que alcance una línea
de crédito de más de 10,000 pesos y cuántos para una de más de
20,000?
6. Realiza una conclusión de al menos media cuartilla acerca de la
importancia del análisis de regresión lineal en la toma de decisiones
dentro del ámbito de la administración y los negocios y para la
realización de pronósticos.