Caso: R&DGo Bank
R&DGo Bank es una entidad privada que ha ingresado con fuerza al sistema
financiero peruano y acaba de cumplir 5 años en el mercado financiero
peruano. Debido a su rápido crecimiento el Gerente de Operaciones desea
hacer un estudio inferencial entre los clientes a los que se les ha otorgado
tarjeta de crédito. Para cumplir con su objetivo, el gerente seleccionó al azar
muestras aleatorias e independientes de tres grupos de clientes según el tipo
de tarjeta de crédito otorgada.
Las variables de interés analizadas fueron las siguientes:
Tarjeta: Tipo de Tarjeta de Crédito otorgada: Clásica, Platino o Dorada.
Género: Género del cliente (Masculino, Femenino).
Edad: Edad del cliente (en años)
Crédito: Monto de crédito utilizado (en miles de soles) en marzo del 2024.
Retiros: Número de retiros por cajero en el mes de marzo hasta antes del
cierre de facturación.
Pagos: Número de pagos en establecimientos comerciales en el mes de
marzo hasta antes del cierre de facturación.
Categoría: Categoría de clasificación del cliente: A1 y A2.
Ingreso: Ingreso mensual del cliente (en miles de soles).
Hijos: Número de hijos del cliente.
Los datos los puede ubicar en el Aula Virtual en el archivo Caso 2.xlxs
1
Análisis de Regresión
1. Considere solo a los clientes con tarjeta de crédito dorada
a) Obtenga el coeficiente de correlación entre las variables monto de crédito y el
ingreso mensual.
b) Estime la ecuación de regresión lineal simple que explique el monto de crédito
utilizado en función del ingreso mensual.
c) Realice el Análisis de Varianza. Use un nivel de significación de 0.01
d) Interprete el coeficiente de determinación.
e) Realice la predicción a un 99% de confianza para
Estimar el monto de crédito utilizado de un cliente con 3500 soles de ingreso.
Estimar el monto medio de crédito utilizado de clientes con 4000 soles de
ingresos.
2. Considere solo a los clientes con tarjeta de crédito platino
a) Determine el mejor modelo de regresión curvilineal que explique el monto de
crédito utilizado en función del ingreso mensual
b) Estime la variable respuesta cuando X=3750
3. Considere solo a los clientes con tarjeta de crédito dorada y determine el mejor
modelo de regresión múltiple que explique el monto de crédito utilizado en
función de la edad, ingreso mensual, retiros, hijos.
a) Realice el Análisis de Varianza. Use un nivel de significación de 0.01.
b) Estime la ecuación del mejor modelo que explica el monto de crédito utilizado.
Use un nivel de significación de 0.01.
c) Realice el análisis de multicolinealidad
d) Interprete el coeficiente de determinación.
e) Realice la predicción a un 99% de confianza para:
Estimar el monto de crédito utilizado de un cliente con 3500 soles de ingreso y
realiza 8 retiros en el mes de marzo.
Estimar el monto medio de crédito utilizado de clientes con 4000 soles de
ingresos y realiza 10 retiros en el mes de marzo.
2
Caso: R&DGo Bank (continuación)
Introducción al Análisis Multivariado
Considere las variables predictoras cuantitativas del modelo de regresión de la
pregunta anterior, de los clientes con tarjeta de crédito clásica
1. ¿Cuál es la dimensión de la matriz de datos?
2. Estime el vector de medias
3. ¿Cuál es la covarianza entre las variables retiros e hijos?
4. ¿Cuál es la correlación entre las variables hijos e ingresos?
5. Obtenga los autovalores de la matriz de correlación
6. Obtenga el autovector del segundo autovalor de la matriz de covarianza
7. Indique la variabilidad explicada considerando los dos primeros autovalores de
la matriz de correlación
8. Calcule la traza de la matriz de covarianza a partir de sus autovalores
9. Calcule el determinante de la matriz de correlación a partir de sus autovalores.
3
Caso: Línea Aérea
Las ganancias por la venta de pasajes (en miles de dólares) de una nueva
aerolínea en el período de diciembre del 2017 a abril del 2024 se presentan a
continuación:
t Yt t Yt t Yt t Yt t Yt t Yt t Yt
1 15.0 13 129.3 25 221.0 37 185.6 49 206.6 61 242.0 73 212.0
2 15.0 14 140.4 26 223.0 38 182.4 50 206.7 62 245.4 74 208.5
3 16.8 15 149.8 27 223.0 39 181.3 51 207.9 63 247.6 75 204.7
4 21.6 16 158.4 28 220.8 40 182.5 52 209.1 64 249.1 76 200.2
5 29.2 17 167.5 29 217.0 41 184.3 53 210.9 65 249.6 77 195.8
6 39.7 18 177.5 30 213.0 42 186.9 54 214.3 66 247.9
7 51.6 19 187.9 31 209.8 43 190.6 55 218.7 67 244.1
8 64.2 20 197.0 32 207.0 44 195.7 56 223.1 68 238.7
9 78.3 21 203.4 33 203.9 45 201.2 57 227.6 69 233.2
10 92.2 22 207.9 34 200.5 46 205.4 58 230.9 70 227.3
11 105.7 23 212.9 35 195.8 47 207.8 59 233.7 71 221.2
12 118.1 24 217.6 36 190.6 48 207.5 60 237.3 72 215.9
Series de Tiempo
Responda las siguientes preguntas. Use un nivel de significación de 0.06
donde sea conveniente:
a) Indique el número de diferenciaciones necesarias para volver a la serie
estacionaria.
b) Obtenga el mejor modelo ARIMA.
En base al mejor modelo ARIMA
c) Verifique si el modelo es adecuado.
d) Verifique si se cumple el supuesto de normalidad de errores.
4
e) Presente a un 94% de confianza el intervalo para el pronóstico de julio del
2024.
Complete los espacios en blanco
a) El producto de los autovalores obtenidos de la matriz de correlación es igual al
____________________ de la matriz de correlación.
b) El número de diferentes covarianzas por pares de variables que se pueden
obtener de una matriz de datos con 80 observaciones y 9 variables de las
cuales 2 son cualitativas es __________
c) El método Box Jenkins se aplica a series de tiempo
____________________________________
d) Si se desea agrupar elementos se puede hacer uso de la técnica multivariada
denominada ____________________________________.
e) La prueba de ___________________ permite evaluar la adecuación de un
modelo de series de tiempo.
f) La suma de los autovalores obtenidos de la matriz de correlaciones es igual a
_____________de la matriz de correlaciones.
g) El análisis factorial, tiene como objetivo la ____________________________
h) La _____________________ de la matriz de correlaciones es igual al número
de variables de la matriz de datos.