0% encontró este documento útil (0 votos)
40 vistas5 páginas

Análisis Probabilístico de Tarjetas de Crédito

Este laboratorio se enfoca en analizar un conjunto de datos de tarjetas de crédito utilizando herramientas estadísticas y de probabilidad. Los estudiantes deben construir tablas de probabilidad y calcular la probabilidad de eventos relacionados con el estado de cuentas, género, tipo de tarjeta y otros factores.

Cargado por

Salomé
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
40 vistas5 páginas

Análisis Probabilístico de Tarjetas de Crédito

Este laboratorio se enfoca en analizar un conjunto de datos de tarjetas de crédito utilizando herramientas estadísticas y de probabilidad. Los estudiantes deben construir tablas de probabilidad y calcular la probabilidad de eventos relacionados con el estado de cuentas, género, tipo de tarjeta y otros factores.

Cargado por

Salomé
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

LABORATORIO 2

Estad´ıstica General
CMC0244
Tema: Probabilidades

1. Objetivos
Diferenciar entre conceptos como experimento aleatorio, variable aleatoria, espacio muestral y eventos.
Calcular probabilidades para diferentes eventos partiendo de las definiciones de probabilidad cl´asica y
frecuentista.

Aplicar procedimientos estad´ısticos para enfrentar situaciones vinculadas con el an´alisis de fen
´omenos aleatorios.

2. Pregunta problematizadora:
Este laboratorio profundiza en un an´alisis integral de un conjunto de datos de tarjetas de cr´edito,
utilizando herramientas de visualizaci´on de datos, t´ecnicas de an´alisis estad´ıstico y la teor´ıa de las
probabilidades. El objetivo es, en primer lugar, descubrir informaci´on valiosa sobre el comportamiento
del cliente y explorar las relaciones entre diversos factores demogr´aficos, financieros y relacionados con
el producto presentes en el conjunto de datos para construir modelos que describen adecuadamente la
regularidad de los resultados aleatorios, de tal forma que se puedan hacer predicciones.
¿C´omo podemos dar una estimaci´on de qu´e tan probable es la ocurrencia de deserci´on de uso de
tarjetas de cr´edito a partir de modelos probabil´ısticos?

3. Resultados de aprendizaje:
Al finalizar la pr´actica de laboratorio el estudiante debe estar en la capacidad de:
Define los conceptos de probabilidad y de elementos que caracterizan una variable aleatoria ilustrando
con situaciones experimentales.

Utiliza herramientas computacionales para el an´alisis estad´ıstico de datos que surgen en ´areas de las
ciencias naturales, ciencias sociales, ingenier´ıa e industria en general.

4. Recursos
Software R. RStudio o Rstudio Cloud (editores recomendados para trabajar con R).
5. Preguntas a responder por los estudiantes
La propuesta de trabajo del presente laboratorio est´a distribuida en 3 bloques. A continuaci´on se
describir´a la situaci´on problema a analizar, se plantear´an las actividades as´ı como las preguntas
correspondientes a desarrollar y finalmente se enuncia el eje tem´atico abordado.

Situaci´on Problema
En estad´ıstica se manejan datos aleatorios; en ellos no es posible hacer predicciones exactas mediante el
uso de modelos matem´aticos, pero cuando son estudiados muchas veces bajo condiciones similares se
encuentra que los resultados presentan cierta regularidad. Por lo tanto, nunca puede estarse seguro de lo
que vaya a pasar, pero con base en la informaci´on del pasado puede predecirse con fundamentos.

En este caso, en particular, un gerente del banco est´a preocupado porque cada vez m ´a s clientes
abandonan sus servicios de tarjetas de cr´edito. El objetivo es obtener informaci´on sobre el
comportamiento del cliente y las caracter´ısticas demogr´aficas, como edad, sexo, nivel educativo y estado
civil para poder hacer predicciones y tener m ´a s elementos de juicio sobre el consumo de las tarjetas de cr
´edito.

El conjunto de datos consta de una amplia gama de variables, que incluyen el estado de actividad del
cliente, la edad, el sexo, el salario, el nivel educativo, el estado civil, la categor´ıa de la tarjeta y el periodo
de relaci´on o permanencia con el banco.

La data contiene:
CLIENTNUM: Numero de cliente. Identificador u´ nico del cliente titular de la cuenta.

Attrition−Flag: Variable de evento interno (actividad del cliente): si la cuenta est ´a cerrada, entonces
attried o existing si esta activa.
Customer−Age: Edad del cliente en an˜ os.
Gender: M=Hombre, F=Mujer.

Education−Level: Calificaci´on educativa del titular de la cuenta (ejemplo: escuela secundaria (high
school), colegio (college), graduado universitario (graduate), doctorado (doctorate), posgraduado (post-
graduate), sin educaci´on (uneducated)).

Marital−Status: Casado, Soltero, Divorciado, Desconocida.


Income−Category: Categor´ıa de ingresos anuales del titular de la cuenta en d´olares (< $40,000, $40,000−
$60,000, $60,000 − $80,000, $80,000 − $120,000, > $120,000, desconocido)
Card−Category: Tipo de tarjeta (Azul, Plata, Oro, Platino)
Months−on−book: Periodo de relaci´on con el banco (meses).

Bloque 1
Problema 1. Importe la base de datos tarjetacredit.csv. Determine la correspondiente tabla de proba-
bilidades (marginales y conjuntas) considerando la poblaci´on en la que cada individuo es clasificado
segu´ n los criterios que aparecen a continuaci´on. Grafique y elabore conclusiones (m´ınimo 3 por cada
´ıtem):
a. g´enero (F ´o M) y tipo de tarjeta (Azul, Plata, Oro, Platino).
b. actividad de la cuenta (cerrada ´o activa) y estado civil (casado. soltero, divorciado, desconocido)
del cliente.
c. tipo de tarjeta (Azul, Plata, Oro, Platino) y perfil educativo del titular de la tarjeta (escuela
secundaria, colegio, graduado universitario, doctorado, posgraduado, sin educaci´on).
d. actividad del cliente con respecto a la cuenta (activa o cerrada) y el g´enero (F ´o M).

Problema 2. Teniendo en cuenta la informaci´on de la tabla d. realizada en el punto anterior, complete:

El gerente del banco recolect´o datos sobre . . . . . . de sus clientes. De los . . . . . . hombres,....tienen tarjetas
de cr´edito activas. . . . . . . de los hombres tienen la cuenta cerrada (inactiva), mientras que........de las mujeres
tienen la cuenta inactiva. El gerente del banco desea determinar la probabilidad de que un cliente
seleccionado al azar sea:

una mujer con tarjeta de cr´edito (cuenta) activa.


una mujer con tarjeta de cr´edito inactiva.
un hombre sin tarjeta activa.
un hombre con tarjeta activa.

Cierre: Ya sea a partir de una tabla de frecuencias cruzada o con la construcci´on de tablas de
probabilidades conjuntas y condicionadas podemos dar respuesta a las diferentes probabilidades de
seleccionar al azar una persona que tenga como caracter´ısticas ser mujer o ser hombre y tener ya bien
sea, actividad en el banco, una cualificaci´on profesional, un estado civil o los diferentes tipos de tarjeta
entre los mercados de cr´editos m ´a s din´amicos.

Bloque 2
Problema 3. Realice la tabla de contingencia y encuentre la probabilidad de que una persona
seleccionada al azar:

Tipo de Edad
Tarjeta Menor de 40 an˜ os Total
40 an˜ os ´o m ´a s
Azul
Plata
Oro
Platino

Total

Tenga 40 an˜ os ´o mas y tarjeta de cr´edito


azul. Tenga menos de 40 an˜ os.
Con tarjeta de cr´edito plata dado que tiene 40 an˜ os ´o m´as.
Sea menor de 40 an˜ os si tiene tarjeta tipo oro.
Con tarjeta oro o azul dado que es una persona menor de 40 an˜os.
Dado que es una persona de 40 an˜ os ´o m´as, no tenga tarjeta platino.

Problema 4. Encuentre las probabilidades marginales y conjuntas para:

Ingresos
< $40K $40K-$60K $60K-$80K $80K-$120K > $120K Desconocido Total
Estado Civil
Divorciado
Casado
Soltero
Desconocido
Total
¿Qu´e se puede inferir en cuanto a los ingresos de los clientes del banco y su estado civil? Realice gr
´aficos y analice frecuencias porcentuales de la tabla para fundamentar su respuesta

Problema 5.
Elabore la tabla de contingencia para los ingresos de los clientes y el perfil educativo del mismo.
Encuentre la probabilidad de que un representante seleccionado al azar:
Tenga posgrado.
Tenga ingresos entre $60K-$80K dado que es graduado universitario.
Sea doctor si tiene de ingresos m ´a s de $ 120K.
Dado que es de ecuela secundaria, no tenga ingresos entre $80.000 y $ 120.000 d´olares.
Si se sabe que el cliente tiene menos de 120.000 d´olares de ingresos anuales, provenga de un cliente
con escuela secundaria.

Cierre: A partir de una situaci´on (comportamiento del cliente respecto a la circulaci´on de tarjetas de
cr´edito) se analizan experimentos aleatorios a trav´es de la teor´ıa de probabilidad marginal, condicional
y conjunta y tipos generales del comportamiento que se pueden describir mediante teoremas probabil
´ısticos

Bloque 3
Problema 6. Entre los estudiantes de una Facultad se dan las siguientes proporciones: el 15 % son
hombres. El 70 % de los varones fuman, mientras que entre las mujeres s ´olo fuman el 20 %. Escogido un
estudiante al azar, calcu´lese la probabilidad de que fume.

Problema 7. Suponga que una empresa X recibe un determinado producto de tres proveedores, 60 % de
B1, 25 % de B2, 15 % de B3. Adem´as, se conoce que, el 90 % de B1, 85 % de B2, 60 % de B3 cumplen
con las especificaciones. Se desea conocer la probabilidad de que algu´ n producto recibido cumpla con
las especificaciones. Si un producto cumple con las especificaciones, ¿cu´al es la probabilidad que
provenga del proveedor B2?

Problema 8. Sabemos que el 7 % de la poblaci´on colombiana tiene estudios superiores, estudios


medios el 20 %, estudios primarios el 60 % y no tiene estudios el 13 %. Los desempleados no se
distribuyen proporcio- nalmente entre esas categor´ıas, dado que de entre los de estudios superiores est
´an sin trabajo el 10 %, entre los de estudios medios el 35 %, entre los de estudios primarios el 18 %, y
entre los que no tienen estudios el 37 %.
a. Obtenga las probabilidades de que extra´ıdo uno al azar, ´este sea desempleado.
b. Titulado superior, sabiendo que est´a sin trabajo.
Cierre: Para finalizar, los problemas del presente bloque permiten aplicar uno de los resultados m ´a s
co- nocidos y u´tiles en el ´area de la probabilidad y estad´ıstica, y en particular en el estudio de la
probabilidad condicional, como lo es el Teorema de Bayes. El objetivo es calcular la probabilidad de un
suceso teniendo informaci´on a priori sobre el mismo.

6. Condiciones de entrega:
1. Se deben incluir los nombres de los integrantes en el archivo entregable.
2. Solo se debe entregar UN ARCHIVO y este debe ser con extensi´on .rmd
3. Se debe marcar el archivo con nombre del profesor tallerista y el nombre y apellidos (ambos
apellidos) del autor de correspondencia (el estudiante encargado de subir el archivo a Interactiva
Virtual).

También podría gustarte