---
title: "Trabajo final Corte 1"
author: "Juan David Mortigo"
date: "2024-02-26"
output: html_document
---
## primero instalamos los paquetes
```{r}
library(dplyr)
library(descriptr)
library(ggplot2)
library(datos)
library(fdth)
```
## luego sacamos una muestra y sembramos una semilla
```{r}
ola <- [Link](datos_credito)
[Link](2210)
muestra_credito <- ola[sample(nrow(ola),size=80),1:14]
```
## sacamos tablas de estado civil y vivienda relacionadas y luego como data frame
```{r}
[Link] <- table(muestra_credito$EstadoCivil, muestra_credito$Vivienda)
[Link]
estadocivil <- table(muestra_credito$EstadoCivil)
estadocivil
vivienda <- table(muestra_credito$Vivienda)
vivienda
estadocivil1 <- [Link](estadocivil)
estadocivil1
vivienda1 <- [Link](vivienda)
vivienda1
```
## diagrama de barras de estado civil
```{r}
estadocivil2 <- rename(estadocivil1, estadoC=Var1, Frecuencia=Freq)
barras_estado <- ggplot(estadocivil2, aes(x = estadoC, y = Frecuencia,
fill=estadoC)) +
geom_bar(stat = 'identity') +
geom_text(aes(label = estadoC), vjust = -1, colour = "black") +
ylim(c(0,75))
barras_estado
```
## Asignamos colores y hacemos grafico de torta
```{r}
colores <- [Link](length(estadocivil))
colores
torta1 <- pie(estadocivil,main="Estado Civil",radius = 1, col = colores, labels =
c(
"Divorciado","casado","Separado","soltero","viudo"))
```
## finalmente hacemos el grafico de donas
```{r}
hsize <- 2
df <- estadocivil1 %>%
mutate(x = hsize)
ggplot(df, aes(x = hsize, y = Freq, fill= Var1)) +
geom_col(color= "black") +
geom_label(aes(label = Freq),
position = position_stack(vjust = 0.5),
[Link] = FALSE) +
coord_polar(theta = "y") +
scale_fill_brewer(palette = "GnBu") +
xlim(c(0.2, hsize + 0.5))+
theme([Link] = element_rect(fill = "pink"))+
guides(fill = guide_legend(title = "Estado Civil"))
```
# Hacemos el mismo proceso anterior con vivienda
```{r}
vivienda2 <- rename(vivienda1, Vivienda=Var1, Frecuencia=Freq)
barras_vivienda <- ggplot(vivienda2, aes(x = Vivienda, y = Frecuencia,
fill=Vivienda)) +
geom_bar(stat = 'identity') +
geom_text(aes(label = Vivienda), vjust = -1, colour = "black") +
ylim(c(0,50))
barras_vivienda
colores <- [Link](length(vivienda))
torta1 <- pie(vivienda,main="Vivienda",radius = 1, col = colores, labels = c(
"Ignorar","Otra","Propietario","Padres","Privado","Alquila"))
hsize <- 2
df2 <- vivienda1 %>%
mutate(x = hsize)
ggplot(df2, aes(x = hsize, y = Freq, fill= Var1)) +
geom_col(color= "black") +
geom_label(aes(label = Freq),
position = position_stack(vjust = 0.5),
[Link] = FALSE) +
coord_polar(theta = "y") +
scale_fill_brewer(palette = "GnBu") +
xlim(c(0.2, hsize + 0.5))+
theme([Link] = element_rect(fill = "pink"))+
guides(fill = guide_legend(title = "Vivienda"))
```
## Creamos una tabla relacionando los ingresos con el trabajo
```{r}
x <-muestra_credito$Ingresos
y <- muestra_credito$Trabajo
df3 <- [Link](x = x, y = y)
df3
```
## posteriormente lo graficamos en un grafico de caja
```{r}
p <- ggplot(df3, aes(x = x, y = y)) + labs(x = "Ingresos", y = "Trabajo") +
theme([Link].x = element_text(size = 15,
color = "blue",
face = "bold"),
[Link].y = element_text(size = 15,
color = "red",
face = "italic"))+
stat_boxplot(geom = "errorbar",
width = 5) +
geom_boxplot(fill = "dodgerblue1",
colour = "black",
alpha = 5,
[Link] = "tomato2")
p
```
## creamos una tabla de frecuencias para precio y creamos su grafica de histograma
y poligonos
```{r}
tabla1 <- fdt(muestra_credito$Precio)
plot(tabla1, col="cadetblue",type = "rfh", main = "Histograma del precio")
grafico_poligono <- plot(tabla1, col="cadetblue",type = "fp", main = "grafico de
poligono del precio")
```
# Hacemos un analisis cuantitativo completo para 3 variables numéricas resumidas en
una sola tabla.
### empezando por gastos
```{r}
gastos <- muestra_credito$Gastos
promedio <- sum(gastos)/length(gastos)
[Link] <- sort(x=gastos,decreasing = FALSE)
mediana <- median(gastos)
moda <- ds_mode(gastos)
rango <- range(gastos,[Link] = FALSE)
varianza_gastos <- round(var(gastos),5)
desvest_gastos <- round(sd(gastos),5)
coefvar_gastos <- round(ds_cvar(gastos),3)
cuartil1_gastos <- quantile(x = gastos,probs = c(0.25,0.5,0.75,1),type = 6)
cuartil1_gastos <- quantile(x = gastos,probs = c(0.25),type = 6)
cuartil2_gastos <- quantile(x = gastos,probs = c(0.5),type = 6)
cuartil3_gastos <- quantile(x = gastos,probs = c(0.75),type = 6)
cuartil4_gastos <- quantile(x = gastos,probs = c(1),type = 6)
[Link]<- matrix(c(53.45,45,35,95,392.83291,19.82001,37.081,35,45,60,130),nrow
= 11)
rownames([Link]) <- c("Promedio","Mediana","Moda","rango(35-130)","varianza",
"desviacion estandar","coeficiente de variacion",
"cuartil 1","cuartil 2", "cuartil 3", "cuartil 4")
colnames([Link]) <- c("Gastos")
[Link] <- [Link]([Link])
[Link]
```
### seguimos con ingresos
```{r}
ingresos <- muestra_credito$Ingresos
promedioi <- sum(ingresos)/length(ingresos)
medianai <- median(ingresos)
modai <- ds_mode(ingresos)
rangoi <- range(ingresos,[Link] = FALSE)
varianza_ingresos <- round(var(ingresos),5)
desvest_ingresos <- round(sd(ingresos),5)
coefvar_ingresos <- round(ds_cvar(ingresos),3)
cuartil1_ingresos <- quantile(x = ingresos,probs = c(0.25,0.5,0.75,1),type = 6)
cuartil1_ingresos <- quantile(x = ingresos,probs = c(0.25),type = 6)
cuartil2_ingresos <- quantile(x = ingresos,probs = c(0.5),type = 6)
cuartil3_ingresos <- quantile(x = ingresos,probs = c(0.75),type = 6)
cuartil4_ingresos <- quantile(x = ingresos,probs = c(1),type = 6)
[Link]<-
matrix(c(170.3375,143,90,462,8798.22642,93.79886,55.066,94.5,143,230,500),nrow =
11)
rownames([Link]) <- c("Promedio","Mediana","Moda","rango(38-
500)","varianza",
"desviacion estandar","coeficiente de variacion",
"cuartil 1","cuartil 2", "cuartil 3", "cuartil 4")
colnames([Link]) <- c("ingresos")
[Link] <- [Link]([Link])
[Link]
```
### y finalmente con cantidad
```{r}
cantidad <- muestra_credito$Cantidad
promedioc <- sum(cantidad)/length(cantidad)
medianai <- median(cantidad)
modac <- ds_mode(cantidad)
rangoc <- range(cantidad,[Link] = FALSE)
varianza_cantidad <- round(var(cantidad),5)
desvest_cantidad <- round(sd(cantidad),5)
coefvar_cantidad <- round(ds_cvar(cantidad),3)
cuartil1_cantidad <- quantile(x = cantidad,probs = c(0.25,0.5,0.75,1),type = 6)
cuartil1_cantidad <- quantile(x = cantidad,probs = c(0.25),type = 6)
cuartil2_cantidad <- quantile(x = cantidad,probs = c(0.5),type = 6)
cuartil3_cantidad <- quantile(x = cantidad,probs = c(0.75),type = 6)
cuartil4_cantidad <- quantile(x = cantidad,probs = c(1),type = 6)
[Link]<-
matrix(c(1045.7125,1000,1300,4300,391269.44794,625.51535,59.817,625,1000,1300,4500)
,nrow = 11)
rownames([Link]) <- c("Promedio","Mediana","Moda","rango(200-
4500)","varianza",
"desviacion estandar","coeficiente de variacion",
"cuartil 1","cuartil 2", "cuartil 3", "cuartil 4")
colnames([Link]) <- c("cantidad")
[Link] <- [Link]([Link])
[Link]
```