II.
Churn vs Polígonos
Camilo Alvarez & Camilo Fabián
Exploración de la data
De las diferentes variables extraídas para analizar el problema global, en esta parte del análisis, se explorará
las variables de:
• Distancia de la bodega
• Clientes Churn
• Distancia a la plaza
Empecemos explorando la variable Distancia de la bodega, donde encontramos lo siguiente:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.300 7.475 10.100 10.441 12.475 22.600
Es una variable númerica donde, la minima distancia entre la bodega y una zona de clientes es de 2.3
kilometros, la distancia promedio es de 10.4409091 kilometros y la máxima distancia de 22.6 en una ruta
estandar.
Siguiendo con la variable de Clientes Churn tenemos:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 38.0 78.0 97.0 101.6 127.8 196.0
Sin embargo como la concentración de clientes en cada una de las zonas es diferentes, es más preciso examinar
el procentaje de Clientes inactivos por zonas, teniendo así:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.3676 0.4921 0.5398 0.5490 0.5971 0.7204
El porcentaje más bajo de clientes inactivos que tiene un poligono es de 0.3676471 y en promedio, los
poligonos tienen un 0.5489577 de clientes churn.
Para el caso de la variable Distancia a la plaza se tiene que:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.800 6.650 8.900 9.377 11.675 21.000
El 50% de los poligonos de clientes, tienen una distancia menor o igual a 8.9 kilometros y la distancia más
alejada de un poligono a la plaza es de 9.3772727 kilometros.
1
0.70
20
20
0.65
15
0.60
15
Porcentaje
Kilometros
Kilometros
0.55
10
0.50
10
0.45
5
5
0.40
0
Dist. Bodega % Churn Dist. Plaza
Análisis de Correlación
Para empezar a verificar si existe una relación entre la distancia de los clientes respecto a la bodega y
la cantidad de clientes que dejan de comprarnos, realizamos un gráfico de dispersión de estas variables
2
Distancia de la bodega vs Clientes churn
P30
P16
0.6 P36 P34
P37
P31
Porcentaje clientes Churn
P44
P3
P32
P29 P28
0.5 P38
P5 P19
P4 P42
P26
P13 P11 P2 P41
P25
P9
P14 P35
0.4 P12
P7 P21
P40 P6
P15 P33
P39
P8 P24
P27
P43
P17 P45
0.3
P20
P1
P22 P18
0.2 P23
5 10 15 20
Distancia (Km)
factor(master_data$[Link]) De 10% a 20% De 7.5% a 10% Over 20%
La dispersión de los polígonos en el gráfico de correlación no muestran ningún tipo de patron o tendencia
aparente, por lo cual no se podría sospechar la existencia de una relación entre la distancia de los grupos de
clientes a la bodega y la concentración de inactivos. Sin embargo, para obtener un dato númerico concreto,
se procede a hacer una prueba de correlación y se obtiene un -0.0649657 , este valor reafirma lo encontrado
gráficamente al no ser significativa dicha correlación. Sin embargo, con la gráfica podemos observar, que los
colores de los puntos (porcentajes de llegadas tardes en el primer semestre del año) siguen un aparente patrón:
a medida que aumenta la distancia la concentración de llegadas tardes también aumenta, esto puede sugerir
falencias en el sistema de ruteo, sin embargo revisarlo a profundidad está fuera del alcance de este proyecto.
Distancia plaza vs churn
Dado al análisis de la variable planteado anteriormente donde se encontró que la distancia a la plaza tiene
una distribución similar a la variable de distancia a la bodega, se esparía que al medir la correlación con el
porcentaje Churn obtengamos resultados similares
3
Distancia a la plaza vs Clientes churn
P34
P16
0.7 P30 P19
P29
P44
P28
P36
P31
Porcentaje clientes Churn
P37
P32
0.6 P4 P43
P5 P3
P41 P2
P9 P42
P13
P25 P26
P15 P7
P35 P24
P27
P23 P33
P6 P38
0.5 P14
P39
P45
P12
P11
P17
P20 P18 P40
P21
P8
0.4
P22 P1
0 5 10 15 20
Distancia (Km)
El gráfico muestra completa dispersión de los poligonos por lo que no se puede sospechar de una posible
relación entre las variables y calculando el coeficiente correlación obtenemos que -0.0972255
4
DISTANCIA VS TIPOS DE PQR
PQR Calidad Sanidad
PQRs Calidad Sanidad vs Clientes churn
P34
P16
0.7 P19 P30
P29
P44
P28
P36
Porcentaje clientes Churn
P31
P37
P32
0.6 P43 P4
P5 P3
P41 P2
P42 P9
P13
P25
P26
P7 P15
P24 P35
P27
P23 P33
P38 P6
0.5 P14 P39
P45
P12 P11
P17 P40
P20 P18
P21
P8
0.4
P22 P1
0 100 200 300 400 500
No. de PQRS
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] 0.06403044
5
PQR Calidad Estandar
PQRs Calidad Estandar vs Clientes churn
P34
P16
0.7 P19 P30
P29
P44
P28
P36
Porcentaje clientes Churn
P31
P37
P32
0.6 P43 P4
P3 P5
P41 P2
P42 P9
P13
P26 P25
P7 P15
P24 P35
P27
P38 P33 P23 P6
0.5 P39 P14
P45
P11 P12
P17
P40
P18
P20
P21
P8
0.4
P1 P22
0 50 100 150 200
No. de PQRS
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] -0.08183392
6
PQR Faltante total
PQRs Faltante Total vs Clientes churn
P34
P16
0.7 P19 P30
P29
P44
P28
P36
Porcentaje clientes Churn
P31
P37
P32
0.6 P43 P4
P3 P5
P41 P2
P42 P9
P13
P25 P26
P7 P15
P24 P35
P27
P6 P33 P23
P38
0.5 P39 P14
P45
P11 P12
P17
P18 P40
P20
P21
P8
0.4
P22 P1
0 20 40 60 80
No. de PQRS
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] 0.3257811
7
PQR No necesita el producto
PQRs No necesita el producto vs Clientes churn
P34
P16
0.7 P19
P30
P29
P44
P28
P36
Porcentaje clientes Churn
P31
P37
P32
0.6 P43 P4
P3 P5
P41 P2
P42 P9
P13
P25 P26
P15 P7
P35 P24
P27
P33
P38 P23 P6
0.5 P14 P39
P45
P12 P11
P17
P18 P40
P20
P21
P8
0.4
P1 P22
50 100 150 200 250
No. de PQRS
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] 0.004552206
8
RELACIÓN ENTRE NO. DE PQRS Y %CHURN
Total PQRS vs Clientes churn
P34
P16
0.7 P19 P30
P29
P44
P28
P36
Porcentaje clientes Churn
P31
P37
P32
0.6 P43 P4
P3 P5
P41 P2
P42 P9
P13
P26 P25
P7 P15
P24 P35
P27
P38 P33 P23 P6
0.5 P14 P39
P45
P12 P11
P17 P40
P18
P20
P21
P8
0.4
P22
P1
0 500 1000
No. de PQRS
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] 0.02231707
9
CANCELADOS VS DISTANCIA
Cancelados vs Distancia a Bodega
2.5
P18
P24
Ordenes canceladas
2.0
P22 P36
P23
P42
P27
P21
P34
P2 P38
P33
P11 P40
1.5
P41
P31 P16
P20 P44 P43 P28
P13 P39
P6
P17
P8
P7 P45
P3 P35
P12
P4 P29
P5 P30
P14 P26 P32
1.0 P9
P15
P25 P19 P1
P37
5 10 15 20
Distancia Km
factor(master_data$MayoriaCli) Comercio Restaurante
## [1] 0.1633295
10