Proyecto Final
Docente:
Leandro Abraham
Tutor:
Ignacio Barraza
Grupo 6-1:
Edgar Castro / Edylin Somoza / Eduardo Villanueva
04/2022
ÍNDICE
TEMÁTICAS 3
HIPÓTESIS 3
DATASET 3
PROCESO ETL 3
DIAGRAMA ENTIDAD-RELACIÓN 4
TABLAS 5
Tabla1:Ventas 5
Tabla2:Productos 5
Tabla3: Envios 5
Tabla4:Publicaciones 5
Tabla5:Pedidos 6
COLUMNAS CALCULADAS 6
MEDIDAS CALCULADAS 6
SEGMENTACIONES 8
ANÁLISIS FUNCIONAL DEL TABLERO 9
1- Ventas por Familia 9
2- Ventas por Categoría 10
3- Formas de Envíos 10
TEMÁTICAS
Para el estudio de las ventas realizadas por medio de la plataforma de E-commerce Mercado
Libre; específicamente del vendedor ES Sport, analizaremos los datos proporcionados por
dicha plataforma tales como; número de venta, usuario, producto, cantidad, totales
relacionadas, formas de envío, entre otros. Abarcando un periodo de dos años iniciando
aproximadamente en Agosto del 2020 y la categoría principal de los productos de estudio tal
como Deporte y fitness. Además del estudio por categoría secundaria y familia de producto.
HIPÓTESIS
● Analizar la totalización de unidades vendidas por mes; con el objetivo de identificar
los productos de mayor movimiento.
● Calcular el porcentaje de participación de las categorías en unidades y en efectivo y
así identificar las tendencias de movimiento.
● Definir el top de productos más vendidos con el fin de mejorar la estimación de las
órdenes de compra acorde a las ventas.
DATASET
Se adjunta a este trabajo el archivo excel con la base de datos organizada y estructurada.
PROCESO ETL
Nuestro Dataset se encuentra dividido en 5 tablas, las cuales contenían toda la información
de una manera que no era la más eficiente, por lo cual implementamos un proceso de
normalización de bases de datos que consiste en asignar y aplicar una serie de reglas a las
relaciones con objeto de minimizar la redundancia de datos, facilitando su gestión posterior.
Logramos filtrar la información de las 5 tablas conectadas a través de PK y FK.
Luego, en el proceso de extracción, transformación y carga transformamos la información
para adaptarla a las necesidades del negocio, tuvimos que generar nuevas columnas para
enriquecer los datos del estudio, cómo el costo de las actividades.
1) Hicimos limpieza de los datos duplicados, así como también la eliminación de vacíos para
mejorar la cardinalidad entre las tablas.
2) Se transformaron los tipos de datos para poder realizar efectivamente operaciones en
medidas calculadas.
3) Se corrigieron los títulos de los encabezados para que coincidan con las variables ya establecidas
en otras tablas; como ProductoId e IdVentaML.
4) Unificamos el estilo de los datos colocando la primera letra en Mayúscula en los campos
requeridos
5) Creamos la tabla calendario para filtrar mejor nuestro registro de ventas y la relacionamos
en el Modelo.
6) Creamos un parámetro para filtrar el top 10 de productos en la vista de ventas por
categoría
7) Usamos la función Calculate para hacer totales de ventas tanto en monto como en
unidades vendidas,
8) Una VAR para calcular el total de ventas por dia y por mes
DIAGRAMA ENTIDAD-RELACIÓN
El modelo relacional inicial tuvo modificaciones debido a la creación de nuevas tablas para la
correcta interacción entre los canales por ejemplo las tablas calendario pedidos, cálculos
(medidas) y filtro top N.
TABLAS
En este apartado, se mencionará cada una de las tablas junto a una breve descripción de
estas y la definición de la clave primaria y foránea.
Tabla1:Ventas
Tipo de clave Campo Tipo de Campo
PK IdVentaML int
FK ProductoId nvarchar(50)
FK SKU nvarchar(20)
FK Cantidad int
- Total decimal
- Fecha Datetime
Tabla2:Productos
Tipo de clave Campo Tipo de Campo
FK SKU nvarchar(20)
FK Familia nvarchar(30)
Categoría
FK Principal nvarchar(30)
Categoría
- Secundari nvarchar(30)
PK ProductoId nvarchar(50)
Tabla3: Envios
Tipo de clave Campo Tipo de Campo
- Dirección nvarchar(50)
- Localidad nvarchar(50)
- Provincia nvarchar(50)
PK EnvioId nvarchar(50)
FK IdPedido nvarchar(50)
- Forma de Envio nvarchar(50)
Tabla4:Publicaciones
Tipo de clave Campo Tipo de Campo
FK SKU nvarchar(20)
PK Publicación nvarchar(15)
FK Familia nvarchar(30)
Categoría
FK Principal nvarchar(30)
Categoría
FK Secundari nvarchar(30)
Tabla5:Pedido
s
Tipo de clave Campo Tipo de Campo
PK IdPedido nvarchar(50)
- Cliente nvarchar(20)
- Documento nvarchar(20)
FK Fecha Datetime
FK IdVentaML nvarchar(50)
COLUMNAS CALCULADAS
1-Ventas → Costo sin IVA = Ventas[Precio Unitario]/1.21
2-Ventas → Envio gratis = if(Ventas[Precio Unitario]<3500,"SI","NO")
3-Ventas → Total = Ventas[Precio Unitario]*Ventas[Cantidad]
MEDIDAS CALCULADAS
Medida
% de
Determina porcentaje de ventas de cada subCategoría
Participación por
Categoría
Variables % de Participacion x Categoria = DIVIDE([Total
Total Vendido Vendido],CALCULATE([Total Vendido],
Categoría REMOVEFILTERS(Productos[Categoria Secundaria])))
Secundaria
Medida
Acumulado Determina el total de las ventas según el mes de estudio
mensual
Variables Total Vendido = SUM(Ventas[Total])
Total Vendido
Fecha
Medida
Productos Recuento de los productos registrados en el sistema
creados
Variable Productos creados = COUNT(Publicaciones[SKU])
SKU
Medida Recuento de los productos registrados en el sistema, segmentado por la
Productos por categoría principal
categoría
Variables Productos por categoria =
SKU CALCULATE(count(Publicaciones[SKU]),'Tabla Categorias'[Categoría
Categoría Principal]="Deportes y fitness")
Principal
Medida Recuento de los productos registrados en el sistema, segmentado por la
Productos por categoría secundaria
categoría 2
Variables Productos por categoria 2 =
SKU CALCULATE(count(Publicaciones[SKU]),'Tabla Categorias'[Categoría
Categoría Principal]="Salud y Equipamiento Médico")
Principal
Medida Recuento total de las publicaciones creadas en la plataforma
Publicaciones
Creadas
Variable Publicaciones Creadas = COUNT(Publicaciones[Publicacion])
Publicaciones
Medida Suma la totalidad por unidad de los productos vendidos
Total de unidades
por venta
Variable Total de unidades por venta = SUM(Ventas[Cantidad])
Ventas
Medida Suma la totalidad por precio de los productos vendidos
Total Vendido
Variable Total Vendido = SUM(Ventas[Total])
Ventas Total
Medida Determina el total de las ventas según el día de estudio
Ventas por dia
Variables Ventas por dia =
Total Vendido Var _Max =Format(Today () , "MMM")
Año / Fecha Return If(Sectedvalue('Calendario
pedidos'[Año])=YEAR(Today()),
Calculate([Total Vendido],Dateadd('Calendario
pedidos'[Fecha],0,YEAR),
Format('Calendario pedidos'[Fecha] , "MMM")<=_Max),[Total
Vendido])
Medida Determina el total de las ventas según el mes de estudio
Ventas x Mes
Variables Ventas x Mes =
Ventas Por Dia Calculate([Ventas por dia],Datesmtd('Calendario
Fecha pedidos'[Fecha]))
SEGMENTACIONES
1- Segmentación tipo panel de botones para
definir el año y la familia de estudio,
además de una segmentación deslizante
para ajustar el rango de tiempo de estudio
2-Segmentación tipo panel de botones para
seleccionar la categoría y una segmentación
deslizante para ajustar el rango de tiempo de
estudio
3- Segmentación tipo panel de botones para
definir la categoría de estudio, una
segmentación deslizante para ajustar el rango
de fechas, y una lista desplegable para la
selección de la provincia a donde se envía el
pedido
ANÁLISIS FUNCIONAL DEL TABLERO
1- Ventas por Familia
Se presentan un gráfico de torta que refleja el Total vendido por mes, y otro de barras
apiladas con las ventas mensuales por familia, todo ello segmentado por familia de
productos lo que proporciona datos relevantes para el análisis de mercado, como los
sectores que más se consumen en cada temporada.
Además de la totalización de las ventas por unidades y ganancias obtenidas.
2- Ventas por Categoría
Se presentan cuatro gráficos uno de torta que refleja el porcentaje de participación de
categoría con respecto al total vendido, y otro de barras apiladas con las ventas mensuales,
todo ello segmentado por categorías de productos lo que proporciona datos relevantes para
el análisis de mercado, como los sectores que más se consumen en cada temporada. Así
como también una gráfico de barras agrupadas que muestra los productos más vendidos por
mes filtrado con el top N de productos más vendidos.
Los gráficos se segmentan de acuerdo al rango de fechas de estudio y la categoría deseada.
3- Formas de Envíos
Se presentan tres gráficos uno de torta que refleja el porcentaje de pedidos por provincia, el
segundo es uno de barras agrupadas que representa el porcentaje de pedidos según su
forma de envío, y el tercero representa la cantidad de pedidos por tipo de logística, todo ello
segmentado por provincia y categoría de productos lo que proporciona datos relevantes
para el análisis transporte y las modalidades de envio mas usadas por los clientes.
Los gráficos se segmentan de acuerdo al rango de fechas de estudio y la categoría y provincia
deseada.