ANALÏTICA DE DATOS PODEROSA, ATRACTIVA Y DE AUTO-SERVICIO
Curso de Power BI
PRESENTADO POR ALEJANDRO SÁNCHEZ / BI CONSULTANT & POWER BI EVANGELIST
Módulo 2 / Descubrimiento y transformación de datos
• Transformando datos con Power BI Desktop
• Combinando los datos / Merge Queries
• DEMO
• Combinando los datos / Combinando binarios (archivos en carpetas)
• DEMO
• Parámetros, templates y otras características
• DEMO
Opciones para combinar datos
• Append Queries (Anexar Queries)
• Anexa los resultados de un query con otro query
• Combinar Binarios
• Usualmente utilizado para anexar varios archivos
(desde la opción Get Data from Folder)
• Merge Queries (Mezclar Queries)
• Une los resultados de un query con otro query
Append Queries
• Permite unir dos o más tablas
• Se recomienda que ambos tengan la misma
estructura si este no es el caso el sistema
añade al conjunto final los campos de todas
las demás con valores nulos.
• Es Similar a una operación UNION del
estándar SQL.
• Los Resultados pueden ser una nueva
query o ser un paso de la existente.
Demostración: Anexar Datos
Merge Queries
Tabla a combinar #2
Tabla a combinar #1 Tabla a combinar #3
Resultado: Consulta
combinada
Merge Queries / Tipos de Joins
Demostración: Merge Queries
Combinar Binarios (archivos en Folders)
• Funcionalidad que permite
anexar (append) los datos de
múltiples archivos contenidos
en un folder.
• Los archivos podrían ser
de distinto tipo (xlsx, csv, txt),
no hay problema.
• Esta funcionalidad se recomienda
cuando se tiene un Excel con muchos
registros el cual puede ser convertido
en multiples Excels mas pequeños
Demostración: Combinar Binarios
Parámetros, templates y otras características
• Parámetros
• Consultas y conexiones dinámicas
(parametrizando filtros y conexiones)
• Templates (plantillas)
• Habilita tu Solución Power BI Desktop para ser
compartida con otros usuarios (sin publicar en nube)
• Incluye todo, excepto los datos
• Características de usabilidad
• Query Dependencies
• Query Grouping → organizando tus queries
Módulo 3 / Modelamiento de Datos
• Conociendo el Motor de Modelado de Datos
• Como comprime datos PBI
• Demo de Compresión
• ¿Que es un modelo de datos?
• Tablas y Relaciones de un modelo Analitíco
• Experiencia analitica en PBI vs Excel
• PivotTables
• ¿Como crear un modelo de alto desempeño?
• ¿Comó empezar a diseñar un modelo de datos?
• Proceso de creación
• Laboratorio
Ciclo de desarrollo con Power BI
Data Discovery Data Modeling Data Visualization
• Extracción de datos • Relaciones • Filtros
• Transformaciones • Cálculos • Cuadros
Power BI Mobile Power BI Service
• Cualquier momento • Compartir resultados
• Cualquier lugar • Refrescar datos
• Cualquier dispositivo • Q&A
Motor del Modelo de Datos
• xVelocity
• Llamado xVelocity (antes conocido como Vertipaq)
• Válido para el tipo de conexión Importado,
no para DirectQuery o Live Connection
• Construido sobre tecnología de SSAS Tabular
• Performance
• Usa tecnología in-memory que provee un elevado
desempeño para el almacenamiento y consulta de datos
• Ciclos de desarrollo cortos, pensado para el usuario final
• Permite crear soluciones fácil y rápido
• Utiliza un lenguaje llamado DAX (Data Analysis
Expressions) que es similar a fórmulas Excel
Cómo trabaja xVelocity
Tabla lógica y representación de
• ¿Qué hace especial a xVelocity? almacenamiento por filas (Row-Store)
• Datos almacenados
por columnas (Column-Store)
• Compresión de datos extrema
Column-Store
“x 2” significa que el “x 3” significa que
“Red” está repetido “20” está repetido
dos veces tres veces
¿Qué es un modelo de datos?
M
o
d
e
(
A Tablas de Búsqueda Columnas
l (Lookup Tables) Calculadas (DAX)
n
o
a
l
d
í
e
t
i Medidas
D Calculadas (DAX)
c
a
o
t
)
o Tablas de Datos
Relaciones
(Data Tables)
s (Relationships) Jerarquías
Versus experiencia de analítica tradicional con Excel
• Tablas dinámicas → base de nuestros reportes en Excel
• Habilidades de modelamiento de datos NO requeridas
• Habilidades para utilizar VLOOKUP, INDEX, etc.
• Sin Modelo de Datos:
• Múltiples datasets → Múltiples tablas dinámicas
• Tamaño limitado por Excel:
• Los datos se cargan en Worksheets
• Excel 2007+ → 1 millón de registros
• El tamaño del archivo crece bastante con unos cuantos miles
de registros, así como el rendimiento deja mucho que desear
Versus experiencia de analítica tradicional con Excel
Modelo tradicional Excel
▪ Modelo de datos con múltiples
tablas de búsqueda (Lookup ▪ Modelo de datos de UNA SOLA
Tables) y datos (Data Tables) TABLA (Flat-And-Wide).
(Star Schema)
▪ El nivel de usabilidad para un
▪ El nivel de usabilidad para un usuario final es BAJO.
usuario final es ALTO.
▪ NO se orienta al Self-Service.
▪ SÍ se orienta al Self-Service.
Modelo Power Pivot en Excel
(motor analítico de Power BI)
Modelando datos para usabilidad y alto desempeño
• Modelo de datos Power BI basado
en principios del “esquema estrella”
(star schema):
• Tabla de Hechos al centro (conocida
como Tabla de Datos en PBI)
• Dimensiones alrededor (conocidas
como Tablas de Búsqueda en PBI)
• El esquema estrella es uno de los
esquemas más popular y vigente
para diseñar modelos datos
utilizado en la creación de DM/DW
y Cubos OLAP
Perspectiva de base de datos vs perspectiva de usuario
Perspectiva de base de datos OLTP (base de datos transaccional)
▪ Enfocada en maximizar el desempeño de los sistemas informáticos (datos normalizados)
Perspectiva de usuario (negocio)
▪ Enfocada en maximizar el desempeño de los
usuarios (datos denormalizados)
Para el consumo
Para la inserción y el almacenamiento
Modelando datos PBI
Modelando datos PBI
Modelando datos PBI
• Hacer cada pequeña cosa
en una tabla de búsqueda
no es un buen modelo de
datos (Exceso de Tablas de
búsqueda).
• Falta de desnormalización.
Mejoras para la usabilidad del modelo de datos
• Renombrando columnas y tablas
• El nombramiento debería mantener al usuario final en mente
• Las tildes y espacios entre palabras se aceptan
• Ocultando columnas y tablas
• Prevenir que los usuarios se vean saturados de datos (Ejemplo: Ocultar llaves)
• Ordenamiento de datos
• Incorpora otros valores de columna
para el ordenamiento
(Ejemplo: Días de la semana)
Cómo empezar a diseñar un modelo de datos
1. Preguntar cuáles son los hechos (conjuntos de datos) sobre los que el
negocio quiere respuestas. Y qué métricas o indicadores se desean conocer.
Por ejemplo: Quiero analizar las ventas, costo y margen de mis empleados
2. Preguntar cuáles son las dimensiones de corte de las
métricas o indicadores seleccionados (¿Quién?, ¿Qué?, ¿Dónde?, ¿Cuándo?,
¿Cómo?, etc. Por ejemplo: Mis empleados, Productos, Punto de venta,
Tiempo, etc.
3. Preguntar cuáles son los atributos de estas dimensiones. Por ejemplo:
Empleado → ¿Quién? → Nombre, Edad, Sexo, etc.
4. Identificar las fuentes de datos.
5. Diseñar un modelo de datos utilizando el esquema estrella
Laboratorio
Creando un
modelo de datos