Tableau
Contenido
Tableau.............................................................................................................................1
Clase 1 – Introducción.......................................................................................................3
Clase 2 – Fuentes de datos.................................................................................................4
1
Clase 3 – Conexiones de datos..........................................................................................5
Clase 4 – Data Visualization..............................................................................................5
Dimensión vs Medida....................................................................................................5
Continuo vs Discreto.....................................................................................................6
Marcas...........................................................................................................................7
Filtros.............................................................................................................................8
Clase 5 - Campos calculados.............................................................................................8
Clase 6 – Campos calculados avanzados.........................................................................11
Funciones lógicas y cálculos de tabla..........................................................................11
Clase 7 – Campos calculados avanzados II.....................................................................13
Expresiones de nivel de detalle (LOD).......................................................................13
Parámetros...................................................................................................................15
Conjuntos.....................................................................................................................16
Clase 8 – Storytelling y Dashboard.................................................................................17
Dashboard....................................................................................................................20
Clase 9/10 – Gráficos avanzados.....................................................................................21
Clase 12 – Tips & Tricks.................................................................................................23
Clase 1 – Introducción
BI: “Bussiness Intelligence” – ¿Qué es? Un conjunto de aplicaciones, herramientas,
tecnolgías, que permiten convertir datos en información, e información en
conocimiento. Facilita la toma de decisiones y la planificación, y proporciona múltiples
beneficios, entre ellos:
Mejora la toma de decisiones del negocio y eficiencia
- Reducir costos y aumentar ingresos
2
- Obtener datos de mayor calidad y alcanzar mayores ventajas competitivas.
Para manejar tal aluvión de datos, las compañías, que buscan tomar la mejor decisión
posible para hacer crecer su negocio, apuestan por el Business Intelligence o
inteligencia de negocios.
Diferencia con Big Data y Data Science: Big Data se ocupa de la captura,
almacenamiento y procesamiento de datos masivos, el Data Science del análisis
predictivo y prescriptivo de esos datos, y el Business Intelligence de aprovechar los
datos para optimizar las decisiones y el reporting de una compañía.
Herramientas de BI según su posicionamiento
Tableau: es el líder del mundo actual. Si bien es paga, se encuentra entre las 10
empresas más grandes del mundo. Colabora con empresas como Spotify, Mercado
Libre, etc. A diferencia de sus competidores es quien ofrece mayor granularidad a la
hora de analizar los datos
¿Qué herramienta es mejor? Es subjetivo al uso que se requiera.
Clase 2 – Fuentes de datos
Datos: información concreta sobre hechos, elementos, etc… Son susceptibles de
análisis, pero no tienen juicio, interpretación o contexto
Información: es el resultado de la transformación de los datos
Análisis de datos: tiene su función en le medio, transformando lo primero en lo
segundo, dando como resultado, información visual, que se traduce en un
3
dashboard. La toma de decisiones no es un trabajo del analista, eso le
corresponde al cliente.
Fuente de datos: el origen que contiene almacenados los datos almacenados, de
forma ordenada y contextualizada, sobre un tema en específico
Un archivo de texto
Una hoja de cálculo
Bases de datos en la nube
Bases de datos on prem
Clase 3 – Conexiones de datos
(A partir de esta clase, trabajamos con Tableau)
Las conexiones entre bases de datos, sirve para armar tablas con datos de distintos
orígenes.
Las conexiones entre bases, solo se pueden realizar cuando entre ellas existan campos
de conexión flexibles, es decir campos que pueden formar un vínculo entre las bases
Puedo vincular más de dos bases, formando un modelo de conexión flexible
Clase 4 – Data Visualization
Dimensión vs Medida
Cuando conectamos una base de datos, Tableau clasifica automáticamente los campos
(columnas) de nuestra tabla, como dimensión o medida.
Medida: es todo campo que contenga información numérica CUANTITATIVA.
Es una variable DEPENDIENTE, porque por sí solo no aporta nada, sin su
unidad de medida acompañándola.
Dimensión: es todo campo que contenga información CUALITATIVA y
categórica. Es INDEPENDIENTE
Las variables independientes ayudan a generar granulación, a diferencia de las
dependientes.
4
Dimensiones
Medidas
Continuo vs Discreto
Al igual que lo anterior, Tableau también identifica si los campos son variables
discretas o continuas
Discretas: son individuales e independientes. Por ejemplo: 1, 2, 3, 24, 45, 78…
Las identifica en color AZUL
Continuas: constituyen un todo continuo y sin interrupción. Ejemplo: 1,1; 1,2;
1,3; 78,4; 86,5, etc… Las identifica en colo VERDE
Visto en elementos visuales:
5
Un gráfico muestra las ventas de unos meses individualmente, y el otro muestra la
evolución de las ventas en esos meses
Barra de herramientas
Ordenar e intercambiar filas/columnas Tipo de visualización
Nueva fuente de datos
Etiquetas de marcas Modo presentación
Crear, duplicar, eliminar hoja
Marcas
Son las opciones para darle formato a los elementos: colores, etiquetas, tamaño, etc…
Color: permite darle un color a nuestro gráfico. Hay opciones para de colores en
secuencia y divergentes (2 colores), que nos pueden ayudar a
reflejar lo que deseamos nosotros.
Tamaño: ajusta sin más el tamaño de los elementos que
componen el gráfico
Etiqueta: opciones de marcas para los elementos dentro del
gráfico. Permite elegir donde posicionarlas, y en qué
elementos.
Descripción emergente: es el mensaje que figura cuando me
paro sobre un elemento, ej, una columna en un gráfico de
barras. Podemos modificar el mensaje para adaptarlo a nuestro gusto
Forma: se habilita solo para algunos gráficos. Nos elegir entre otras formas de
gráfico distintas de las que vienen por default. Ej: en lugar de que un gráfico de
líneas muestre líneas rectas lo haga en formas cuadradas
Se puede jugar con esas opciones soltando las fichas en cada marca (color, tamaño, etc.
…), y lograr resultados diferentes. Es bastante intuitivo
Filtros
Son importantes para sumarle granularidad a nuestro trabajo, limpiando así la base de
datos, y haciendo que los gráficos sean más específicos. Por ejemplo, sumar un filtro de
fecha a un gráfico, hace que podamos ver los mismos datos, pero en cada fecha en
concreto, haciéndolo más entendible y digerible
6
Clase 5 - Campos calculados
¿Qué son? Los campos calculados son nuevos datos que podemos crear, a partir de
otros ya existentes. Podemos generar tanto dimensiones como medidas. Para que se
entienda, son el equivalente a crear nuevas columnas en el Excel, utilizando funciones,
para obtener nuevos datos que no teníamos en un principio.
Tipos:
Básicos: permite crear campos calculados a nivel fila o a nivel visualización.
LOD: igual que los básicos, pero con más granularidad.
Tablas: solo permite crear cálculos a nivel de detalle de visualización.
Vamos a poder generarlos a través de funciones. Hay muchos tipos:
- Numéricas: cambiar un valor numérico dentro de una columna
- De cadena: de texto. Extraer, modificar o agregar algún valor de la cadena de
texto
- Lógicas
- De fecha
- De agregación
- De cálculo de tablas
Para crear un nuevo campo calculado, clic derecho en algún espacio en blanco (donde
se encuentran los nombres de los campos), y tocamos crear campo calculado
En esta nueva ventana es donde vamos a escribir nuestra función (muy similar a como
escribimos una función en Excel).
Ideal escribir un descripción para que identifiquemos qué fin tiene cuando lo utilicemos.
Debemos escribirlo con //, ejemplo:
//Este campo calculado se utiliza para sumar las ventas de la tabla 1
7
Algunas funciones vistas:
Min/Max: busca el valor mínimo/máximo entre dos valores o campos
MIN([Sales],[Profit])
Campo 1 Campo 2
Replace: función de cadena (string). Sirve para reemplazar una subcadena,
dentro de una cadena de texto. Es decir:
“08/12 – Martes – 16:30” – CADENA
“08/12” – SUBCADENA
“Martes” – SUBCADENA
“16:30” – SUBCADENA
REPLACE(Fecha,'Martes', 'Miércoles')
Reemplazo, dentro de la cadena del campo “Fecha” la subcadena “Martes” por
“Miércoles”
Replace Anidado:
REPLACE(REPLACE([Order ID], '2018', 'xxxx'), 'xxxx', 'AAAA')
Hago un reemplazo a un reemplazo. Tableau, como en las matemáticas, primero
resuelve lo que está dentro del paréntesis de más adentro (REPLACE([Order ID], 2018,
´xxxx´), por lo que primero va a realizar ese reemplazo. Luego, resolverá lo de afuera,
haciendo un reemplazo del campo ya reemplazado.
Left/Right: para extraer una subcadena, de una cadena:
LEFT/RIGHT(Campo,
cantidad de caracteres)
Con esta fórmula, estoy indicando que se extraiga, desde la subcadena del lado
izquierdo, o derecho, tanta cantidad de caracteres
MID: también para extraer, pero esta vez de una subcadena situada en el medio.
MID(Cadena,
Subcadena, Cantidad
de caracteres)
8
Con esto, indico que quiero extraer de tal cadena, a partir de tal carácter, tanta
cantidad de caracteres)
Split: es otra manera de extraer una subcadena, si están separadas con algún
símbolo, como “-“ o “,”
SPLIT(Cadena,
Símbolo, Número
El de subcadena) número de subcadena puedo indicarlo de
izquierda a derecha (2, 3, 4) o de derecha a izquierda
(-2,-3,-4)
Concat: concatenar varias cadenas en una sola.
([CAMPO] + “-“ +
([OTRO
CAMPO]) + “-“ +
Clase 6 – Campos calculados
([OTRO avanzados
CAMPO])
Funciones lógicas y cálculos de tabla
En la programación, las funciones lógicas tienen dos respuestas posibles: verdadero o
falso. No hay grises en el medio.
Si una condición resuelta verdadera, el ejercicio termina ahí. Si es falsa, se pueden
agregar más procedimientos, hasta que resulte verdadero.
Case: evalúa una secuencia de valores, y las compara. Si hay coincidencia
devuelve el valor correspondiente (1 o 2). Sino, devuelve un valor default (si no
ponemos valor default, devuelve NULL)
La estructura básica es:
- CASE (xxxx) – Sobre qué estamos aplicando el case
- WHEN: (xxxx) THEN (xxxx) – Cuando encuentra tal valor, reemplazarlo por tal
otro. El WHEN se puede volver a utilizar, tantas veces como necesitemos
- =
- END – Indica que termina el código. Sin esto el código no funcionaría
1 Opción
CASE [Category]
WHEN 'Furniture' THEN 'Muebles'
ELSE “Otros”
END
Si encuentra “furniture”, devolver “muebles”, para los demás (else), devolver
“otros”
2 Opciones
CASE [Category] 9
WHEN 'Furniture' THEN 'Muebles'
WHEN ‘Technology’ THEN ‘Tecnología’
También podemos utilizarlo para quitar una categoría de un gráfico, porque no
queremos que se vea:
CASE [Sub-Category]
WHEN ‘phones’ THEN ‘vacío’
ELSE [Sub-Category]
END
IF: es similar al case, pero permite más opciones de comparación, y además
puede trabajar con operadores “and” y “or”, para modificar las condiciones que
se deben cumplir para darnos un resultado
Si el valor del capo “suma”, es mayor a 120000, entonces escribir “Check”, de lo
contrario “No Check”
IIF: igual al IF, solo que se escribe de forma resumida, como en Excel
Ejemplo de IF con AND y también con más condiciones:
10
Ejemplo de IF con OR:
Clase 7 – Campos calculados avanzados II
Expresiones de nivel de detalle (LOD)
Nos permiten realizar cálculos sobre el nivel de granularidad que queramos.
Conoceremos tres LOD: Fixed, Include y Exclude
Sintaxis de un LOD 1
Fixed: la función "fixed” nos permite calcular una medida, en base a una
dimensión (ejemplo, ventas según país), y poder tenerla FIJA en una
tabla, sin importar los filtros o la vista de la misma.
11
En este caso: {FIXED[País]:[Ventas]}
Entonces, podríamos saber la cantidad de ventas de cada país, independientemente de la
ciudad, o de cualquier otro nivel de agregación que queramos colocar
Esta función es muy importante, ya que nos permite hacer ciertos cálculos, que sin ella
no podríamos. Por ejemplo, ahora podríamos agregar una columna que muestre la
cantidad de ventas por crear un campo calculado que muestre el porcentaje de ventas
por ciudad, y crear un campo calculado para sacar el porcentaje con relación al país. Es
decir, de las ventas de cada país, que porcentaje proviene de cada ciudad.
Include:
Exclude:
Recurso: Top 15 Tableau LOD Expressions (Practical Examples)
Parámetros
Un parámetro es básicamente una variable. Puede ser un número, una fecha o una
cadena, y que se puede reemplazar en un valor constante de un cálculo.
12
En Tableau, los usamos principalmente para que funcionen como una botonera, que
cambien la datos y la especificidad de los gráficos conforme nosotros los
movamos/toquemos
Ejemplo: en la función 2 * X, “X” la variable “x” es un PARÁMETRO, y esta puede
tomar el valor que el usuario elija.
Los parámetros son una de las funcionalidades de Tableau más utilizadas, ya que nos
permiten darle mayor flexibilidad e interacción a nuestros dashboards
Nombre del parámetro
Tipo de datos: entero, de cadena, fecha y hora
Valor actual: valor que va a tomar ese parámetro. El que nosotros
queramos
Formato: con que formato se va a mostrar (numero, moneda, fecha, etc.)
Valor al abrir el libro de trabajo: será el valor actual
Conjuntos
Los conjuntos nos permiten aislar segmentos específicos de una dimensión, y luego
utilizarlo de formas distintas para sacar distintos insights. Funcionan como filtros.
O sea, dentro de cada ficha tenemos una serie de categorías. Por ejemplo, dentro de la
ficha país podemos tener: Argentina, Uruguay, , Alemania y España. Si queremos,
podemos crear un conjunto dentro de país. Hacemos que Argentina y Uruguay sean un
conjunto, y entonces Alemania y España estarán por fuera del mismo
Así, podemos utilizarlo como un filtro, que aplicamos para saber que datos son del
conjunto (Argentina/Uruguay), o también diferenciar el conjunto con un color
(supongamos, naranja) y aplicarlo a cada un gráfico. Entonces sabemos que datos están
en el conjunto (Argentina y Uruguay), y cuáles NO.
13
Insigths: “resultados del
análisis de los datos y de
la información que ayudan
Tipos
1) Dinámicos: aquellos que cambian cuando cambian los datos subyacentes, y solo
pueden basarse en una única dimensión.
2) Fijos: no cambian cuando cambian los datos subyacentes y pueden basarse en
una o muchas dimensiones
Clase 8 – Storytelling y Dashboard
Un relato bien contado, vale mucho más que un gráfico mediocre.
Luego de una presentación, la gran mayoría de las personas van a recordar la narración
que escucharon, antes que los datos que vieron.
En los rubros de tecnología, es importante estar preparados, ya que no hay posibilidad
de dar pasos atrás, usualmente hay fechas límites para completar trabajos, y lo mejor
que podemos hacer es estar preparados, sea para anotar, comprender, presentar. Se
avanza de a pasos grandes y sólidos, que por supuesto con buena predisposición y
preparación, se pueden llevar adelante.
14
Lo usual, es que, una vez trabajados los datos, y logrados los insights, se pasa
directamente a la comunicación con la audiencia. Este proceso es erróneo, deriva en una
presentación aburrida, donde la audiencia no presta atención, y desean irse lo antes
posible. Por lo que todo el trabajo se ve opacado.
Es necesario que generemos una HISTORIA, que empaquemos los datos. ¿Y por qué?
Para hacerlos:
Más memorables: que la gente recuerde lo que vio, y qué significado tuvo
Más impactantes: que impacte en todo el cerebro, no solo en lo racional
Más personal: que la audiencia entienda que son parte del proceso que surge a
partir de esto, que los incluye.
Consejos:
1) Conocer la audiencia:
Entender el negocio es sumamente necesario maximiza las posibilidades de que el
usuario entienda y utilice los tableros:
Si nuestro trabajo está dirigido más bien a un nivel gerencial, será simple y directo. Nos
enfocamos en los KPI´S y las progresiones
En cambio, si está dirigido a niveles operativos o más bajos
“KPI”: es el resultado de un proceso de medición, que sigue un determinado objetivo.
Por lo tanto, el KPI, es una especie de indicador, mide un periodo corriente, y me
muestra si voy en dirección acorde a mi objetivo.
“OKR”: igual que el KPI, pero en el corto plazo.
15
“Objetivos Smart”: son los objetivos estratégicos (medibles, accesibles, etc…)
2) Utilizar colores:
Nos ayuda a identificar fácilmente los insights y le den un estilo o estética a nuestro
tablero. También es necesario entender como funciona el color en el cerebro (por
ejemplo, el rojo suele indicar algo importante)
3) Mantenerlos simple
Es un error común sobrecargar el tablero de información, porque queremos mostrar
todo, pero terminamos logrando un efecto contrario.
Lo mejor es que logremos unir creatividad con simpleza, a veces menos, es más.
Apuntemos a darle solución a una o algunas necesidades puntuales, ni más, ni menos.
Proporción dorada
Ya sea que nuestro tablero es más bien horizontal o vertical, tenemos que dividirlo en
proporciones doradas. Una vez dividido, organizar los gráficos por jerarquía: de
izquierda a derecha, y de arriba hacia abajo. Es decir, en las partes superiores irán los
gráficos y KPIS más relevantes para nuestro usuario.
Esta estructura, se basa en cómo el ser humano occidental lee y escribe.
16
4) Gráficos eficientes
Mientras que las tablas interactúan con nuestro sistema verbal, los gráficos entran en el
sistema visual, que es más rápido para procesar información
¿Qué NO debemos usar NUNCA? Gráficos 3D. Son engañosos, porque la perspectiva
altera el entendimiento visual
Existen 2 tipos de gráficos: de comparación y dispersión
- Gráfico de torta: no poner más de 5 o 6 variables, como mucho
- Gráficos de escala dinámica: aquellos que no arrancan desde 0, sino desde un
valor x
- De ejes dobles:
Dashboard
Trazado: tiene todas las propiedades del elemento seleccionado (fondo, bordes,
relleno, etc.)
Dashboard: contiene todas las hojas donde hicimos los gráficos, y una sección
de objetos.
Estas opciones indican cómo van a acomodarse los objetos dentro del dashboard
- Mosaico: establece automáticamente espacios proporcionales donde se van a colocar
los objetos
- Flotante: permite colocar los objetos en cualquier lado
17
Clase 9/10 – Gráficos avanzados
En esta clase aprendemos principalmente el funcionamiento de los gráficos de doble eje,
con los que logramos conformar gráficos mucho más variados y avanzados,
combinando distintas marcas, colores, etc…
Tabla de resaltado: es una tabla que tiene como diferenciación un COLOR, que
se hace más oscuro o claro dependiendo de los valores
Mapa de calor: similar a la tabla de resaltado, pero se puede utilizar, además del
color, una FORMA y TAMAÑO de marca para diferenciar los valores, según
sean más altos o más bajos. Se puede aplicar a una tabla, mapa, etc.
Imágen A: Tabla de resaltado
Imágen B: Heatmap (Mapa de calor)
18
Gráfico de dispersión: muestra puntos en las intersecciones de los ejes “x” e “y”,
que contienen cierta información. Es uno de los más útiles en el análisis de
datos, ya que permite identificar patrones y sacar conclusiones.
1. Arrastramos una medida al eje x, y otra al eje y
2. Agregamos la medida que queremos ver a la marca “Detalle”
3. Jugamos con los colores, tamaños, etc.
Tree Map: esta visualización muestra rectángulos con cierta jerarquía de
tamaño, color, que permiten comparar las distintas medidas
Área apilada: nos muestra como se distribuye una variable en el tiempo, como
porcentaje del total
1- Hacemos un gráfico de líneas simple
2- Cambiamos la marca a “área”
3- Cambiamos el cálculo de tabla rápido de nuestra medida a porcentaje del total
4- Ponemos calcular usando “tabla hacia abajo”
Mapas: permite ver fácilmente datos geográficos, de forma más visual e
interactiva. Podemos colocarle una marca, sean círculos, cuadrados, o “mapa”,
que muestra los países o ciudades rellenos.
Además, se pueden combinar haciendo ejes dobles, dando resultados como este:
19
[Link]
Podemos agregar también mapas de fuentes externas, como los que hay en esa página
Clase 12 – Tips & Tricks
Última clase. Vemos algunos tips y trucos que nos pueden ayudar a sumarle dinamismo
y buena visualización al dashboard
Íconos: podemos utilizarlos para acompañar a nuestros KPI´S, o para darles una
función, por ejemplo, un botón que nos de información.
1. En una nueva hoja creamos un campo calculado con un valor o
utilizamos una medida,
2. Seleccionamos el tipo de marca “forma”
3. Seleccionamos nuestro ícono previamente cargado
4. Usamos la descripción emergente para escribir la información que
queremos que se vea al pasar el ratón por encima
Last refresh: nos muestra la última hora de modificación de un gráfico
1. Vamos a una hoja que contenga un gráfico
2. Doble click en el título
3. Seleccionamos insertar, hora de actualización de datos
Acciones: permiten al usuario interactuar con las visualizaciones, mejorando la
experiencia del usuario. Las seleccionamos en Dashboard -> Acciones
Filtro: seleccionamos datos de un gráfico, y estos se filtran en otro
Resaltar: resaltamos valores en un gráfico, y estos se resaltan en otro
URL: seleccionamos datos de un gráfico, y aparece la opción de hacer
click en un hipervínculo
20
21