Tableau Prep
Tableau Prep
Sommaire
Nouvelles fonctionnalités de Tableau Prep 1
Ressources associées 2
Exemples de fichiers 3
Voici l’histoire... 4
Nettoyer Orders_Central 13
Nettoyer Orders_East 21
Nettoyer Orders_West 23
Finalisation et ressources 51
Tableau Software i
Aide de Tableau Prep
55
Installation et déploiement 62
Publier un flux 67
Se connecter via des connecteurs intégrés pour les types de données courants 81
ii Tableau Software
Aide de Tableau Prep
À prendre en compte lorsque vous vous connectez à des connexions virtuelles : 107
Appliquer des opérations de nettoyage à une étape des données entrantes 126
Appliquer des filtres au champ dans l’étape des données entrantes 127
Exemples 139
Réunir des fichiers et des tables de base de données dans l’étape des données
entrantes 145
iv Tableau Software
Aide de Tableau Prep
Ajouter des descriptions aux étapes du flux et aux actions de nettoyage 173
Tableau Software v
Aide de Tableau Prep
Écrire votre propre calcul de filtre pour rechercher et supprimer les doublons 209
Utiliser les rôles des données pour valider vos données 210
Exigences 215
vi Tableau Software
Aide de Tableau Prep
Suspendre les mises à jour des données pour améliorer les performances 257
Ajouter et identifier des valeurs qui ne sont pas présentes dans l’ensemble de don-
nées 279
Actions prises en charge par Tableau Agent pour Tableau Prep 290
Tableau Software ix
Aide de Tableau Prep
x Tableau Software
Aide de Tableau Prep
Exemples 368
Utiliser la recherche avec caractères génériques pour permuter des champs 380
Ressources 387
Tableau Software xi
Aide de Tableau Prep
Créer des fichiers d’extrait de données et des sources de données publiées 433
Enregistrer les données de sortie de flux dans des bases de données externes 440
Bases de données prises en charge et exigences relatives aux bases de données 442
Enregistrer les données de sortie de flux vers des ensembles de données dans CRM
Analytics 449
Considérations 461
Créer une application connectée pour l’API Ingestion de Data Cloud 464
Autorisations 468
Exemples 485
Connexion à une connexion serveur et sortie sur une connexion de base de don-
nées 485
Le flux inclut les connexions de script Rserve et TabPy et envoie une sortie vers
une connexion de base de données 486
Exemples 488
Le flux inclut des étapes de script pour Rserve et TabPy et se connecte à une
base de données 490
Le flux se connecte aux fichiers locaux et publie sur les fichiers locaux 498
Le flux se connecte à des fichiers locaux et publie sur ces fichiers, et utilise la
forme courte pour l’actualisation incrémentielle 498
Le flux publie sur un serveur et le fichier d’identifiants est stocké sur un partage
réseau 499
Compatibilité entre différentes versions de Tableau Prep Builder et Tableau Server 505
Tableau Software xv
Aide de Tableau Prep
Fichiers 527
Fichiers 535
Créer des ensembles de données entiers pour les 1ères et 2ndes infractions 567
Récapitulatif 571
Continuez avec Analyse avec la seconde date dans Tableau Desktop on page 1. 572
Erreurs courantes en cas d’utilisation de la ligne de commande pour exécuter des flux 603
Erreur : « These features were found that prevent this version of the application from
using this file » 609
Erreur : « You are using Server version: null... » lors de la connexion à Tableau Server
compatible avec SSL à l’aide de Tableau Prep 610
Actualisation automatique des clés produit à l’aide d’une licence zéro temps d’arrêt 613
Suivi des données d’utilisation et d’expiration des licences Tableau Desktop 614
Mots-clés 637
l Utilisez le tableau de bord Rechercher par fonctionnalité pour afficher une liste des nou-
velles fonctionnalités d’un produit ou d’une version, ou pour savoir quand une fonc-
tionnalité a été publiée. The dashboard currently defaults to Tableau Prep as the product
(which includes Prep Builder and Prep Conductor features) for the version Tableau Prep
Builder.
l Utilisez le tableau de bord Mettre à niveau Prep pour obtenir la liste des fonctionnalités
spécifiques à votre mise à niveau. Si vous publiez des flux sur Tableau Server pour les exé-
cuter de manière programmée, certaines nouvelles fonctionnalités nécessitent une ver-
sion minimale de Tableau Server pour s’exécuter. La vue répertorie la version minimale de
Tableau Server qui prend en charge la planification des flux créés dans une version spé-
cifique de Tableau Prep Builder. Vous pourrez ainsi repérer rapidement les fonctionnalités
avec des exigences de compatibilité.
Tableau Software 1
Aide de Tableau Prep
Ressources associées
Nouvelles fonctionnalités
Parcourez les résumés des nouvelles fonctionnalités pour les versions actuellement prises en
charge.
2 Tableau Software
Aide de Tableau Prep
Ce didacticiel décrit les opérations courantes disponibles dans Tableau Prep. En utilisant les
exemples d’ensembles de données fournis avec Tableau Prep, vous allez procéder à la création
d’un flux basé sur l’exemple Superstore. Ce didacticiel utilise la version la plus récente de
Tableau Prep Builder. Si vous utilisez une version plus ancienne, vos résultats peuvent différer.
Consultez les conseils au fur et à mesure pour découvrir comment Tableau Prep vous aide à
nettoyer et à organiser vos données en vue de vos analyses.
Pour installer Tableau Prep Builder avant de poursuivre ce didacticiel, consultez Installer
Tableau Prep ou Tableau Prep Builder depuis l’interface utilisateur dans le Guide de déploiement
de Tableau Desktop et de Tableau Prep Builder. Vous pouvez aussi télécharger la version
d’essai gratuit.
Exemples de fichiers
Pour accomplir les tâches de ce didacticiel, vous devez installer Tableau Prep Builder, ou si la
création Web est activée sur votre version 2020.4 ou ultérieure du serveur, vous pouvez
également essayer les étapes sur le Web.
Après avoir installé Tableau Prep Builder sur votre ordinateur, vous pouvez également trouver
les échantillons de fichiers à l’emplacement suivant :
Tableau Software 3
Aide de Tableau Prep
Vous pouvez également télécharger les échantillons de fichiers à partir de ces liens et créer un
répertoire Samples et un sous-répertoire South. Cette opération est nécessaire si vous
effectuez ce didacticiel sur le Web.
l Orders_Central l Orders_South_2015
l Orders_East l Orders_South_2016
l Orders_West l Orders_South_2017
l returns_reasons_new l Orders_South_2018
Voici l’histoire...
Vous travaillez au siège social d’une grande chaîne de magasins. Votre responsable souhaite
que vous analysiez les ventes de produits et les bénéfices réalisés par l’entreprise au cours des
quatre dernières années. Vous lui suggérez d’utiliser Tableau Desktop pour cette mission. Votre
responsable approuve votre idée avec enthousiasme et souhaitez que vous vous mettiez au
travail immédiatement.
Vous commencez à collecter toutes les données dont vous allez avoir besoin, mais vous vous
rendez compte que les données ont fait l’objet d’une collecte et d’un suivi différents pour chaque
région. Vous remarquez aussi qu’il y a un grand nombre d’entrées de données fantaisistes dans
les différents fichiers et qu’une région a même un fichier séparé pour chaque année.
Avant de pouvoir commencer à analyser des données dans Tableau, vous devez donner un bon
coup de nettoyage aux données. La nuit va être longue.
En cherchant de quoi vous sustenter dans les menus de restaurant, il vous revient à l’esprit que
Tableau propose un produit appelé Tableau Prep. Voilà qui pourrait vous aider dans vos tâches
herculéennes de nettoyage des données.
Vous téléchargez le produit ou vous vous inscrivez à un essai gratuit pour voir ce qui se passe.
4 Tableau Software
Aide de Tableau Prep
Pour vous lancer, la première étape consiste à vous connecter à vos données et à créer l’étape
des données entrantes. À partir de là, vous commencez à créer un workflow, ou « flux » dans la
terminologie Tableau Prep, et à ajouter d’autres étapes pour agir sur vos données au fur et à
mesure.
Conseil : l’étape des données entrantes est le point d’ingestion pour vos données et le point de
départ de votre flux. Vous pouvez avoir plusieurs étapes de données entrantes, et certaines
peuvent inclure plusieurs fichiers de données. Pour plus d’informations sur la connexion aux
données, consultez Se connecter aux données sur la page 81.
Vos fichiers de données sur les ventes pour les différentes régions sont stockés dans différents
formats, et vos commandes pour la région Sud sont dispersées sur plusieurs fichiers. Vous
consultez le volet Connexions et vous constatez que vous disposez de nombreux choix pour
vous connecter aux données. Formidable !
Étant donné que vos autres régions ont un fichier pour l’ensemble des quatre années de
données, vous décidez de vous attaquer en premier à la région Sud.
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
Tableau Software 5
Aide de Tableau Prep
2. Les fichiers sont des fichiers .csv, donc sélectionnez Fichier texte dans la liste de
connexions.
Après que vous vous êtes connecté à votre premier fichier, l’espace de travail Tableau
Prep Builder s’ouvre, divisé en deux sections principales. Le volet Flux en haut et le volet
Entrée en bas.
Comme dans Tableau Desktop, le volet Flux est votre espace de travail, où vous pouvez
interagir avec vos données visuellement et créer votre flux. Le volet Entrée contient les
option de configuration relatives à l’ingestion des données. Il affiche également les
champs, les types de données et les exemples de valeurs depuis votre ensemble de
données.
Nous examinerons comment vous pouvez interagir avec ces données dans la section
suivante.
Conseil : pour les tables simples, Tableau Prep crée automatiquement une étape des
données entrantes pour vous dans le volet Flux lorsque vous ajoutez des données à
votre flux. Sinon, vous pouvez utiliser la fonction glisser-déposer pour ajouter des tables
au volet Flux.
6 Tableau Software
Aide de Tableau Prep
4. Vous avez trois autres fichiers pour vos commandes dans le Sud, et la façon dont vous les
combinez dépend de l’environnement où vous travaillez.
b. Vous voyez s’afficher une option pour Réunir plusieurs tables. Sélectionnez-la.
Vous notez que le répertoire où vous avez sélectionné votre fichier est déjà
renseigné et que les autres fichiers dont vous avez besoin sont répertoriés dans la
section Tables incluses du volet des données entrantes.
Conseil : une union des données entrantes est très utile pour se connecter à
plusieurs fichiers depuis une seule source de données avec nom et structure
similaires, et les combiner. Pour utiliser cette option, les fichiers doivent être dans le
même répertoire parent ou enfant. Si vous ne voyez pas les fichiers dont vous avez
besoin, modifiez vos critères de recherche. Pour plus d’informations, consultez
Réunir des fichiers et des tables de base de données dans l’étape des
données entrantes sur la page 145.
c. Cliquez sur Appliquer pour ajouter les données de ces fichiers à l’étape des
données entrantes orders_south_2015.
d. Les fichiers des autres régions sont tous des fichiers d’une seule table si bien que
vous pouvez les sélectionner tous à la fois et les ajouter à votre flux.
Tableau Software 7
Aide de Tableau Prep
L’option d’union des données entrantes n’est pas disponible actuellement pour Tableau
Server et Tableau Cloud. Vous voulez malgré tout inclure tous les fichiers de la région
Sud et gérer les données de la même manière, afin de les combiner de façon logique.
a. Répétez les étapes 2 et 3 pour ajouter le reste des fichiers du sous-répertoire
Orders South.
b. Combinez-les avec une étape d’union. (Pour plus d’informations, consultez Réunir
des fichiers et des tables de base de données dans l’étape des données
entrantes sur la page 145.)
Faites un Ctrl+clic (Cmd+clic sur MacOS) pour sélectionner les fichiers suivants et
faites un glisser-déposer sur le volet Flux pour les ajouter à votre flux. (Pour
connaître l’emplacement des fichiers, consultez Finalisation et ressources sur la
page 51.)
l Orders_Central.csv
l Orders_East.xlsx
l Orders_West.csv
8 Tableau Software
Aide de Tableau Prep
Remarque : ce sont différents types de fichiers. Si vous ne voyez pas tous ces
fichiers, assurez-vous que votre explorateur de fichiers ou votre Finder est
configuré pour afficher tous les types de fichiers.
l
Dans le volet Connexions, cliquez sur le bouton Ajouter une connexion . Cli-
quez sur Microsoft Excel et sélectionnez Orders_East.xlsx.
Tableau Software 9
Aide de Tableau Prep
Lorsque vous sélectionnez une étape des données entrantes dans le volet Flux, vous pouvez
voir les paramètres utilisés pour rassembler les données, les champs inclus et un aperçu de vos
données.
C’est un bon moment pour déterminer la quantité de données que vous souhaitez inclure dans
votre flux, et supprimer ou filtrer les champs que vous ne souhaitez pas conserver. Vous pouvez
aussi modifier les types de données qui n’ont pas été correctement affectés.
Conseil : si vous utilisez des ensembles de données volumineux, Tableau Prep propose
automatiquement un échantillon de données afin de maximiser les performances. Si vous ne
voyez pas les données attendues, vous devrez peut-être ajuster l’échantillon. Vous pouvez le
faire dans l’onglet Échantillon de données. Pour plus d’informations sur la configuration de
vos options de données et la taille des échantillons, consultez Définir la taille de votre
échantillon de données sur la page 135.
Dans le volet Flux, à mesure que vous sélectionnez chaque étape et examinez chaque
ensemble de données, vous remarquez quelques points à corriger plus tard, et un point que
vous pouvez corriger maintenant dans l’étape Entrée.
10 Tableau Software
Aide de Tableau Prep
l Le champ State (État) utilise des abréviations pour le nom de l’État. Dans d’autres
fichiers, le nom apparaît en entier, il vous faudra donc corriger ce point plus tard.
l Beaucoup de champs commencent par Right_. Ces champs semblent être des
doublons d’autres champs. Vous ne souhaitez pas inclure ces champs en double
dans votre flux. Voici un point que vous pouvez corriger ici dans l’étape des
données entrantes :
l’un des champs sélectionnés et cliquez sur l’option Supprimer . Ceci indique à
Tableau Prep d’ignorer ces champs et de ne pas les inclure dans le flux.
Conseil : lorsque vous effectuez des opérations de nettoyage dans une étape, par
exemple en supprimant des champs, Tableau Prep enregistre vos modifications
dans le volet Modifications et ajoute une annotation (sous la forme d’une petite
icône) dans le volet Flux pour que vous disposiez d’un suivi des actions effectuées
sur vos données. Pour les étapes des données entrantes, une annotation est
également ajoutée à chaque champ.
Tableau Software 11
Aide de Tableau Prep
l Dans le volet Flux, cliquez sur l’étape des données entrantes Orders_Central pour la
sélectionner. Dans le volet Entrée, vous remarquez les problèmes suivants :
l Les dates de commande et les dates d’expédition sont séparées en champs pour
le mois, le jour et l’année.
l Certains champs présentent des types de données différents dans d’autres
fichiers.
Vous devez nettoyer ces champs avant de pouvoir combiner ce fichier avec les autres
fichiers. Mais vous ne pouvez pas le faire à l’étape des données entrantes. Vous créez
une note pour vous rappeler de le faire ultérieurement.
Les champs de ce fichier semblent correctement alignés avec les autres fichiers. Par
contre, il semble que le code de devise soit inclus dans toutes les valeurs Sales (Ventes).
Encore un point que vous devrez corriger aussi plus tard.
Maintenant que vous avez identifié ce qui pose problème dans vos ensembles de données,
l’étape suivante consiste à examiner vos données d’un peu plus près et à nettoyer les
problèmes que vous avez repérés. Vous pourrez ainsi combiner et organiser vos données et
générer un fichier de sortie qui servira pour votre analyse.
Les étapes peuvent varier, selon ce que vous comptez faire. Par exemple, ajoutez une étape de
nettoyage dès que vous souhaitez appliquer des opérations de nettoyage à vos champs, par
exemple filtrer, fusionner, fractionner, renommer, etc. Ajoutez une étape d’agrégation pour
regrouper et agréger des champs, et modifiez le niveau de détail de vos données. Pour plus
d’informations sur les différents types d’étapes et leurs utilisations, consultez Créer et
organiser votre flux sur la page 160.
12 Tableau Software
Aide de Tableau Prep
Conseil : lorsque vous ajoutez des étapes à votre flux, une ligne de flux est automatiquement
ajoutée pour connecter les étapes les unes aux autres. Vous pouvez déplacer ces lignes de flux
et les supprimer ou les ajouter en fonction de vos besoins.
Lorsque vous exécutez votre flux, ces points de connexion sont requis pour que Tableau Prep
puisse savoir quelles étapes sont connectées et dans quel ordre ces étapes s’appliquent dans le
flux. S’il manque une ligne de flux, le flux sera interrompu et une erreur s’affichera.
Nettoyer Orders_Central
Pour résoudre les problèmes que vous avez remarqués précédemment, et pour voir s’il n’y a pas
d’autres problèmes, commencez par ajouter une étape de nettoyage à l’étape des données
entrantes Orders_Central.
l
Cliquez sur l’icône plus et ajoutez une étape de nettoyage. Selon votre version,
cette option de menu est Ajouter une étape, Ajouter une étape de nettoyage ou
Étape de nettoyage.
Lorsque vous ajoutez une étape de nettoyage à votre flux, l’espace de travail change et
vous voyez les détails de vos données.
Tableau Software 13
Aide de Tableau Prep
L’espace de travail est désormais divisé en trois parties : le volet Flux, le volet Profil avec
une barre d’outils et la grille de Données.
Le volet Profil vous montre la structure de vos données, en résumant les valeurs de
champs dans des classes afin que vous puissiez voir rapidement les valeurs associées et
repérer les données atypiques ainsi que les valeurs null. La Grille de données vous
montre le niveau de détail des lignes pour vos champs.
Astuce : chaque champ du volet Profil s’affiche dans un volet Profil. Utilisez le menu
Il manque un champ pour Region dans cet ensemble de données. Étant donné que les
autres ensembles de données possèdent ce champ, vous devrez l’ajouter afin de pouvoir
combiner vos données ultérieurement. Pour cela, vous devrez utiliser un champ calculé.
14 Tableau Software
Aide de Tableau Prep
3. Dans l’éditeur de calcul, nommez le champ calculé Région. Entrez ensuite "Central" (y
compris les guillemets) et cliquez sur Enregistrer.
Vous apprécierez la flexibilité qu’offrent les champs calculés pour organiser vos données.
Vous constatez avec plaisir que Tableau Prep utilise le même langage d’éditeur de calcul
que Tableau Desktop.
Conseil : lorsque vous apportez des modifications à vos champs et valeurs, Tableau Prep
les mémorise dans le volet Modifications à gauche. Une icône (annotation) représentant
la modification est également ajoutée à l’étape de nettoyage dans le flux et au champ dans
le volet Profil. Nous allons examiner le Suivi des modifications après avoir apporté
d’autres modifications.
Ensuite, vous souhaitez vous occuper des champs séparés de date de commande et date
d’expédition. Vous souhaitez les combiner en deux champs uniques, un pour Order Date
(Date de commande) et un pour Ship Date (Date d’expédition) afin qu’ils soient alignés
avec les mêmes champs dans les autres ensembles de données. En veillant à ce que vos
tables contiennent les mêmes champs, vous pourrez combiner ultérieurement les tables à
l’aide d’une union.
Vous pouvez utiliser un champ calculé pour le faire en une seule étape facile.
4. Dans la barre d’outils, cliquez sur Créer un champ calculé pour combiner les champs
Order Year (Année de commande), Order Month (Mois de commande) et Order Day
(Jour de commande) en un champ au format « MM/DD/YYYY ».
5. Dans l’éditeur de calcul, nommez le champ calculé Date de commande. Entrez ensuite le
calcul suivant, puis cliquez sur Enregistrer :
Tableau Software 15
Aide de Tableau Prep
Maintenant que vous avez un nouveau champ pour votre date de commande, vous
souhaitez supprimer les champs existants, étant donné qu’ils sont devenus inutiles.
Le volet Profil comporte de nombreux champs. Vous remarquerez une zone Recherche
en haut à droite de la barre d’outils. Vous vous demandez si vous pouvez l’utiliser pour
trouver rapidement les champs que vous souhaitez supprimer. Vous décidez de tenter
l’opération.
Tableau Prep fait rapidement défiler tous les champs qui contiennent Order dans la vue.
Parfait !
16 Tableau Software
Aide de Tableau Prep
7. Faites un Ctrl+clic (Cmd+clic sur MacOS) pour sélectionner les champs pour Order Year,
Order Month et Order Day. Faites ensuite un clic droit sur les champs sélectionnés et
sélectionnez Supprimer (Supprimer le champ dans les versions précédentes) dans le
menu pour les supprimer.
8. Répétez maintenant les étapes 4 à 7 ci-dessus pour créer un seul champ pour Ship Date
(Date d’expédition). Essayez de vous-même ou utilisez les étapes ci-dessous pour vous
aider.
l Dans la barre d’outils, cliquez sur Créer un champ calculé pour combiner les
champs Ship Year (Année d’expédition), Ship Month (Mois d’expédition) et Ship
Day (Jour d’expédition) en un champ au format « MM/DD/YYYY ».
l Supprimez les champs Ship Year, Ship Month et Ship Day. Recherchez les
champs, sélectionnez-les et sélectionnez Supprimer (Supprimer le champ dans
les versions précédentes) dans le menu pour supprimer les champs.
Conseil : Tableau Prep résume les données dans le volet Profil en classes pour vous
aider à voir rapidement la forme de vos données, repérer les données atypiques, identifier
les relations entre les champs, etc.
Tableau Software 17
Aide de Tableau Prep
début à janvier de l’année suivante, et est étiquetée en conséquence. Étant donné que
certains dates de ventes et dates d’expédition tombent dans la dernière partie de 2018 et
2019, nous avons une classe étiquetée avec l’année de fin 2019 et 2020 en
conséquence.
Pour modifier cette vue sur les dates réelles, cliquez sur le menu Options
l Il est affecté à un type de données Chaîne au lieu d’un type de données Nombre
(décimal).
l Une valeur de champ affiche Aucun au lieu d’une valeur numérique pour
l’absence de remise.
Ceci générera un problème lors de la combinaison de vos fichiers. Vous avez donc intérêt
à corriger aussi ce problème.
9. Effacez votre recherche et entrez disc dans la zone de recherche pour trouver le champ.
18 Tableau Software
Aide de Tableau Prep
11. Pour modifier le type de données du champ Remise de Chaîne en Nombre (décimal),
cliquez sur Abc et sélectionnez Nombre (décimal) dans le menu déroulant.
12. Enfin, nommez votre étape pour vous aider à vous souvenir de ce que vous avez fait dans
cette étape. Dans le volet Flux, double-cliquez sur le nom de l’étape Nettoyage 1 et
entrez Correction dates/noms de champs.
Vous cliquez sur la flèche pour l’ouvrir et vous avez la bonne surprise de voir la liste de toutes les
modifications que vous avez apportées. Lorsque vous faites défiler les modifications dans la liste,
vous notez que vous pouvez supprimer ou modifier vos modifications ou même les déplacer pour
changer l’ordre dans lequel vous les avez effectuées.
Vous appréciez de pouvoir retrouver facilement les modifications que vous avez effectuées à
chaque étape lors de la création de votre flux et de pouvoir expérimenter avec l’ordre de ces
modifications pour tirer le meilleur parti de vos données.
Tableau Software 19
Aide de Tableau Prep
Maintenant que vous avez nettoyé un fichier, vous examinez les autres fichiers pour voir si vous
avez besoin de corriger d’autres problèmes.
20 Tableau Software
Aide de Tableau Prep
Nettoyer Orders_East
En examinant les champs du fichier Orders_East, la plupart des champs semblent être alignés
avec les autres fichiers, à l’exception du champ Sales (Ventes). Pour examiner les choses de
plus près et pour voir s’il n’y a pas d’autres problèmes, vous ajoutez une étape de nettoyage à
l’étape des données entrantes Orders_East.
l
Cliquez sur l’icône plus et ajoutez une étape de nettoyage. Selon votre version,
cette option de menu est Ajouter une étape, Ajouter une étape de nettoyage ou
Étape de nettoyage.
l Cliquez sur l’étape de nettoyage suggérée (Tableau Prep Builder à partir de la ver-
sion 2020.3.3 et sur le Web).
En examinant le champ Sales, vous constatez rapidement que le code de devise USD a
été inclus avec les chiffres de vente et que Tableau Prep a interprété ces champs comme
une chaîne.
Il est facile de corriger le type de données, vous savez déjà comment procéder. Par contre,
il y a plus de 2000 lignes uniques de données de ventes et il serait fastidieux de corriger
chaque ligne individuellement pour en supprimer le code de devise.
Mais vous utilisez Tableau Prep, et vous décidez de vous reporter au menu déroulant pour
voir si une option peut faire cela pour vous.
Lorsque vous cliquez sur Options supplémentaires (flèche déroulante dans les
anciennes versions) du champ Sales, vous voyez s’afficher une option de menu intitulée
Nettoyer et une option en-dessous pour supprimer des lettres. Vous décidez de tenter
l’opération et de voir ce qui se passe.
Tableau Software 21
Aide de Tableau Prep
4. Le reste du fichier ne semble pas poser de problème. Nommez votre étape de nettoyage
pour vous souvenir de votre travail, par exemple Changement du type de données.
Ensuite, vous examinez votre dernier fichier Orders_West pour voir s’il y a des problèmes à
corriger.
22 Tableau Software
Aide de Tableau Prep
Nettoyer Orders_West
Lorsque vous examinez les champs du fichier Orders_West, la plupart des champs semblent
alignés avec les autres fichiers, mais vous vous rappelez que le champ States (États) utilise des
abréviations pour les valeurs au lieu du nom complet de l’État. Pour combiner ce fichier avec les
autres fichiers, vous devez corriger ce problème. Vous ajoutez ainsi une étape de nettoyage à
l’étape des données entrantes Orders_West.
l
Cliquez sur l’icône plus et ajoutez une étape de nettoyage.
l Cliquez sur l’étape de nettoyage suggérée (Tableau Prep Builder à partir de la ver-
sion 2020.3.3 et sur le Web).
Vous constatez que les valeurs de noms d’État utilisent l’abréviation courte. Il n’y a que 11
valeurs uniques pour ce champ. Vous pourriez modifier manuellement chacune d’elles,
mais peut-être que Tableau Prep a prévu une autre méthode ?
Vous cliquez sur le menu Options supplémentaires (flèche déroulante dans les
versions précédentes) pour le champ et vous voyez une option appelée Regrouper les
valeurs (Regrouper et remplacer dans les versions précédentes). Quand vous la
sélectionnez, plusieurs options s’affichent :
l Sélection manuelle
l Prononciation
l Caractères communs
l Orthographe
Les noms des États n’ont pas la même sonorité, leur orthographe est correcte, et ils ne
partagent pas les mêmes caractères. Vous décidez donc d’essayer l’option Sélection
manuelle.
Astuce : vous pouvez double-cliquer sur un nom de champ ou une valeur de champ pour
modifier une seule valeur. Pour modifier plusieurs valeurs, vous pouvez sélectionner
toutes les valeurs et utiliser l’option du menu contextuel Modifier les valeurs. Mais si
vous souhaitez associer une ou plusieurs valeurs à des valeurs spécifiques, utilisez
l’option Regrouper les valeurs dans le menu déroulant.
Tableau Software 23
Aide de Tableau Prep
Une fiche de deux colonnes s’ouvre. Il s’agit de l’Éditeur Regrouper les valeurs. La
colonne sur la gauche affiche les valeurs du champ actuel et la colonne sur la droite
affiche les champs disponibles à associer aux champs sur la gauche.
Vous souhaitez associer les abréviations d’État à la version de complète du nom de l’État,
mais vous ne trouvez pas ces valeurs dans l’ensemble de données Orders_West. Vous
vous demandez si vous pouvez simplement modifier le nom directement et peut-être
l’ajouter ici, et vous vous lancez.
4. Dans l’Éditeur Regrouper les valeurs dans le volet gauche, double-cliquez sur AZ pour
surligner la valeur et tapez Arizona. Appuyez ensuite sur Entrée pour ajouter votre
modification.
24 Tableau Software
Aide de Tableau Prep
Tableau Prep a créé une valeur associée pour votre nouvelle valeur Arizona et lui a
automatiquement associé l’ancienne valeur AZ. Si vous avez configuré une relation
d’association pour ces valeurs, vous gagnerez du temps dans le cas où d’autres valeurs
de cette région sont entrées de cette manière.
Astuce : vous pouvez ajouter des valeurs de champ qui ne sont pas dans votre
échantillon de données pour configurer des relations d’association et organiser ainsi vos
données. Si vous actualisez votre source de données et que de nouvelles données sont
ajoutées, vous pouvez ajouter les nouvelles données à l’association au lieu de corriger
manuellement chaque valeur.
Lorsque vous ajoutez manuellement une valeur qui ne figure pas dans votre échantillon de
données, la valeur est marquée avec un point rouge pour vous aider à l’identifier
facilement.
5. Répétez ces étapes pour associer chaque État avec la version complète de son nom.
AZ Arizona
CA California
Tableau Software 25
Aide de Tableau Prep
CO Colorado
ID Idaho
MT Montana
NM New Mexico
NV Nevada
OR Oregon
UT Utah
WA Washington
WY Wyoming
Cliquez ensuite sur Terminé pour fermer l’Éditeur Regrouper les valeurs.
Une fois que tous les États sont associés, vous consultez le volet Modifications et vous
constatez qu’il n’y a qu’une seule entrée au lieu de 11.
Tableau Prep a regroupé des actions similaires pour un champ. La méthode vous plaît
parce qu’elle vous aidera à retrouver plus facilement les modifications que vous avez
apportées à votre ensemble de données.
26 Tableau Software
Aide de Tableau Prep
La correction des valeurs du champ State était la seule modification que vous aviez à faire
ici.
6. Nommez votre étape de nettoyage pour vous souvenir de votre travail, par exemple
Renommer les États.
Vous avez effectué un grand nettoyage de vos données et vous êtes stupéfait de voir à quel point
cette opération était facile et rapide. Vous allez même pouvoir rentrer à temps pour le dîner ! Pour
être sûr de ne pas perdre le travail effectué jusqu’à ce point, enregistrez votre flux.
Cliquez sur Fichier > Enregistrer ou Fichier > Enregistrer sous. Enregistrez votre fichier en
tant que fichier de flux (.tfl) et donnez-lui un nom, par exemple Mon Superstore.
Astuce : lorsque vous enregistrez vos fichiers de flux (.tfl), vous pouvez soit les enregistrer en
tant que fichier de flux (.tflx), soit compresser vos fichiers de données locales avec eux pour
partager le flux et les fichiers avec une autre personne. Pour plus d’informations sur
l’enregistrement et le partage de vos flux, consultez Enregistrer et partager votre travail sur la
page 429.
Parce que tous les fichiers ont des champs similaires après vos efforts de nettoyage, pour
regrouper toutes les lignes dans une seule table, vous devez réunir les tables.
Vous vous rappelez qu’il existe une option d’étape intitulée Union, mais vous vous demandez si
vous pouvez simplement faire glisser et déposer les étapes pour les réunir. Vous décidez
d’essayer et de voir ce que cela donne.
Tableau Software 27
Aide de Tableau Prep
l Dans le volet Flux, faites glisser l’étape de nettoyage Renommer les États sur
l’étape de nettoyage Type de données modifié et déposez-la sur l’option Union.
Vous voyez que Tableau Prep Builder a ajouté une nouvelle étape Union à votre
flux. Formidable ! Vous souhaitez maintenant ajouter aussi les autres fichiers à
cette union.
l Dans le volet Flux, faites glisser l’étape de nettoyage Renommer les États sur
l’étape Union que vous avez créée précédemment pour vos fichiers South et
déposez-la sur l’option Ajouter.
28 Tableau Software
Aide de Tableau Prep
Vous voyez que Tableau Prep a ajouté vos nouveaux fichiers à votre union
précédente. Formidable ! Vous souhaitez maintenant ajouter aussi les autres
fichiers à cette union.
2. Faites glisser l’étape de nettoyage suivante dans le flux jusqu’à l’étape Union puis
déposez-la sur Ajouter pour l’ajouter à l’union existante.
Tous vos fichiers sont maintenant combinés en une seule table ! Dans le volet Flux,
sélectionnez la nouvelle étape Union pour voir vos résultats.
Tableau Software 29
Aide de Tableau Prep
Vous notez que Tableau a automatiquement associé les champs présentant les mêmes
noms et types.
Vous voyez aussi que les couleurs affectées aux étapes dans le flux sont utilisées dans
les profils d’union pour indiquer la provenance du champ et apparaissent aussi dans la
bande colorée en haut de chaque champ pour vous indiquer si ce champ existe dans
cette table.
30 Tableau Software
Aide de Tableau Prep
Vous notez qu’un nouveau champ appelé Table Names (Noms des tables) a été ajouté. Il
répertorie les tables d’où proviennent toutes les lignes de l’union.
Une liste des champs discordants s’affiche également dans le volet Résumé et il vous
apparaît aussitôt que les champs Product et Discounts apparaissent uniquement dans le
fichier Orders_Central.
4. Pour examiner ces champs de plus près, dans le volet Résultats de l’union, sélectionnez
la case à cocher Afficher uniquement les champs sans correspondance.
En examinant les données de champ, vous verrez que les donnés sont identiques, mais
que le nom du champ est différent. Vous pourriez simplement renommer le champ, mais
vous vous demandez s’il ne serait pas possible de simplement faire glisser et déposer ces
champs pour les fusionner. Vous décidez d’essayer et de voir ce que cela donne.
Tableau Software 31
Aide de Tableau Prep
6. Répétez cette étape pour fusionner le champ Discounts avec le champ Discount.
Le seul champ qui n’a pas de correspondance maintenant est le champ File Paths
(Chemins d’accès des fichiers). Dans Tableau Prep Builder, ce champ affiche les
chemins d’accès des fichiers pour l’union de caractères génériques que vous avez
réalisée pour vos commandes de ventes de la région Sud. Vous décidez de garder ce
champ parce qu’il contient des informations utiles.
Conseil : vous disposez de plusieurs options pour corriger des champs discordants
après une union. S’il détecte une correspondance possible, Tableau Prep la met en
surbrillance en jaune. Pour fusionner les champs, survolez le champ surligné et cliquez
Pour d’autres manières de fusionner des champs dans une union, consultez Corriger les
champs non concordants sur la page 414.
8. Nommez votre étape Union pour indiquer le travail couvert par cette union, par exemple
Toutes les commandes.
32 Tableau Software
Aide de Tableau Prep
Vous êtes un génie du nettoyage ! Pendant que vous admirez le résultat de votre travail, votre
responsable vous appelle. Il a oublié de mentionner qu’il souhaite que vous incluiez tous les
retours de produit dans votre analyse. Il espère que cette manipulation ne vous demandera pas
trop de travail. Avec Tableau Prep dans votre trousse d’outils, vous êtes paré.
1. Dans le volet Connexions, cliquez sur Ajouter une connexion. Sélectionnez Microsoft
Excel et accédez aux fichiers d’échantillons de données que vous utilisez pour cet
exercice. (Voir Exemples de fichiers sur la page 3 pour télécharger le fichier.)
2. Sélectionnez return reasons_new.xlsx, puis cliquez sur Ouvrir pour ajouter le fichier au
volet Flux.
Dans ce fichier de votre flux, vous ne souhaitez inclure que quatre champs : Order ID (ID
de commande), Product ID (ID de produit), Return Reason (Motif du retour) et Notes
(Remarques).
Tableau Software 33
Aide de Tableau Prep
4. Renommez l’étape des données entrantes afin de mieux refléter les données incluses
dans cette entrée. Dans le volet Flux, double-cliquez sur le nom de l’étape Returns_new
et entrez Returns (all).
Vous allez devoir faire du nettoyage dans ce fichier avant tout autre travail sur les
données. Vous ajoutez donc une étape de nettoyage pour vérifier.
5. Dans le volet Flux, sélectionnez l’étape des données entrantes Returns (all) (Retours
(tous)), cliquez sur l’icône Plus ou sur l’étape de nettoyage suggérée pour ajouter une
étape de nettoyage.
Dans le volet Profil, redimensionnez le champ Notes afin de mieux voir les entrées. Pour
cela, cliquez sur le bord extérieur droit du champ et faites-le glisser vers la droite.
6. Dans le champ Remarques, utilisez la barre de défilement visuelle à droite des valeurs
de champ pour scanner les valeurs.
34 Tableau Software
Aide de Tableau Prep
l Il semble que le nom de l’approbateur soit inclus dans l’entrée des remarques sur le
retour. Pour mieux travailler avec ces données, vous souhaitez placer ces
informations dans un champ séparé.
Pour éliminer les espaces supplémentaires, vous vous rappelez qu’il existe une option de
nettoyage permettant de supprimer les espaces de fin. Vous décidez de l’essayer pour
voir si cela peut résoudre le premier problème et supprimer les espaces supplémentaires.
Oui ! L’opération s’est déroulée comme vous le souhaitiez. Les espaces supplémentaires
ont disparu !
Vous souhaitez ensuite créer un champ séparé pour le nom de l’approbateur. Vous voyez
une option Scinder les valeurs dans le menu et vous décidez de l’utiliser.
Tableau Software 35
Aide de Tableau Prep
Comme dans Tableau Desktop, Tableau Prep a automatiquement attribué un nom à ces
champs. Vous devez donc renommer ces champs en un nom descriptif.
11. Enfin, supprimez le champ Notes d’origine puisque vous n’en avez plus besoin.
36 Tableau Software
Aide de Tableau Prep
Peut-être que l’option Regrouper les valeurs (Regrouper et remplacer dans les versions
précédentes) peut vous aider ?
Vous vous souvenez qu’il existe une option pour les Caractères communs. Étant donné
que ces valeurs partagent les mêmes lettres, vous décidez d’essayer cette option.
Tableau Software 37
Aide de Tableau Prep
Cette option a regroupé toutes les variations de chaque nom pour vous. C’était
exactement le résultat recherché.
Après avoir vérifié les autres noms pour vous assurer qu’ils sont correctement regroupés,
cliquez sur Terminé pour fermer l’Éditeur Regrouper les valeurs.
38 Tableau Software
Aide de Tableau Prep
13. Nommez votre étape de nettoyage pour vous souvenir de votre travail, par exemple
Remarques nettoyées.
Maintenant que les données de retours de produits sont toutes nettoyées, vous souhaitez ajouter
ces données aux données de commandes depuis vos fichiers réunis. Par contre, un grand
nombre de ces fichiers n’existe pas dans les fichiers réunis. Pour ajouter ces champs (colonnes
de données) à votre ensemble de données réunies, vous devez utiliser une jointure.
1. Dans le volet Flux, faites glisser l’étape Remarques nettoyées sur l’étape d’union Toutes
les commandes et faites-la glisser sur Lier.
Tableau Software 39
Aide de Tableau Prep
Lorsque vous liez les fichiers, Tableau Prep affiche le résultat de votre jointure dans
Profil de jointure.
L’utilisation de jointures peut se révéler complexe. Vous voulez souvent avoir une vue
claire des facteurs qui sont inclus dans la jointure, par exemple les champs utilisés pour
lier les fichiers, le nombre de lignes inclus dans les résultats et tous les champs qui ne
sont pas inclus ou qui sont des valeurs null.
Lorsque vous vérifiez les résultats d’une jointure dans Tableau Prep, vous êtes ravi
d’avoir accès à autant d’informations et d’interactivité.
40 Tableau Software
Aide de Tableau Prep
Conseil : le volet tout à gauche du profil de jointure vous permet d’explorer la jointure et
d’interagir avec elle. Vous pouvez également modifier des valeurs directement dans les
volets Clauses de jointure et effectuer d’autres opérations de nettoyage dans le volet
Résultats de la jointure.
Sélectionnez les champs à lier dans la section Clauses de jointure appliquées ou ajoutez
les clauses de jointure suggérées dans la section Recommandations sur les clauses de
jointure.
Pour plus d’informations sur l’utilisation de jointures, consultez Agréger, lier ou réunir
des données sur la page 403.
Vous voyez que vous avez plus de 13 000 lignes exclues de vos fichiers All Orders
(Toutes les commandes). Une fois que vous avez créé votre jointure, Tableau Prep a
automatiquement créé une jointure sur le champ Product ID, mais vous souhaitiez
également créer une jointure sur le champ Order ID.
Tableau Software 41
Aide de Tableau Prep
Lorsque vous examinez le volet gauche du profil de jointure, vous constatez que Order
ID figure dans la liste des clauses de jointure recommandées, donc vous l’y ajoutez
rapidement depuis ce point.
Le Type de jointure étant défini sur une jointure interne (paramètre par défaut pour
Tableau Prep), la jointure inclut uniquement des valeurs qui existent dans les deux
fichiers. Mais vous souhaitez toutes vos données des fichiers Orders ainsi que les
données de retours pour ces fichiers. Vous avez donc besoin de modifier le type de
jointure.
3. Dans la section Type de jointure, cliquez sur le côté du diagramme pour inclure toutes
les commandes. Dans l’exemple ci-dessous, cliquez sur le côté gauche du diagramme
pour changer le type de jointure en jointure gauche et inclure toutes les données de
l’étape union Toutes les commandes et toutes les données correspondantes de l’étape
Remarques nettoyées.
42 Tableau Software
Aide de Tableau Prep
Vous avez maintenant toutes les données des fichiers de commandes de ventes et toutes
les données de retours s’appliquant à ces commandes. Vous consultez le volet Clauses
de jointure et vous voyez des valeurs distinctes qui n’existent pas dans l’autre fichier.
Par exemple, plusieurs lignes de commandes (affichées en rouge) n’ont pas de données
de retour correspondantes. Vous appréciez de pouvoir explorer ce niveau de détail dans
votre jointure.
Vous avez hâte de démarrer votre analyse de ces données dans Tableau Desktop, mais
vous remarquez quelques résultats dans la jointure que vous souhaitez nettoyer au
préalable. Par chance, vous savez comment vous y prendre !
Astuce : vous vous demandez si le nettoyage de vos données est assez poussé ? Depuis
Tableau Prep Builder, vous pouvez prévisualiser vos données dans Tableau Desktop
depuis toute étape de votre flux pour les vérifier.
Il vous suffit de faire un clic droit sur l’étape dans le volet Flux et de sélectionner Aperçu
dans Tableau Desktop dans le menu.
Vous pouvez expérimenter avec vos données. Toutes les modifications que vous apportez
dans Tableau Desktop ne seront pas retranscrites dans votre source de données dans
Tableau Prep Builder. Pour plus d’informations, consultez Afficher la sortie de flux dans
Tableau Desktop sur la page 432.
Tableau Software 43
Aide de Tableau Prep
Remarque : pour nettoyer les champs dans votre jointure, vous pouvez effectuer des
opérations de nettoyage directement dans l’étape Lier. Dans l’optique de ce didacticiel,
nous allons ajouter une étape de nettoyage afin que vous puissiez voir clairement vos
opérations de nettoyage. Si vous souhaitez effectuer ces étapes directement dans l’étape
de jointure, ignorez les étapes 1 et 3 ci-dessous.
Lorsque vous avez lié les deux étapes, les champs communs Order ID et Product ID ont été
ajoutés aux deux tables.
Vous souhaitez conserver le champ Product ID de toutes vos commandes et le champ Order ID
du fichier des retours, et supprimer les champs en double issus de ces fichiers. Vous n’avez pas
besoin des champs Chemins d’accès de fichiers et Noms de tables dans votre fichier de
sortie, donc vous supprimez également ces champs.
Conseil : lorsque vous liez des tables en utilisant des champs qui existent dans les deux
fichiers, Tableau Prep intègre les deux champs et renomme le champ en double du second
fichier en ajoutant un « -1 » ou un « -2 » au nom du champ, par exemple Order ID et Order ID-1.
l Order ID
l Product ID-1
44 Tableau Software
Aide de Tableau Prep
Vous avez plusieurs valeurs null là où le produit a été retourné, mais sans remarque sur le
retour ni indication de l’approbateur. Pour faciliter l’analyse de ces données, vous
souhaitez afficher un champ avec une valeur de Oui et Non pour indiquer si le produit a
été retourné.
Vous n’avez pas ce champ, mais vous pouvez l’ajouter en créant un champ calculé.
5. Nommez le champ Retourné?, entrez le calcul suivant puis cliquez sur Enregistrer.
Tableau Software 45
Aide de Tableau Prep
Pour votre analyse, vous voudriez aussi connaître le nombre de jours nécessaires à
l’expédition d’une commande, mais vous ne disposez pas non plus de ce champ.
Vous avez par contre toutes les informations nécessaires pour le créer, donc vous
ajoutez un autre champ calculé pour le créer.
7. Nommez le champ Jours avant expédition, entrez le calcul suivant puis cliquez sur
Enregistrer.
46 Tableau Software
Aide de Tableau Prep
Tableau Software 47
Aide de Tableau Prep
Selon votre environnement de travail, vous pouvez envoyer votre flux vers un fichier (Tableau
Prep Builder uniquement), vers une source de données publiée ou vers une base de données.
l’icône plus et sélectionnez Sortie (Ajouter une sortie dans les versions
précédentes).
Lorsque vous ajoutez une étape Sortie, le volet Sortie s’ouvre et affiche un instantané de
vos données. Vous pouvez sélectionner ici le type de sortie que vous souhaitez générer
et spécifier le nom du fichier et son emplacement d’enregistrement.
L’emplacement par défaut est le dossier My Tableau Prep Builder dans votre dossier de
sources de données.
2. Dans le volet gauche de la liste déroulante Enregistrer la sortie sur, selon votre
environnement de travail, effectuez l’une des opérations suivantes :
48 Tableau Software
Aide de Tableau Prep
Astuce : vous avez plusieurs options lorsque vous générez une sortie à partir de votre
flux. Vous pouvez générer un fichier d’extrait (Tableau Prep Builder uniquement) ou vous
pouvez publier vos données en tant que source de données sur Tableau Server ou
Tableau Cloud, ou encore écrire vos données dans une base de données. Pour plus
d’informations sur la génération de fichiers de sortie, consultez Créer des fichiers
d’extrait de données et des sources de données publiées sur la page 433.
3. Dans la section Options d’écriture, affichez les options pour écrire les nouvelles données
dans vos fichiers. Vous souhaitez utiliser le paramètre par défaut (Créer la table) et
remplacer la table par votre sortie de flux, il n’y a donc rien à changer ici.
Conseil : depuis la version 2020.2.1, vous pouvez choisir la façon dont vous souhaitez
réécrire vos données de flux sur votre table. Vous pouvez choisir parmi deux options :
Créer une table ou Ajouter une table. Par défaut, Tableau Prep utilise l’option Créer
une table et remplace vos données de table par de nouvelles données lorsque vous
exécutez votre flux. Si vous choisissez Ajouter une table, Tableau Prep ajoute les
données de flux à la table existante afin que vous puissiez suivre à la fois les données
nouvelles et les données historiques à chaque exécution de flux. Pour plus d’informations,
consultez Configurer les options d’écriture sur la page 475.
4. Dans le volet Sortie, cliquez sur Exécuter le flux ou cliquez sur le bouton Exécuter le
Remarque : si vous travaillez sur le Web, cliquez sur Publier pour publier votre
brouillon de flux. Seuls les flux publiés peuvent être exécutés.
Tableau Software 49
Aide de Tableau Prep
5. Une fois que le flux a fini de s’exécuter, une boîte de dialogue d’état montre si le flux s’est
correctement exécuté et indique la durée de l’exécution. Cliquez sur Terminé pour fermer
la boîte de dialogue.
Si vous travaillez sur le Web, accédez à la page Explorer>Tous les flux, et trouvez votre
flux. Vous pouvez voir l’état de votre flux exécuté dans la page Vue d’ensemble du flux.
Pour garder vos données à jour, vous pouvez exécuter le flux manuellement ou utiliser la
ligne de commande. Si vous disposez du module Data Management et que Tableau
50 Tableau Software
Aide de Tableau Prep
Prep Conductor est activé, vous pouvez également exécuter votre flux de manière
programmée sur Tableau Server ou Tableau Cloud.
Depuis Tableau Prep Builder version 2020.2.1 et sur le Web, vous pouvez également
choisir d’actualiser toutes vos données à chaque fois que le flux est exécuté, ou d’exécuter
votre flux en utilisant l’actualisation incrémentielle et de traiter uniquement vos nouvelles
données à chaque fois.
Pour savoir comment garder vos données à jour, consultez les rubriques suivantes :
l Actualiser les fichiers de sortie du flux depuis la ligne de commande sur la
page 479
l Publier un flux sur Tableau Server ou Tableau Cloud sur la page 520
l Actualiser les données de flux à l’aide d’une actualisation incrémentielle sur
la page 469
Finalisation et ressources
Vous êtes un champion de la préparation de données ! Vous avez pris des données
désordonnées et vous les avez réorganisées haut la main. En un temps record, vous avez
nettoyé et préparé vos données à partir de plusieurs ensembles de données et vous les avez
transformées en un ensemble de données léger et propre avec lequel vous pouvez maintenant
travailler dans Tableau Desktop pour faire votre analyse.
Vous souhaitez continuer à vous exercer ? Essayez de répliquer le reste de l’exemple de flux
Superstore en utilisant les fichiers de données disponibles à cette adresse :
l Orders_South_2015
l Orders_South_2016
l Orders_South_2017
l Orders_South_2018
l Orders_Central
l Orders_East
l Orders_West
l returns_reasons_new
l Quota
Vous pouvez également trouver les fichiers à l’emplacement suivant sur votre ordinateur après
avoir installé Tableau Prep Builder :
Tableau Software 51
Aide de Tableau Prep
Vous voulez approfondir votre formation ? Découvrez ces fantastiques ressources, ou suivez
une formation en présentiel.
Vous souhaitez plus d’informations sur les rubriques traitées ici ? Consultez les autres rubriques
dans l’aide en ligne de Tableau Prep.
Remarque : Tableau Prep version 2019.1.2 s’appelle désormais Tableau Prep Builder et
réfère à l’application Desktop. Depuis la version 2020.4, en tant qu’utilisateur Creator,
vous pouvez également créer et modifier des flux Tableau Server et Tableau Cloud.
Chaque étape du processus est représenté visuellement par un graphique de flux que vous
créez et contrôlez. Tableau Prep enregistre le suivi de chaque opération afin que vous puissiez
vérifier votre travail et apporter des modifications à tout moment dans le flux.
Une fois que vous avez terminé votre flux, exécutez-le pour appliquer les opérations à
l’ensemble de données tout entier.
Tableau Prep s’intègre directement avec les autres produits Tableau. À tout moment de votre
flux, vous pouvez créer un extrait de vos données, publier votre source de données sur Tableau
Server ou Tableau Cloud, publier votre flux sur Tableau Server ou Tableau Cloud pour continuer
52 Tableau Software
Aide de Tableau Prep
à modifier sur le Web ou actualiser vos données de manière programmée. Vous pouvez
également ouvrir Tableau Desktop directement à partir de Tableau Prep Builder pour
prévisualiser vos données.
Pour des informations sur l’installation de Tableau Prep Builder, consultez Installer Tableau
Desktop ou Tableau Prep Builder dans le Guide de déploiement de Tableau Desktop et Tableau
Prep.
Vous souhaitez essayer Tableau Prep avec un assistant IA ? Depuis la version 2025.2, vous
pouvez utiliser Tableau Agent pour vous aider à créer des calculs, nettoyer et transformer vos
données à mesure que vous créez votre flux. Pour plus d’informations, consultez Créer des flux
Tableau Prep avec Tableau Agent.
Tableau Software 53
Aide de Tableau Prep
Vous êtes prêt à l’essayer ? Dans la page de démarrage, cliquez sur l’un des exemples de flux
à explorer et expérimentez avec les différentes étapes, ou essayez le didacticiel pratique Prise
en main de Tableau Prep Builder sur la page 3 pour apprendre à créer un flux. Vous pouvez
aussi essayer l’un de nos Scénarios pratiques sur la page 543 avec Tableau Prep Builder.
54 Tableau Software
Aide de Tableau Prep
Remarque : vous trouverez les exemples de fichiers de données utilisés dans les flux aux
emplacements suivants :
Pour en savoir plus sur la façon dont Tableau Prep Builder optimise vos données pour les
performances, voir Tableau Prep sous le capot. Pour en savoir plus sur Tableau Prep et ses
différentes fonctionnalités et fonctions, consultez les rubriques de ce guide.
Tableau Software 55
Aide de Tableau Prep
l Volet Flux (2) : Représentation visuelle des étapes des opérations à mesure que vous
préparez vos données. C’est à ce stade que vous ajoutez des étapes pour construire
votre flux.
l Volet Profil (3) : Résumé de chaque champ dans votre échantillon de données. Vérifiez
la forme de vos données et identifiez rapidement les valeurs atypiques et les valeurs null.
l Grille de données (4) : Niveau de détail des lignes pour vos données.
Après vous être connecté à vos données et avoir commencé à créer votre flux, vous ajoutez des
étapes dans le volet Flux. Ces étapes fonctionnent comme un objectif sur la structure de vos
données, ainsi qu’un résumé des opérations appliquées à vos données. Chaque étape
représente une catégorie d’opérations différentes que vous définissez, et qui font toutes partie
de votre flux.
56 Tableau Software
Aide de Tableau Prep
Vous pouvez réduire le volet Connexions si vous avez besoin de plus d’espace dans votre
espace de travail.
Tableau Software 57
Aide de Tableau Prep
Vous démarrez votre flux en faisant glisser des tables dans le volet Flux. Vous pouvez y ajouter
des ensembles de données supplémentaires, permuter vos données, réunir ou lier des
données, créer des agrégations et générer une sortie de flux dans un fichier (.hyper, .csv, .xlsx),
une source de données publiée à utiliser dans Tableau, une base de données ou CRM
Analytics. Pour plus d’informations sur l’enregistrement et le partage des fichiers de sortie,
consultez Enregistrer et partager votre travail sur la page 429.
Remarque : si vous modifiez les données pendant que vous êtes dans Tableau Desktop,
par exemple en renommant les champs, en modifiant les types de données, etc., ces
modifications ne sont pas répercutées dans Tableau Prep Builder.
En haut du volet Profil, une barre d’outils vous montre les opérations de nettoyage que vous
pouvez effectuer pour chaque étape de votre flux. Un menu d’options s’affiche également sur
chaque fiche du volet Profil et vous permet de sélectionner les différentes opérations possibles
sur les données.
Par exemple :
58 Tableau Software
Aide de Tableau Prep
l Nettoyer les erreurs de saisie de données en utilisant la fonction Regrouper les valeurs ou
des opérations de nettoyage rapide
l Réorganiser l’ordre de vos colonnes de champ en les faisant glisser et en les déposant à
l’emplacement de votre choix
Sélectionnez une ou plusieurs valeurs de champ dans une fiche Profil et faites un clic droit (Ctrl-
clic sur MacOS) pour voir les options supplémentaires permettant de conserver ou d’exclure des
valeurs, de regrouper des valeurs sélectionnées ou de remplacer des valeurs par des valeurs
null.
Tableau Software 59
Aide de Tableau Prep
Tableau Prep mémorise toutes les modifications que vous apportez, dans leur ordre
d’exécution, afin que vous puissiez y revenir, les vérifier ou les ajuster si nécessaire. Procédez
par glisser et déposer pour réorganiser ces opérations dans la liste pour expérimenter avec vos
données et appliquer les modifications dans un ordre différent.
Cliquez sur la flèche en haut à droite du volet pour développer et réduire le volet Modifications
afin d’avoir plus d’espace pour travailler avec les données dans le volet Profil.
Pour plus d’informations sur l’application des options de nettoyage à vos données, consultez
Nettoyer et organiser les données sur la page 249.
Cliquez sur l’icône Réduire les profils dans la barre d’outils pour réduire (ou développer) le
volet Profil et voir vos options.
60 Tableau Software
Aide de Tableau Prep
Tableau Prep Builder enregistre également les données dans le fichier de flux Tableau (.tfl) pour
prendre en charge les opérations suivantes (qui peuvent capturer les valeurs de données
saisies) :
l Calculs
À partir de la version 2020.4, Tableau Prep prend en charge la création Web pour les flux. Vous
pouvez désormais créer des flux pour nettoyer vos données et les préparer en utilisant Tableau
Prep Builder, Tableau Server ou Tableau Cloud. Vous pouvez également exécuter
manuellement les flux sur le Web sans que le module Data Management soit nécessaire.
Bien que la plupart des fonctionnalités de Tableau Prep Builder soient également prises en
charge sur le Web, il existe quelques différences lors de la création et de l’utilisation de vos flux.
Important : pour créer et modifier des flux sur le Web, vous devez avoir une licence Creator.
Data Management n’est nécessaire que si vous souhaitez exécuter vos flux de manière
programmée à l’aide de Tableau Prep Conductor ou via l’API. Pour plus d’informations sur la
configuration et l’utilisation de Tableau Prep Conductor, consultez « Tableau Prep Conductor »
dans l’aide de Tableau Server ou Tableau Cloud.
Tableau Software 61
Aide de Tableau Prep
Installation et déploiement
Pour permettre aux utilisateurs de créer et de modifier des flux sur le Web, vous devez
configurer plusieurs paramètres sur votre serveur. Pour plus d’informations sur chacun de ces
paramètres, consultez Créer et modifier des flux publiés sur le Web.
l Création Web : activée par défaut, cette option contrôle si les utilisateurs peuvent créer
et modifier des flux sur Tableau Server ou Tableau Cloud.
l Exécuter maintenant : contrôle si les utilisateurs ou seuls les administrateurs peuvent
exécuter les flux manuellement à l’aide de l’option Exécuter maintenant. Vous n’avez
pas besoin de Data Management pour exécuter les flux manuellement sur le Web.
l Tableau Prep Conductor : si vous possédez une licence Data Management activez
cette option pour permettre aux utilisateurs de planifier et de suivre les flux.
l Extensions Tableau Prep (à partir de la version 2021.2.0) : contrôle si les utilisateurs
peuvent se connecter à Einstein Discovery pour appliquer et exécuter des modèles pré-
dictifs sur les données de leur flux.
l Enregistrement automatique : activée par défaut, cette fonctionnalité permet
d’enregistrer automatiquement le flux d’un utilisateur toutes les quelques secondes.
Pour plus d’informations sur le paramétrage de la taille de vos données, voir Définir la taille de
votre échantillon de données dans l’aide de Tableau Prep.
62 Tableau Software
Aide de Tableau Prep
sont limitées ou ne sont pas encore prises en charge dans Tableau Server ou Tableau Cloud. Le
tableau suivant identifie les fonctionnalités où des différences peuvent s’appliquer.
Créer et organiser
votre flux
Nettoyer et orga-
niser les données
Tableau Software 63
Aide de Tableau Prep
Agréger, lier ou
réunir des données
Afficher la sortie de
flux dans Tableau
Desktop
Créer un extrait
dans un fichier
Créer un extrait
dans une feuille de
calcul Microsoft
64 Tableau Software
Aide de Tableau Prep
Excel
Se connecter à une
requête SQL per-
sonnalisée
Les brouillons sont enregistrés sur le serveur et le projet auquel vous êtes connecté. Vous ne
pouvez pas enregistrer ou publier un brouillon sur un autre serveur, mais vous pouvez
enregistrer le flux dans un autre projet sur ce serveur en utilisant l’option de menu Fichier >
Publier en tant que.
Vous seul pouvez voir le contenu du brouillon tant que vous ne l’avez pas publié. Si vous publiez
des modifications et devez les annuler, vous pouvez utiliser la boîte de dialogue Historique des
révision pour afficher une version précédemment publiée et y revenir. Pour plus d’informations
Tableau Software 65
Aide de Tableau Prep
sur l’enregistrement des flux sur le Web, consultez Enregistrer automatiquement vos flux sur le
Web.
l Vous ne pouvez publier des brouillons de flux que sur le serveur auquel vous êtes
connecté.
l Vous pouvez publier un brouillon sur un autre projet en utilisant le menu Fichier et en
sélectionnant Publier en tant que.
l Vous pouvez intégrer des informations d’identification pour les connexions de base de
données de votre flux pour qu’il s’exécute sans que vous ayez à saisir manuellement les
informations d’identification lors de l’exécution du flux. Si vous ouvrez le flux pour le modi-
fier, vous devrez saisir à nouveau vos informations d’identification.
l Depuis le menu supérieur, sélectionnez Fichier > Identifiants de connexion > Intégrer
dans le flux publié.
66 Tableau Software
Aide de Tableau Prep
l Lors de la publication d’un flux, sélectionnez la case à cocher Intégrer les informations
d’identification. Cette option s’affiche lorsque vous sélectionnez Publier en tant que
pour publier le flux vers un nouveau projet pour la première fois ou lorsque vous modifiez
un flux qui a été publié en dernier par quelqu’un d’autre.
Publier un flux
Lorsque vous publiez votre flux, il devient la version actuelle du flux et peut être exécuté et
consulté par d’autres personnes ayant accès à votre projet. Les flux qui ne sont jamais publiés ou
les modifications de flux que vous apportez à un brouillon ne sont visibles que par vous tant que
Tableau Software 67
Aide de Tableau Prep
vous n’avez pas publié le flux. Pour plus d’informations sur le statut des flux, consultez
Enregistrer automatiquement vos flux sur le Web.
l Depuis le menu supérieur, sélectionnez Fichier > Publier ou Fichier > Publier en tant
que
l Depuis la barre supérieure, cliquez sur le bouton Publier ou cliquez sur la flèche
déroulante pour sélectionner Publier en tant que.
68 Tableau Software
Aide de Tableau Prep
Tableau Software 69
Aide de Tableau Prep
70 Tableau Software
Aide de Tableau Prep
Tableau Software 71
Aide de Tableau Prep
72 Tableau Software
Aide de Tableau Prep
Remarque : depuis la version 2020.4.1, vous pouvez également créer et modifier des flux
dans Tableau Server et Tableau Cloud. Les informations de cette rubrique s’appliquent à
toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création
de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server et
Tableau Cloud.
Vous pouvez ouvrir plusieurs espaces de travail Tableau Prep Builder pour travailler sur
plusieurs flux en même temps. Dans Tableau Prep Builder version 2019.3.1 et versions
antérieures, si vous sélectionnez Fichier > Ouvrir, Tableau Prep Builder remplace votre flux
ouvert actuel par le nouveau flux que vous sélectionnez.
Remarques : si vous ouvrez un flux dans une version où le connecteur n’est pas pris en
charge, le flux peut s’ouvrir mais risque de présenter des erreurs ou de ne pas s’exécuter,
à moins que les connexions de données ne soient supprimées.
Certains connecteurs peuvent nécessiter le téléchargement et l’installation d’un pilote
pour que vous puissiez vous connecter à vos données. Consultez la page
Téléchargement de pilotes sur le site Web de Tableau pour obtenir les liens de
téléchargement et les instructions d’installation.
Tableau Software 73
Aide de Tableau Prep
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
Depuis la version 2021.4 si vous disposez de Data Management avec Catalog activé,
vous pouvez également cliquer sur Nouveau > Flux à partir de la page Ressources
externes sur le Web pour créer un flux avec une connexion prise en charge par Catalog.
Pour plus d’informations, consultez Tableau Catalog dans l’aide de Tableau Server ou
Tableau Cloud.
74 Tableau Software
Aide de Tableau Prep
Tableau Software 75
Aide de Tableau Prep
l Si vous vous êtes connecté à une base de données, sélectionnez une base de
données ou un schéma, puis double-cliquez sur une table ou faites-la glisser vers
le volet Flux pour démarrer votre flux.
76 Tableau Software
Aide de Tableau Prep
l Cliquez sur Ouvrir un flux pour accéder à votre fichier de flux, et ouvrez-le.
Après vous être connecté à vos données, utilisez les différentes options de l’étape des données
entrantes pour identifier les données avec lesquelles travailler dans votre flux. Vous pouvez
ensuite ajouter une étape de nettoyage ou un autre type d’étape pour examiner, nettoyer et
organiser vos données.
Lorsque vos flux incluent plusieurs connecteurs de source de données différents, Tableau Prep
vous aide à voir facilement quels connecteurs et tables sont associés à vos étapes des données
entrantes. Lorsque vous cliquez sur l’étape des données entrantes, le connecteur et la table de
données associés sont surlignés dans le volet Connexions. Cette option a été ajoutée dans
Tableau Prep Builder version 2020.1.1 et est également prise en charge lors de la modification
des flux sur le Web.
Tableau Software 77
Aide de Tableau Prep
78 Tableau Software
Aide de Tableau Prep
2. Dans la page Vue d’ensemble du flux, cliquez sur Modifier pour modifier votre flux.
Votre flux s’ouvrira dans un nouvel onglet. Dès que vous commencez à apporter des
modifications, Tableau enregistre automatiquement vos modifications toutes les quelques
secondes et enregistre votre flux modifié sous forme de brouillon. Les brouillons ne sont visibles
que pour vous et votre administrateur.
Une fois que vous avez terminé, vous pouvez fermer votre flux et continuer à apporter des
modifications plus tard ou publier votre flux pour appliquer vos modifications, créant ainsi une
nouvelle version du flux.
Comme d’autres outils, la publication de flux utilise la méthode du premier entré. Si un autre
utilisateur modifie et republie le flux avant vous, ses modifications sont appliquées en premier.
Vous pouvez toutefois suivre les modifications et revenir à une version précédente à l’aide de la
page Historique des révisions. Pour plus d’informations sur l’historique des révisions,
consultez Utiliser des révisions de contenu dans l’Aide de Tableau Desktop.
Tableau Software 79
Aide de Tableau Prep
Remarque : depuis la version 2020.4.1, vous pouvez également créer et modifier des flux
dans Tableau Server et Tableau Cloud. Les informations de cette rubrique s’appliquent à
toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création
de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server.
Vous pouvez vous connecter à vos données en utilisant l’un des éléments suivants :
Builder ou démarrez un flux sur le Web, puis cliquez sur le bouton Ajouter une connexion
pour voir si le volet gauche contient les connecteurs disponibles sous Connexion.
La plupart des connecteurs intégrés fonctionnent de la même manière sur toutes nos plates-
formes et sont décrits dans la rubrique Connecteurs pris en charge dans l’aide de Tableau
Desktop.
Tableau Software 81
Aide de Tableau Prep
Remarque : lors de la connexion à une source de données, n’utilisez pas le nom réservé
« Nombre d’enregistrements » pour un nom de champ ou un champ calculé. L’utilisation
de ce nom réservé entraînera une erreur liée aux autorisations.
l À compter de la version 2025.1, vous pouvez vous connecter à des sources de données
sur site, publier votre flux sur Tableau Cloud et l’exécuter de manière programmée. Vous
aurez besoin d’un client Tableau Bridge configuré dans un pool de clients Bridge, en
ajoutant le domaine à la Liste d’autorisations de réseau privé. Dans Tableau Prep
Builder et sur le Web, lorsque vous vous connectez à votre source de données, assurez-
vous que l’URL du serveur correspond au domaine du pool Bridge. Pour plus
d’informations, consultez Bases de données sur la page 536 dans la rubrique « Publier
un flux sur Tableau Server ou Tableau Cloud ».
l Certains connecteurs, présentés dans les sections ci-dessous, ont des exigences
différentes lorsqu’ils sont utilisés avec Tableau Prep Builder.
82 Tableau Software
Aide de Tableau Prep
Vous pouvez également ajouter des informations d’identification directement à partir de la boîte
de dialogue Publier (Tableau Prep Builder version 2020.1.1 et versions ultérieures) lors de la
publication de votre flux, puis les intégrer automatiquement dans votre flux lors de la publication.
Pour plus d’informations, consultez Publier un flux depuis Tableau Prep Builder sur la page
525.
Si vous n’avez pas configuré les informations d’identification enregistrées et que vous
sélectionnez Inviter l’utilisateur dans le menu déroulant Authentification , après avoir publié le
flux, vous devez modifier la connexion et saisir vos informations d’identification dans l’onglet
Connexions dans Tableau Server ou Tableau Cloud, sinon le flux échouera lors de l’exécution.
Tableau Software 83
Aide de Tableau Prep
Dans Tableau Prep Builder version 2019.4.1, les connecteurs cloud suivants ont été ajoutés et
sont également disponibles lors de la création ou de la modification de flux sur le Web :
l Box
l DropBox
l Google Drive
l OneDrive
Pour plus d’informations sur la connexion à vos données à l’aide de ces connecteurs, consultez
la rubrique d’aide consacrée aux connecteurs dans l’aide de Tableau Desktop.
Tableau Prep Builder prend en charge la connexion aux données à l’aide du connecteur
Salesforce, tout comme Tableau Desktop, mais avec quelques différences.
l Tableau Prep Builder prend en charge tout type de jointure de votre choix.
l SQL personnalisé peut être créé dans Tableau Prep Builder 2022.1.1 ou version ulté-
rieure. Les flux qui utilisent SQL personnalisé peuvent être exécutés et les étapes exis-
tantes peuvent être modifiées dans la version 2020.2.1 ou ultérieure.
l L’utilisation d’une connexion standard pour créer votre propre connexion personnalisée
n’est pas prise en charge actuellement.
l Vous ne pouvez pas modifier le nom de la source de données par défaut pour choisir un
nom unique ou personnalisé.
l Si vous prévoyez de publier des flux sur Tableau Server et que vous souhaitez utiliser les
informations d’identification enregistrées, l’administrateur du serveur devra configurer
Tableau Server avec un ID de client OAuth et un secret sur le connecteur. Pour plus
d’informations, voir Modifier Salesforce.com OAuth sur des informations d’identification
enregistrées dans l’aide de Tableau Server.
l Pour exécuter une actualisation incrémentielle sur les entrées de flux qui utilisent le
connecteur Salesforce, vous devez utiliser Tableau Prep Builder version 2021.1.2 ou ulté-
rieure. Pour plus d’informations sur l’utilisation de l’actualisation incrémentielle, consultez
Actualiser les données de flux à l’aide d’une actualisation incrémentielle sur la
page 469.
84 Tableau Software
Aide de Tableau Prep
Tableau Prep importe les données en créant un extrait. Seuls les extraits sont actuellement pris
en charge pour Salesforce. Le chargement de l’extrait initial peut prendre un certain temps en
fonction de la quantité de données incluse. Vous verrez une minuterie dans l’étape des données
entrantes pendant le chargement des données.
Pour plus d’informations sur l’utilisation du connecteur Salesforce, consultez Salesforce dans
l’aide de Tableau Desktop et la création Web.
Pour vous connecter aux données Salesforce Data Cloud, utilisez le connecteur Salesforce Data
Cloud. Le connecteur Salesforce Data Cloud reconnaît les espaces de données, présente des
étiquettes d’objet plus claires et est optimisé par des requêtes accélérées.
1. Dans le volet Connexions, sélectionnez Salesforce Data Cloud dans la liste des connec-
teurs Tableau Server.
2. Dans la boîte de dialogue Salesforce Data Cloud, cliquez sur Connexion.
3. Connectez-vous à Salesforce avec votre nom d’utilisateur et votre mot de passe.
4. Sélectionnez Autoriser.
5. Fermez le volet du navigateur.
6. Dans Tableau Prep, sélectionnez un espace de données pour afficher les tables.
7. Sélectionnez une table.
Vous devez configurer les informations d’identification pour que Tableau Prep communique avec
Google BigQuery. Si vous prévoyez de publier des flux sur Tableau Server ou Tableau Cloud, les
connexions OAuth doivent également être configurées pour ces applications.
Tableau Software 85
Aide de Tableau Prep
Remarque : Tableau Prep ne prend actuellement pas en charge l’utilisation des attributs
de personnalisation de Google BigQuery.
l Configurer OAuth pour Google - Configuration des connexions OAuth pour Tableau Ser-
ver.
l Connexions OAuth - Configuration des connexions OAuth pour Tableau Cloud.
Pour configurer SSL pour les connexions OAuth à Google BigQuery, suivez les étapes
suivantes :
1. Exportez le certificat SSL de votre proxy vers un fichier, par exemple proxy.cer. Vous pou-
vez trouver votre certificat dans Applications > Utilities > Keychain
Access >System > Certificates (under Category).
2. Localisez la version de java que vous utilisez pour exécuter Tableau Prep Builder. Par
exemple : /Applications/Tableau Prep Builder
2020.4.app/Plugins/jre/lib/security/cacerts
86 Tableau Software
Aide de Tableau Prep
1. Dans Tableau Server ou Tableau Cloud, dans l’onglet Connexions, sur la connexion
Tableau Software 87
Aide de Tableau Prep
d’identification enregistrées.
2. Connectez-vous à Google BigQuery en utilisant votre e-mail ou votre numéro de télé-
phone, puis sélectionnez Suivant.
3. Dans Authentification, sélectionnez Se connecter avec un fichier de Compte de ser-
vice (JSON).
4. Entrez le chemin d’accès du fichier ou utilisez le bouton Parcourir pour le rechercher.
5. Cliquez sur Connexion.
6. Entrez votre mot de passe pour continuer.
7. Sélectionnez Accepter pour autoriser Tableau à accéder à vos données Google
BigQuery. Vous serez invité à fermer le navigateur.
Gérer vos paramètres de compte dans l’aide de Tableau Desktop et l’aide de la création Web.
Publier un flux depuis Tableau Prep Builder sur la page 525 pour obtenir des informations
sur le paramétrage des options d’authentification lors de la publication d’un flux.
Afficher et résoudre les erreurs pour obtenir des informations sur la résolution des erreurs de
connexion dans Tableau Server ou Tableau Cloud.
88 Tableau Software
Aide de Tableau Prep
Tableau Prep Builder prend en charge la connexion aux données à l’aide de SAP HANA, tout
comme Tableau Desktop, mais avec quelques différences.
Connectez-vous à la base de données à l’aide de la même procédure que celle utilisée dans
Tableau Desktop. Pour plus d’informations, consultez SAP HANA. Après vous être connecté et
avoir recherché votre table, faites glisser la table vers l’espace de travail pour commencer à créer
votre flux.
Les invites liées aux variables et aux paramètres lors de l’ouverture d’un flux ne sont pas prises
en charge dans Tableau Prep. Au lieu de cela, dans le volet Entrée, cliquez sur l’onglet Variables
et paramètres et sélectionnez les variables et les opérandes que vous souhaitez utiliser, puis
faites votre choix dans une liste de valeurs prédéfinies ou entrez des valeurs personnalisées
pour interroger votre base de données et renvoyer les valeurs dont vous avez besoin.
Tableau Prep Builder et Tableau Prep Conductor ne prennent pas en charge les variables et les
paramètres lors de la connexion à une source de données publiée SAP HANA.
Remarque : depuis Tableau Prep Builder version 2019.2.2 et sur le Web à partir de la
version 2020.4.1, vous pouvez utiliser SQL initial pour interroger votre connexion. Si vous
avez plusieurs valeurs pour une variable, vous pouvez sélectionner la valeur dont vous
avez besoin dans une liste déroulante.
Tableau Software 89
Aide de Tableau Prep
Vous pouvez également ajouter des variables supplémentaires. Cliquez sur le bouton plus
dans la section Variables et sélectionnez une variable et un opérande, puis entrez une valeur
personnalisée.
Vous pouvez vous connecter à des fichiers de données spatiales et à des sources de données
spatiales dans Tableau Prep Builder ou lors de la création ou de la modification de flux sur le
Web.
90 Tableau Software
Aide de Tableau Prep
Vous pouvez également combiner des tables spatiales avec des tables non spatiales à l’aide
d’une jointure standard et envoyer des données spatiales à un fichier d’extrait (.hyper). Les
fonctions spatiales, les jointures spatiales via des intersections et la visualisation de données
spatiales sur une carte Tableau Prep ne sont pas prises en charge actuellement.
l Fichiers de formes Esri : Le dossier doit contenir des fichiers .shp, .shx, .dbf et .prj, ainsi
que les fichiers .zip du fichier de formes Esri.
l Bases de données géographiques de fichiers Esri : le dossier doit contenir le fichier
.gdb ou .zip de la base de données géographiques du fichier.
l Fichiers KML : le dossier doit contenir le fichier .kml. (Aucun autre fichier n’est requis.)
l Fichiers GeoJSON : le dossier doit contenir le fichier .geojson (aucun autre fichier n’est
requis.)
l Fichiers TopoJSON : le dossier doit contenir le fichier .json ou .topojson. (Aucun autre
fichier n’est requis.)
Tableau Software 91
Aide de Tableau Prep
Si vous avez besoin de vous connecter à des sources de données ne figurant pas dans le volet
Connexions, vous pouvez vous connecter à n’importe quelle source de données avec le
connecteur Autres bases de données (ODBC) qui prend en charge la norme SQL et
92 Tableau Software
Aide de Tableau Prep
implémente l’API ODBC. La connexion aux données à l’aide du connecteur Autres bases de
données (ODBC) fonctionne comme dans Tableau Desktop, à quelques différences près :
l Vous ne pouvez vous connecter qu’avec l’option DSN (nom de la source de données).
l Pour publier et exécuter votre flux dans Tableau Server, le serveur doit être configuré avec
un DSN correspondant.
l Il existe une expérience de connexion unique à la fois pour Windows et MacOS. Les
invites liées aux attributs de connexion pour les pilotes ODBC (Windows) ne sont pas
prises en charge.
l Seuls les pilotes 64 bits sont pris en charge par Tableau Prep Builder.
Important : Tableau Prep Builder ne prend en charge que les pilotes 64 bits. Si vous avez déjà
installé et configuré un pilote 32 bits, vous devrez peut-être le désinstaller, puis installer la
version 64 bits si le pilote n’autorise pas l’installation simultanée des deux versions.
Si l’utilitaire n’est pas installé sur votre Mac, vous pouvez en télécharger un depuis
(www.odbcmanager.net par exemple) ou vous pouvez modifier manuellement le fichier
odbc.ini.
Tableau Software 93
Aide de Tableau Prep
Remarque : Tableau Prep Builder ne prenant pas en charge les invites liées aux
attributs de connexion, vous devez donc définir ces informations lors de la
configuration du DNS.
94 Tableau Software
Aide de Tableau Prep
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
3. Dans la boîte de dialogue Autres bases de données (ODBC), sélectionnez un DSN dans
la liste déroulante et entrez le nom d’utilisateur et le mot de passe. Cliquez ensuite sur
Connexion.
Tableau Software 95
Aide de Tableau Prep
4. Dans le volet Connexions, sélectionnez votre base de données dans la liste déroulante.
96 Tableau Software
Aide de Tableau Prep
Lorsque vous travaillez avec des fichiers Microsoft Excel, vous pouvez utiliser l’Interpréteur de
données pour détecter les sous-tables dans vos données et supprimer les informations
superflues afin de préparer vos données pour l’analyse. Lorsque vous activez l’Interpréteur de
données, il détecte ces sous-tables et les répertorie en tant que nouvelles tables dans la section
Tables du volet Connexions. Vous pouvez aussi les déposer dans le volet Flux.
Si vous désactivez l’Interpréteur de données, ces tables sont supprimées du volet Connexions.
Si ces tables sont déjà utilisées dans le flux, il en résulte des erreurs de flux provenant des
données manquantes.
L’exemple ci-dessous montre les résultats de l’utilisation de l’Interpréteur de données pour une
feuille de calcul Excel dans le volet Connexions. L’Interpréteur de données a détecté deux sous-
tables supplémentaires.
Tableau Software 97
Aide de Tableau Prep
4. Faites glisser la nouvelle table vers le volet Flux pour l’inclure dans votre flux. Pour
supprimer l’ancienne table, faites un clic droit sur l’étape des données entrantes pour
l’ancienne table, et sélectionnez Supprimer.
l Utiliser un connecteur créé par un partenaire. Pour plus d’informations sur les connec-
teurs dans Exchange, consultez la section Utiliser des connecteurs créés par des par-
tenaires sur la page en regard.
98 Tableau Software
Aide de Tableau Prep
l Utiliser un connecteur personnalisé créé avec le SDK Tableau Connector. Le SDK pour
connecteurs fournit des outils permettant de créer un connecteur personnalisé pour les
données basées sur ODBC ou JDBC. Pour plus d’informations, consultez Connecteurs
créés avec Tableau Connector SDK dans l’aide de Tableau Desktop.
Les connecteurs personnalisés pour les données basées sur ODBC et JDBC sont pris en charge
dans Tableau Prep Builder version 2020.4.1 et versions ultérieures.
Pour les développeurs de connecteurs, voir Exécuter votre connecteur pour plus d’informations.
Une fois le connecteur installé, il apparaît dans la section Vers un serveur du volet
Connexion.
Tableau Software 99
Aide de Tableau Prep
la publier depuis Tableau Prep Builder (version 2019.3.1 et supérieure) sur Tableau Server ou
Tableau Cloud, ou en tant que sortie de votre flux.
Vous pouvez utiliser une source de données publiée comme source de données d’entrée pour
votre flux, que vous travailliez dans Tableau Prep Builder ou sur le Web.
Remarque : lorsque vous publiez un flux qui inclut une source de données publiée en tant
qu’entrée, le publicateur est désigné comme propriétaire par défaut du flux. Lors de son
exécution, le flux utilise le propriétaire du flux pour le compte Exécuter en tant que. Pour
plus d’informations sur le compte Exécuter en tant que, consultez Compte Exécuter en
tant que service. Seul l’administrateur de site ou de serveur peut modifier le propriétaire
du flux dans Tableau Server ou Tableau Cloud, et uniquement pour lui-même.
l Les sources de données publiées qui incluent des fonctions ou des filtres utilisateur, à par-
tir de Tableau Prep Builder version 2021.1.3.
l Connexions à un seul serveur et site. La connexion à un serveur différent ou au même
serveur et à un site différent n’est pas prise en charge. Vous devez utiliser la connexion à
un même serveur ou site pour effectuer les opérations suivantes :
l Connexion à la source de données publiée.
Si votre flux utilise des sources de données publiées et que vous vous déconnectez du
serveur, la connexion au flux est interrompue. Le flux sera dans un état d’erreur et vous
ne pourrez pas voir les données de la source de données publiée dans le volet Profil ou la
grille de données.
Remarque : Tableau Prep Builder ne prend pas en charge les sources de données
publiées qui incluent des données multidimensionnelles (cube), des connexions multi-
serveurs ou des sources de données publiées avec des tables associées.
l Les sources de données publiées avec des fonctions ou des filtres utilisateur, à partir de
Tableau Server et Tableau Cloud version 2021.2.
l La création ou la modification d’un flux sur le Web à l’aide d’une source de données
publiée (Tableau Server ou Tableau Cloud version 2020.4 et versions ultérieures)
l La connexion aux sources de données publiées (Tableau Server et Tableau Cloud version
2019.3 et versions ultérieures)
l Dans la création Web Prep (Tableau Server et Tableau Cloud), l’accès aux sources de
données est également autorisé en fonction de l’identité de l’utilisateur connecté au
serveur. Vous ne verrez que les données auxquelles vous avez accès.
Pour plus d’informations sur Tableau Catalog, consultez « À propos de Tableau Catalog » dans
l’aide de Tableau Server ou Tableau Cloud.
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
Dans la création Web, la boîte de dialogue Rechercher des données s’ouvre pour le
serveur auquel vous êtes connecté.
4. Dans la boîte de dialogue Rechercher des données, effectuez une recherche dans la
liste des sources de données publiées disponibles. Utilisez l’option de filtre pour filtrer par
type de connexion et sources de données certifiées.
Si vous n’êtes pas autorisé à vous connecter à une source de données, la ligne et le
bouton Connexion s’affichent en grisé.
6. Le source de données est ajoutée au volet Flux. Dans le volet Connexions, vous pouvez
sélectionner d’autres sources de données ou utiliser l’option de recherche pour trouver
votre source de données et la faire glisser vers le volet Flux afin de créer votre flux.
L’onglet Tableau Server dans le volet Entrée affiche des détails sur la source de données
publiée.
7. (Facultatif) Si vous avez activé le module Data Management avec Tableau Catalog,
utilisez la liste déroulante Type de contenu pour rechercher des bases de données et
des tables.
Vous pouvez utiliser l’option de filtre dans le coin supérieur droit pour filtrer vos résultats
par type de connexion, avertissements sur la qualité des données et certifications.
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
4. Sélectionnez votre source de données ou utilisez l’option de recherche pour trouver votre
source de données et faites-la glisser vers le volet de flux pour démarrer votre flux.
L’onglet Tableau Server dans le volet Entrée affiche des détails sur la source de
données publiée.
Vous pouvez vous connecter aux données en utilisant des connexions virtuelles pour vos flux.
Les connexions virtuelles sont une ressource partageable qui fournit un point d’accès central aux
données.
l Les paramètres ne sont pas pris en charge. Pour plus d’informations sur l’utilisation des
paramètres dans votre flux, consultez Créer et utiliser des paramètres dans les flux
sur la page 225.
Pour plus d’informations sur les connexions virtuelles et les stratégies de données, consultez
Tableau Server ou Tableau Cloud.
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
Dans la création Web, la boîte de dialogue Rechercher des données s’ouvre pour le
serveur auquel vous êtes connecté.
7. Le source de données est ajoutée au volet Flux. Dans le volet Connexions, vous pouvez
faire votre sélection dans la liste des tables incluses dans la connexion virtuelle et les faire
glisser vers le volet Flux pour commencer votre flux.
Remarque : si vous voyez des opérations Renommer dans le volet Modifications lors
de la connexion à une connexion virtuelle, ne les supprimez pas. Tableau Prep génère
automatiquement ces opérations pour lesquels créer un mappage et afficher le nom
convivial du champ.
Pour plus d’informations sur l’enregistrement et l’utilisation d’extraits avec Tableau Prep Builder,
consultez Enregistrer et partager votre travail sur la page 429.
Pour plus d’informations sur Tableau Catalog, consultez « À propos de Tableau Catalog » dans
l’aide de Tableau Server ou Tableau Cloud.
1. Connectez-vous à votre source de données et, dans le volet Connexions du champ Base
de données, sélectionnez une base de données.
2. Cliquez sur le lien SQL personnalisé pour ouvrir l’onglet SQL personnalisé.
3. Saisissez ou collez la requête dans la zone de texte, puis cliquez sur Exécuter pour
exécuter votre requête.
4. Ajoutez une étape de nettoyage dans le volet Flux de manière à ce que seuls les champs
pertinents de la requête SQL personnalisée soient ajoutés à votre flux.
Vous pouvez spécifier une commande SQL initiale qui s’exécutera lors de la connexion à la base
de données qui la prend en charge. Par exemple, lorsque vous vous connectez à Amazon
Redshift, vous pouvez entrer une instruction SQL pour appliquer un filtre lors de la connexion à la
base de données de la même manière que vous ajoutez des filtres à l’étape des données
entrantes. La commande SQL s’appliquera avant que les données soient échantillonnées et
chargées dans Tableau Prep.
Depuis Tableau Prep Builder (version 2020.1.3) et sur le Web, vous pouvez également inclure
des paramètres pour transmettre les données de nom d’application, de version et de nom du
flux et ainsi inclure des données de suivi lorsque vous interrogez votre source de données.
l Modifiez la commande SQL initiale et actualisez l’étape des données entrantes en pro-
cédant à une nouvelle connexion.
l Exécutez le flux. La commande SQL initiale est exécutée avant le traitement de toutes les
données.
l Exécutez le flux sur Tableau Server ou Tableau Cloud. La commande SQL initiale est exé-
cutée à chaque fois que le flux est exécuté dans le cadre du chargement des données
Remarque : le module Data Management est nécessaire pour exécuter votre flux sur
Tableau Server ou Tableau Cloud. Pour plus d’informations sur Data Management,
consultez À propos de Data Management.
Vous pouvez transmettre les paramètres suivants à votre source de données pour ajouter des
détails supplémentaires concernant votre application Tableau Prep, la version et le nom du flux.
Les paramètres TableauServerUser et TableauServerUserFull ne sont pas pris en charge
actuellement.
sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server et
Tableau Cloud.
Pour déterminer la proportion de votre ensemble de données à utiliser dans le flux, vous pouvez
configurer votre ensemble de données. Lorsque vous vous connectez à vos données ou que
vous faites glisser des tables vers le volet Flux, une étape des données entrantes est
automatiquement ajoutée au flux.
Dans l’étape des données entrantes, vous déterminez quelles données et combien de données
inclure dans votre flux. Il s’agit toujours de la première étape de votre flux.
Si vous êtes connecté à un fichier Excel ou texte, vous pouvez également actualiser les
données de l’étape des données entrantes. Pour plus d’informations, consultez Ajouter des
données supplémentaires à l’étape des données entrantes sur la page 141.
l Faire un clic droit (ou Cmd-clic sur MacOS) dans l’étape des données entrantes sur le
volet Flux pour la renommer ou la supprimer.
l Réunir plusieurs fichiers dans le même répertoire parent ou enfant. Pour plus
d’informations, consultez Réunir des fichiers et des tables de base de données dans
l’étape des données entrantes sur la page 145.
l (à partir de la version 2023.1) Incluez les numéros de ligne générés automatiquement en
fonction de l’ordre de tri d’origine de votre ensemble de données. Consultez Inclure les
numéros de ligne de votre ensemble de données sur la page en regard.
l Rechercher des champs.
l Voir un aperçu des valeurs de champ.
l Configurer les propriétés du champ en modifiant le nom du champ ou configurer les para-
mètres de texte pour les fichiers texte.
l Configurez l’échantillon de données ingéré dans votre flux. Consultez Définir la taille de
votre échantillon de données sur la page 135.
l Supprimez les champs dont vous n’avez pas besoin. Vous pouvez toujours revenir à
l’étape des données entrantes et les inclure ultérieurement.
l Hide fields that you don’t need to clean, but still want to include in your flow output. Vous
pouvez les afficher à tout moment si nécessaire.
Remarque : cette option n’est actuellement pas prise en charge pour les fichiers inclus
dans une union d’entrée.
Depuis la version 2023.1, Tableau Prep génère automatiquement des numéros de ligne en
fonction de l’ordre de tri d’origine de vos données que vous pouvez inclure en tant que nouveau
champ dans votre flux. Cette fonctionnalité est disponible uniquement pour les types de fichiers
Microsoft Excel ou texte (.csv).
Dans les versions précédentes, si vous vouliez inclure ces numéros de ligne, vous deviez les
ajouter manuellement à la source avant d’ajouter l’ensemble de données à votre flux.
Ce champ est généré à l’étape des données entrantes lorsque vous vous connectez à vos
données. Par défaut, il est exclu du flux, mais vous pouvez l’inclure en un clic. Si vous choisissez
de l’inclure, il se comporte comme n’importe quel autre champ et peut être utilisé dans vos
opérations de flux et vos champs calculés.
Tableau Prep prend également en charge la fonction ROW_NUMBER pour les champs calculés.
Cette fonction est utile lorsque votre ensemble de données contient des champs qui peuvent
définir le tri, tels que l’ID de ligne ou l’horodatage. Pour plus d’informations sur l’utilisation de
cette fonction, consultez Créer des calculs de niveau de détail, de classement et de section
sur la page 321.
La liste des modifications est supprimée, le champ fait désormais partie des données de
flux et vous pouvez voir les numéros de ligne générés dans les étapes de flux suivantes.
l Vous pouvez modifier le type de données du champ dans les étapes suivantes.
l Vous pouvez utiliser ce champ dans les opérations de flux et les calculs.
l Cette valeur est générée de nouveau pour l’intégralité de l’ensemble de données chaque
fois que les données d’entrée sont actualisées ou que le flux est exécuté.
l Ce champ n’est pas disponible pour les unions d’entrée.
Vous pouvez définir une ligne spécifique comme ligne d’en-tête de champ et identifier la ligne de
début des données pour les fichiers Excel et texte (.csv).
Lors de la connexion à des fichiers Excel ou texte, il arrive souvent que les fichiers texte soient
formatés avec des méta-informations dans les premières lignes afin de les rendre lisibles par un
utilisateur humain. Par défaut, Tableau Prep interprète les premières lignes des fichiers CSV
comme étant la ligne d’en-tête de champ. Les fichiers Excel sont interprétés en fonction des
types de champs et des lignes vides. Tableau Prep peut sélectionner une ligne comme en-tête
ou ne pas inclure de ligne d’en-tête.
Par exemple, dans les fichiers suivants, STORE DETAILS est interprété comme la ligne d’en-
tête.
Vous pouvez exclure les informations de métadonnées (1) et fournir la structure de schéma
correcte de vos données en définissant la ligne 3 comme en-tête (2) et la ligne 4 comme ligne de
début des données.
Fichiers CSV :
Fichiers Excel :
Par exemple, l’exemple suivant montre les paramètres par défaut pour l’en-tête de ligne et la
ligne de début :
Remarque : l’aperçu des données ne reflète pas les modifications apportées aux
paramètres des échantillons de données.
Vous pouvez définir la ligne de début des données sur n’importe quelle valeur supérieure à la
valeur de la ligne d’en-tête. Par défaut, Tableau Prep définit la ligne de début des données sur le
numéro consécutif suivant la ligne d’en-tête. Toutes les lignes situées entre la ligne d’en-tête et la
ligne de début des données sont ignorées.
Le menu Options d’en-tête affiche la ligne d’en-tête et le numéro de la ligne de début des
données. Vous pouvez éventuellement définir l’en-tête et la première ligne directement
dans la boîte de dialogue Options d’en-tête.
Toutes les lignes situées entre la ligne d’en-tête et la ligne de début des données sont
ignorées.
Vous pouvez réunir plusieurs tables à partir de sources de données ayant la même structure de
schéma et la même ligne de métadonnées.
6. Cliquez sur Appliquer pour réunir les fichiers et conserver la sélection d’en-tête et de ligne
pour tous les fichiers de l’union des données entrantes. Cela suppose que la structure des
fichiers et le schéma des fichiers de données entrantes sont identiques.
Pour plus d’informations sur l’utilisation de SQL personnalisé, consultez Utiliser SQL
personnalisé pour la connexion aux données sur la page 111.
l Masquer le champ : masquez les champs plutôt que de les supprimer afin de réduire
l’encombrement de votre flux. Vous pourrez toujours les afficher de nouveau si néces-
saire. Les champs masqués sont toujours inclus lorsque vous exécutez votre flux.
l Filtre : utilisez l’éditeur de calcul pour filtrer les valeurs. Depuis la version 2023.1, vous
pouvez également utiliser la boîte de dialogue Filtre de dates relatives pour spécifier
rapidement des plages de dates applicables à tout champ de date ou de date/heure.
l Renommer un champ : dans le champ Nom du champ, double-cliquez (Ctrl+clic sur
MacOS) sur le nom du champ et entrez un nouveau nom de champ.
l Modifier le type de données : cliquez sur le type de données du champ et sélectionnez
un nouveau type de données dans le menu. Cette option est actuellement prise en
charge pour les fichiers Microsoft Excel, les fichiers texte et PDF, les sources de données
Box, Dropbox, Google Drive et OneDrive. Toutes les autres sources de données peuvent
être modifiées dans une étape de nettoyage.
Remarque : depuis la version 2023.1, vous pouvez sélectionner plusieurs champs pour
les masquer, les afficher, les supprimer ou les inclure. Dans les versions précédentes,
vous pouviez utiliser un champ à la fois et cocher ou décocher les cases afin d’inclure ou
de supprimer des champs.
Le volet Entrée affiche une liste des champs de votre ensemble de données. Par défaut, tous
les champs sont inclus sauf le champ généré automatiquement, Numéro de ligne source.
Utilisez la vue Aperçu des données ou Liste pour gérer vos champs.
l
Dans la liste des champs, cliquez sur l’icône d’œil ou sélectionnez Masquer les
Options supplémentaires .
Les champs sont traités par le flux pendant l’exécution. Vous pouvez également afficher
les champs à tout moment si nécessaire. Pour plus d’informations, consultez Masquer des
champs.
l Inclure les champs: ajoutez à votre flux des champs qui ont été marqués comme sup-
primés.
l Dans la liste des champs, sélectionnez une ou plusieurs lignes et faites un clic droit
Dans l’étape des données entrantes, vous pouvez appliquer des filtres à l’aide de l’éditeur de
calcul. Depuis la version 2023.1, vous pouvez également utiliser la boîte de dialogue Filtre de
dates relatives pour spécifier une plage de dates exacte de valeurs à inclure pour les types de
champs de date et de date/heure. Pour plus d’informations, consultez « Filtre de dates
relatives » dans Filtrer vos données sur la page 194.
Vous pouvez utiliser d’autres options de filtre dans l’étape de nettoyage ou d’autres types
d’étapes. Pour plus d’informations, consultez Filtrer vos données sur la page 194.
1. Dans la barre d’outils, cliquez sur Filtrer les valeurs. Utilisez l’une des méthodes
suivantes pour filtrer vos données :
l
Dans la liste des champs, cliquez sur le menu Options supplémentaires à
partir du nom du champ et sélectionnez Filtre > Calcul….
l
Dans l’aperçu des données, cliquez sur le menu Options supplémentaires à
1. Sélectionnez un champ avec un type de données Date ou Date et heure, puis utilisez l’une
des méthodes suivantes pour appliquer un filtre de dates relatives.
l Dans la liste des champs, faites un clic droit (ou Cmd-clic sous MacOS) ou cliquez
2. Dans la boîte de dialogue Filtre de dates relatives, spécifiez la plage exacte d’années, de
trimestres, de mois, de semaines ou de jours que vous voulez inclure dans votre flux.
Vous pouvez également configurer un ancrage relatif à une date spécifique et inclure les
valeurs null.
Remarque : par défaut, le filtre fonctionne par rapport à la date à laquelle le flux est
exécuté ou prévisualisé dans l’expérience de création.
Une annotation est ajoutée à la grille de champs et dans le volet Flux à gauche de l’étape des
données entrantes. Vos modifications sont également enregistrées dans le volet Modifications.
l Dans la liste des champs, sélectionnez un champ dans la colonne Nom du champ et cli-
quez sur Renommer le champ. Entrez le nouveau nom du champ.
l Dans l’aperçu des données, sélectionnez un champ et cliquez sur Renommer le champ.
Entrez le nouveau nom du champ.
l Vue du champ :
Vous pouvez également modifier le type de données des champs dans d’autres types
d’étape du flux ou affecter des types de données pour vous aider à valider vos valeurs de
champ. Pour plus d’informations sur la modification de votre type de données ou
l’utilisation de types de données, voir Vérifier les types de données affectés à vos
données sur la page 181 et Utiliser les rôles des données pour valider vos données
sur la page 210.
Lorsque vous travaillez avec des fichiers texte ou Excel, vous pouvez corriger les types de
données qui ont été incorrectement induits avant que vous commenciez votre flux. Les types de
données peuvent toujours être modifiés par étapes consécutives dans le volet Profil après le
démarrage de votre flux.
l La première ligne contient l’en-tête (par défaut) : sélectionnez cette option pour utiliser
la première ligne comme étiquettes de champs.
l Qualificateur de texte : sélectionnez le caractère qui entoure les valeurs dans le fichier.
l Jeu de caractères : sélectionnez le jeu de caractères qui décrit le codage du fichier texte.
Tableau Prep détermine par défaut le nombre maximum de lignes requises pour explorer et
préparer efficacement les données pour un échantillon représentatif de votre ensemble de
données. D’après l’exemple d’algorithme de Tableau Prep, plus vos données d’entrée
contiennent de champs, plus le nombre de lignes autorisées est petit. Lorsque les données sont
échantillonnées, l’échantillon résultant peut inclure ou non toutes les lignes dont vous avez
besoin, selon la manière dont l’échantillon a été calculé et retourné. Par exemple, par défaut,
Tableau Prep utilise la méthode de sélection rapide pour échantillonner les données. Avec cette
méthode, les lignes supérieures sont chargées, et si votre ensemble de données est volumineux
et que les données sont structurées chronologiquement, vous verrez peut-être vos premières
données échantillonnées, mais pas une représentation complète de toutes les données. Si vous
ne voyez pas les données attendues, vous pouvez modifier les paramètres de l’échantillon de
données pour exécuter à nouveau la requête.
Lorsque vous créez ou modifiez des flux à l’aide de la création Web, le nombre maximum de
lignes qu’un utilisateur peut sélectionner lors de l’utilisation d’ensembles de données volumineux
est configuré par l’administrateur. Pour plus d’informations, consultez Échantillons de données et
limites de traitement dans l’aide de Tableau Server ou Tableau Cloud.
Après avoir supprimé les champs et les valeurs inutiles de l’ensemble de données, vous pouvez
modifier la quantité de données chargées pour l’échantillonnage ou la méthode
d’échantillonnage.
Pour valider vos données après le nettoyage et la mise en forme, exécutez le flux et affichez le
résultat dans Tableau Desktop.
Remarque : exécutez le flux complet plutôt que d’afficher un échantillon dans Tableau
Desktop pour pouvoir voir l’intégralité de vos données. Si vous voyez des valeurs
inattendues ou incorrectes qui ne figuraient pas dans l’échantillon, vous pouvez revenir
dans Tableau Prep pour résoudre ce problème.
3. Sélectionnez le nombre de lignes que vous souhaitez charger pour l’échantillonnage des
données. Le nombre de lignes que vous choisissez a un effet sur les performances.
l Automatique : (par défaut) charge les données rapidement et calcule auto-
l Spécifier : généralement utilisé pour charger un petit nombre de lignes afin que
vous puissiez comprendre la structure des données et réduire les temps de
chargement. Spécifiez un nombre de lignes inférieur à 1 million.
l Maximum : charge autant de données que possible pour une sélection de lignes
inférieure ou égale à 1 048 576. Assurez-vous de satisfaire aux Exigences de
hautes performances pour les ensembles de données volumineux.
Exemples
Ces exemples sont basés sur l’ensemble de données Indicateurs Mondiaux inclus dans
Tableau Prep. Le premier échantillon utilise l’option Automatique pour le nombre de
lignes et l’option Aléatoire pour la méthode d’échantillonnage ou le nombre de lignes à
renvoyer pour l’échantillonnage.
Une fois ces valeurs sélectionnées, 3 000 lignes sont sélectionnées au hasard et utilisées
pour représenter l’ensemble des données.
Après vous être connecté à vos sources de données et avoir démarré la création de votre flux,
vous voudrez peut-être actualiser vos connexions de données à mesure que de nouvelles
données sont introduites. Vous pouvez également lier ou réunir des ensembles de données à
l’étape des données entrantes pour optimiser le travail avec des sources de données plus
volumineuses.
l Dans le volet Flux, faites un clic droit sur l’étape des données entrantes que vous
souhaitez actualiser et sélectionnez Actualiser dans le menu.
l Dans le volet Flux sur le menu supérieur, cliquez sur le bouton Actualiser pour actualiser
toutes les étapes de données entrantes. Pour actualiser une seule étape de données
entrantes, cliquez sur la flèche déroulante à côté du bouton d’actualisation et
sélectionnez l’étape des données entrantes dans la liste.
Modifier la connexion
Utilisez cette option pour actualiser facilement vos informations d’identification ou remplacer la
source de données par le même type de source de données.
des données entrantes, mais cela peut avoir une incidence sur les performances. Pour
plus d’informations sur le paramétrage de la taille de votre échantillon de données, voir
Définir la taille de votre échantillon de données sur la page 135.
1. Dans le volet Connexions, cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS)
sur la source de données et sélectionnez Modifier.
1. Dans le volet Connexions , faites glisser la nouvelle table vers le volet Flux au-dessus de
l’étape d’entrée que vous souhaitez remplacer et déposez-la sur l’option Remplacer.
3. Faites glisser la table vers le volet Flux en haut de la seconde étape du flux où vous
souhaitez ajouter l’étape des données entrantes. Déposez-la sur l’option Ajouter pour la
reconnecter au flux.
Lorsque vous travaillez avec plusieurs fichiers ou tables de base de données depuis une source
de données unique, vous pouvez appliquer des filtres pour rechercher des fichiers ou utiliser la
recherche avec caractères génériques pour rechercher des tables, puis réunir les données de
manière à inclure toutes ces données de fichiers et de tables dans l’étape des données
entrantes. Pour pouvoir être réunis, les fichiers doivent être dans le même répertoire ou sous-
répertoire.
Remarque : cette option n’est pas disponible pour les extraits Tableau.
Les nouveaux fichiers qui sont ajoutés au même dossier correspondant aux critères de filtre sont
automatiquement inclus dans l’union la prochaine fois que vous ouvrez le flux ou que vous
l’exécutez depuis la ligne de commande.
Les fichiers de flux complets (.tflx) ne récupèrent pas automatiquement les nouveaux fichiers
étant donné que ceux-ci sont déjà compressés avec le flux. Pour inclure les nouveaux fichiers
pour les flux compressés, ouvrez le fichier de flux (.tfl) dans Tableau Prep Builder afin de
récupérer les nouveaux fichiers puis recompressez le flux de manière à inclure les nouvelles
données de fichiers.
Pour réunir des tables de bases de données, les tables doivent se trouver dans la même base de
données et la connexion à la base de données doit prendre en charge la recherche avec
caractères génériques. Les bases de données suivantes prennent en charge ce type d’union :
l Amazon Redshift
l MySQL
l Oracle
l PostgreSQL
Si vous ajoutez ou supprimez des fichiers ou des tables après avoir créé l’union, vous pouvez
actualiser l’étape des données entrantes de manière à mettre à jour votre flux avec les données
nouvelles ou modifiées.
Si vous avez besoin de réunir des données à partir de sources de données différentes, vous
pouvez le faire à l’aide de l’étape Union. Pour plus d’informations sur la création des étapes
Union, consultez Réunir vos données sur la page 411.
Si vous souhaitez modifier l’union par défaut, vous pouvez spécifier des critères de filtre
supplémentaires pour trouver les fichiers ou les feuilles à inclure dans l’union.
Filtres supplémentaires
Pris en charge dans Tableau Prep Builder version 2022.2.1 et versions ultérieures et pour les
flux publiés sur Tableau Cloud.
Remarque : si vous utilisez des filtres supplémentaires dans votre flux, la planification des
flux n’est actuellement disponible qu’à l’aide de Tableau Cloud . Vous pouvez exécuter le
flux manuellement dans Tableau Prep Builder ou via l’interface de ligne de commande.
Cette fonctionnalité n’est pas compatible avec Tableau Server version 2022.1 et versions
antérieures.
À partir de Tableau Prep Builder version 2022.2.1 et versions ultérieures, les options de filtrage
lors de la recherche de fichiers à réunir ont changé. Vous continuez à spécifier un répertoire et un
sous-répertoire dans lesquels effectuer la recherche, mais vous pouvez désormais définir
plusieurs filtres pour effectuer une recherche plus granulaire.
Ces options de filtrage s’appliquent aux types de fichiers Texte, Microsoft Excel et Statistiques.
Vous pouvez sélectionner plusieurs filtres. Chaque filtre est appliqué séparément, dans l’ordre
dans lequel vous les sélectionnez, de haut en bas. Les filtres ne peuvent actuellement pas être
déplacés une fois qu’ils ont été ajoutés, mais vous pouvez supprimer et ajouter des filtres selon
les besoins.
Filtre Description
Taille du Filtrez les fichiers en sélectionnant une Plage de tailles ou un Classé par
fichier taille.
Classé par taille : incluez ou excluez les N fichiers les plus grands ou les
plus petits.
Date de créa- Filtrez les fichiers en sélectionnant Plage de dates, Date relative ou
tion Classé par date.
Classé par date : incluez ou excluez les N fichiers les plus récents ou les
plus anciens.
Date de modi- Filtrez les fichiers en sélectionnant Plage de dates, Date relative ou
fication Classé par date.
Classé par date : incluez ou excluez les N fichiers les plus récents ou les
plus anciens.
1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur
Fichier texte pour les fichiers .csv, sur Microsoft Excel pour les fichiers Excel ou sur
Fichier de statistiques pour les fichiers de statistiques, puis sélectionnez un fichier à
ouvrir.
2. Dans le volet Entrée, sélectionnez l’onglet Tables, puis sélectionnez Réunir plusieurs
tables.
4. Cliquez sur Ajouter un filtre de fichiers et sélectionnez l’une des options suivantes :
l Nom du fichier : saisissez un modèle de nom à rechercher.
5. Cliquez à nouveau sur Ajouter un filtre de fichiers pour ajouter d’autres filtres.
Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à
l’ensemble de données dans le champ Chemins d’accès des fichiers dans le volet Profil. Ce
champ est ajouté automatiquement.
1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur Fichier
texte pour les fichiers .csv ou sur Microsoft Excel pour les fichiers Excel, puis
sélectionnez un fichier à ouvrir.
2. Dans le volet Entrée, sélectionnez l’onglet Plusieurs fichiers puis sélectionnez Union
avec caractères génériques.
L’exemple ci-dessous montre une union des données entrantes utilisant un modèle de
correspondance. Le signe plus sur l’icône du fichier dans l’étape des données entrantes
sur Orders_Central sur le volet Flux indique que cette étape inclut une union des données
entrantes. Les fichiers de l’union sont répertoriés sous Fichiers inclus.
Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à
l’ensemble de données dans le champ Chemins d’accès des fichiers dans le volet Profil. Ce
champ est ajouté automatiquement.
Remarque : l’interface d’union des données entrantes pour les tables de base de données
a été mise à jour dans Tableau Prep Builder version 2022.2.1. Vos options peuvent se
présenter de différentes manières selon votre version.
3. Dans le volet Entrée, sélectionnez l’onglet Tables, puis sélectionnez Réunir plusieurs
tables.
Dans les versions antérieures, sélectionnez l’onglet Tables multiples puis sélectionnez
Union avec caractères génériques.
4. Dans le champ Tables, sélectionnez Inclure ou Exclure dans la liste déroulante, puis
saisissez un modèle correspondant pour trouver les tables que vous souhaitez réunir.
Dans les versions précédentes, utilisez les options de recherche, de tables et de modèle
de correspondance.
Seules les tables qui s’affichent dans le volet Connexions dans la section Tables
peuvent être incluses dans l’union. La recherche pour l’union des données entrantes ne
peut pas effectuer de recherche dans des schémas ou dans la connexion à des bases de
données pour trouver des tables.
Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir toutes les tables
ajoutées à l’ensemble de données dans le champ Noms des tables du volet Profil. Ce
champ est ajouté automatiquement.
Une nouvelle colonne appelée Clés liées apparaît dans le volet Entrée et affiche les relations
suivantes, le cas échéant :
l
Identificateur unique. Ce champ identifie de manière unique chaque ligne du tableau.
Une table peut contenir plusieurs identificateurs uniques. Les valeurs des champs doivent
être uniques et ne peuvent pas être vides ou null.
l
Domaine connexe. Ce champ associe la table à une autre table dans la base de
données. Une table peut comporter plusieurs champs associées.
Vous pouvez utiliser ces relations pour trouver et ajouter rapidement les tables associées à
votre flux ou créer des jointures à partir de l’étape des données entrantes. Cette fonctionnalité
est disponible pour tous les connecteurs de base de données pris en charge dans lesquels des
relations entre tables sont définies.
1. Connectez-vous à une base de données (par exemple Microsoft SQL Server) qui contient
des données de relation pour des champs, par exemple des identificateurs uniques ou
des champs associés (clé étrangère).
2. Dans le volet Entrée, cliquez sur un champ marqué comme champ associé ou
3. Pointez sur la table que vous souhaitez ajouter ou lier, et cliquez sur le bouton Plus pour
ajouter la table à votre flux. Sinon, cliquez sur le bouton Lier pour créer une jointure avec
la table sélectionnée.
Si vous créez une jointure, Tableau Prep utilise la relation de champ définie pour lier les
tables et vous présente un aperçu des clauses de jointure qu’il utilisera pour créer la
jointure.
4. Vous pouvez également lier des tables associées à partir du menu du volet Flux. Cliquez
sur l’icône plus , puis sélectionnez Ajouter une jointure pour afficher la liste des tables
liées. Tableau Prep crée la jointure en fonction des champs qui constituent la relation entre
les deux tables.
Remarque : si aucune relation entre tables n’est définie pour votre table, cette
option n’est pas disponible.
Pour plus d’informations sur l’utilisation des jointures, consultez Lier vos données sur la page
404.
Après vous être connecté aux données que vous souhaitez inclure dans votre flux, vous pouvez
commencer le nettoyage et l’organisation de vos données en ajoutant de nouvelles étapes au
flux ou en insérant des étapes entre les étapes existantes.
Pour organiser votre flux, vous pouvez modifier les couleurs par défaut des étapes, ajouter des
descriptions afin de fournir le contexte de vos étapes ou de vos actions de nettoyage, ou
réorganiser la disposition de votre flux afin de faciliter le suivi des flux complexes.
À mesure que votre flux commence à prendre forme, vous devrez peut-être revenir aux étapes
précédentes de votre flux et insérer différents types d’étapes pour effectuer diverses actions,
par exemple ajouter une étape de nettoyage supplémentaire ou agréger vos données afin
d’utiliser le même niveau de détail qu’une étape ultérieure.
Remarque : les options de menu que vous verrez varient selon votre version de Tableau
Prep Builder et selon que vous choisissez d’ajouter une étape pour créer l’étape suivante
du flux ou d’insérer une étape entre les étapes existantes. Si vous utilisez Tableau Prep
Builder version 2019.3.1 ou une version antérieure, reportez-vous à cette section pour
voir vos options de menu.
Vous ne pouvez pas ajouter des étapes de données entrantes à l’aide de ces menus. Pour cela,
vous devez faire glisser les tables du volet Connexions vers le volet Flux. Pour plus
d’informations, consultez Se connecter aux données sur la page 81.
cliquez sur le bouton plus pour sélectionner un type d’étape dans le menu. Sinon, cliquez
sur l’étape de nettoyage suggérée (Tableau Prep Builder version 2020.3.3 et ultérieure) pour
ajouter automatiquement une étape de nettoyage à votre flux.
l Étape de étape : ajoutez une étape de nettoyage pour effectuer diverses actions de
nettoyage. Pour plus d’informations sur les diverses actions de nettoyage disponibles,
consultez Nettoyer et organiser les données sur la page 249.
Remarque : dans la version Tableau Prep Builder 2019.4.2, l’option Ajouter une
branche a été remplacée par l’option Étape de nettoyage. Pour scinder votre flux
l Nouvelles lignes : générez de nouvelles lignes pour combler les lacunes de votre
ensemble de données séquentielles. Pour plus d’informations, consultez Combler les
lacunes dans les données séquentielles sur la page 317.
Agréger : créez une étape d’agrégation pour sélectionner les champs et modifier leur
niveau de détail. Pour plus d’informations, consultez Agréger et regrouper les données
sur la page 403.
l Jointure : créez une étape de jointure pour combiner les tables de données. Lorsque
vous créez une jointure depuis l’option de menu, vous pouvez ajouter manuellement
l’autre entrée à la jointure et ajouter vos clauses de jointure. Vous pouvez sinon faire
glisser une étape et la déposer (comme ci-dessous) pour lier les fichiers
automatiquement. Pour plus d’informations sur la création d’une jointure, consultez Lier
vos données sur la page 404.
Si vous vous connectez à des bases de données qui incluent des tables avec des
données relationnelles, vous pouvez également créer une jointure à partir du menu dans
le volet Flux. Pour savoir comment lier des tables à l’aide de cette méthode, consultez
Lier des données dans l’étape des données entrantes sur la page 157.
l Union : créez une étape d’union. Ajoutez des tables à l’union en les faisant glisser jusqu’à
l’étape et en les déposant sur l’option Ajouter qui s’affiche. Vous pouvez sinon faire
glisser et déposer une étape sur une autre étape pour réunir des fichiers. Pour plus
d’informations sur la création d’une union, consultez Réunir vos données sur la page
411.
l Script (Tableau Prep Builder à partir de la version 2019.3.1 et sur le Web) : créez une
étape de script pour inclure des scripts R et Python dans votre flux. Les étapes de script ne
sont actuellement pas prises en charge dans Tableau Cloud. Pour plus d’informations,
consultez Utiliser des scripts R et Python dans votre flux sur la page 385.
l Prédiction : utilisez des modèles optimisés par Einstein Discovery pour réaliser des pré-
dictions de score en bloc pour les données de votre flux. Pour plus d’informations, consul-
tez Ajouter des prédictions Einstein Discovery à votre flux sur la page 418.
l Sortie : créez une étape de sortie pour enregistrer la sortie dans un fichier d’extrait
(.hyper), un fichier .csv, publier la sortie en tant que source de données sur un serveur ou
écrire votre sortie de flux dans une base de données.
L’enregistrement des étapes de sortie vers un fichier n’est pas actuellement pris en charge
sur le Web. Pour plus d’informations sur les types de sortie, consultez Enregistrer et
partager votre travail sur la page 429.
l Coller : ajoutez les étapes copiées depuis le même flux. Pour plus d’informations sur le
copier-coller d’étapes dans le même flux, consultez Nettoyer et organiser les données
sur la page 249.
l Insérer un flux (Tableau Prep Builder à partir de la version 2019.3.2 et sur le Web) :
ajoutez dans votre flux actuel des étapes de flux qui ont été enregistrées à partir d’un autre
flux. Vous pouvez les ajouter à la fin d’une étape ou les insérer entre des étapes
existantes. Pour plus d’informations sur l’utilisation des étapes de flux enregistrées dans
votre flux, consultez Créer des étapes de flux réutilisables sur la page 314.
Remarque : cette option a été ajoutée à ce menu dans Tableau Prep Builder
version 2019.4.2. Dans les versions précédentes, vous pouviez ajouter des étapes
de flux en utilisant le clic droit ou Ctrl-clic (MacOS) dans l’espace blanc du volet
Flux.
utilisez une version antérieure de Tableau Prep Builder, reportez-vous à la section Version
2019.3.1 et versions antérieures ci-dessous.
1. Placez le curseur au milieu de la ligne de flux là où vous souhaitez insérer une étape
jusqu’à ce que l’icône plus apparaisse. Cliquez ensuite sur l’icône et sélectionnez un
type d’étape.
Remarque : vos options peuvent être différentes selon la version de votre produit.
Par exemple, l’option Insérer un flux a été ajoutée à ce menu dans Tableau Prep
Builder version 2019.4.2.
l Agréger : insérez une étape d’agrégation pour sélectionner des champs existants
et modifier leur niveau de détail. Pour plus d’informations, consultez Agréger et
regrouper les données sur la page 403.
l Jointure : insérez une étape Jointure entre des étapes existantes. Lorsque vous
créez une jointure depuis l’option de menu, vous pouvez ajouter manuellement
l’autre entrée à la jointure et ajouter vos clauses de jointure. Vous pouvez sinon
faire glisser une étape et la déposer (comme ci-dessous) pour lier les fichiers
automatiquement.
Pour plus d’informations sur la création d’une jointure, consultez Lier vos données
sur la page 404.
Si vous vous connectez à des bases de données qui incluent des tables avec des
données relationnelles vous pouvez également créer une jointure à partir du menu
dans le volet Flux. Pour savoir comment lier des tables à l’aide de cette méthode,
consultez Lier des données dans l’étape des données entrantes sur la page
157.
l Union : Insérez une étape Union. Ajoutez des tables à l’union en les faisant glisser
jusqu’à l’étape et en les déposant sur l’option Ajouter qui s’affiche. Vous pouvez
sinon faire glisser et déposer une étape sur une autre étape pour réunir des fichiers.
Pour plus d’informations sur la création d’une union, consultez Réunir vos
données sur la page 411.
l Script (Tableau Prep Builder à partir de la version 2019.3.1 et sur le Web) : insérez
une étape de script pour inclure des scripts R et Python dans votre flux. Les étapes
de script ne sont actuellement pas prises en charge dans Tableau Cloud. Pour plus
d’informations, consultez Utiliser des scripts R et Python dans votre flux sur la
page 385.
l Prédiction : utilisez des modèles optimisés par Einstein Discovery pour réaliser
des prédictions de score en bloc pour les données de votre flux. Pour plus
d’informations, consultez Ajouter des prédictions Einstein Discovery à votre
flux sur la page 418.
l Coller : insérez des étapes copiées à partir du même flux entre les étapes exis-
tantes. Pour plus d’informations sur le copier-coller d’étapes dans le même flux,
consultez Nettoyer et organiser les données sur la page 249.
Remarque : cette option a été ajoutée à ce menu dans Tableau Prep Builder
version 2019.4.2. Dans les versions précédentes, vous pouviez insérer des
étapes de flux en utilisant le clic droit ou Ctrl-clic (MacOS) dans l’espace
blanc du volet Flux.
1. Survolez une étape jusqu’à ce que l’icône plus apparaisse, puis cliquez sur l’icône et
sélectionnez un type d’étape. Insérer une étape insère une étape de nettoyage entre les
étapes. Toutes les autres options créent une branche à partir du flux.
l Insérer une étape : Insérez une étape de nettoyage entre les étapes existantes
pour effectuer diverses actions de nettoyage. Pour plus d’informations sur les
diverses actions de nettoyage que vous pouvez utiliser, consultez Nettoyer et
organiser les données sur la page 249.
l Ajouter une jointure : Créez une étape Lier où vous pouvez ajouter manuellement
l’autre entrée à la jointure et ajouter les clauses de jointure. Vous pouvez sinon faire
glisser et déposer une étape pour lier des fichiers. Dans l’exemple suivant, nous
faisons glisser l’étape des données entrantes Orders_Central et nous la déposons
sur Lier :
Pour plus d’informations sur la création d’une jointure, consultez Lier vos
données sur la page 404.
Dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, si vous vous
connectez à des bases de données qui incluent des tables contenant des données
de relation, vous pouvez également créer une jointure à partir du menu du volet
Flux. Pour savoir comment lier des tables à l’aide de cette méthode, consultez Lier
des données dans l’étape des données entrantes sur la page 157.
l Ajouter une union : Créez une étape Union. Ajoutez des tables à l’union en les
faisant glisser jusqu’à l’étape et en les déposant sur l’option Ajouter qui s’affiche.
Vous pouvez sinon faire glisser et déposer une étape sur une autre étape pour
réunir des fichiers. Pour plus d’informations sur la création d’une union, consultez
Réunir vos données sur la page 411.
l Ajouter un script (version 2019.3.1 et ultérieur) : Créez une étape de script pour
inclure des scripts R et Python dans votre flux. Pour plus d’informations, consultez
Utiliser des scripts R et Python dans votre flux sur la page 385.
l Ajouter une sortie : sélectionnez cette option pour enregistrer la sortie dans un
fichier d’extrait (.hyper) ou un fichier .csv, ou pour publier la sortie en tant que
source de données sur un serveur.
Vous pouvez utiliser l’option Regrouper pour compartimenter des sections de flux volumineux
complexes dans des dossiers afin de faciliter le suivi, la résolution des problèmes ou le partage
de votre flux avec d’autres personnes. Vous pouvez modifier la couleur du groupe, ajouter une
description, copier et coller les étapes regroupées dans d’autres zones de votre flux, ou même,
dans Tableau Prep Builder, enregistrer les étapes regroupées dans un fichier sur votre serveur
afin de les réutiliser dans d’autres flux.
Créer un groupe
Sélectionnez un ensemble d’étapes connectées dans votre flux (vous pouvez également faire
glisser des étapes pour sélectionner plusieurs étapes en un seul clic), puis faites un clic droit ou
Cmd-clic (MacOS) sur les étapes sélectionnées et sélectionnez Regrouper dans le menu.
Après avoir créé le groupe, vous pouvez effectuer l’une des opérations suivantes :
Cliquez sur les flèches doubles pour développer ou réduire le groupe à tout
moment.
l Ajoutez d’autres étapes au groupe en faisant glisser une étape connectée et en la dépo-
sant sur le dossier réduit.
l Supprimez des étapes du groupe. Dans l’état développé, faites un clic droit ou Cntrl-clic
(Mac OS) sur une étape et sélectionnez Supprimer du groupe.
Remarque : cette option n’est pas disponible si vous essayez de supprimer une
étape qui brise la continuité du groupe.
l Dans l’état réduit, faites un clic droit ou Cntrl-clic (MacOS) pour ouvrir le menu et faites
votre choix parmi les options suivantes :
ou publiez-le sur Tableau Server ou Tableau Cloud pour le partager avec d’autres
personnes ou l’utiliser dans d’autres flux. Pour plus d’informations sur
l’enregistrement des étapes pour pouvoir les réutiliser, consultez Créer des étapes
de flux réutilisables sur la page 314.
l Supprimer : supprime le groupe et toutes les étapes du groupe du flux.
l (version 2021.1.2 et versions ultérieures) Dans l’état développé, faites un clic droit ou
Cntrl-clic (MacOS) dans la zone de groupe développée afin d’ouvrir le menu de réduction
du groupe ou de dégroupage des étapes.
Pour sélectionner un thème de couleur différent pour vos étapes, procédez comme suit :
2. Faites un clic droit ou Ctrl-clic (MacOS) sur une étape sélectionnée et sélectionnez
Modifier la couleur.
Pour réinitialiser la couleur de l’étape à la couleur par défaut, procédez comme suit :
l Sélectionnez les étapes que vous avez modifiées, faites un clic droit sur une étape
sélectionnée et sélectionnez Modifier la couleur, puis sélectionnez Réinitialiser la
couleur au bas de la palette de couleurs.
Remarque : vous ne pouvez pas supprimer les lignes de flux qui entrent dans un groupe
d’étapes réduit ou en sortent. Vous devez soit développer le groupe, soit dégrouper les
étapes en premier.
l Pour supprimer une étape ou une ligne de flux, sélectionnez l’étape ou la ligne à
supprimer, faites un clic droit sur l’élément, puis sélectionnez Supprimer.
l Pour supprimer plusieurs étapes ou lignes de flux, effectuez l’une des opérations
suivantes :
l Utilisez votre souris pour faire glisser et sélectionner une section entière du flux.
Ensuite, faites un clic droit (ou Ctrl+clic sur MacOS) sur l’une des étapes
sélectionnées, puis sélectionnez Supprimer.
l Appuyez sur Ctrl+A ou Cmd+A (MacOS) pour sélectionner tous les éléments du
flux, ou appuyez sur Ctrl+clic ou Cmd+clic (MacOS) pour sélectionner des éléments
spécifiques, puis appuyez sur la touche Suppr.
Pour plus d’informations sur l’affichage de vos modifications dans le volet Modifications,
consultez Afficher vos modifications sur la page 264.
Lorsque vous ajoutez une description, une icône de message est ajoutée sous l’étape.
Cliquez sur l’icône pour afficher ou masquer le texte de la description dans le volet Flux.
l Double-cliquez sur le champ de nom dans l’étape, puis cliquez sur Ajouter une
description.
4. Cliquez en-dehors de la zone de texte ou appuyez sur Entrée pour appliquer vos
modifications. Par défaut, la description s’affiche sous l’étape. Pour masquer la
5. Pour modifier ou supprimer la description, faites un clic droit (ou Ctrl+clic sur MacOS) sur
l’étape ou la description. Ensuite, à partir du menu, sélectionnez Modifier la description
ou Supprimer la description.
3. Faites un clic droit ou Ctrl-clic (MacOS) sur une entrée dans le volet Modifications et
sélectionnez Ajouter une description.
La description apparaît sous le texte généré pour la modification avec une icône de
commentaire .
5. Pour modifier ou supprimer la description, faites un clic droit (ou Ctrl+clic sur MacOS) sur
l’élément à modifier, puis sélectionnez Modifier la description ou Supprimer la des-
cription.
Lorsque vous créez un flux, Tableau Prep Builder utilise une disposition par défaut. Chaque flux
organise et traite vos données de gauche à droite, avec les étapes des données entrantes
commençant à l’extrême gauche de l’espace de travail, et les étapes de sortie se terminant à
droite de cet espace. Cependant, si vous créez des flux importants et complexes, ils peuvent
rapidement devenir difficiles à suivre.
Vous pouvez nettoyer la disposition de votre flux en sélectionnant et en déplaçant des étapes
afin de l’organiser de manière logique pour vous. Par exemple, vous pouvez fixer des lignes de
flux croisées, déplacer des étapes de votre flux pour nettoyer l’espace blanc supplémentaire, ou
réorganiser les étapes de votre flux afin de montrer une séquence claire d’événements.
Pour nettoyer ce flux, sélectionnes et faites glisser les étapes vers le haut, le bas, la gauche ou
la droite, puis déposez-les à un nouvel emplacement dans l’espace de travail. Les étapes du
flux ne peuvent pas être déplacées dans une position qui perturbe le flux du processus de
gauche à droite. Par exemple, vous ne pouvez pas faire glisser une étape d’union positionnée
avant une étape de jointure vers une position qui se trouve après cette étape de jointure dans le
flux.
Lorsque vous faites glisser des étapes du flux vers un emplacement autorisé, une zone orange
s’affiche. Si l’emplacement n’est pas autorisé, aucune zone orange ne s’affiche et les étapes
reviennent à leur emplacement d’origine lorsque vous essayez de les déposer.
Pour déplacer des étapes dans votre flux, procédez comme suit :
1. Dans le volet Flux, sélectionnez les étapes que vous souhaitez déplacer. Vous pouvez
cliquer sur une étape spécifique, la faire glisser pour sélectionner plusieurs étapes, ou
faire un Ctrl-clic ou Cmd-clic (MacOS) pour sélectionner des étapes qui ne sont pas
adjacentes.
Cliquez dans n’importe quelle zone du graphique pour accéder à cette zone de votre flux ou
Option de la Description
barre d’outils
Effectuez un zoom avant ou arrière sur votre flux. Vous pouvez cliquer sur
l’indicateur de pourcentage pour rétablir la vue à 100 %.
Utilisez les options de cette rubrique pour bien appréhender la composition de vos données et
mieux comprendre les modifications que vous devez apporter, ainsi que l’effet des opérations
que vous incluez dans le flux.
Pour modifier un type de données, cliquez sur l’icône du type de données et sélectionnez le type
de données correct dans le menu contextuel. Vous pouvez modifier des types de données
« chaîne » ou « entier » en Date ou Date et heure, et Tableau Prep déclenchera la fonction Auto
DateParse (analyse automatique de date) pour modifier ces types de données. Comme Tableau
Desktop, si la modification échoue, vous voyez des valeurs null dans les champs à la place, et
vous pouvez créer un calcul pour effectuer la modification.
Pour plus d’informations sur l’utilisation de la fonction DateParse, consultez Convertir un champ
en un champ de date dans l’aide de Tableau Desktop et la création Web.
Vous pouvez modifier le type de données dans votre étape des données entrantes après vous
être connecté aux données à partir des sources de données suivantes :
l Microsoft Excel
l Fichiers texte
l Fichiers PDF
l Box
l Dropbox
l Google Drive
l OneDrive
Pour toutes les autres sources de données, ajoutez une étape de nettoyage ou un autre type
d’étape pour effectuer cette modification. Pour afficher la liste des options de nettoyage
disponibles dans les différents types d’étapes, consultez À propos des opérations de
nettoyage sur la page 249.
l Nombre de fichiers et de lignes : dans le coin supérieur gauche du volet Profil, vous
pouvez voir des informations qui résument le nombre de champs et de lignes dans les
données à un point particulier du flux. Tableau Prep arrondit au millier le plus proche. Dans
l’exemple ci-dessous, l’ensemble de données comporte 21 champs et 3000 lignes.
Lorsque vous survolez le nombre de champs et de lignes, vous pouvez voir le nombre
exact de lignes (dans cet exemple, 2848).
l Échantillonné : pour vous permettre d’interagir directement avec vos données, Tableau
Prep utilise un sous-ensemble de vos données brutes. Le nombre de lignes est déterminé
par les types de données et le nombre de champs rendus. Les champs de chaînes ont
plus d’espace de stockage que les entiers, donc si vous avez 10 champs de chaînes dans
votre ensemble de données, vous obtiendrez moins de lignes que si vous aviez 10
champs d’entiers.
Par exemple, les dates de commande et d’expédition sont résumées ou « classées » par année.
Chaque classe représente une année depuis janvier de l’année de début à janvier de l’année
suivante, et étiquetée en conséquence. Étant donné que certains dates de ventes et dates
d’expédition tombent dans la dernière partie de 2018 et 2019, une classe est créée pour l’année
suivante pour ces valeurs.
Lorsque vos données contiennent des champs numériques ou de date, vous pouvez basculer
sur une version détaillée (discrète) des valeurs ou une version résumée (continue) des valeurs.
La vue résumée affiche la plage des valeurs dans un champ et la fréquence avec laquelle
certaines valeurs apparaissent.
Ce basculement peut vous aider à isoler des valeurs uniques (comme le nombre
d’enregistrements « 3 » dans un champ) ou la distribution de valeurs (comme la somme de tous
les enregistrements « 3 » dans un champ)
1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le menu
2. Dans le menu contextuel, sélectionnez Détails pour voir une version détaillée des valeurs,
ou Résumé pour voir la version distribuée des valeurs.
Depuis la version 2021.1.1, lorsque vous recherchez des champs, un nouvel indicateur s’affiche
en vous indiquant le nombre de champs trouvés afin que vous puissiez mieux comprendre les
résultats de votre recherche. Si aucun champ n’est trouvé, des messages supplémentaires
s’affichent.
Pour rechercher des champs, entrez un terme de recherche complet ou partiel dans la zone de
recherche de la barre d’outils.
1. Cliquez sur l’icône Rechercher pour rechercher un champ et entrez une valeur.
2. Pour utiliser des options de recherche avancées, cliquez sur le bouton Options de
recherche ....
3. Pour utiliser les résultats de la recherche pour filtrer les données, sélectionnez Conserver
uniquement ou Exclure.
Dans le volet Flux, une icône de filtre apparaît au-dessus des étapes concernées.
2. Faites un clic droit ou Cmd-clic (MacOS) sur les valeurs de champ sélectionnées puis
sélectionnez Copier dans le menu. Vous pouvez également utiliser les raccourcis clavier
Ctrl+C ou cmd+C (MacOS) ou sélectionner Copier dans le menu ... de la barre d’outils.
Remarque : Édition > Copier ne copie pas actuellement les valeurs de champ de
la grille de données.
Vous pouvez utiliser les options de tri d’une fiche Profil pour trier les classes (le nombre de
valeurs représentées par les barres de distribution) dans l’ordre croissant ou décroissant ou les
valeurs de champs individuelles dans l’ordre alphabétique.
Grille de données
Triez les détails au niveau des lignes pour vos champs dans l’ordre croissant ou décroissant.
Vous pouvez modifier l’ordre des champs à partir du volet Profil, de la grille de données ou de la
liste en les faisant glisser et en les déposant dans une nouvelle position.
1. Dans le volet Profil, le volet Résultats, la grille de données ou la vue Liste, sélectionnez
un(e) ou plusieurs fiches ou champs de profil.
2. Faites glisser la fiche ou le champ de repère jusqu’à ce que la ligne de cible noire appa-
raisse.
3. Déposez la fiche ou le champ de profil en place.
Le volet Profil, la grille de données et la liste sont synchronisés afin que le champ appa-
raisse dans le même ordre aux deux emplacements. Le nouvel ordre des champs est per-
sistant dans tous les produits Tableau lors de l’exécution et de la planification des flux.
Cliquez sur un champ dans le volet Profil dans une étape de nettoyage, ou dans le volet
Résultats dans un autre type d’étape. Le volet Flux met en évidence le chemin où ce champ est
utilisé.
Remarque : cette option n’est pas disponible pour les types d’étapes de données
entrantes ou sortantes.
Par exemple, pour surligner les valeurs associées, dans le volet Profil, cliquez sur une valeur
dans un champ. Les valeurs associées dans un autre champ deviennent bleues et et la
proportion de la barre surlignée en bleu représente le degré d’association.
Tableau Prep fournit diverses options que vous pouvez utiliser pour filtrer vos données. Par
exemple, utilisez Conserver uniquement ou Exclure pour effectuer un filtrage en un clic sur
une valeur spécifique pour un champ d’une fiche Profil, d’une grille de données ou d’une fiche de
résultats, ou sélectionnez parmi diverses options de filtrage pour des besoins de filtrage plus
complexes. Vous pouvez également conserver ou supprimer des champs entiers.
Vous pouvez filtrer les données à toute étape du flux. Si vous souhaitez simplement modifier une
valeur spécifique, vous pouvez sélectionner Modifier la valeur pour modifier la valeur en ligne
ou remplacer la valeur par une valeur Null. Pour plus d’informations sur la modification des
valeurs de champ, voir Modifier des valeurs de champ sur la page 271.
Si votre flux comporte des champs qui n’ont pas besoin d’être nettoyés, mais que vous
souhaitez malgré tout les inclure dans votre flux, vous pouvez masquer les champs au lieu de
les supprimer. Les données de ces champs ne seront pas chargées tant que vous n’aurez pas
affiché les champs ou exécuté votre flux pour générer votre sortie.
Lorsque vous masquez des champs, une nouvelle fiche Profil appelée Champs masqués est
automatiquement ajoutée au volet Profil, ce qui vous permet d’afficher facilement les champs de
la liste lorsque vous en avez besoin.
Vous pouvez inclure des champs masqués dans la plupart des opérations, mais dans le cas des
jointures, des agrégations et des permutations, le champ doit être affiché pour être utilisé dans
l’un de ces types d’étape. Si vous masquez le champ après qu’il a été utilisé dans l’une de ces
opérations, le champ s’affichera comme masqué et l’opération ne sera pas affectée.
Tous les champs masqués sont signalés par une icône d’œil .
La sélection de plusieurs champs dans l’étape des données entrantes est prise en charge
à compter de la version 2023.1.
2. Cliquez avec le bouton droit, Ctrl-clic (MacOS), dans le menu Options supplémentaires
3. Une nouvelle fiche Profil est générée et affiche vos champs masqués.
4. Pour afficher les champs, dans la fiche Profil Champs masqués, sélectionnez un ou plu-
sieurs champs, puis cliquez sur l’icône d’œil , faites un clic droit ou Ctrl-clic (MacOS) et
sélectionnez Afficher les champs dans le menu.
Depuis la liste
1. Dans une étape de nettoyage, dans la barre d’outils, cliquez sur l’icône Liste pour pas-
ser à la liste.
2. Sélectionnez un ou plusieurs champs à masquer ou à afficher.
Date et Date et Calcul, plage de dates, date relative, valeurs nulles, valeurs sélec-
Heure tionnées
. Pour voir le menu sur la grille de données, vous devez d’abord cliquer sur le bouton Masquer
Filtre de calcul
Lorsque vous sélectionnez Calcul, la boîte de dialogue Ajouter un filtre s’ouvre. Entrez le
calcul, vérifiez qu’il est valide et cliquez sur Enregistrer. Depuis la version 2021.4.1, vous
pouvez également inclure des paramètres dans les filtres de calcul. Pour plus d’informations,
consultez Appliquer des paramètres utilisateur aux calculs de filtre sur la page 241.
Remarque : dans l’étape des données entrantes, c’est le seul type de filtre disponible.
Tous les autres types de filtres sont disponibles dans les fiches Profil, la grille de données
ou le volet de résultats.
valeur pour ajouter des valeurs qui sont dans votre ensemble de données mais qui ne sont
pas incluses dans votre échantillon. Cliquez sur Terminé pour appliquer votre filtre.
Remarque : ce filtre n’est pas disponible pour les types d’étape Agrégation ou
Permutation.
Les résultats filtrés s’affichent dans le volet gauche de l’éditeur de filtre afin que vous puissiez les
consulter et expérimenter avec les résultats. Une fois que vous avez obtenu les résultats
souhaités, cliquez sur Terminé pour appliquer votre modification.
Les données en double peuvent avoir un impact sur la qualité de vos données, biaiser les
résultats de prédiction et gaspiller de l’espace de stockage. La suppression des doublons
garantit que chaque valeur est unique, fournissant ainsi une représentation exacte de vos
données. La première étape de suppression des doublons consiste à identifier les lignes en
double dans vos données. Une fois que vous les avez identifiées, vous pouvez les supprimer du
flux de travail.
1. (Facultatif) Pour les fichiers Excel et texte, vous pouvez cliquer sur l’étape des données
entrantes et ajouter un champ Numéro de ligne source pour trier les lignes en fonction de
la source de données d’origine. Pour plus d’informations, voir Ajoutez le champ Numéro
de ligne source à votre flux et Ordre de tri du champ calculé sur la page 209.
2. Cliquez sur n’importe quelle étape autre qu’une étape d’entrée ou de sortie.
le volet Profil, vous pouvez cliquer sur le menu Options supplémentaires dans
le champ sélectionné et sélectionner Identifier les lignes en double.
Un champ calculé est créé et répertorié dans le volet Modifications. Le champ calculé
fournit une description et les noms des champs couverts par les lignes en double. La grille
de données montre quelles lignes sont uniques et lesquelles sont des doublons.
L’image suivante montre les résultats en cas de sélection des deux champs Région et
Type d’élément pour identifier les lignes en double uniquement dans ces champs
sélectionnés.
Si un numéro de ligne source est disponible, il est utilisé pour trier l’ordre des lignes.
Sinon, les lignes sont triées en fonction du premier champ dans le schéma de la table.
Pour modifier les valeurs du champ calculé, vous pouvez modifier directement le calcul
ou écrire votre propre calcul. Consultez Ordre de tri du champ calculé sur la page 209.
4. Pour évaluer les lignes en double, cliquez sur Dupliquer ou Unique dans la ligne Est-ce
une ligne en double ? ou dans la grille de données.
L’image suivante montre les lignes en double dans tous les champs.
L’image suivante montre les lignes en double uniquement dans les champs Région et
Type d’élément.
5. Pour filtrer et conserver uniquement les lignes uniques, cliquez sur Unique dans la grille
de données ou dans le champ Est-ce une ligne en double ? et sélectionnez Conserver
uniquement dans la barre d’outils. Vous pouvez éventuellement cliquer sur Unique dans
la grille de données ou dans le champ Est-ce une ligne en double ?, puis faire un clic droit
pour sélectionner Conserver uniquement.
Vous pouvez également sélectionner Doublon puis sélectionnez Exclure pour rechercher
les doublons à l’aide d’un filtre de données. Cette opération produit les mêmes résultats
que de sélectionner les options Unique et Conserver uniquement et n’affecte pas les
lignes à exclure ou à conserver.
Un filtre est créé dans le volet Modifications, indiquant que seules les lignes uniques sont
conservées et que les lignes en double sont exclues.
6. Dans le champ calculé Est-ce une ligne en double ?, cliquez sur le menu Options sup-
Les lignes en double sont supprimées lorsque vous exécutez le flux et créez une sortie.
1. Ne supprimez pas le champ calculé Est-ce une ligne en double ? si vous effectuez des
ajustements pour les données échantillonnées. Vous avez ainsi la possibilité de modifier
la taille de l’échantillon ou d’ajuster les données de l’échantillon lors de l’étape des don-
nées entrantes.
2. Ajustez la taille de l’échantillon pour charger autant de données que possible pour la
sélection de lignes. Consultez Définir la taille de votre échantillon de données.
3. Les doublons peuvent ne pas apparaître dans les données échantillonnées selon la taille
de l’échantillon. L’option Conserver uniquement pour les lignes uniques vous permet de
supprimer les lignes en double, même si elles ne sont pas visibles dans les données
échantillonnées.
Par exemple :
Pour les fichiers Excel et texte, vous pouvez trier selon la source de données d’origine en
ajoutant un champ Numéro de ligne source.
Par exemple :
Pour plus d’informations, consultez Ajouter le champ Numéro de ligne source à votre flux.
Écrire votre propre calcul de filtre pour rechercher et supprimer les dou-
blons
Vous pouvez écrire votre propre calcul de filtre sur plusieurs champs pour rechercher et
supprimer les doublons.
Le calcul de filtre suivant renverra uniquement les résultats qui renvoient la valeur « True ». Le
calcul renvoie la valeur « True » ou « False » en fonction des champs utilisés pour la fonction
PARTITION
Vous pouvez utiliser les fonctions IF ou CASE dans l’éditeur de calcul. Par exemple :
Utilisez les rôles des données pour identifier rapidement si les valeurs d’un champ sont valides
ou non. Tableau Prep fournit un ensemble standard de rôles de données parmi lesquels vous
pouvez faire votre choix. Vous pouvez sinon créer vos propres rôles à l’aide de valeurs de
champ uniques dans votre ensemble de données.
Lorsque vous attribuez un rôle de données, Tableau Prep compare les valeurs standard
définies pour le rôle de données aux valeurs de votre champ. Toutes les valeurs qui ne
correspondent pas sont marquées d’un point d’exclamation rouge. Vous pouvez filtrer votre
champ de manière à ne voir que les valeurs valides ou non valides et prendre les mesures
appropriées pour les corriger. Une fois que vous avez attribué un rôle de données à vos
champs, vous pouvez utiliser l’option Regrouper les valeurs pour regrouper et associer des
valeurs non valides à des valeurs valides en fonction de l’orthographe et de la prononciation.
Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux
dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes
les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de
flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server.
Par exemple, si vous avez des valeurs de champ pour des données géographiques, vous pouvez
attribuer un rôle des données Ville. Tableau Prep compare alors les valeurs de champ à un
ensemble de valeurs de domaine connues pour identifier les valeurs discordantes.
Remarque : chaque champ est analysé indépendamment si bien qu’une valeur de Ville
« Portland » dans l’État « Washington » du pays « États-Unis » peut ne pas être une
combinaison valide de ville et d’État, mais elle ne sera pas identifiée comme telle parce
qu’il s’agit d’un nom de ville valide.
Tableau Prep Builder prend en charge les rôles des données suivants :
l E-mail
l URL
l Rôles géographiques (basés sur des données géographiques actuelles et identiques aux
données utilisées par Tableau Desktop)
l Aéroport
Conseil : dans Tableau Prep Builder depuis la version 2019.1.4 et sur le Web, si vous affectez
un rôle géographique à un champ, vous pouvez également utiliser ce rôle de données pour
associer et regrouper les valeurs avec la valeur standard définie par votre type de données.
Pour plus d’informations sur le regroupement de valeurs à l’aide de rôles de données, consultez
Nettoyer et organiser les données sur la page 249.
1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de
données pour le champ.
Tableau Prep compare les valeurs de données du champ aux valeurs de domaine ou
modèles connus (pour l’e-mail ou l’URL) pour le rôle des données que vous sélectionnez
et utilise un point d’exclamation rouge pour marquer toutes les valeurs discordantes.
3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs,
sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont
valides ou non valides pour le rôle de données.
Depuis Tableau Prep Builder version 2019.3.1 et sur le Web, vous pouvez créer vos propres
rôles de données personnalisés à l’aide des valeurs de champ de vos ensembles de données.
Vous créez alors un ensemble standard de valeurs que vous-même ou d’autres personnes
pouvez utiliser pour valider vos valeurs de champ lors du nettoyage des données. Sélectionnez
le champ que vous souhaitez utiliser, appliquez des opérations de nettoyage si nécessaire, puis
publiez-le sur Tableau Server ou Tableau Cloud pour l’utiliser dans votre flux ou partager vos
rôles des données avec d’autres utilisateurs.
Si vous créez des rôles de données personnalisés lors de la modification de flux sur le Web,
vous pouvez publier le rôle de données personnalisé directement sur le serveur auquel vous
êtes connecté.
Exigences
l Vous pouvez créer des rôles de données personnalisés à partir de champs individuels
dans votre ensemble de données. La création de rôles de données personnalisés à partir
d’une combinaison de champs n’est pas prise en charge.
l La publication de rôles de données dans des projets avec des autorisations verrouillées
n’est pas prise en charge.
l Vous pouvez créer des rôles de données personnalisés uniquement pour les champs
affectés à un type de données Chaîne et Nombre (entier).
l Lorsque vous créez un rôle de données personnalisé, Tableau Prep crée, dans votre flux,
une étape de sortie spécifique à la publication du rôle de données.
l La publication de rôles de données personnalisés sur plusieurs sites dans le même flux
n’est pas prise en charge. Si vous publiez le flux, vous devez publier le rôle de données
personnalisé sur le même site ou serveur que celui sur lequel le flux est publié.
l Les rôles de données personnalisés sont spécifiques au site, au serveur et au projet où
vous les publiez. Tous les utilisateurs ayant des autorisations sur l’emplacement peuvent
utiliser le rôle de données personnalisé, mais doivent être connectés au site ou au serveur
pour le sélectionner ou l’appliquer. Les rôles de données personnalisés reçoivent
l’autorisation par défaut pour le groupe Tous les utilisateurs pour les nouveaux projets
au lieu de l’autorisation Aucune.
l Les rôles de données personnalisés ne sont pas spécifiques à une version. Lors de
l’application d’un rôle de données personnalisé, la version la plus récente est appliquée.
l Après la publication sur Tableau Server ou Tableau Cloud, l’utilisateur ayant accès au site,
au serveur et au projet peut visualiser tous les rôles de données dans cet emplacement.
l Les utilisateurs disposant des autorisations appropriées peuvent déplacer, sup-
4. Cliquez sur Exécuter le flux pour créer le type de données. Une fois le processus de
publication terminé avec succès, vous pouvez afficher votre rôle de données dans
Tableau Server ou Tableau Cloud. Le traitement du rôle des données peut prendre un
certain temps en fonction de la charge pesant sur votre site Tableau Server ou Tableau
Cloud. Si votre rôle de données n’est pas disponible immédiatement, attendez quelques
minutes, puis essayez de le sélectionner à nouveau.
Tableau Prep compare les valeurs de données du champ aux valeurs de domaine
connues pour le rôle des données que vous sélectionnez et ajoute un point d’exclamation
rouge aux valeurs qui ne correspondent pas.
3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs,
sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui
sont valides ou non valides pour le rôle de données.
4. Utilisez les options de nettoyage dans le menu Options supplémentaires pour corriger
les valeurs de champ qui ne sont pas valides. Pour plus d’informations sur le nettoyage de
vos valeurs de champs, consultez À propos des opérations de nettoyage sur la page
249.
site ou votre serveur. Cliquez sur Plus d’actions pour un rôle des données sélectionné afin
de le déplacer vers un autre projet, modifier les autorisations ou le supprimer.
Remarque : dans Tableau Prep Builder versions 2019.1.4 et 2019.2.1, cette option était
appelée Correspondances des types de données.
Si vous attribuez un rôle de données géographiques à un champ, vous pouvez utiliser les
valeurs du type de données pour regrouper et associer les valeurs de votre champ en fonction
de l’orthographe et de la prononciation afin de les normaliser. Vous pouvez utiliser
Orthographe ou Orthographe et prononciation pour regrouper et associer les valeurs non
valides aux valeurs valides.
Ces options utilisent la valeur standard définie par le type de données. Si la valeur standard ne
se trouve pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute
automatiquement et marque la valeur comme n’appartenant pas à l’ensemble de données
d’origine. Pour plus d’informations sur l’attribution de rôles de données à des champs, consultez
Attribuer des rôles des données standard à vos données sur la page 211.
Si vous souhaitez utiliser des rôles de données pour regrouper des valeurs, procédez comme
suit.
1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de
données pour le champ.
l Ville
l Pays/région
l Comté
l État/province
Depuis Tableau Prep Builder version 2019.3.2 et sur le Web, vous pouvez également
choisir parmi vos rôles de données personnalisés.
Tableau Prep compare les valeurs de données du champ aux valeurs de domaine
connues pour le rôle des données que vous sélectionnez et ajoute un point d’exclamation
rouge aux valeurs qui ne correspondent pas.
Tableau Prep compare les valeurs par orthographe ou orthographe et prononciation, puis
regroupe les valeurs similaires sous la valeur normalisée pour le type de données. Si la
valeur standardisée ne figure pas dans votre ensemble de données, elle est ajoutée et
marquée avec un point rouge.
Si vous réutilisez souvent des flux en utilisant différentes données avec le même schéma, vous
pouvez créer et appliquer des paramètres utilisateur à vos flux pour passer facilement d’un
scénario à l’autre. Un paramètre est une valeur globale d’espace réservé telle qu’un numéro, une
valeur de texte ou une valeur booléenne qui peut remplacer une valeur constante dans un flux.
Au lieu de créer et de gérer plusieurs flux, vous pouvez désormais créer un flux et utiliser des
paramètres pour exécuter le flux avec vos différents ensembles de données. Par exemple, vous
pouvez créer un paramètre pour différentes régions de vente, puis appliquer une valeur de
paramètre au chemin du fichier d’entrée pour exécuter le flux en utilisant uniquement les
données de cette région.
Depuis Tableau Prep Builder et Tableau Cloud version 2023.2, vous pouvez également ajouter
des paramètres système au nom de sortie au fichier ou de la source de données publiée pour
ajouter automatiquement un horodatage chaque fois que vous exécutez le flux.
Vous pouvez appliquer des paramètres système (version 2023.2 et versions ultérieures) aux
noms de sortie pour les types de sortie de fichier et de source de données publiée.
Le tableau suivant répertorie les emplacements où vous pouvez appliquer des paramètres pour
chaque type d’étape.
Vous pouvez rendre les valeurs des paramètres de flux obligatoires ou facultatives. Lors de
l’exécution du flux, les utilisateurs sont invités à saisir les valeurs des paramètres. Les valeurs
de paramètre requises doivent être entrées avant que l’utilisateur puisse exécuter le flux. Des
valeurs de paramètre facultatives peuvent être saisies ou vous pouvez accepter la valeur
actuelle (par défaut). Les valeurs des paramètres sont ensuite appliquées à l’exécution du flux
partout où ce paramètre est utilisé.
Remarque : pour exécuter ou planifier des flux qui incluent des paramètres sur Tableau
Server ou Tableau Cloud, votre administrateur doit activer les paramètres Paramètre de
flux sur votre serveur. Pour plus d’informations, consultez Créer et modifier des flux
publiés sur le Web dans l’aide de Tableau Server ou Tableau Cloud.
1. Dans le menu du haut, cliquez sur l’icône Paramètre , puis sur Créer un paramètre.
Si vous incluez une description, les utilisateurs peuvent voir ces informations en les
survolant (à partir de la version 2022.1.1) dans la liste des paramètres et là où les
paramètres sont utilisés.
3. Sélectionnez l’un des type de données suivants. Les valeurs des paramètres doivent cor-
respondre au type de données que vous sélectionnez.
l Nombre (entier ou décimal)
l Chaîne
l Booléen
4. Spécifiez les Valeurs autorisées. Ce sont les valeurs que les utilisateurs peuvent entrer
dans le paramètre.
l Tout : cette option permet aux utilisateurs de saisir n’importe quelle valeur pour le
l Liste : saisissez une liste de valeurs parmi lesquelles les utilisateurs peuvent choi-
sir lors de l’application du paramètre. Pour saisir plusieurs valeurs, appuyez sur
Entrée après chaque saisie.
5. (facultatif) Sélectionnez Exiger une sélection au moment de l’exécution (Demander
une valeur au moment de l’exécution dans les versions précédentes). Le paramètre
devient alors un champ obligatoire. L’utilisateur doit saisir une valeur lors de l’exécution
ou de la planification du flux.
6. Entrez une Valeur actuelle. Il s’agit d’une valeur obligatoire qui agit comme valeur par
défaut pour le paramètre.
l Tout : entrez une valeur.
l Liste : Tableau utilise la première valeur de votre liste. Utilisez l’option déroulante
pour le modifier.
l Booléen : sélectionnez Vrai ou Faux.
7. Cliquez sur OK pour enregistrer le paramètre.
l Exécuter des requêtes SQL personnalisées définies dans une étape des données
entrantes.
l Renseigner les paramètres facultatifs qui ne sont pas spécifiés au moment de l’exécution.
l Remplacer le paramètre en tant que valeur statique dans les étapes enregistrées (à partir
de la version 2022.1.1).
l Remplacer le paramètre en tant que valeur statique dans les chemins d’accès du fichier
lors de la publication de flux avec des ensembles de données compressés.
Vous pouvez modifier la valeur à tout moment. Dans le menu supérieur, vous pouvez modifier le
paramètre ou utiliser le bouton Définir dans la liste des paramètres. Depuis le flux, vous pouvez
utiliser le bouton Définir partout où le paramètre est appliqué. Dans ce cas, il réinitialise la
valeur actuelle (par défaut) du paramètre partout où ce paramètre est utilisé, même dans les
requêtes SQL personnalisées.
Pour mettre en surbrillance les étapes du flux qui utilisent le paramètre, cliquez sur Afficher
dans le flux dans la boîte de dialogue des paramètres. Si le paramètre n’est utilisé qu’en un
seul endroit, vous êtes directement dirigé vers cette étape avec le volet de profil ouvert.
l
Dans le menu supérieur, sélectionnez l’icône Paramètre . Utilisez cette option
pour réinitialiser les valeurs de paramètre utilisées n’importe où dans le flux, ou
lorsqu’elles sont utilisées dans des filtres et des champs calculés.
SQL.
Les paramètres système (à partir de la version 2023.2) sont automatiquement générés lorsque
vous exécutez le flux. Il vous suffit de les appliquer au nom de votre étape de sortie et chaque fois
que le flux est exécuté, le paramètre est mis à jour dynamiquement avec la date ou l’heure de
début de l’exécution du flux.
Vous pouvez inclure des paramètres utilisateur dans votre chemin d’accès du fichier à quelques
exceptions près. À partir de la version 2022.1.1, vous pouvez également voir un aperçu des
valeurs des paramètres.
Exceptions
l Depuis la version 2022.1.1, vous pouvez planifier et exécuter des flux sur le Web qui
incluent des paramètres dans le chemin d’accès du fichier d’entrée. Si vous utilisez une
version antérieure, exécutez les flux dans Tableau Prep Builder ou depuis la ligne de com-
mande.
l Pour inclure des paramètres dans le chemin d’accès du fichier lors de la publication de
flux sur le Web, une connexion directe au fichier est requise. Sinon, le paramètre est
converti en une valeur statique à l’aide de la Valeur actuelle.
1. Dans l’onglet Paramètres, dans le chemin d’accès du fichier, placez votre curseur à
l’endroit où vous souhaitez ajouter le paramètre.
3. Affichez un aperçu de la valeur du paramètre. La valeur actuelle (par défaut) est affichée
dans l’aperçu. Vous serez invité à sélectionner ou à entrer la valeur du paramètre lorsque
Remarque : l’utilisation d’un paramètre pour un nom de table dans une connexion
d’entrée Google BigQuery n’est pas encore prise en charge.
1. Sur l’onglet Paramètres, dans le champ Table, cliquez sur le menu déroulant.
2. Sélectionnez Utiliser le paramètre, puis sélectionnez le paramètre dans la liste.
SQL personnalisé
4. Sélectionnez Exécuter pour exécuter votre requête. Vous ne serez pas invité à saisir une
valeur de paramètre tant que vous n’aurez pas exécuté le flux. Au lieu de cela, la requête
s’exécutera initialement en utilisant la Valeur actuelle du paramètre.
l Nom de fichier
l Sections de votre chemin d’accès du fichier
l Nom de la source de données publiée
l Nom de la table de base de données
l Nom de la feuille de calcul Microsoft Excel (à partir de la version 2022.1.1)
l Scripts SQL personnalisés qui s’exécutent avant ou après l’écriture des données de sortie
de flux dans une base de données (à partir de la version 2022.1.1)
1. Dans le volet Sortie, sélectionnez Fichier dans la liste déroulante Enregistrer la sortie
sur.
Pour le chemin d’accès du fichier, placez votre curseur à l’emplacement où vous souhaitez
ajouter le paramètre.
Lorsque vous exécutez le flux, vous êtes invité à entrer vos valeurs de paramètre.
1. Dans le volet Sortie, dans la liste déroulante Enregistrer la sortie sur, sélectionnez
Source de données publiée.
2. Dans le champ Nom, cliquez sur l’icône de paramètre et sélectionnez votre para-
mètre.
Lorsque vous exécutez le flux, vous êtes invité à entrer vos valeurs de paramètre.
1. Dans l’ onglet Sortie, dans la liste déroulante Enregistrer la sortie dans, sélectionnez
Table de base de données.
2. Dans le champ Table, sélectionnez Utiliser le paramètre, puis sélectionnez le para-
mètre dans la liste.
3. (Facultatif) Cliquez sur l’onglet SQL personnalisé. À partir de la version 2022.1.1, vous
pouvez entrer un script SQL avec des paramètres à exécuter avant et après l’écriture
des données dans la table. Pour inclure un paramètre, cliquez sur Insérer un paramètre
et sélectionnez votre paramètre.
Pour plus d’informations sur l’utilisation de scripts SQL lors de l’écriture d’une sortie dans
une base de données, consultez Enregistrer les données de sortie de flux dans des
bases de données externes sur la page 440.
Remarque : les paramètres utilisés dans les scripts SQL doivent être supprimés
manuellement. Consultez Supprimer manuellement les paramètres utilisateur
sur la page 244 pour plus d’informations.
Lorsque vous exécutez le flux, vous êtes invité à entrer vos valeurs de paramètre.
l Nom de fichier
l Nom de la source de données publiée
Nom de fichier
Cette option de sortie n’est pas disponible lors de la création ou de la modification de flux sur le
Web
1. Dans le volet Sortie, sélectionnez Fichier dans la liste déroulante Enregistrer la sortie
sur.
2. Dans le champ Nom, cliquez sur l’icône de paramètre et sélectionnez parmi les para-
mètres de date ou d’heure d’exécution suivants. Vous pouvez combiner plusieurs para-
mètres système pour créer l’horodatage dont vous avez besoin.
Date d’exécution
l Date : AAAA-MM-JJ, AAAAMMJJ, JJ-MM-AAAA
Durée d’exécution
l AAAA-MM-JJ_HH-MM-SS (24 heures)
Lorsque vous exécutez le flux, Tableau Prep applique l’heure de démarrage du flux en
utilisant votre fuseau horaire local ou le fuseau horaire du serveur.
1. Dans le volet Sortie, dans la liste déroulante Enregistrer la sortie sur, sélectionnez
Source de données publiée.
2. Dans le champ Nom, cliquez sur l’icône de paramètre et sélectionnez parmi les para-
mètres de date ou d’heure d’exécution suivants. Vous pouvez combiner plusieurs para-
mètres système pour créer l’horodatage dont vous avez besoin.
Date d’exécution
l Date : AAAA-MM-JJ, AAAAMMJJ, JJ-MM-AAAA
l Numéro de trimestre
l Numéro d’année
Durée d’exécution
l AAAA-MM-JJ_HH-MM-SS (24 heures)
Lorsque vous exécutez le flux, Tableau Prep applique l’heure de démarrage du flux en
utilisant votre fuseau horaire local ou le fuseau horaire du serveur.
1. Dans l’étape des données entrantes ou la barre d’outils du volet Profil, choisissez Filtrer
les valeurs. Pour ajouter un filtre de paramètre à un champ, depuis le menu Options sup-
Lorsque vous exécutez le flux, vous êtes invité à entrer vos valeurs de paramètre.
1. Dans la barre d’outils du volet de profil, cliquez sur Créer un champ calculé. Pour ajou-
ter un paramètre à un calcul sur un champ, depuis le menu Options supplémentaires
2. Dans l’éditeur de calcul Ajouter un champ, entrez votre calcul, saisissez le nom du
paramètre pour le sélectionner dans la liste, puis cliquez sur Enregistrer pour enregistrer
votre calcul.
Lorsque vous exécutez le flux, vous êtes invité à entrer vos valeurs de paramètre.
Remarque : les options de suppression de paramètres dans un flux varient selon votre
version. Suivez les instructions ci-dessous pour la version 2022.1 et les versions
ultérieures. Utilisez Supprimer manuellement les paramètres utilisateur sur la page
suivante pour les versions précédentes et pour supprimer les paramètres utilisés dans les
scripts SQL personnalisés qui s’exécutent avant ou après l’écriture de la sortie dans une
base de données.
1. Dans le menu du haut, cliquez sur l’icône de paramètre dans le menu déroulant, puis
cliquez sur Modifier le paramètre pour le paramètre que vous souhaitez supprimer.
Avant de pouvoir supprimer un paramètre utilisateur de votre liste de paramètres, vous devez
d’abord rechercher et supprimer toutes les instances des paramètres de votre flux, même du
volet Modifications.
1. Dans le menu du haut, cliquez sur l’icône de paramètre dans le menu déroulant.
2. Pour le paramètre que vous souhaitez supprimer, cliquez sur Afficher dans le flux pour
trouver toutes les instances où le paramètre est utilisé dans le flux.
4. Dans le menu du haut, cliquez sur l’icône de paramètre dans le menu déroulant et
pour le paramètre que vous souhaitez supprimer, cliquez sur Modifier le paramètre.
Si un paramètre utilisateur est marqué comme obligatoire, les utilisateurs doivent entrer une
valeur avant de pouvoir exécuter le flux. Si un paramètre est facultatif, les utilisateurs peuvent
saisir une valeur ou accepter la Valeur actuelle du paramètre par défaut.
Les paramètres obligatoires sont ceux dont la case Exiger une sélection au moment de
l’exécution (Exiger une valeur au moment de l’exécution dans les versions précédentes) est
cochée.
Si vous exécutez des flux à l’aide de l’interface en ligne de commande et que vous souhaitez
remplacer les valeurs de paramètre actuelles (par défaut), créez un fichier de remplacement de
paramètres .json et incluez la syntaxe -p --parameters dans votre ligne de commande. Pour plus
d’informations, consultez Actualiser les fichiers de sortie du flux depuis la ligne de
commande sur la page 479.
1. Saisissez ou sélectionnez les valeurs des paramètres utilisateur. S’il existe des para-
mètres facultatifs dans le flux, vous pouvez entrer les valeurs à ce stade ou accepter la
valeur de paramètre actuelle (par défaut).
2. Cliquez sur Exécuter le flux pour exécuter le flux.
Pour plus d’informations sur l’exécution de flux, consultez Publier un flux sur Tableau Server
ou Tableau Cloud sur la page 520.
1. Dans l’onglet Nouvelles tâches ou Tâches liées, dans la section Définir les
paramètres, saisissez ou sélectionnez les valeurs des paramètres. S’il existe des
paramètres facultatifs dans le flux, vous pouvez saisir les valeurs à ce moment-là ou
laisser le champ vide pour utiliser la valeur de paramètre actuelle (par défaut).
2. Cliquez sur Créer des tâches pour planifier votre flux.
Vous pouvez également nettoyer vos données à l’aide d’une étape de permutation ou une étape
de script pour appliquer des scripts R ou Python à votre flux. Les étapes de script ne sont pas
prises en charge dans Tableau Cloud. Pour plus d’informations, consultez Permuter vos
données sur la page 375 ou Utiliser des scripts R et Python dans votre flux sur la page 385.
Vous pouvez appliquer des opérations de nettoyage limitées à l’étape des données entrantes et
vous ne pouvez pas appliquer d’opérations de nettoyage à l’étape de sortie. Pour plus
d’informations sur l’application d’opérations de nettoyage à l’étape des données entrantes,
consultez Appliquer des opérations de nettoyage à une étape des données entrantes sur
la page 126.
Filtrer X X X X X X X
Regrou- X X X X
per les
valeurs
Nettoyer X X X X X
Convertir X X X X X X
des dates
Scinder X X X X X
les
valeurs
Renom- X X X X X X
mer le
champ
Renom- X
mer les
champs
(en bloc)
Dupliquer X X X X X
le champ
Con- X X X X X X X
server uni-
quement
le champ
Sup- X X X X X X X
primer le
champ
Créer un X X X X X
champ
calculé
Modifier X X X X X
la valeur
Modifier X X X X X X X
le type de
données
À mesure que vous modifiez vos données, des annotations sont ajoutées à l’étape
correspondante dans le volet Flux et une entrée est ajoutée dans le volet Modifications pour
enregistrer vos actions. Si vous apportez des modifications dans l’étape des données entrantes,
l’annotation s’affiche à gauche de l’étape dans le volet Flux et s’affiche dans le Profil d’entrée
dans la liste des champs.
L’ordre d’application de vos modifications a une incidence. Les modifications apportées dans les
types d’étape Agrégation, Permutation, Jointure et Union sont effectuées soit avant, soit après
ces actions de nettoyage, selon l’emplacement du champ où vous effectuez la modification.
L’emplacement où la modification a été effectuée s’affiche dans le volet Modifications de
l’étape.
L’exemple suivant montre les modifications apportées à plusieurs champs dans une étape de
jointure. La modification est effectuée avant l’action de jointure afin de générer des résultats
corrigés.
Type Agré- Agré- Per- Per- Join- Join- Union Union Nou-
d’ gation gation muta- muta- ture ture velles
Action tion tion lignes
/étape :
Empla- Cham- Cham- Pas en Créé à Inclu- Inclus Champs Cha- Cha-
cement ps ps per- partir s dans incom- mps mp uti-
du grou- agré- muta- d’une dans les patibles com- lisé
champ : pés gés tion per- un deux binés pour
muta- table- table- géné-
tion au* aux* rer
des
lignes
Filtrer Avant Après Avant Après Avan- Après Avant Après Après
l’agrég- l’agrég- la per- la per- t la la join- l’Union l’Unio- les
ation ation muta- muta- join- ture n nou-
tion tion ture velles
lignes
Regrou- N/A N/A Avant Après Avan- Après Avant Après Après
per les la per- la per- t la la join- l’Union l’Unio- les
valeurs muta- muta- join- ture n nou-
tion tion ture velles
lignes
Net- N/A N/A Avant Après Avan- Après Avant Après Après
toyer la per- la per- t la la join- l’Union l’Unio- les
muta- muta- join- ture n nou-
tion tion ture velles
lignes
Con- Avant Après Avant Après Avan- Après Avant Après Après
vertir l’agrég- l’agrég- la per- la per- t la la join- l’Union l’Unio- les
Scinder N/A N/A Avant Après Avan- Après Avant Après Après
les la per- la per- t la la join- l’Union l’Unio- les
valeurs muta- muta- join- ture n nou-
tion tion ture velles
lignes
Renom- N/A N/A Avant Après Avan- Après Avant Après Avant
mer le la per- la per- t la la join- l’Union l’Unio- les
champ muta- muta- join- ture n nou-
tion tion ture velles
lignes
Dupli- N/A N/A Avant Après Avan- Après Avant Après Après
quer le la per- la per- t la la join- l’Union l’Unio- les
champ muta- muta- join- ture n nou-
tion tion ture velles
lignes
Con- Après Après Avant Après Avan- Après Avant Après Après
server l’agrég- l’agrég- la per- la per- t la la join- l’Union l’Unio- les
uni- ation ation muta- muta- join- ture n nou-
que- tion tion ture velles
ment le lignes
champ
Sup- Sup- Sup- Avant Après Avan- Après Avant Après Après
primer prime prime la per- la per- t la la join- l’Union l’Unio- les
le de de muta- muta- join- ture n nou-
champ l’agrég- l’agrég- tion tion ture velles
ation ation lignes
Créer N/A N/A Avant Après Aprè- Après Avant Après Après
un la per- la per- s la la join- l’Union l’Unio- les
champ muta- muta- join- ture n nou-
Modi- N/A N/A Avant Après Avan- Après Avant Après Après
fier la la per- la per- t la la join- l’Union l’Unio- les
valeur muta- muta- join- ture n nou-
tion tion ture velles
lignes
Modi- Avant Après Avant Après Avan- Avant Avant Après Avant
fier le l’agrég- l’agrég- la per- la per- t la la join- l’Union l’Unio- les
type de ation ation muta- muta- join- ture n nou-
don- tion tion ture velles
nées lignes
Remarque : pour les jointures, si le champ est un champ calculé créé à l’aide d’un champ
issu d’une autre table, la modification est appliquée avant la jointure. Si le champ est créé
avec des champs issus des deux tables, la modification est appliquée après la jointure.
d’outils ou cliquez sur Options supplémentaires dans la fiche Profil du champ, la grille de
données ou le volet Résultats pour ouvrir le menu.
Dans les types d’étape Agrégation, Permutation, Jointure et Union, le menu Options
supplémentaires est disponible dans les fiches Profil du volet Résultats et la grille de
données correspondante. Si vous effectuez les mêmes opérations ou actions de nettoyage à
plusieurs reprises tout au long de votre flux, vous pouvez copier et coller vos étapes, vos actions
ou même vos champs. Pour plus d’informations, voir Copier des étapes, des actions et des
champs sur la page 307.
Afficher le volet Profil : il s’agit de la vue par défaut. Sélectionnez ce bouton pour
revenir à la vue du volet Profil ou du volet Résultats.
l
Sélectionner et masquer ou afficher plusieurs lignes à l’aide de l’option .
l Renommer les champs en bloc.
Suspendre les mises à jour des données pour améliorer les per-
formances
Lorsque vous effectuez des opérations de nettoyage de vos données, Tableau Prep applique vos
modifications au fur et à mesure pour vous présenter les résultats immédiatement. Pour gagner
un temps de traitement précieux lorsque vous connaissez les modifications que vous devez
apporter et so vous n’avez pas besoin de commentaires immédiats à chaque modification, vous
pouvez améliorer les performances en suspendant les mises à jour des données.
Lorsque vous suspendez les mises à jour des données, vous pouvez effectuer toutes vos
modifications en une seule fois, puis redémarrer les mises à jour pour voir vos résultats. Vous
pouvez redémarrer les mises à jour des données et activer toutes les opérations disponibles à
tout moment.
Remarque : lorsque vous suspendez les mises à jour des données, toutes les opérations
qui vous demandent de voir vos valeurs seront désactivées. Par exemple, si vous voulez
appliquer un filtre aux valeurs sélectionnées, vous devez voir les valeurs que vous voulez
exclure.
1. Dans le menu du haut, cliquez sur Suspendre les mises à jour de données pour sus-
pendre les mises à jour.
2. Tableau Prep convertit le volet Profil en une liste. Dans la liste, utilisez le menu Options
Pour plus d’informations sur l’utilisation du mode Liste, voir Sélectionner votre vue sur
la page 255.
3. Pour voir les résultats de vos modifications ou activer une fonctionnalité désactivée, redé-
marrez les mises à jour des données. Cliquez sur le bouton Redémarrer les mises à
jour des données, cliquez sur le bouton Reprendre dans la boîte de dialogue du menu
ou dans la bannière de message en haut du volet Flux.
Remarque : Tableau Prep Builder vous offre la possibilité de reprendre les mises à
jour directement à partir du menu. Si vous modifiez des flux sur le Web, vous
devrez reprendre les mises à jour à partir du menu supérieur.
1. Dans le volet Profil, dans la grille de données, dans le volet Résultats ou dans la liste,
sélectionnez le champ auquel vous souhaitez apporter des modifications.
droit (ou Ctrl+clic sur MacOS) sur une valeur de champ pour conserver ou exclure
des valeurs. Vous pouvez également utiliser le filtre Valeurs sélectionnées pour
choisir et sélectionner les valeurs à filtrer, y compris les valeurs non comprises dans
votre échantillon de flux. Pour plus d’informations sur les options de filtre, consultez
Filtrer vos données sur la page 194.
l Regrouper les valeurs (Regrouper et remplacer dans les versions
précédentes) : sélectionnez manuellement les valeurs ou utilisez le regroupement
automatique. Vous pouvez aussi sélectionner plusieurs valeurs dans la fiche Profil
et faire un clic droit (ou Ctrl+clic sur MacOS) pour regrouper ou dégrouper des
valeurs ou encore modifier la valeur de regroupement. Pour plus d’informations sur
l’utilisation de l’option Regrouper les valeurs, consultez Associer auto-
matiquement des valeurs à une valeur standard à l’aide de la cor-
respondance approximative sur la page 281.
l Nettoyer : faites votre choix dans la liste d’opérations de nettoyage rapides à appli-
quer à toutes les valeurs du champ.
l Convertir des dates : pour les champs affectés à un type de données Date ou
Date et heure, faites votre choix dans la liste d’opérations de nettoyage rapide
DATEPART pour convertir vos valeurs de champ de date en une valeur d’entier
représentant une année, un trimestre, un mois, une semaine, un jour, ou encore
une valeur de date et d’heure. Vous pouvez également choisir parmi deux opé-
rations de nettoyage rapide DATENAME, jour de la semaine ou nom du mois, pour
convertir les valeurs de votre champ de date.
l Année fiscale personnalisée : si votre année fiscale ne commence pas en
l Scinder les valeurs : Scindez les valeurs automatiquement en fonction d’un sépa-
rateur commun ou utilisez la scission personnalisée pour spécifier la façon dont
vous souhaitez scinder les valeurs de champ. La scission automatique et la scis-
sion personnalisée fonctionnent de la même manière que dans Tableau Desktop.
Pour plus d’information, consultez Fractionner un champ en champs multiples
dans l’aide de Tableau Desktop et l’aide de la création Web.
l Renommer le champ : modifiez le nom du champ.
l Dupliquer le champ : créez une copie de votre champ et de vos valeurs.
l Conserver uniquement le champ : conservez uniquement le champ sélectionné
et excluez tous les autres champs dans l’étape.
Utilisez l’option Renommer les champs pour renommer plusieurs champs en bloc. Recherchez
des parties d’un nom de champ pour le remplacer ou le supprimer, ou ajoutez des préfixes ou
des suffixes à tous les champs ou à certains champs de votre ensemble de données.
Vous pouvez également appliquer automatiquement la même modification à tous les champs
ajoutés par la suite qui correspondent à vos critères en cochant la case Renommer
automatiquement les nouveaux champs lors de vos modifications.
Remarque : cette option n’est disponible que dans un type d’étape Nettoyage.
1. Dans une étape de Nettoyage, dans la barre d’outils, sélectionnez Renommer les
champs.
Votre vue est automatiquement convertie en Liste et affiche tous les champs de votre
flux. Vous pouvez utiliser l’option Rechercher dans la barre d’outils pour affiner vos
résultats.
Tous les champs sont sélectionnés par défaut. Désélectionnez la case supérieure pour
effacer la sélection de tous les champs et sélectionner manuellement uniquement les
champs que vous souhaitez modifier.
2. Dans le volet Renommer les champs, vous avez le choix entre les options suivantes :
l Remplacer le texte : dans le champ Trouver le texte, recherchez le texte cor-
l Ajouter un préfixe : ajoutez un texte au début de tous les noms de champs sélec-
tionnés.
l Ajouter un suffixe : ajoutez un texte à la fin de tous les noms de champs sélec-
tionnés.
Au fur et à mesure que vous effectuez vos entrées, vos résultats s’affichent dans le
volet Liste.
Dans Tableau Prep Builder à partir de la version 2019.1.3 et sur le Web, vous pouvez cliquer sur
une annotation sur l’icône de modification dans une étape du volet Flux ou sur une fiche Profil
dans le volet Profil ou Résultats. La modification et le champ affecté seront surlignés dans le
volet Modifications ainsi que dans le volet Profil ou Résultats.
Vous pouvez également sélectionner une étape, puis développer le volet Modifications pour
consulter les détails de chaque modification, éditer ou supprimer vos modifications, ou faire
glisser des modifications vers le haut ou vers le bas pour changer leur ordre d’application. Vous
pouvez aussi ajouter une description pour fournir un contexte aux autres utilisateurs. Pour plus
d’informations sur l’ajout de descriptions à vos modifications, voir Ajouter des descriptions aux
étapes du flux et aux actions de nettoyage sur la page 173.
Lorsque vous affichez les modifications pour une étape Agrégation, Permutation, Jointure ou
Union, l’ordre dans lequel la modification est appliquée s’affiche avant ou après l’action de
réorganisation. L’ordre de ces modifications est appliqué par le système et ne peut pas être
modifié. Vous pouvez éditer et supprimer la modification.
Exemple :
Une union des données entrantes génère 3 champs contenant les Fusionner 3 champs en
mêmes valeurs. 1
Lorsque vous fusionnez des champs, Tableau Prep conserve tous les champs du champ cible et
remplace toutes les valeurs null de ce champ par les valeurs issues des champs source que vous
fusionnez avec le champ cible. Les champs source sont supprimés.
Exemple
Nom Téléphone_Contact
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678
l Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner
les champs s’affiche.
l Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu
contextuel, puis cliquez sur Fusionner les champs.
l Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre
d’outils.
Pour savoir comment corriger des champs discordants suite à une union, consultez Corriger
les champs non concordants sur la page 414.
Remarque : dans Tableau Prep Builder, si vous ne souhaitez pas utiliser cette
fonctionnalité, désactivez-la. Dans le menu supérieur, accédez à Aide > Paramètres et
Performances. Cliquez ensuite sur Activer les recommandations pour désélectionner
la coche à côté du paramètre.
l
Cliquez sur l’icône d’ampoule en haut à droite de la fiche Profil.
l Dans la barre d’outils, cliquez sur la flèche déroulante Recommandations pour affi-
cher toutes les recommandations concernant votre ensemble de données et sélec-
tionnez une recommandation dans la liste.
Répétez les étapes ci-dessus pour appliquer des modifications supplémentaires ou ignorez les
modifications suggérées et utilisez les autres outils de nettoyage pour résoudre les problèmes de
données.</p>
Remarque : toutes les modifications que vous apportez aux valeurs doivent être
compatibles avec le type de champ de données.
Sinon, faites un clic droit sur une valeur et cliquez sur Modifier la valeur. La modification
est enregistrée dans Suivi des modifications sur le côté gauche de l’écran.
Remarque : lorsque vous associez plusieurs valeurs à une seule valeur, le champ
d’origine montre une icône de groupe à côté de la valeur. Elle vous indique quelles
valeurs sont regroupées ensemble.
Vous pouvez empiler les opérations pour appliquer plusieurs opérations de nettoyage
aux champs. Par exemple, commencez par sélectionner Supprimer > Supprimer les
nombres puis sélectionnez Nettoyer > Supprimer la ponctuation pour supprimer tous
les nombres et la ponctuation des valeurs de champ.
3. Pour annuler vos modifications, cliquez sur la flèche Annuler en haut du volet Flux ou
supprimez la modification de la liste des modifications.
3. Faites un clic droit et sélectionnez Groupe dans le menu contextuel. La valeur de la sélec-
tion sur laquelle vous faites un clic droit devient le nom par défaut du nouveau groupe,
mais vous pouvez le modifier en ligne.
1. Dans la fiche Profil, appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (sur Mac), et
sélectionnez les valeurs que vous souhaitez modifier
2. Faites un clic droit ou Ctrl+clic (Mac), et sélectionnez Remplacer par une valeur null
dans le menu. Les valeurs sont transformées en valeurs null et l’icône de groupe appa-
Par exemple, imaginons qu’un champ comporte trois valeurs : Ma société, Ma société
Incorporated et Ma société Inc. Ces valeurs représentent toutes trois la même entreprise, Ma
société. Vous pouvez utiliser Regrouper les valeurs pour associer les valeurs Ma société
Incorporated et Ma société Inc. à Ma société afin que les valeurs s’affichent toutes trois comme
Ma société dans le champ.
Pour supprimer des valeurs du groupe, dans la section supérieure du volet droit, dans
l’éditeur Regrouper les valeurs, désactivez la case à cocher à côté des valeurs.
4. Dans le volet droit de l’éditeur Regrouper les valeurs, cliquez sur Regrouper les
valeurs.
Un nouveau groupe est créé à l’aide de la dernière valeur sélectionnée comme nom de
groupe. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la
valeur ou faites un clic droit ou Ctrl+clic (MacOS) sur le champ groupé et sélectionnez
Modifier la valeur dans le menu.
Par exemple, dans l’image ci-dessous, le Wyoming et le Nevada ne figurent pas dans
l’ensemble de données.
Voici quelques raisons pour lesquelles une valeur peut ne pas être dans l’ensemble de
données :
l Vous venez d’ajouter la nouvelle valeur manuellement.
ciée, cliquez sur le bouton Plus dans le volet droit de l’éditeur Regrouper les
valeurs.
Si vous utilisez des types de données pour valider vos valeurs de champ, vous pouvez utiliser
l’option Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) pour
faire correspondre des valeurs non valides avec des valeurs valides. Pour plus d’informations,
consultez Regrouper des valeurs similaires par rôle de données sur la page 222
l Prononciation : trouvez et regroupez les valeurs ayant la même sonorité. Cette option
utilise l’algorithme Metaphone 3 qui indexe les mots selon leur prononciation et est plus
spécifiquement adapté aux mots anglais. Ce type d’algorithme est utilisé par de nom-
breux correcteurs orthographiques. Cette option n’est pas disponible pour les rôles de
données.
l Caractères communs : trouvez et regroupez les valeurs ayant des lettres et des
nombres en commun. Cette option utilise l’algorithme d’empreinte digitale ngram qui
indexe les mots par leurs caractères uniques après avoir supprimé la ponctuation, les
doublons et les espaces blancs. Cet algorithme fonctionne quelle que soit la langue prise
en charge. Cette option n’est pas disponible pour les rôles de données.
Par exemple, cet algorithme associerait les noms représentés sous la forme « John
Smith » et « Smith, John » parce qu’ils génèrent tous deux la clé « hijmnost ». Cet
algorithme ne prenant pas en considération la prononciation, la valeur « Tom Jhinois »
aurait la même clé « hijmnost » et serait également inclus dans le groupe.
l Orthographe : trouvez et regroupez les valeurs ayant la même orthographe. Cette option
utilise l’algorithme de distance Levenshtein qui calcule une distance de modification entre
deux valeurs de texte utilisant un seuil fixe par défaut. Elle les regroupe ensuite lorsque la
distance de modification est inférieure à la valeur de seuil. Cet algorithme fonctionne
quelle que soit la langue prise en charge. Vous pouvez l’utiliser une fois qu’un rôle des
données a été appliqué. Dans ce cas, il fait correspondre les valeurs invalides à la valeur
valide la plus proche en utilisant la distance d’édition. Si la valeur standard ne se trouve
pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute automatiquement
et marque la valeur comme n’appartenant pas à l’ensemble de données d’origine.
l Prononciation et orthographe : si vous affectez un rôle des données à vos champs,
vous pouvez l’utiliser pour associer et regrouper des valeurs avec la valeur standard défi-
nie par votre rôle. Cette option associe ensuite des valeurs non valides à la valeur valide
la plus proche en fonction de l’orthographe et de la prononciation. Si la valeur standard ne
se trouve pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute auto-
matiquement et marque la valeur comme n’appartenant pas à l’ensemble de données
d’origine. Cette option est celle qui convient le mieux aux mots anglais.
Pour plus d’informations, consultez Nettoyer et organiser les données sur la page 249.
Vous souhaitez en savoir plus sur ces algorithmes de correspondance approximative ?
Consultez Regroupement automatisé dans Tableau Prep Builder sur Tableau.com.
l Caractères communs
l Orthographe
Tableau Prep Builder trouve et regroupe les valeurs qui correspondent et les remplace par
la valeur qui se présente le plus fréquemment dans le groupe.
3. Consultez les regroupements, et ajoutez ou supprimez manuellement des valeurs, ou
Selon la manière dont vous définissez le curseur, vous pouvez avoir davantage de contrôle sur
le nombre de valeurs incluses dans un groupe et le nombre de groupes créés. Par défaut,
Tableau Prep détecte le paramètre de regroupement optimal et affiche le curseur dans cette
position.
Lorsque vous modifiez le seuil, Tableau Prep analyse un échantillon des valeurs pour
déterminer le nouveau regroupement. Les groupes générés à partir du paramètre sont
sauvegardés et enregistrés dans le volet Modifications, mais le paramètre de seuil n’est pas
enregistré. La prochaine fois que vous ouvrez l’éditeur Regrouper les valeurs, soit pour
modifier votre changement existant, soit pour effectuer une nouvelle modification, le curseur de
seuil est affiché dans la position par défaut, ce qui vous permet d’effectuer des ajustements en
fonction de votre ensemble de données actuel.
l Orthographe
Tableau Prep trouve et regroupe les valeurs qui correspondent et les remplace par la
valeur qui se présente le plus fréquemment dans le groupe.
3. Dans le volet gauche de l’éditeur Regrouper les valeurs, faites glisser le curseur vers l’un
des 5 niveaux de seuil pour modifier vos résultats.
Pour définir un seuil plus strict, déplacez le curseur vers la gauche. Il en résulte moins de
correspondances et la création de moins de groupes inférieur. Pour définir un seuil moins
strict, déplacez le curseur vers la droite. Il en résulte plus de correspondances et la
création de plus de groupes.
4. Cliquez sur Terminé pour enregistrer vos modifications.
inscrire à un essai gratuit de Tableau Cloud qui inclut désormais les fonctionnalités de
Tableau Agent.
Tableau Agent dans Tableau Prep est une fonctionnalité d’IA générative qui peut vous aider à
nettoyer et à transformer vos données. Dans les versions précédentes, vous pouviez utiliser
Tableau Agent pour vous aider à créer des champs calculés au fur et à mesure que vous
construisiez votre flux. À partir de la version 2025.2, vous pouvez utiliser Tableau Agent pour
vous aider à nettoyer vos données et créer votre flux, et aussi créer des champs calculés. Cette
fonctionnalité est disponible dans Tableau Prep Builder et la création Web Tableau Prep dans
Tableau Cloud.
Pour utiliser Tableau Agent, décrivez simplement ce que vous aimeriez faire en langage naturel,
par exemple « Diviser le champ Détails du vol en des champs séparés pour le vol, la date, la
classe et le prix » ou « Modifier les valeurs du champ Date de commande sur Mois ». Tableau
Agent vous renvoie un résumé décrivant comment accomplir votre tâche et suggère un
ensemble d’étapes à appliquer à votre flux, et il crée même des calculs si nécessaire.
En tant que personne dûment informée, vous pouvez passer en revue les étapes suggérées et
appliquer chacune d’entre elles individuellement ou appliquer toutes les étapes du plan. Tableau
Agent effectue les étapes pour vous, en créant votre flux et en ajoutant les modifications au volet
Modifications. Vous pouvez interagir manuellement avec toutes les modifications apportées par
Tableau Agent, par exemple modifier un calcul ou utiliser Annuler ou Refaire, et ainsi toujours
garder le contrôle de votre flux.
Tableau Agent peut effectuer une action unique, par exemple créer un champ calculé, ou des
actions plus complexes nécessitant plusieurs étapes. Selon les actions nécessaires pour mener
à bien la tâche, Tableau Agent vous montrera l’action unique que vous pouvez vérifier et
appliquer, ou vous renverra un plan si la tâche exige des actions plus complexes et plusieurs
étapes. Tableau Agent gère un maximum de 10 étapes. Si l’action nécessite plus de 10 étapes,
divisez votre demande en plusieurs questions.
est envoyée à un modèle d’invite créé par Tableau. Le modèle d’invite demande au LLM de créer
un plan ou un ensemble d’étapes pour votre tâche afin que vous puissiez examiner les étapes
suggérées renvoyées par Tableau Agent avant de les appliquer à votre flux.
Tableau Agent n’utilise que les sources de données auxquelles votre flux est connecté, et dans le
cas de Tableau Prep, seules les données des tables de l’étape sélectionnée sont envoyées à
l’invite et au LLM, et non toutes les données de votre flux.
Tableau Agent ne connaît aucune autre source de données Tableau et ne peut donc pas
suggérer de contenu pertinent, ni répondre à des questions de traçabilité des données ou encore
des questions de connaissances générales. Les stratégies définies par l’utilisateur pour la
sécurité au niveau des lignes et des colonnes sont respectées. Les données auxquelles un
utilisateur a accès lors de l’utilisation de Tableau Agent sont conformes à toutes les stratégies de
sécurité en vigueur au niveau des lignes ou des colonnes.
Lorsque vous ouvrez Tableau Agent pour la première fois, il indexe vos données afin de
comprendre le contexte. Tableau Agent peut ainsi renvoyer des résultats pertinents en fonction
de vos questions et de votre source de données. Les informations qu’il indexe comprennent les
noms des colonnes et le type de données, ainsi que 5 exemples de lignes de la table référencée
dans l’étape de flux.
La couche de confiance Einstein peut être utilisée pour masquer les données à caractère
personnel (PII), en utilisant le masquage des données basé sur un modèle, avant qu’elles ne
soient envoyées au LLM. À l’aide de techniques de machine learning et de correspondance de
modèles, les données à caractère personnel dans les requêtes sont remplacées par des jetons
génériques, puis affichées avec les valeurs d’origine dans la réponse. Pour plus d’informations
sur la configuration du masquage des données, consultez Sélection des données à masquer
dans l’aide de Salesforce. Pour ajouter une couche de protection supplémentaire, la couche de
confiance Einstein garantit qu’après avoir traité la requête et la réponse, le LLM oublie à la fois
l’un et l’autre.
Vous pouvez afficher votre consommation des données dans votre organisation Salesforce à
l’aide de tableaux de bord prédéfinis et du portefeuille numérique. Vous pouvez aussi vous
connecter à vos données Data Cloud depuis Tableau et créer des visualisations à l’aide des
données des tables du portefeuille numérique. Pour plus d’informations, consultez Afficher
l’utilisation des requêtes Einstein.
Vous trouverez ci-dessous la liste des actions de transformation que Tableau Agent prend en
charge actuellement. Pour plus d’informations sur les limitations de Tableau Agent, consultez
Limitations de Tableau Agent pour Tableau Prep sur la page 306 plus loin dans cette
rubrique.
l Mettre en minuscules
Tableau Agent n’est pas en mesure de se connecter à vos sources de données, d’intégrer des
données supplémentaires pour vous, d’optimiser l’échantillonnage ou de créer des étapes des
données entrantes. Commencez donc par vous connecter à vos données et importez les tables
avec lesquelles vous souhaitez travailler dans l’espace de travail Flux.
1. Dans le volet Flux, sélectionnez l’icône Tableau Agent dans la barre d’outils à côté de
Alertes.
Remarque : si vous ne voyez pas l’icône, vérifiez que vous êtes connecté à un site
Tableau Cloud (Serveur > Connexion dans Tableau Prep Builder) sur lequel
Tableau+ et l’IA dans Tableau pour Tableau Prep sont activés.
2. Lorsque le volet s’ouvre, cliquez sur J’ai compris pour confirmer que vous avez pris
connaissance de la clause de non-responsabilité et démarrez. Vous devrez peut-être
Tableau Agent n’est pas un chatbot ouvert. Il fonctionne uniquement au sein de votre ensemble
de données et ne peut effectuer qu’un ensemble spécifique d’actions liées au nettoyage et à la
transformation des données de votre flux. Par exemple, Tableau Agent peut vous aider à scinder
des champs, à permuter ou à agréger vos données, mais il ne peut pas répondre à des questions
ouvertes du type « Parle-moi de ce flux » ou « Parle-moi de la table Commandes plus en détail ».
Remarque : actuellement, Tableau Agent ne peut pas exécuter le flux ou programmer son
exécution, ni créer des étapes de sortie, ni vous aider lors de certains types d’étapes,
comme les étapes de jointure, d’union, de script ou de prédiction. Pour plus d’informations,
consultez Limitations de Tableau Agent pour Tableau Prep sur la page 306.
1. Dans le volet Flux, sélectionnez l’étape à laquelle vous souhaitez que Tableau Agent
applique l’action de nettoyage. Sélectionnez un type d’étape, par exemple saisie de
données, nettoyage ou autre étape prise en charge.
Actuellement, étant donné que Tableau Agent fonctionne sur la base d’une étape
spécifique, vous devez donc d’abord sélectionner l’étape à laquelle vous souhaitez
effectuer une action. Si vous souhaitez effectuer des opérations de nettoyage sur des
tables présentes dans des étapes séparées, vous devrez effectuer cette opération une
étape à la fois.
2. Dans le volet Tableau Agent, décrivez l’action pour laquelle vous sollicitez l’aide de
Tableau Agent.
Conseil : pour optimiser les résultats obtenus avec Tableau Agent, soyez précis dans
votre requête et fournissez autant de détails que possible pour aider Tableau Agent à
comprendre le contexte. Dans cet exemple, la valeur de notre champ utilise deux
délimiteurs différents. En incluant ces informations dans la requête Peux-tu diviser le
champ Détails du vol pour que j’aie des champs séparés pour la date, le numéro
de vol, le départ, la destination, la classe et le prix ? Dans le champ Détails du vol,
les données « Départ » et « Destination » s’affichent avec un tiret. Par exemple
« Tokyo-New York ». Tableau Agent peut alors mieux comprendre la requête et
suggérer les actions appropriées.
3. Lorsque votre requête est prête, cliquez sur la flèche dans la zone de texte pour la
transmettre à Tableau Agent. Tableau Agent indexe les données dans l’étape que vous
avez sélectionnée pour évaluer votre requête par rapport aux données. Ensuite, la
requête est transmise à un modèle d’invite, qui est ensuite transmis au modèle de
langage de grande taille (LLM) qui traite les données et renvoie un plan.
5. Cliquez sur Appliquer pour appliquer chaque étape individuellement ou cliquez sur
Appliquer tout, dans quel cas Tableau Agent appliquera toutes les étapes du plan.
6. Évaluez le résultat pour vous assurer que Tableau Agent a fait ce que vous attendiez. Une
coche verte apparaît à côté de chaque étape qui a été menée à bien. Vous pouvez évaluer
et modifier toutes les modifications répertoriées dans le volet Modifications et également
7. Continuez à demander à Tableau Agent de nettoyer vos données, puis ajoutez une étape
Sortie afin de terminer votre flux.
Grâce à Tableau Agent, il n’a jamais été aussi facile de créer des champs calculés. Lancez
Tableau Agent depuis la boîte de dialogue Calcul, décrivez simplement un calcul et Tableau
Agent créera la formule, ce qui vous permet d’ajouter en un seul clic des champs calculés
puissants à vos flux Prep. Auparavant, la création de formules pour les champs calculés
nécessitait une compréhension des objets et des champs, des fonctions disponibles et de
diverses limitations basées sur les types de données, les types de formules, etc.
2. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche de profil ou une grille de données, cliquez sur le menu Options supplémentaires
3. Cliquez sur Créer avec Tableau Agent. La boîte de dialogue de calcul se ferme et le volet
Tableau Agent s’ouvre.
4. Dans le volet Conversation, sélectionnez J’ai compris pour confirmer que vous avez pris
connaissance de la décharge de responsabilité, puis démarrez.
5. Étant donné que vous avez ouvert Tableau Agent depuis la boîte de dialogue de calcul, il
est déjà rempli avec votre intention. Dans la zone de texte de Tableau Agent, décrivez le
calcul souhaité. Fournissez autant de détails que possible afin d’obtenir les meilleurs
résultats possibles.
6. Lorsque votre requête est prête, cliquez sur la flèche dans la zone de texte pour la
transmettre à Tableau Agent.
Remarque : si Tableau Agent ne peut pas fournir un calcul valide, vous pouvez
nous faire part de vos commentaires.
7. Évaluez le résultat pour vous assurer que c’est ce que vous recherchez. Cliquez sur
Modifier pour ouvrir la boîte de dialogue de calcul et personnalisez le calcul
manuellement et appliquez-le. Sinon, cliquez sur Appliquer et Tableau Agent ajoute le
calcul à votre flux.
Exemples de calcul
Remarque : parfois, Tableau Agent affiche le calcul suggéré dans le volet Tableau Agent
pour que vous puissiez le vérifier et l’appliquer, et parfois, il n’affiche qu’une description
résumée que vous pouvez appliquer, puis vérifier et modifier dans le volet Modifications.
Exemple de calcul 1 :
Rapide : Écrire un calcul pour trouver le nom du mois des commandes dans le champ Date de
commande.
Exemple de calcul 2 :
Rapide : Écrire un calcul pour limiter les valeurs du champ Quantité à une valeur maximale de 10.
Dans cet exemple, une invite supplémentaire est ajoutée pour affiner les calculs afin de
conserver les valeurs supérieures au seuil.
Rapide : Si la quantité est supérieure à 10, la remplacer par le texte « Au-dessus du seuil » et
conserver les valeurs d’origine.
Formulez expli- Tableau Agent fait de son mieux pour Si vous souhaitez que Tableau
citement votre déduire votre intention, mais il peut arri- Agent scinde un champ, indi-
intention ver que sa compréhension ne soit pas quez-lui les champs que vous
correcte. souhaitez qu’il crée. Ou si vous
souhaitez que Tableau Agent
crée un calcul, commencez par
exemple votre requête par la
phrase « Créer un calcul qui... »
Masquez les Des champs qui portent le même nom Masquez les champs dont vous
champs non dans votre ensemble de données n’avez pas besoin et Tableau
pertinents peuvent être sources de confusion pour Agent n’utilisera pas ces
Tableau Agent. champs masqués.
Attention aux Tableau Agent est capable de com- Reportez-vous aux champs spé-
synonymes prendre les synonymes courants. Par cifiques qui vous intéressent
exemple, il saurait que les « titres » et pour aider Tableau Agent à être
« films » peuvent s’appliquer à un plus précis.
champ appelé « films ». Par contre, il
ne connaît aucune terminologie ou acro-
nyme spécifique à votre entreprise que
vous pouvez éventuellement utiliser.
Utilisez un lan- Tableau Agent peut analyser votre Plus votre requête contient de
gage spé- source de données à la recherche des détails, plus Tableau Agent est
cifique dans noms de champs et des données de en mesure de fournir une visua-
vos demandes ces champs, mais il ne comprend pas lisation pertinente.
vraiment les données comme le ferait
un humain.
Décomposez Tableau Agent peut créer un plan par Décomposez vos tâches en
les tâches com- étapes, mais il peut avoir du mal à différentes parties et répétez le
Posez des Tableau Agent n’est pas un chatbot à Posez des questions ciblées sur
questions por- usage général. Il ne peut pas répondre l’exécution d’actions de net-
tant uni- à des questions consultatives telles que toyage spécifiques de vos don-
quement sur « comment nettoyer mes données ? » nées et l’itération du processus
vos données ou des questions générales telles que pour les résultats.
« quelle est la meilleure race de chat
pour un animal de compagnie ? »
Types d’analyses
Tableau Agent ne prend pas encore en charge les questions de type consultatif, telles que
« Que fait ce flux ? », « Peux-tu m’expliquer ce calcul ? » ou vous aider à résoudre les
problèmes de votre flux, par exemple « Comment corriger cette erreur ? » Au lieu de cela,
demandez-lui de vous assister dans des tâches de nettoyage spécifiques, telles que « Extraire
le code bancaire du code de transaction » ou « Additionner les transactions par banque et par
mois ».
l Choisir une source de données pour vous ou ajouter des données au flux, par exemple
des unions d’entrée
l Procéder à des modélisations de données, telles que des jointures et des unions
l Prendre en charge certains types d’étapes, par exemple les prédictions, les scripts et les
étapes de sortie
l Fournir une réponse qui nécessite l’analyse de plus d’une étape du flux
l Ramifier le flux. Actuellement, Tableau Agent ne peut créer que des étapes linéaires.
l Prendre en charge toutes les langues. Tableau Agent prend en charge l’anglais (en_US)
et un sous-ensemble d’autres langues. Si les noms et valeurs des champs de votre source
de données ne sont pas dans la même langue que vos paramètres de langue utilisateur ou
ne sont pas identiques à la langue dans laquelle vous interagissez avec Tableau Agent,
utilisez le nom et les valeurs exacts du champ dans vos demandes. Pour plus
d’informations sur les langues actuellement prises en charge par Tableau Agent,
consultez Langues et paramètres régionaux pris en charge par IA dans Tableau.
Lors du nettoyage de vos données, vous répétez souvent les mêmes actions ou opérations de
nettoyage tout au long de votre flux. Pour optimiser le nettoyage et l’organisation de vos
données, vous pouvez copier-coller les opérations ou les actions tout au long de votre flux, ou
même copier des étapes ou des groupes sélectionnés et les enregistrer. Vous pouvez ainsi
effectuer des actions ou des opérations de nettoyage une seule fois, puis les réutiliser là où vous
en avez besoin. Vous pouvez même dupliquer des champs pour expérimenter différentes
opérations de nettoyage.
Pour plus d’informations sur la création de groupes dans votre flux, consultez Regrouper des
étapes sur la page 168 (version 2020.3.3 et versions ultérieures).
1. Dans le volet Flux, sélectionnez une ou plusieurs étapes ou groupes dans le flux.
2. Cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) sur l’étape sélectionnée et
sélectionnez Copier.
3. Pour coller les étapes copiées, effectuez l’une des opérations suivantes :
l
Survolez une étape jusqu’à ce que l’icône plus apparaisse, puis cliquez sur
l’icône et sélectionnez Coller dans le menu.
l Cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) dans n’importe quel
espace blanc sur l’espace de travail et cliquez sur Coller.
4. Si vous avez collé les étapes dans l’espace blanc du flux, faites glisser les étapes là où
vous les souhaitez dans le flux et déposez-les. Si vous ajoutez des étapes à la fin d’une
étape de flux, les étapes sont automatiquement ajoutées à la fin de l’étape. Si vous insérez
des étapes entre les étapes de flux existantes, déplacez les étapes là où vous les
souhaitez dans le flux et corrigez les erreurs éventuelles.
Vous pouvez supprimer des lignes du flux ou déplacer des étapes selon vos besoins. Par
exemple, pour connecter une étape aux étapes copiées, supprimez la ligne de flux
existante s’il y en a une, puis faites glisser l’étape existante vers la nouvelle étape et
déposez-la sur Ajouter.
l Copiez une opération depuis le volet Modifications dans une étape et collez-la dans le
volet Modifications de la même étape ou d’une autre étape pour appliquer la même
Pour copier et coller une modification apportée à une étape dans la même étape ou dans une
autre étape, procédez comme suit :
3. Dans le volet Modifications où vous voulez coller la modification, cliquez avec le bouton
droit de la souris ou Ctrl-clic (MacOS) et sélectionnez Coller. Sélectionnez la modification
Pour faire glisser et déposer une modification dans d’autres zones de l’étape, procédez comme
suit :
1. Dans le volet Profil, dans la grille de données, dans le volet Résultats ou dans la liste,
sélectionnez le champ que vous souhaitez copier.
Un nouveau champ est créé avec le même nom et un modificateur. Par exemple, « Ship Date -1
».
Remarque : les étapes de flux réutilisables ne peuvent pas être créées sur le Web, mais
vous pouvez les utiliser dans vos flux Web. Les étapes réutilisables qui incluent des
étapes des données entrantes basées sur des fichiers ne sont pas encore prises en
charge sur le Web.
Si vous répétez souvent les mêmes actions et que vous souhaitez appliquer ces mêmes étapes
dans d’autres flux, Tableau Prep Builder version 2019.3.2 et versions ultérieures vous permet
de sélectionner un(e) ou plusieurs étapes ou groupes de flux et leurs actions associées ou le
flux tout entier et de les enregistrer localement dans un fichier sur votre ordinateur. Vous pouvez
également les publier sur Tableau Server ou Tableau Cloud afin de les partager avec d’autres
personnes.
Lorsque les étapes de flux sont publiées sur votre serveur, une balise Étapes enregistrées est
automatiquement ajoutée afin que vous puissiez facilement les rechercher et les trouver lorsque
vous les ajoutez à vos flux.
À partir de la version 2022.1.1, vous pouvez créer des étapes réutilisables qui incluent des
paramètres. Lorsque les étapes sont enregistrées, le paramètre est converti en une valeur
statique à l’aide de la Valeur actuelle du paramètre. Pour plus d’informations sur l’utilisation de
paramètres dans les flux, consultez Créer et utiliser des paramètres dans les flux sur la
page 225.
2. Cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) sur une étape sélectionnée
et sélectionnez Enregistrer les étapes en tant que flux.
4. Si vous publiez le flux sur Tableau Server ou Tableau Cloud, connectez-vous à votre
serveur si nécessaire, renseignez les champs dans la boîte de dialogue Publier le flux
puis cliquez sur Publier.
3. Dans la boîte de dialogue Ajouter un flux, sélectionnez parmi les flux enregistrés dans
votre fichier local ou sur votre serveur, puis cliquez sur Ajouter. La liste des flux est
automatiquement filtrée pour afficher les flux étiquetés avec les étapes enregistrées.
Pour insérer d’autres flux, modifiez le type de flux sur Tous les flux.
Dans Tableau Prep Builder depuis la version 2019.4.2 et sur le Web, vous pouvez cliquer
sur Afficher le flux pour ouvrir et afficher le flux publié sur le serveur auquel vous êtes
connecté.
4. Le flux est ajouté au volet Flux. Si vous ajoutez un flux à la fin d’une étape de flux, les
étapes de flux sont automatiquement ajoutées à la fin de l’étape. Si vous insérez des
étapes de flux entre les étapes de flux existantes, déplacez les étapes là où vous les
souhaitez dans le flux et corrigez les erreurs éventuelles.
Si vous avez des lacunes dans votre ensemble de données séquentielles, vous devrez peut-être
combler ces lacunes avec de nouvelles lignes pour analyser efficacement vos données ou
réaliser une analyse des tendances. Vous pouvez utiliser le type d’étape Nouvelles lignes pour
générer les lignes manquantes et définir les options de configuration permettant d’obtenir les
résultats dont vous avez besoin.
De nouvelles lignes peuvent être générées pour les champs comportant des valeurs
numériques (nombres entiers) ou de date. Les options de configuration incluent :
l Générer des lignes à l’aide des valeurs d’un seul champ ou de deux champs
l Utiliser toutes les données du champ ou sélectionner une plage de valeurs
l Créer un nouveau champ avec les résultats ou ajouter les nouvelles lignes à vos champs
existants
l Définir l’incrément (jusqu’à 10 000) à utiliser lors de la génération des nouvelles lignes
l Définir les valeurs des nouvelles lignes sur la valeur zéro ou des valeurs null, ou copier la
valeur de la ligne précédente.
Exemples
l Exemple 1 : Vous disposez d’un tableau de données de vente, mais il y a certains jours
où aucune vente n’est enregistrée. Vous avez besoin d’une ligne pour chaque jour, et pas
seulement pour les jours où vous avez eu des ventes. Avec Nouvelles lignes, vous
pouvez générer des lignes pour vos jours manquants et les ajouter à votre champ
existant « Jours de la semaine ». Étant donné qu’aucune vente n’est enregistrée pour ces
jours, vous souhaitez que la valeur de la quantité vendue soit égale à zéro.
entre les deux dates et créer un nouveau champ appelé « Tous les jours » pour conserver
vos données d’origine.
1. Dans le volet Flux, cliquez sur l’icône plus et sélectionnez Nouvelles lignes. Une
étape Nouvelles lignes s’affiche dans le volet Flux.
Effectuez les étapes suivantes pour configurer vos options afin de générer les nouvelles
lignes.
2. Comment souhaitez-vous ajouter de nouvelles lignes ? Utilisez l’une des options sui-
vantes pour sélectionner le ou les champs où des lignes sont manquantes.
a. Valeurs d’un champ : génère les lignes manquantes à partir des valeurs d’un seul
champ. Utilisez cette option pour les types de données Nombre (entier) ou Date.
Par défaut, utilisez les valeurs minimum et maximum pour générer les lignes
manquantes. Cette option utilise toutes les valeurs du champ. Si vous souhaitez
uniquement utiliser une plage de valeurs pour générer les lignes manquantes,
définissez une valeur de début et une valeur de fin.
champ pour conserver vos données d’origine. Lorsque vous utilisez des plages de
valeurs à partir de deux champs, vous devez créer un nouveau champ.
4. Spécifier votre valeur d’incrément : saisissez une valeur comprise entre 1 et 10 000.
Chaque nouvelle ligne est incrémentée de la valeur que vous sélectionnez. Si vous sélec-
tionnez une valeur supérieure à l’écart entre les valeurs, aucune nouvelle ligne n’est géné-
rée.
l Champs numériques : sélectionnez une valeur numérique.
l Champs de date : sélectionnez une valeur numérique et sélectionnez Jour,
Semaine ou Mois.
5. Quelles valeurs vos nouvelles lignes doivent-elles avoir ? : sélectionnez une option
pour renseigner les autres valeurs de champ pour les nouvelles lignes.
l Valeurs null : remplissez toutes les valeurs de champ avec des valeurs null.
l Valeurs null ou zéro : remplissez toutes les valeurs de texte avec des valeurs null
et toutes les valeurs numériques avec zéro.
l Copier à partir de la ligne précédente : remplissez toutes les valeurs de champ
avec la valeur de la ligne précédente.
Les nouvelles lignes sont affichées en gras dans le volet Lignes générées lorsque vous entrez
vos paramètres de configuration. Les détails de la ligne sont affichés dans le volet Résultats
des nouvelles lignes.
Vous pouvez utiliser des champs calculés pour créer de nouvelles données en utilisant les
données déjà présentes dans votre source de données. Tableau Prep prend en charge de
nombreux types de calcul identiques à ceux de Tableau Desktop. Pour des informations
générales sur la création de calculs, consultez Démarrer avec les calculs dans Tableau.
Remarque : lors de la création d’un champ calculé, n’utilisez pas le nom réservé
« Nombre d’enregistrements ». L’utilisation de ce nom réservé entraînera une erreur liée
aux autorisations.
Depuis la version 2020.1.3 Tableau Prep Builder et sur le Web, vous pouvez utiliser les fonctions
analytiques de niveau de détail (LOD) FIXED, RANK et ROW_NUMBER pour effectuer des
calculs plus complexes.
Par exemple, ajoutez un calcul LOD FIXED pour modifier la granularité des champs de votre
table, utilisez la fonction analytique ROW_NUMBER () pour trouver rapidement les lignes en
double, ou utilisez l’une des fonctions RANK () afin de trouver les valeurs N supérieures ou N
inférieures pour une sélection de lignes comportant des données similaires. Si vous souhaitez
être guidé lors de la création de ces types d’expressions, vous pouvez utiliser l’éditeur de calcul
visuel.
Depuis la version 2021.4.1 de Tableau Prep Builder et sur le Web, vous pouvez utiliser la
fonctionnalité de section pour répartir les lignes dans un nombre spécifié de compartiments.
Remarque : certaines fonctions prises en charge dans Tableau Desktop peuvent ne pas
être encore compatibles dans Tableau Prep. Pour voir les fonctions disponibles pour
Tableau Prep, consultez la liste des fonctions dans l’éditeur de calcul.
Tableau Prep prend en charge l’expression LOD FIXED et utilise la syntaxe {FIXED
[Field1],[Field2] : Aggregation([Field)}.
Dans les expressions LOD, les deux parties de l’équation sont séparées par un signe deux-
points.
l FIXED [Champ] (obligatoire) : il s’agit du ou des champs pour lesquels vous souhaitez
calculer les valeurs. Par exemple, si vous souhaitez connaître le total des ventes pour un
client et une région, vous devez entrer FIXED [Customer ID], [Region]:. Si vous
ne sélectionnez aucun champ, cela équivaut à effectuer l’agrégation définie sur le côté
droit des deux-points et à répéter cette valeur pour chaque ligne.
Si vous utilisez cette fonctionnalité dans Tableau Prep, les exigences suivantes s’appliquent :
l L’imbrication d’expressions dans une expression LOD n’est pas prise en charge. Par
exemple, { FIXED [Region] : AVG( [Sales] ) / SUM( [Profit] )} n’est
pas pris en charge.
l La combinaison d’une expression LOD avec une autre expression n’est pas prise en
charge. Par exemple, [Sales]/{ FIXED [Country / Region]:SUM([Sales])}
n’est pas pris en charge.
Éditeur de calcul
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans
une fiche Profil ou une grille de données, cliquez sur le menu Options
2. Dans l’éditeur de calcul, saisissez un nom pour votre calcul et entrez l’expression.
Par exemple, pour trouver le nombre moyen de jours pour expédier des produits
par ville, créez un calcul tel que celui présenté ci-dessous.
1. Dans une fiche de profil ou un volet de résultats, cliquez sur le menu Options
souhaitez calculer les valeurs. Le champ dans lequel vous avez sélectionné
l’option de menu Créer un champ calculé > LOD fixe est ajouté par défaut.
Cliquez sur l’icône pour ajouter des champs supplémentaires à votre cal-
cul. Le côté gauche de l’équation est alors rempli, {FIXED [Field1],
[Field2] :.
3. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet
Modifications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur
Modifier pour ouvrir l’éditeur visuel de calcul et apporter les modifications
nécessaires.
l PARTITION (facultatif) : désignez les lignes sur lesquelles vous voulez effectuer le calcul.
Vous pouvez spécifier plus d’un champ, mais si vous voulez utiliser la table entière,
omettez cette partie de la fonction. Tableau Prep traitera alors toutes les lignes comme la
partition. Par exemple {ORDERBY [Sales] : RANK() }.
l DESC ou ASC (facultatif) : représente l’ordre décroissant (DESC) ou croissant (ASC). Par
défaut, le classement est trié par ordre décroissant, il n’est donc pas nécessaire de le
préciser dans l’expression. Si vous souhaitez changer l’ordre de tri, ajoutez ASC à
l’expression.
Vous pouvez également inclure les deux options dans la fonction. Par exemple, si vous
souhaitez classer une sélection de lignes, mais que vous voulez trier les lignes par ordre
croissant, puis appliquer le classement par ordre décroissant, vous devez inclure ces deux
options dans l’expression. Par exemple : {PARTITION [Country], [State]:
{ORDERBY [Sales] ASC,[Customer Name] DESC: RANK() }}
l L’imbrication d’expressions dans une fonction RANK () n’est pas prise en charge. Par
exemple, [Sales]/{PARTITION [Country]: {ORDERBY [Sales]: RANK() }}
/ SUM( [Profit] )} n’est pas pris en charge.
l La combinaison d’une fonction RANK () avec une autre expression n’est pas prise en
charge. Par exemple, [Sales]/{PARTITION [Country]: {ORDERBY [Sales]:
RANK() }} n’est pas pris en charge.
Exemple de
calcul :
{ORDERBY
[Commission]
DESC: RANK()}
Exemple de
calcul :
{ORDERBY
[Commission]
DESC: RANK_
DENSE()}
Exemple de
calcul :
{ORDERBY
[Commission]
DESC: RANK_
MODIFIED()}
Exemple de
calcul :
{ORDERBY
[Commission]
DESC: RANK_
PERCENTILE()}
Remarque
: en cas
d’égalité,
Tableau
Prep
arrondit au
niveau
inférieur,
comme
pour
PERCENT_
RANK ()
dans SQL.
Exemple de
calcul :
{ORDERBY
[Commission]
DESC: ROW_
NUMBER()}
L’exemple suivant montre une comparaison de chacune des fonctions ci-dessus appliquées au
même ensemble de données.
de calcul visuel : vous sélectionnez vos champs et Tableau Prep écrit le calcul pour vous.
Remarque : les calculs ROW_NUMBER () ne sont pas disponibles dans l’éditeur de calcul
visuel.
Éditeur de calcul
Utilisez l’éditeur de calcul pour créer l’un des calculs RANK () ou ROW_NUMBER () pris en
charge. La liste des calculs analytiques pris en charge est affichée dans l’éditeur de calcul dans
le menu déroulant Référence sous Analytique.
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires et
sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, saisissez un nom pour votre calcul et entrez l’expression.
Par exemple, pour trouver la dernière commande d’un client, créez un calcul tel que celui
présenté ci-dessous, puis ne conservez que les lignes de commande du client qui sont
classées avec le chiffre 1.
Cet exemple utilise l’exemple d’ensemble de données Superstore dans Tableau Prep Builder
pour trouver et supprimer les valeurs exactes en double pour le champ ID de ligne en utilisant
la fonction ROW_NUMBER.
2. Dans le volet Flux, pour l’étape des données entrantes Orders West (Commandes
région Ouest), cliquez sur l’étape Nettoyer Renommer les États.
5. Dans le nouveau champ calculé, faites un clic droit ou faites un Cmd-clic (MacOS) sur la
valeur 1 du champ, puis sélectionnez Conserver uniquement dans le menu.
Avant Après
1. Dans une fiche de profil ou un volet de résultats, cliquez sur le menu Options
Après avoir sélectionné votre premier champ, cliquez sur le l’icône plus pour
ajouter des champs supplémentaires à votre calcul. Si vous souhaitez inclure toutes
les lignes ou supprimer un champ sélectionné, faites un clic droit ou Cmd-clic
(MacOS) dans la zone de liste déroulante des champs de la section Regrouper par
et sélectionnez Supprimer le champ.
l Dans la section Regrouper par, sélectionnez les champs que vous voulez utiliser
pour calculer vos nouvelles valeurs. Le champ dans lequel vous avez sélectionné
l’option de menu Créer un champ calculé >Classement est ajouté par défaut.
Cliquez sur l’icône plus pour ajouter des champs supplémentaires à votre
calcul, puis sélectionnez votre type de Classement. Cliquez sur l’icône de tri
pour modifier l’ordre de classement de décroissant (DESC) à croissant (ASC).
3. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet
Modifications, vous pouvez voir le calcul que Tableau Prep Builder a généré. Cliquez
sur Modifier pour ouvrir l’éditeur visuel de calcul et apporter les modifications
nécessaires.
Calcul de sections
Utilisez la fonction Section pour répartir les lignes dans un nombre spécifié de compartiments en
créant un champ calculé. Vous sélectionnez les champs selon lesquels vous souhaitez répartir et
le nombre de groupes (sections) à utiliser. Vous pouvez également sélectionner des champs
supplémentaires pour créer des partitions où les lignes de section sont réparties en groupes.
Utilisez l’éditeur de calcul pour saisir la syntaxe manuellement ou utilisez l’éditeur de calcul visuel
pour sélectionner les champs. Tableau Prep écrit alors le calcul pour vous.
Par exemple, si vous avez des lignes de données d’élèves et que vous souhaitez voir quels
élèves se situent dans les 50 % supérieurs et les 50 % inférieurs, vous pouvez regrouper les
données en deux sections.
L’exemple suivant montre deux groupes pour la moitié supérieure et la moitié inférieure des
notes des élèves. La syntaxe pour cette méthode est la suivante :
Vous pouvez également créer une partition, où chaque valeur d’un champ est une partition
distincte, et diviser les données en groupes pour chaque partition.
L’exemple suivant montre la création de partitions pour le champ de matière. Une partition est
créée pour chaque matière et deux groupes (sections) sont créés pour le champ Note. Les
lignes sont ensuite réparties uniformément dans les deux groupes pour les trois partitions. La
syntaxe pour cette méthode est la suivante :
l Dans la section Regrouper par, sélectionnez les champs des lignes pour lesquels
vous souhaitez calculer les valeurs. La partie PARTITION du calcul est alors
créée. Vous pouvez avoir plusieurs champs Regrouper par pour un seul calcul.
Cliquez sur l’icône pour ajouter des champs supplémentaires à votre calcul. Si
vous souhaitez inclure toutes les lignes ou supprimer un champ sélectionné, faites
un clic droit ou Cmd-clic (MacOS) dans la zone de liste déroulante des champs de
la section Regrouper par et sélectionnez Supprimer le champ.
6. Dans le volet Modifications, vous pouvez voir le calcul que Tableau Prep Builder a
généré. Cliquez sur Modifier pour ouvrir l’éditeur visuel de calcul et apporter les
modifications nécessaires.
L’exemple suivant montre une division de lignes par quartiles. Une partition est créée sur
la base de quatre régions des États-Unis, puis les données du champ Ventes sont
regroupées de manière uniforme dans les partitions.
Éditeur de calcul
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires
et sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, saisissez un nom pour votre calcul et entrez l’expression. Par
exemple, pour classer les lignes d’étudiants par niveau en deux groupes puis les
regrouper par matière, utilisez :{PARTITION [Subject]:{ORDERBY [Grade]
DESC:NTILE(2)}}.
l NTILE (obligatoire) : NTILE est l’entier dans lequel les lignes sont divisées.
Remarque : lorsque toutes les lignes sont divisibles par la clause NTILE, la
fonctionnalité divise les lignes de manière égale entre le nombre de
sections. Lorsque le nombre de lignes n’est pas divisible par la clause
NTILE, les groupes résultants sont divisés en compartiments de tailles
différentes.
Les calculs multilignes vous permettent de calculer des valeurs entre plusieurs lignes de
données dans votre flux. S’ils sont similaires aux calculs de table dans Tableau, les calculs
multilignes s’appliquent à l’intégralité de votre ensemble de données lorsque vous exécutez
votre flux. Vous pouvez également vous baser sur le résultat en utilisant d’autres types de
calculs.
Remarque : lors de la création d’un champ calculé, n’utilisez pas le nom réservé
« Nombre d’enregistrements ». L’utilisation de ce nom réservé entraînera une erreur liée
aux autorisations.
Dans Tableau, les calculs de table ne s’appliquent qu’aux valeurs de votre visualisation. Bien que
vous puissiez vous baser sur le résultat, vous devez utiliser un autre calcul de table pour le faire.
Pour plus d’informations sur l’utilisation des calculs de table dans Tableau, consultez
Transformer des valeurs avec des calculs de table.
L’exécution de calculs de table lors de la préparation des données peut offrir une plus grande
flexibilité pour l’analyse des données dans Tableau. Vous pouvez facilement réutiliser le calcul
lors de la création de votre vue et le calcul sous-jacent n’est pas affecté par le filtrage. Les temps
de chargement des classeurs pour les grands ensembles de données peuvent être plus rapides
car le calcul de la table n’est pas recalculé après l’exécution de la requête.
l Différence par rapport à : calcule la différence entre la valeur de ligne actuelle et une
autre valeur.
l Différence de pourcentage par rapport à : calcule la différence entre la valeur de la
ligne actuelle et une autre valeur sous forme de pourcentage.
l Calculs mobiles : renvoient la somme ou la moyenne d’un champ numérique dans un
ensemble flexible de lignes.
l Remplir les calculs : calcule et renseigne les données manquantes dans les lignes ci-
dessus.
l Exécution de calculs : calcule la somme ou la moyenne des valeurs dans une colonne.
Utilisez l’éditeur de calcul visuel pour générer rapidement le calcul ou écrivez votre propre calcul
personnalisé dans l’éditeur de calcul.
Un calcul Différence par rapport à calcule la différence entre la valeur actuelle et une valeur N
lignes avant ou après la ligne actuelle.
1. Dans une fiche Profil ou un volet de résultats, cliquez sur le menu Options
2. Dans la section Regrouper par, sélectionnez les champs comportant les lignes que vous
souhaitez inclure dans le calcul. Cette option partitionne votre table lors de l’exécution du
calcul. Pour appliquer le calcul à toutes les lignes de la table, acceptez la valeur par
Après avoir sélectionné votre premier champ, cliquez sur l’icône Plus pour ajouter des
champs Regrouper par supplémentaires à votre calcul. Pour réorganiser ou supprimer
des champs, faites un clic droit ou Ctrl-clic (MacOS) et sélectionnez une action dans le
menu.
3. Dans la section Organiser par, sélectionnez les champs que vous voulez utiliser comme
ordre de tri. Ce champ sert à spécifier comment la fonction LOOKUP organise les lignes de
votre table.
Cliquez sur l’icône Plus pour ajouter des champs Organiser par supplémentaires à
votre calcul. Cliquez sur l’icône de tri pour modifier l’ordre de décroissant (ASC) en
croissant (DESC). Vous pouvez également faire un clic droit ou Ctrl-clic (MacOS) et
sélectionner une action dans le menu pour réorganiser ou supprimer des champs.
4. Dans la section Calculer au moyen de, sélectionnez le champ comprenant la valeur que
vous souhaitez utiliser pour calculer vos résultats.
5. Dans la section Différence par rapport à, sélectionnez les lignes à utiliser pour calculer la
différence. Sélectionnez par exemple Valeur précédente, 2 pour calculer la différence
entre la valeur actuelle et une valeur 2 lignes avant cette valeur. Les annotations mettent
en évidence les lignes utilisées pour effectuer le calcul.
Par défaut, l’aperçu du calcul vous montrera la première ligne de valeur non null.
Cependant, vous pouvez cliquer sur n’importe quelle ligne de la table des résultats et voir
un aperçu actualisé de la valeur sélectionnée.
Si le calcul ne peut pas être effectué avec les paramètres actuels, l’annotation Nombre
insuffisant de données s’affiche. Pour résoudre ce problème, sélectionnez une valeur
actuelle différente ou modifiez la configuration dans la section Différence par rapport à.
6. Dans le volet de gauche, double-cliquez sur l’en-tête du champ et entrez un nom pour
votre calcul.
7. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet
Modifications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur
Modifier pour ouvrir l’éditeur visuel de calcul et apporter les modifications nécessaires.
Éditeur de calcul
Si vous voulez écrire votre propre calcul pour calculer la différence entre deux valeurs, utilisez la
fonction LOOKUP dans l’éditeur de calcul.
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires et
sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression. Par exemple, pour trouver la différence entre
les ventes actuelles et les ventes de la veille par région, créez un calcul du type suivant :
1. Dans une fiche Profil ou un volet de résultats, cliquez sur le menu Options
2. Dans la section Regrouper par, sélectionnez les champs comportant les lignes que vous
souhaitez inclure dans le calcul. Cette option partitionne votre table lors de l’exécution du
calcul. Pour appliquer le calcul à toutes les lignes de la table, acceptez la valeur par défaut
Table complète.
Après avoir sélectionné votre premier champ, cliquez sur l’icône Plus pour ajouter des
champs Regrouper par supplémentaires à votre calcul. Pour réorganiser ou supprimer
des champs, faites un clic droit ou Ctrl-clic (MacOS) et sélectionnez une action dans le
menu.
3. Dans la section Organiser par, sélectionnez les champs que vous voulez utiliser comme
ordre de tri. Ce champ sert à spécifier comment la fonction LOOKUP organise les lignes de
votre table.
Cliquez sur l’icône Plus pour ajouter des champs Organiser par supplémentaires à
votre calcul. Cliquez sur l’icône de tri pour modifier l’ordre de décroissant (ASC) en
croissant (DESC). Vous pouvez également faire un clic droit ou Ctrl-clic (MacOS) et
sélectionner une action dans le menu pour réorganiser ou supprimer des champs.
4. Dans la section Calculer au moyen de, sélectionnez le champ comprenant la valeur que
vous souhaitez utiliser pour calculer vos résultats.
Par défaut, l’aperçu du calcul vous montrera la première ligne de valeur non null.
Cependant, vous pouvez cliquer sur n’importe quelle ligne de la table des résultats et voir
un aperçu actualisé de la valeur sélectionnée.
Si le calcul ne peut pas être effectué avec les paramètres actuels, vous verrez l’annotation
Nombre insuffisant de données. Pour résoudre ce problème, sélectionnez une valeur
actuelle différente ou modifiez la configuration dans la section Différence de
pourcentage par rapport à.
6. Dans le volet de gauche, double-cliquez sur l’en-tête du champ et entrez un nom pour
votre calcul.
7. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet
Modifications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur
Modifier pour ouvrir l’éditeur visuel de calcul et apporter les modifications nécessaires.
Éditeur de calcul
Si vous voulez écrire votre propre calcul pour calculer la différence de pourcentage entre deux
valeurs, utilisez la fonction LOOKUP dans l’éditeur de calcul.
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires
et sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression. Par exemple, pour trouver la différence de
pourcentage entre les ventes actuelles et les ventes des jours précédents par région,
créez un calcul du type suivant :
Créez un calcul mobile pour mieux comprendre les tendances de vos données et réduire les
fluctuations globales. Dans Tableau Prep, vous pouvez calculer une moyenne mobile ou une
somme sur un nombre spécifié de valeurs avant ou après la valeur actuelle. Par exemple, vous
pouvez suivre la moyenne mobile des ventes sur trois mois par région.
dans le volet de gauche et vous pouvez consulter les résultats du calcul à l’extrême droite du
volet.
1. Dans une fiche Profil ou un volet de résultats, cliquez sur le menu Options
2. Dans la section Regrouper par, sélectionnez les champs comportant les lignes que vous
souhaitez inclure dans le calcul. Cette option partitionne votre table lors de l’exécution du
calcul. Pour appliquer le calcul à toutes les lignes de la table, acceptez la valeur par
défaut Table complète.
Après avoir sélectionné votre premier champ, cliquez sur le l’icône Plus pour ajouter
des champs Regrouper parsupplémentaires à votre calcul. Pour réorganiser ou
supprimer des champs, faites un clic droit ou Ctrl-clic (MacOS) et sélectionnez une action
dans le menu.
3. Dans la section Organiser par, sélectionnez les champs que vous voulez utiliser comme
ordre de tri. Ce champ sert à spécifier comment la fonction LOOKUP organise les lignes de
votre table.
Si le champ où vous avez sélectionné l’option de menu Créer un champ calculé > Calcul
mobile est un champ de date ou d’heure, ce champ est ajouté par défaut, mais vous
pouvez le modifier.
Cliquez sur l’icône Plus pour ajouter des champs Organiser par supplémentaires à
votre calcul. Cliquez sur l’icône de tri pour modifier l’ordre de décroissant (ASC) en
croissant (DESC). Vous pouvez également faire un clic droit ou Ctrl-clic (MacOS) et
sélectionner une action dans le menu pour réorganiser ou supprimer des champs.
4. Dans la section Calculer au moyen de, sélectionnez le champ comprenant la valeur que
vous souhaitez utiliser pour calculer vos résultats.
Pour modifier le paramètre des résultats, cliquez sur le menu déroulant dans le champ
Valeurs. Par exemple, pour calculer la moyenne mobile des ventes du mois en cours et
des 2 mois précédents, définissez Valeurs précédentes sur 2 et fermez la boîte de
dialogue.
6. Par défaut, l’aperçu du calcul vous montrera la première ligne de valeur non null.
Cependant, vous pouvez cliquer sur n’importe quelle ligne de la table des résultats et voir
un aperçu actualisé de la valeur sélectionnée. Les annotations mettent en évidence les
lignes utilisées pour effectuer le calcul.
Si le calcul ne peut pas être effectué avec les paramètres actuels, vous verrez
l’annotation Nombre insuffisant de données. Pour résoudre ce problème, cliquez sur le
menu déroulant dans le champ Valeurs pour modifier la configuration dans Paramètres
des résultats.
7. Dans le volet de gauche, double-cliquez sur l’en-tête du champ et entrez un nom pour
votre calcul.
8. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet
Modifications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur
Modifier pour ouvrir l’éditeur visuel de calcul et apporter les modifications nécessaires.
Éditeur de calcul
Si vous voulez écrire votre propre calcul pour calculer la moyenne mobile ou la somme, utilisez la
fonction LOOKUP dans l’éditeur de calcul.
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires et
sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression. Par exemple, pour trouver la moyenne
mobile des ventes sur trois mois par région, créez un calcul du type suivant :
+
{ PARTITION [Region]:{ ORDERBY [Year of Sale]ASC,[Order Mon-
th]ASC:LOOKUP([Sales],-0)}}
/
3
Si vous devez créer un champ avec la valeur d’une ligne précédente, vous pouvez créer un
calcul personnalisé à l’aide de la fonction LOOKUP.
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires et
sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression. Par exemple, pour trouver la valeur des
ventes précédentes par date de commande, créez un calcul tel que celui présenté ci-
dessous.
Remplir le calcul
Pris en charge dans Tableau Prep Builder à partir de la version 2023.3, Tableau Server à
compter de la version 2023.3 et sur le Web dans Tableau Cloud.
Une opération de remplissage de calcul exécute un calcul et renseigne les données manquantes
afin que les valeurs nulles soient remplacées par les valeurs des lignes ci-dessus, permettant
ainsi de visualiser facilement les données. L’exemple ci-dessous montre les résultats d’un
remplissage de calcul en remplaçant les valeurs null du champ Student par des valeurs basées
sur les lignes ci-dessus.
1. Dans une fiche Profil ou un volet de résultats, cliquez sur le menu Options sup-
2. Dans la section Regrouper par, vous pouvez sélectionner des champs pour partitionner
les données lors de l’exécution du calcul. Si vous ne souhaitez pas que vos données
soient partitionnées, acceptez la valeur par défaut Table complète.
Après avoir sélectionné votre premier champ, vous pouvez ajouter des champs
Regrouper par supplémentaires à votre partition en cliquant sur l’icône Plus . Pour
réorganiser ou supprimer des champs, faites un clic droit ou Ctrl-clic (MacOS) et
sélectionnez une action dans le menu.
3. Dans la section Organiser par, sélectionnez un ou plusieurs champs que vous voulez
utiliser comme ordre de tri. Ce champ sert à spécifier l’ordre des lignes dans une table.
Vous pouvez également ajouter un numéro de ligne source lors de l’étape des données
entrantes issues de fichiers texte, CSV ou Excel pour trier les données dans l’ordre des
sources de données.
4. Cliquez sur l’icône Plus pour ajouter des champs Organiser par supplémentaires à
votre calcul. Vous devez choisir au moins un champ. Cliquez sur l’icône de tri pour
modifier l’ordre de décroissant (ASC) en croissant (DESC). Vous pouvez également faire
un clic droit ou Ctrl-clic (MacOS) et sélectionner une action dans le menu pour réorganiser
ou supprimer des champs.
5. Dans la section Calculer au moyen de, sélectionnez le champ comprenant les valeurs
que vous souhaitez renseigner. Le champ Résultat affiche les valeurs renseignées en
gras.
6. Dans le volet de gauche, double-cliquez sur l’en-tête du champ et entrez un nom pour
votre calcul.
7. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet Modi-
fications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur Modifier
pour ouvrir l’éditeur visuel de calcul et apporter les modifications nécessaires.
Éditeur de calcul
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires
et sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression.
3. Entrez un nom pour le calcul, puis cliquez sur Enregistrer.
Exemples
Exemple de remplissage avec une partition : sur la base des données suivantes, vous
pouvez remplir les valeurs manquantes dans le champ Catégorie de capteur à l’aide de la
fonction LAST_VALUE. Dans cet exemple, Sensor ID est utilisé pour partitionner les
données, Time Stamp est utilisé pour classer les données et Sensor Category est utilisé
pour calculer les données.
Exemple de remplissage sans partition : sur la base des données suivantes, vous pouvez
remplir les valeurs manquantes du champ Student. Le champ Numéro de ligne source a
été ajouté dans une étape des données entrantes et est utilisé pour classer les données
dans l’ordre source. Student est utilisé pour calculer les données.
Calcul mobile
Pris en charge dans Tableau Prep Builder à partir de la version 2023.3, Tableau Server à
compter de la version 2023.3 et sur le Web dans Tableau Cloud.
Un calcul mobile calcule la somme cumulée ou la moyenne d’une valeur et de toutes les valeurs
précédentes de la colonne. L’exemple ci-dessous montre les résultats d’un calcul mobile pour la
somme des ventes au fil du temps.
1. Dans une fiche Profil ou un volet de résultats, cliquez sur le menu Options sup-
2. Dans la section Regrouper par, vous pouvez sélectionner des champs pour partitionner
les données lors de l’exécution du calcul. Si vous ne souhaitez pas que vos données
soient partitionnées, acceptez la valeur par défaut Table complète.
Après avoir sélectionné votre premier champ, vous pouvez ajouter des champs
Regrouper par supplémentaires à votre partition en cliquant sur l’icône Plus . Pour
3. Dans la section Organiser par, sélectionnez un ou plusieurs champs que vous voulez
utiliser comme ordre de tri. Ce champ sert à spécifier l’ordre des lignes dans une table.
Vous pouvez également ajouter un numéro de ligne source lors de l’étape des données
entrantes issues de fichiers texte, CSV ou Excel pour trier les données dans l’ordre des
sources de données.
4. Cliquez sur l’icône Plus pour ajouter des champs Organiser par supplémentaires à
votre calcul. Vous devez choisir au moins un champ. Cliquez sur l’icône de tri pour
modifier l’ordre de décroissant (ASC) en croissant (DESC). Vous pouvez également faire
un clic droit ou Ctrl-clic (MacOS) et sélectionner une action dans le menu pour réorganiser
ou supprimer des champs.
5. Dans la section Résultats, sélectionnez l’agrégation que vous souhaitez effectuer (SUM
ou AVG), pour une somme cumulée ou une moyenne cumulée
6. Vous pouvez toutefois cliquer sur n’importe quelle ligne de la table des résultats et voir un
aperçu actualisé de la valeur sélectionnée. Les annotations mettent en évidence les lignes
utilisées pour effectuer le calcul.
7. Dans le volet de gauche, double-cliquez sur l’en-tête du champ et entrez un nom pour
votre calcul.
8. Cliquez sur Terminé pour ajouter votre nouveau champ calculé. Dans le volet Modi-
fications, vous pouvez voir le calcul que Tableau Prep a généré. Cliquez sur Modifier
pour ouvrir l’éditeur visuel de calcul et apporter les modifications nécessaires.
Éditeur de calcul
1. Dans la barre d’outils du volet Profil, cliquez sur Créer un champ calculé, ou dans une
fiche Profil ou une grille de données, cliquez sur le menu Options supplémentaires
et sélectionnez Créer un champ calculé > Calcul personnalisé.
2. Dans l’éditeur de calcul, entrez l’expression. Par exemple, sur la base des données
suivantes, vous pouvez calculer le total de Ventes au fil du temps en utilisant la fonction
RUNNING_SUM. Les données ne sont pas partitionnées et sont regroupées à l’aide de
Table complète. Le champ Ordre permet de trier par ordre chronologique, et Ventes est
utilisé pour calculer les données.
Les résultats de la somme cumulée sont mis en évidence dans le volet de calcul.
les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de
flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server et
Tableau Cloud.
L’analyse de données à partir d’une feuille de calcul ou d’un tableau croisé peut parfois s’avérer
difficile dans Tableau. Tableau préfère que les données soient « grandes » plutôt que « larges »,
ce qui signifie que vous devez souvent permuter vos données de colonnes en lignes pour que
Tableau puisse les évaluer correctement.
Toutefois, il peut arriver que vos tables de données soient grandes et étroites, et soient trop
normalisées pour permettre une analyse correcte. Prenons par exemple un département de
ventes qui assure le suivi des dépenses de publicité dans deux colonnes, l’une appelée
Publicité et contenant des lignes pour la radio, la télévision et l’impression, et une colonne
pour les dépenses totales. Dans ce type de scénario, pour analyser ces données en tant que
mesures séparées, vous devez permuter ces données de lignes en colonnes.
Utilisez l’une des options suivantes lorsque vous permutez vos données :
Quelle que soit la manière dont vous permutez vos champs, vous pouvez interagir directement
avec les résultats et procéder à des opérations de nettoyage supplémentaires pour que vos
données se présentent comme vous le souhaitez. Vous pouvez également utiliser la fonction de
dénomination intelligente par défaut de Tableau Prep pour renommer automatiquement vos
champs et valeurs permutés.
dans le volet Profil, sélectionnez les champs que vous souhaitez permuter, puis
faites un clic droit ou Ctrl-clic (MacOS) et sélectionnez Permuter les colonnes en
lignes dans le menu. Si vous utilisez cette option, passez à l’étape 7.
l
Toutes les versions : cliquez sur l’icône et sélectionnez Ajouter une
permutation dans le menu contextuel.
4. (Facultatif) Dans le volet Champs, entrez une valeur dans le champ Recherche pour
rechercher les champs à permuter dans la liste de champs.
7. (Facultatif) Dans le volet Champs permutés, cliquez sur l’icône plus pour ajouter
d’autres colonnes à permuter, puis répétez l’étape précédente pour sélectionner d’autres
champs à permuter. Vos résultats apparaissent immédiatement à la fois dans le volet
Résultats de la permutation et la grille de données.
8. Si vous n’avez pas activé l’option de dénomination par défaut ou si Tableau Prep n’a pas
pu détecter un nom automatiquement, modifiez les noms des champs. Vous pouvez
également modifier les noms des champs d’origine dans ce volet pour mieux décrire les
données.
10. Pour actualiser vos données de permutation lorsque les données changent, exécutez
votre flux. Si de nouveaux champs sont ajoutés à votre source de donnée et ont besoin
d’être ajoutés à la permutation, ajoutez-les manuellement à la permutation.
Cet exemple présente une feuille de calcul de ventes de produits pharmaceutiques, taxes et
totaux par mois et année.
En permutant les données, vous pouvez créer des lignes pour chaque mois et années, et des
colonnes individuelles pour les ventes, les taxes et les totaux afin que Tableau puisse interpréter
plus facilement ces données à des fins d’analyse.
3. Cliquez sur l’icône plus et sélectionnez Ajouter une permutation dans le menu
contextuel.
4. Dans le volet Champs permutés, cliquez sur le lien Utiliser la recherche avec
caractères génériques pour permuter des champs.
5. Entrez une valeur ou une valeur partielle que vous souhaitez rechercher. Par exemple,
entrez Sales_ pour obtenir les champs étiquetés sous sales_2017, sales_2018 et
sales_2019.
6. (Facultatif) Dans le volet Champs permutés, cliquez sur l’icône plus pour ajouter
d’autres colonnes à permuter, puis répétez l’étape précédente pour sélectionner d’autres
champs à permuter.
7. Si vous n’avez pas activé l’option de dénomination par défaut ou si Tableau Prep n’a pas
pu détecter un nom automatiquement, modifiez les noms des champs.
8. Pour actualiser vos données de permutation lorsque les données changent, exécutez
votre flux. Tous les nouveaux champs ajoutés à votre source de données et
correspondant au modèle avec caractères génériques sont automatiquement détectés et
ajoutés à la permutation.
9. Si les résultats ne correspondent pas à vos attentes, essayez l’une des options suivantes :
l Entrez une valeur différente dans le champ Recherche et appuyez sur Entrée. La
permutation est automatiquement actualisée et affiche les nouveaux résultats.
les champs qui ont été ajoutés manuellement en les faisant glisser hors de la
colonne Valeurs Permutation1 vers le volet Champs.
Remarque : il n’est pas possible de supprimer les champs qui ont été
ajoutés à partir des résultats de la recherche avec caractères génériques en
les faisant glisser hors de la colonne Valeurs Permutation1. Au lieu de
cela, essayez d’utiliser un modèle plus spécifique pour obtenir les résultats
de recherche escomptés.
Par exemple, si vos coûts de publicité mensuels incluent tous les types de publicité dans une
colonne, si vous permutez les données de lignes en colonnes, vous pouvez avoir une colonne
séparée pour chaque type de publicité, ce qui facilite l’analyse des données.
Vous pouvez sélectionner un champ auquel appliquer la permutation. Les valeurs de champ
pour ce champ sont ensuite utilisées pour créer les nouvelles colonnes. Ensuite, sélectionnez
un champ à utiliser pour remplir les nouvelles colonnes. Ces valeurs de champ sont agrégées et
vous pouvez sélectionner le type d’agrégation à appliquer.
3. Cliquez sur l’icône plus et sélectionnez Ajouter une permutation dans le menu
contextuel.
6. Sélectionnez un champ dans le volet gauche et faites-le glisser vers la section Champ qui
permutera les lignes en colonnes dans le volet Champs permutés.
Les valeurs de ce champ seront utilisées pour créer et nommer les nouvelles colonnes.
Vous pouvez modifier les noms des colonnes dans le volet Résultat de la permutation
ultérieurement.
7. Sélectionnez un champ dans le volet gauche et faites-le glisser vers la section Champ qui
permutera les lignes en colonnes dans le volet Champs permutés. Les valeurs dans
ce champ sont utilisées pour remplir les nouvelles colonnes créées à partir de l’étape
précédente.
Un type d’agrégation par défaut est affecté au champ. Cliquez sur le type d’agrégation
pour le modifier.
9. Si le champ permuté est modifié dans ses données de lignes, faites un clic droit ou Ctrl-clic
(MacOS) lors de l’étape de permutation dans le volet Flux et sélectionnez Actualiser.
Remarque : la connexion aux scripts en tant qu’étape des données entrantes pour votre
flux n’est pas encore prise en charge. En outre, les étapes de script ne sont pas encore
prises en charge pour les flux créés ou publiés sur Tableau Cloud.
Configurez votre serveur Rserve ou votre serveur Tableau Python (TabPy) et ajoutez une étape
de script à votre flux. Tableau Prep transmet les données à Rserve pour R ou au serveur
Tableau Python (TabPy) pour Python et renvoie les données résultantes au flux sous la forme
de table. Vous pouvez continuer à appliquer des opérations de nettoyage aux résultats et
générer vos résultats pour analyse.
Lorsque vous créez votre script, vous devrez inclure une fonction qui spécifie un dataframe
comme argument de la fonction. Pour retourner des champs différents de ceux que vous entrez,
vous devrez inclure une fonction getOutputSchema dans votre script qui définit les types de
sortie et de données. Sinon, la sortie utilisera les champs des données d’entrée.
Si vous créez ou modifiez des flux dans Tableau Server (à partir de la version 2020.4.1) qui
incluent des étapes de script, Tableau Server doit également avoir une connexion à un serveur
Rserve ou TabPy pour exécuter les étapes de script. Pour plus d’informations sur la
configuration de R ou de Python à utiliser dans vos flux et sur la création de vos scripts, voir
Utiliser des scripts R (Rserve) dans votre flux en dessous ou Utiliser des scripts Python
dans votre flux sur la page 394.
Décharge de responsabilité : cette rubrique inclut des informations sur un produit tiers.
Remarque : bien que nous fassions tout notre possible pour que les références au
contenu de tiers soient exactes, les informations fournies ici peuvent changer sans
préavis à mesure que R et Rserve évoluent. Pour obtenir les informations les plus à jour,
veuillez consulter la documentation et le support R et Rserve.
R est un langage de programmation et un environnement logiciel open source pour les calculs
statistiques et la représentation graphique. Pour étendre la fonctionnalité de Tableau Prep
Builder, vous pouvez créer des scripts dans R à utiliser dans votre flux. Ils seront exécutés via un
serveur Rserve pour produire des sorties que vous pouvez utiliser dans votre flux.
Par exemple, vous pouvez ajouter des données de modélisation statistique ou de prévision aux
données que vous avez déjà dans votre flux à l’aide d’un script dans R, puis utiliser la puissance
de Tableau Prep Builder pour nettoyer l’ensemble de données résultant à des fins d’analyse.
Pour inclure des scripts R dans votre flux, vous devez configurer une connexion entre Tableau
Prep Builder et un serveur Rserve. Vous pouvez ensuite utiliser des scripts R pour appliquer les
fonctions prises en charge aux données de votre flux à l’aide des expressions R. Après avoir
entré les détails de configuration et indiqué à Tableau Prep Builder le fichier et la fonction que
vous voulez utiliser, les données sont transmises en toute sécurité au serveur Rserve, les
expressions sont appliquées et les résultats sont renvoyés sous forme de table (R data.frame)
que vous pouvez nettoyer ou générer si nécessaire.
Vous pouvez exécuter des flux incluant des étapes de script dans Tableau Server tant que vous
avez configuré une connexion à votre serveur Rserve. L’exécution de flux avec des étapes de
script dans Tableau Cloud n’est pas prise en charge actuellement. Pour configurer Tableau
Server, consultez Configurer le serveur Rserve pour Tableau Server sur la page suivante.
Conditions préalables
Pour inclure des étapes de script R dans votre flux, installez R et configurez une connexion à un
serveur Rserve.
Ressources
l Télécharger et installer R. Téléchargez et installez la version la plus récente de R pour
Linux, Mac ou Windows.
l Notes de mise en œuvre de R (poste de la communauté). Installez et configurez une
connexion à R et Rserve pour Windows.
l Installer et configurer Rserve : Instructions pour l’installation générale et la configuration
de toutes les plates-formes.
l Rserve pour Windows (notes de version) : Cette rubrique couvre les limitations lors
de l’installation de Rserve en local sous Windows.
l Version 2019.3 et ultérieure : vous pouvez exécuter des flux publiés incluant des
étapes de script dans Tableau Server.
l Version 2020.4.1 et ultérieure : vous pouvez créer, modifier et exécuter des flux
incluant des étapes de script dans Tableau Server.
l Tableau Cloud : la création ou l’exécution de flux avec des étapes de script n’est pas
prise en charge actuellement.
2. Entrez les commandes suivantes pour définir l’adresse de l’hôte, les valeurs de port et le
délai d’expiration de la connexion :
L’exemple suivant montre quelques options supplémentaires que vous pouvez inclure dans votre
fichier de configuration Rserve.conf :
Pour plus d’informations sur la configuration d’un fichier Rserve.conf, reportez-vous à la section
Configuration avancée de Rserve dans les Notes de mise en œuvre de R (poste de la
communauté).
Par exemple :
Décimale Double
Int Entier
Bool Logique
Remarque : Date et DateTime doivent toujours être renvoyés sous la forme d’une chaîne
valide. Les types Native Date (DateTime) dans R ne sont pas pris en charge comme
valeurs retournées mais peuvent être utilisés dans le script.
Pour retourner des champs différents de ceux que vous entrez, vous devrez inclure une fonction
getOutputSchema dans votre script qui définit les types de sortie et de données. Sinon, la sortie
utilisera les champs des données d’entrée qui proviennent de l’étape précédant l’étape de script
dans le flux.
Utilisez la syntaxe suivante lorsque vous spécifiez les types de données pour vos champs dans
getOutputSchema :
prep_string () Chaîne
prep_decimal () Décimale
prep_int () Entier
prep_bool () Booléen
prep_date () Date
prep_datetime () DateTime
1. Sélectionnez Aide > Paramètres et performances > Gérer la connexion à une exten-
sion analytique.
l Le port 4912 est le port par défaut pour les serveurs Rserve cryptés SSL.
l Si le serveur exige des informations d’identification, entrez un nom d’utilisateur et
un mot de passe.
l Si le serveur utilise le cryptage SSL, cochez la case Exiger SSL, puis cliquez sur
le lien Fichier de configuration personnalisé pour spécifier un certificat pour la
connexion.
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
3. Cliquez sur l’icône plus et sélectionnez Ajouter un script dans le menu contextuel.
5. Dans la section Nom de fichier, cliquez sur Parcourir pour sélectionner votre fichier
script.
6. Entrez le Nom de la fonction puis appuyez sur Entrée pour exécuter votre script.
Décharge de responsabilité : cette rubrique inclut des informations sur un produit tiers.
Remarque : bien que nous fassions tout notre possible pour que les références au
contenu de tiers soient exactes, les informations fournies ici peuvent changer sans
préavis à mesure que Python évolue. Pour obtenir les informations les plus à jour,
veuillez consulter la documentation et le support Python.
Pour inclure des scripts Python dans votre flux, vous devez configurer une connexion entre
Tableau et un serveur TabPy. Ensuite, vous pouvez utiliser des scripts Python pour appliquer
des fonctions prises en charge aux données de votre flux en utilisant un Pandas Dataframe.
Lorsque vous ajoutez une étape de script à votre flux et spécifiez les détails de configuration, le
fichier et la fonction que vous souhaitez utiliser, les données sont transmises en toute sécurité au
serveur TabPy, les expressions du script sont appliquées et les résultats sont renvoyés sous
forme de table que vous pouvez nettoyer ou générer si nécessaire.
Vous pouvez exécuter des flux qui incluent des étapes de script dans Tableau Server tant que
vous avez configuré une connexion à votre serveur TabPy. L’exécution de flux avec des étapes
de script dans Tableau Cloud n’est pas prise en charge actuellement. Pour configurer Tableau
Server, consultez Configurer le serveur Tableau Python (TabPy) pour Tableau Server en
dessous.
Pour plus d’informations sur la configuration des sites sur Tableau Server avec des extensions
analytiques pour les classeurs, consultez Configurer les connexions avec les extensions
analytiques.
Conditions préalables
Pour inclure des scripts Python dans votre flux, effectuez la configuration suivante. La création
ou l’exécution de flux avec des étapes de script dans Tableau Cloud n’est pas prise en charge
actuellement.
l Version 2019.3 et ultérieure : vous pouvez exécuter des flux publiés incluant des
étapes de script dans Tableau Server.
l Version 2020.4.1 et ultérieure : vous pouvez créer, modifier et exécuter des flux
incluant des étapes de script dans Tableau Server.
l Tableau Cloud : la création ou l’exécution de flux avec des étapes de script n’est pas
prise en charge actuellement.
2. Entrez les commandes suivantes pour définir l’adresse de l’hôte, les valeurs de port et le
délai d’expiration de la connexion :
Par exemple, pour ajouter un codage à un ensemble de champs dans un flux, vous pouvez
écrire le script suivant :
def encode(input):
le = preprocessing.LabelEncoder()
Return pd.DataFrame({
'Opportunity Number' : input['Opportunity Number'],
'Supplies Subgroup Encoded' : le.fit_transform(input['Supplies Sub-
group']),
'Region Encoded' : le.fit_transform(input['Region']),
'Route To Market Encoded' : le.fit_transform(input['Route To Mar-
ket']),
'Opportunity Result Encoded' : le.fit_transform(input['Opportunity
Result']),
'Competitor Type Encoded' : le.fit_transform(input['Competitor
Type']),
'Supplies Group Encoded' : le.fit_transform(input['Supplies
Group']),
})
Décimale Double
Int Entier
Bool Booléen
Remarque : Date et DateTime doivent toujours être renvoyés sous la forme d’une chaîne
valide.
Pour retourner des champs différents de ceux que vous entrez, vous devrez inclure une fonction
get_output_schema dans votre script qui définit les types de sortie et de données. Sinon, la
sortie utilisera les champs des données d’entrée qui proviennent de l’étape précédant l’étape de
script dans le flux.
Utilisez la syntaxe suivante lorsque vous spécifiez les types de données pour vos champs dans
get_output_schema :
prep_string() Chaîne
prep_decimal() Décimale
prep_int() Entier
prep_bool() Booléen
prep_date() Date
prep_datetime() DateTime
Les crochets peuvent être utilisés pour accéder aux lignes d’un DataFrame. Les crochets
simples génèrent un Pandas Series, tandis qu’un crochet double génère un Pandas
DataFrame.
def create_key(df):
return pd.DataFrame({
"Key": ['12345']
})
def get_output_schema():
return pd.DataFrame({
'Opportunity Number' : prep_int(),
'Supplies Subgroup Encoded' : prep_int(),
'Region Encoded' : prep_int(),
'Route To Market Encoded' : prep_int(),
'Opportunity Result Encoded' : prep_int(),
1. Sélectionnez Aide > Paramètres et performances > Gérer la connexion à une exten-
sion analytique.
l Si le serveur utilise le cryptage SSL, cochez la case Nécessite SSL, puis cliquez
sur le lien Aucun fichier de configuration personnalisé... pour spécifier un
certificat pour la connexion. Ceci est votre fichier de certificat de serveur SSL.
1. Ouvrez Tableau Prep Builder et cliquez sur le bouton Ajouter une connexion .
Dans la création Web, depuis la page d’accueil, cliquez sur Créer > Flux, ou depuis la
page Explorer, cliquez sur Nouveau > Flux. Cliquez ensuite sur Se connecter aux
données.
3. Cliquez sur l’icône plus et sélectionnez Ajouter un script dans le menu contextuel.
4. Dans le volet Script, dans la section Type de connexion, sélectionnez Serveur Tableau
Python (TabPy).
5. Dans la section Nom de fichier, cliquez sur Parcourir pour sélectionner votre fichier
script.
6. Entrez le Nom de la fonction puis appuyez sur Entrée pour exécuter votre script.
Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux
dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes
les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux
sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server et Tableau
Cloud.
Si vous avez besoin d’ajuster la granularité de vos données, utilisez l’option Agréger pour créer
une étape d’agrégation ou de regroupement des données. Le fait que les données soient
agrégées ou regroupées dépend du type de données (chaîne, nombre ou date).
1. Dans le volet Flux, cliquez sur l’icône plus et sélectionnez Agrégation. Une nouvelle
étape d’agrégation s’affiche dans le volet Flux et le volet Profil est mis à jour pour afficher
le profil d’agrégation et de groupe.
2. Faites glisser les champs du volet de gauche vers le volet Champs groupés (les champs
qui composent la ligne) ou vers le volet Champs agrégés (les données qui seront
agrégées et présentées au niveau des champs groupés).
l Rechercher des champs dans la liste et sélectionner uniquement les champs que
vous souhaitez inclure dans l’agrégation.
l Cliquer sur Ajouter tout ou Tout supprimer pour appliquer ou supprimer des
champs en lots.
Les champs sont distribués entre les colonnes Champs regroupés et Champs agrégés
en fonction de leur type de données. Cliquez sur les en-têtes de type de groupe ou
d’agrégation (par exemple, AVG ou SUM) pour modifier le type de groupe ou
d’agrégation.
Dans les grilles de données sous le profil d’agrégation et de groupe, vous pouvez voir un
échantillon des membres du groupe ou de l’agrégation.
Toutes les opérations de nettoyage exécutées sur les champs sont enregistrées dans le
volet Modifications.
La jointure est une opération que vous pouvez effectuer en tout point du flux. La jointure à un
stade précoce du flux peut vous aider à comprendre vos ensembles de données et faire
apparaître les points qui nécessitent votre attention immédiate.
Gauche Pour chaque ligne, inclue toutes les valeurs de la table gauche et toutes les
valeurs correspondantes de la table droite. Lorsqu’une valeur de la table
gauche n’a pas de correspondance dans la table droite, vous voyez une valeur
null dans les résultats de la jointure.
Interne Pour chaque ligne, inclut les valeurs qui ont des correspondances dans les
deux tables.
Droite Pour chaque ligne, inclut toutes les valeurs de la table droite et les valeurs cor-
respondantes de la table gauche. Lorsqu’une valeur de la table gauche n’a
pas de valeur correspondante dans la table droite, vous voyez une valeur null
dans les résultats de la jointure.
leftOnly Pour chaque ligne, inclut uniquement les valeurs de la table gauche qui ne cor-
respondent à aucune valeur de la table droite. Les valeurs de champ de la
table droite s’affichent sous forme de valeurs null dans les résultats de la join-
ture.
rightOnly Pour chaque ligne, inclut uniquement les valeurs de la table droite qui ne cor-
respondent à aucune valeur de la table gauche. Les valeurs de champ de la
table gauche s’affichent sous forme de valeurs null dans les résultats de la join-
ture.
notInner Pour chaque ligne, inclut toutes les valeurs de la table droite et de la table
gauche qui ne correspondent pas.
Complète Pour chaque ligne, inclut toutes les valeurs des deux tables. Lorsqu’une valeur
de l’une des tables n’a pas de correspondance dans l’autre table, vous voyez
une valeur null dans les résultats de la jointure.
et faites-la glisser vers l’autre table jusqu’à ce que l’option Jointure s’affiche.
l
Cliquez sur l’icône et sélectionnez Ajouter une jointure dans le menu, puis
ajoutez manuellement l’autre entrée à la jointure, et ajoutez les clauses de jointure.
Remarque : si vous vous connectez à une table pour laquelle des relations
de tables sont définies et qui inclut des champs connexes, vous pouvez
sélectionner Jointure et faire votre choix dans la liste des tables liées.
Tableau Prep crée la jointure en fonction des champs qui constituent la
relation entre les deux tables.
Pour plus d’informations sur les connecteurs avec des relations de table,
voir Lier des données dans l’étape des données entrantes sur la page
157.
Une nouvelle étape de jointure est ajoutée au flux et le volet Profil se met à jour de
manière à afficher le profil de jointure.
b. Dans Type de jointure, cliquez sur le graphique Venn pour spécifier le type de
jointure souhaité.
c. Dans Clauses de jointure appliquées, cliquez sur l’icône plus ou, dans le
champ choisi pour la condition de jointure par défaut, spécifiez ou modifiez la clause
de jointure. Les champs que vous avez sélectionnés dans la condition de jointure
sont les champs communs aux tables de la jointure.
d. Vous pouvez également cliquer sur les clauses de jointure recommandées qui
s’affichent sous Recommandations relatives aux clauses de jointure pour
ajouter la clause à la liste des clauses de jointure appliquées.
l Clauses de jointure appliquées : par défaut, Tableau Prep définit la première clause de
jointure sur la base des noms de champs communs dans les tables à lier. Ajoutez ou
supprimez les clauses de jointure selon vos besoins.
l Type de jointure : par défaut, lorsque vous créez une jointure, Tableau Prep utilise une
jointure interne entre les tables. Selon les données auxquelles vous vous connectez,
vous pourrez peut-être utiliser les jointures gauches, internes, droites, leftOnly, rightOnly,
notInner ou complètes.
l Cliquez sur chaque barre Inclus pour isoler et voir les données du profil de jointure
incluses dans la jointure.
l Cliquez sur chaque barre Exclu pour isoler et voir les données du profil de jointure
exclues de la jointure.
l Cliquez sur toute combinaison de barres Inclus et Exclu pour voir une perspective
cumulée des données.
l
Recommandations relatives aux clauses de jointure : cliquez sur l’icône plus à
côté de la clause de jointure recommandée pour l’ajouter à la liste Clauses de jointure
appliquées.
l Volet Clauses de jointure : dans les Clauses de jointure, vous pouvez voir les valeurs
de chaque champ dans la clause de jointure. Les valeurs qui ne répondent pas aux
critères de la jointure s’affichent en texte rouge.
l Volet Résultats de la jointure : si, dans le volet Résultats de la jointure, vous voyez
des valeurs que vous souhaitez modifier, vous pouvez modifier les valeurs dans ce volet.
La bonne nouvelle est que si vos valeurs de champ ne présentent aucun de ces problèmes,
vous pouvez corriger les valeurs de champ directement dans les Clauses de jointure ou
travailler avec les valeurs exclues en cliquant sur les barres Exclu(s) dans Résumé des
résultats de la jointure et utiliser les opérations de nettoyage dans le menu du volet Profil.
Pour plus d’informations sur les différentes options de nettoyage disponibles dans l’étape Lier,
consultez À propos des opérations de nettoyage sur la page 249.
Vous pouvez également sélectionner plusieurs valeurs à conserver, exclure ou filtrer dans les
volets Clauses de jointure, ou appliquer d’autres opérations de nettoyage dans le volet
Résultats de la jointure. Selon les champs que vous modifiez et leur emplacement dans le
processus de jointure, vos modifications sont appliquées soit avant, soit après la jointure pour
vous fournir les résultats corrigés.
Pour plus d’informations sur le nettoyage des champs, consultez Appliquer des opérations de
nettoyage sur la page 254.
Conseil : Afin de maximiser les performances, une seule union peut avoir 10 entrées au
maximum. Si vous avez besoin de réunir plus de 10 fichiers ou tables, essayez de réunir les
fichiers dans l’étape des données entrantes. Pour plus d’informations sur ce type d’union,
consultez Réunir des fichiers et des tables de base de données dans l’étape des données
entrantes sur la page 145.
Comme dans une jointure, vous pouvez utiliser l’opération d’union en tout point du flux.
1. Après avoir ajouté au moins deux tables dans le volet Flux, sélectionnez la table
concernée et faites-la glisser vers l’autre table jusqu’à ce que l’option Union s’affiche.
Vous pouvez aussi cliquer sur l’icône et sélectionner Union dans le menu. Une
nouvelle étape d’union est ajoutée au volet Flux et le volet Profil se met à jour pour
afficher le profil de l’union.
2. Ajoutez des tables supplémentaires à l’union en faisant glisser des tables vers les tables
de l’union jusqu’à ce que voyiez l’option Ajouter.
3. Dans le profil de l’union, vérifiez les métadonnées relatives à l’union. Vous pouvez
supprimer les tables de l’union et consulter les détails sur les champs non concordants.
l Vérifier les métadonnées de l’union : Le profil d’union affiche des métadonnées sur
l’union. Vous pouvez voir ici les tables qui constituent l’union, le nombre résultant de
champs et les champs discordants.
l Vérifier les couleurs pour chaque champ : À côté de chaque champ répertorié dans le
résumé Union et au-dessus de chaque champ dans le profil de l’union, vous trouverez un
ensemble de couleurs. Les couleurs correspondent à chaque table de l’union.
Si toutes les couleurs de table s’affichent pour ce champ, l’union a été correctement
exécutée pour ce champ. Une couleur de table manquante indique que vous avez des
champs non concordants.
Les champs discordants sont des champs qui peuvent avoir des données similaires mais
qui diffèrent d’une manière ou d’une autre. Vous pouvez voir la liste des champs qui ne
correspondent pas dans le résumé Union, ainsi que les tables dont ils sont issus. Pour
examiner de plus près les données des champs, cochez la case Afficher uniquement
les champs sans correspondance pour isoler les champs discordants dans le profil de
l’union.
Pour corriger ces champs, vous pouvez appliquer l’une des suggestions de la section
Corriger les champs non concordants en dessous ci-dessous.
Pour résoudre le problème de non-concordance de champ, vous devez fusionner les champs
non concordants ensemble.
1. Dans la liste Champs discordants, cliquez sur un champ discordant. S’il existe
une suggestion de correspondance, le champ correspondant est surligné en jaune.
Les suggestions de correspondance sont basées sur les champs présentant des
types de données et des noms de champ similaires.
2. Survolez le champ surligné et cliquez sur le bouton Plus pour fusionner les champs.
2. Faites un clic droit ou Ctrl-clic (MacOS) sur un champ sélectionné et si la fusion est
valide, l’option de menu Fusionner les champs apparaît.
Si vous voyez s’afficher Aucune option disponible lorsque vous faites un clic droit
sur le champ, il est possible que les champs ne puissent pas être fusionnés. (par
exemple, si vous essayez de fusionner deux champs issus de la même entrée).
3. Cliquez sur Fusionner les champs pour fusionner les champs sélectionnés.
Pour renommer le champ dans le volet du profil de l’union, faites un clic droit sur le nom
du champ et cliquez sur Renommer le champ.
l Les champs correspondants ont le même nom mais sont d’un type différent : par
défaut, lorsque le nom des champs correspondants correspond, mais pas le type de
données des champs, Tableau Prep modifie le type de l’un des champs afin qu’ils soient
compatibles les uns avec les autres. Si Tableau Prep effectue ce changement, il est
indiqué en haut du champ fusionné par l’icône Modifier le type de données.
Dans certains cas, Tableau Prep peut ne pas choisir le type de données correct. Dans ce
cas, et si vous souhaitez annuler la fusion, faites un clic droit ou Ctrl+clic (MacOS) sur
l’icône Modifier le type de données et sélectionnez Séparer les entrées avec
différents types.
Vous pouvez ensuite fusionner les champs tout d’abord en modifiant le type de données
l Les tables correspondantes ont un nombre de champs différent : pour réunir des
tables, il faut que chaque table de l’union contienne le même nombre de champs. Si une
union génère des champs supplémentaires, fusionnez le champ en un champ existant.
Pour des informations sur la fusion de champs dans le même fichier, consultez Fusionner des
champs sur la page 266.
l Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner
les champs s’affiche.
l Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu
contextuel, puis cliquez sur Fusionner les champs.
l Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre
d’outils contextuelle.
Utilisez des modèles optimisés par Einstein Discovery pour exécuter des tâches de score en
masse d’une prédiction pour les données de votre flux. Les prédictions peuvent vous aider à
prendre des décisions plus informées et à appliquer des mesures pour améliorer les résultats de
votre entreprise.
Lors de l’application de ces modèles, un nouveau champ pour les résultats prédits (sous forme
de scores de probabilité ou de moyennes estimées) est automatiquement ajouté à votre flux.
Vous pouvez également ajouter les champs des principaux prédicteurs et des améliorations
principales à vos données de flux en sélectionnant ces options lors de l’application de votre
modèle. Les principaux prédicteurs indiquent les facteurs qui ont le plus contribué à la
prédiction. Les améliorations principales suggèrent des mesures à prendre pour améliorer les
résultats prédits.
Par exemple, pour prédire la rétention du personnel, vous pouvez créer un modèle à l’aide de
données historiques (où vous connaissez déjà le résultat) dans Einstein Discovery, puis
appliquer ce modèle à l’ensemble de données de votre flux puis générer les résultats prédits.
Les résultats de prédiction sont appliqués au niveau des lignes, ce qui vous aide à approfondir
votre analyse dans Tableau.
Si vous devez appliquer plusieurs modèles à votre ensemble de données, vous pouvez inclure
plusieurs étapes de prédiction dans votre flux. Chaque étape de prédiction applique un modèle
de prédiction unique au flux. Depuis la version 2021.2, vous pouvez vous connecter à plusieurs
serveurs Einstein Discovery en un seul flux pour choisir les modèles dont vous avez besoin. Les
versions antérieures vous limitent à un seul serveur Einstein Discovery par flux.
Remarque : vous devez avoir une licence Salesforce et un compte utilisateur configuré
pour accéder à Einstein Discovery et utiliser cette fonctionnalité. Consultez Conditions
préalables sur la page en regard pour obtenir plus d’informations.
Pour plus d’informations sur Einstein Discovery, consultez Premiers pas avec Einstein Discovery
et Explication, prédiction et action avec Einstein Discovery dans l’aide de Salesforce. Vous
pouvez également élargir vos connaissances avec le parcours Recueil de connaissances avec
Einstein Discovery dans Trailhead.
Remarque : Einstein Discovery dans Tableau est optimisé par salesforce.com. Consultez
les conditions applicables dans votre contrat avec salesforce.com.
Conditions préalables
Pour configurer et utiliser les prédictions Einstein Discovery dans votre flux, vous avez besoin de
licences, d’accès et d’autorisations spécifiques dans Salesforce et Tableau.
Exigences Salesforce
exigence description
exigence description
exigence description
exigence description
Pour appliquer les prédictions Einstein Discovery à votre flux, vous aurez besoin des éléments
suivants :
Discovery.
Lorsque vous vous connectez pour la première fois, une page Web s’ouvre, vous
demandant de vous connecter à votre compte Salesforce à l’aide de vos informations
d’identification Salesforce. Une fois que vous vous êtes connecté, une page Web s’ouvre
pour demander si vous souhaitez autoriser Tableau à accéder à vos données Salesforce.
Cliquez sur Autoriser pour continuer, puis fermez l’onglet résultant dans votre navigateur.
5. Cliquez sur Sélectionner une définition de prédiction. La liste des modèles déployés
auxquels vous avez accès s’ouvre. Les modèles sont créés et déployés dans Salesforce à
l’aide d’Einstein Discovery. Pour plus d’informations sur les modèles prédictifs, consultez
À propos des modèles dans l’aide de Salesforce.
l Les prédicteurs principaux indiquent quels facteurs ont le plus contribué au résultat
prévu.
l Les améliorations les plus importantes suggèrent des mesures à prendre pour
améliorer les résultats prédits.
8. Dans la section Mapper les champs, mappez vos champs de flux à vos champs de
modèles.
Si votre champ de flux est affecté à un type de données différent, vous devrez le
modifier pour qu’il corresponde au type de données attribué au champ de modèle.
Pour modifier le type de données, dans la section Mapper les champs, cliquez
simplement sur le type de données du champ de flux, puis sélectionnez le nouveau
type de données dans le menu. Vous pouvez ensuite remodifier le type de données
dans une étape de nettoyage ultérieure.
9. Pour appliquer vos paramètres et exécuter le modèle sur vos données, cliquez sur
Appliquer. Les résultats de la prédiction s’affichent dans le volet Profil et la grille de
données.
Si vous modifiez des paramètres, vous pouvez cliquer à nouveau sur Appliquer pour
réexécuter le modèle avec vos modifications. Si vous quittez l’étape Prédiction avant de
cliquer surAppliquer, le modèle ne s’exécute pas et vos modifications sont perdues.
Dans cette rubrique, nous avons appliqué le modèle de prédiction de rétention du personnel à
nos données d’employés dans Tableau Prep pour obtenir un score de probabilité qu’un employé
restera avec l’entreprise.
Quelle est la pro- Einstein Discovery prédit qu’il y a 81,38 % de Champ de prédiction
babilité que cet chances que l’employé reste dans l’entreprise.
employé reste ?
Quels sont les Les années avec le responsable actuel Champ Prédicteur 1
facteurs qui réduisent de 2,2 % les chances que cet (prédicteur principal)
influent sur ce employé reste dans l’entreprise.
Impact du Prédicteur 1
résultat ?
(impact en pourcentage
du prédicteur principal)
Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web
dans l’aide de Tableau Server et Tableau Cloud.
l Affichez un aperçu des données de votre l Créez et modifiez les flux publiés
flux dans Tableau Desktop. sur le Web.
l Incluez des connexions de fichiers directes l Chargez des fichiers pour vos
dans votre entrée de flux ou compressez entrées de flux et connectez-vous
vos fichiers et publiez le flux compressé sur à diverses sources de données.
votre serveur. l Envoyez votre flux vers une
l Envoyez votre flux vers un fichier, une source de données publiée ou
source de données publiée ou une base de vers une base de données.
données.
Pour garder les données à jour, vous pouvez exécuter manuellement des flux individuels depuis
Tableau Prep Builder ou à la ligne de commande. Vous pouvez également exécuter des flux
publiés sur Tableau Server ou Tableau Cloud manuellement ou de manière programmée. Pour
plus d’informations sur l’exécution de flux, consultez Publier un flux sur Tableau Server ou
Tableau Cloud sur la page 520.
Enregistrer un flux
Dans Tableau Prep Builder, vous pouvez enregistrer manuellement votre flux pour sauvegarder
votre travail avant d’effectuer toute opération supplémentaire. Votre flux est enregistré au format
de fichier de flux Tableau Prep (.tfl).
Vous pouvez également compresser vos fichiers locaux (Excel, fichiers texte et extraits Tableau)
avec votre flux pour les partager avec d’autres, de la même manière que vous compressez un
classeur pour le partager dans Tableau Desktop. Seuls les fichiers locaux peuvent être
compressés avec un flux. Les données issues des connexions à des bases de données, par
exemple, ne sont pas incluses.
En mode de création Web, les fichiers locaux sont automatiquement compressés avec notre
flux. Les connexions de fichiers directs ne sont pas encore prises en charge.
Lorsque vous enregistrez un flux compressé, ce flux est enregistré en tant que fichier de flux
compressé Tableau (.tflx).
l Pour enregistrer votre flux manuellement, dans le menu supérieur, sélectionnez Fichier >
Enregistrer.
l Dans Tableau Prep Builder, pour compresser vos fichiers de données avec votre flux,
dans le menu supérieur, effectuez l’une des opérations suivantes :
l Sélectionnez Fichier > Exporter le flux compressé
l Sélectionnez Fichier > Enregistrer sous. Ensuite, dans la boîte de dialogue Enre-
gistrer sous, sélectionnez Fichiers de flux compressés Tableau dans le menu
déroulant Type de fichier.
Vous ne pouvez enregistrer les flux que sur le serveur auquel vous êtes actuellement connecté.
Vous ne pouvez pas créer un brouillon de flux sur un serveur et tenter de l’enregistrer ou de le
publier sur un autre serveur. Si vous souhaitez publier le flux sur un autre projet sur le serveur,
utilisez l’option de menu Fichier > Publier en tant que, puis sélectionnez votre projet dans la
boîte de dialogue.
Tant que vous n’avez pas publié les brouillons de flux et que vous ne les avez pas rendus
accessibles à des personnes autorisées à accéder au projet sur votre serveur, vous seul pouvez
les consulter. Les flux présentant un statut de brouillon sont marqués avec un badge Brouillon
afin que vous puissiez facilement retrouver vos flux en cours. Si le flux n’a jamais été publié, un
badge Jamais publié s’affiche à côté du badge Brouillon.
Une fois qu’un flux est publié et que vous modifiez et republiez le flux, une nouvelle version est
créée. Vous pouvez voir une liste des versions du flux dans la boîte de dialogue Historique des
Pour plus d’informations sur la gestion de l’historique des révisions, consultez Utiliser des
révisions de contenu dans l’Aide de Tableau Desktop.
Remarque : si vous avez récupéré des flux dans votre dossier Flux récupérés, cette
boîte de dialogue s’affiche chaque fois que vous ouvrez l’application jusqu’à ce que ce
dossier soit vide.
Si vous ne souhaitez pas activer cette fonctionnalité, en tant qu’administrateur, vous pouvez la
désactiver pendant ou après l’installation. Pour plus d’informations sur la désactivation de cette
fonctionnalité, consultez Désactiver la récupération de fichiers dans le guide de déploiement de
Tableau Desktop et Tableau Prep.
Lorsque vous nettoyez vos données, il arrive que vous souhaitiez vérifier l’avancement de
l’opération en la consultant dans Tableau Desktop. Lorsque votre flux s’ouvre dans Tableau
Desktop, Tableau Prep Builder crée un fichier Tableau .hyper permanent et un fichier de source
de données Tableau (.tds). Les fichiers sont enregistrés dans votre référentiel Tableau dans le
fichier Sources de données afin que vous puissiez expérimenter avec vos données à tout
moment.
Lorsque vous ouvrez le flux dans Tableau Desktop, vous pouvez voir l’échantillon de données
avec lequel vous travaillez dans votre flux et les opérations qui s’y appliquent, jusqu’à l’étape
que vous avez sélectionnée.
Remarque : bien que vous puissiez expérimenter avec vos données, Tableau ne vous
présente qu’un échantillon de vos données et vous ne pouvez pas enregistrer le classeur
en tant que classeur complet (.twbx). Lorsque vous êtes prêt à travailler avec vos
données dans Tableau, créez une étape de sortie dans votre flux et enregistrez la sortie
Pour afficher votre échantillon de données dans Tableau Desktop, procédez comme suit :
1. Faites un clic droit sur l’étape où vous souhaitez afficher vos données et sélectionnez
Aperçu dans Tableau Desktop depuis le menu contextuel.
l Extrait Hyper (.hyper): il s’agit du type de fichier d’extrait Tableau le plus récent.
l Valeurs séparées par des virgules (.csv) : enregistrez l’extrait dans un fichier .csv pour
partager vos données avec des tiers. Le codage du fichier CSV exporté sera UTF-8 avec
BOM.
l Microsoft Excel (.xlsx) : feuille de calcul Microsoft Excel.
l Enregistrez la sortie de votre flux en tant que source de données sur Tableau Server ou
Tableau Cloud pour partager vos données et fournir un accès centralisé aux données que
vous avez nettoyées, mises en forme et combinées.
l Enregistrez votre sortie de flux dans une base de données pour créer, remplacer ou com-
pléter les données de la table avec vos données de flux nettoyées et préparées. Pour
plus d’informations, voir Enregistrer les données de sortie de flux dans des bases
de données externes sur la page 440.
Utilisez l’actualisation incrémentielle lors de l’exécution de votre flux pour gagner du temps et
des ressources en actualisant uniquement les nouvelles données au lieu de votre ensemble de
données complet. Pour plus d’informations sur la configuration et l’exécution de votre flux à
l’aide d’une actualisation incrémentielle, consultez Actualiser les données de flux à l’aide
d’une actualisation incrémentielle sur la page 469.
Remarque : pour que vous puissiez publier votre sortie Tableau Prep Builder sur Tableau
Server, l’API REST de Tableau Server doit être activée. Pour plus d’informations,
consultez Rest API Requirements (Configuration requise pour l’API Rest) dans l’aide de
l’API Rest Tableau. Pour publier sur un serveur qui utilise des certificats de cryptage SSL
(Secure Socket Layer), des étapes de configuration supplémentaires sont nécessaires
sur l’ordinateur exécutant Tableau Prep Builder. Pour plus d’informations, consultez
Avant l’installation dans le Guide de déploiement de Tableau Desktop et de Tableau Prep
Builder.
Incluez des valeurs de paramètre dans les noms de fichier de sortie de votre flux, les chemins
d’accès, les noms de table ou les scripts SQL personnalisés (version 2022.1.1 et versions
ultérieures) pour exécuter facilement vos flux pour différents ensembles de données. Pour plus
d’informations, consultez Créer et utiliser des paramètres dans les flux sur la page 225.
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
Si vous avez exécuté le flux précédemment, cliquez sur le bouton Exécuter le flux dans
l’étape Sortie. Cela exécute le flux et met à jour votre sortie.
2. Dans le volet gauche, sélectionnez Fichier dans la liste déroulante Enregistrer la sortie
sur. Dans les versions précédentes, sélectionnez Enregistrer dans le fichier.
3. Cliquez sur le bouton Parcourir, puis dans la boîte de dialogue Enregistrer l’extrait
sous, entrez un nom pour le fichier et cliquez sur Accepter.
4. Dans le champ Type de sortie, sélectionnez l’un des types de sortie suivants :
l Extrait (. hyper)
l Créer une table : cette option crée une nouvelle table ou remplace la table exis-
tante par la nouvelle sortie.
l Ajouter à la table : cette option ajoute les nouvelles données à votre table exis-
tante. Si la table n’existe pas déjà, une nouvelle table est créée et les exécutions
suivantes ajoutent de nouvelles lignes à cette table.
Remarque : l’option Ajouter à la table n’est pas prise en charge pour les
types de sortie .csv. Pour plus d’informations sur les combinaisons
d’actualisations prises en charge, consultez Options d’actualisation de
flux sur la page 470.
6. Cliquez sur Exécuter le flux pour exécuter le flux et générer le fichier d’extrait.
Lorsque vous extrayez des données de flux vers une feuille de calcul Microsoft Excel, vous
pouvez créer une nouvelle feuille de calcul ou bien ajouter ou remplacer des données dans une
feuille de calcul existante. Les conditions suivantes s’appliquent :
l Seuls les fichiers au format .xlsx Microsoft Excel sont pris en charge.
l Les lignes de feuille de calcul commencent à la cellule A1.
l Lors de l’ajout ou du remplacement de données, la première ligne est présupposée être
un en-tête.
l Les noms d’en-tête sont ajoutés lors de la création d’une nouvelle feuille de calcul, mais
pas lors de l’ajout de données à une feuille de calcul existante.
l Les éventuels formats ou formules dans les feuilles de calcul existantes ne sont pas appli-
qués à la sortie de flux.
l L’écriture sur des tables ou des plages nommées n’est pas prise en charge actuellement.
l L’actualisation incrémentielle n’est pas prise en charge actuellement.
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
Si vous avez exécuté le flux précédemment, cliquez sur le bouton Exécuter le flux dans
l’étape Sortie. Cela exécute le flux et met à jour votre sortie.
2. Dans le volet gauche, sélectionnez Fichier dans la liste déroulante Enregistrer la sortie
sur.
3. Cliquez sur le bouton Parcourir, puis dans la boîte de dialogue Enregistrer l’extrait,
entrez un nom pour le fichier et cliquez sur Accepter.
4. Dans le champ Type de sortie, sélectionnez Microsoft Excel (.xlsx).
5. Dans le champ Feuille de calcul, sélectionnez la feuille de calcul sur laquelle vous sou-
haitez écrire vos résultats, ou entrez un nouveau nom dans le champ à la place, puis cli-
quez sur Créer une nouvelle table.
6. Dans la boîte de dialogue Options d’écriture, sélectionnez l’une des options suivantes :
l Créer une table : crée ou recrée (si le fichier existe déjà) la feuille de calcul avec
Une comparaison de champ vous montre les champs de votre flux qui
correspondent aux champs de votre table, si celle-ci existe déjà. Si la feuille de
calcul est nouvelle, une correspondance élément par élément s’affiche. Tous les
champs qui n’ont pas de correspondance sont ignorés.
7. Cliquez sur Exécuter maintenant pour exécuter le flux et générer le fichier d’extrait
Microsoft Excel.
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
Remarque : depuis Tableau Prep Builder version 2020.1.4, une fois que
vous vous êtes connecté à votre serveur, Tableau Prep Builder mémorise le
nom et les informations d’identification de votre serveur lorsque vous fermez
l’application. La prochaine fois que vous ouvrez l’application, vous êtes déjà
connecté à votre serveur.
Sur un Mac, vous pouvez être invité à donner accès à votre trousseau Mac afin que
Tableau Prep Builder puisse utiliser les certificats SSL en toute sécurité pour se
connecter à votre environnement Tableau Server ou Tableau Cloud.
Si vous effectuez une sortie vers Tableau Cloud, incluez le pod sur lequel votre site
est hébergé dans « serverUrl », par exemple, « https://eu-west-
1a.online.tableau.com », et non « https://online.tableau.com ».
l Projet : sélectionnez le projet où vous souhaitez charger la source de données et
l’extrait.
Vous pouvez vous connecter aux données depuis n’importe lequel des connecteurs pris en
charge par Tableau Prep Builder ou le Web, et envoyer des données à une base de données
externe. Vous pouvez ainsi ajouter ou mettre à jour les données dans votre base de données
avec des données nettoyées et préparées à partir de votre flux chaque fois que le flux est
exécuté. Cette fonctionnalité est disponible à la fois pour les actualisations incrémentielles et les
actualisations complètes, sauf mention contraire. Pour plus d’informations sur la configuration
d’une actualisation incrémentielle, consultez Actualiser les données de flux à l’aide d’une
actualisation incrémentielle sur la page 469.
Lorsque vous enregistrez votre sortie de flux dans une base de données externe, Tableau Prep
effectue les opérations suivantes :
1. Génère les lignes et exécute toutes les commandes SQL sur la base de données.
2. Écrit les données dans une table temporaire (ou zone de transit en cas de sortie sur
Snowflake) dans la base de données de sortie.
3. Si l’opération réussit, les données sont déplacées de la table temporaire (ou de votre zone
de transit pour Snowflake) dans la table de destination.
4. Exécute toutes les commandes SQL que vous souhaitez exécuter après avoir écrit les don-
nées sur la base de données.
Si le script SQL échoue, le flux échoue. Toutefois, vos données seront toujours chargées dans
vos tables de base de données. Vous pouvez essayer de réexécuter le flux ou d’exécuter
manuellement votre script SQL sur votre base de données pour l’appliquer.
Options de sortie
Vous pouvez sélectionner les options suivantes lors de l’écriture de données sur une base de
données. Si la table n’existe pas déjà, elle est créée lors de la première exécution du flux.
l Ajouter à la table : cette option ajoute des données à une table existante. Si la table
n’existe pas, la table est créée lors de l’exécution initiale du flux et des données sont ajou-
tées à cette table à chaque exécution ultérieure du flux.
l Créer une table : cette option crée une nouvelle table avec les données de votre flux. Si la
table existe déjà, la table et toute structure de données ou de propriétés existante définie
pour la table sont supprimées et remplacées par une nouvelle table qui utilise la structure
de données du flux. Tous les champs existant dans le flux sont ajoutés à la nouvelle table
de base de données.
l Remplacer les données : cette option supprime les données de votre table existante et
les remplace par les données de votre flux, mais conserve la structure et les propriétés de
la table de base de données. Si la table n’existe pas, la table est créée lors de l’exécution
initiale du flux et les données de table sont remplacées lors de chaque exécution ultérieure
du flux.
Options supplémentaires
En plus des options d’écriture, vous pouvez également inclure des scripts SQL personnalisés ou
ajouter une nouvelle table à votre base de données.
l Scripts SQL personnalisés : entrez votre SQL personnalisé et sélectionnez si vous sou-
haitez exécuter votre script avant, après ou à la fois avant et après l’écriture des données
dans les tables de la base de données. Vous pouvez utiliser ces scripts pour créer une
copie de votre table de base de données avant que les données de flux ne soient écrites
dans la table, ajouter un index, ajouter d’autres propriétés de table, etc.
l Ajouter une nouvelle table : ajoutez une nouvelle table portant un nom unique à la base
de données au lieu d’en sélectionner une dans la liste de table existante. Si vous sou-
haitez appliquer un schéma autre que le schéma par défaut (Microsoft SQL Server et
PostgreSQL), vous pouvez le spécifier à l’aide de la syntaxe [schema name].[table
name].
Si vous vous connectez à des sources de données sur site, à compter de la version 2025.1,
vous pouvez utiliser un client Tableau Bridge pour vous connecter et actualiser vos données
dans Tableau Cloud. Vous aurez besoin d’un client Tableau Bridge configuré dans un pool de
clients Bridge, en ajoutant le domaine à la Liste d’autorisations de réseau privé. Dans Tableau
Prep Builder et sur le Web, lorsque vous vous connectez à votre source de données, assurez-
vous que l’URL du serveur correspond au domaine du pool Bridge. Pour plus d’informations,
consultez « Bases de données » dans la section Tableau Cloud dans Publier un flux depuis
Tableau Prep Builder.
Remarque : il n’est pas encore possible de fixer des limites de caractères pour vos
champs. Par contre, vous pouvez créer, dans votre base de données, des tables qui
incluent des contraintes de limite de caractères, puis utiliser l’option Remplacer les
données pour remplacer vos données tout en conservant la structure de la table dans
votre base de données.
l Point (.)
l Espace ( )
l point-virgule (;)
Microsoft SQL l Les valeurs de champ de texte peuvent comporter jusqu’à 3072
Server caractères. Les valeurs plus longues sont tronquées.
l (Version : 2022.3.1) Les sorties de flux publiées sur Tableau Server
sont autorisées à accéder en écriture à une base de données
Microsoft SQL Server à l’aide des informations d’identification
Exécuter en tant que. Consultez maestro.output.write_to_
mssql_using_runas dans Options tsm configuration set.
SAP HANA l Les valeurs de champ de texte peuvent comporter jusqu’à 8192
caractères. Les valeurs plus longues sont tronquées.
de Snowflake.
Vous pouvez intégrer vos informations d’identification pour la base de données lors de la
publication du flux. Pour plus d’informations sur l’intégration d’informations d’identification,
consultez la section Bases de données dans Publier un flux depuis Tableau Prep
Builder sur la page 525
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
2. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez Stockage sur les
bases de données et le cloud.
3. Sous l’onglet Paramètres, entrez les informations suivantes :
l Dans la liste déroulante Connexion, sélectionnez le connecteur de base de
données où vous souhaitez écrire votre sortie de flux. Seuls les connecteurs pris en
charge s’affichent. Il peut s’agir du même connecteur que celui que vous avez utilisé
pour votre entrée de flux ou d’un connecteur différent. Si vous sélectionnez un autre
connecteur, vous serez invité à vous connecter.
Pour créer une table dans la base de données, entrez plutôt un nom de table
unique dans le champ, puis cliquez sur Créer une nouvelle table. Lorsque vous
exécutez le flux pour la première fois, quelle que soit l’option d’écriture que vous
sélectionnez, la table est créée dans la base de données en utilisant le même
schéma que le flux.
4. Le volet Sortie affiche un instantané de vos données. Une comparaison de champ vous
montre les champs de votre flux qui correspondent aux champs de votre table, si la table
existe déjà. Si la table est nouvelle, une correspondance élément par élément s’affiche.
En cas de non-correspondance de champ, une note d’état vous montre toutes les erreurs.
l Aucune correspondance : le champ est ignoré : les champs existent dans le
flux mais pas dans la base de données. Le champ ne sera pas ajouté à la table de
base de données sauf si vous sélectionnez l’option d’écriture Créer une table et
effectuez une actualisation complète. Ensuite, les champs de flux sont ajoutés à la
table de base de données et utilisent le schéma de sortie de flux.
l Aucune correspondance : le champ contiendra des valeurs null : des
champs existent dans la base de données, mais pas dans le flux. Le flux transmet
une valeur null à la table de base de données du champ. Si le champ existe dans le
flux, mais qu’il n’y a pas de correspondance parce que le nom du champ est
différent, vous pouvez accéder à une étape de nettoyage et modifier le nom du
champ afin qu’il corresponde au nom du champ de base de données. Pour savoir
comment modifier le nom d’un champ, consultez Appliquer des opérations de
nettoyage sur la page 259.
l Erreur : les types de données de champ ne correspondent pas : le type de
données attribué à un champ dans le flux et la table de base de données sur
laquelle vous écrivez votre sortie doit correspondre, sinon le flux échouera. Vous
pouvez accéder à une étape de nettoyage et modifier le type de données de
champ pour résoudre ce problème. Pour plus d’informations sur la modification
des types de données, consultez Vérifier les types de données affectés à vos
données sur la page 181.
5. Sélectionnez une option d’écriture. Vous pouvez sélectionner une option différente pour
l’actualisation complète et incrémentielle et l’option est appliquée lorsque vous
sélectionnez la méthode d’exécution de votre flux. Pour plus d’informations sur
l’exécution de notre flux à l’aide d’une actualisation incrémentielle, consultez Actualiser
les données de flux à l’aide d’une actualisation incrémentielle sur la page 469.
l Ajouter à la table : cette option ajoute des données à une table existante. Si la
table n’existe pas, la table est créée lors de l’exécution initiale du flux et des
données sont ajoutées à cette table à chaque exécution ultérieure du flux.
l Créer une table : cette option crée une nouvelle table. S’il existe déjà une table du
même nom, la table existante est supprimée et remplacée par la nouvelle table.
Toutes les structures ou les propriétés de données existantes définies pour la table
sont également supprimées et remplacées par la structure de données du flux.
Tous les champs existant dans le flux sont ajoutés à la nouvelle table de base de
données.
l Remplacer les données : cette option supprime les données de votre table
existante et les remplace par les données de votre flux, mais conserve la structure
et les propriétés de la table de base de données.
6. (facultatif) Cliquez sur l’onglet SQL personnalisé et entrez votre script SQL. Vous pouvez
entrer un script à exécuter avant et après l’écriture des données sur la table.
7. Cliquez sur Exécuter le flux pour exécuter le flux et écrire vos données dans votre base
de données sélectionnée.
Nettoyez vos données à l’aide de Tableau Prep et obtenez de meilleurs résultats de prédiction
dans CRM Analytics. Connectez-vous simplement aux données de l’un des connecteurs pris en
charge par Tableau Prep Builder ou Tableau Prep sur le Web. Ensuite, appliquez des
transformations pour nettoyer vos données et exportez vos données de flux directement vers les
ensembles de données dans CRM Analytics auxquels vous avez accès.
Les flux qui envoient des données vers CRM Analytics ne peuvent pas être exécutés à l’aide de
l’interface de ligne de commande. Vous pouvez exécuter des flux manuellement à l’aide de
Tableau Prep Builder ou à l’aide d’un programme sur le Web avec Tableau Prep Conductor.
Conditions préalables
Pour envoyer des données de flux vers CRM Analytics, vérifiez que vous disposez des licences,
accès et autorisations suivants dans Salesforce et Tableau.
Exigences Salesforce
exigence description
exigence description
exigence description
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
2. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez CRM Analytics.
5. Sous le champ Nom, vérifiez que l’application affichée est l’application sur laquelle vous
êtes autorisé à écrire.
Pour changer d’application, cliquez sur Parcourir les ensembles de données, puis
sélectionnez l’application dans la liste, saisissez le nom de l’ensemble de données dans le
champ Nom et cliquez sur Accepter.
6. Dans la section Options d’écriture, Actualisation complète et Créer une table sont les
seules options prises en charge.
7. Cliquez sur Exécuter le flux pour exécuter le flux et écrire vos données dans l’ensemble
de données CRM Analytics.
Si l’exécution de votre flux réussit, vous pouvez vérifier les résultats de sortie dans CRM
Analytics à partir de l’onglet Surveiller du Gestionnaire de données. Pour plus
d’informations sur cette fonctionnalité, consultez Surveillance d’un chargement de
données externes dans l’aide de Salesforce.
Préparez vos données avec Tableau Prep, puis associez-les aux ensembles de données
existants dans Data Cloud. Utilisez l’un des connecteurs pris en charge par Tableau Prep
Builder ou Tableau Prep sur le Web pour importer vos données, nettoyer et préparer vos
données, puis générer vos données de flux directement vers Data Cloud à l’aide de l’API
d’ingestion.
Licence Salesforce Pour plus d’informations sur les éditions de Data Cloud et les
licences complémentaires, consultez Éditions et licences Data
Cloud standard dans l’aide de Salesforce.
Autorisations pour Vous devez être affecté à un espace de données ainsi qu’à l’un
l’espace de données des ensembles d’autorisations suivants dans Data Cloud :
Autorisation d’ingestion Vous devez être affecté aux éléments suivants pour accéder
vers Data Cloud aux champs d’ingestion vers Data Cloud :
Licence et autorisations Licence Creator. En tant que Creator, vous devez vous
Tableau Prep connecter à votre compte d’org Salesforce et vous authentifier
avant de pouvoir sélectionner des applications et des
ensembles de données pour générer vos données de flux.
Si c’est la première fois que vous enregistrez des données dans Data Cloud, suivez les
exigences de configuration décrites dans Conditions préalables à la configuration de Data
Cloud sur la page 462.
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
2. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez Salesforce Data Cloud.
3. Dans la section Objet, sélectionnez l’org Salesforce Data Cloud à laquelle vous
connecter.
5. Connectez-vous à l’org Data Cloud à l’aide de votre nom d’utilisateur et de votre mot de
passe.
6. Dans le formulaire Autoriser l’accès, cliquez sur Autoriser.
l Dans la zone de recherche rapide, saisissez API Ingestion, puis sélectionnez API
Ingestion dans les résultats.
l Dans la page API Ingestion, vous verrez les connecteurs disponibles répertoriés
sous Nom du connecteur.
9. La section Options d’écriture indique que les lignes existantes seront mises à jour si la
valeur spécifiée existe déjà dans une table, ou qu’une nouvelle ligne sera insérée si la
valeur spécifiée n’existe pas déjà.
10. Cliquez sur Exécuter le flux pour exécuter le flux et écrire vos données dans Data Cloud.
11. Validez les données dans Data Cloud en affichant l’état d’exécution dans le flux de
données et les objets dans l’explorateur de données.
Considérations
l Vous ne pouvez exécuter qu’un flux à la fois. L’exécution doit être terminée dans Data
Cloud avant qu’une autre sortie de sauvegarde puisse être exécutée.
l L’enregistrement d’un flux dans Data Cloud peut demander un certain temps. Vérifiez
l’état dans Data Cloud.
l Les données sont enregistrées dans Data Cloud à l’aide de la fonction Upsert. Si un
enregistrement dans un fichier correspond à un enregistrement existant, l’enregistrement
existant est mis à jour avec les valeurs de vos données. Si aucune correspondance n’est
trouvée, l’enregistrement est créé en tant que nouvelle entité.
l Pour Prep Conductor, si vous planifiez l’exécution automatique du même flux, les données
ne seront pas mises à jour. En effet, seul Upsert est pris en charge.
l Vous ne pouvez pas abandonner le travail pendant le processus d’enregistrement dans
Data Cloud.
l Les champs enregistrés dans Data Cloud ne font pas l’objet d’une validation. Validez les
données dans Data Cloud.
Remarque : les schémas de l’API Ingestion ont des exigences définies. Voir
Exigences du schéma sur la page 465 avant l’ingestion.
Une véritable clé primaire doit être utilisée pour Data Cloud. S’il n’en existe pas, vous
devez créer un champ de formule pour la clé primaire.
Pour Catégorie, choisissez entre Profil, Engagement ou Autre. Un champ datetime doit
être présent pour les objets destinés à la catégorie d’engagement. Les objets de type profil
ou autre n’imposent pas cette même exigence. Pour plus d’informations, voir Catégorie et
Clé primaire.
6. Cliquez sur Déployer.
Vous disposez désormais d’un flux de données et d’un objet lac de données. Votre flux de
données peut désormais être ajouté à un espace de données.
1. Accédez à l’onglet Flux de données et sélectionnez le flux de données que vous avez
créé.
L’espace de mappage de champs affiche vos objets DLO sources à gauche et vos objets
DMO cibles à droite. Pour plus d’informations, consultez Carte des objets modèle de
données.
Dans le cadre de la configuration de votre application connectée pour l’API Ingestion, vous
devez sélectionner les portées OAuth suivantes :
Exigences du schéma
Pour créer une source API Ingestion dans Data Cloud, le fichier de schéma que vous téléchargez
doit répondre à des exigences spécifiques. Voir Configuration requise pour le fichier de schéma
API Ingestion.
l Les schémas téléchargés doivent être dans un format OpenAPI valide avec une extension
.yml ou .yaml. La version OpenAPI 3.0.x est prise en charge.
l Les objets ne peuvent pas avoir d’objets imbriqués.
l Chaque schéma doit avoir au moins un objet. Chaque objet doit avoir au moins un champ.
l Les objets ne peuvent pas avoir plus de 1000 champs.
l Les objets ne peuvent pas comporter plus de 80 caractères.
l Les noms d’objet doivent uniquement contenir les caractères a-z, A-Z, 0–9, _, -. Il ne doit
pas y avoir de caractères Unicode.
l Les noms de champs doivent uniquement contenir les caractères a-z, A-Z, 0–9, _, -. Il ne
doit pas y avoir de caractères Unicode.
l Les noms de champs ne peuvent pas être l’un de ces mots réservés : date_id, location_id,
dat_account_currency, dat_exchange_rate, pacing_period, pacing_end_date, row_count,
version. Les noms de champs ne peuvent pas contenir la chaîne __.
l Les noms de champs ne peuvent pas excéder 80 caractères.
l Les champs répondent au type et au format suivants :
l Pour le type texte ou booléen : chaîne
required:
- car_id
- color
- createddate
properties:
car_id:
type: integer
format: int64
color:
type: string
maxLength: 50
createddate:
type: string
format: date-time
Vous pouvez vous connecter aux données de n’importe quel connecteur pris en charge par
Tableau Prep Builder ou la création Web et enregistrer votre sortie de flux sous forme de fichier
.parquet ou .csv sur Amazon S3. La sortie peut être enregistrée en tant que nouvelles données
ou vous pouvez remplacer les données S3 existantes. Pour éviter la perte de données, vous
pouvez utiliser l’option SQL personnalisé pour faire une copie des données de votre table et
l’exécuter avant d’enregistrer les données de flux sur S3.
Le volume total de données et le nombre d’objets que vous pouvez stocker dans Amazon S3
sont illimités. La taille des objets Amazon S3 individuels peut varier d’un minimum de 0 octet à un
maximum de 5 To. L’objet le plus volumineux pouvant être téléchargé dans un seul PUT est de
5 Go. Pour les objets de plus de 100 Mo, les clients doivent envisager d’utiliser la fonctionnalité
de téléchargement partitionné. Consultez Téléchargement et copie d’objets à l’aide du
téléchargement partitionné.
Autorisations
Pour écrire dans votre compartiment Amazon S3, vous avez besoin des éléments suivants :
région et nom du compartiment, ID de la clé d’accès et clé d’accès secrète. Pour obtenir ces
clés, vous devrez créer un utilisateur de gestion des identités et des accès (IAM) au sein d’AWS.
Consultez Gestion des clés d’accès pour les utilisateurs IAM.
1. Cliquez sur l’icône plus dans une étape et sélectionnez Ajouter une sortie.
2. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez Stockage sur les bases
de données et le cloud.
3. Dans la section Table > Connexion, sélectionnez Amazon S3 (sortie uniquement).
4. Dans le formulaire Amazon S3 (sortie uniquement), ajoutez les informations suivantes :
l ID de clé d’accès : ID de clé utilisé pour signer les demandes que vous envoyez à
Amazon S3.
l Clé d’accès secrète : informations d’identification de sécurité (mots de passe,
clés d’accès) utilisées pour vérifier que vous avez l’autorisation d’accéder à la res-
source AWS.
l Région du compartiment : emplacement du compartiment Amazon S3 (point de
terminaison de la région AWS). Par exemple : us-east-2.
l Nom du compartiment : le nom du compartiment S3 dans lequel vous souhaitez
écrire la sortie du flux. Les noms de compartiment de deux comptes AWS dans la
même région ne peuvent pas être identiques.
Vous pouvez enregistrer la sortie du flux en tant que nouvel objet S3 ou remplacer un
objet S3 existant.
l Pour un nouvel objet S3, entrez le nom du fichier .parquet ou .csv. L’URI est
file.csv>.
l Pour remplacer un objet S3 existant, saisissez le nom du fichier .parquet ou .csv
ou cliquez sur Parcourir pour trouver les fichiers S3 .parquet ou .csv existants.
7. Pour les options d’écriture, un nouvel objet S3 est créé avec les données de votre flux. Si
les données existent déjà, les structures ou propriétés de données existantes définies
pour l’objet sont supprimées et remplacées par de nouvelles données de flux. Tous les
champs du flux sont ajoutés au nouvel objet S3.
8. Cliquez sur Exécuter le flux pour lancer l’opération et écrire vos données sur S3.
Vous pouvez vérifier que les données ont été enregistrées sur S3 en vous connectant à
votre compte AWS S3 et en accédant à la console AWS S3.
Depuis Tableau Prep Builder version 2020.2.1 et sur le Web, vous pouvez configurer
l’actualisation incrémentielle des entrées et des sorties dans votre flux. Ainsi, seules les
nouvelles lignes seront récupérées et traitées lors de l’exécution du flux, d’où un gain de temps et
de ressources.
Par exemple, si votre flux inclut des données de transaction qui sont mises à jour
quotidiennement, vous pouvez configurer des actualisations incrémentielles afin de récupérer et
de traiter uniquement les nouvelles transactions quotidiennes, puis exécuter une actualisation
complète hebdomadaire ou mensuelle afin d’actualiser toutes vos données de flux.
Remarque : pour exécuter une actualisation incrémentielle sur les entrées de flux qui
utilisent le connecteur Salesforce, vous devez utiliser Tableau Prep Builder version
Pour exécuter votre flux à l’aide d’un actualisation incrémentielle, Tableau Prep a besoin des
informations suivantes :
l Le champ qui détecte les nouvelles lignes dans la table des données entrantes.
l Le champ à utiliser pour comparer les dernières valeurs traitées dans la sortie de flux
avec les valeurs des données entrantes afin de déterminer les lignes nouvelles. Pour plus
de détails, voir Actualisation incrémentielle avec ajout sur la page 475.
l La manière dont vous souhaitez écrire les nouvelles données sur vos tables. Vous pou-
vez ajouter de nouvelles données à vos tables existantes, remplacer les données de vos
tables par de nouvelles données, ou, depuis Tableau Prep Builder version 2020.3.1 et sur
le Web, remplacer les données dans une table existante.
Actualisation Toutes ins- Ajoutez de Gardez une trace des données nou-
complète + Ajou- tallations nouvelles velles et des données existantes à
ter à une table lignes à la chaque exécution de flux. L’option
table exis- Ajouter à la table n’est pas dis-
tante. ponible pour les types de sortie .csv.
Actualisation Nouvelles Créez ou rem- Créez une nouvelle table avec les nou-
incrémentielle + lignes uni- placez une velles lignes uniquement en tant
Créer une table quement table existante qu’ensemble de données complet.
avec les nou-
Si la source de données de sortie
velles lignes
n’existe pas ou ne peut pas être
uniquement.
connectée lors de l’exécution du flux,
le flux échouera. Une actualisation
complète est nécessaire pour créer la
sortie avant qu’elle puisse être utilisée
de manière incrémentielle.
nouvelles lignes. Dans l’étape Sortie, spécifiez comment les nouvelles lignes sont écrites sur
votre table. Lorsque vous exécutez le flux, vous pouvez sélectionner un type d’actualisation
complète ou incrémentielle.
Conseil : une fois que vous avez configuré vos étapes de d’entrée et de sortie pour
l’actualisation incrémentielle, vous pouvez conserver vos configurations et les réutiliser. Copiez
et collez les étapes pour les utiliser ailleurs dans votre flux actuel ou dans Tableau Prep Builder,
utilisez Enregistrer les étapes en tant que flux pour enregistrer les étapes sélectionnées
dans un fichier local ou sur votre serveur afin de les réutiliser dans d’autres flux. Pour plus
d’informations sur le copier-coller ou la réutilisation d’étapes, consultez Copier des étapes,
des actions et des champs sur la page 307.
1. Dans le volet Flux, sélectionnez l’étape des données entrantes que vous souhaitez confi-
gurer pour l’actualisation incrémentielle.
2. Dans le volet Entrée de l’onglet Paramètres, dans la section Actualisation incré-
mentielle (section Configurer l’actualisation incrémentielle dans les versions anté-
rieures), définissez les options suivantes :
l Champ d’entrée (Identifier les nouvelles lignes à l’aide du champ dans les
versions antérieures) : sélectionnez le champ que vous souhaitez actualiser dans
vos données d’entrée. Un type de données de Nombre (entier), Date ou Date et
heure doit être attribué à ce champ. Actuellement, vous ne pouvez sélectionner
qu’un seul champ.
l Sortie : sélectionnez la sortie qui est liée à votre entrée et qui inclut le champ à
utiliser pour comparer les lignes.
Champ d’entrée (Identifier les nouvelles lignes à l’aide du champ dans les
versions antérieures).
Table existante :
Col1 Col2
ID 5 Ligne 5
Col1 Col2
ID 1 NewRow1
ID 6 NewRow6
Vous pouvez publier vos lignes dans un fichier (Tableau Prep Builder uniquement), une source
de données publiée ou une base de données. Par défaut, les sorties vers des extraits locaux ou
.hyper publiés sont définies sur Ajouter à la table. Les sorties vers des types de fichiers .csv
sont définies sur Créer la table.
1. Dans le volet Flux, sélectionnez l’étape de sortie que vous souhaitez configurer pour
l’actualisation incrémentielle.
2. Dans le volet Sortie, dans la section Options d’écriture, consultez l’option d’écriture par
défaut et apportez des modifications si nécessaire.
l Créer une table : cette option crée une nouvelle table ou remplace la table exis-
tante par la nouvelle sortie.
l Ajouter à la table : cette option ajoute les nouvelles données à votre table exis-
tante. Si la table n’existe pas déjà, une nouvelle table est créée lors de la première
exécution du flux et les exécutions suivantes ajoutent les nouvelles lignes à cette
table. Non disponible pour les types de sortie .csv. Pour plus d’informations sur les
combinaisons d’actualisations prises en charge, consultez Options
d’actualisation de flux sur la page 470.
l Remplacer les données (Tableau Prep Builder depuis la version 2020.3.1 et ver-
sions ultérieures, et sur le Web) : cette option est disponible lorsque vous sou-
haitez écrire votre sortie en la réintégrant dans une table existante d’une base de
données. Cette option remplace les données de la table de base de données par
les données de flux, mais conserve la structure du schéma de la table.
l’exécution de votre flux à partir de la ligne de commande, voir Exécuter le flux avec
l’actualisation incrémentielle activée sur la page 494.
Si vous avez Data Management avec Tableau Prep Conductor activé, vous pouvez exécuter
votre flux à l’aide d’une actualisation incrémentielle en définissant une programmation dans
Tableau Server ou Tableau Cloud.
Remarque : dans la version précédente, les options d’écriture sont définies dans
Tableau Prep Builder et ne peuvent pas être modifiées lors de l’exécution de votre flux
dans Tableau Server ou Tableau Cloud. Depuis Tableau Server et Tableau Cloud version
2020.4, vous pouvez modifier le flux directement dans le Web. Pour plus d’informations
sur l’utilisation de Tableau Prep sur le Web, consultez Tableau Prep sur le Web dans
l’aide de Tableau Server.
Tableau Prep exécute une actualisation complète pour toutes les sorties quelle que soit l’option
d’exécution que vous sélectionnez si aucune sortie existante n’est trouvée. Les flux ultérieurs
utilisent le processus d’actualisation incrémentielle et récupèrent et traitent uniquement les
nouvelles lignes à moins qu’il ne manque des données de configuration de l’actualisation
incrémentielle ou que la sortie existante ne soit supprimée.
Pour exécuter le flux dans Tableau Prep à l’aide d’une actualisation incrémentielle, sélectionnez
Actualisation incrémentielle dans l’un des emplacements suivants :
l Dans le volet Sortie, cliquez sur l’option déroulante de l’option Exécuter le flux.
l Dans le volet Flux, cliquez sur l’option déroulante du bouton Exécuter à côté de l’étape
Sortie.
Si une entrée pour laquelle vous avez activé l’actualisation incrémentielle est associée à
plusieurs sorties, ces sorties doivent être exécutées ensemble et doivent utiliser le même
type d’actualisation. Lorsque vous exécutez votre actualisation dans Tableau Prep, une
boîte de dialogue s’affiche pour vous indiquer que vous devez exécuter les deux sorties
ensemble.
Vous pouvez exécuter votre flux depuis la ligne de commande pour actualiser votre sortie de flux
au lieu d’exécuter le flux depuis Tableau Prep Builder. Vous pouvez exécuter un flux à la fois à
l’aide de cette méthode. Cette option est disponible à la fois sur les ordinateurs Windows et Mac
sur lesquels Tableau Prep Builder est installé.
Remarque : si vous utilisez la gestion des licences basée sur la connexion (LBLM),
assurez-vous d’ouvrir régulièrement Tableau Prep et de vous connecter à
l’environnement Tableau Server ou au site Tableau Cloud que vous avez utilisé pour
l’activation. Sinon, le bail peut expirer, provoquant l’échec des flux exécutés via la ligne
de commande. Vous pouvez également contacter votre administrateur pour modifier la
durée de votre bail sur la durée maximale. Pour plus d’informations, consultez Gestion
des licences basée sur la connexion.
Limitations du connecteur :
l Connecteurs JDBC ou ODBC : les flux qui incluent ces connecteurs peuvent être exé-
cutés depuis la ligne de commande à compter de la version 2019.2.3.
l Connecteurs cloud : les flux qui incluent des connecteurs cloud, tels que Google
BigQuery, ne peuvent pas être exécutés depuis la ligne de commande. Au lieu de cela,
exécutez le flux manuellement ou exécutez le flux de manière programmée dans Tableau
Server ou Tableau Cloud à l’aide de Tableau Prep Conductor. Pour plus d’informations,
consultez Actualiser les données de flux sur la page 514.
l Authentification SSO : l’exécution de flux à partir de la ligne de commande n’est pas
prise en charge si vous utilisez l’authentification SSO. Vous pouvez exécuter les flux
depuis Tableau Prep Builder à la place.
l Authentification multifacteur : l’interface en ligne de commande (CLI) de Tableau Prep
ne prend pas en charge Tableau avec l’authentification multifacteur (MFA). Pour plus
d’informations, consultez cet article dans la Base de connaissances de Tableau.
Pour les ordinateurs Windows, vous pouvez également programmer ce processus à l’aide du
Planificateur de tâches Windows. Pour plus d’informations, consultez Planificateur de tâches
dans l’aide en ligne de Microsoft.
Lorsque vous exécutez des flux depuis la ligne de commande, Tableau Prep Builder actualise
toutes les sorties du flux à l’aide des paramètres des étapes de sortie spécifiées dans Tableau
Prep Builder. Pour savoir comment spécifier vos emplacements de sortie, consultez Créer des
fichiers d’extrait de données et des sources de données publiées sur la page 433. Pour
plus d’informations sur la configuration de vos options d’écriture (version 2020.2.1 et versions
ultérieures), consultez Configurer les options d’écriture sur la page 475.
Remarque : les fichiers d’identifiants .json ne sont pas requis si le flux se connecte et
envoie la sortie à des fichiers locaux, à des fichiers stockés sur un partage réseau ou à des
fichiers de données entrantes utilisant l’authentification Windows (SSPI). Pour plus
d’informations sur l’authentification Windows, consultez Modèle SSPI dans l’aide en ligne
de Microsoft.
Tableau Prep Builder utilise les informations du fichier de flux et du fichier .json d’identifiants pour
exécuter le flux dans le cas de connexions distantes. Par exemple, le nom de la base de données
pour vos connexions à distance et le nom du projet pour vos fichiers de sortie proviennent du flux,
et le nom du serveur et les identifiants de connexion proviennent du fichier d’identifiants .json.
l Si vous comptez réutiliser le fichier, placez-le dans un dossier où il ne sera pas écrasé par
le processus d’installation de Tableau Prep Builder.
l Si vous exécutez un flux qui inclut l’un des éléments suivants, vous devez inclure un fichier
.json qui comprend les informations d’identification requises pour vous connecter.
l Connectez-vous à des fichiers de base de données ou des sources de données
publiées.
l La sortie est publiée sur un serveur ou sur une base de données ( depuis la version
2020.3.1).
l Le flux inclut des étapes de script pour Rserve ou TabPy. Le fichier .json doit inclure
les informations d’identification requises pour se connecter à ces services. Pour
plus d’informations, consultez les exigences du tableau pour votre version ci-des-
sous.
l Les informations d’identification spécifiées dans votre flux et celles incluses dans votre
fichier .json doivent correspondre, sinon le flux ne s’exécutera pas.
l Lorsque vous exécutez le processus, le nom d’hôte, le port et le nom d’utilisateur sont uti-
lisés pour trouver la connexion correspondante dans le fichier de flux Tableau (.tfl) et mis
à jour avant l’exécution du processus. L’ID de port et l’ID de site sont facultatifs si vos
connexions ne requièrent pas ces informations.
l Si vous vous connectez à une source de données publiée, incluez les valeurs hostname,
contentUrl et port (80 pour http et 443 pour https) dans les connexions d’entrée. Le nom
d’hôte est nécessaire pour trouver la connexion correspondante dans le fichier de flux
Tableau (. tfl). Quant à contentUrl et au port, ils servent à établir la connexion au serveur.
l Si vous vous connectez à Tableau Cloud, incluez le port (80 ou 443) dans les connexions
d’entrée pour le pod auquel vous vous connectez. Dans l’URl de connexion au serveur,
assurez-vous d’inclure le préfixe de pod correspondant avec online.tableau.com. Pour
plus d’informations sur Tableau Cloud, consultez Connexions Tableau Bridge à Tableau
Cloud dans l’aide en ligne de Tableau Cloud.
l (version 2021.4.1 et versions ultérieure) Si vous incluez des paramètres dans votre flux,
vous pouvez créer et inclure un fichier .json de remplacement des paramètres dans la
ligne de commande pour modifier les valeurs des paramètres à partir des valeurs par
défaut actuelles. Pour plus d’informations, consultez Exécuter des flux qui incluent
des valeurs de paramètre sur la page 484.
Selon votre version de Tableau Prep Builder, vos informations d’identification peuvent être
mises en forme différemment. Cliquez sur l’onglet ci-dessous pour afficher le format des
informations d’identification pour votre version de Tableau Prep Builder.
tableau : » ou TabPy.
Remarque: ContentUrl est toujours requis dans le fichier .json pour les connexions au
serveur. Si vous vous connectez à un site par défaut, par exemple
« https://my.server/#/site/ », définissez ContentUrl sur une valeur vide, par exemple
"contentUrl": ""
Pour exécuter, depuis la ligne de commande, des flux qui incluent des valeurs de paramètre,
vous pouvez créer un fichier .json de remplacement de paramètres qui inclut les valeurs de
paramètre que vous souhaitez utiliser. Ces valeurs remplacent les valeurs actuelles (par défaut)
définies pour les paramètres.
Il s’agit d’un fichier distinct de votre fichier credentials.json. Il inclut les noms et les valeurs de
vos paramètres.
Remarque : depuis la version 2022.1.1, les valeurs des paramètres n’ont plus besoin
d’être placées entre guillemets. Dans les versions précédentes, tous les noms et valeurs
de paramètre devaient inclure des guillemets.
Exemple :
{
"Parameter 1": Value 1,
"Number Parameter": 40,
"Boolean Parameter": True
}
Lorsque vous exécutez le flux, incluez -p --parameters et le nom de votre fichier dans la ligne de
commande.
Exemples :
Windows
Mac
Exemples
Cette section présente différents exemples de fichiers d’identifiants que vous pouvez créer en
respectant les exigences relatives au fichier d’identifiants .json.
{
"tableauServerConnections":[
{
"serverUrl":"https://my.server",
"contentUrl": "mysite",
"port":443,
"username": "jsmith",
"password": "passw0rd$"
}
]
}
Connexion à une connexion serveur et sortie sur une connexion de base de données
Cet exemple montre un fichier d’identifiants .json qui se connecte à une connexion serveur et
envoie les sorties à une connexion de base de données :
{
"tableauServerConnections":[
{
"serverUrl":"https://my.server",
"contentUrl": "mysite",
"port":443,
"username": "jsmith",
"password": "passw0rd$"
}
],
"databaseConnections":[
{
"hostname":"example123.redshift.amazonaws.com",
"port":"5439",
"username":"jsmith",
"password":"p@s$w0rd!"
}
]
}
Le flux inclut les connexions de script Rserve et TabPy et envoie une sortie vers une
connexion de base de données
Cet exemple montre un fichier d’identifiants .json qui inclut Rserve et des identifiants Tabpy et
envoie les sorties vers une connexion de base de données :
{
"extensions": [
{
"extensionName": "rSupport",
"regular": {
"host": "localhost",
"port": "9000",
"username": "jsmith"
},
"sensitive": {
"password": "pwd"
}
},
{
"extensionName": "pythonSupport",
"regular": {
"host": "localhost",
"port": "9000"
},
"sensitive": {
}
}
],
"databaseConnections":[
{
"hostname":"example123.redshift.amazonaws.com",
"port": "5439",
"username": "jsmith",
"password": "p@s$w0rd!"
},
{
"hostname":"mysql.mydb.tsi.lan",
"port": "3306",
"username": "jsmith",
"password": "mspa$$w0rd"
}
]
}
{
"databaseConnections":[
{
"hostname":"example123.redshift.amazonaws.com",
"port": "5439",
"username": "jsmith",
"password": "p@s$w0rd!"
},
{
"hostname":"mysql.mydb.tsi.lan",
"port": "3306",
"username": "jsmith",
"password": "mspa$$w0rd"
}
]
}
Remarque : si vous utilisez Tableau Prep Builder version 2018.2.2 à 2018.3.1, incluez
toujours les lignes « inputConnections » et « outputConnections » même si le flux ne
dispose pas de connexions distantes pour les données entrantes ou sortantes. Laissez
simplement ces lignes vides. Si vous utilisez Tableau Prep Builder version 2018.3.2 et
versions ultérieures, vous n’avez pas besoin d’inclure les tableaux vides.
Exemples
Cette section présente deux exemples différents de fichiers d’identifiants que vous pouvez créer
à l’aide des exigences relatives au fichier d’identifiants .json.
{
"inputConnections":[
{
"hostname":"https://my.server",
"contentUrl": "mysite",
"port":443,
"username": "jsmith",
"password": "passw0rd$"
}
],
"outputConnections":[
{
"serverUrl":"https://my.server",
"contentUrl":"mysite",
"username":"jsmith",
"password":"passw0rd$"
}
]
}
{
"inputConnections":[
{
"hostname":"mysql.example.lan",
"port":1234,
"username": "jsmith",
"password": "passw0rd"
},
{
"hostname":"Oracle.example.lan",
"port":5678,
"username": "jsmith",
"password": "passw0rd"
}
],
"outputConnections":[
{
"serverUrl":"http://my.server",
"contentUrl":"mysite",
"username":"jsmith",
"password":"passw0rd$"
}
]
}
Le flux inclut des étapes de script pour Rserve et TabPy et se connecte à une base
de données
Cet exemple montre un fichier d’informations d’identification .json qui inclut le mot de passe des
services Rserve et TabPy et se connecte à MySQL.
{
"inputConnections":[
{
"hostname":"mysql.example.lan",
"port":1234,
"username": "jsmith",
"password": "passw0rd"
}
],
"extensions":[
{
"extensionName":"rSupport",
"credentials":{
"password":"pwd",
}
},
{
"extensionName" : "pythonSupport",
"credentials": {
"password": "pwd"
}
}
]
}
l Si vous utilisez Tableau Prep Builder version 2018.2.2 à 2018.3.1, incluez toujours les
lignes « inputConnections » et « outputConnections » même si le flux ne dispose pas de
connexions distantes pour les données entrantes ou sortantes. Laissez simplement ces
lignes vides.
Si vous utilisez Tableau Prep Builder version 2018.3.2 et versions ultérieures, vous n’avez
pas besoin d’inclure la ligne vide.
l Pas de connexion distante aux données entrantes ? Incluez cette syntaxe en haut
du fichier .json
{
"inputConnections":[
],
l Pas de connexion distante aux données sortantes ? Incluez cette syntaxe en bas du
fichier .json
"outputConnections":[
]
}
l L’ID de port pour votre connexion d’entrée ou le port n’est pas spécifié dans le nom du
serveur.
S’il n’y a pas d’ID de port pour votre connexion, n’incluez pas la référence
"port":xxxx, dans le fichier .json, pas même "port": "". Si l’ID de port est inclus
dans le nom du serveur, incluez l’ID de port dans le nom d’hôte. Par exemple
"hostname": "mssql.example.lan,1234"
l Si vous avez plusieurs connexions à des données entrantes ou sortantes, incluez les
identifiants pour chacun dans le fichier.
l Si vous vous connectez à des sources de données publiées, assurez-vous d’inclure le
nom d’hôte et contentUrl dans les connexions d’entrée.
Exécuter le flux
Important : les exemples ci-dessous incluent le changement de nom de la version 2019.1.2 de
« Tableau Prep » en « Tableau Prep Builder ». Si vous utilisez une version antérieure du produit,
utilisez plutôt « Tableau Prep ».
Windows
Mac
Windows
Mac
l Le fichier de flux ou le fichier d’identifiants est stocké sur un partage réseau (utilisez
le format UNC pour le chemin d’accès : \\server\path\file name) :
Windows
Mac : Mappez le partage réseau à /Volumes dans le Finder afin qu’il soit persistant,
puis utilisez /Volumes/.../[your file] pour spécifier le chemin d’accès :
Pour des informations sur les erreurs courantes et leurs solutions, consultez Erreurs
courantes en cas d’utilisation de la ligne de commande pour exécuter des flux sur la
page 603.
Si vous n’avez pas activé Tableau Prep Conductor sur votre serveur pour planifier l’exécution de
vos flux, vous pouvez exécuter votre flux à l’aide d’actualisations incrémentielles depuis la ligne
de commande. Il suffit d’inclure le paramètre --incrementalRefresh dans votre ligne de
commande comme indiqué dans l’exemple ci-dessous.
Windows
Mac
Si l’actualisation incrémentielle est activée pour les étapes des données entrantes de votre flux
et que les paramètres d’actualisation incrémentielle sont correctement configurés, Tableau
Prep Builder procèdera comme suit :
l Toutes les entrées du flux pour lesquelles l’actualisation incrémentielle est activée exé-
cuteront toutes les sorties correspondantes en utilisant l’actualisation incrémentielle.
l Si l’actualisation incrémentielle n’a été activée pour aucune entrée dans le flux; toutes les
sorties seront exécutées à l’aide d’une actualisation complète. Un message affiche les
détails de la méthode d’actualisation.
l Si l’actualisation incrémentielle est activée pour certaines entrées dans le flux, les sorties
correspondantes s’exécuteront à l’aide d’une actualisation incrémentielle. Les autres
sorties seront exécutées à l’aide d’une actualisation complète et un message affichera les
détails de la méthode d’actualisation.
Pour plus d’informations sur la configuration des flux de manière à utiliser l’actualisation
incrémentielle, consultez Actualiser les données de flux à l’aide d’une actualisation
incrémentielle sur la page 469
Options de commande
Si vous souhaitez afficher les options d’aide, incluez -h dans la ligne de commande.
-d, -- Débo- Incluez cette option pour afficher d’autres informations afin de débo-
debug gage guer un problème d’actualisation de flux. Les fichiers journaux sont
du pro- stockés dans : My Tableau Prep Builder Repo-
ces- sitory\Command Line Repository\Logs
sus de
flux.
der version].app/Contents/scripts/./tableau-prep-
cli -dsv -c path/to/[your credential file
name].json -t path/to/[your flow file name].tfl
-h, --help Con- L’option d’aide ou une erreur de syntaxe affiche les informations
sultez suivantes :
l’aide
usage: tableau-prep-cli [-c <arg>] [-d] [-h] [-t
pour
<arg>]
les
option- -c,--connections <arg> Path to a file with
s de all connection information
syn-
taxe. -d,--debug This option is for
debugging
-inc, -- Exé- Incluez cette option pour exécuter une actualisation incrémentielle
incre- cutez pour toutes les entrées configurées pour l’utiliser. Une actualisation
men- une incrémentielle permet à Tableau Prep Builder de récupérer et de
talRe- actua- traiter uniquement les nouvelles lignes au lieu de toutes les lignes
fresh lisa- dans un flux.
tion
Les paramètres de configuration de l’actualisation incrémentielle lors
incré-
des étapes des données entrantes déterminent quelles sorties de
men-
flux peuvent être exécutées de manière incrémentielle. Toutes les
tielle
autres sorties seront exécutées à l’aide d’une actualisation complète
pour
et un message affichera les détails de la méthode d’actualisation.
toutes
Pour plus d’informations sur l’exécution de flux à l’aide
-t, -- Fichie- Requiert le chemin d’accès où le fichier de flux .tfl est localisé.
tflFile r de
<arg> flux .tfl
-p, --para- Les Incluez ce fichier si vous souhaitez remplacer les valeurs de para-
meters para- mètre actuelles (par défaut) appliquées à votre flux. Pour plus
mètre- d’informations sur l’utilisation des paramètres de flux, consultez
s Créer et utiliser des paramètres dans les flux sur la page 225.
rem-
place-
nt le
fichier
.json
Exemples de syntaxe
Les lignes de commande ci-dessous affichent quatre exemples différents d’exécution d’un flux à
l’aide des critères suivants :
Le flux se connecte aux fichiers locaux et publie sur les fichiers locaux
Windows
Mac
Le flux se connecte à des fichiers locaux et publie sur ces fichiers, et utilise la forme
courte pour l’actualisation incrémentielle
Windows
Mac
Mac
Le flux publie sur un serveur et le fichier d’identifiants est stocké sur un partage
réseau
Windows
Mac
Remarque : depuis la version 2020.4, vous pouvez désormais créer et modifier les flux
directement dans Tableau Server et Tableau Cloud. Les flux créés sur le Web seront
toujours compatibles avec la version de serveur que vous utilisez. Pour plus
d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web
dans l’aide de Tableau Server et Tableau Cloud.
De la même manière, si vous publiez des flux sur Tableau Server ou Tableau Cloud pour
programmer leur exécution à l’aide de Tableau Prep Conductor, et que vos flux incluent des
fonctionnalités ou des connecteurs nouveaux non pris en charge dans la version de Tableau
Server ou Tableau Cloud sur laquelle vous publiez, vous pouvez rencontrer des erreurs de
compatibilité susceptibles d’empêcher la programmation et l’exécution de vos flux.
Les versions de maintenance de Tableau Desktop et Tableau Prep Builder ne suivent pas la
même séquence.
Pour trouver la version de distribution de votre produit, ouvrez Tableau Prep Builder, puis dans le
menu supérieur, effectuez l’une des opérations suivantes :
l Windows : dans le menu du haut, cliquez sur Aide > À propos de Tableau Prep Builder
ou À propos de Tableau Prep, selon votre version.
l Mac : dans le menu supérieur, cliquez sur Tableau Prep Builder > À propos de Tableau
Prep Builder ou Tableau Prep > À propos de Tableau Prep, selon votre version.
Tableau Server
Tableau Prep Conductor a été introduit comme partie intégrante du module Data Management
dans Tableau Server version 2019.1. Pour programmer l’exécution de flux sur Tableau Server,
vous devez utiliser Tableau Server version 2019.1 ou ultérieure, et Tableau Prep Conductor doit
être activé.
Pour trouver votre version de Tableau Server, ouvrez Tableau Server dans votre navigateur
Web. Dans la barre du menu supérieur, cliquez sur l’icône d’informations dans le coin
supérieur droit et sélectionnez À propos de Tableau Server. Une boîte de dialogue vous
indique quelle version de Tableau Server vous utilisez. Pour savoir comment activer Tableau
Prep Conductor, consultez Étape 2 : Configurer les paramètres de flux pour votre serveur dans
l’aide de Tableau Server.
Tableau Cloud
Tableau Prep Conductor a été introduit comme partie intégrante du module Data Management
dans Tableau Cloud version 2019.3. Pour programmer l’exécution de flux sur Tableau Cloud,
vous devez utiliser Tableau Cloud version 2019.3 ou ultérieure, et Tableau Prep Conductor doit
être activé.
Pour trouver votre version, ouvrez Tableau Cloud dans votre navigateur Web. Dans la barre de
menu supérieure, cliquez sur l’icône d’informations dans le coin supérieur droit et sélectionnez
À propos de Tableau Cloud. Une boîte de dialogue vous indique quelle version de Tableau
Cloud vous utilisez. Pour plus d’informations sur l’activation de Tableau Prep Conductor,
consultez Tableau Prep Conductor dans l’aide de Tableau Cloud.
Par exemple :
l Le flux comprend des connecteurs d’entrée ou des fonctionnalités qui ne sont pas pris en
charge dans la version où le flux est ouvert.
l La machine que vous utilisez pour ouvrir le flux n’a pas les connecteurs d’entrée requis ou
possède une version de pilote pour le connecteur non compatible. Tableau Prep Builder
requiert l’installation de pilotes 64 bits pour fonctionner avec des connecteurs d’entrée de
flux.
En cas de problème de compatibilité, lorsque vous essayez d’ouvrir le flux, le flux peut s’ouvrir
mais risque de contenir des erreurs. Ou alors il ne s’ouvrira pas ou vous recevrez un message
d’erreur. Dans l’exemple ci-dessous, le flux ne s’ouvre pas, un message d’erreur s’affiche et
répertorie les fonctionnalités incompatibles ainsi que les options permettant de résoudre le
problème.
Cliquez sur le bouton de mise à jour situé en bas du volet Découvrir pour télécharger la
dernière version du produit et suivez les instructions d’Installation de Tableau Prep
Builder dans le Guide de déploiement de Tableau Desktop et Tableau Prep Builder. Si
vous n’avez pas accès au bouton de mise à jour du volet Découvrir, des instructions sur le
téléchargement de la dernière version du produit sont incluses dans la rubrique Installer
Tableau Prep Builder.
l Assurez-vous que votre ordinateur est compatible avec Tableau Prep Builder. Par
exemple, assurez-vous que les pilotes 64 bits sont installés pour les connecteurs utilisés
par le flux. Pour télécharger des pilotes, consultez la page Téléchargements des pilotes.
l Ouvrez une copie du flux dont les fonctionnalités incompatibles sont supprimées.
Dans Tableau Server, Tableau Prep Conductor détecte les fonctionnalités incluses dans un flux
au moment de sa publication. S’il détecte des fonctionnalités qu’il ne prend pas en charge, le flux
peut toujours être publié sur Tableau Server, mais il ne peut pas être exécuté, ni être programmé
ou encore ajouté à une tâche. Tableau Cloud est mis à jour automatiquement et régulièrement, et
est donc généralement compatible avec toutes les versions de Tableau Prep Builder.
Si vous utilisez une version plus ancienne de Tableau Server, vous pouvez toujours exécuter des
flux incompatibles manuellement dans Tableau Prep Builder ou à l’aide de la ligne de
commande. Pour plus d’informations sur l’utilisation de ce processus, consultez Actualiser les
fichiers de sortie de flux à partir de la ligne de commande.
Remarque : depuis Tableau Prep Builder version 2020.1.4, une fois que vous vous
connectez à votre serveur, Tableau Prep Builder se souvient de votre nom de serveur et
de vos informations d’identification lorsque vous fermez l’application. La prochaine fois
que vous ouvrez l’application, vous êtes donc déjà connecté à votre serveur.
1. Survolez la fonction désactivée pour voir si elle est désactivée parce qu’elle n’est pas
compatible avec la version de votre serveur, puis cliquez sur le bouton Utiliser la
fonctionnalité. Cette option est disponible dans le volet Flux et dans les menus du volet
Profil, du volet Résultats et la grille de données.
Remarque : les fonctionnalités peuvent être désactivées pour d’autres raisons, par
exemple si les mises à jour des données sont suspendues ou si l’option n’est pas
disponible pour une étape ou un type de données spécifique.
1. Dans le menu du haut, sélectionnez Aide > Paramètres et performances > Désactiver
les fonctionnalités incompatibles.
Survolez les alertes dans le volet Flux pour afficher des informations sur la fonctionnalité
incompatible ou utilisez le centre d’alertes pour afficher plus de détails. Dans le centre d’alerte,
cliquez sur le lien Afficher dans le flux pour accéder directement à l’étape, l’annotation, le
champ ou la modification qui a déclenché l’avertissement.
Si vous continuez à publier le flux, la publication aboutira correctement. Toutefois, lorsque vous
ouvrez le flux dans Tableau Server ou Tableau Cloud, le message suivant s’affichera :
Pour planifier et exécuter le flux dans Tableau Server, vous pouvez effectuer l’une des
opérations suivantes :
Tableau Cloud est mis à jour automatiquement et régulièrement, en général tous les
trimestres. Testez d’abord votre flux, pour vous assurer qu’il est compatible avec votre
version actuelle de Tableau Cloud avant de le publier.
l Avant de publier le flux, supprimez les éléments incompatibles du flux, puis publiez le flux.
l Si vous avez déjà publié votre flux sur Tableau Server, essayez de modifier directement
le flux sur le serveur (version 2019.4 et ultérieure), téléchargez le flux et supprimez des
fonctionnalités ou créez le flux dans une version antérieure de Tableau Prep Builder en
utilisant uniquement des fonctionnalités disponibles dans cette version.
Remarque : Tableau Prep Conductor fait partie de Data Management . Vous devez
l’activer dans Tableau Server ou Tableau Cloud pour exécuter les flux à l’aide de la
fonctionnalité de programmation. Pour plus de détails sur Data Management, consultez
Tableau Data Management. Pour plus d’informations sur l’activation de Tableau Prep
Conductor dans Tableau Server ou Tableau Cloud, consultez Étape 2 : Configurer les
paramètres de flux pour votre serveur dans l’aide de Tableau Server ou Tableau Prep
Conductor dans l’aide de Tableau Cloud.
1. Ouvrez votre flux. Si vous êtes dans Tableau Prep Conductor, dans le menu Autres
actions , cliquez sur Télécharger pour télécharger le flux et l’ouvrir dans Tableau Prep
Builder ou ouvrez simplement le flux dans Tableau Prep Builder.
2. Si vous avez téléchargé le flux, cliquez sur le flux téléchargé pour l’ouvrir.
Dans le coin supérieur droit du volet Flux, cliquez sur Alerte pour afficher les détails
de chaque fonctionnalité incompatible. Cliquez sur Afficher dans le flux pour
naviguer jusqu’à la fonctionnalité incompatible et prendre des mesures.
4. Dans le menu supérieur, cliquez sur Fichier > Enregistrer sous pour enregistrer une
copie de votre flux. Utilisez les options des sections suivantes pour supprimer les
fonctionnalités incompatibles de votre flux.
Pour modifier votre connexion de données, consultez Remplacer votre source de données
sur la page 142.
Fonctionnalités incompatibles
Pour supprimer les fonctionnalités incompatibles, vous devez trouver les étapes où ces
fonctionnalités ont été utilisées et les supprimer. Vous pouvez suivre les instructions de la section
Identifier les fonctionnalités incompatibles sur la page 511 pour localiser les fonctions
incompatibles.
1. Si la fonctionnalité est un type d’étape, dans le volet Flux, cliquez sur l’étape où la
fonctionnalité est utilisée. Cliquez avec le bouton droit de la souris (ou Ctrl-clic sur un
MacOS) dans l’étape et sélectionnez Supprimer.
2. Si la fonctionnalité est une opération de nettoyage, dans le volet Flux, cliquez sur l’étape
où la fonctionnalité est utilisée. Vous pouvez survoler les annotations dans le volet Flux ou
dans les volets Profil ou Résultats pour afficher une liste des modifications.
Remarque : dans Tableau Prep Builder version 2019.1.3 et ultérieure, vous pouvez
survoler l’icône représentant la modification que vous recherchez dans une étape
du volet Flux ou dans la fiche de profil, puis sélectionner l’annotation dans la liste
des modifications. La modification est mise en surbrillance dans le volet
Modifications, le volet Profil ou le volet Résultats, et dans la grille de données.
4. Répétez ces étapes pour remplacer toute autre fonctionnalité. Enregistrez ensuite votre
flux et republiez-le.
Vous avez créé votre flux et nettoyé vos données, mais vous souhaitez maintenant partager
votre jeu de données avec d’autres personnes et conserver ces données à jour. Vous pouvez
exécuter manuellement vos flux dans Tableau Prep Builder et sur le Web, et publier un extrait
dans Tableau Server, mais il existe maintenant une meilleure méthode.
Découvrez Tableau Prep Conductor, qui fait partie de Data Management et qui est disponible
dans Tableau Server à compter de la version 2019.1, ainsi que dans Tableau Cloud. Si vous
ajoutez cette option à votre installation Tableau Server ou Tableau Cloud, vous pouvez utiliser
Tableau Prep Conductor pour exécuter vos flux de manière programmée et conserver vos
données de flux à jour.
Pour plus d’informations sur la configuration de Tableau Prep Conductor, consultez le contenu
Tableau Prep Conductor dans l’aide de Tableau Server et Tableau Cloud.
Et depuis la version 2021.3, vous pouvez exécuter successivement jusqu’à 20 flux de manière
programmée, à l’aide de la nouvelle option Tâches liées. Pour plus d’informations sur
l’exécution de flux à l’aide de tâches liées, voir Planifier des tâches liées dans l’aide de
Tableau Server ou Tableau Cloud.
Remarque : si Tableau Catalog est installé, vous pouvez également voir les
avertissements sur la qualité des données pour vos données d’entrée de flux et visualiser
l’impact en amont et en aval des champs de votre flux sur le nouvel onglet Lignage. Pour
plus d’informations sur Tableau Catalog, consultez À propos de Tableau Catalog dans
l’aide de Tableau Server.
Avec Tableau Prep Conductor, vous pouvez effectuer les opérations suivantes :
l Configurer votre serveur ou votre site de manière à utiliser Tableau Prep Conductor
l Configurer les notifications par e-mail pour les défaillances de flux, qu’ils soient
exécutés à la demande ou de manière programmée
l Publier un flux depuis Tableau Prep Builder sur Tableau Server ou Tableau Cloud. Depuis
la version 2020.4.1, vous n’avez plus besoin du module Data Management pour publier
des flux sur le Web.
à des bases de données, vous pouvez soit intégrer les informations d’identification
de la base de données, soit exiger une invite utilisateur.
l Entrer des balises et une description pour aider les autres utilisateurs à trouver
votre flux
l Gérer le flux
l Modifier une connexion des données entrantes et mettre à jour les informations
d’identification
l Afficher les sources de données créées à partir d’un flux et les relier au flux qui les
a créées
l Créez des programmations pour exécuter vos flux ou exécutez vos programmations à la
demande
l Ajouter des tâches planifiées pour exécuter le flux et sélectionner les sorties de flux
à mettre à jour
l Ajoutez des tâches liées planifiées pour exécuter plusieurs flux les uns après les
autres
l Surveiller le flux
Exécuter un flux
Important : depuis la version 2020.4.1, le module Data Management n’est plus requis pour
exécuter les flux manuellement sur le Web. Il n’est requis (avec Tableau Prep Conductor activé)
que si vous prévoyez d’exécuter vos flux de manière programmée.
Pour générer la sortie de votre flux, vous devez exécuter votre flux. Lorsque vous exécutez le
flux, toutes vos données (pas seulement l’échantillon de données avec lequel vous travaillez
peut-être) sont exécutées à travers vos étapes de flux. Toutes vos opérations de nettoyage sont
appliquées à votre ensemble de données complet, ce qui donne un ensemble de données
ordonné et propre que vous pouvez maintenant utiliser pour analyser vos données.
Remarque : à partir de la version 2021.4.1, lorsque vous exécutez des flux qui incluent
des paramètres, vous serez invité à saisir des valeurs de paramètres. Vous devez entrer
les valeurs de paramètre requises. Vous pouvez également saisir des valeurs de
paramètre facultatives ou accepter la valeur actuelle (par défaut) du paramètre. Pour plus
d’informations sur l’utilisation de paramètres dans les flux, consultez Exécuter des flux
avec des paramètres sur la page 245.
l Manuel : Exécutez vos flux manuellement à tout moment dans Tableau Prep Builder et sur
le Web. Data Management n’est pas nécessaire. Les flux sur le Web doivent être publiés
avant de pouvoir être exécutés. Pour plus d’informations, consultez Publication de flux
dans l’aide de Tableau Server ou Tableau Cloud.
l Interface en ligne de commande : si vous n’avez pas Data Management, vous pouvez
exécuter les flux un par un à l’aide de l’interface en ligne de commande. Pour plus
d’informations, consultez Actualiser les fichiers de sortie du flux depuis la ligne de
commande sur la page 479.
l API REST : utilisez les méthodes API REST Flux et Tâche de flux dans Tableau Server
pour exécuter des flux. Data Management est nécessaire. Pour plus d’informations,
consultez Méthodes de flux dans l’aide de l’API REST de Tableau.
Pour plus d’informations, consultez Tableau Prep Conductor dans l’aide de Tableau
Server ou Tableau Cloud. Pour plus d’informations sur la planification de votre flux pour
qu’il s’exécute automatiquement, consultez Planifier une tâche de flux dans l’aide de
Tableau Server.
Si vous exécutez des flux dans la création Web (version 2020.4 et ultérieure), le flux doit être
publié sur le serveur pour l’exécuter, et vous ne pouvez pas exécuter un autre flux tant que le
premier flux n’est pas terminé, même à partir d’un onglet distinct. Pour plus d’informations,
consultez Publier un flux sur Tableau Server ou Tableau Cloud sur la page 520.
Dans Tableau Cloud, le nombre d’exécutions de flux que vous pouvez effectuer par jour est
également limité par l’administrateur de site. Pour plus d’informations, consultez Capacité du
site Tableau Cloud dans l’aide de Tableau Cloud.
1. Dans Tableau Prep Builder ou sur votre serveur, ouvrez votre flux.
2. Effectuez l’une des actions suivantes :
l
Dans le menu du haut, cliquez sur Exécuter pour exécuter l’intégralité du flux, ou
cliquez sur la flèche déroulante pour sélectionner une sortie de flux dans la liste.
l
Sur le serveur, depuis la page Explorer, faites un clic droit ou Cmd-clic (MacOS)
Plus d’actions et sélectionnez Exécuter maintenant dans le menu. L’intégralité
de votre flux sera exécuté.
l Cliquez sur une étape de sortie dans votre flux, puis dans le volet Sortie, cliquez sur
Exécuter le flux.
Si le flux n’est pas ouvert sur le Web, vous devrez cliquer sur Modifier le flux pour
ouvrir votre flux en mode de modification, puis cliquer sur Publier pour publier le
flux ou accepter l’invite de publication du flux, puis cliquer sur Exécuter le flux.
Publiez vos flux sur Tableau Server ou Tableau Cloud pour les partager avec d’autres ou les
exécuter automatiquement de manière programmée et actualiser la sortie du flux à l’aide de
Tableau Prep Conductor. Vous pouvez également exécuter manuellement des flux individuels
sur le serveur. Vous devez d’abord publier les flux créés ou modifiés sur le Web (à partir de la
version 2020.4) avant de pouvoir les exécuter.
Pour plus d’informations sur la publication de flux sur le Web, consultez Publication de flux
dans l’aide de Tableau Server ou Tableau Cloud. Pour plus d’informations sur l’exécution de
flux, consultez Exécuter un flux sur la page 517.
Avant de publier
Pour être sûr de pouvoir exécuter votre flux, vérifiez les points suivants :
Les flux qui contiennent des erreurs échouent lorsque vous tentez de les exécuter dans
Tableau Server ou Tableau Cloud. Les erreurs qui se trouvent dans les flux sont
identifiées par un point d’exclamation rouge et un point rouge avec un indicateur Erreurs
en haut à droite de l’espace de travail.
2. Vérifiez que votre flux n’inclut pas des connecteurs d’entrée ou des fonctionnalités non
compatibles avec votre version de Tableau Server. Les flux créés sur le Web sont toujours
compatibles avec la version du serveur sur laquelle ils sont créés.
Depuis Tableau Prep Builder, vous pouvez toujours publier des flux qui incluent des
connecteurs ou des fonctionnalités non encore pris en charge dans votre version de
Tableau Server, mais vous ne pouvez pas programmer leur exécution.
Par exemple, le connecteur SAP HANA a été introduit dans Tableau Prep Builder version
2019.1.4 mais ce connecteur n’est pas pris en charge avant Tableau Server version
2019.2 pour Tableau Prep Conductor. Lorsque vous publiez le flux, un message s’affiche
comme l’exemple ci-dessous :
Remarque : pour programmer l’exécution de flux sur Tableau Server, vous devez
utiliser Tableau Server version 2019.1 ou ultérieure, et Tableau Prep Conductor
doit être activé.
Pour exécuter votre flux dans Tableau Server, vous devez prendre les mesures
appropriées pour rendre le flux compatible. Pour savoir comment travailler avec des flux
incompatibles, consultez la rubrique Compatibilité de version avec Tableau Prep sur
la page 500.
3. Les flux qui incluent des étapes d’entrée ou de sortie avec des connexions à un partage
réseau nécessitent l’établissement d’une liste autorisée. Tableau Cloud ne prend pas en
charge cette option et les fichiers doivent être compressés avec le flux lors de la
publication.
Remarque : actuellement, les flux créés sur le Web ne peuvent être publiés que
vers une base de données ou une source de données publiée.
Les étapes d’entrée et de sortie de flux qui pointent vers des fichiers stockés sur un
partage réseau (chemin UNC) ne sont pas autorisées, à moins que le fichier et le chemin
d’accès ne soient accessibles par le serveur et figurent sur la liste autorisée de votre
entreprise. Si vous publiez le flux sans ajouter l’emplacement du fichier à votre liste
d’autorisations, le flux sera publié, mais vous obtiendrez une erreur lorsque vous
essaierez d’exécuter le flux manuellement ou de manière programmée dans Tableau
Server.
Si les fichiers ne sont pas stockés dans un emplacement figurant sur la liste autorisée, un
message d’avertissement s’affiche lorsque vous publiez le flux.
Cliquez sur le lien « Liste » dans le message pour afficher la liste des emplacements
autorisés. Déplacez vos fichiers vers l’un des emplacements de la liste et assurez-vous
que votre flux pointe vers ces nouveaux emplacements.
Dans Tableau Server, pour configurer les chemins réseau autorisés, utilisez les options
de commande tsm décrites à Étape 4 : Liste autorisée des emplacements d’entrée et de
sortie dans l’aide de Tableau Server.
Si vous ne souhaitez pas déplacer vos fichiers vers un emplacement de la liste autorisée,
vous devez empaqueter les fichiers d’entrée avec le flux et publier la sortie de flux sur
Tableau Server en tant que source de données publiée. Pour plus d’informations sur la
configuration de ces options, voir Publier un flux depuis Tableau Prep Builder sur la
page en regard dans cette rubrique.
4. (Tableau Prep Builder seulement) Si les étapes de sortie de votre flux sont définies sur
Publier en tant que source de données, toutes les étapes de sortie de flux doivent
pointer vers le même serveur ou site où le flux est publié. Elles peuvent pointer vers
différents projets sur ce serveur ou site, mais vous ne pouvez sélectionner qu’un seul
serveur ou site.
Pour définir l’emplacement de publication de vos étapes de sortie, procédez comme suit :
Le nom du fichier de sortie doit être suffisamment distinctif pour que la personne
qui exécute le flux puisse facilement identifier les fichiers de sortie à actualiser. Le
nom du fichier apparaît sur la page Vue d’ensemble et Connexions du flux dans
Tableau Server ou Tableau Cloud.
Remarque : lorsque vous publiez un flux, vous êtes automatiquement affecté en tant que
propriétaire du flux par défaut. Si le flux se connecte à une source de données publiée, le
serveur utilise le propriétaire du flux pour se connecter à la source de données publiée.
Seul l’administrateur de site ou de serveur peut modifier le propriétaire du flux, et
uniquement pour lui-même.
3. Renseignez les champs de votre plate-forme. Cliquez ensuite sur Publier. Tableau Server
ou Tableau Cloud s’ouvre automatiquement dans votre navigateur par défaut sur la page
Vue d’ensemble du flux.
Tableau Server
1. Dans la boîte de dialogue Publier sur Tableau Server, renseignez les champs suivants :
l Projet : Cliquez sur l’option déroulante pour sélectionner votre projet dans la hié-
rarchie de projet. Il doit s’agir du même projet que celui où les fichiers de sortie sont
publiés.
l Nom : Entrez un nom pour votre flux. Ce nom apparaît sur le serveur dans les
pages Flux. Si vous souhaitez remplacer un flux existant, cliquez sur l’option dérou-
lante pour sélectionner un nom dans la liste.
l Description (facultatif) : Entrez une description pour le flux.
l Balises (facultatif) : Cliquez sur Ajouter pour entrer une ou plusieurs balises afin
d’identifier votre flux et le rendre plus facile à trouver pour les utilisateurs. Vous pou-
vez également ajouter des balises après publication dans les pages Flux sur
Tableau Server.
2. Cliquez sur Modifier dans la section Connexions pour modifier les paramètres de
connexion ou modifier l’authentification.
Fichiers
Par défaut, les connexions d’entrée de fichiers sont compressées avec le flux. Les fichiers
compressés ne sont pas actualisés lors de l’exécution du flux dans Tableau Server. Tous
les fichiers doivent avoir le même paramètre, soit Télécharger soit Connexion directe.
Connexion en direct
Pour récupérer les données les plus récentes lors de l’actualisation des fichiers de sortie,
sélectionnez Connexion directe si Tableau Server peut se connecter à l’emplacement du
fichier et que l’emplacement figure sur la liste autorisée de votre entreprise.
Si vos étapes d’entrée ou de sortie pointent vers des fichiers stockés sur un partage
réseau (chemin UNC) et que l’emplacement ne figure pas dans la liste autorisée de votre
entreprise, un message d’avertissement s’affiche. Cliquez sur le lien dans le message
pour afficher la liste des emplacements figurant sur la liste autorisée, déplacez vos
fichiers et pointez les étapes d’entrée et de sortie vers le nouvel emplacement de fichier.
Pour plus d’informations, consultez l’Étape 3 Avant de publier sur la page 520.
Depuis la version 2022.1.1, vous pouvez planifier et exécuter des flux sur le Web qui
incluent des paramètres dans le chemin d’accès du fichier d’entrée. Cette opération
nécessite une connexion directe au fichier.
Si vos fichiers sont empaquetés avec votre flux ou si vous utilisez une version antérieure
de Tableau Prep, tous les paramètres inclus dans les chemins de fichier sont remplacés
par la valeur actuelle (par défaut) et le chemin d’accès du fichier devient statique. Pour
plus d’informations sur l’utilisation de paramètres dans les flux, consultez Appliquer des
paramètres aux étapes des données entrantes sur la page 233.
Bases de données
Si votre flux se connecte à une ou plusieurs bases de données, sélectionnez l’un des
types d’authentification suivants pour vous connecter aux sources de données d’entrée
de flux.
l Mot de passe intégré : Les informations d’identification que vous avez utilisées
pour vous connecter aux données seront enregistrées avec la connexion et
utilisées lors de l’exécution programmée du flux. Si vous ouvrez le flux pour le
modifier, vous devrez saisir à nouveau vos informations d’identification.
Si vous vous connectez à des connecteurs cloud, vous pouvez ajouter vos
informations d’identification directement à partir de la boîte de dialogue Publier le
flux pour les intégrer au flux.
1. Cliquez sur Modifier dans la section Connexions ou cliquez sur Modifier les
informations d’identification dans le message d’avertissement. Cliquez
ensuite sur Ajouter les informations d’identification dans le menu
déroulant Authentification.
Tableau Cloud
1. Dans la boîte de dialogue Publier sur Tableau Cloud, renseignez les champs suivants :
l Projet : Cliquez sur l’option déroulante pour sélectionner votre projet dans la hié-
rarchie de projet. Il doit s’agir du même projet que celui où les fichiers de sortie sont
publiés.
l Nom : Entrez un nom pour votre flux. Ce nom apparaît sur le serveur dans les
pages Flux. Si vous souhaitez remplacer un flux existant, cliquez sur l’option dérou-
lante pour sélectionner un nom dans la liste.
l Description (facultatif) : Entrez une description pour le flux.
l Balises (facultatif) : Cliquez sur Ajouter pour entrer une ou plusieurs balises afin
d’identifier votre flux et le rendre plus facile à trouver pour les utilisateurs. Vous pou-
vez également ajouter des balises après publication dans les pages Flux sur
Tableau Server.
2. Cliquez sur Modifier dans la section Connexions pour modifier les paramètres de
connexion ou modifier l’authentification.
Fichiers
Tableau Cloud ne prend pas en charge les connexions de fichiers directes pour les
données de l’étape des données entrantes et vous devez compresser vos fichiers avec le
flux. Les fichiers compressés ne sont pas actualisés lors de l’exécution du flux dans
Tableau Cloud.
Comme alternative, vous pouvez exécuter des flux avec des paramètres dans le
chemin d’accès du fichier dans Tableau Prep Builder ou à l’aide de la ligne de
commande. Pour plus d’informations sur l’utilisation de paramètres dans les flux,
consultez Appliquer des paramètres aux étapes des données entrantes sur la
page 233.
Bases de données
Pour garder les données à jour lors de la publication des flux sur Tableau Cloud, vous ne
pouvez vous connecter directement qu’aux sources de données hébergées dans le
cloud. Pour plus d’informations sur les connexions directes prises en charge par Tableau
Cloud, voir Autoriser les connexions directes aux données hébergées sur une plate-
forme de cloud.
Si vous vous connectez à des sources de données sur site, à compter de la version
2025.1, vous pouvez utiliser un client Tableau Bridge pour vous connecter et actualiser
vos données dans Tableau Cloud. Pour utiliser le client Tableau Bridge :
l Le client Tableau Bridge doit être configuré pour utiliser un pool de clients Bridge
(pas le pool par défaut)
l Un ou plusieurs clients Bridge connectés doivent être inclus dans le pool et les
clients doivent être actifs
Pour plus d’informations, consultez Configurer et gérer le pool de clients Bridge dans l’aide
de Tableau Cloud.
Remarque : en cas de connexion à des sources de données sur site, vous devez
convertir les sources de données en une source de données publiée. Quant à
Tableau Cloud, il peut utiliser un client Tableau Bridge pour se connecter à vos
données si Tableau Bridge est configuré pour cette source de données.
Pour plus d’informations sur l’utilisation de Tableau Bridge, voir Autoriser vos publicateurs
à conserver des connexions en direct aux données locales.
Si votre flux se connecte à une source de données basée dans le cloud qui prend en
charge une connexion directe, sélectionnez l’un des types d’authentification suivants pour
vous connecter aux sources de données d’entrée de flux.
l Mot de passe intégré : les informations d’identification que vous avez utilisées
pour vous connecter aux données seront enregistrées avec la connexion et utilisées
lors de l’exécution programmée du flux. Si vous ouvrez le flux pour le modifier, vous
devrez saisir à nouveau vos informations d’identification.
l Si vous n’utilisez pas de client Tableau Bridge pour vous connecter à votre source
de données sur site, cochez la case d’option Publier la source de données.
Sélectionnez cette option pour convertir la connexion d’entrée de la source de don-
nées en une source de données publiée lorsque vous publiez le flux sur Tableau
Cloud.
Si vous ne cochez pas cette case, le flux dans Tableau Prep Builder reste
connecté à la source de données locale sur site et le flux dans Tableau Prep
Builder risque de ne pas être synchronisé avec la version publiée du flux. Pour
continuer à travailler avec votre flux, vous devrez télécharger le flux sur Tableau
Cloud pour le modifier, puis le republier.
Si vous vous connectez à des connecteurs cloud, vous pouvez ajouter vos informations
d’identification directement à partir de la boîte de dialogue Publier le flux pour les intégrer
au flux.
1. Cliquez sur Modifier dans la section Connexions ou cliquez sur Modifier les
informations d’identification dans le message d’avertissement. Cliquez ensuite
sur Ajouter les informations d’identification dans le menu déroulant
Authentification.
5. Cliquez sur Modifier dans la section Connexions et vérifiez que vos informations
d’identification ont été ajoutées et intégrées dans votre flux.
Scénarios pratiques
En quoi consiste l’organisation des données ? Comment cette opération affecte-t-elle les
visualisations et les analyses possibles ? Dans les didacticiels ci-dessous, nous allons explorer
des scénarios d’analyse et de visualisation, identifier les limitations de données qui s’appliquent,
puis voir comment Tableau Prep peut nous aider à organiser les données en vue de l’objectif
recherché.
Téléchargez les ensembles de données et suivez les procédures décrites dans les scénarios
pratiques à l’aide de Tableau Prep et Tableau Desktop. Apprenez comment appliquer les
fonctionnalités et les fonctions dans Tableau Prep pour préparer vos données en vue d’une
analyse dans Tableau Desktop.
Faites-nous part de vos commentaires. Nous venons de lancer cette section de l’aide
en ligne. Si vous souhaitez que des scénarios spécifiques y figurent, n’hésitez pas à nous
le faire savoir. Utilisez la barre de commentaires en haut de la page pour nous en dire plus.
Pour exécuter les tâches décrites dans ces didacticiels, vous aurez besoin d’installer Tableau
Prep et Tableau Desktop, et de télécharger et enregistrer les données sur votre ordinateur.
Pour plus d’informations sur l’installation de Tableau Prep et Tableau Desktop, consultez
Installer Tableau Prep ou Tableau Prep Builder depuis l’interface utilisateur dans le Guide de
déploiement de Tableau Desktop et de Tableau Prep. Sinon, vous pouvez télécharger les
versions d’évaluation gratuites de Tableau Prep et Tableau Desktop.
Remarque : pour effectuer les tâches décrites dans ce didacticiel, vous aurez besoin
d’installer Tableau Prep et, de manière facultative, Tableau Desktop :
Vous devrez également télécharger trois fichiers de données. Il est recommandé de les
enregistrer dans le dossier Mon dossier Tableau Prep > Sources de données.
- Beds.xlsx
- Hours.xlsx
- Patient Beds.xlsx
Les données
Pour nos quatre lits, A, B, C et D, nous suivons quel patient occupait le lit, et l’heure de début et
de fin de son occupation. Les données se présentent comme suit :
Analyse préliminaire
Si nous introduisons les données dans Tableau Desktop, nous pouvons créer un diagramme de
Gantt pour montrer à quel moment les patients occupent les lits.
Cette représentation visuelle est utile. Nous pouvons voir qu’il n’existe que de brefs intervalles
entre les occupations pour les lits A et B, mais que le lit C, quant à lui, est très sous-utilisé. Il n’y a
pas d’heure de fin pour le patient du lit D, mais nous pourrons gérer ce problème avec quelques
calculs. Nous disposons ainsi d’une vue d’ensemble visuelle du mode d’occupation des lits.
Par contre, comment faire pour compter le nombre d’heures pendant lequel un lit était vacant ?
Ou comparer la durée d’inoccupation des lits avant ou près la mise en place d’une nouvelle
stratégie ? Il n’existe aucun moyen facile de répondre à ces questions avec la structure actuelle
des données.
Avant de passer à Tableau Prep, prenons du recul et considérons ce dont nous avons besoin
pour répondre à la question, « Pendant combien d’heures chaque lit a-t-il été inoccupé ? »
Nous devons pouvoir examiner chaque lit pour chaque heure, et savoir si un patient occupait ou
non le lit. Actuellement, les données relèvent seulement quand un patient occupait le lit. Nous
n’avons pas donné d’informations à Tableau au sujet des heures d’inoccupation.
Pour créer cette matrice complète de tous les lits et de toutes les heures, nous allons créer deux
ensembles de données. L’un d’eux est simplement une liste de lits (A, B, C, D) et l’autre une liste
d’heure (1, 2, 3, …, 23, 24). En effectuant une jointure croisée (en liant chaque ligne d’un
ensemble de données avec chaque ligne de l’autre ensemble de données), nous obtiendrons
chaque combinaison possible de lits et d’heures.
Ensuite, nous allons intégrer les informations Patient Beds (Lits de patients) en étiquetant
chaque combinaison lit-heure comme ayant ou non un patient spécifique. Nous obtenons un
ensemble de données qui inclut une ligne pour chaque lit-heure, et indique si un patient occupait
le lit, le nombre et les heures de début et de fin. Les valeurs null indiquent que le lit était
inoccupé.
Avec les données de cette structure, nous pouvons effectuer des analyses de ce type, afin
d’analyser les lits vacants aussi facilement que les lits avec patients.
Conseil : pour plus d’informations sur la connexion aux données, consultez Se connecter
aux données sur la page 81.
Ensuite, nous devons créer un champ pour effectuer la jointure croisée avec l’ensemble de
données Hours (Heures). Nous allons ajouter un calcul, qui est simplement la valeur 1.
5. Dans le volet Flux, sélectionnez Beds (Lits) puis sélectionnez l’étape de nettoyage sug-
gérée.
6. Avec l’étape Nettoyer que nous venons d’ajouter, le volet Profil s’affiche. Sélectionnez
Créer un champ calculé dans la barre d’outils.
7. Nommez le champ Cross Join (Jointure croisée) et entrez la valeur 1.
8. La grille Données devrait se mettre à jour pour afficher l’état actuel des données.
9. Dans le volet Connexions, sélectionnez le bouton Ajouter une connexion pour ajouter
une autre connexion de données.
10. Choisissez Microsoft Excel puis sélectionnez Hours.xlsx file et cliquez sur Ouvrir.
11. Dans le volet Flux, sélectionnez Hours (Heures) et cliquez sur l’étape de nettoyage sug-
gérée pour l’ajouter au flux.
12. Dans la barre d’outils du volet Profil, créez un champ calculé appelé Cross Join (Join-
ture croisée) et entrez la valeur 1.
Les deux ensemble de données ont maintenant un champ partagé, Cross Join, et peuvent être
liés.
13. Liez les deux étapes de nettoyage en faisant glisser Nettoyer 2 sur Nettoyer 1 et en les
déposant sur l’option Lier.
14. Dans le Profil de jointure ci-dessous, les configurations de jointure devraient se remplir
automatiquement.
l Étant donné que nous avons nommé les deux champs Cross Join, Tableau Prep
les identifie automatiquement comme champ partagé et crée les Clauses de join-
ture appliquées appropriées.
l Le Type de jointure par défaut est interne, et c’est ce que nous souhaitons.
l Cette jointure correspondra à toutes les lignes issues de Beds avec toutes les
lignes issues de Hours, comme nous l’avons vu dans la grille Données.
A. Clause de jointure
B. Type de jointure
Conseil : pour plus d’informations sur les jointures, consultez Lier vos données sur la
page 404.
Nous n’avons plus besoin des fichiers Cross Join donc nous pouvons les supprimer.
15. Dans le volet Flux, sélectionnez Lier 1, sélectionnez l’icône Plus , puis sélectionnez
Étape de nettoyage.
16. Sélectionnez les champs Cross Join-1 et Cross Join, puis l'option Supprimer les
champs.
17. Double-cliquez sur l’étiquette Nettoyer 3 et renommez cette étape Bed Hour Matrix
(Matrice Lits Heures).
Nous avons maintenant l’ensemble de données Bed Hour Matrix qui contient tous les lits et
toutes les heures, et nous avons terminé la première partie de la création de notre ensemble de
données.
1. Dans le volet Connexions, sélectionnez le bouton Ajouter une connexion pour ajouter
une autre connexion de données.
2. Choisissez Microsoft Excel, sélectionnez le fichier Patient Beds.xlsx, puis l'option
Ouvrir.
3. Dans le volet Flux, sélectionnez Patient Beds (Lits d’hôpitaux), puis sélectionnez l’étape
de nettoyage suggérée pour l’ajouter au flux.
Le fichier Bed Hour Matrix est basé sur le nombre d’heures mais Patient Beds est basé sur
l’heure réelle, nous devons extraire les heures de début et de fin de Patient Beds. En outre, pour
l’heure de fin, nous voulons nous assurer que, si un patient occupe encore le lit à la fin de la
journée (minuit, heure 24), ce lit sera indiqué comme occupé alors même qu’il n’y a pas d’heure
de fin dans l’ensemble de données. Nous allons ajouter un champ calculé dans cette nouvelle
étape.
La partie DATEPART prend l’heure de fin. La partie IFNULL affectera une heure de fin de
24 (minuit) en l’absence d’heure de fin.
Nous sommes maintenant prêts à lier l’occupation des lits de patients à Bed Hour Matrix. Cette
jointure est un peu plus complexe que les précédentes. Une jointure interne retournerait
uniquement les valeurs présentes dans les deux ensembles de données. Étant donné que nous
souhaitons conserver tous les emplacements lit-heure, qu’un patient ait ou non occupé le lit,
nous devons effectuer une jointure gauche. Ceci entraîne beaucoup de valeurs null, mais ce
résultat est correct.
Nous devons également faire l’association lorsqu’un emplacement lit-heure est pris par un
patient (ou des patients). Donc, en plus d’associer le lit occupé par le patient, nous devons
également prendre en considération l’heure. L’ensemble de données Bed Hour Matrix a
justement un champ Hour (Heure) et l’ensemble de données Patient Beds a des champs Start
Hour (Heure de début) et End Hour (Heure de fin). Nous allons utiliser des notions de logique de
base pour déterminer si un patient devrait être affecté à un emplacement lit-heure donné : Un
patient est considéré comme occupant un lit si son heure de début est inférieure ou égale à
(<=) l’emplacement lit-heure ET que son heure de fin est supérieure ou égale à (>=)
l’emplacement lit-heure.
De ce fait, trois clauses de jointure sont nécessaires pour associer correctement ces deux
ensembles de données ensemble.
11. Sélectionnez le bouton Plus en haut à droite de la zone Clauses de jointure appli-
quées pour ajouter une autre clause de jointure. Définissez-la sur Hour >= Start Hour.
Ajoutez une troisième clause de jointure pour Bed = Hospital Bed.
12. Dans la section Type de jointure, sélectionnez la zone sans trame de fond du graphique
à côté de Bed Hour Matrix (Matrice des heures d’hospitalisation) pour modifier le type de
Remarque : si vous faites glisser Bed Hour Matrix vers Nettoyer 3 et non l’inverse, vous
pouvez obtenir les résultats souhaités en utilisant une jointure droite au lieu d’une jointure
gauche. L’ordre dans lequel vous faites glisser les étapes a une incidence sur l’orientation
de la jointure. Les clauses de jointure seront également dans l’ordre inverse. Veillez à
préserver la logique correcte de comparaison des heures.
Nos données sont maintenant liées, mais il nous faut nettoyer quelques artefacts de la jointure et
nous assurer que les champs sont bien ordonnés. Nous n’avons plus besoin des paramètres
Start Hour et End Hour. Hospital Bed et Bed sont également redondants. Enfin, une valeur
null dans le champ Patient signifie réellement que le lit est vacant.
14. Dans le volet Flux, ajoutez une étape de nettoyage afin que nous puissions mettre de
l’ordre dans les données liées.
15. Faites un Ctrl+clic (Command+clic sur un Mac) pour faire une sélection multiple des
champs End Hour (Heure de fin), Start Hour (Heure de début) et Hospital Bed (Lit
d’hôpital), puis sélectionnez Supprimer des champs dans la barre d’outils.
16. Dans la fiche Profil du champ Patient, double-cliquez sur la valeur null et tapez Unoc-
cupied (Inoccupé).
Nous avons maintenant une structure de données avec une ligne pour chaque lit-heure. Si un
patient occupait un lit pendant cette heure, nous disposons également des informations sur le
patient. Il ne nous reste plus qu’à ajouter une étape de sortie et à générer l’ensemble de
données lui-même.
17. Dans le volet Flux, sélectionnez Nettoyer 4, sélectionnez l’icône Plus , puis ajoutez
une étape de Sortie.
18. Dans le volet Sortie, modifiez le Type de sortie sur .csv puis sélectionnez Parcourir.
19. Entrez Bed Hour Patient Matrix comme nom et choisissez l’emplacement souhaité
avant de sélectionner Accepter pour enregistrer.
20. Sélectionnez le bouton Exécuter le flux au bas du volet pour générer votre sortie. Sélec-
tionnez Terminé dans la boîte de dialogue d’état pour fermer la boîte de dialogue.
Conseil : pour plus d’informations sur les fichiers de sortie et l’exécution d’un flux,
consultez Enregistrer et partager votre travail sur la page 429.
Maintenant que l’ensemble de données présente la structure souhaitée, nous pouvons effectuer
une analyse plus approfondie qu’avec les données d’origine.
1. Ouvrez Tableau Desktop. Dans le volet Connexion, sélectionnez Fichier texte, accédez
au fichier Bed Hour Patient Matrix.csv, puis sélectionnez Ouvrir.
2. Dans l’onglet Source de données, les données devraient apparaître dans l’espace de
travail par défaut. Accédez à Sheet 1.
3. Dans le volet Données, faites glisser Hour au-dessus de la ligne séparant les Mesures et
les Dimensions pour en faire une dimension discrète.
4. Faites glisser Bed vers l’étagère Lignes et Hour vers l’étagère Colonnes.
5. Faites glisser Patient vers l’étagère Couleur.
La mise en forme est facultative mais contribue à rendre les visuels plus lisibles.
15. Double-cliquez sur l’onglet de feuille au bas et renommez-le Bed Use by Hour (Occu-
pation des lits par heure).
Cette vue nous permet de voir rapidement quand un lit donné était occupé ou vacant.
Mais nous pouvons aller plus loin et compter le nombre d’heures pendant lesquelles chaque lit
était inoccupé.
16. Sélectionnez l’icône de l’onglet de nouvelle feuille en bas pour ouvrir une nouvelle
feuille.
17. Faites glisser Patient vers Lignes.
18. Faites glisser Hour vers Colonnes. Faites un clic droit sur la pile Hour pour ouvrir le menu.
Choisissez Mesure > Total.
19. Faites glisser une autre copie du champ Patient depuis le volet Données vers l’étagère
Couleur.
20. Faites un clic droit sur l’axe et sélectionnez Modifier l’axe. Modifiez le titre sur Hours et
fermez la boîte de dialogue.
21. Renommez l’onglet de la feuille Bed Hours by Patient.
Cette vue nous permet d’identifier le nombre d’heures de lits inoccupés, ce que nous ne pouvions
pas faire avec l’ensemble de données d’origine. Quels autres graphiques ou tableaux de bord
pouvez-vous créer ? Lancez-vous maintenant que vos données présentent la structure correcte.
Récapitulatif et ressources
Pour créer cette structure de données à l’aide de Tableau Prep, nous avons dû effectuer les
actions suivantes :
1. Créer un ensemble de données pour chaque aspect que nous souhaitons analyser, dans
ce cas Beds et Hours.
2. Effectuer une jointure croisée de ces ensemble de données afin de créer un ensemble de
données Bed Hour Matrix avec chaque combinaison possible de lits et d’heures.
3. Lier Bed Hour Matrix avec les données Patient Bed, en s’assurant que la jointure
conserve tous les emplacements lits-heures et que les clauses de jointure associent cor-
rectement les données de lits de patients avec les emplacements lits-heures.
Nous avons utilisé les calculs suivants pour créer des champs pour la jointure. Le second et le
troisième extraient les informations d’heures à partir des champs date/heure d’origine.
l Jointure croisée = 1
l Affecte simplement la valeur 1 à chaque ligne
simplement « 9 ».
l Heure de fin = IFNULL(DATEPART('hour',[End Time]), 24)
l Nous pourrions utiliser DATEPART('hour',[End Time]), comme nous l’avions
fait pour Heure de début. Ce calcul prend l’heure de fin, et l’extrait. Ainsi, « 1/1/18
4:34 PM » devient simplement « 4 ».
l Mais nous souhaitons indiquer que le lit de patient qui est encore occupé (pas
d’heure de fin) est utilisé, et non pas vacant. Pour cela, nous affectons une heure
de fin de 24 (minuit) en l’absence d’heure de fin à l’aide de la fonction IFNULL. Si le
premier argument DATEPART('hour',[End Time]) est null, le calcul renvoie
« 24 » à la place.
Remarque : vous souhaitez vérifier votre travail ? Téléchargez le fichier de flux complet
Tableau Prep (Hospital Beds.tflx) et le fichier de classeur complet Tableau Desktop
(Hospital Beds.twbx).
des ressources supplémentaires ? Le billet de blog Master Tableau Prep with this list of
learning resources est là pour vous aider.
Dans ce didacticiel en deux parties, nous allons organiser des données d’infractions routières et
répondre aux questions suivantes :
1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque
conducteur ?
2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils
corrélés ?
5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de
stage de conduite obligatoire ?
Dans Ia première étape, nous allons utiliser Tableau Prep Builder pour restructurer les données
en vue de notre analyse. Dans la seconde étape, Analyse avec la seconde date dans Tableau
Desktop sur la page 572, nous passerons à l’analyse dans Tableau Desktop.
L’objectif de ce didacticiel est de présenter divers concepts dans le contexte d’un scénario de la
vie réelle et d’explorer les options, en déterminant de manière non prescriptive quelle est la plus
adaptée. Au terme de ce didacticiel, vous devriez mieux appréhender l’incidence de la structure
des données sur les calculs et l’analyse, et être familiarisé avec divers aspects de Tableau Prep
et les calculs dans Tableau Desktop.
Remarque : pour effectuer les tâches décrites dans ce didacticiel, vous aurez besoin de
Tableau Prep Builder (installé ou via la navigateur) et des données téléchargées. Pour la
deuxième partie, vous aurez également besoin de Tableau Desktop installé.
Pour installer Tableau Prep Builder et Tableau Desktop avant de poursuivre ce didacticiel,
consultez le Guide de déploiement de Tableau Desktop et Tableau Prep. Sinon, vous pouvez
télécharger les versions d’évaluation gratuites de Tableau Prep et Tableau Desktop.
Les données
Pour cet exemple, nous allons examiner des données d’infractions routières. Chaque infraction
est une ligne. Le conducteur, la date, le type d’infraction, l’obligation ou non pour le conducteur
de suivre un stage de conduite, et le montant de l’amende sont enregistrés.
Pour analyser les récidivistes, nous souhaitons un ensemble de données qui distingue les dates
de première et seconde infraction, les informations associées à chacune de ces infractions, et
où chaque ligne est un conducteur.
Pour plus d’informations sur la connexion aux données, consultez Se connecter aux
données sur la page 81.
Ensuite, nous devons identifier la date de la première infraction pour chaque conducteur. Pour
cela, nous utiliserons l’étape Agrégation, en créant un mini-ensemble de données comportant
les champs Driver ID (ID de conducteur) et Minimum Infraction Date (Date minimum de
l’infraction).
Lorsque vous utilisez une étape d’agrégation dans Tableau Prep, tout champ définissant ce qui
constitue une ligne est un Champ groupé. (Pour nous, il s’agit de Driver ID.) Tous les champs
qui seront agrégés et présentés au niveau des champs groupés correspondent à un Champ
agrégé. (Pour nous, il s’agit de Infraction Date).
5. Dans le volet Flux, sélectionnez Infractions, cliquez sur l’icône plus et sélectionnez
Agrégation.
7. Faites glisser Infraction Date vers la zone Champs agrégés. L’agrégation par défaut
est CNT (total). Cliquez sur CNT et modifiez l’agrégation sur Minimum.
Ceci identifie la date la plus petite (la plus ancienne), qui est la date de la première
infraction par conducteur.
Pour plus d’informations sur les agrégations, consultez Nettoyer et organiser les données sur
la page 249.
8. Dans le volet Flux, sélectionnez Agrégation 1, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage afin que nous puissions nettoyer la sortie de l’agrégation.
9. Dans le volet Profil, double-cliquez sur le nom du champ Infraction Date et modifiez-le
sur 1st Infraction Date (Date de la 1ère infraction).
Dans le volet Profil de cette étape de nettoyage, nous pouvons voir que nos données se
composent maintenant de 39 lignes et seulement 2 champs. Tous les champs non utilisés pour le
regroupement ou l’agrégation sont perdus. Par contre, nous voulons conserver une partie des
informations d’origine. Nous pourrions soit ajouter ces champs au regroupement ou à
l’agrégation (ce qui changerait le niveau de détail ou nécessiterait l’agrégation des données), soit
lier ce mini-ensemble de données aux données d’origine (essentiellement en ajoutant une
nouvelle colonne aux données d’origine pour le champ 1st Infraction Date). Procédons à la
jointure.
10. Dans le volet Flux, sélectionnez Infractions, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage.
Assurez-vous de survoler l’étape Infractions directement, et non pas la ligne entre cette
étape et l’étape d’agrégation. Si la nouvelle étape de nettoyage est insérée entre les deux
Votre flux est alors associé à toutes les données d’origine. Nous allons lier les résultats de
l’agrégation à cette copie des données complètes. En effectuant une jointure avec Driver ID,
nous ajoutons la date minimum depuis notre agrégation dans les données d’origine.
11. Sélectionnez l’étape Nettoyer 2 et faites-la glisser sur l’étape Nettoyer 1, puis déposez-
la sur Lier.
12. La configuration de jointure par défaut devrait être correcte : une jointure interne sur
Driver ID = Driver ID.
Pour plus d’informations sur les jointures, consultez Lier vos données sur la page 404.
Étant donné que certains champs risquent d’être dupliqués lors d’une jointure (par exemple les
champs dans la clause de jointure), il est souvent utile de nettoyer les champs superflus avant
d’effectuer une jointure.
13. Dans le volet Flux, sélectionnez Jointure 1, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage.
14. Dans le volet Profil, faites un clic droit ou Ctrl-clic (MacOS) sur la fiche de Driver ID-1, et
sélectionnez Supprimer.
15. Pour modifier l’ordre du champ, faites glisser la fiche 1st Infraction Date entre Driver ID
et Infraction Date où vous voyez apparaître la ligne noire.
En examinant la grille des données ci-dessous, nous pouvons voir notre nouvel ensemble de
données combinées. Nous avons la date d’infraction minimum (à savoir la première date) pour
chaque conducteur ajouté à chaque ligne de l’ensemble de données.
Remarque : nous souhaitons utiliser les données telles qu’elles sont actuellement dans
Nettoyer 3 ultérieurement dans le flux. Nous allons donc ajouter une autre étape de
nettoyage pour obtenir la date de la seconde infraction. L’état actuel des données dans
l’étape Nettoyer 3 sera ainsi disponible ultérieurement.
16. Dans le volet Flux, sélectionnez Nettoyer 3, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage.
17. Dans la barre d’outils du volet Profil, choisissez Filtrer les valeurs. Créez un filtre
[Infraction Date] != [1st Infraction Date].
19. Dans le volet Flux, sélectionnez Nettoyer 4, cliquez sur l’icône plus et sélectionnez
Agréger.
20. Faites glisser Driver ID vers la zone Champs groupés. Faire glisser Infraction Date
vers la zone Champs agrégés et modifiez l’agrégation sur Minimum.
21. Dans le volet Flux, sélectionnez Agréger 2, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage. Renommez Infraction Date en 2nd Infraction Date.
La date de la seconde infraction est maintenant identifiée pour chaque conducteur. Pour
associer toutes les autres informations avec chaque infraction (type, amende, stage de conduite
obligatoire), nous devons à nouveau les lier à l’ensemble de données tout entier.
22. Sélectionnez l’étape Nettoyer 5 et faites-la glisser sur l’étape Nettoyer 3, puis déposez-la
sur Lier.
23. À nouveau, la configuration de jointure par défaut devrait être correcte : une jointure
interne sur Driver ID = Driver ID.
24. Dans le volet Flux, sélectionnez Jointure 2, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage. Supprimez les champs Driver ID-1 et 1st Infraction Date puisqu’ils
ne sont plus nécessaires.
Créer des ensembles de données entiers pour les 1ères et 2ndes infrac-
tions
Avant de poursuivre, prenons du recul et considérons tous les éléments dont nous disposons et
comment nous souhaitons les faire fonctionner ensemble. Ce que nous recherchons au final est
un ensemble de données qui se présente comme ceci, avec une colonne pour Driver ID, puis
des colonnes pour la date, le type, le stage de conduite obligatoire et le montant de l’amende
pour les 1ères et 2ndes infractions.
Comment y parvenir ?
Dans l’étape Nettoyer 3, nous avons notre ensemble de données complet avec une colonne qui
répète la date de la première infraction pour chaque conducteur.
Nous souhaitons éliminer toutes les autres lignes pour un conducteur qui ne correspondent pas
à la première infraction, créant ainsi un ensemble de données comportant uniquement les
premières infractions. C’est-à-dire que nous souhaitons conserver uniquement les informations
pour un conducteur donné lorsque 1st Infraction Date = Infraction Date. Une fois que nous
avons appliqué un filtre pour conserver uniquement la ligne de la première infraction, nous
pouvons supprimer le champ Infraction Date et mettre de l’ordre dans les noms des champs.
De même, après la seconde agrégation et jointure, nous avons notre ensemble de données
complet avec une colonne pour la seconde date d’infraction.
Nous pouvons appliquer un filtre similaire 2nd Infraction Date = Infraction Date pour
conserver uniquement la ligne d’information pour la 2nde infraction de chaque conducteur. À
nouveau, nous pouvons également renommer Infraction Date qui est maintenant redondant et
mettre un peu d’ordre dans les noms des champs.
25. Dans le volet Flux, sélectionnez Nettoyer 3, cliquez sur l’icône plus et sélectionnez
Étape de nettoyage.
Comme à l’étape 10 ci-dessus, nous voulons ajouter une branche pour la nouvelle étape
de nettoyage, et non pas l’insérer entre Nettoyer 3 et Nettoyer 4.
26. Avec cette nouvelle étape Nettoyer sélectionnée, dans le volet Profil, cliquez sur Filtrer
des valeurs dans la barre d’outils. Créez un filtre [1st Infraction Date] =
[Infraction Date].
28. Renommez les champs Infraction Type, Traffic School et Fine Amount de manière à
ce qu’ils commencent par « 1st ».
29. Double-cliquez sur le nom Nettoyer 7 sous l’étape dans le volet Flux et renommez-le
Robust 1st.
31. Cliquez sur Filtrer les valeurs dans la barre d’outils. Créez un filtre [2nd Infraction
Date] = [Infraction Date].
33. Renommez les champs Infraction Type, Traffic School et Fine Amount de manière à
ce qu’ils commencent par « 2nd ».
34. Double-cliquez sur le nom Nettoyer 6 sous l’étape dans le volet Flux et renommez-le
Robust 2nd.
pouvoir les lier à nouveau ensemble sur Driver ID et obtenir la structure de données
recherchée.
35. Sélectionnez Robust 2nd et faites-le glisser sur Robust 1st, en le déposant sur Lier.
36. La configuration de jointure par défaut devrait être correcte, sous la forme Driver ID =
Driver ID.
37. Nous ne souhaitons pas déposer les conducteurs qui n’ont pas commis de seconde
infraction, donc nous allons effectuer une jointure gauche. Dans la zone Type de
jointure, cliquez sur la zone sans ombrage du diagramme à côté de Robust 1st, pour la
transformer en jointure Gauche.
38. Dans le volet Flux, sélectionnez Jointure 3, cliquez sur l’icône Plus et sélectionnez
Étape de nettoyage. Supprimez le champ en double Driver ID-1.
Les données sont dans l’état souhaité, donc nous pouvons créer une sortie et passer à
l’analyse.
39. Dans le volet Flux, sélectionnez Nettoyer 6 que vous venez d’ajouter, cliquez sur l’icône
40. Dans le volet Sortie, modifiez le Type de sortie sur .csv puis cliquez sur Parcourir.
Entrez Driver Infractions comme nom, et choisissez l’emplacement souhaité avant de
cliquer sur Accepter pour enregistrer.
41. Cliquez sur le bouton Exécuter le flux au bas du volet pour générer votre sortie.
Cliquez sur Terminé dans la boîte de dialogue d’état pour fermer la boîte de dialogue.
Conseil : pour plus d’informations sur les fichiers de sortie et l’exécution d’un flux,
consultez Enregistrer et partager votre travail sur la page 429.
Remarque : vous pouvez télécharger le fichier de flux terminé pour vérifier votre travail :
Driver Infractions.tflx
Récapitulatif
Pour la première étape de ce didacticiel, notre objectif était de prendre notre ensemble de
données d’origine et de le préparer pour l’analyse relative aux premières et secondes infractions.
Le processus consiste en trois phases :
1. Créer une agrégation qui conserve Driver ID et MIN Infraction Date. Liez cette
agrégation avec l’ensemble de données d’origine pour créer un « ensemble de données
intermédiaire » comportant la date de la première infraction (minimum) répétée pour
chaque ligne.
2. Dans une nouvelle étape, filtrez toutes les lignes où 1st Infraction Date est identique à
Infraction Date. À partir de cet ensemble de données filtré, créez une agrégation qui
conserve Driver ID et MIN Infraction date. Liez avec l’ensemble de données
intermédiaire issu de la première étape. Cette opération identifie la date de la seconde
infraction.
Créer des ensembles de données propres pour les premières et secondes infractions :
5. Liez les ensembles de données Robust 1st et Robust 2nd en veillant à conserver tous
les enregistrements de Robust 1st pour éviter de perdre les conducteurs n’ayant pas
commis de seconde infraction.
Ensuite, nous souhaitons explorer l’analyse de ces données dans Tableau Desktop.
Remarque : nous tenons à remercier Ann Jackson pour sa rubrique Workout Wednesday
Do Customers Spend More on Their First or Second Purchase? et Andy Kriebel pour son
astuce Tableau Prep Returning the First and Second Purchase Dates qui ont fourni
l’inspiration initiale pour ce didacticiel. Si vous cliquez sur ces liens, vous quitterez le site
Web de Tableau. Tableau décline toute responsabilité quant au degré d’exactitude ou
d’actualité des pages gérées par des fournisseurs externes. Contactez les propriétaires si
vous avez des questions relatives au contenu.
Lors de la première étape, nous avons examiné notre ensemble de données d’origine et l’avons
structuré de manière à pouvoir répondre aux questions suivantes :
1. Quelle était la durée, en jours, entre la première et la seconde infraction pour chaque
conducteur ?
2. Comparez les montants des amendes pour la première et la seconde infraction. Sont-ils
corrélés ?
5. Quel était le montant moyen de l’amende pour les conducteurs n’ayant jamais effectué de
stage de conduite obligatoire ?
À mesure que nous explorions ces questions, il est apparu clairement que la première structure
des données que nous avions créée présentait quelques avantages et quelques inconvénients.
Nous retournerons dans Tableau Prep Builder et effectuerons quelques mises en forme
supplémentaires, puis nous verrons l’incidence qu’a cette action sur la même analyse dans
Tableau Desktop. Enfin, nous adopterons une approche strictement Tableau Desktop de
l’analyse en utilisant les expression de niveau de détail (LOD) avec les données d’origine.
L’objectif de ce didacticiel est de présenter divers concepts dans le contexte d’un scénario de la
vie réelle et d’explorer les options, en déterminant de manière non prescriptive quelle est la plus
adaptée. Au terme de ce didacticiel, vous devriez mieux appréhender l’incidence de la structure
des données sur les calculs et l’analyse, et être familiarisé avec divers aspects de Tableau Prep
et les calculs dans Tableau Desktop.
Remarque : pour effectuer les tâches décrites dans ce didacticiel, vous aurez besoin
d’installer Tableau Prep Builder et, de manière facultative, Tableau Desktop, et de
télécharger les données.
L’ensemble de données est la sortie de Driver Infractions.tflx, telle que nous l’avons créée
dans la première étape.
C. Nous pouvons tracer ces données par rapport à Driver ID dans un graphique à barres.
Notez que sept conducteurs n’ont pas commis de seconde infraction, donc il y a sept
valeurs null.
B. Pour ajouter une courbe de tendance, utilisez l’onglet Analyses dans le volet de gauche et
générez une courbe de tendance linéaire. En survolant la courbe de tendance, nous
pouvons voir que la valeur R carrée est pratiquement de zéro, et que la valeur p est
largement supérieure à un seuil de signification. Nous pouvons déterminer qu’il n’y a pas
de corrélation entre le montant de la première et de la seconde amende.
A. Pour répondre à ces questions dans Tableau Desktop, nous devons ajouter les amendes
des deux infractions à un seul champ. Étant donné que certains conducteurs n’ont pas
nécessairement commis de seconde infraction, nous devons utiliser la fonction zéro null
ZN pour transformer toute valeur null dans 2nd Fine Amount en zéros. Ne pas le faire
entraînera des valeurs null s’il n’y a pas de deuxième amende.
C. Nous pouvons tracer le Montant total payé par rapport à Driver ID et trier le graphique à
barres.
C. Nous pouvons tracer le Nombre de types d’infractions par rapport à Driver ID et trier le
graphique à barres.
Nombre d’infractions =
4. Pour réunir tous ces éléments, nous prenons le montant total des amendes et nous
le divisons par notre nouveau champ calculé Nombre d’infractions pour
déterminer le montant moyen de l’amende :
B. Nous devons également filtrer les conducteurs qui n’ont jamais suivi de stage
obligatoire—mais cette information est également stockée sur deux champs différents.
1. Tableau est très efficace en matière de calculs numériques. Nous formulerons ceci
avec des nombres pour obtenir les meilleures performances possibles. Pour
combiner ces deux champs, nous créerons un calcul pour chaque champ indiquant
« Yes = 1 » et « No = 0 » (la valeur null devrait également = 0 pour les conducteurs
n’ayant pas commis de seconde infraction). En totalisant le résultat de ces calculs,
tout conducteur ayant une valeur totale de 0 n’a jamais suivi de stage obligatoire
(et une valeur de 1 ou 2 indique combien de fois il a suivi ce stage). Nous pouvons
ensuite appliquer un filtre de manière à conserver uniquement les conducteurs
associés à une valeur de 0.
3. Nous procédons ensuite de même pour le 2nd stage obligatoire. Nous pouvons
ajouter les deux éléments dans le même calcul en mettant chaque déclaration de
cas entre parenthèses et en ajoutant un signe plus entre eux. En supprimant
quelques sauts de ligne, le calcul se présente comme suit :
(CASE [1st Traffic School] WHEN 'Yes' THEN 1 WHEN 'No' THEN 0
ELSE 0 END)
+
(CASE [2nd Traffic School] WHEN 'Yes' THEN 1 WHEN 'No' THEN 0
ELSE 0 END)
Étant donné que nous avons intégré les agrégations dans le calcul, l’agrégation dans la
pile sera AGG et nous ne pouvons pas la modifier, ce qui est attendu.
En règle générale, lorsque les données sont stockées avec plusieurs colonnes pour le même
type de données (par exemple deux colonnes pour la date, deux colonnes pour le montant de
l’amende, etc.) et que des informations uniques sont stockées dans le nom du champ (par
exemple s’il s’agit de la première ou de la seconde infraction), ceci indique que les données
devraient être permutées.
Une permutation multiple dans Tableau Prep Builder peut gérer cette tâche avec efficacité.
Nous pouvons travailler à partir de la fin du flux Driver Infraction que Tableau Prep a créé
dans le didacticiel précédent Trouver la seconde date avec Tableau Prep sur la page 559.
Conseil : veillez à revenir dans Tableau Prep pour les étapes suivantes.
1. Depuis l’étape de nettoyage finale, ajoutez une étape Permutation pour permuter
chaque champ dupliqué. Utilisez l’icône plus en haut à droite de la zone Champs
permutés pour ajouter d’autres Valeurs de permutation. Chaque ensemble de champ
(par exemple les montants de 1ère et 2nd amende) devrait être permuté ensemble.
2. Dans la zone Champs pivotés, sous la colonne Noms Pivot1, cliquez deux fois sur
chaque valeur et renommez-les en 1ère et 2nde.
Les résultats peuvent être mis en ordre en supprimant les dates null et en renommant et
réorganisant les champs.
3. Ajoutez une étape de nettoyage après la permutation. Dans la colonne Infraction Date,
faites un clic droit sur la barre null et choisissez Exclure.
5. Faites glisser les champs comme approprié pour les réorganiser comme ci-dessous :
6. À partir des nouvelles données permutées, créez une sortie appelée Pivoted Driver
Infractions (Infractions des conducteurs Données permutées) et insérez-la dans Tableau
Desktop. (N’oubliez pas d’exécuter le flux après avoir ajouté l’étape Sortie.)
Nous pouvons maintenant examiner nos cinq questions à nouveau en nous basant sur cette
structure de données permutées. Vous pouvez développer chacune des informations de base
pour savoir comment procéder si vous êtes bloqué.
2. Nous voulons nous assurer que ces deux valeurs sont disponibles pour être
comparées pour chaque conducteur, donc nous devons les corriger au niveau de
Driver ID.
Ici, la ligne qui sait quelle est la première date ne sait pas quelle est la
seconde date, et vice versa. Pour contourner ce problème, nous utiliserons
une expression LOD FIXED pour que ces premières et secondes dates
soient obligatoirement associées par Driver ID.
Remarque : le calcul d’origine IF doit être agrégé lorsqu’il est intégré dans
une expression LOD. Nous pouvons utiliser une agrégation de base qui
préservera la valeur de date (des agrégations telles que SUM, AVG ou MIN
fonctionneront, mais pas CNT ou CNTD).
Remarque : ces calculs peuvent également être créés dans Tableau Prep
Builder. Pour plus d’informations sur les expressions LOD, consultez Créer
des calculs de niveau de détail, de classement et de section sur la page
321.
DATEDIFF ( 'day',
4. Tracez Durée entre les infractions sur les colonnes et Driver ID sur les lignes.
Les résultats seront identiques à la sortie obtenue avec la structure de données non permutées.
A. Pour répondre à cette question dans Tableau Desktop, nous utiliserons une logique très
similaire à la question précédente. Nous utiliserons Infraction Number pour identifier si
une ligne donnée est la première ou la seconde infraction, puis nous extrairons le
montant de l’amende en conséquence.
Ces calculs peuvent également être créés dans Tableau Prep Builder. Pour plus
d’informations sur les expressions LOD, consultez Créer des calculs de niveau
de détail, de classement et de section sur la page 321.
3. Créez un nuage de points avec Montant de la 1ère amende sur les colonnes et
Montant de la 2nde amende sur les lignes, et faites ressortir une courbe de
tendance linéaire comme précédemment.
Les résultats seront identiques à la sortie obtenue avec la structure de données non permutées.
A. Pour répondre à cette question dans Tableau Desktop, la structure de données permutées
est idéale. Il nous suffit de faire ressortir Driver ID et Fine Amount dans un graphique à
barres. L’agrégation par défaut est déjà SUM, donc le montant total payé par le
conducteur sera automatiquement tracé.
Les résultats seront identiques à la sortie obtenue avec la structure de données non permutées.
Les résultats seront identiques à la sortie obtenue avec la structure de données non permutées.
Ceci renvoie la date de la seconde infraction, le cas échéant, ou « no » s’il n’y a pas
eu de seconde infraction.
Nombre d’infractions =
B. Nous devons également filtrer les conducteurs qui ont suivi un stage obligatoire. Il semble
que nous pourrions utiliser le champ Traffic School et filtrer sur Traffic School = no.
Cependant, cela filtrerait les infractions non associées au stage obligatoire et non les
conducteurs qui ne sont jamais allés au stage obligatoire. Si un conducteur a suivi un
stage obligatoire pour une infraction, mais pas l’autre, nous ne voulons pas que l’une ou
l’autre infraction soit prise en compte ici. Ce conducteur a suivi un stage obligatoire et ne
correspond donc pas aux paramètres de la question.
Nous souhaitons simplement filtrer les conducteurs qui ont suivi un stage obligatoire. En
termes de données, nous souhaitons filtrer les conducteurs qui affichent une valeur
« Yes » pour Traffic School (Stage obligatoire) sur une ligne, quelle que soit l’infraction à
laquelle la valeur est associée. Créons notre calcul par étapes, en utilisant une vue
simple pour nous aider à suivre ce qui se passe :
1. Tout d’abord, nous souhaitons savoir si un pilote affiche une valeur « Yes » pour le
stage obligatoire. Faites glisser Driver ID vers Lignes et Traffic School vers
2. Ensuite, nous souhaitons créer un calcul qui identifie si la valeur de Traffic School
est « Yes ». La première étape du calcul est :
En appliquant cette modification dans la vue, nous voyons l’opposé de ce que nous
recherchons. Tout conducteur associé à une valeur « No » est marqué comme
« False » dans le tableau. Au lieu de cela, nous voulons que la valeur « Yes »
apparaisse comme « True » pour chaque enregistrement concernant ce
conducteur. Que fait la fonction MIN dans ce cas ? Elle prend la première réponse
dans l’ordre alphabétique, à savoir « No ».
5. Si nous déposons Attended Traffic School sur l’étagère Filtre et que nous
sélectionnons simplement « False », nous nous retrouvons seulement avec les
conducteurs qui n’ont jamais suivi de stage obligatoire.
C. Pour répondre à la question d’origine, avec notre filtre en place, nous pouvons simplement
déposer Average Fine sur l’étagère Texte dans la fiche Repères. Étant donné que nous
avons intégré les agrégations dans le calcul, l’agrégation dans le champ sera AGG et
nous ne pouvons pas le modifier, ce qui est attendu.
Les résultats seront identiques à la sortie obtenue avec la structure de données non permutées.
Tableau Desktop et les expressions LOD peuvent répondre à toutes vos questions analytiques.
Si nous nous connectons au fichier Traffic Violations.xlsx d’origine, il semble très similaire à
l’ensemble de données permutées, à l’exception du champ crucial Infraction Number. Nous
devons reproduire le résultat des étapes d’agrégation via les expressions LOD.
a. Pour commencer, nous devons simplement examiner les dates qui sont
supérieures à la première date :
Les résultats seront identiques aux sorties obtenues avec les deux autres structures de données.
LOD FIXED donc c’est sans doute une bonne idée de procéder ainsi dès le début :
Les résultats seront identiques aux sorties obtenues avec les deux autres structures de
données.
B. En utilisant les champs que nous avons créés pour la question 2, nous ajouterons les
deux montants d’amende. ZN est nécessaire pour éviter un résultat nul pour les
conducteurs qui n’ont commis qu’une seule infraction. Le calcul est le suivant :
Les résultats seront identiques aux sorties obtenues avec les deux autres structures de
données.
B. Nous pouvons extraire les types de 1ère et 2nde infraction, les entourer dans des
expressions LOD pour les rendre FIXED pour le conducteur, et utiliser un calcul IF pour
compter les types :
ELSEIF
{FIXED [Driver ID] : MIN(IF [1st Infraction]=
[Infraction Date] THEN [Infraction Type] END)}
!=
{FIXED [Driver ID] : MIN(IF [2nd Infraction]=
[Infraction Date] THEN [Infraction Type] END)}
THEN 2
ELSE 1
END
Ce qui est un peu difficile à appréhender mais fonctionne si vous avez une
préférence pour ce calcul. (Notez que les sauts de ligne et certains espaces
n’ont pas d’incidence sur l’interprétation d’un calcul par Tableau.)
A. Nous pouvons tracer le Nombre de types d’infractions par rapport à Driver ID et trier le
graphique à barres.
Les résultats seront identiques aux sorties obtenues avec les deux autres structures de
données.
Nombre d’infractions =
3. Pour le montant total payé, nous pouvons utiliser le calcul de la question 3. Pour
réunir tous ces éléments, nous prenons le montant total des amendes et nous le
divisons par notre nouveau champ calculé Nombre d’infractions pour déterminer
le montant moyen de l’amende :
B. Nous devons également filtrer les conducteurs qui ont suivi un stage obligatoire. Étant
donné que cet ensemble de données inclut des conducteurs ayant commis une troisième
ou une quatrième infraction, nous ne pouvons pas utiliser la même méthode que la
structure de données permutées. Au lieu de cela, nous suivrons la même méthode que les
données non permutées, résumée ici :
1. Tout d’abord nous devons créer deux calculs qui identifient si la première et la
seconde infractions impliquaient ou non un stage obligatoire :
(CASE [1st Traffic School] WHEN 'Yes' THEN 1 WHEN 'No' THEN
0 ELSE 0 END)
+
(CASE [2nd Traffic School] WHEN 'Yes' THEN 1 WHEN 'No' THEN
0 ELSE 0 END)
Les résultats seront identiques aux sorties obtenues avec les deux autres structures de
données.
Il est important de se rappeler que cette solution comporte de nombreux calculs imbriqués et
expressions LOD. Selon la taille de l’ensemble de données et la complexité des données, les
performances peuvent poser problème.
l Si vous souhaitez éviter les expressions LOD, il existe une solution d’organisation des
données, même si des calculs peuvent s’avérer nécessaires pour certaines analyses
(Analyse dans Tableau Desktop sur la page 573).
l Si vous pouvez organiser les données et que vous maîtrisez les calculs, y compris les
expressions LOD, l’option intermédiaire offre la flexibilité optimale (Aller plus loin—
Données permutées sur la page 581).
l Si vous êtes à l’aise avec les expressions LOD, l’impact sur les performances est minimal,
et/ou si vous n’avez pas accès à Tableau Prep, résoudre la question avec les seules
expressions LOD est une option tout à fait viable (Aller encore plus loin—Calculs
seulement sur la page 592).
Au minimum, il est utile de comprendre comment l’agrégation dans Tableau Prep et les
expressions LOD dans Tableau Desktop sont liées ensemble et affectent l’analyse des données.
Comme pour la plupart des choses avec Tableau, il existe plusieurs manières de procéder.
Explorer toutes les options possibles peut vous aider à rassembler les concepts et à choisir la
solution la plus adaptée à votre cas.
Calculs utilisés :
Infractions de conducteurs
l Durée entre les infractions = DATEDIFF('day', [1st Infraction Date],
[2nd Infraction Date])
l 1er stage obligatoire = {FIXED [Driver ID] : MIN (IF [1st Infraction] =
[Infraction Date] THEN [Traffic School] END ) }
l 2nd stage obligatoire = {FIXED [Driver ID] : MIN (IF [2nd Infraction] =
[Infraction Date] THEN [Traffic School] END ) }
Remarque : nous tenons à remercier Ann Jackson pour sa rubrique Workout Wednesday
Do Customers Spend More on Their First or Second Purchase? et Andy Kriebel pour son
astuce Tableau Prep Returning the First and Second Purchase Dates qui ont fourni
l’inspiration initiale pour ce didacticiel. Si vous cliquez sur ces liens, vous quitterez le site
Web de Tableau. Tableau décline toute responsabilité quant au degré d’exactitude ou
d’actualité des pages gérées par des fournisseurs externes. Contactez les propriétaires si
vous avez des questions relatives au contenu.
Exécution de LogShark
LogShark est un utilitaire de ligne de commande open source gratuit que vous pouvez utiliser
pour extraire des informations des fichiers journaux Prep à des fins de dépannage et d’obtention
d’informations sur les erreurs et l’utilisation. Le plug-in LogSharkPrep.twbx vous permet de
générer des classeurs avec un tableau de bord des erreurs et des flux qui vous aide à analyser et
à visualiser les problèmes Prep.
LogShark nécessite que les fichiers journaux Prep que vous traitez soient des fichiers
compressés (zippés). Pour trouver les fichiers journaux Prep, accédez au dossier Mon dossier
Tableau Prep. Vous le trouverez à cet emplacement : /Users/<username>/Documents/My
Tableau Prep Repository .
Pour plus d’informations sur l’installation et l’exécution de LogShark, consultez Configurer votre
ordinateur pour LogShark.
Le tableau suivant décrit les erreurs courantes et leurs solutions. Pour des informations sur
l’exécution des flux depuis la ligne de commande, consultez Actualiser les fichiers de sortie
du flux depuis la ligne de commande sur la page 479.
« Unable to read the connections file. » (Impos- Le fichier cre- Vérifiez la syntaxe
sible de lire le fichier de connexions) dentials.json pour les
contient des connexions aux
erreurs de syn- données entrantes
taxe ou de format dans le fichier
pour les .json. Pour plus
connexions aux d’informations et
données pour des
entrantes. exemples, consul-
tez Actualiser les
fichiers de sortie
du flux depuis la
ligne de com-
mande sur la page
479.
« There are errors in the flow. Unable to run the Il manque des Vérifiez que le
flow. informations fichier .json
d’identification contient les
Check that the credentials .json file includes all
dans le fichier informations
required credentials. Open the flow in Tableau
credentials.json d’identification
Prep Builder to view error details. » (Erreurs dans
pour les nécessaires pour
le flux. Impossible d’exécuter le flux. Vérifiez que le
connexions toutes les
fichier credentials.json inclut toutes les
entrantes, ou le connexions, et
informations d’identification requises. Ouvrez le
flux comporte ouvrez le fichier de
flux dans Tableau Prep Builder pour afficher les
des erreurs. flux dans Tableau
détails de l’erreur.)
Prep Builder pour
voir s’il y a des
erreurs dans le
flux.
Si le flux contient
des erreurs, vous
devez les corriger,
puis republier le
flux sur Tableau
Server, puis
essayer d’exécuter
à nouveau le
processus.
« Could not find match for <hostname of inputCon- Il manque une Assurez-vous que
nections > » (Impossible de trouver une cor- entrée pour le le fichier
respondance pour <hostname of nom d’hôte (nom credentials.json
inputConnections >) du serveur) dans inclut les
le fichier cre- informations
dentials.json. d’identification
correctes pour le
nom d’hôte (nom
du serveur).
Pour plus
d’informations et
pour des
exemples,
consultez
Actualiser les
fichiers de sortie
du flux depuis la
ligne de
commande sur la
page 479.
Pour plus
d’informations et
pour des
exemples,
consultez
Actualiser les
fichiers de sortie
du flux depuis la
ligne de
commande sur la
page 479.
Pour plus
d’informations et
pour des
exemples,
consultez
Actualiser les
fichiers de sortie
du flux depuis la
ligne de
commande sur la
page 479.
« We don’t have credentials for Tableau Server to Le fichier cre- Vérifiez que le
publish extract for one or more output nodes in tfl/t- dentials.json n’a chemin d’accès du
flx file. » (Nous n’avons pas les informations pas été transmis fichier
d’identification nécessaires pour que Tableau Ser- en tant credentials.json
ver publie un extrait pour un ou plusieurs nœuds qu’argument de est inclus dans la
de sortie dans un fichier tfl/tflx.) ligne de com- ligne de
mande ou il commande et que
manque les infor- le fichier
mations credentials.json
d’identification inclut tous les
pour la identifiants et
connexion de sor- éléments corrects
tie. pour la connexion
de sortie.
Pour plus
d’informations et
pour des
exemples,
consultez
Actualiser les
fichiers de sortie
du flux depuis la
ligne de
commande sur la
page 479.
« Loom rest api server not started » (Serveur API La configuration Vérifiez que
REST Loom non démarré) de l’installation Tableau Prep
ou de Builder est
l’environnement correctement
n’est pas cor- installé et que vous
recte. exécutez la
commande en tant
qu’administrateur.
Pour plus
d’informations sur
l’installation de
Tableau Prep
Builder, consultez
Installer Tableau
Desktop ou
Tableau Prep
Builder depuis
l’interface
utilisateur.
« Error. Flow file does not exist. » (Erreur. Le Le chemin Vérifiez que la
fichier de flux n’existe pas) d’accès au fichier ligne de com-
de flux est incor- mande inclut le
rect. chemin d’accès
correct du fichier
de flux.
« Error. Connections file does not exist. » (Erreur. Le chemin Vérifiez que la
Le fichier de connexions n’existe pas) d’accès du fichier ligne de com-
credentials.json mande inclut le
est incorrect. chemin d’accès
correct du fichier
credentials.json.
Les flux incluant des fonctionnalités non prises en charge dans des versions antérieures
entraînent une erreur de compatibilité. Pour résoudre l’erreur, ouvrez le flux dans la version
ultérieure, et enregistrez une copie du flux sans les fonctionnalités indiquées. Dans l’exemple ci-
dessus, supprimez le filtre null du champ auquel il a été appliqué.
Ouvrez ensuite la copie dont la fonctionnalité a été supprimée dans la version antérieure de
Tableau Prep Builder.
Vous utilisez Server version: null mais la version minimum compatible est : 10.0.
Mettez à niveau à une version compatible
Si vous voyez cette erreur, adressez-vous à votre service informatique ou votre administrateur
système pour qu’il installe le certificat racine requis sur l’ordinateur sur lequel Tableau Prep
Builder est installé. Pour plus d’informations, consultez Configuration système requise dans le
Guide de déploiement de Tableau Desktop et de Tableau Prep Builder.
Vous devez renouveler les licences à durée limitée et actualiser la clé produit pour continuer à
bénéficier d’un service ininterrompu. Vous pouvez renouveler en continu la licence à durée
limitée à l’expiration de chaque période spécifiée. Si vous ne renouvelez pas votre licence
temporaire et qu’elle arrive à expiration, Tableau cessera de fonctionner et vous n’aurez plus
accès au logiciel. Pour plus d’informations sur le renouvellement de votre licence, consultez
Comment renouveler vos licences Tableau.
Remarque : les licences d’évaluation pour Tableau Desktop ou Tableau Prep expirent au
terme d’une période définie, généralement 14 jours. À l’expiration de la période
d’évaluation, vous devez acheter une licence pour continuer à utiliser le produit.
Vous pouvez également activer ou désactiver une clé produit ou actualiser une clé produit de
maintenance à partir de cette boîte de dialogue si vous n’utilisez pas l’option Bureau virtuel
(ATR).
Remarque : Tableau propose des licences à durée limitée fournissant toute une gamme
de possibilités. Le type de licence que vous utilisez s’affiche dans le champ Produit. Pour
plus d’informations sur les différents types de licences basées sur les utilisateurs
disponibles, consultez Licences basées sur les utilisateurs dans l’aide en ligne de Tableau
Server.
Les utilisateurs Tableau Desktop existants peuvent avoir une licence perpétuelle
(permanente). Les licences perpétuelles n’expirent pas et leur champ La licence expire
dans la boîte de dialogue Gérer les clés produit affiche « Permanent ». Vous devez
toutefois acheter des services d’assistance et de maintenance pour bénéficier d’un accès
aux mises à jour de produit et à l’assistance technique. Ces services doivent être
renouvelés pour que vous puissiez continuer à bénéficier du service. Les licences
perpétuelles (permanentes) ne sont plus disponibles pour Tableau Desktop.
Utilisez les boutons suivants pour choisir une action concernant votre clé produit :
l Actualiser (autre que Gestion des licences basée sur la connexion et autre que Bureau
virtuel uniquement) : cliquez sur le bouton Actualiser pour actualiser une licence de
maintenance qui expire, puis fermez et redémarrez Tableau Desktop. Si la date
d’expiration de la maintenance ne se met pas à jour, adressez-vous à votre
administrateur de licences. Il se peut que la clé ou le contrat de licence ait changé.
Une clé produit dont la valeur d’expiration de la licence est répertoriée comme «
permanente » (voir la boîte de dialogue Gérer les clés produit ci-dessus) est une
ancienne clé produit. Vous pouvez actualiser une clé produit permanente à tout moment
tant que la date de fin de maintenance indiquée dans le Portail client Tableau est
supérieure à la date reflétée dans la boîte de dialogue Gérer les clés produit dans
Desktop.
Si la clé produit a atteint sa date d’expiration (clés produit non permanentes), vous ne
pouvez pas l’actualiser la clé produit. Visitez le Portail client de Tableau pour obtenir une
clé produit d’abonnement mise à jour et effectuer une nouvelle activation. Si la clé produit
n’a pas atteint sa date d’expiration, vous pouvez actualiser la clé du produit. Lorsque vous
actualisez une clé produit qui n’a pas encore expiré, seule la valeur d’expiration de la
licence changera et non la clé produit. La clé produit change lorsqu’elle atteint sa date
d’expiration.
Remarque : vous ne pouvez pas actualiser la clé produit si Tableau Desktop est
hors ligne. Si vous activez Tableau Desktop en mode hors connexion, vous devez
obtenir et activer une nouvelle clé depuis le Portail client Tableau.
l Désactiver (autre que Gestion des licences basée sur la connexion et autre que Bureau
virtuel) : sélectionnez une clé produit dans la liste puis cliquez sur Désactiver pour
désactiver la clé produit. Désactivez une clé produit si vous avez besoin de déplacer la clé
produit vers un autre ordinateur ou que vous n’avez plus besoin de la clé produit sur cet
ordinateur.
Pour plus d’informations sur la désactivation d’une clé produit, consultez Déplacer ou
désactiver des clés produit dans l’aide de Tableau Desktop et le guide de déploiement de
Tableau Prep.
l Activer : une fois que Tableau Desktop ou Tableau Prep est installé, cliquez sur Activer
pour ouvrir la boîte de dialogue d’activation et entrez votre clé produit. Si un message
d’erreur s’affiche et que vous ne pouvez pas activer Tableau Desktop ou Tableau Prep à
l’aide de votre clé produit, contactez l’assistance Tableau.
Pour plus d’informations sur l’activation d’une clé produit, consultez Activer et enregistrer
votre produit dans le guide de déploiement de Tableau Desktop et de Tableau Prep.
Tableau Desktop et Tableau Prep Builder tenteront d’actualiser silencieusement une clé produit
active et avertiront les utilisateurs 14 jours avant l’expiration de leur licence si l’actualisation
silencieuse n’a pas abouti. Tableau tentera d’actualiser une clé produit à trois reprises (14 jours,
2 jours et 1 jour avant l’expiration de la licence) pour refléter les prolongations de date de fin de
licence à la suite du renouvellement de votre abonnement. La clé produit n’est pas actualisée à
moins qu’un utilisateur Tableau Desktop se connecte à Tableau Desktop pendant ces périodes.
Pour les utilisateurs qui ne se connectent pas à Tableau Desktop chaque jour, vous devez
actualiser leurs clés produit à l’aide de l’option de menu Gérer les clés produit.
Si Tableau Desktop et Tableau Server sont configurés pour générer des rapports sur les
licences, lorsque vous êtes connecté à Tableau Server en tant qu’administrateur, vous voyez
ces deux rapports répertoriés dans la page État du serveur de la section Analyse.
Si ces rapports ne figurent pas dans la liste, il se peut que Tableau Desktop et Tableau Server ne
soient pas configurés pour les rapports d’utilisation de Tableau Desktop.
Pour des informations sur la configuration des rapports d’utilisation dans Tableau Desktop et
Tableau Server, consultez Gérer l’utilisation des licences Tableau Desktop dans le guide de
déploiement de Tableau Desktop et Tableau Prep.
Ressources supplémentaires
Pour plus d’informations sur la gestion de votre licence, consultez les rubriques suivantes :
l Pour trouver votre clé produit et activer Tableau Desktop ou Tableau Prep Builder,
consultez Où se trouve ma clé produit ?
l Pour désactiver une clé produit ou la déplacer vers un autre ordinateur, consultez
Déplacer ou désactiver Tableau Desktop.
l Pour en savoir plus sur les clés produit pour les bureaux virtuels non permanents ou pour
les ordinateurs auxquels une nouvelle image est régulièrement appliquée, consultez
Configurer la prise en charge des bureaux virtuels.
l Pour en savoir plus sur la gestion des clés produit pour Tableau Server ou Tableau
Cloud, consultez Présentation des licences (Linux | Windows)
l Pour en savoir plus sur le processus de renouvellement de licence ou pour renouveler
une licence, consultez Comment renouveler vos licences Tableau.
Fonctions de nombre
Syntaxe Description
Exemples :
ABS(-7) = 7
ABS([Budget Variance])
Renvoie la valeur absolue pour tous les
nombres contenus dans le champ Budget
Variance.
Exemple :
ACOS(-1) = 3.14159265358979
Exemple :
ASIN(1) = 1.5707963267949
Exemple :
ATAN(180) = 1.5652408283942
Exemple :
ATAN2(2, 1) = 1.10714871779409
Exemple :
CEILING(3.1415) = 4
Exemple :
Exemple :
COT(PI( ) /4) = 1
Exemple :
DIV(11,2) = 5
Exemples :
Exemple :
FLOOR(3.1415) = 3
Exemple :
HEXBINX([Longitude], [Latitude])
Exemple :
HEXBINY([Longitude], [Latitude])
Exemple :
LN(EXP(5)) = 5
Exemple :
LOG(256, 2) = 8
Exemples :
MAX(4,7)
MAX(Sales,Profit)
MAX([First Name],[Last Name])
Exemples :
MIN(4,7)
MIN(Sales,Profit)
Exemple :
PI() = 3.14159265358979
Exemples :
POWER(5,2) = 52 = 25 POWER
(Temperature, 2)
5^2 = POWER(5,2) = 25
Exemple :
RADIANS(180) = 3.14159
Exemple :
ROUND(Sales)
Exemple :
SIGN(AVG(Profit)) = -1
Exemples :
SIN(0) = 1.0
Exemple :
SQRT(25) = 5
Exemple :
SQUARE(5) = 25
Exemple :
Exemple :
ZN([Profit]) = [Profit]
Fonctions de chaîne
Syntaxe Description
Exemple :
ASCII('A') = 65
Exemple :
CHAR(65) = 'A'
Exemple :
CONTAINS(“Calculation”, “alcu”) =
true
Exemple :
Exemples :
FIND("Calculation", "alcu") = 2
Exemple :
FINDNTH("Calculation", "a", 2) =7
Exemple :
ISDATE("2004-04-15") = True
Exemple :
LEFT("Matador", 4) = "Mata"
Exemple :
LEN("Matador") = 7
Exemple :
LOWER("ProductVersion") =
"productversion"
Exemple :
Exemples :
MID("Calculation", 2) =
"alculation"
MID("Calculation", 2, 5) ="alcul"
Exemple :
Exemple :
Exemple :
Exemple :
REGEXP_MATCH('-([1234].[
The.Market ])-', '\\[\\s*(\\w*\\.)
(\\w*\\s*\\])') = true
Exemple :
Exemple :
REPLACE("Calculation", "ion",
"ed") = "Calculated"
Exemple :
RIGHT("Calculation", 4) = "tion"
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
UPPER("Calculation") =
"CALCULATION"
Fonctions d’agrégation
Syntaxe Description
Exemple :
AVG([Profit])
Exemple :
COUNT([Customer ID])
Exemple :
COUNTD([Region])
Exemple :
MEDIAN([Profit])
Exemple :
PERCENTILE([Sales], 0.90)
Exemple :
STDEV([Profit])
Exemple :
STDEVP([Profit])
Exemple :
SUM([Profit])
Exemple :
VAR([Height])
Exemple :
VARP([Test Score])
Exemple :
ZN([Profit]) = [Profit]
Syntaxe Description
Exemple :
Exemple :
Exemple :
FLOAT("3")= 3.000
Exemple :
INT(8.0/3.0) = 2 or INT(-9.7) = -9
MAKEDATE(year, month, day) Renvoie une valeur de date créée à partir d’une
année, d’un mois et d’un jour du mois.
Exemple :
MAKEDATE(2014, 3, 18)
Exemple :
MAKEDATETIME(#2012-11-12#,
#07:59:00#)
MAKETIME(hour, minute, second) Renvoie une valeur de temps créée à partir des
heures, minutes et secondes.
Exemple :
expression donnée.
Exemple :
STR([Age])
Fonctions de date
Syntaxe Description
Exemple :
DATEADD('month', 3, #2004-04-15#) =
2004-07-15 12:00:00 AM
Exemple :
DATEDIFF('month', #2004-07-15#,
#2004-04-03#, 'sunday') = -3
Exemple :
DATENAME('month', #2004-04-15#) =
"April"
Exemple :
DATEPARSE ("dd.MMMM.yyyy",
"15.April.2004") = 2004-04-15
12:00:00 AM
Exemple :
DATEPART('month', #2004-04-15#) = 4
Exemple :
DATETRUNC('quarter', #2004-08-15#)
= 2004-07-01 12:00:00 AM
Exemple :
DAY(#2004-04-12#) = 12
Exemple :
ISDATE("2004-04-15") = True
Exemple :
MONTH(#2004-04-12#) = 4
Exemple :
Exemple :
TODAY() = 2004-05-12
Exemple :
YEAR(#2004-04-12#) = 2004
Fonctions logiques
Syntaxe Description
Exemple :
IFNULL([Profit], 0)
IIF(test, then, else, [unk- Vérifie si une condition est remplie, et renvoie
nown]) une valeur si TRUE, une autre valeur si FALSE,
et une troisième valeur optionnelle ou NULL si
inconnu.
Exemple :
Exemple :
ISDATE("2004-04-15") = True
Exemple :
ISNULL([Profit])
Exemple :
ZN([Profit]) = [Profit]
Fonctions analytiques
Syntaxe Description
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Mots-clés
Fonction Description
Exemple :
Exemple
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
{FIXED[Customer ID]:MIN([Order
Date])}
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :
Exemple :