Comment choisir
les Bonnes Données
Visualisation
Comment choisir la bonne visualisation des données
par Mike Yi
Introduction
Les visualisations de données sont un élément vital d'une analyse de données, car elles ont le
capacité à résumer efficacement de grandes quantités de données à travers un graphique
format. Il existe de nombreux types de graphiques disponibles, chacun ayant ses propres forces
et cas d'utilisation. L'une des parties les plus délicates du processus d'analyse est le choix
la bonne façon de représenter vos données en utilisant l'une de ces visualisations.
Lorsque vous décidez d'un type de graphique, pensez d'abord au type de rôle que le graphique
servira. Les rôles communs pour la visualisation des données incluent :
• montrer le changement au fil du temps
• montrant une composition partie-tout
• décrire les flux et les processus
• regarder comment les données sont réparties
• comparer les valeurs entre les groupes
• observer les relations entre les variables
• examen des données géographiques
Ensuite, considérez les types de données que vous souhaitez tracer. Le type de graphique que vous
l'utilisation dépendra de si les données sont catégorielles, numériques ou une combinaison de celles-ci
Certaines visualisations peuvent également être utilisées à des fins multiples.
selon ces facteurs. Ce livre est organisé selon cette approche
en tête, avec un chapitre pour chaque rôle de visualisation, chacun avec plusieurs
types de graphiques pour couvrir les types de données courants et les sous-tâches.
Veuillez noter que ce document ne doit servir que de directive générale : il est pos-
Il est possible que sortir des modes standard vous aide à acquérir des additions.
informations. Expérimentez non seulement avec différents types de graphiques, mais aussi avec comment le
Les variables sont encodées dans chaque graphique. Il est également bon de garder à l'esprit que vous
ne se limitent pas à montrer tout dans un seul graphique. Il est souvent préférable de
gardez chaque intrigue individuelle aussi simple et claire que possible, et utilisez plutôt
des graphiques multiples pour faire des comparaisons, montrer des tendances et démontrer des relations
relations entre plusieurs variables.
Comment choisir une visualisation de données – 3
Comment ce livre est organisé
Ce livre est divisé en chapitres, un pour chacune des principales catégories pour
utilisant une visualisation de données. Chaque chapitre est précédé d'une courte introduction,
suivi d'une liste de types de graphiques appartenant à cette catégorie. Chaque type de graphique est
accompagné d'une courte description et d'une ou plusieurs icônes. Ci-dessous se trouve une clé
pour décoder ces symboles :
BASIC : Les types de graphiques avec cette icône représentent des graphiques typiques ou standard.
types. Lorsque vous devez créer une visualisation de données, essayez de voir si l'une
de ces types de graphiques fonctionne d'abord, avant de décider d'un type peu commun ou
type avancé.
PEU COMMUN : Les types de graphiques avec cette icône sont légèrement plus inhabituels
que les types de graphiques les plus courants. Les cas d'utilisation pour ces graphiques sont
plus spécialisé que d'autres types de graphiques dans cette même catégorie ou plus
souvent vu dans d'autres rôles.
AVANCÉ : Les types de graphiques avec cette icône sont encore plus spécialisés dans
leurs rôles. Assurez-vous que le type de graphique est le meilleur pour votre utilisation
cas avant de l'implémenter. Parfois, ces types de graphiques ne seront pas
intégré dans des logiciels ou bibliothèques de visualisation, et un travail supplémentaire sera
nécessite d'être fait pour assembler ces types de graphiques.
Icônes de connexion : Certains types de graphiques apparaissent dans plusieurs
chapitres du livre, ayant soit plusieurs cas d'utilisation
ou des cas d'utilisation qui s'étendent sur plusieurs rôles. Dans ces cas,
vous verrez un rectangle arrondi avec son entrée notant le
d'autres chapitres dans lesquels ce type de graphique apparaît directement.
Les types de graphiques vus dans les cases représentent les sous-thèmes de chaque visualisation
rôle; ceux-ci auront des cas d'utilisation plus spécialisés et avancés.
Comment choisir une visualisation de données - 4
Table des matières
Introduction..............................................................................................................................3
Comment ce livre est organisé ...............................................................................................4
Chiffres bruts : montrant simplement les données............................................................................6
Graphiques montrant l'évolution dans le temps...........................................................................7
Graphiques pour montrer la composition part-to-whole ......................................................9
Tableaux pour représenter les flux et les processus..................................................................11
Graphiques pour examiner comment les données sont distribuées..........................................................12
Graphiques pour comparer des valeurs entre des groupes .......................................................14
Graphiques pour observer les relations entre les variables.......................................18
Graphiques pour examiner des données géographiques.....................................................................21
Annexe A : Graphiques essentiels pour l'analyse des données.....................................................23
Annexe B : Graphiques qui doivent être utilisés judicieusement...........................................25
Annexe C : Autres manières de visualiser les données ..................................................... 26
À propos de Chartio.......................................................................................................................27
Comment choisir une visualisation des données - 5
Chiffres bruts : simplement montrer les données
Il est important de garder à l'esprit que vous n'avez pas toujours besoin d'utiliser un graphique pour
dépeindre vos données. Parfois, il suffit de montrer les données sous forme de texte pour être le plus efficace
façon active de transmettre des informations.
Graphique à valeur unique
Quand vous n'avez qu'un seul nombre, il vaut mieux simplement le rapporter.
tel quel. Tracer graphiquement une seule valeur (comme avec un)
barre ou point) n'est généralement pas significatif s'il n'y a pas d'autres
valeurs à comparer.
Valeur unique avec indicateur
Un indicateur compare la valeur unique à une seconde
nombre. Cela sert souvent à comparer la valeur d'un indicateur entre
la période actuelle et la période précédente.
Graphique à barres
Type de graphique comparant une seule valeur à un autre nombre,
souvent un point de référence plutôt qu'un autre point de données. Le
une valeur unique est représentée par la longueur d'une barre, tandis que la comparaison
les points sont montrés comme des zones ombrées ou une ligne perpendiculaire.
Table
Comparer des points de données (lignes) à travers plusieurs différents
attributs (colonnes). Généralement triés par un important ou
attributs proéminents pour améliorer l'utilité.
Comment choisir une visualisation des données – 6
Graphiques montrant l'évolution au fil du temps
L'une des applications les plus courantes de la visualisation des données est de voir le
changement de la valeur numérique d'une caractéristique ou métrique au fil du temps. Ces graphiques
généralement, le temps est représenté sur l'axe horizontal, se déplaçant de gauche à droite, avec
les valeurs de la variable d'intérêt sur l'axe vertical.
Graphique linéaire
Type de graphique le plus courant pour montrer le changement au fil du temps. Un
un point est tracé pour chaque période de temps de gauche à droite; chaque
La position verticale du point indique la valeur de la caractéristique. Points
sont connectés par des segments de ligne pour souligner la progression
à travers le temps.
Sparkline
Un graphique linéaire miniature avec peu ou pas d'étiquetage, conçu pour
être placé à côté de texte ou dans des tableaux. Fournit un niveau élevé
aperçu sans attirer trop l'attention. Peut aussi
être vu sous forme de sparkbar, ou de graphique à barres miniature (voir
ci-dessous).
Diagramme de dispersion connecté
Montre l'évolution dans le temps de deux variables numériques (voir
graphique de dispersion dans les relations). Les segments de ligne sont toujours connectés
points à travers le temps, mais ils peuvent ne pas aller de manière cohérente de
de gauche à droite comme dans un graphique linéaire.
Diagramme à barres
Chaque période est associée à une barre ; la valeur de chaque barre
est représenté à sa hauteur au-dessus (ou en dessous) d'une ligne de base zéro.
Fonctionne mieux quand il n'y a pas trop de périodes de temps à
montrer.
Comment choisir une visualisation de données - 7
Boîte à moustaches
Chaque période est associée à un diagramme en boîte et en moustaches;
chaque ensemble de boîte et de moustaches montre l'étendue du plus
valeurs de données communes. Meilleur lorsqu'il y a plusieurs enregistrements-
des éléments pour chaque période et une distribution des valeurs sont nécessaires
à être tracé.
Le suivi des changements au fil du temps est d'un grand intérêt dans le domaine financier. Un
Le tableau spécialisé développé pour ce domaine comprend les éléments suivants :
Graphique en chandeliers
On dirait un box plot, mais chaque boîte et moustaches encodent
des statistiques différentes. Les extrémités de la boîte indiquent l'ouverture et
les prix de clôture, tandis que la couleur indique la direction du changement.
Comment choisir une visualisation de données - 8
Graphiques pour montrer la composition partie-tout
Parfois, nous devons savoir non seulement un total, mais les composants qui
comprendre ce total. Pendant que d'autres graphiques comme un graphique à barres standard peuvent être
utilisé pour comparer les valeurs des composants, les graphiques suivants mettent
la décomposition partie-tout à l'avant-garde.
Diagramme circulaire
L'ensemble est représenté par un cercle rempli. Les parties sont proportionnelles.
des tranches circulaires de ce cercle, une pour chaque groupe catégorique.
Meilleur avec cinq tranches ou moins avec des proportions distinctes.
Graphique en anneau
Un graphique en secteurs avec un trou au centre. Cette zone centrale peut
être utilisé pour montrer une valeur numérique unique pertinente. Certains
fois utilisé comme une alternative esthétique à un prog standard
barre de progression (voir le graphique en barres empilées ci-dessous).
Diagramme en gaufre / graphique en grille
Des carrés disposés dans une grille (typiquement) de 10 x 10 ; chaque carré
représente un pourcent de l'ensemble. Les carrés sont colorés
basé sur la taille du groupe catégorique.
Diagramme à barres empilées
Un histogramme (voir Évolution au fil du temps ou Distributions) où
chaque barre a été divisée en plusieurs sous-barres pour montrer
une répartition partie-toute. Un seul barre empilée peut être
utilisé comme alternative au graphique en secteur ou en anneau ; les gens
tendent à porter des jugements plus précis sur la longueur que sur la surface
ou angle.
Comment choisir une visualisation de données – 9
Diagramme area empilé
Un graphique linéaire (voir l'évolution dans le temps) où les régions ombragées
sont ajoutés sous la ligne pour diviser le total en sous-groupes
valeurs.
Graphique de flux
Version modifiée du graphique en aires empilées où les aires sont
empilés autour d'un axe central. Met en évidence les changements relatifs
au lieu de valeurs exactes.
Graphique en cascade
Augmente un changement au fil du temps avec une décom- position partie-tout
La position. Les barres aux extrémités représentent des valeurs à deux points dans le temps,
et les longueurs des barres flottantes intermédiaires montrent le décom-
position du changement entre les points.
Certaines compositions partie-tout suivent une forme hiérarchique. Dans celles-ci
des cas, chaque partie peut être divisée en parties plus fines à des niveaux inférieurs. Voici un
quelques types de graphiques plus spécialisés pour visualiser ce type de données :
Diagramme mosaïque / Diagramme Marimekko
Peut être considéré comme un graphique à barres empilées divisé sur les deux axes. Un
la boîte est divisée sur un axe en fonction d'une variable catégorique,
ensuite chaque sous-boîte est divisée dans l'autre axe en fonction d'un
deuxième variable catégorique.
Carte de chaleur
Peut être considéré comme un graphique Marimekko plus généralisé.
Les sous-boîtes n'ont pas besoin d'avoir une direction de coupe cohérente.
à un niveau de hiérarchie particulier, et il peut y en avoir plus d'un
deux niveaux de hiérarchie.
Comment choisir une visualisation de données - 10
Graphiques pour représenter les flux et les processus
Une utilisation plus spécialisée des graphiques liés à la décomposition d'un tout est
le suivi du flux des montants à travers un processus à plusieurs étapes. À leur
les plus avancés, ces graphiques peuvent montrer efficacement comment plusieurs entrées sont
transformé en plusieurs sorties.
Graphique en entonnoir
Vu dans des contextes d'affaires, montrant comment les gens rencontrent
obtenir un produit et finalement devenir utilisateurs ou clients.
Une barre est tracée pour chaque étape, dont les longueurs reflètent
nombre d'utilisateurs. Les régions de connexion soulignent la connexion
les actions en étapes et donner la forme qui porte le nom du type de graphique.
Graphique en ensembles parallèles
Multiples divisions partie-tout sur différentes dimensions
sont représentés sous forme de barres empilées parallèles. Régions connectantes
montrez comment les différents sous-groupes se rapportent les uns aux autres
entre les dimensions.
Diagramme de Sankey
La largeur de la région colorée montre le volume relatif
à chaque étape d'un processus. Permet plusieurs sources de
entrées et sorties à visualiser.
Diagramme de Gantt
Utilisé pour la planification de projets, les décomposant en indi-
tâches individuelles. Chaque tâche est associée à une barre, fournissant un
chronologie pour quand chaque tâche devrait commencer et se terminer.
Comment choisir une visualisation de données – 11
Graphiques pour voir comment les données sont distribuées
Une utilisation importante des visualisations est de montrer comment les valeurs des points de données
sont distribués. Cela est particulièrement utile lors du processus d'exploration,
en essayant de construire une compréhension des propriétés des caractéristiques des données.
Remarque : Graphiques pour visualiser les distributions de données à travers deux ou plusieurs variables
sont couverts dans le chapitre sur les Relations.
Diagramme à barres
Utilisé lorsque une variable est qualitative ou prend des valeurs discrètes.
La hauteur de chaque barre indique la quantité de chaque catégorie.
groupe catégorique.
Histogramme
Similaire à un graphique à barres, mais utilisé lorsqu'une variable prend
valeurs numériques continues. L'intervalle numérique de la variable
est divisé en bacs pour l'agrégation des comptes. Des barres sont tracées
se toucher pour mettre en évidence la continuité de la variable
nature continue.
Courbe de densité
Une alternative à l'histogramme lorsque une variable prend nu-
Les valeurs méric. Chaque point de données contribue une petite quantité
de la zone locale ; les zones sont additionnées sur tous les points pour former
la courbe complète.
Boîte à moustaches
Un diagramme en boîte et moustaches montre l'étendue des valeurs les plus courantes
Les extrémités de la boîte délimitent les 50 % centraux de
les données. Plus souvent utilisé pour comparer des distributions être
entre les groupes plutôt qu'en tant que résumé global.
Comment choisir une visualisation de données - 12
Diagramme de valeurs par lettres
Étend le marquage des quartiles du box plot avec des éléments supplémentaires
des cases qui indiquent des huitièmes, des seizièmes et des quantités plus petites
carreaux. Meilleur quand il y a beaucoup de données disponibles pour faire
estimations stables.
Diagramme de violon
Combine une courbe de densité tracée sur une ligne centrale avec
un diagramme en boîte en tant que résumé statistique. Plus souvent utilisé pour
comparer les distributions entre les groupes plutôt que comme un
résumé global.
Le graphique en violon inclut généralement un graphique en boîte pour fournir des détails statistiques.
la courbe de densité. Le diagramme en boîte interne peut parfois être exclu, ou
un autre type de graphique de distribution linéaire peut également être utilisé à la place. Tout le
ci-dessous sont les meilleurs avec peu ou un nombre modéré de points de données ; avec beaucoup
Pour les points de données, un résumé comme le graphique en boîte est le meilleur.
Diagramme de tapis
Tous les points de données sont représentés sous forme de traits de repère sur une ligne droite.
avec une valeur correspondant précisément à la position.
Diagramme en bandes
Comme un graphique de moquette, mais avec des points au lieu de marques de graduation. Certains-
temps tracés avec des points légèrement décalés vers le haut ou vers le bas pour
réduire le chevauchement.
Nuage de points
Comme un diagramme à bande, mais un décalage délibéré est effectué pour
prévenir le chevauchement. Un léger ajustement horizontal peut être nécessaire
afin de garder l'essaim de points compact.
Comment choisir une visualisation de données - 13
Graphiques pour comparer des valeurs
entre les groupes
Une application très courante pour la visualisation des données est de comparer des valeurs
entre des groupes distincts. Ceci est fréquemment combiné avec d'autres rôles pour
visualisation des données, comme montrer le changement au fil du temps, ou examiner comment les données sont
distribué. En conséquence, il s'agit de la plus grande catégorie de types de graphiques.
Diagramme à barres
La manière la plus basique de comparer des valeurs numériques entre
groupes ou catégories. Chaque groupe se voit attribuer une barre ; chaque
La valeur de la barre est représentée par sa hauteur au-dessus (ou en dessous) d'un
base zéro.
Diagramme à barres groupées
Étend un graphique à barres pour comparer des données à travers deux catégories
variables. Chaque barre correspond à une intersection de vari-
niveaux de tableau : les catégories pour une variable sont indiquées par
positions de clusters de barres, tandis que la deuxième variable est indiquée
par couleur de barre ou position au sein de chaque cluster.
Graphique en bâtonnets
Remplace les barres d'un histogramme par des lignes et des points. Utile
pour quand il y a beaucoup de groupes ou de catégories à tracer.
Diagramme à points
Remplace les barres d'un graphique à barres par des points. Puisque la valeur
est indiqué par la position plutôt que par la longueur, le diagramme à points peut
soyez bon quand une ligne de base à zéro n'est pas utile.
Comment choisir une visualisation de données - 14
Graphique linéaire
Chaque ligne dans un graphique linéaire montre comment les valeurs (position verticale
la variation au fil du temps (horizontale). Une ligne est tracée
pour chaque groupe à comparer. Meilleur quand il y a cinq ou
moins de groupes à tracer.
Sparkline
Des graphiques linéaires plus petits, généralement avec peu ou pas d'étiquetage.
Conçu pour montrer un aperçu de haut niveau en ligne avec le texte ou
tableaux, mais aussi utile lorsqu'il y a plusieurs groupes à tracer.
Crête
Une série de graphiques linéaires ou de courbes de densité (voir Distributions)
avec des axes décalés partiellement utilisés pour comparer des distributions
entre les groupes. Meilleur lorsqu'il existe des motifs distincts
à travers les groupes.
Diagramme en boîte
Compare un résumé statistique des valeurs numériques.
entre les groupes. Un ensemble de boîtes et de moustaches décrivant le
la plage des valeurs de données les plus courantes (voir Distributions) est
assigné à chaque groupe ou catégorie.
Graphique à valeurs de lettres
Utilisé de manière similaire au box plot, mais une valeur lettre
plot (seeDistributions) est assigné à chaque groupe à la place.
Mieux utilisé lorsqu'il y a beaucoup de données dans chaque groupe afin que
Les estimations statistiques sont stables.
Graphique en violon
Compare les distributions entre les groupes. Un assemblage de violon
de la courbe de densité et du diagramme en boîte (voir Distributions) est assigné
à chaque groupe ou catégorie.
Comment choisir une visualisation de données - 15
Une sous-catégorie des graphiques de comparaison provient de la comparaison de
valeurs entre les groupes pour plusieurs attributs.
Graphique en pente
Type spécialisé de graphique linéaire. Deux lignes parallèles indiquent
temps différents, avec la position verticale indiquant la valeur. Un
Un segment de ligne est tracé entre les deux temps pour chaque donnée
point. Utile lorsque plusieurs points de données sont présents; ligne
Les pentes fournissent un indicateur rapide de la direction du changement pour
chacun.
Diagramme de coordonnées parallèles
Extension du graphique de pente pour des dimensions multiples. Chaque
la ligne verticale indique maintenant une variable différente ; chacune peut
a sa propre échelle. Utile pour observer les motifs et les relations
rapports dans les données. Quand il n'y a que deux variables, un
un nuage de points (voirRelations) est souvent plus facile à lire.
Graphique en haltères
Utilisé pour comparer deux points de données à travers plusieurs variables.
Tout comme les coordonnées parallèles, chaque point de données a une valeur
tracés sur chaque ligne. En revanche, les segments de ligne connectent
points dans chaque variable, en soulignant la différence
en valeur. Peut être utilisé comme alternative au graphique en pente
pour montrer le changement entre deux périodes de temps pour plusieurs
groupes.
Comment choisir une visualisation de données – 16
Dans certains cas, vous pourriez être intéressé seulement par le classement entre
des groupes sans avoir besoin de voir les valeurs réelles.
Graphique à barres
Version modifiée d'un graphique linéaire où la position verticale
correspond à un rang plutôt qu'à une valeur. Ce changement permet
pour prendre en charge plus de catégories qu'un graphique linéaire standard.
Graphique à barres groupées
Normalement, les graphiques à barres groupées afficheront les barres à l'intérieur
chaque groupe dans un ordre cohérent. Cependant, ils peuvent
au lieu d'être trié par valeur au sein de chaque groupe pour souligner
classement, au prix de rendre plus difficile de trouver chacun
sous-catégorie.
Comment Choisir une Visualisation de Données - 17
Graphiques pour observer les relations
entre les variables
Une tâche qui se présente lors de l'exploration des données est de comprendre la relation
navire entre les caractéristiques des données. Les types de graphiques ci-dessous peuvent être utilisés pour tracer
deux variables ou plus l'une par rapport à l'autre pour observer des tendances et des modèles
entre eux.
Diagramme de dispersion
Type de graphique standard pour montrer les relations entre
deux variables numériques. La position de chaque point sur l'horizontale
Les axes horizontal et vertical indiquent la valeur associée.
variable.
Graphique à bulles
Diagramme de dispersion avec la taille des points dictée par une troisième valeur numérique
variable. Les nuages de points peuvent être étendus de d'autres manières : point
les formes peuvent encoder une variable catégorique, et la couleur peut être
utilisé pour indiquer soit des données catégorielles, soit des données numériques. Il est préférable
pour limiter un nuage de points à un maximum de trois variables
maintenir la compréhension.
Diagramme de dispersion connecté
Lorsqu'une troisième variable représente le temps, les points dans un nuage de points
le tracé peut être relié par des segments de ligne pour montrer le progrès
sion dans les valeurs au fil du temps.
Graphique à barres et lignes à double axe
Un graphique à barres partage un axe horizontal (typiquement le temps)
à travers deux types de graphiques : le graphique à barres et le graphique linéaire. Utile
pour quand les variables tracées avec chaque type de graphique sont
lié, mais sont sur des échelles numériques différentes.
Comment choisir une visualisation de données – 18
Graphique à barres groupées
Extension du graphique à barres (voir Comparaisons ou Distributions)
à deux variables catégorielles. Des clusters de barres sont associés
avec des niveaux d'une variable, tandis que la couleur ou la position dans chaque
le cluster indique les niveaux de la deuxième variable. La longueur
de chaque barre au croisement correspondant des niveaux
indique une valeur pour ce groupe, comme la fréquence des données ou un
synthèse d'une troisième variable numérique.
Carte de chaleur
Extension des diagrammes à barres et des histogrammes (voir Distribution
tions) à deux variables, chacune desquelles peut être catégorielle
ou numérique. Chaque axe représente des groupes ou des intervalles de valeurs
pour l'une des variables, formant une grille. Les couleurs des cellules indiquent
fréquence des données ou un résumé d'une troisième variable pour chaque
intersection des variables d'axe.
courbe de densité 2D
Extension des courbes de densité (voir Distributions) à deux
variables numériques. Les couleurs sont associées à des valeurs comme dans un
carte thermique, mais appliquée en douceur sur la zone tracée
plutôt que dans des bacs discrets. Quelque peu déroutant, cela
le graphique est parfois aussi connu sous le nom de carte thermique.
Dendrogramme
Type de graphique spécialisé pour montrer la similitude entre les données
points. Plus la branche reliant deux points de données est basse
plus ils sont similaires. Parfois tracé avec un
carte thermique accompagnante pour dépeindre les données sous-jacentes.
Comment choisir une visualisation de données – 19
Parfois, la forme d'une relation est celle d'un réseau de connexions. Un
un graphe mathématique composé de nœuds connectés par des arêtes est une forme de base,
mais d'autres types de graphiques existent pour montrer ce type de données.
Diagramme de réseau
Les points (nœuds ou sommets) représentent des entités individuelles.
Les lignes (arêtes) relient des entités avec une relation particulière.
navire. L'épaisseur de ligne peut être utilisée pour encoder la valeur. Sommet
les positions n'ont pas nécessairement de signification inhérente,
et peut simplement être placé juste pour rendre les connexions claires
que possible.
Carte de transit
Application pratique des diagrammes de réseau pour le train et
systèmes de métro. Fréquemment, ceux-ci prennent un niveau assez élevé de
abstraction, mettant l'accent sur les connexions entre les stations
plutôt que leurs véritables emplacements géographiques.
Diagramme de chordes
Comme un diagramme de réseau standard, mais les sommets sont ar-
rangés en cercle.
Diagramme arborescent
Un diagramme de réseau organisé pour montrer la hiérarchie.
relations. La direction de chaque arête correspond à un
relation entre les nœuds connectés, tels que par-
relations entre enfant et adulte ou entre senior et junior.
Comment choisir une visualisation de données - 20
Graphiques pour examiner les données géographiques
Parfois, les données incluent des informations géographiques comme la latitude et la longitude.
tude ou régions comme pays ou état. Alors que tracer ces données pourrait simplement
étendre une visualisation existante sur un fond de carte (comme ceux
dans le chapitre précédent pour décrire les relations), il y a quelques graphiques
types qui tiennent spécifiquement compte du domaine de mappage.
carte de dispersion
Nuage de points construit sur une carte géographique, utilisant geo-
coordonnées graphiques en tant que positions de points.
Carte bulle
Diagramme à bulles construit sur une carte géographique, où le point
la taille est un indicateur de valeur. Peut également être utilisé pour regrouper à-
regrouper des points dans une carte de dispersion s'ils sont trop denses.
histogramme 2D
Des cartes thermiques peuvent être construites sur des zones géographiques. Certains-
fois vus avec une grille en forme de hexagone plutôt que d'un
grille rectangulaire. Peut déformer la géographie sur ses bords.
Carte isopleth / carte de contour
Courbe de densité en 2D construite sur une carte géographique.
Carte de connexion
Informations et flux de réseau construits sur une géographie
carte ic.
Comment choisir une visualisation de données – 21
Choroplèthe
Semblable à une carte thermique, mais les couleurs sont attribuées à des facteurs géopolitiques
régions plutôt qu'une grille arbitraire. Les valeurs sont souvent dans
la forme de taux ou de ratios pour éviter la distorsion due à la population
densité d'ion.
Cartogramme
Régions géopolitiques dimensionnées par la valeur. Cela doit nécessairement re-
exige une distorsion des formes et de la topologie.
Comment choisir une visualisation de données – 22
Annexe A : Graphiques essentiels pour les données
analyse
Ce guide couvre des dizaines de types de graphiques, et il en existe encore beaucoup d'autres.
des cas d'utilisation plus spécialisés. Il peut parfois être décourageant de comprendre
quel graphique conviendra le mieux aux données en main.
.gepaneieplunenteiontcentvauisgepal,quephiagrduxhoicdeussseocprelcveardeiaPour
graphique présentant dix-huit types de graphiques courants pour l'analyse de données. La plupart
Les visualisations pour les tableaux de bord et les rapports seront bien servies par l'un de ceux-ci.
types de graphiques. N'hésitez pas à imprimer le graphique et à l'utiliser comme référence rapide.
ence pour chaque fois que vous avez besoin de visualiser vos données.
Lorsque vous utilisez le sélecteur de graphiques, n'oubliez pas de garder à l'esprit trois points :
1. Quel type d'analyse le graphique effectuera-t-il ?
2. Quels types de données ai-je - catégoriques ou numériques - et combien ?
quelles variables vais-je tracer ?
3. Après avoir créé le graphique, transmet-il des informations utiles ? Si ce n'est pas le cas, essayez
un type de graphique différent ou une autre manière d'encoder les variables. Vous pouvez
besoin d'un type de graphique peu commun ou avancé non trouvé dans le diagramme,
ou doit utiliser plus d'un graphique.
Comment choisir une visualisation de données – 23
Graphiques essentiels pour l'analyse des données
Nombre brut Partie-tout
Graphique à valeur unique Diagramme circulaire
Valeur singulière de Showaraw Répartition partie-tout par un
variable catégorique unique
Valeur unique avec indicateur Graphique à barres empilées
Comparaison d'une seule valeur Graphique à barres avec des informations supplémentaires
contre une valeur précédente répartition partie-tout
Graphique en bullet Graphique de zones empilées
Comparaison d'une seule valeur Graphique linéaire avec des éléments supplémentaires
contre une valeur de référence répartition partie-tout
Table
Relation
Afficher les valeurs brutes pour plusieurs
points de données sur plusieurs variables Nuage de points
Relation entre
deux variables numériques
Évolution au fil du temps
Graphique linéaire Graphique en bulles
Changement au fil du temps pour un numérique Relation entre
variable ou comparer 1-5 groupes trois variables numériques
Sparkline Diagramme à barres groupées
Graphiques en ligne miniatures pour Comparaison ou distribution par
comparer plusieurs groupes deux variables catégorielles
Carte thermique
Distribution
Distribution par deux variables binées
Graphique à barres
(catégorique ou numérique)
Comparaison ou distribution par un
variable catégorique unique
Géospatial
Histogramme Carte à bulles
Distribution par un histogramme Graphique à bulles construit sur le dessus d'un
variable numérique unique carte géographique
Diagramme en boîte Choroplèthe
Comparer les résumés de distribution Comparaison entre
à travers une variable acatégorique régions géopolitiques par couleur
Annexe B : Graphiques à utiliser
judicieusement
Il y a quelques types de graphiques exclus du guide qui probablement
ne seraient pas considérés comme trop rares ou spécialisés. Les types de graphiques comme ceux-ci
dans cette section ont été exclus car ils sont moins efficaces que d'autres,
types de graphiques plus courants, ou ont des défauts qui les rendent plus difficiles
pour comprendre. Utilisez ces graphiques uniquement lorsque vous avez un cas unique ou spécifique
point qui bénéficierait d'une représentation alternative.
Pictogramme / Isotype
Utilisé pour comparer des valeurs entre des groupes et d'autres endroits
un graphique à barres pourrait être utilisé. Chaque icône représente un spécifié
quantité; les valeurs sont généralement arrondies à l'entier le plus proche
nombre d'icônes. Ainsi, cela perd un peu de précision par rapport
au graphique à barres plus courant.
Graphique à barres circulaires / radiales
Un graphique à barres, mais avec des barres tracées en arcs concentriques.
Cependant, cela déforme la valeur de chaque groupe, car ce n'est pas
claire si les valeurs sont indiquées par des angles de barre ou des arcs
Il est préférable de se en tenir à un graphique à barres standard.
Radar / graphique en araignée
Utilisé pour comparer des valeurs entre des points de données sur plusieurs
attributs. Chaque attribut est une branche, avec la valeur indiquée
par distance du centre. Un polygone est tracé pour chacun
point de données. Cependant, les gens perçoivent souvent la valeur en fonction de
aire du polygone, qui dépend de l'ordre des attributs. Cela
il est généralement préférable d'utiliser un graphique de coordonnées parallèles ou multi-
graphique à barres groupées multiples pour éviter cette distorsion.
Comment choisir une visualisation de données - 25
Annexe C : Moyens supplémentaires de visualiser
données
Il existe de nombreuses techniques de graphiques qui vont au-delà du simple choix du bon
type de graphique et encodages de données. Voici quelques techniques courantes qui
peut rendre vos données plus faciles à lire et à interpréter.
Orientation horizontale vs. verticale
Certains types de graphiques pour effectuer des comparaisons, comme le
Un graphique à barres ou un diagramme en boîte peut être tracé verticalement ou horizontalement.
tally. L'orientation horizontale peut être utile lorsque le
les groupes ont de longs noms.
Multiples petits / facettage
Plutôt que de tracer plusieurs groupes ou catégories sur un
axe unique, créez simplement un graphique pour chaque groupe. Cela peut
rendre plus facile la distinction entre les groupes, en particulier
quand il y en a beaucoup (par exemple, graphique en ligne contre sparkline).
Vous souhaiterez peut-être trier les facettes par une caractéristique de données, comme
taille globale.
Compositions de graphiques / tableaux de bord
Des collections de graphiques, de statistiques et de tableaux sont utilisées pour
transmettre rapidement des informations clés aux utilisateurs d'une organisation
Regrouper des éléments connexes et les organiser
les plus importants en haut et les moins importants
en bas peut aider les spectateurs à tirer des insights des données.
Comment choisir une visualisation de données – 26
À propos de Chartio
Fondée en 2010, Chartio est une solution d'exploration de données basée sur le cloud pour tous.
Avec une interface révolutionnaire de glisser-déposer et des centaines de données
les intégrations de sources, Chartio permet à quiconque dans une entreprise de facilement
connecter, transformer et visualiser les métriques qui comptent le plus pour eux –
aucun codage requis. Avec Chartio, les utilisateurs peuvent créer des interactions puissantes
tableaux de bord, collaborer avec des coéquipiers et partager des insights avec juste un
quelques clics. Et Chartio est accompagné d'un support client expert et d'une assistance étendue
documentation, s'assurant que tout le monde dans votre entreprise a les outils
ils doivent travailler avec succès avec des données et être informés.
Apprenez à comprendre rapidement les données de votre entreprise sur atchartio.com, et
en savoir plus sur comment travailler avec des données sur chartio.com/apprendre/
Comment choisir une visualisation des données - 27