0% ont trouvé ce document utile (0 vote)
20 vues27 pages

Comment Choisir La Bonne Visualisation de Données

Le document aborde différents types de visualisations de données et comment choisir la bonne en fonction du type de données et de l'objectif. Il décrit les rôles courants de la visualisation des données, tels que montrer les changements au fil du temps, la composition partie-tout, les flux/processus, les distributions, les comparaisons de groupes, les relations et les données géographiques. Pour chaque rôle, il fournit des exemples de types de graphiques basiques, peu courants et avancés ainsi que de brèves descriptions. Il comprend également des annexes sur les graphiques essentiels, ceux à utiliser avec parcimonie, et des techniques de visualisation supplémentaires.

Transféré par

ScribdTranslations
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
20 vues27 pages

Comment Choisir La Bonne Visualisation de Données

Le document aborde différents types de visualisations de données et comment choisir la bonne en fonction du type de données et de l'objectif. Il décrit les rôles courants de la visualisation des données, tels que montrer les changements au fil du temps, la composition partie-tout, les flux/processus, les distributions, les comparaisons de groupes, les relations et les données géographiques. Pour chaque rôle, il fournit des exemples de types de graphiques basiques, peu courants et avancés ainsi que de brèves descriptions. Il comprend également des annexes sur les graphiques essentiels, ceux à utiliser avec parcimonie, et des techniques de visualisation supplémentaires.

Transféré par

ScribdTranslations
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Comment choisir

les Bonnes Données


Visualisation
Comment choisir la bonne visualisation des données

par Mike Yi
Introduction
Les visualisations de données sont un élément vital d'une analyse de données, car elles ont le
capacité à résumer efficacement de grandes quantités de données à travers un graphique
format. Il existe de nombreux types de graphiques disponibles, chacun ayant ses propres forces

et cas d'utilisation. L'une des parties les plus délicates du processus d'analyse est le choix

la bonne façon de représenter vos données en utilisant l'une de ces visualisations.

Lorsque vous décidez d'un type de graphique, pensez d'abord au type de rôle que le graphique

servira. Les rôles communs pour la visualisation des données incluent :

• montrer le changement au fil du temps

• montrant une composition partie-tout


• décrire les flux et les processus
• regarder comment les données sont réparties

• comparer les valeurs entre les groupes

• observer les relations entre les variables


• examen des données géographiques

Ensuite, considérez les types de données que vous souhaitez tracer. Le type de graphique que vous

l'utilisation dépendra de si les données sont catégorielles, numériques ou une combinaison de celles-ci

Certaines visualisations peuvent également être utilisées à des fins multiples.


selon ces facteurs. Ce livre est organisé selon cette approche
en tête, avec un chapitre pour chaque rôle de visualisation, chacun avec plusieurs
types de graphiques pour couvrir les types de données courants et les sous-tâches.

Veuillez noter que ce document ne doit servir que de directive générale : il est pos-
Il est possible que sortir des modes standard vous aide à acquérir des additions.
informations. Expérimentez non seulement avec différents types de graphiques, mais aussi avec comment le

Les variables sont encodées dans chaque graphique. Il est également bon de garder à l'esprit que vous

ne se limitent pas à montrer tout dans un seul graphique. Il est souvent préférable de
gardez chaque intrigue individuelle aussi simple et claire que possible, et utilisez plutôt
des graphiques multiples pour faire des comparaisons, montrer des tendances et démontrer des relations

relations entre plusieurs variables.

Comment choisir une visualisation de données – 3


Comment ce livre est organisé

Ce livre est divisé en chapitres, un pour chacune des principales catégories pour
utilisant une visualisation de données. Chaque chapitre est précédé d'une courte introduction,

suivi d'une liste de types de graphiques appartenant à cette catégorie. Chaque type de graphique est

accompagné d'une courte description et d'une ou plusieurs icônes. Ci-dessous se trouve une clé

pour décoder ces symboles :

BASIC : Les types de graphiques avec cette icône représentent des graphiques typiques ou standard.

types. Lorsque vous devez créer une visualisation de données, essayez de voir si l'une
de ces types de graphiques fonctionne d'abord, avant de décider d'un type peu commun ou

type avancé.

PEU COMMUN : Les types de graphiques avec cette icône sont légèrement plus inhabituels
que les types de graphiques les plus courants. Les cas d'utilisation pour ces graphiques sont

plus spécialisé que d'autres types de graphiques dans cette même catégorie ou plus

souvent vu dans d'autres rôles.

AVANCÉ : Les types de graphiques avec cette icône sont encore plus spécialisés dans
leurs rôles. Assurez-vous que le type de graphique est le meilleur pour votre utilisation

cas avant de l'implémenter. Parfois, ces types de graphiques ne seront pas


intégré dans des logiciels ou bibliothèques de visualisation, et un travail supplémentaire sera

nécessite d'être fait pour assembler ces types de graphiques.

Icônes de connexion : Certains types de graphiques apparaissent dans plusieurs

chapitres du livre, ayant soit plusieurs cas d'utilisation


ou des cas d'utilisation qui s'étendent sur plusieurs rôles. Dans ces cas,

vous verrez un rectangle arrondi avec son entrée notant le


d'autres chapitres dans lesquels ce type de graphique apparaît directement.

Les types de graphiques vus dans les cases représentent les sous-thèmes de chaque visualisation

rôle; ceux-ci auront des cas d'utilisation plus spécialisés et avancés.

Comment choisir une visualisation de données - 4


Table des matières

Introduction..............................................................................................................................3

Comment ce livre est organisé ...............................................................................................4

Chiffres bruts : montrant simplement les données............................................................................6

Graphiques montrant l'évolution dans le temps...........................................................................7

Graphiques pour montrer la composition part-to-whole ......................................................9

Tableaux pour représenter les flux et les processus..................................................................11

Graphiques pour examiner comment les données sont distribuées..........................................................12

Graphiques pour comparer des valeurs entre des groupes .......................................................14

Graphiques pour observer les relations entre les variables.......................................18

Graphiques pour examiner des données géographiques.....................................................................21

Annexe A : Graphiques essentiels pour l'analyse des données.....................................................23

Annexe B : Graphiques qui doivent être utilisés judicieusement...........................................25

Annexe C : Autres manières de visualiser les données ..................................................... 26

À propos de Chartio.......................................................................................................................27

Comment choisir une visualisation des données - 5


Chiffres bruts : simplement montrer les données

Il est important de garder à l'esprit que vous n'avez pas toujours besoin d'utiliser un graphique pour

dépeindre vos données. Parfois, il suffit de montrer les données sous forme de texte pour être le plus efficace

façon active de transmettre des informations.

Graphique à valeur unique

Quand vous n'avez qu'un seul nombre, il vaut mieux simplement le rapporter.

tel quel. Tracer graphiquement une seule valeur (comme avec un)
barre ou point) n'est généralement pas significatif s'il n'y a pas d'autres

valeurs à comparer.

Valeur unique avec indicateur


Un indicateur compare la valeur unique à une seconde
nombre. Cela sert souvent à comparer la valeur d'un indicateur entre

la période actuelle et la période précédente.

Graphique à barres

Type de graphique comparant une seule valeur à un autre nombre,


souvent un point de référence plutôt qu'un autre point de données. Le
une valeur unique est représentée par la longueur d'une barre, tandis que la comparaison

les points sont montrés comme des zones ombrées ou une ligne perpendiculaire.

Table
Comparer des points de données (lignes) à travers plusieurs différents

attributs (colonnes). Généralement triés par un important ou


attributs proéminents pour améliorer l'utilité.

Comment choisir une visualisation des données – 6


Graphiques montrant l'évolution au fil du temps

L'une des applications les plus courantes de la visualisation des données est de voir le
changement de la valeur numérique d'une caractéristique ou métrique au fil du temps. Ces graphiques

généralement, le temps est représenté sur l'axe horizontal, se déplaçant de gauche à droite, avec

les valeurs de la variable d'intérêt sur l'axe vertical.

Graphique linéaire

Type de graphique le plus courant pour montrer le changement au fil du temps. Un

un point est tracé pour chaque période de temps de gauche à droite; chaque
La position verticale du point indique la valeur de la caractéristique. Points
sont connectés par des segments de ligne pour souligner la progression
à travers le temps.

Sparkline
Un graphique linéaire miniature avec peu ou pas d'étiquetage, conçu pour
être placé à côté de texte ou dans des tableaux. Fournit un niveau élevé

aperçu sans attirer trop l'attention. Peut aussi


être vu sous forme de sparkbar, ou de graphique à barres miniature (voir

ci-dessous).

Diagramme de dispersion connecté

Montre l'évolution dans le temps de deux variables numériques (voir


graphique de dispersion dans les relations). Les segments de ligne sont toujours connectés

points à travers le temps, mais ils peuvent ne pas aller de manière cohérente de

de gauche à droite comme dans un graphique linéaire.

Diagramme à barres

Chaque période est associée à une barre ; la valeur de chaque barre


est représenté à sa hauteur au-dessus (ou en dessous) d'une ligne de base zéro.

Fonctionne mieux quand il n'y a pas trop de périodes de temps à

montrer.

Comment choisir une visualisation de données - 7


Boîte à moustaches

Chaque période est associée à un diagramme en boîte et en moustaches;

chaque ensemble de boîte et de moustaches montre l'étendue du plus


valeurs de données communes. Meilleur lorsqu'il y a plusieurs enregistrements-

des éléments pour chaque période et une distribution des valeurs sont nécessaires

à être tracé.

Le suivi des changements au fil du temps est d'un grand intérêt dans le domaine financier. Un

Le tableau spécialisé développé pour ce domaine comprend les éléments suivants :

Graphique en chandeliers

On dirait un box plot, mais chaque boîte et moustaches encodent


des statistiques différentes. Les extrémités de la boîte indiquent l'ouverture et

les prix de clôture, tandis que la couleur indique la direction du changement.

Comment choisir une visualisation de données - 8


Graphiques pour montrer la composition partie-tout

Parfois, nous devons savoir non seulement un total, mais les composants qui
comprendre ce total. Pendant que d'autres graphiques comme un graphique à barres standard peuvent être

utilisé pour comparer les valeurs des composants, les graphiques suivants mettent

la décomposition partie-tout à l'avant-garde.

Diagramme circulaire

L'ensemble est représenté par un cercle rempli. Les parties sont proportionnelles.

des tranches circulaires de ce cercle, une pour chaque groupe catégorique.


Meilleur avec cinq tranches ou moins avec des proportions distinctes.

Graphique en anneau

Un graphique en secteurs avec un trou au centre. Cette zone centrale peut


être utilisé pour montrer une valeur numérique unique pertinente. Certains

fois utilisé comme une alternative esthétique à un prog standard


barre de progression (voir le graphique en barres empilées ci-dessous).

Diagramme en gaufre / graphique en grille

Des carrés disposés dans une grille (typiquement) de 10 x 10 ; chaque carré

représente un pourcent de l'ensemble. Les carrés sont colorés


basé sur la taille du groupe catégorique.

Diagramme à barres empilées

Un histogramme (voir Évolution au fil du temps ou Distributions) où

chaque barre a été divisée en plusieurs sous-barres pour montrer


une répartition partie-toute. Un seul barre empilée peut être
utilisé comme alternative au graphique en secteur ou en anneau ; les gens
tendent à porter des jugements plus précis sur la longueur que sur la surface

ou angle.

Comment choisir une visualisation de données – 9


Diagramme area empilé
Un graphique linéaire (voir l'évolution dans le temps) où les régions ombragées

sont ajoutés sous la ligne pour diviser le total en sous-groupes


valeurs.

Graphique de flux

Version modifiée du graphique en aires empilées où les aires sont


empilés autour d'un axe central. Met en évidence les changements relatifs

au lieu de valeurs exactes.

Graphique en cascade
Augmente un changement au fil du temps avec une décom- position partie-tout

La position. Les barres aux extrémités représentent des valeurs à deux points dans le temps,

et les longueurs des barres flottantes intermédiaires montrent le décom-

position du changement entre les points.

Certaines compositions partie-tout suivent une forme hiérarchique. Dans celles-ci


des cas, chaque partie peut être divisée en parties plus fines à des niveaux inférieurs. Voici un

quelques types de graphiques plus spécialisés pour visualiser ce type de données :

Diagramme mosaïque / Diagramme Marimekko

Peut être considéré comme un graphique à barres empilées divisé sur les deux axes. Un

la boîte est divisée sur un axe en fonction d'une variable catégorique,


ensuite chaque sous-boîte est divisée dans l'autre axe en fonction d'un

deuxième variable catégorique.

Carte de chaleur
Peut être considéré comme un graphique Marimekko plus généralisé.
Les sous-boîtes n'ont pas besoin d'avoir une direction de coupe cohérente.

à un niveau de hiérarchie particulier, et il peut y en avoir plus d'un

deux niveaux de hiérarchie.

Comment choisir une visualisation de données - 10


Graphiques pour représenter les flux et les processus

Une utilisation plus spécialisée des graphiques liés à la décomposition d'un tout est

le suivi du flux des montants à travers un processus à plusieurs étapes. À leur


les plus avancés, ces graphiques peuvent montrer efficacement comment plusieurs entrées sont

transformé en plusieurs sorties.

Graphique en entonnoir

Vu dans des contextes d'affaires, montrant comment les gens rencontrent

obtenir un produit et finalement devenir utilisateurs ou clients.


Une barre est tracée pour chaque étape, dont les longueurs reflètent
nombre d'utilisateurs. Les régions de connexion soulignent la connexion

les actions en étapes et donner la forme qui porte le nom du type de graphique.

Graphique en ensembles parallèles

Multiples divisions partie-tout sur différentes dimensions


sont représentés sous forme de barres empilées parallèles. Régions connectantes

montrez comment les différents sous-groupes se rapportent les uns aux autres

entre les dimensions.

Diagramme de Sankey

La largeur de la région colorée montre le volume relatif


à chaque étape d'un processus. Permet plusieurs sources de
entrées et sorties à visualiser.

Diagramme de Gantt

Utilisé pour la planification de projets, les décomposant en indi-


tâches individuelles. Chaque tâche est associée à une barre, fournissant un
chronologie pour quand chaque tâche devrait commencer et se terminer.

Comment choisir une visualisation de données – 11


Graphiques pour voir comment les données sont distribuées

Une utilisation importante des visualisations est de montrer comment les valeurs des points de données

sont distribués. Cela est particulièrement utile lors du processus d'exploration,


en essayant de construire une compréhension des propriétés des caractéristiques des données.

Remarque : Graphiques pour visualiser les distributions de données à travers deux ou plusieurs variables

sont couverts dans le chapitre sur les Relations.

Diagramme à barres

Utilisé lorsque une variable est qualitative ou prend des valeurs discrètes.

La hauteur de chaque barre indique la quantité de chaque catégorie.


groupe catégorique.

Histogramme
Similaire à un graphique à barres, mais utilisé lorsqu'une variable prend

valeurs numériques continues. L'intervalle numérique de la variable


est divisé en bacs pour l'agrégation des comptes. Des barres sont tracées

se toucher pour mettre en évidence la continuité de la variable


nature continue.

Courbe de densité
Une alternative à l'histogramme lorsque une variable prend nu-
Les valeurs méric. Chaque point de données contribue une petite quantité

de la zone locale ; les zones sont additionnées sur tous les points pour former

la courbe complète.

Boîte à moustaches

Un diagramme en boîte et moustaches montre l'étendue des valeurs les plus courantes

Les extrémités de la boîte délimitent les 50 % centraux de


les données. Plus souvent utilisé pour comparer des distributions être

entre les groupes plutôt qu'en tant que résumé global.

Comment choisir une visualisation de données - 12


Diagramme de valeurs par lettres

Étend le marquage des quartiles du box plot avec des éléments supplémentaires
des cases qui indiquent des huitièmes, des seizièmes et des quantités plus petites

carreaux. Meilleur quand il y a beaucoup de données disponibles pour faire

estimations stables.

Diagramme de violon

Combine une courbe de densité tracée sur une ligne centrale avec
un diagramme en boîte en tant que résumé statistique. Plus souvent utilisé pour

comparer les distributions entre les groupes plutôt que comme un

résumé global.

Le graphique en violon inclut généralement un graphique en boîte pour fournir des détails statistiques.

la courbe de densité. Le diagramme en boîte interne peut parfois être exclu, ou


un autre type de graphique de distribution linéaire peut également être utilisé à la place. Tout le
ci-dessous sont les meilleurs avec peu ou un nombre modéré de points de données ; avec beaucoup

Pour les points de données, un résumé comme le graphique en boîte est le meilleur.

Diagramme de tapis

Tous les points de données sont représentés sous forme de traits de repère sur une ligne droite.

avec une valeur correspondant précisément à la position.

Diagramme en bandes

Comme un graphique de moquette, mais avec des points au lieu de marques de graduation. Certains-

temps tracés avec des points légèrement décalés vers le haut ou vers le bas pour

réduire le chevauchement.

Nuage de points

Comme un diagramme à bande, mais un décalage délibéré est effectué pour


prévenir le chevauchement. Un léger ajustement horizontal peut être nécessaire

afin de garder l'essaim de points compact.

Comment choisir une visualisation de données - 13


Graphiques pour comparer des valeurs

entre les groupes

Une application très courante pour la visualisation des données est de comparer des valeurs

entre des groupes distincts. Ceci est fréquemment combiné avec d'autres rôles pour
visualisation des données, comme montrer le changement au fil du temps, ou examiner comment les données sont

distribué. En conséquence, il s'agit de la plus grande catégorie de types de graphiques.

Diagramme à barres

La manière la plus basique de comparer des valeurs numériques entre

groupes ou catégories. Chaque groupe se voit attribuer une barre ; chaque

La valeur de la barre est représentée par sa hauteur au-dessus (ou en dessous) d'un

base zéro.

Diagramme à barres groupées

Étend un graphique à barres pour comparer des données à travers deux catégories

variables. Chaque barre correspond à une intersection de vari-


niveaux de tableau : les catégories pour une variable sont indiquées par
positions de clusters de barres, tandis que la deuxième variable est indiquée

par couleur de barre ou position au sein de chaque cluster.

Graphique en bâtonnets

Remplace les barres d'un histogramme par des lignes et des points. Utile

pour quand il y a beaucoup de groupes ou de catégories à tracer.

Diagramme à points

Remplace les barres d'un graphique à barres par des points. Puisque la valeur

est indiqué par la position plutôt que par la longueur, le diagramme à points peut

soyez bon quand une ligne de base à zéro n'est pas utile.

Comment choisir une visualisation de données - 14


Graphique linéaire

Chaque ligne dans un graphique linéaire montre comment les valeurs (position verticale

la variation au fil du temps (horizontale). Une ligne est tracée


pour chaque groupe à comparer. Meilleur quand il y a cinq ou
moins de groupes à tracer.

Sparkline
Des graphiques linéaires plus petits, généralement avec peu ou pas d'étiquetage.

Conçu pour montrer un aperçu de haut niveau en ligne avec le texte ou


tableaux, mais aussi utile lorsqu'il y a plusieurs groupes à tracer.

Crête
Une série de graphiques linéaires ou de courbes de densité (voir Distributions)

avec des axes décalés partiellement utilisés pour comparer des distributions

entre les groupes. Meilleur lorsqu'il existe des motifs distincts


à travers les groupes.

Diagramme en boîte

Compare un résumé statistique des valeurs numériques.


entre les groupes. Un ensemble de boîtes et de moustaches décrivant le

la plage des valeurs de données les plus courantes (voir Distributions) est

assigné à chaque groupe ou catégorie.

Graphique à valeurs de lettres

Utilisé de manière similaire au box plot, mais une valeur lettre


plot (seeDistributions) est assigné à chaque groupe à la place.
Mieux utilisé lorsqu'il y a beaucoup de données dans chaque groupe afin que

Les estimations statistiques sont stables.

Graphique en violon

Compare les distributions entre les groupes. Un assemblage de violon


de la courbe de densité et du diagramme en boîte (voir Distributions) est assigné

à chaque groupe ou catégorie.

Comment choisir une visualisation de données - 15


Une sous-catégorie des graphiques de comparaison provient de la comparaison de
valeurs entre les groupes pour plusieurs attributs.

Graphique en pente

Type spécialisé de graphique linéaire. Deux lignes parallèles indiquent

temps différents, avec la position verticale indiquant la valeur. Un


Un segment de ligne est tracé entre les deux temps pour chaque donnée
point. Utile lorsque plusieurs points de données sont présents; ligne
Les pentes fournissent un indicateur rapide de la direction du changement pour

chacun.

Diagramme de coordonnées parallèles

Extension du graphique de pente pour des dimensions multiples. Chaque


la ligne verticale indique maintenant une variable différente ; chacune peut

a sa propre échelle. Utile pour observer les motifs et les relations


rapports dans les données. Quand il n'y a que deux variables, un
un nuage de points (voirRelations) est souvent plus facile à lire.

Graphique en haltères

Utilisé pour comparer deux points de données à travers plusieurs variables.

Tout comme les coordonnées parallèles, chaque point de données a une valeur

tracés sur chaque ligne. En revanche, les segments de ligne connectent

points dans chaque variable, en soulignant la différence


en valeur. Peut être utilisé comme alternative au graphique en pente
pour montrer le changement entre deux périodes de temps pour plusieurs

groupes.

Comment choisir une visualisation de données – 16


Dans certains cas, vous pourriez être intéressé seulement par le classement entre
des groupes sans avoir besoin de voir les valeurs réelles.

Graphique à barres

Version modifiée d'un graphique linéaire où la position verticale


correspond à un rang plutôt qu'à une valeur. Ce changement permet
pour prendre en charge plus de catégories qu'un graphique linéaire standard.

Graphique à barres groupées

Normalement, les graphiques à barres groupées afficheront les barres à l'intérieur

chaque groupe dans un ordre cohérent. Cependant, ils peuvent


au lieu d'être trié par valeur au sein de chaque groupe pour souligner

classement, au prix de rendre plus difficile de trouver chacun


sous-catégorie.

Comment Choisir une Visualisation de Données - 17


Graphiques pour observer les relations
entre les variables
Une tâche qui se présente lors de l'exploration des données est de comprendre la relation
navire entre les caractéristiques des données. Les types de graphiques ci-dessous peuvent être utilisés pour tracer

deux variables ou plus l'une par rapport à l'autre pour observer des tendances et des modèles

entre eux.

Diagramme de dispersion

Type de graphique standard pour montrer les relations entre


deux variables numériques. La position de chaque point sur l'horizontale

Les axes horizontal et vertical indiquent la valeur associée.


variable.

Graphique à bulles

Diagramme de dispersion avec la taille des points dictée par une troisième valeur numérique

variable. Les nuages de points peuvent être étendus de d'autres manières : point

les formes peuvent encoder une variable catégorique, et la couleur peut être
utilisé pour indiquer soit des données catégorielles, soit des données numériques. Il est préférable

pour limiter un nuage de points à un maximum de trois variables


maintenir la compréhension.

Diagramme de dispersion connecté

Lorsqu'une troisième variable représente le temps, les points dans un nuage de points

le tracé peut être relié par des segments de ligne pour montrer le progrès

sion dans les valeurs au fil du temps.

Graphique à barres et lignes à double axe

Un graphique à barres partage un axe horizontal (typiquement le temps)


à travers deux types de graphiques : le graphique à barres et le graphique linéaire. Utile

pour quand les variables tracées avec chaque type de graphique sont
lié, mais sont sur des échelles numériques différentes.

Comment choisir une visualisation de données – 18


Graphique à barres groupées

Extension du graphique à barres (voir Comparaisons ou Distributions)

à deux variables catégorielles. Des clusters de barres sont associés


avec des niveaux d'une variable, tandis que la couleur ou la position dans chaque

le cluster indique les niveaux de la deuxième variable. La longueur


de chaque barre au croisement correspondant des niveaux
indique une valeur pour ce groupe, comme la fréquence des données ou un
synthèse d'une troisième variable numérique.

Carte de chaleur
Extension des diagrammes à barres et des histogrammes (voir Distribution

tions) à deux variables, chacune desquelles peut être catégorielle


ou numérique. Chaque axe représente des groupes ou des intervalles de valeurs

pour l'une des variables, formant une grille. Les couleurs des cellules indiquent

fréquence des données ou un résumé d'une troisième variable pour chaque

intersection des variables d'axe.

courbe de densité 2D
Extension des courbes de densité (voir Distributions) à deux
variables numériques. Les couleurs sont associées à des valeurs comme dans un

carte thermique, mais appliquée en douceur sur la zone tracée


plutôt que dans des bacs discrets. Quelque peu déroutant, cela
le graphique est parfois aussi connu sous le nom de carte thermique.

Dendrogramme
Type de graphique spécialisé pour montrer la similitude entre les données

points. Plus la branche reliant deux points de données est basse


plus ils sont similaires. Parfois tracé avec un
carte thermique accompagnante pour dépeindre les données sous-jacentes.

Comment choisir une visualisation de données – 19


Parfois, la forme d'une relation est celle d'un réseau de connexions. Un
un graphe mathématique composé de nœuds connectés par des arêtes est une forme de base,
mais d'autres types de graphiques existent pour montrer ce type de données.

Diagramme de réseau
Les points (nœuds ou sommets) représentent des entités individuelles.
Les lignes (arêtes) relient des entités avec une relation particulière.
navire. L'épaisseur de ligne peut être utilisée pour encoder la valeur. Sommet

les positions n'ont pas nécessairement de signification inhérente,


et peut simplement être placé juste pour rendre les connexions claires

que possible.

Carte de transit

Application pratique des diagrammes de réseau pour le train et


systèmes de métro. Fréquemment, ceux-ci prennent un niveau assez élevé de

abstraction, mettant l'accent sur les connexions entre les stations

plutôt que leurs véritables emplacements géographiques.

Diagramme de chordes

Comme un diagramme de réseau standard, mais les sommets sont ar-

rangés en cercle.

Diagramme arborescent

Un diagramme de réseau organisé pour montrer la hiérarchie.


relations. La direction de chaque arête correspond à un
relation entre les nœuds connectés, tels que par-
relations entre enfant et adulte ou entre senior et junior.

Comment choisir une visualisation de données - 20


Graphiques pour examiner les données géographiques

Parfois, les données incluent des informations géographiques comme la latitude et la longitude.

tude ou régions comme pays ou état. Alors que tracer ces données pourrait simplement
étendre une visualisation existante sur un fond de carte (comme ceux
dans le chapitre précédent pour décrire les relations), il y a quelques graphiques
types qui tiennent spécifiquement compte du domaine de mappage.

carte de dispersion

Nuage de points construit sur une carte géographique, utilisant geo-


coordonnées graphiques en tant que positions de points.

Carte bulle
Diagramme à bulles construit sur une carte géographique, où le point
la taille est un indicateur de valeur. Peut également être utilisé pour regrouper à-

regrouper des points dans une carte de dispersion s'ils sont trop denses.

histogramme 2D
Des cartes thermiques peuvent être construites sur des zones géographiques. Certains-

fois vus avec une grille en forme de hexagone plutôt que d'un
grille rectangulaire. Peut déformer la géographie sur ses bords.

Carte isopleth / carte de contour

Courbe de densité en 2D construite sur une carte géographique.

Carte de connexion
Informations et flux de réseau construits sur une géographie
carte ic.

Comment choisir une visualisation de données – 21


Choroplèthe
Semblable à une carte thermique, mais les couleurs sont attribuées à des facteurs géopolitiques

régions plutôt qu'une grille arbitraire. Les valeurs sont souvent dans
la forme de taux ou de ratios pour éviter la distorsion due à la population

densité d'ion.

Cartogramme
Régions géopolitiques dimensionnées par la valeur. Cela doit nécessairement re-

exige une distorsion des formes et de la topologie.

Comment choisir une visualisation de données – 22


Annexe A : Graphiques essentiels pour les données

analyse
Ce guide couvre des dizaines de types de graphiques, et il en existe encore beaucoup d'autres.

des cas d'utilisation plus spécialisés. Il peut parfois être décourageant de comprendre

quel graphique conviendra le mieux aux données en main.

.gepaneieplunenteiontcentvauisgepal,quephiagrduxhoicdeussseocprelcveardeiaPour
graphique présentant dix-huit types de graphiques courants pour l'analyse de données. La plupart

Les visualisations pour les tableaux de bord et les rapports seront bien servies par l'un de ceux-ci.

types de graphiques. N'hésitez pas à imprimer le graphique et à l'utiliser comme référence rapide.

ence pour chaque fois que vous avez besoin de visualiser vos données.

Lorsque vous utilisez le sélecteur de graphiques, n'oubliez pas de garder à l'esprit trois points :

1. Quel type d'analyse le graphique effectuera-t-il ?


2. Quels types de données ai-je - catégoriques ou numériques - et combien ?
quelles variables vais-je tracer ?
3. Après avoir créé le graphique, transmet-il des informations utiles ? Si ce n'est pas le cas, essayez

un type de graphique différent ou une autre manière d'encoder les variables. Vous pouvez

besoin d'un type de graphique peu commun ou avancé non trouvé dans le diagramme,

ou doit utiliser plus d'un graphique.

Comment choisir une visualisation de données – 23


Graphiques essentiels pour l'analyse des données

Nombre brut Partie-tout


Graphique à valeur unique Diagramme circulaire

Valeur singulière de Showaraw Répartition partie-tout par un


variable catégorique unique

Valeur unique avec indicateur Graphique à barres empilées

Comparaison d'une seule valeur Graphique à barres avec des informations supplémentaires
contre une valeur précédente répartition partie-tout

Graphique en bullet Graphique de zones empilées

Comparaison d'une seule valeur Graphique linéaire avec des éléments supplémentaires
contre une valeur de référence répartition partie-tout

Table
Relation
Afficher les valeurs brutes pour plusieurs
points de données sur plusieurs variables Nuage de points

Relation entre
deux variables numériques
Évolution au fil du temps

Graphique linéaire Graphique en bulles

Changement au fil du temps pour un numérique Relation entre


variable ou comparer 1-5 groupes trois variables numériques

Sparkline Diagramme à barres groupées

Graphiques en ligne miniatures pour Comparaison ou distribution par


comparer plusieurs groupes deux variables catégorielles

Carte thermique
Distribution
Distribution par deux variables binées
Graphique à barres
(catégorique ou numérique)

Comparaison ou distribution par un


variable catégorique unique
Géospatial
Histogramme Carte à bulles

Distribution par un histogramme Graphique à bulles construit sur le dessus d'un

variable numérique unique carte géographique

Diagramme en boîte Choroplèthe


Comparer les résumés de distribution Comparaison entre
à travers une variable acatégorique régions géopolitiques par couleur
Annexe B : Graphiques à utiliser
judicieusement

Il y a quelques types de graphiques exclus du guide qui probablement


ne seraient pas considérés comme trop rares ou spécialisés. Les types de graphiques comme ceux-ci

dans cette section ont été exclus car ils sont moins efficaces que d'autres,
types de graphiques plus courants, ou ont des défauts qui les rendent plus difficiles

pour comprendre. Utilisez ces graphiques uniquement lorsque vous avez un cas unique ou spécifique

point qui bénéficierait d'une représentation alternative.

Pictogramme / Isotype
Utilisé pour comparer des valeurs entre des groupes et d'autres endroits

un graphique à barres pourrait être utilisé. Chaque icône représente un spécifié

quantité; les valeurs sont généralement arrondies à l'entier le plus proche

nombre d'icônes. Ainsi, cela perd un peu de précision par rapport


au graphique à barres plus courant.

Graphique à barres circulaires / radiales

Un graphique à barres, mais avec des barres tracées en arcs concentriques.

Cependant, cela déforme la valeur de chaque groupe, car ce n'est pas


claire si les valeurs sont indiquées par des angles de barre ou des arcs

Il est préférable de se en tenir à un graphique à barres standard.

Radar / graphique en araignée

Utilisé pour comparer des valeurs entre des points de données sur plusieurs

attributs. Chaque attribut est une branche, avec la valeur indiquée


par distance du centre. Un polygone est tracé pour chacun
point de données. Cependant, les gens perçoivent souvent la valeur en fonction de

aire du polygone, qui dépend de l'ordre des attributs. Cela


il est généralement préférable d'utiliser un graphique de coordonnées parallèles ou multi-

graphique à barres groupées multiples pour éviter cette distorsion.

Comment choisir une visualisation de données - 25


Annexe C : Moyens supplémentaires de visualiser
données
Il existe de nombreuses techniques de graphiques qui vont au-delà du simple choix du bon
type de graphique et encodages de données. Voici quelques techniques courantes qui
peut rendre vos données plus faciles à lire et à interpréter.

Orientation horizontale vs. verticale


Certains types de graphiques pour effectuer des comparaisons, comme le
Un graphique à barres ou un diagramme en boîte peut être tracé verticalement ou horizontalement.

tally. L'orientation horizontale peut être utile lorsque le


les groupes ont de longs noms.

Multiples petits / facettage


Plutôt que de tracer plusieurs groupes ou catégories sur un
axe unique, créez simplement un graphique pour chaque groupe. Cela peut
rendre plus facile la distinction entre les groupes, en particulier
quand il y en a beaucoup (par exemple, graphique en ligne contre sparkline).

Vous souhaiterez peut-être trier les facettes par une caractéristique de données, comme
taille globale.

Compositions de graphiques / tableaux de bord

Des collections de graphiques, de statistiques et de tableaux sont utilisées pour

transmettre rapidement des informations clés aux utilisateurs d'une organisation

Regrouper des éléments connexes et les organiser


les plus importants en haut et les moins importants
en bas peut aider les spectateurs à tirer des insights des données.

Comment choisir une visualisation de données – 26


À propos de Chartio

Fondée en 2010, Chartio est une solution d'exploration de données basée sur le cloud pour tous.

Avec une interface révolutionnaire de glisser-déposer et des centaines de données


les intégrations de sources, Chartio permet à quiconque dans une entreprise de facilement

connecter, transformer et visualiser les métriques qui comptent le plus pour eux –
aucun codage requis. Avec Chartio, les utilisateurs peuvent créer des interactions puissantes

tableaux de bord, collaborer avec des coéquipiers et partager des insights avec juste un
quelques clics. Et Chartio est accompagné d'un support client expert et d'une assistance étendue

documentation, s'assurant que tout le monde dans votre entreprise a les outils
ils doivent travailler avec succès avec des données et être informés.

Apprenez à comprendre rapidement les données de votre entreprise sur atchartio.com, et


en savoir plus sur comment travailler avec des données sur chartio.com/apprendre/

Comment choisir une visualisation des données - 27

Vous aimerez peut-être aussi