Université de Nouakchott
Institut Universitaire Professionnel (IUP)
Visualisation des données
Filière : Sciences des Données (S3)
Dr. Moustapha Mohamed Saleck
E-mail : [email protected]
1
AU : 2024/2025
Qu’est ce que la visualisation des données ?
La visualisation des données est la représentation graphique des informations et des données. En
utilisant des éléments visuels tels que des diagrammes, des graphiques, des cartes et des réseaux,
les outils de visualisation des données offrent un moyen accessible de voir et de comprendre les
tendances, les valeurs aberrantes et les schémas dans les données.
2
Qu’est ce que la visualisation des données ?
▪ La Data viz aide à comprendre les informations beaucoup plus rapidement et à reconnaître des
schémas qui seraient autrement difficiles à voir avec des données textuelles.
▪ Dans le monde du Big Data, les outils et technologies de visualisation des données sont essentiels
pour analyser des quantités massives d’informations et prendre des décisions fondées sur les
données.
▪ Une visualisation de données efficace doit être informative, efficiente, attrayante et, dans
certains cas, interactive et prédictive.
3
Qu’est ce que la visualisation des données ?
▪ Pittenturf explique les critères de base auxquels une visualisation de données doit répondre pour être
efficace (Pittenturf 2018) :
4
Différents types de données
Il existe différents types de données qui seront illustrées par différents types de graphiques.
❑ données structurées : sondage, fichier de notes, liste de préférence, etc
❑ séries temporelles : évolution de la température moyenne sur terre, série financière, nombre de
malades atteints de la grippe par semaine, etc
❑ données géographiques : nombre d’espèces de plantes relevées en différents sites, indice de
pauvreté dans le monde, position d’un téléphone portable, etc
❑ données non structurées : langage naturel, chants doiseaux, imgaes, vidéos
5
Données structurées
Les données structurées, généralement organisées en lignes et en colonnes, qui incluent des
nombres et des mots, tels que des noms, des dates et des informations de carte de crédit...
Santé publique
Le fichier ci-dessous reporte des statistiques de santé publique pour les pays d’Afrique (année ?)
6
Données structurées
Les données structurées, généralement organisées en lignes et en colonnes, qui incluent des
nombres et des mots, tels que des noms, des dates et des informations de carte de crédit...
Données bancaires : informations sur des prêts (République Tcheque, 1999)
7
Données non structurées
Les données non structurées, qui ne sont pas organisées et qui incluent le texte des fichiers et
documents, les données mobiles et issues des réseaux sociaux, le contenu des sites web et les vidéos.
Identification de la race d’un chat ou d’un chien à partir d’une image
Les images sont toutes différentes par divers aspects : fond, position de l’animal, intensité de lumière,
etc.
On ne peut pas les comparer ou les agréger directement.
8
Différents graphiques
Selon le type de données que l’on doit visualiser et selon le message qu’on veut faire passer, on va
utiliser différents types de graphiques.
9
Comment choisir le bon graphique ?
La visualisation des données, comme tout autre outil, peuvent être très utiles lorsqu’ils sont bien
utilisés. Pour tirer le meilleur parti de vos données, vous devez les associer au bon type de graphique.
Comment y parvenir ? En vous posant les questions suivantes :
1. Qui est mon public?
2. Quelles sont les connaissances que je souhaite apporter à mes lecteurs ?
3. Quelle doit être la portée de mon axe ?
4. Dois-je afficher les valeurs dans le temps ou parmi les groupes ?
5. De quelles informations ai-je besoin concernant le nombre de catégories ?
10
Comparer des données
Diagramme en batons horizontal est un bon graphique pour afficher et comparer le rang des valeurs
et se concentrer sur les extrêmes.
On préfère
▪ des noms courts pour les catégories
▪ faible nombre de catégories (idéalement moins de 7)
Exemples : Chiffre d’affaires, chiffre d’affaires par année, etc.
11
Comparer des données
Exemple
On considère la production mondiale de plastique par tranche de 10 ans.
12
Comparer des données
Utilisation de plastique par région du monde (2019)
13
Comparer des données
Un premier diagramme, avec plotly
Que peut-on encore améliorer pour faciliter la lecture et compléter les informations disponibles ?
14
Comparer des données
Un second diagramme par habitant, avec plotly
Le diagramme en barres verticale permet une lecture facile des titres de
catégories (ici régions du monde).
Ordonner les valeurs permet d’identifier très vite les gros utilisateurs
de plastique et les petits utilisateurs.
On voit aussi plus facilement que la Chine et les Etats-Unis utilisent
presque la même quantité de plastique.
Les légendes d’axe et leur unité de mesure sont importantes !
Il manque encore un titre indiquant de a quoi on s’interesse et l’année
des données
15
Comparer des données
Le diagramme en bâtons vertical est utilisé si
➢ on veut savoir si les valeurs des données ont atteint un objectif particulier
➢ les éléments du graphique comportent plus de sept mais moins de 15 catégories,
➢ on a besoin d’afficher des nombres négatifs
➢ les étiquettes des catégories de données sont longues.
Exemple : Visiteurs du site web par pays, Clients gagnés par rôle, etc.
16
Visualiser de compositions
On considère des données de criminalité à Londres en 2020.
17
Suivre une évolution (séries temporelles)
Exemples de séries temporelles
Activité électrique dans le cerveau, Battements de cœur par minute.
Mesures de précipitations, température, direction de vent
Cours des actions, des crypto-monnaies
nombre d’animaux dans un environnement
Ventes au détail annuelles, abonnés mensuels.
18
Les Types de diagrammes et de graphiques
les plus courants
1. Graphique en barres
Le graphique en barres, également connu sous le nom de diagramme à colonnes horizontales, est
populaire pour une raison bien précise : il est agréable à regarder et permet de visualiser rapidement des
ensembles de données. Les graphiques en barres vous permettent d’identifier rapidement la barre la plus
haute ou la plus basse, y compris les différences incrémentales entre les barres.
Quand utiliser les graphiques en barre ?
▪ Si vous avez plus de 10 articles ou catégories à comparer.
▪ Si les étiquettes ou les noms de vos catégories sont longs.
19
Les Types de diagrammes et de graphiques
les plus courants
1. Graphique en barres
Meilleures techniques pour les graphiques en barres
▪ Concentrez-vous sur une couleur pour un graphique en barres. Les couleurs d’accentuation sont
idéales si vous souhaitez mettre en évidence certaines données importantes.
▪ Les barres doivent être plus larges que l’espace blanc entre les barres.
▪ Pour une meilleure lisibilité de votre graphique en barres, écrivez les étiquettes horizontalement (et
non verticalement).
▪ Classez les catégories par ordre alphabétique ou par valeur afin d’assurer la cohérence de votre
graphique en barres.
20
Les Types de diagrammes et de graphiques
les plus courants
2. Graphique linéaire
Vous pouvez utiliser un graphique linéaire pour représenter des données continues ou des données dont
les valeurs sont infinies. Par exemple, le graphique ci-dessous met en évidence l’augmentation des
recherches de mots clés pour le « télétravail » aux États-Unis entre le 1er février 2020 et le 22 mars
2020.
Quand utiliser les graphiques linéaires?
▪ Comparer et présenter un grand nombre de données à la
fois.
▪ Montrer les tendances ou les progrès au fil du temps.
▪ Mettre en évidence la décélération.
▪ Présenter les données prévisionnelles et partager
l’incertitude dans un seul graphique linéaire.
21
Les Types de diagrammes et de graphiques
les plus courants
2. Graphique linéaire
Meilleures techniques pour les graphiques linéaire
▪ N’utilisez que des lignes pleines, car les lignes en pointillés ou en tirets ne retiennent pas l’attention.
▪ Veiller à ce que les points soient ordonnés de manière cohérente.
▪ Étiqueter directement les lignes et éviter d’utiliser des légendes dans un graphique linéaire.
▪ Ne pas tracer plus de quatre lignes pour éviter les distractions visuelles.
22
Les Types de diagrammes et de graphiques
les plus courants
3. Graphique en aires
Un graphique en aires est semblable à un graphique linéaire, car il montre également les
changements dans le temps. La différence avec ces types de graphiques est que les graphiques en
aires peuvent représenter le volume, qui est généralement coloré.
L’exemple de graphique en aires de la BBC ci-dessous montre une simple comparaison de deux
ensembles de données sur une période donnée.
Quand utiliser les graphiques en aires ?
• Afficher l’évolution des valeurs ou des valeurs multiples
au fil du temps.
• Mettre en évidence l’ampleur d’un changement.
• Montrer des différences importantes entre les valeurs.
23
Les Types de diagrammes et de graphiques
les plus courants
3. Graphique en aires
Meilleures techniques pour les graphiques en aires
▪ Ne pas afficher plus de quatre catégories sur ce type de graphiques.
▪ Utilisez des couleurs transparentes pour éviter de masquer les données en arrière-plan sur ce type
de graphiques.
▪ Ajouter des annotations et des explications à ce type de graphiques.
▪ Regroupez les petites valeurs en une seule plus grande afin d’éviter l’encombrement sur ce type de
graphiques.
24
Les Types de diagrammes et de graphiques
les plus courants
4. Nuage de points
Le nuage de points permet de montrer la relation entre des éléments basés sur deux variables et
ensembles de données différents. Les points (ou données de tracé) sont inscrites dans un système de
coordonnées x-y. Dans certains nuages de points, une ligne de tendance est ajoutée (comme dans
l’exemple ci-dessous) au nuage.
Quand utiliser nuage de points ?
• Montrer les relations entre deux variables.
• Vous disposez de deux variables de données
qui se complètent.
25
Les Types de diagrammes et de graphiques
les plus courants
4. Nuage de points
Meilleures techniques pour les nuage de points
▪ La valeur de l’axe des y commence à zéro pour représenter les données avec précision.
▪ Tracez des variables de données supplémentaires en modifiant la taille et la couleur des points.
▪ Surligner avec de la couleur et des annotations.
26
Les Types de diagrammes et de graphiques
les plus courants
5. Diagramme circulaire
Les diagrammes circulaires mettent en évidence des données et des statistiques sous forme de parts de
tarte. Un diagramme circulaire représente des nombres en pourcentages, et la somme totale de tous les
diagrammes doit être égale à 100 %. Lorsque vous envisagez d’utiliser des diagrammes et des graphiques
pour visualiser des données, les diagrammes circulaires ont le plus d’impact sur votre public si vous disposez
d’un petit ensemble de données.
27
Les Types de diagrammes et de graphiques
les plus courants
5. Diagramme circulaire
Le diagramme circulaire en forme de beignet, une variante du diagramme circulaire, montre un élément de
conception ou la valeur totale de toutes les variables au centre.
Quand utiliser les diagrammes circulaires ?
• llustrer des comparaisons de partie à partie – des
tableaux et graphiques de l’entreprise à ceux de la salle
de classe.
• Identifier les éléments les plus petits et les plus grands
dans des ensembles de données.
• Comparer les différences entre plusieurs points de
données dans un diagramme circulaire.
28
Les Types de diagrammes et de graphiques
les plus courants
5. Diagramme circulaire
Bonnes techniques pour l’utilisation d’un diagramme circulaire
▪ Limitez les catégories à 3 ou 5 pour assurer la différenciation entre les tranches du diagramme circulaire.
▪ Vérifiez que la valeur totale des tranches est égale à 100 %.
▪ Regroupez les tranches similaires en une seule tranche plus grande pour réduire l’encombrement.
▪ Faites ressortir votre tranche la plus importante grâce à la couleur. Utilisez des nuances de cette couleur
spécifique pour mettre en valeur le reste des tranches.
▪ Organiser les tranches intelligemment. Par exemple, vous pouvez placer la plus grande section à la position 12
heures et aller dans le sens des aiguilles d’une montre à partir de là. Ou placez la deuxième plus grande section
29
à la position 12 heures et continuez dans le sens inverse des aiguilles d’une montre à partir de là.
Les Types de diagrammes et de graphiques
les plus courants
5. Diagramme circulaire
Bonnes techniques pour l’utilisation d’un diagramme circulaire
30
Les Types de diagrammes et de graphiques
les plus courants
6. Pictogramme
Bien que son nom contienne le mot « gramme »,
un pictogramme n’est pas un type de
diagrammes. Au contraire, un pictogramme est un
type de graphique qui utilise des images ou des
icônes pour représenter les données. Chaque
icône représente un certain nombre d’ensembles
de données, d’unités ou d’objets. Par exemple,
l’infographie ci-dessous contient un pictogramme
– chaque icône humaine représente 10 % des
chefs d’entreprise.
31
Les Types de diagrammes et de graphiques
les plus courants
6. Pictogramme
Quand utiliser les pictogrammes ?
▪ Lorsque votre public cible préfère les icônes et les images aux ensembles de données (pour illustrer
les données).
▪ Montrer l’avancement d’un objectif ou d’un projet pour présenter des données continues.
▪ Mettre en évidence les classements pour comparer les données.
▪ Partager les résultats d’une enquête ou la distribution de données.
▪ Partager le niveau de compétence ou les ensembles de données.
32
Les Types de diagrammes et de graphiques
les plus courants
6. Pictogramme
Meilleures techniques pour les pictogrammes
▪ Gardez vos icônes et vos images simples pour éviter de distraire votre public avec ce type de
graphiques.
▪ N’utilisez pas de couleurs contrastées pour vos icônes. Utilisez plutôt des nuances d’une couleur
spécifique.
▪ Limitez le nombre de lignes à cinq ou dix pour une meilleure lisibilité de ce type de graphiques.
33