0% ont trouvé ce document utile (0 vote)
53 vues23 pages

Stat Des Poly

Ce document est un polycopié d'introduction à la statistique descriptive destiné aux étudiants de première année en sciences économiques et gestion. Il couvre les concepts fondamentaux tels que les variables, les données statistiques, et les méthodes d'analyse univariée et bivariée, tout en fournissant des outils pour organiser et interpréter des données. L'objectif est de doter les étudiants des compétences nécessaires pour mener des analyses statistiques rigoureuses et éclairées.

Transféré par

nodazilzal
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
53 vues23 pages

Stat Des Poly

Ce document est un polycopié d'introduction à la statistique descriptive destiné aux étudiants de première année en sciences économiques et gestion. Il couvre les concepts fondamentaux tels que les variables, les données statistiques, et les méthodes d'analyse univariée et bivariée, tout en fournissant des outils pour organiser et interpréter des données. L'objectif est de doter les étudiants des compétences nécessaires pour mener des analyses statistiques rigoureuses et éclairées.

Transféré par

nodazilzal
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Mohammed V de Rabat

Faculté des Sciences Juridiques, Économiques et Sociales - Salé

L1 Économie Gestion
"Troc commun"

MATIÈRE : STATISTIQUE DESCRIPTIVE

AUTEUR : PR. EL HAMMA IMAD

Année universitaire :
Table des matières
Introduction 2

1 Chapitre 1 : Variables, Données Statistiques, Tableaux, Effectifs 4


1.1 Définitions Fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 La Science Statistique . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.2 Mesure et Variable . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Population et Échantillons : Définitions et Exemples . . . . . . . . . 5
1.1.4 Unité statistique ou individu . . . . . . . . . . . . . . . . . . . . . . 6
1.1.5 Caractère – Modalité . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.6 Typologie des Variables . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.7 Séries Statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Catégorie et typologies des variables . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Variable Qualitative Nominale . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Variable Qualitative Ordinale . . . . . . . . . . . . . . . . . . . . . 11
1.2.3 Variable Quantitative Discrète . . . . . . . . . . . . . . . . . . . . . 13
1.2.4 Variable Quantitative Continue . . . . . . . . . . . . . . . . . . . . 14
1.2.5 Classes avec Amplitudes Différentes . . . . . . . . . . . . . . . . . . 14
1.3 Effectif et fréquences en Statistiques Descriptives . . . . . . . . . . . . . . 15
1.3.1 Fréquence et Fréquence Cumulée . . . . . . . . . . . . . . . . . . . 15
1.3.2 Fréquence, Fréquence Cumulée . . . . . . . . . . . . . . . . . . . . . 15
1.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Corrections . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1
Introduction
Ce polycopié est conçu comme une introduction à la statistique descriptive, principale-
ment destinée aux étudiants de première année en sciences économiques et gestion. Son
objectif est de fournir une compréhension fondamentale des outils et méthodes statistiques
essentiels, rendant ainsi les étudiants capables d’analyser et d’interpréter des données sta-
tistiques avec compétence. De plus, ce document peut s’avérer précieux pour quiconque
est amené à travailler avec des données statistiques, que ce soit pour la rédaction d’un
rapport ou la préparation d’un mémoire.
La statistique, dans son essence, est une science aux multiples dimensions. Elle est sou-
vent évoquée au pluriel, "statistiques", pour souligner la diversité de ses applications et
domaines d’intervention. Englobant la recherche, la collecte, le traitement, l’analyse, et
l’interprétation de données, ainsi que leur présentation sous divers formats tels que ta-
bleaux et graphiques, la statistique descriptive offre un cadre méthodologique pour la
synthèse d’informations quantitatives relatives à une multitude de phénomènes, qu’ils
soient économiques, financiers, historiques, géographiques, ou biologiques.
Il est courant dans la pratique statistique de rencontrer des données qui ne capturent
qu’une partie du phénomène étudié, du fait de leur nature partiellement observable. Dans
ces cas, il devient nécessaire d’inférer des informations supplémentaires à partir des don-
nées disponibles. Cette démarche implique l’établissement d’hypothèses sur les lois de
probabilité régissant le phénomène en question. Ainsi, la statistique s’enrichit de la théo-
rie des probabilités, donnant lieu à ce que l’on appelle la statistique mathématique ou
inférentielle.
Ce document est structuré pour être accessible au plus grand nombre, guidant le lecteur
à travers les concepts et techniques fondamentales de la statistique descriptive. Il ambi-
tionne de doter les étudiants des compétences nécessaires pour mener à bien des analyses
statistiques rigoureuses, propices à une compréhension approfondie des données et à la
formulation de conclusions éclairées.
Ce polycopié est organisé en trois chapitres principaux, chacun abordant un aspect fonda-
mental de la statistique descriptive. Cette structure vise à faciliter une progression logique
de l’apprentissage, de la familiarisation avec les concepts de base jusqu’à l’application de
méthodes statistiques plus avancées.

Chapitre 1 : Introduction aux Variables, Données Statistiques, Tableaux, et


Effectifs

Ce premier chapitre pose les fondations de la statistique descriptive. Il commence par


explorer les définitions fondamentales telles que la science statistique, les mesures, les
variables, et les séries statistiques. Il détaille ensuite les différents types de variables (qua-
litatives nominales et ordinales, quantitatives discrètes et continues) et leur représentation
à travers des tableaux et des graphiques, tels que les diagrammes en secteurs, en barres,
en bâtonnets, et les histogrammes. Ce chapitre vise à équiper les étudiants avec les compé-
tences nécessaires pour organiser et présenter des données de manière claire et informative.

2
Chapitre 2 : Statistique Descriptive Univariée

Le deuxième chapitre se concentre sur l’analyse univariée, couvrant les paramètres de po-
sition (mode, moyenne, médiane, etc.), les paramètres de dispersion (variance, écart-type,
etc.), les moments, et les paramètres de forme (asymétrie, aplatissement). L’objectif est
de fournir aux étudiants les outils pour résumer et caractériser un ensemble de données
à travers une série d’indicateurs statistiques, facilitant ainsi l’interprétation et la compa-
raison des distributions de données.

Chapitre 3 : Statistique Descriptive Bivariée et Théorie des Indices

Le troisième chapitre avance vers l’analyse bivariée, examinant les relations entre deux
variables à travers des concepts tels que la covariance, la corrélation, et la régression li-
néaire. Cette partie du cours explore également les techniques pour analyser les relations
entre deux variables qualitatives, incluant l’usage de tableaux de contingence et le test du
khi-carré. Enfin, une introduction à la théorie des indices offre une perspective sur les me-
sures d’inégalité et l’application des indices statistiques pour synthétiser les informations
économiques et financières.

3
1 Chapitre 1 : Variables, Données Statistiques, Tableaux,
Effectifs
Ce chapitre se concentre sur les concepts fondamentaux de la statistique descriptive, intro-
duisant les bases nécessaires pour comprendre et travailler avec des données statistiques.

1.1 Définitions Fondamentales

1.1.1 La Science Statistique

La science statistique représente une méthode scientifique essentielle pour le traitement des
données quantitatives. Étymologiquement, le terme "statistique" provient du latin "sta-
tus", signifiant état, ce qui souligne son rôle dans la description et l’analyse de l’état d’un
phénomène à partir de données empiriques. Cette discipline s’applique à une multitude
de domaines, de l’agronomie à la psychologie, en passant par la biologie, la démographie,
l’économie, la sociologie et la linguistique, entre autres.

1.1.2 Mesure et Variable

En statistique, on s’intéresse à des unités statistiques ou unités d’observation, telles que des
individus, des entreprises ou des ménages. Dans la plupart des cas en sciences humaines, le
nombre d’unités est fini. Sur ces unités, on mesure un caractère ou une variable, qui peut
être le chiffre d’affaires d’une entreprise, le revenu d’un ménage, l’âge d’une personne ou
encore la catégorie socioprofessionnelle. On suppose généralement que la variable prend
une seule valeur sur chaque unité.
Pour des raisons de simplicité, les variables sont souvent désignées par des lettres, telles
que X, Y ou Z. Les valeurs possibles de la variable sont appelées modalités, et l’ensemble
de ces valeurs ou modalités constitue le domaine de la variable. Ainsi, la statistique permet
de quantifier, d’analyser, d’interpréter et de présenter les données, en mettant en lumière
les caractéristiques et les variations des phénomènes observés dans divers contextes.

Exemples de Variables et Mesures :

Exemple 1
— Variable : Niveau de satisfaction
— Type : Qualitative Ordinale
— Modalités : Faible, Moyen, Élevé
— Unité de mesure : Non applicable (ordonnée)
— Utilisation : Évaluation avec un ordre, telle que le niveau de satisfaction des
clients.
Exemple 2

— Variable : Nombre d’enfants par famille


— Type : Quantitative Discrète

4
— Modalités : Nombres entiers (0, 1, 2, ...)
— Unité de mesure : Nombre d’enfants
— Utilisation : Comptage précis, comme le nombre d’enfants dans les familles.

1.1.3 Population et Échantillons : Définitions et Exemples

Une population désigne un ensemble d’individus ou d’unités statistiques, qui peuvent


être divers et ne se limitent pas nécessairement aux êtres humains. Elle peut comprendre
n’importe quel ensemble d’objets concernés par une étude statistique.

a) Exemples :
— La population des ménages dans un quartier de Casablanca.
— La population des oliviers dans une région de l’Atlas marocain.
— La population des élèves d’une école primaire à Rabat.
Une population peut être exhaustive, couvrant l’ensemble des individus concernés, ou
bien être une partie de cet ensemble, auquel cas on parle d’échantillon. Par exemple,
les élèves de la première année d’une école primaire représentent un échantillon de la
population totale des élèves de l’école.

b) Remarque : Une population est toujours composée d’unités homogènes, c’est-à-


dire du même type ou de la même nature, et dont le nombre est fini. Par exemple, une
population ne peut pas inclure à la fois des voitures et des oliviers.

c) les différents types d’échantillons : Un échantillon est un sous-ensemble de la


population qui est sélectionné pour l’étude. L’objectif est de recueillir des données sur cet
échantillon qui peuvent ensuite être utilisées pour tirer des conclusions sur la population
entière. La sélection d’un échantillon approprié est cruciale pour la validité des résultats
de l’étude.

Types d’échantillons :

— Échantillon aléatoire simple : Chaque membre de la population a une chance


égale d’être inclus dans l’échantillon. Cela garantit que l’échantillon est représen-
tatif de la population.
— Échantillon stratifié : La population est divisée en strates, ou groupes, qui sont
homogènes en eux-mêmes mais différents les uns des autres. Un échantillon aléa-
toire est ensuite sélectionné dans chaque strate. Cette méthode est utile lorsque la
population est hétérogène.
— Échantillon systématique : On sélectionne un membre de la population à inter-
valles réguliers, après avoir déterminé un point de départ aléatoire. Cette méthode
est souvent plus simple à mettre en œuvre que l’échantillonnage aléatoire simple.
— Échantillon par grappes : La population est divisée en grappes (par exemple,
géographiquement), et un échantillon de ces grappes est sélectionné. Tous les indi-
vidus au sein des grappes sélectionnées sont inclus dans l’échantillon.

5
Chaque type d’échantillon a ses avantages et ses limites, et le choix du type d’échantillon
dépend des objectifs de l’étude, de la nature de la population et des ressources disponibles.

1.1.4 Unité statistique ou individu

Dans le domaine des statistiques, une unité statistique est considérée comme le bloc de
base d’une population étudiée. Chaque unité représente un élément individuel au sein
de cette population, permettant aux chercheurs de collecter, analyser et interpréter des
données de manière précise et significative. Une population, dans ce contexte, est donc
un ensemble composé exclusivement d’unités statistiques partageant des caractéristiques
communes, facilitant l’étude d’un phénomène spécifique ou la réponse à une question de
recherche.

Exemples :
— Population des ménages dans un quartier de Casablanca : uci, une unité
statistique est représentée par un ménage individuel, tel que la famille Idrissi au
123 rue principale. Le choix de ménages comme unités statistiques permet aux
chercheurs de comprendre des dynamiques spécifiques, telles que la composition
des ménages, leurs revenus, leurs habitudes de vie, etc., dans ce quartier précis.

— Population des oliviers dans une région de l’Atlas marocain : ans ce cas,
une unité statistique est un olivier individuel. Cette spécification permet d’étudier
des aspects tels que l’âge des arbres, leur santé, leur productivité, ou leur distribu-
tion géographique, fournissant des informations précieuses pour l’agriculture et la
conservation.

— Population des élèves d’une école primaire à Rabat : Chaque élève, comme
Fatima en 4ème année, représente une unité statistique. Cela permet d’examiner
des variables telles que la performance académique, les besoins éducatifs spéci-
fiques, ou les tendances démographiques parmi les élèves, offrant une base pour
des décisions pédagogiques informées.

Importance de l’homogénéité : La remarque sur l’homogénéité des populations est


cruciale. Pour qu’une étude soit pertinente et ses conclusions valides, il est essentiel que
toutes les unités statistiques partagent un trait commun significatif pour l’objet de l’étude.
Cela signifie que, dans une population définie pour une étude particulière, les unités
doivent être du même type ou de la même nature. Ainsi, une population ne devrait
pas mélanger des catégories incompatibles, comme des voitures et des oliviers, car cela
brouillerait les objectifs de l’étude et compromettrait la validité des résultats.
Chaque unité statistique, en tant qu’entité individuelle au sein de la population, joue un
rôle crucial dans la compréhension des dynamiques et caractéristiques de la population
dans son ensemble. L’analyse de ces unités permet de dégager des tendances, des mo-
dèles et des insights précieux sur la population étudiée, contribuant ainsi à la base de
connaissances dans divers domaines d’application.

6
1.1.5 Caractère – Modalité

Un caractère est un attribut ou une propriété qui peut être mesurée ou observée chez
chaque unité statistique d’une population. Il s’agit d’un aspect spécifique du phénomène
étudié qui peut varier d’une unité à l’autre. La capacité d’identifier et de définir pré-
cisément ces caractères est essentielle pour structurer une enquête statistique et pour
permettre l’analyse des données recueillies.

Exemple :
— Population (P) : voitures circulant à Tanger.
— Unité statistique (U) : une voiture parmi celles circulant à Tanger.
— Caractères (C) : Ces caractères peuvent inclure l’âge de la voiture, la marque, le
modèle, le prix d’achat, la puissance du moteur, etc. Chacun de ces caractères peut
fournir des insights différents sur la population des voitures à Tanger, comme des
tendances dans les préférences des consommateurs, l’évolution du marché automo-
bile local, ou des aspects liés à l’environnement et à la consommation d’énergie.

Les modalités d’un caractère représentent les différentes valeurs ou états que peut
prendre ce caractère. En d’autres termes, les modalités sont les options ou les catégo-
ries spécifiques qui décrivent comment un caractère se manifeste au sein de la population
étudiée.

Exemple :
— Population (P) : étudiants de première année à la Faculté des Sciences Écono-
miques et de Gestion de Salé (FESG Salé).
— Unité statistique (U) : un étudiant de première année à la FESG Salé.
— Caractère (C) : Supposons que l’on s’intéresse aux caractères tels que la spéciali-
sation choisie par l’étudiant, son âge, et son genre.
— Modalités (M) : Supposons que l’on s’intéresse aux caractères tels que la spéciali-
sation choisie par l’étudiant, son âge, et son genre.
— Pour le caractère "spécialisation", les modalités pourraient inclure "Écono-
mie", "Gestion", "Comptabilité", etc.
— Pour l’âge, les modalités seraient les différentes tranches d’âge des étudiants,
par exemple "17-19 ans", "20-22 ans", etc.
— Pour le genre, les modalités typiques seraient "Masculin", "Féminin", et éven-
tuellement d’autres options selon le contexte de l’étude.

1.1.6 Typologie des Variables

La typologie des variables consiste à les classer en différentes catégories en fonction de


leur nature et de leurs caractéristiques. Les deux principales catégories de variables sont
les variables qualitatives et les variables quantitatives.

Variables Qualitatives : Les variables qualitatives, également appelées variables ca-


tégorielles, prennent des valeurs qui décrivent des caractéristiques ou des qualités non

7
numériques. Elles peuvent être nominales ou ordinales.
— Variable nominale : Une variable nominale représente des catégories sans ordre
inhérent. Par exemple, la couleur des yeux (bleu, vert, marron) est une variable
nominale car il n’y a pas d’ordre naturel entre les couleurs.
— Variable ordinale : Une variable ordinale représente des catégories avec un ordre
inhérent. Par exemple, le niveau d’éducation (primaire, secondaire, universitaire)
est une variable ordinale car il existe un ordre naturel entre les niveaux d’éducation.

Exemples :
— Pour une étude sur les préférences alimentaires, la variable "type de cuisine préféré"
peut être une variable nominale avec des catégories telles que "italien", "chinois"
et "mexicain".
— Pour une enquête sur la satisfaction des clients, la variable "niveau de satisfaction"
peut être une variable ordinale avec des catégories telles que "insatisfait", "neutre"
et "satisfait".

Variables Quantitatives : Les variables quantitatives, également appelées variables


numériques, prennent des valeurs numériques qui représentent des mesures ou des quan-
tités. Elles peuvent être continues ou discrètes.
— Variable continue : Une variable continue peut prendre n’importe quelle valeur
dans un intervalle donné. Par exemple, la taille, le poids et le revenu sont des
variables continues car ils peuvent prendre une infinité de valeurs dans un intervalle
donné.
— Variable discrète : Une variable discrète ne peut prendre que des valeurs spé-
cifiques et distinctes. Par exemple, le nombre d’enfants dans une famille est une
variable discrète car il ne peut prendre que des valeurs entières.

Exemples :
— Pour une étude sur la croissance des plantes, la variable "hauteur des plantes" peut
être une variable continue car elle peut prendre n’importe quelle valeur positive.
— Pour une analyse démographique, la variable "nombre de personnes dans un mé-
nage" peut être une variable discrète car elle ne peut prendre que des valeurs
entières non négatives.
La typologie des variables est importante en analyse statistique car elle guide le choix des
techniques d’analyse les plus appropriées en fonction de la nature des données. tique.

8
Table 1 – Typologie des Variables

Type de Variable Sous-type Description Exemple


Continue Peut prendre n’importe Température, dis-
Quantitative
quelle valeur dans un in- tance parcourue
tervalle donné.
Discrète Peut prendre des valeurs Nombre d’enfants,
séparées, souvent des en- voitures vendues
tiers.
Nominal Catégorise sans ordre in- Couleur des yeux,
Qualitative
hérent. type de nourriture
Ordinal Catégorise avec un ordre Niveau de satisfac-
ou un classement. tion, classement de
course
Date/Heure Spécifique à un moment Date de naissance,
Temporelle
donné. heure de début
Durée Mesure la durée d’une Durée d’un appel,
période ou d’un événe- temps passé à étu-
ment. dier

1.1.7 Séries Statistiques

Les séries statistiques constituent l’épine dorsale de l’analyse statistique. Elles sont défi-
nies comme des ensembles d’observations recueillies autour d’une ou de plusieurs variables,
capturant les caractéristiques essentielles d’un phénomène ou d’une population étudiée.
Ces observations fournissent les données brutes nécessaires pour mener des analyses statis-
tiques, permettant de décrire, d’interpréter et parfois de prédire les aspects du phénomène
concerné.

Unidimensionnelles vs. Multidimensionnelles :


— Une série unidimensionnelle se concentre sur une unique variable. Par exemple, la
série peut consister en la taille d’un échantillon de personnes, où chaque observation
représente la taille d’une personne spécifique.
— Une série multidimensionnelle, en revanche, implique plusieurs variables simulta-
nément pour chaque observation. Cela pourrait inclure la taille, le poids, et l’âge
des personnes dans un échantillon, offrant une vue plus complète et complexe des
données.

Organisation des Données : Les données de ces séries peuvent être organisées de
manière structurée, comme dans des tableaux ou des listes, où chaque ligne représente
une observation et chaque colonne une variable. Cette organisation facilite l’analyse et
l’interprétation des données.

Analyse des Séries Statistiques : L’analyse de ces séries peut inclure le calcul de
mesures de tendance centrale (telles que la moyenne, la médiane, et le mode) et de dis-
persion (comme l’écart-type et la variance), ainsi que l’examen de la corrélation entre

9
variables. Ces analyses aident à synthétiser et à comprendre les propriétés fondamentales
des données.

Importance de la Collecte de Données : Pour que les séries statistiques soient


fiables et significatives, il est crucial de collecter les données de manière rigoureuse et
représentative. Cela assure que les analyses effectuées sont valides et que les conclusions
tirées sont robustes.

Exemple Pratique :Prenons l’exemple des notes des étudiants dans un cours. Un ta-
bleau de série statistique pourrait lister les étudiants et leurs notes correspondantes. Dans
cet exemple, chaque ligne du tableau représente une observation (la note d’un étudiant
spécifique), formant une série statistique unidimensionnelle centrée sur la variable "Note".
L’analyse de cette série statistique permettrait de calculer la moyenne des notes, identifiant
ainsi la performance moyenne des étudiants, ou la variance, mesurant la dispersion des
notes autour de la moyenne. Ces analyses offrent des insights précieux sur la distribution
des performances des étudiants et peuvent aider à identifier les besoins en matière de
soutien pédagogique ou les domaines où la classe excelle.
En résumé, les séries statistiques jouent un rôle fondamental dans l’exploration et l’ana-
lyse des données. Elles permettent aux chercheurs et aux analystes de structurer les ob-
servations de manière significative, de réaliser des analyses approfondies et d’en tirer des
conclusions éclairées sur le phénomène étudié.

Table 2 – Série statistique des notes des étudiants

Étudiant Note
Étudiant 1 15
Étudiant 2 12
Étudiant 3 18
Étudiant 4 10
Étudiant 5 14
Étudiant 6 16
Étudiant 7 13

1.2 Catégorie et typologies des variables

1.2.1 Variable Qualitative Nominale

Les variables qualitatives nominales décrivent des caractéristiques qui ne peuvent pas être
quantifiées numériquement mais peuvent être catégorisées. Par exemple, le sexe, la couleur
ou la catégorie professionnelle sont des exemples de variables qualitatives nominales

Effectifs, Fréquences et Tableau Statistique : pour représenter une variable qua-


litative nominale, on utilise un tableau statistique qui présente les différentes catégories
ainsi que le nombre d’observations (effectifs) et les fréquences relatives à chaque catégorie.

10
Catégorie Effectifs Fréquences
Masculin 150 0.60
Féminin 100 0.40

Dans notre exemple de répartition des étudiants d’une université par sexe, nous avons
d’abord recueilli les données sur le nombre d’étudiants de chaque sexe. Supposons que
nous ayons trouvé 150 étudiants masculins et 100 étudiants féminins.

Pour calculer les fréquences relatives, nous divisons le nombre d’observations de chaque
catégorie par le nombre total d’observations. Dans notre cas, le nombre total d’observa-
tions est la somme des effectifs des deux catégories (150 + 100 = 250).

— Pour le sexe masculin :


Fréquence relative = (Nombre d’observations pour le sexe masculin) / (Nombre
total d’observations) = 150 / 250 = 0.60
— Pour le sexe féminin :
Fréquence relative = (Nombre d’observations pour le sexe féminin) / (Nombre to-
tal d’observations) = 100 / 250 = 0.4

Ces valeurs de fréquences relatives sont ensuite incluses dans le tableau statistique pour
fournir une représentation claire de la répartition des catégories.
Diagramme en Secteurs et Diagramme en Barres : tilisation des diagrammes en
secteurs et en barres pour visualiser les données qualitatives nominales, facilitant l’inter-
prétation des proportions entre modalités.

Figure 1 – Répartition des étudiants par sexe

1.2.2 Variable Qualitative Ordinale

Les variables qualitatives ordinales décrivent des caractéristiques qui peuvent être classées
dans un ordre spécifique mais sans qu’il y ait nécessairement une mesure numérique entre

11
elles. Par exemple, le niveau d’éducation (primaire, secondaire, supérieur) ou le niveau de
satisfaction (faible, moyen, élevé) sont des variables qualitatives ordinales.

Le Tableau Statistique Pour représenter une variable qualitative ordinale, un tableau


statistique est utilisé pour présenter les différentes catégories dans un ordre spécifique,
ainsi que le nombre d’observations (effectifs) et les fréquences relatives à chaque catégorie.
Contrairement aux variables nominales, les catégories sont ordonnées selon un critère
spécifique.
Exemple : Répartition des étudiants par niveau d’éducation dans une école.

Niveau d’éducation Effectifs Fréquences


Primaire 50 0.25
Secondaire 70 0.35
Supérieur 80 0.40

Table 3 – Répartition des étudiants par niveau d’éducation

Diagramme en Secteurs et en Barres d’Effectifs Tout comme pour les variables


nominales, les données relatives à une variable qualitative ordinale peuvent être visuali-
sées à l’aide de diagrammes en secteurs ou de diagrammes en barres. Cependant, dans
le cas des variables ordinales, il est important de conserver l’ordre des catégories dans la
représentation graphique.

Exemple : Diagramme en secteurs illustrant la répartition des étudiants par niveau


d’éducation.

0:Primaire
25% 0:Secondaire
35%
0:Supérieur

40%

Exemple : Diagramme en barres illustrant la répartition des étudiants par niveau d’édu-
cation.

100 80
80 70
Effectifs

60 50
40
20
0
Primaire Secondaire Supérieur
Niveau d’éducation

12
1.2.3 Variable Quantitative Discrète

Une variable quantitative discrète est une variable qui prend des valeurs spécifiques et
isolées, généralement des nombres entiers, et qui peuvent être comptées individuellement.
Ces valeurs ne peuvent pas être fractionnées en parties plus petites. Par exemple, le
nombre de frères et sœurs d’une personne, le nombre de livres dans une bibliothèque, ou
le nombre de points marqués lors d’un match sont des exemples de variables quantitatives
discrètes.

Le Tableau Statistique Lorsque nous travaillons avec des variables quantitatives dis-
crètes, nous organisons les données dans un tableau statistique pour une présentation
claire. Ce tableau comporte généralement deux colonnes : une pour les modalités de la
variable (dans notre cas, le nombre de personnes dans chaque ménage) et une pour les
effectifs correspondants. Nous avons déjà vu un exemple de tableau statistique pour notre
variable précédente. Maintenant, nous allons explorer comment représenter visuellement
ces données à l’aide d’un diagramme en bâtons.

Table 4 – Tableau statistique pour le nombre de personnes dans chaque ménage

Nombre de personnes dans le ménage Effectifs


1 12
2 18
3 10
4 8
5 5

Diagramme en Bâtonnets d’Effectifs Pour visualiser ces données, nous utilisons


souvent un diagramme en bâtons (ou histogramme) où l’axe horizontal représente les
modalités de la variable (dans notre cas, l’âge) et l’axe vertical représente les effectifs.
Chaque bâton représente la fréquence ou l’effectif de la modalité correspondante. Voici
un exemple d’un tel diagramme pour les données d’âge précédentes :

10
10
8
8
Effectifs

6
5
4
3
2
2

0
10 11 12 13 14
Âge

13
Dans ce diagramme, chaque barre représente un effectif. Par exemple, il y a 5 individus
de 10 ans, 8 individus de 11 ans, et ainsi de suite.

1.2.4 Variable Quantitative Continue

Les variables quantitatives continues décrivent des caractéristiques qui peuvent prendre
une infinité de valeurs dans un intervalle donné. Par exemple, la taille, le poids, ou le
revenu sont des variables quantitatives continues.

Le Tableau Statistique Pour visualiser les données d’une variable quantitative conti-
nue, on utilise un histogramme où l’axe horizontal représente les classes ou les intervalles,
et l’axe vertical représente les effectifs de chaque classe. Voici un exemple d’un tel tableau
statistique pour les données de revenu précédentes :

Table 5 – Exemple de tableau statistique pour une variable quantitative continue (revenu
en DH)

Classe de revenu Effectifs


[1000, 2000[ 10
[2000, 3000[ 20
[3000, 4000[ 25
[4000, 5000[ 15
[5000, 6000[ 12

Histogramme L’histogramme est un graphique qui représente la distribution des don-


nées d’une variable quantitative continue. Chaque barre de l’histogramme représente une
classe ou un intervalle de valeurs, et la hauteur de chaque barre représente le nombre
d’observations (effectifs) dans cette classe. Les histogrammes sont utiles pour visualiser
la répartition des données et identifier les tendances ou les modèles.

1.2.5 Classes avec Amplitudes Différentes

Dans certains cas, il est nécessaire d’utiliser des classes de revenu avec des amplitudes
(C’est la différence entre la plus grande et la plus petite valeur de la classe) différentes
afin de regrouper les données de manière à ce que chaque classe couvre une plage de
valeurs similaire en termes de densité d’observations.
Cependant, dans ce scénario, nous ne pouvons pas tracer directement l’histogramme des
classes de revenu, car les largeurs des barres seraient inégales. Au lieu de cela, nous devons
utiliser des densités d’effectifs pour représenter graphiquement la distribution des données.
Pour calculer la densité d’effectifs pour chaque classe, nous divisons le nombre d’observa-
tions dans chaque classe par l’amplitudes ou la largeur de cette classe. Cela nous donne une
mesure de la densité d’observations par unité de revenu, ce qui nous permet de comparer
les classes de revenu malgré leurs amplitudes différentes.
Voici comment nous pouvons calculer les densités d’effectifs pour chaque classe de revenu :

14
10 10
— Pour la classe [1000, 2000[ : densité = 2000−1000
= 1000
= 0, 01
20 20
— Pour la classe [2000, 3000[ : densité = 3000−2000
= 1000
= 0, 02
25 25
— Pour la classe [3000, 4000[ : densité = 4000−3000
= 1000
= 0, 025
15 15
— Pour la classe [4000, 6000[ : densité = 6000−4000
= 2000
= 0, 0075
12 12
— Pour la classe [6000, 7000[ : densité = 7000−6000
= 1000
= 0, 012
Nous utlisons ces densités d’effectifs pour tracer un histogramme de densité, qui représente
graphiquement la distribution des données de revenu malgré les amplitudes différentes des
classes de revenu.

1.3 Effectif et fréquences en Statistiques Descriptives

Dans cette section explore les différents types d’effectifs et de fréquences utilisés en sta-
tistiques descriptives pour résumer et analyser des ensembles de données. Ces mesures
fournissent des insights sur la distribution et la structure des données collectées.

1.3.1 Fréquence et Fréquence Cumulée

1. La fréquence d’une valeur est le rapport entre l’effectif absolu de cette valeur
et le nombre total d’observations dans l’ensemble des données. Elle permet de
comprendre la proportion qu’une valeur représente dans l’ensemble des données.
2. Fréquence Relative La fréquence relative est une autre manière de nommer
la fréquence, soulignant son rôle dans la comparaison des proportions de chaque
catégorie par rapport au total des observations.
3. Fréquence Cumulée
(a) Croissante : La fréquence cumulée croissante est le total des fréquences rela-
tives jusqu’à un certain point, permettant de voir la proportion d’observations
qui sont inférieures ou égales à cette valeur.
(b) Décroissante : La fréquence cumulée décroissante est calculée en partant de
la fin et en cumulant les fréquences, montrant la proportion d’observations
supérieures ou égales à chaque valeur.

Exemple de Tableau avec Fréquences

Présentons un tableau illustrant les fréquences et les fréquences cumulées pour un en-
semble de données fictif.

1.3.2 Fréquence, Fréquence Cumulée

Dans cette section, nous explorons comment les fréquences et les fréquences cumulées
sont calculées à partir de l’effectif absolu, offrant une vue détaillée de la distribution des
données.

1. La fréquence d’une valeur est calculée en divisant l’effectif absolu de cette valeur
par le nombre total d’observations. Elle représente la part de chaque valeur dans

15
l’ensemble des données, exprimée en proportion.
2. Fréquence Cumulée
(a) Croissante : La fréquence cumulée croissante somme les fréquences de toutes
les valeurs précédentes jusqu’à la valeur actuelle, montrant la progression des
proportions cumulées dans l’ensemble des données.
(b) Décroissante : La fréquence cumulée décroissante calcule la somme des fré-
quences à partir d’une valeur donnée jusqu’à la dernière, illustrant la part cu-
mulative des valeurs supérieures ou égales à chaque point.

Exemple de Tableau avec Fréquences et Effectifs

Voici un tableau qui combine les effectifs, les fréquences, et les fréquences cumulées pour
un ensemble de données fictif, permettant de visualiser comment chaque fréquence est
dérivée de l’effectif.

Effectif Fréquence Cumulée Fréquence Cumulée


Valeur Fréquence
Absolu Croissante Décroissante
A 10 0.10 0.10 1.00
B 20 0.20 0.30 0.90
C 30 0.30 0.60 0.70
D 40 0.40 1.00 0.40

Table 6 – Répartition des effectifs, fréquences et fréquences cumulées

Pourquoi la Fréquence ? Elle permet de comparer directement les parts de chaque


catégorie, offrant une vue d’ensemble de la répartition des données sans recourir à des
pourcentages.
Pourquoi les Fréquences Cumulées ? Ces mesures aident à comprendre la distribution
globale des données, montrant comment les parts s’accumulent ou diminuent à travers
l’ensemble des valeurs.

16
1.4 Exercices

Exercice 1.1 : Représentation des Données de Satisfaction des Clients


On vous donne les scores de satisfaction des clients d’un restaurant sur une échelle de 1
à 5. Les scores sont :
2, 3, 3, 4, 5, 2, 1, 4, 3, 5, 2, 3, 4, 5, 4, 3, 2, 5, 3, 4.
1. Construisez un tableau de fréquence pour les scores de satisfaction.
2. Représentez ces données sous forme de diagramme en bâtons.
3. Créez un diagramme circulaire pour montrer la proportion de chaque score dans
l’ensemble total des réponses.
Exercice 1.2 : Analyse et Représentation des Âges
Les âges des participants à un cours de musique sont :
22, 25, 19, 32, 28, 26, 19, 21, 25, 29, 22, 24.
1. Répartissez ces âges en 4 groupes d’intervalle égal et notez le nombre de participants
dans chaque groupe.
2. Représentez ces groupes d’âge à l’aide d’un histogramme.
3. Discutez de la répartition des âges des participants et de ce que cela pourrait
signifier pour le type de cours de musique offert.
Exercice 1.3 : Représentation des Notes d’Étudiants
Les notes finales d’une classe dans un examen sont :
10, 12, 15, 9, 8, 16, 14, 18, 7, 13, 12, 11, 15, 16, 10.
1. Classez ces notes en catégories (échec, passable, bien, très bien, excellent) en défi-
nissant des intervalles de notes appropriés.
2. Représentez la distribution de ces catégories de notes à l’aide d’un diagramme en
bâtons ou d’un histogramme.
3. Créez un diagramme de répartition (boîte à moustaches) pour montrer la distribu-
tion des notes, en indiquant la médiane, le premier et le troisième quartile, ainsi
que les valeurs extrêmes.
Exercice 1.4 : Variables Continues avec Amplitudes Similaires
Vous avez les données sur les durées d’utilisation quotidienne d’internet par un groupe de
20 personnes :
2.1, 3.5, 4.0, 5.2, 6.5, 3.3, 2.8, 4.5, 5.0, 6.2, 1.5, 2.9, 3.6, 4.1, 5.8, 6.1, 2.4, 3.7, 4.8, 5.6.
1. Classez ces durées en intervalles de 1 heure et calculez l’effectif pour chaque classe.
2. Représentez ces données à l’aide d’un histogramme.
3. Interprétez l’histogramme en termes de tendances d’utilisation d’internet dans le
groupe.
Exercice 1.5 : Variables Continues avec Amplitudes Différentes
Les distances parcourues par les élèves pour se rendre à l’école sont :
1, 3, 5, 7, 2, 2, 10, 15, 20, 3, 4, 6, 8, 12, 15, 25, 4, 5, 9, 13.
1. Déterminez des classes d’amplitude variable pour mieux représenter la distribution
des distances.
2. Représentez ces données avec un histogramme adapté aux amplitudes différentes.
3. Analysez le choix des amplitudes de classe et comment cela affecte la visualisation
des données.

17
Exercice 1.6 : Représentation des Préférences de Mode de Transport
Une enquête a été menée pour comprendre les préférences de mode de transport pour se
rendre au travail, avec les résultats suivants :
— Voiture : 120 personnes
— Transport en commun : 180 personnes
— Vélo : 60 personnes
— Marche : 90 personnes
— Autres : 30 personnes

1. Calculez le nombre total de personnes ayant répondu à l’enquête.


2. Pour chaque mode de transport, calculez la proportion (en pourcentage) du total
des réponses.
3. Dessinez un diagramme circulaire pour représenter ces proportions.
4. Analysez ce que le diagramme révèle sur les préférences de mode de transport.

Valeur Fréquence Fréquence Relative (%) Fréquence Cumulée Croissante Fréquence Cumulée D
A 0.10 10 10 100
B 0.20 20 30 90
C 0.30 30 60 70
D 0.40 40 100 40
Total 1.00 100 - -

Table 7 – Répartition des fréquences et fréquences cumulées

Pourquoi la Fréquence ? Elle permet de comparer directement les proportions de


chaque catégorie, offrant une vue d’ensemble de la répartition des données.
Pourquoi les Fréquences Cumulées ? Ces mesures aident à comprendre la distribu-
tion globale des données, en montrant comment les proportions s’accumulent à travers
l’ensemble des valeurs.

18
1.5 Corrections

Exercice 1.1 : Représentation des Données de Satisfaction des Clients


Les scores de satisfaction des clients d’un restaurant sont donnés sur une échelle de 1 à
5 : 2, 3, 3, 4, 5, 2, 1, 4, 3, 5, 2, 3, 4, 5, 4, 3, 2, 5, 3, 4.

1. Tableau de Fréquence
Premièrement, calculons l’effectif pour chaque score de satisfaction :
Score de Satisfaction Effectif
1 1
2 5
3 7
4 5
5 2

2. Diagramme en Bâtons
Pour le diagramme en bâtons, nous représenterons chaque score de satisfaction sur
l’axe des abscisses (x) et l’effectif correspondant sur l’axe des ordonnées (y).
Le diagramme en bâtons ci-dessous montre l’effectif de chaque score de satisfaction
des clients. Comme nous pouvons le voir, le score 3 est le plus fréquent, indiquant
que la majorité des clients sont modérément satisfaits.

3. Diagramme Circulaire
Le diagramme circulaire ci-dessus illustre la répartition des scores de satisfaction
des clients. Il montre clairement que la majorité des clients ont attribué un score de
3, ce qui représente 35% des réponses, suivis par les scores de 2 et 4 (25% chacun),
tandis que les scores de 1 et 5 sont moins fréquents.

Ces graphiques fournissent une visualisation directe de la distribution des scores de satis-
faction, permettant de comprendre rapidement la répartition des données. La représenta-
tion graphique aide à identifier les tendances et à faire des comparaisons visuelles entre
les différentes catégories de données.

Figure 3 – Diagramme Circulaire


Figure 2 – Diagramme en Bâtons

19
Exercice 1.2 : Analyse et Représentation des Âges

1. Répartition des Âges en Groupes d’Intervalle Égal


Avec les âges donnés : 22, 25, 19, 32, 28, 26, 19, 21, 25, 29, 22, 24, nous devons
d’abord identifier l’étendue d’âge pour créer des intervalles .
— Âge minimum : 19
— Âge maximum : 32
Pour diviser ces âges en 4 groupes d’intervalle égal, considérons l’étendue d’âge de
19 à 32, ce qui donne une étendue totale de 13 ans. Pour simplifier, nous pouvons
arrondir et créer des intervalles qui couvrent l’ensemble de l’étendue. Une approche
pourrait être de diviser cette étendue en 4 parties égales, mais étant donné la petite
étendue, des intervalles de 4 ans seraient pratiques, bien que cela donne technique-
ment plus de 4 groupes si l’on couvre jusqu’à l’âge maximum exactement.

Pour rester dans l’esprit de l’exercice, nous choisirons des intervalles qui répar-
tissent de manière équitable :
— 19-22 ans
— 23-26 ans
— 27-30 ans
— 31-34 ans (pour couvrir jusqu’à l’âge maximum avec des intervalles égaux)
Calculons l’effectif dans chaque groupe :

— 19-22 ans : 5 participants (19, 19, 21, 22, 22)


— 23-26 ans : 5 participants (24, 25, 25, 26)
— 27-30 ans : 2 participants (28, 29)
— 31-34 ans : 1 participant (32)
2. Représentation avec un Histogramme
Pour l’histogramme, nous utiliserons les intervalles et effectifs définis ci-dessus.
3. Discussion sur la Répartition des Âges
La répartition des âges suggère que le cours attire principalement des jeunes adultes,
avec une concentration particulière dans les tranches d’âge de 19-22 ans et de 23-
26 ans. Cela pourrait indiquer que le cours est particulièrement populaire parmi
les étudiants universitaires ou les jeunes professionnels. Les intervalles plus élevés
montrent une diminution du nombre de participants, ce qui pourrait suggérer que
le cours est moins adapté ou moins attrayant pour les personnes plus âgées, ou
simplement que ces tranches d’âge ont moins de temps libre pour s’engager dans
des cours de musique.
Cette répartition peut orienter le type de musique enseigné, les méthodes péda-
gogiques employées, et même les horaires des cours pour mieux correspondre aux
disponibilités et aux intérêts de cette tranche d’âge dominante. Par exemple, un
cours qui inclut des genres musicaux modernes, utilise des technologies d’appren-
tissage actuelles, et propose des horaires flexibles pourrait être particulièrement
bien reçu.

20
Figure 4 – Réprtition des âges des participants au cours de musique

Exercice 1.3 : Représentation des Notes d’Étudiants

1. Classement des Notes en Catégories

Pour classer les notes en catégories, nous pouvons définir les intervalles suivants :
— Échec : moins de 10
— Passable : 10 à 12
— Bien : 13 à 15
— Très bien : 16 à 17
— Excellent : 18 et plus
— Les notes données sont : 10, 12, 15, 9, 8, 16, 14, 18, 7, 13, 12, 11, 15, 16, 10.
Répartition selon les catégories :
— Échec : 3 notes (9, 8, 7)
— Passable : 4 notes (10, 12, 12, 11)
— Bien : 4 notes (15, 14, 13, 15)
— Très bien : 2 notes (16, 16)
— Excellent : 1 note (18)
2. Représentation avec un Diagramme en Bâtons ou un Histogramme
Pour visualiser cette distribution, nous pouvons utiliser un histogramme, car il
s’adapte bien à la représentation de données catégorisées.
3. Création d’un Diagramme de Répartition (Boîte à Moustaches)

21
Figure 5 – Diagramme en Bâtons Figure 6 – Diagramme Circulaire

Les graphiques ci-dessus présentent la distribution des notes d’étudiants de deux


manières différentes :
(a) Distribution des Notes par Catégorie : Le diagramme en bâtons montre le
nombre de notes dans chaque catégorie définie (Échec, Passable, Bien, Très
bien, Excellent). Cette visualisation aide à comprendre rapidement la réparti-
tion des performances des étudiants selon ces catégories, avec la majorité des
notes se situant dans les catégories "Passable" et "Bien".
(b) Diagramme de Répartition (Boîte à Moustaches) : Ce graphique fournit une
vue détaillée de la distribution des notes, y compris la médiane, les quartiles,
les valeurs extrêmes, et la moyenne. La médiane (ligne à l’intérieur de la boîte)
indique la note "centrale" des étudiants, tandis que les bords de la boîte re-
présentent le premier et le troisième quartile, offrant une vue sur la dispersion
des notes. Les valeurs extrêmes sont représentées par les "moustaches" et les
points individuels qui peuvent indiquer des notes exceptionnellement basses ou
élevées.
4. Discussion sur la Répartition des Âges des Participants
La distribution des notes suggère que la classe a une performance globalement équilibrée,
avec une tendance vers les notes moyennes ("Passable" et "Bien"). Le diagramme de
répartition montre que la dispersion des notes couvre une large gamme, avec quelques
étudiants obtenant des scores très bas (échec) et quelques-uns excellant (note "Excellent").
La présence de notes dans toutes les catégories peut indiquer une variété de niveaux de
compréhension parmi les étudiants, ce qui pourrait nécessiter une approche pédagogique
différenciée pour s’assurer que tous les étudiants atteignent un niveau de compétence
satisfaisant.

22

Vous aimerez peut-être aussi