Stat Des Poly
Stat Des Poly
L1 Économie Gestion
"Troc commun"
Année universitaire :
Table des matières
Introduction 2
1
Introduction
Ce polycopié est conçu comme une introduction à la statistique descriptive, principale-
ment destinée aux étudiants de première année en sciences économiques et gestion. Son
objectif est de fournir une compréhension fondamentale des outils et méthodes statistiques
essentiels, rendant ainsi les étudiants capables d’analyser et d’interpréter des données sta-
tistiques avec compétence. De plus, ce document peut s’avérer précieux pour quiconque
est amené à travailler avec des données statistiques, que ce soit pour la rédaction d’un
rapport ou la préparation d’un mémoire.
La statistique, dans son essence, est une science aux multiples dimensions. Elle est sou-
vent évoquée au pluriel, "statistiques", pour souligner la diversité de ses applications et
domaines d’intervention. Englobant la recherche, la collecte, le traitement, l’analyse, et
l’interprétation de données, ainsi que leur présentation sous divers formats tels que ta-
bleaux et graphiques, la statistique descriptive offre un cadre méthodologique pour la
synthèse d’informations quantitatives relatives à une multitude de phénomènes, qu’ils
soient économiques, financiers, historiques, géographiques, ou biologiques.
Il est courant dans la pratique statistique de rencontrer des données qui ne capturent
qu’une partie du phénomène étudié, du fait de leur nature partiellement observable. Dans
ces cas, il devient nécessaire d’inférer des informations supplémentaires à partir des don-
nées disponibles. Cette démarche implique l’établissement d’hypothèses sur les lois de
probabilité régissant le phénomène en question. Ainsi, la statistique s’enrichit de la théo-
rie des probabilités, donnant lieu à ce que l’on appelle la statistique mathématique ou
inférentielle.
Ce document est structuré pour être accessible au plus grand nombre, guidant le lecteur
à travers les concepts et techniques fondamentales de la statistique descriptive. Il ambi-
tionne de doter les étudiants des compétences nécessaires pour mener à bien des analyses
statistiques rigoureuses, propices à une compréhension approfondie des données et à la
formulation de conclusions éclairées.
Ce polycopié est organisé en trois chapitres principaux, chacun abordant un aspect fonda-
mental de la statistique descriptive. Cette structure vise à faciliter une progression logique
de l’apprentissage, de la familiarisation avec les concepts de base jusqu’à l’application de
méthodes statistiques plus avancées.
2
Chapitre 2 : Statistique Descriptive Univariée
Le deuxième chapitre se concentre sur l’analyse univariée, couvrant les paramètres de po-
sition (mode, moyenne, médiane, etc.), les paramètres de dispersion (variance, écart-type,
etc.), les moments, et les paramètres de forme (asymétrie, aplatissement). L’objectif est
de fournir aux étudiants les outils pour résumer et caractériser un ensemble de données
à travers une série d’indicateurs statistiques, facilitant ainsi l’interprétation et la compa-
raison des distributions de données.
Le troisième chapitre avance vers l’analyse bivariée, examinant les relations entre deux
variables à travers des concepts tels que la covariance, la corrélation, et la régression li-
néaire. Cette partie du cours explore également les techniques pour analyser les relations
entre deux variables qualitatives, incluant l’usage de tableaux de contingence et le test du
khi-carré. Enfin, une introduction à la théorie des indices offre une perspective sur les me-
sures d’inégalité et l’application des indices statistiques pour synthétiser les informations
économiques et financières.
3
1 Chapitre 1 : Variables, Données Statistiques, Tableaux,
Effectifs
Ce chapitre se concentre sur les concepts fondamentaux de la statistique descriptive, intro-
duisant les bases nécessaires pour comprendre et travailler avec des données statistiques.
La science statistique représente une méthode scientifique essentielle pour le traitement des
données quantitatives. Étymologiquement, le terme "statistique" provient du latin "sta-
tus", signifiant état, ce qui souligne son rôle dans la description et l’analyse de l’état d’un
phénomène à partir de données empiriques. Cette discipline s’applique à une multitude
de domaines, de l’agronomie à la psychologie, en passant par la biologie, la démographie,
l’économie, la sociologie et la linguistique, entre autres.
En statistique, on s’intéresse à des unités statistiques ou unités d’observation, telles que des
individus, des entreprises ou des ménages. Dans la plupart des cas en sciences humaines, le
nombre d’unités est fini. Sur ces unités, on mesure un caractère ou une variable, qui peut
être le chiffre d’affaires d’une entreprise, le revenu d’un ménage, l’âge d’une personne ou
encore la catégorie socioprofessionnelle. On suppose généralement que la variable prend
une seule valeur sur chaque unité.
Pour des raisons de simplicité, les variables sont souvent désignées par des lettres, telles
que X, Y ou Z. Les valeurs possibles de la variable sont appelées modalités, et l’ensemble
de ces valeurs ou modalités constitue le domaine de la variable. Ainsi, la statistique permet
de quantifier, d’analyser, d’interpréter et de présenter les données, en mettant en lumière
les caractéristiques et les variations des phénomènes observés dans divers contextes.
Exemple 1
— Variable : Niveau de satisfaction
— Type : Qualitative Ordinale
— Modalités : Faible, Moyen, Élevé
— Unité de mesure : Non applicable (ordonnée)
— Utilisation : Évaluation avec un ordre, telle que le niveau de satisfaction des
clients.
Exemple 2
4
— Modalités : Nombres entiers (0, 1, 2, ...)
— Unité de mesure : Nombre d’enfants
— Utilisation : Comptage précis, comme le nombre d’enfants dans les familles.
a) Exemples :
— La population des ménages dans un quartier de Casablanca.
— La population des oliviers dans une région de l’Atlas marocain.
— La population des élèves d’une école primaire à Rabat.
Une population peut être exhaustive, couvrant l’ensemble des individus concernés, ou
bien être une partie de cet ensemble, auquel cas on parle d’échantillon. Par exemple,
les élèves de la première année d’une école primaire représentent un échantillon de la
population totale des élèves de l’école.
Types d’échantillons :
5
Chaque type d’échantillon a ses avantages et ses limites, et le choix du type d’échantillon
dépend des objectifs de l’étude, de la nature de la population et des ressources disponibles.
Dans le domaine des statistiques, une unité statistique est considérée comme le bloc de
base d’une population étudiée. Chaque unité représente un élément individuel au sein
de cette population, permettant aux chercheurs de collecter, analyser et interpréter des
données de manière précise et significative. Une population, dans ce contexte, est donc
un ensemble composé exclusivement d’unités statistiques partageant des caractéristiques
communes, facilitant l’étude d’un phénomène spécifique ou la réponse à une question de
recherche.
Exemples :
— Population des ménages dans un quartier de Casablanca : uci, une unité
statistique est représentée par un ménage individuel, tel que la famille Idrissi au
123 rue principale. Le choix de ménages comme unités statistiques permet aux
chercheurs de comprendre des dynamiques spécifiques, telles que la composition
des ménages, leurs revenus, leurs habitudes de vie, etc., dans ce quartier précis.
— Population des oliviers dans une région de l’Atlas marocain : ans ce cas,
une unité statistique est un olivier individuel. Cette spécification permet d’étudier
des aspects tels que l’âge des arbres, leur santé, leur productivité, ou leur distribu-
tion géographique, fournissant des informations précieuses pour l’agriculture et la
conservation.
— Population des élèves d’une école primaire à Rabat : Chaque élève, comme
Fatima en 4ème année, représente une unité statistique. Cela permet d’examiner
des variables telles que la performance académique, les besoins éducatifs spéci-
fiques, ou les tendances démographiques parmi les élèves, offrant une base pour
des décisions pédagogiques informées.
6
1.1.5 Caractère – Modalité
Un caractère est un attribut ou une propriété qui peut être mesurée ou observée chez
chaque unité statistique d’une population. Il s’agit d’un aspect spécifique du phénomène
étudié qui peut varier d’une unité à l’autre. La capacité d’identifier et de définir pré-
cisément ces caractères est essentielle pour structurer une enquête statistique et pour
permettre l’analyse des données recueillies.
Exemple :
— Population (P) : voitures circulant à Tanger.
— Unité statistique (U) : une voiture parmi celles circulant à Tanger.
— Caractères (C) : Ces caractères peuvent inclure l’âge de la voiture, la marque, le
modèle, le prix d’achat, la puissance du moteur, etc. Chacun de ces caractères peut
fournir des insights différents sur la population des voitures à Tanger, comme des
tendances dans les préférences des consommateurs, l’évolution du marché automo-
bile local, ou des aspects liés à l’environnement et à la consommation d’énergie.
Les modalités d’un caractère représentent les différentes valeurs ou états que peut
prendre ce caractère. En d’autres termes, les modalités sont les options ou les catégo-
ries spécifiques qui décrivent comment un caractère se manifeste au sein de la population
étudiée.
Exemple :
— Population (P) : étudiants de première année à la Faculté des Sciences Écono-
miques et de Gestion de Salé (FESG Salé).
— Unité statistique (U) : un étudiant de première année à la FESG Salé.
— Caractère (C) : Supposons que l’on s’intéresse aux caractères tels que la spéciali-
sation choisie par l’étudiant, son âge, et son genre.
— Modalités (M) : Supposons que l’on s’intéresse aux caractères tels que la spéciali-
sation choisie par l’étudiant, son âge, et son genre.
— Pour le caractère "spécialisation", les modalités pourraient inclure "Écono-
mie", "Gestion", "Comptabilité", etc.
— Pour l’âge, les modalités seraient les différentes tranches d’âge des étudiants,
par exemple "17-19 ans", "20-22 ans", etc.
— Pour le genre, les modalités typiques seraient "Masculin", "Féminin", et éven-
tuellement d’autres options selon le contexte de l’étude.
7
numériques. Elles peuvent être nominales ou ordinales.
— Variable nominale : Une variable nominale représente des catégories sans ordre
inhérent. Par exemple, la couleur des yeux (bleu, vert, marron) est une variable
nominale car il n’y a pas d’ordre naturel entre les couleurs.
— Variable ordinale : Une variable ordinale représente des catégories avec un ordre
inhérent. Par exemple, le niveau d’éducation (primaire, secondaire, universitaire)
est une variable ordinale car il existe un ordre naturel entre les niveaux d’éducation.
Exemples :
— Pour une étude sur les préférences alimentaires, la variable "type de cuisine préféré"
peut être une variable nominale avec des catégories telles que "italien", "chinois"
et "mexicain".
— Pour une enquête sur la satisfaction des clients, la variable "niveau de satisfaction"
peut être une variable ordinale avec des catégories telles que "insatisfait", "neutre"
et "satisfait".
Exemples :
— Pour une étude sur la croissance des plantes, la variable "hauteur des plantes" peut
être une variable continue car elle peut prendre n’importe quelle valeur positive.
— Pour une analyse démographique, la variable "nombre de personnes dans un mé-
nage" peut être une variable discrète car elle ne peut prendre que des valeurs
entières non négatives.
La typologie des variables est importante en analyse statistique car elle guide le choix des
techniques d’analyse les plus appropriées en fonction de la nature des données. tique.
8
Table 1 – Typologie des Variables
Les séries statistiques constituent l’épine dorsale de l’analyse statistique. Elles sont défi-
nies comme des ensembles d’observations recueillies autour d’une ou de plusieurs variables,
capturant les caractéristiques essentielles d’un phénomène ou d’une population étudiée.
Ces observations fournissent les données brutes nécessaires pour mener des analyses statis-
tiques, permettant de décrire, d’interpréter et parfois de prédire les aspects du phénomène
concerné.
Organisation des Données : Les données de ces séries peuvent être organisées de
manière structurée, comme dans des tableaux ou des listes, où chaque ligne représente
une observation et chaque colonne une variable. Cette organisation facilite l’analyse et
l’interprétation des données.
Analyse des Séries Statistiques : L’analyse de ces séries peut inclure le calcul de
mesures de tendance centrale (telles que la moyenne, la médiane, et le mode) et de dis-
persion (comme l’écart-type et la variance), ainsi que l’examen de la corrélation entre
9
variables. Ces analyses aident à synthétiser et à comprendre les propriétés fondamentales
des données.
Exemple Pratique :Prenons l’exemple des notes des étudiants dans un cours. Un ta-
bleau de série statistique pourrait lister les étudiants et leurs notes correspondantes. Dans
cet exemple, chaque ligne du tableau représente une observation (la note d’un étudiant
spécifique), formant une série statistique unidimensionnelle centrée sur la variable "Note".
L’analyse de cette série statistique permettrait de calculer la moyenne des notes, identifiant
ainsi la performance moyenne des étudiants, ou la variance, mesurant la dispersion des
notes autour de la moyenne. Ces analyses offrent des insights précieux sur la distribution
des performances des étudiants et peuvent aider à identifier les besoins en matière de
soutien pédagogique ou les domaines où la classe excelle.
En résumé, les séries statistiques jouent un rôle fondamental dans l’exploration et l’ana-
lyse des données. Elles permettent aux chercheurs et aux analystes de structurer les ob-
servations de manière significative, de réaliser des analyses approfondies et d’en tirer des
conclusions éclairées sur le phénomène étudié.
Étudiant Note
Étudiant 1 15
Étudiant 2 12
Étudiant 3 18
Étudiant 4 10
Étudiant 5 14
Étudiant 6 16
Étudiant 7 13
Les variables qualitatives nominales décrivent des caractéristiques qui ne peuvent pas être
quantifiées numériquement mais peuvent être catégorisées. Par exemple, le sexe, la couleur
ou la catégorie professionnelle sont des exemples de variables qualitatives nominales
10
Catégorie Effectifs Fréquences
Masculin 150 0.60
Féminin 100 0.40
Dans notre exemple de répartition des étudiants d’une université par sexe, nous avons
d’abord recueilli les données sur le nombre d’étudiants de chaque sexe. Supposons que
nous ayons trouvé 150 étudiants masculins et 100 étudiants féminins.
Pour calculer les fréquences relatives, nous divisons le nombre d’observations de chaque
catégorie par le nombre total d’observations. Dans notre cas, le nombre total d’observa-
tions est la somme des effectifs des deux catégories (150 + 100 = 250).
Ces valeurs de fréquences relatives sont ensuite incluses dans le tableau statistique pour
fournir une représentation claire de la répartition des catégories.
Diagramme en Secteurs et Diagramme en Barres : tilisation des diagrammes en
secteurs et en barres pour visualiser les données qualitatives nominales, facilitant l’inter-
prétation des proportions entre modalités.
Les variables qualitatives ordinales décrivent des caractéristiques qui peuvent être classées
dans un ordre spécifique mais sans qu’il y ait nécessairement une mesure numérique entre
11
elles. Par exemple, le niveau d’éducation (primaire, secondaire, supérieur) ou le niveau de
satisfaction (faible, moyen, élevé) sont des variables qualitatives ordinales.
0:Primaire
25% 0:Secondaire
35%
0:Supérieur
40%
Exemple : Diagramme en barres illustrant la répartition des étudiants par niveau d’édu-
cation.
100 80
80 70
Effectifs
60 50
40
20
0
Primaire Secondaire Supérieur
Niveau d’éducation
12
1.2.3 Variable Quantitative Discrète
Une variable quantitative discrète est une variable qui prend des valeurs spécifiques et
isolées, généralement des nombres entiers, et qui peuvent être comptées individuellement.
Ces valeurs ne peuvent pas être fractionnées en parties plus petites. Par exemple, le
nombre de frères et sœurs d’une personne, le nombre de livres dans une bibliothèque, ou
le nombre de points marqués lors d’un match sont des exemples de variables quantitatives
discrètes.
Le Tableau Statistique Lorsque nous travaillons avec des variables quantitatives dis-
crètes, nous organisons les données dans un tableau statistique pour une présentation
claire. Ce tableau comporte généralement deux colonnes : une pour les modalités de la
variable (dans notre cas, le nombre de personnes dans chaque ménage) et une pour les
effectifs correspondants. Nous avons déjà vu un exemple de tableau statistique pour notre
variable précédente. Maintenant, nous allons explorer comment représenter visuellement
ces données à l’aide d’un diagramme en bâtons.
10
10
8
8
Effectifs
6
5
4
3
2
2
0
10 11 12 13 14
Âge
13
Dans ce diagramme, chaque barre représente un effectif. Par exemple, il y a 5 individus
de 10 ans, 8 individus de 11 ans, et ainsi de suite.
Les variables quantitatives continues décrivent des caractéristiques qui peuvent prendre
une infinité de valeurs dans un intervalle donné. Par exemple, la taille, le poids, ou le
revenu sont des variables quantitatives continues.
Le Tableau Statistique Pour visualiser les données d’une variable quantitative conti-
nue, on utilise un histogramme où l’axe horizontal représente les classes ou les intervalles,
et l’axe vertical représente les effectifs de chaque classe. Voici un exemple d’un tel tableau
statistique pour les données de revenu précédentes :
Table 5 – Exemple de tableau statistique pour une variable quantitative continue (revenu
en DH)
Dans certains cas, il est nécessaire d’utiliser des classes de revenu avec des amplitudes
(C’est la différence entre la plus grande et la plus petite valeur de la classe) différentes
afin de regrouper les données de manière à ce que chaque classe couvre une plage de
valeurs similaire en termes de densité d’observations.
Cependant, dans ce scénario, nous ne pouvons pas tracer directement l’histogramme des
classes de revenu, car les largeurs des barres seraient inégales. Au lieu de cela, nous devons
utiliser des densités d’effectifs pour représenter graphiquement la distribution des données.
Pour calculer la densité d’effectifs pour chaque classe, nous divisons le nombre d’observa-
tions dans chaque classe par l’amplitudes ou la largeur de cette classe. Cela nous donne une
mesure de la densité d’observations par unité de revenu, ce qui nous permet de comparer
les classes de revenu malgré leurs amplitudes différentes.
Voici comment nous pouvons calculer les densités d’effectifs pour chaque classe de revenu :
14
10 10
— Pour la classe [1000, 2000[ : densité = 2000−1000
= 1000
= 0, 01
20 20
— Pour la classe [2000, 3000[ : densité = 3000−2000
= 1000
= 0, 02
25 25
— Pour la classe [3000, 4000[ : densité = 4000−3000
= 1000
= 0, 025
15 15
— Pour la classe [4000, 6000[ : densité = 6000−4000
= 2000
= 0, 0075
12 12
— Pour la classe [6000, 7000[ : densité = 7000−6000
= 1000
= 0, 012
Nous utlisons ces densités d’effectifs pour tracer un histogramme de densité, qui représente
graphiquement la distribution des données de revenu malgré les amplitudes différentes des
classes de revenu.
Dans cette section explore les différents types d’effectifs et de fréquences utilisés en sta-
tistiques descriptives pour résumer et analyser des ensembles de données. Ces mesures
fournissent des insights sur la distribution et la structure des données collectées.
1. La fréquence d’une valeur est le rapport entre l’effectif absolu de cette valeur
et le nombre total d’observations dans l’ensemble des données. Elle permet de
comprendre la proportion qu’une valeur représente dans l’ensemble des données.
2. Fréquence Relative La fréquence relative est une autre manière de nommer
la fréquence, soulignant son rôle dans la comparaison des proportions de chaque
catégorie par rapport au total des observations.
3. Fréquence Cumulée
(a) Croissante : La fréquence cumulée croissante est le total des fréquences rela-
tives jusqu’à un certain point, permettant de voir la proportion d’observations
qui sont inférieures ou égales à cette valeur.
(b) Décroissante : La fréquence cumulée décroissante est calculée en partant de
la fin et en cumulant les fréquences, montrant la proportion d’observations
supérieures ou égales à chaque valeur.
Présentons un tableau illustrant les fréquences et les fréquences cumulées pour un en-
semble de données fictif.
Dans cette section, nous explorons comment les fréquences et les fréquences cumulées
sont calculées à partir de l’effectif absolu, offrant une vue détaillée de la distribution des
données.
1. La fréquence d’une valeur est calculée en divisant l’effectif absolu de cette valeur
par le nombre total d’observations. Elle représente la part de chaque valeur dans
15
l’ensemble des données, exprimée en proportion.
2. Fréquence Cumulée
(a) Croissante : La fréquence cumulée croissante somme les fréquences de toutes
les valeurs précédentes jusqu’à la valeur actuelle, montrant la progression des
proportions cumulées dans l’ensemble des données.
(b) Décroissante : La fréquence cumulée décroissante calcule la somme des fré-
quences à partir d’une valeur donnée jusqu’à la dernière, illustrant la part cu-
mulative des valeurs supérieures ou égales à chaque point.
Voici un tableau qui combine les effectifs, les fréquences, et les fréquences cumulées pour
un ensemble de données fictif, permettant de visualiser comment chaque fréquence est
dérivée de l’effectif.
16
1.4 Exercices
17
Exercice 1.6 : Représentation des Préférences de Mode de Transport
Une enquête a été menée pour comprendre les préférences de mode de transport pour se
rendre au travail, avec les résultats suivants :
— Voiture : 120 personnes
— Transport en commun : 180 personnes
— Vélo : 60 personnes
— Marche : 90 personnes
— Autres : 30 personnes
Valeur Fréquence Fréquence Relative (%) Fréquence Cumulée Croissante Fréquence Cumulée D
A 0.10 10 10 100
B 0.20 20 30 90
C 0.30 30 60 70
D 0.40 40 100 40
Total 1.00 100 - -
18
1.5 Corrections
1. Tableau de Fréquence
Premièrement, calculons l’effectif pour chaque score de satisfaction :
Score de Satisfaction Effectif
1 1
2 5
3 7
4 5
5 2
2. Diagramme en Bâtons
Pour le diagramme en bâtons, nous représenterons chaque score de satisfaction sur
l’axe des abscisses (x) et l’effectif correspondant sur l’axe des ordonnées (y).
Le diagramme en bâtons ci-dessous montre l’effectif de chaque score de satisfaction
des clients. Comme nous pouvons le voir, le score 3 est le plus fréquent, indiquant
que la majorité des clients sont modérément satisfaits.
3. Diagramme Circulaire
Le diagramme circulaire ci-dessus illustre la répartition des scores de satisfaction
des clients. Il montre clairement que la majorité des clients ont attribué un score de
3, ce qui représente 35% des réponses, suivis par les scores de 2 et 4 (25% chacun),
tandis que les scores de 1 et 5 sont moins fréquents.
Ces graphiques fournissent une visualisation directe de la distribution des scores de satis-
faction, permettant de comprendre rapidement la répartition des données. La représenta-
tion graphique aide à identifier les tendances et à faire des comparaisons visuelles entre
les différentes catégories de données.
19
Exercice 1.2 : Analyse et Représentation des Âges
Pour rester dans l’esprit de l’exercice, nous choisirons des intervalles qui répar-
tissent de manière équitable :
— 19-22 ans
— 23-26 ans
— 27-30 ans
— 31-34 ans (pour couvrir jusqu’à l’âge maximum avec des intervalles égaux)
Calculons l’effectif dans chaque groupe :
20
Figure 4 – Réprtition des âges des participants au cours de musique
Pour classer les notes en catégories, nous pouvons définir les intervalles suivants :
— Échec : moins de 10
— Passable : 10 à 12
— Bien : 13 à 15
— Très bien : 16 à 17
— Excellent : 18 et plus
— Les notes données sont : 10, 12, 15, 9, 8, 16, 14, 18, 7, 13, 12, 11, 15, 16, 10.
Répartition selon les catégories :
— Échec : 3 notes (9, 8, 7)
— Passable : 4 notes (10, 12, 12, 11)
— Bien : 4 notes (15, 14, 13, 15)
— Très bien : 2 notes (16, 16)
— Excellent : 1 note (18)
2. Représentation avec un Diagramme en Bâtons ou un Histogramme
Pour visualiser cette distribution, nous pouvons utiliser un histogramme, car il
s’adapte bien à la représentation de données catégorisées.
3. Création d’un Diagramme de Répartition (Boîte à Moustaches)
21
Figure 5 – Diagramme en Bâtons Figure 6 – Diagramme Circulaire
22