0% ont trouvé ce document utile (0 vote)
941 vues36 pages

Cours de Statistique Descriptive

Le document présente un cours de statistique descriptive dispensé par Dr. Montassar Zayati à l'Université de Sousse. Il aborde les concepts fondamentaux de la statistique, y compris les unités statistiques, les populations, les caractères statistiques, et les types de variables. Le cours est structuré en plusieurs chapitres, chacun traitant des méthodes de présentation, d'analyse et de représentation des données statistiques.

Transféré par

Junior Ngongo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
941 vues36 pages

Cours de Statistique Descriptive

Le document présente un cours de statistique descriptive dispensé par Dr. Montassar Zayati à l'Université de Sousse. Il aborde les concepts fondamentaux de la statistique, y compris les unités statistiques, les populations, les caractères statistiques, et les types de variables. Le cours est structuré en plusieurs chapitres, chacun traitant des méthodes de présentation, d'analyse et de représentation des données statistiques.

Transféré par

Junior Ngongo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

République Tunisienne

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique


Université de Sousse

Institut Supérieur de Finances et de Fiscalité de Sousse

COURS DE STATISTIQUE
DESCRIPTIVE

Dr. MONTASSAR Zayati


Maître-assistant en méthodes quantitatives : spécialité économétrie
E-mail: zayati_monta@[Link]

Année Universitaire 2020/2021


Dr. Montassar Zayati : Cours de « Statistique Descriptive » 2

Sommaire
CHAPITRE 0 : INITIATION A LA STATISTIQUE DESCRIPTIVE 4
I. GENERALITES 4
II. RAPPEL SUR LE SIGNE DE SOMMATION « ∑ » : 5
1. CONVENTION D’ECRITURE : 5
2. LES PROPRIETES DU SYMBOLE « ∑ » : 5
3. QUELQUES SOMMES CLASSIQUES : 5
III. VOCABULAIRE STATISTIQUE : 5
1. UNITES STATISTIQUE : 5
2. POPULATION : 6
3. CARACTERE STATISTIQUE : 6
3.1. Caractère qualitatif : 6
3.2. Caractère quantitatif : 6
4. VARIABLES 6
5. MODALITE : 6
6. EFFECTIF : 7
7. NATURE DE LA VARIABLE : 7
7.1. Les variables qualitatives ordinaux et nominaux : 7
7.2. Les variables quantitatives discrètes et continues : 7
7.2.1. Les variables quantitatives discrètes : 7
7.2.2. Les variables quantitatives continues : 7
8. DENOMBREMENT : 9
8.1. Le recensement : 9
8.2. Le sondage : 9
9. FREQUENCE : 10
IV. APPLICATION ET MISE A NIVEAU : 11
CHAPITRE 1 : PRESENTATION DES SERIES STATISTIQUES 12
I. LE DEPOUILLEMENT : 12
II. MODES DE REGROUPEMENT DES UNITES STATISTIQUES 13
1. SERIE SIMPLE 13
2. DISTRIBUTION PAR VALEURS OU PAR MODALITES 14
2.1. Distribution par valeurs 14
2.2. Distribution par modalités 14
3. REGROUPEMENT PAR CATEGORIES 14
3.1. Catégories de valeurs 15
3.2. Catégories de modalités 15
III. LES TABLEAUX STATISTIQUES : 16
1. LES TABLEAUX A SIMPLE ENTREE : 16
1.1. Les tableaux de variables continues. 16
1.2. Les tableaux de variables discrètes : 17
2. LES TABLEAUX A DOUBLE ENTREE : 17
2.1. Les tableaux de variables continues. 17
2.1.1. Les tableaux de variablesdiscrets 18
IV. APPLICATION ET MISE A NIVEAU : 18
CHAPITRE 2 : LES TABLEAUX ET LES GRAPHIQUES STATISTIQUES 19
I. REPRESENTATION GRAPHIQUE D’UNE VARIABLE QUALITATIVE : 19
II. REPRESENTATION GRAPHIQUE D’UNE VARIABLE QUANTITATIVE : 20
1. LA VARIABLE STATISTIQUE DISCRETE : 21
2. LA VARIABLE QUANTITATIVE CONTINUE : 22
3. LE POLYGONE STATISTIQUE : 23
III. APPLICATION ET MISE A NIVEAU : 24
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 3

CHAPITRE 3 : LES CARACTERISTIQUES DE TENDANCE CENTRALE 26


I. LE MODE : 26
1. DEFINITION : 26
2. DETERMINATION DU MODE EN SERIE DISCRETE : 26
3. DETERMINATION DU MODE EN SERIE CONTINUE : 26
II. LA MOYENNE ARITHMETIQUE : 27
II. LA MOYENNE ARITHMETIQUE
III. LA MEDIANE : 28
1. DEFINITION : 28
2. LA MEDIANE EN SERIE DISCRETE : 28
2.1. La série est impaire : 28
2.2. La série est paire : 28
3. LA MEDIANE EN SERIE CONTINUE : 29
CHAPITRE 4 : LES CARACTERISTIQUES DE DISPERSION 30
I. L’ETENDUE : 30
II. L’INTERVALLE INTERQUARTILE 30
1. LES QUARTILES : 32
2. METHODE DE CALCUL DES QUARTILES : 32
3. INTERVALLE INTERQUATILE : 32
III. L’ECART MOYEN : 33
IV. LA VARIANCE (V) : 34
V. L’ECART TYPE : 35
VI. LE COEFFICIENT DE VARIATION : 35
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 4

Chapitre 0 : Initiation à la
Statistique Descriptive

I. Généralités
Le but de la statistique est de dégager les significations de données(numériques ou non)
obtenues au cours de l'étude d'un phénomène. Il faut distinguer les données statistiques (qui
sont les résultats d'observations recueillies lors de l'étude d'un phénomène), et la méthode
statistique(qui a pour objet l'étude rationnelle des données).

L’objectif de la statistique est de résumer de manière précise et pertinente,


l’informationcontenue dans une certaine quantité de données provenant de l’observation
d’unphénomène alé[Link] peut fabriquer des indicateurs pour décrire de manière
synthétique la masse de données: c’est la statistique descriptive. Ainsi plusieurs définitions
ont été proposées pour définir cette dernière. Gérard CALOT, dans son Cours de statistique
descriptive (DUNOD, 1965), définit la statistique comme une « méthode qui vise à la
description quantitative des ensembles nombreux, puis à analyser, à commenter et à critiquer
ces données ». C’est donc une méthode et non une théorie, une méthode quantitative et non
qualitative.

On divise souvent aujourd’hui l'étude de la statistique, au sens général, en deux parties :


 La statistique descriptive, qui est un ensemble de méthodes permettant de décrire les
unités statistiques (voir la section 3 pour une définition plus précise du terme "unité
statistique") qui composent une population (voir la section 3 pour une définition plus
précise du terme "population").
 La statistique Inductive (ou mathématique) dont l'objet est de formuler des lois à
partir de l'observation d'échantillons, c'est-à-dire de tirages limités effectués au sein
d’une population. La statistique mathématique intervient dans les enquêtes et les
sondages. Elle s'appuie sur la statistique descriptive, mais aussi sur le calcul des
probabilités.
Statistique

Descriptive Inductive
Tableaux, graphiques, statistiques Extrapolation des résultats d’échantillons
résumées, recherche de corrélation, etc… pour faire des prévisions basées sur des
calculs de probabilités.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 5

La statistique, qu’elle soit descriptive ou mathématique, est employée dans toutes les sciences,
ainsi que dans la vie quotidienne. Son utilisation très intensive dans le champ de l’économie a
fait naître une nouvelle expression : L’économétrie. L’économétrie est la modélisation
économique par l’outil statistique.

II. Rappel sur le signe de Sommation « ∑ » :

Le signe de sommation sera utilisé tout au long de ce cours, il est donc nécessaire d’en
rappeler les principales propriétés.

1. Convention d’écriture :
𝑛

𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 = 𝑥𝑖
𝑖=1
Cette écriture se lit : « somme de xi , i allant de 1 à n ».
Exemple : 𝑥1 = 3 ; 𝑥2 = 7 ; 𝑥3 = −4 ; 𝑥4 = −2 ; 𝑥5 = 0
5

𝑥𝑖 = 3 + 7 − 4 − 2 + 0 = 4
𝑖=1

2. Les propriétés du symbole « ∑ » :


𝑛 𝑛
 𝑖=1 𝑎𝑥𝑖 =𝑎 𝑖=1 𝑥𝑖
𝑛 𝑛 𝑛
 𝑖=1 𝑥𝑖 + 𝑗 =1 𝑦𝑖 = 𝑖=1 𝑥𝑖 + 𝑦𝑖
𝑛 𝑛 𝑛 𝑛
 𝑖=1 𝑥𝑖 ∗ 𝑗 =1 𝑦𝑗 = 𝑖=1 𝑥𝑖 𝑗 =1 𝑦𝑖

3. Quelques sommes classiques :


Somme des n premiers entiers naturels
𝑛(𝑛 + 1)
1 + 2 + 3 + ⋯+ 𝑛 =
2
Somme des carrés des n premiers entiers naturels
𝑛 𝑛 + 1 (2𝑛 + 1)
1² + 2² + 3² + ⋯ + 𝑛² =
6

III. Vocabulaire statistique :

1. Unités statistique :
Unités statistique : on appel unité statistique l’élément de l’ensemble que l’on veut
étudier.

Exemple :
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 6

Si l’on s’intéresse à l’école ESTIM ; un étudiant est considéré comme une unité statistique.

2. Population :
Population : on appel population l’ensemble des unités statistiques.

Exemple :
Si l’on s’intéresse aux étudiants qui étudies dans une faculté privé en économie à Sousse, on
pourra prendre comme population ESTIM.

3. Caractère statistique :
Caractère statistique : on appelle caractère statistique l’aspect du caractère retenue dans
le cadre de l’analyse.

Chaque unité statistique peut être étudiée selon un certain nombre de caractéristiques.
Exemple :
Au titre des caractères possibles, concernant un étudiant d’ESTIM on pourra trouver : la
couleur des yeux, nationalité, taille, niveau de vie, poids, niveau scolaire…

Remarque : le caractère étudié est soit de nature quantitative soit de nature qualitative.

3.1. Caractère qualitatif :


Dans le cas d’un caractère qualitatif celui-ci pourra ni être mesurer ni être repérer.
Exemple :
La couleur des yeux, niveau d’éducation, nationalité…

3.2. Caractère quantitatif :


Le caractère quantitatif peut être repérable ou mesurable ;
Exemple :
Taille de l’étudiant, poids, revenu des ménages….

4. Variables
Variable : on appelle variable l’expression numérique ou littérale du caractère, retenu dans
le cadre de l’analyse. On la note : Xi.

Exemple :
Dans le cadre d’une étude sur la couleur des yeux, la variable exprimera les différentes
couleurs possibles : bleu, noir, vert, etc. Si l’étude porte sur le nombre des étudiants dans
chaque niveau d’étude à ESTIM (L1, L2, Master), alors la variable sera numérique de type :
22, 18, 6, 10, …ainsi de suite.

5. Modalité :
Modalité :on appelle modalité l’aspect du caractère retenu dans le cadre de l’analyse.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 7

Exemple :
Si la caractéristique retenue est la couleur des téléphones portables du groupe d’étudiant
d’ESTIM présent dans ce cours de statistique descriptive pour l’année 2012/2013. Les
variables pourront être les couleurs envisageables soit : rouge, noir, vert, fleurit, blanc, etc.
parmi ces variables certaines seront retenues et forment les modalités par exemple : fleurit,
rouge et noir.

Remarque :

 Les modalités doivent être incompatibles : c'est-à-dire, il ne sera pas possible pour les
unités statistiques d’appartenir à deux modalités différentes.
 La liste des modalités doivent être exhaustive : c'est-à-dire, une unité statistique n’a
pas la possibilité de n’appartenir à aucune modalité.

6. Effectif :
Effectif : on appelle effectif le nombre d’unités statistiques pouvant être rattaché à la
même modalité. On le note : ni

Exemple :
Dans le cas précédent, on pourra avoir par exemple 6 étudiants qui ont un portable de couleur
noir et 2 étudiants qui ont un portable de couleur rouge.

7. Nature de la variable :
Nature de la variable : une variable peut être soit continue, soit discrète.

7.1. Les variables qualitatives ordinaux et nominaux :


Les modalités de certains caractères qualitatifs peuvent être ordonnées ou hiérarchisées.
On dit alors que le caractère est ordinal. C’est le cas par exemple de tous les caractères
qualitatifs dont les modalités sont des opinions. Lorsque les modalités d’un caractère ne
peuvent pas être ordonnées, le caractère est dit nominal. (par exemple : couleurs des yeux)

7.2. Les variables quantitatives discrètes et continues :


7.2.1. Les variables quantitatives discrètes :
Lorsque la variable ne peut prendre qu’une valeur unique et fini de valeurs, on parle de
variable discrète.
Exemple :
Pour le même cas précédent, la réponse ou la variable ne peut prendre qu’une valeur unique
bien fini allant de 0 à n.
7.2.2. Les variables quantitatives continues :
On parle de variables continues, lorsque celle-ci peut prendre un nombre infini de valeurs
dans un intervalle donné 𝛼 ; 𝛽 .
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 8
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 9

Remarque :
 La distinction entre caractère quantitatif continuet non continu (discret) peut donc
être présentée ainsi : un caractère quantitatif est dit « à valeurs discrètes » lorsque les
valeurs peuvent être comptées (on peut savoir combien il y en a à l’avance) et est dit « à
valeurs continues » lorsque les valeurs doivent être mesurées (on sait les mesurer mais
on ne peut pas dire directement combien il y en a). En se référant à cette distinction, on
dira alors que le nombre de pièces d’un appartement est un caractère quantitatif discret
car on peut compter le nombre de pièces. Inversement, on dira que la taille des unités
statistiques d’une population est un caractère quantitatif continu car pour savoir combien
mesure chaque unité on devra procéder à une mesure de la taille (idem pour le poids ou la
surface).

 En économie, certains caractères quantitatifs sont traités comme s’ils étaient continus,
alors qu’ils ne le sont pas : c’est le cas du revenu. Celui-ci est exprimé en unité
monétaires. Or les unités monétaires se ramènent à des unités discrètes, les centimes.
Mais comme ces valeurs sont très nombreuses et parfois (et même souvent) comportant
plus de 2 chiffres après la virgule, on procède par regroupement. En d’autres termes, on
traite le revenu comme un caractère quantitatif continu, quoiqu’il n’en soit pas un.

Exemple :
Pour la durée d’une conversation téléphonique, la variable pourrait être la suivante pour un
effectif de 42 personnes.
Temps écoulé
Effectif : (ni)
(en minutes)
0 ;5 10
5 ; 15 12
15 ; 30 20
Total 42

8. Dénombrement :
Dénombrement : le dénombrement d’une population peut être effectué de deux façons
différentes soit par sondage soit par recensement.

8.1. Le recensement :
Le recensement est l’action qui consiste à étudier une ou plusieurs caractéristiques de
l’ensemble d’une population. Cet méthode présente l’avantage de passer l’intégralité des
unités statistiques en revue, mais nécessite des moyens d’investigation extrêmement coûteux.

8.2. Le sondage :
Le sondage est l’étude d’une partie de la population appelée échantillon. Cet échantillon doit
respecter un certain nombre de contraintes. Notamment, il doit être représentatif (c'est-à-dire
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 10

présenter les mêmes caractéristiques que la population). Par la suite l’analyse fournira des
informations qui seront généralisés sur toute la population.

Il existe plusieurs méthodes d’échantillonnage. On peut citer par exemple :


 Le sondage par quotas.
 Le sondage aléatoire simple. (qui est le plus utilisés et le plus efficace).
 Le sondage raisonné.
 Le sondage stratifié.

9. Fréquence :
Fréquence : elle peut être de deux types : soit absolue (c’est l’effectif lui-même ni), soit
relative (rapport d’un effectif à l’effectif total) ;

On note la fréquence relative :


𝑃
𝑛𝑖
𝑓𝑖 = avec𝑁 = 𝑛𝑖
𝑁
𝑖=1

A MAITRISER PARFAITEMENT :

Le préalable qui consiste à définir :


 La population
 Le caractère
 L’unité statistique
 Les différents types de variables et leurs natures.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 11

IV. Application et mise à niveau :


Application 1:

Quels peuvent être, pour l’école d’ESTIM, les éléments à définir, afin de déterminer si les
étudiants apprécient l’ensemble de ces services.

Réponses :
 La population : l’ensemble des étudiants.
 L’unité statistique : l’un des étudiants.
 Le caractère statistique : le niveau de contentement des étudiants.
 La variable est qualitative : niveau de satisfaction ;
 Modalités : il sera possible d’avoir recours au découpage suivant : très satisfait,
satisfait, insatisfait, mécontent, etc.
L’effectif des étudiants est de 120.

Niveau de satisfaction Effectif


Très satisfait .
Satisfait .
Moyen .
insatisfait .
Mécontent .
TOTAL 120

Application 2 :

Dans le cadre d’une étude portant sur la couleur des téléphones portable les plus préférés qu’il
commercialise. M. Aristide vous demande comment définir la population, l’unité statistique,
le caractère et sa nature ainsi que les modalités possibles.

Question à choix multiples :

1. Un caractère ne peut être étudié que de manière discrète ou de manière continue ?


VRAI FAUX
2. La caractéristique « couleur des yeux » est une variable quantitative.
VRAI FAUX
3. L’effectif est l’expression numérique du caractère.
VRAI FAUX
4. Une unité statistique peut intégrer une ou plusieurs modalités.
VRAI FAUX
5. Il est préférable de faire un sondage plutôt qu’un recensement si l’on désire avoir une
étude significative à moindre coût.
VRAI FAUX
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 12

Chapitre 1 : Présentation des


séries statistiques

CE QU’IL FAUT SAVOIR

La présentation des séries statistiques est l’étape préalable à tout travail statistique. Elle peut
prendre deux formes :
 Un tableau ;
 Un graphique.
Les tableaux et les graphiques seront retenus en fonction des objectifs de l’étude.

I. Le dépouillement :

La réalisation d’un tableau statistique passe systématiquement par la mise en forme des
données brutes de l’expérience. Cette phase préliminaire est appelée le dépouillement.

Dépouillement : c’est l’action qui consiste à recenser, mettre en ordre croissant ou


décroissant les données résumées d’une distribution.

Exemple :
L’étude du nombre d’enfant à charge d’une population de 24 personnes employés par
l’entreprise LEMYON SA nous livre les résultats suivants :

P1 5 P13 3
P2 2 P14 3
P3 2 P15 1
P4 3 P16 0
P5 0 P17 0
P6 0 P18 0
P7 1 P19 0
P8 1 P20 2
P9 2 P21 1
P10 2 P22 4
P11 2 P23 2
P12 3 P24 0

La 1ièrepersonne interrogée a cinq enfants à charge.


La 6ièmepersonne interrogée n’a pas d’enfants à charge.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 13

Les données ainsi recueillies sont alors présentées dans un tableau, la série étant
préalablement classée en ordre croissant (ou décroissant).

Nombre d’enfants à charge Effectif (ni)


0 7
1 4
2 7
3 4
4 1
5 1
TOTAL 24

II. Modes de regroupement des unités statistiques


1. Série simple
Soit le tableau (A) suivant qui contient des statistiques macroéconomiques relatives aux
27 pays de l’UE, plus huit de ses principaux partenaires commerciaux.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 14

C’est un tableau de données brutes. Nous pouvons lire sur chaque ligne du tableau les
différentes valeurs ou modalités des variables ou des caractères associés à chacune des 35
unités statistiques de la population. Chaque colonne correspond à une série simple de valeurs
numériques ou de modalité[Link] exemple, dans le cas de la dimension « superficie », il y a 35
valeurs différentes. Dans le cas du caractère « monnaie », il y a 20 modalités différentes. Dans
le cas de la dimension « nombre de frontières terrestres avec d’autres pays de l’UE à 27 », les
35 pays se répartissent seulement sur 8 valeurs (si l’on exclut la valeur « 7 ») ou 9 valeurs (si
l’on inclut la valeur « 7 »).

Mais une présentation exhaustive, dans laquelle aucun regroupement n’est effectué, n’est
pas toujours pratique. Le plus souvent les données sont collectées et entrées dans l’ordinateur
sous forme d’un tableau brut, puis elles sont regroupées.

2. Distribution par valeurs ou par modalités


Suivant que le caractère est quantitatif ou qualitatif, on peut effectuer un regroupement par
valeurs ou un regroupement par modalités. Dans ce cas, on parle de distribution. Dans notre
exemple, la série initiale des 35 données va être distribuée sur un nombre généralement
inférieur (ou égal), de valeurs ou de modalités.

2.1. Distribution par valeurs


Prenons l’exemple de la variable « nombre de frontières terrestres avec d’autres pays de
l’UE à 27 » dans le tableau (A) ci-dessus. Un regroupement des 35 unités statistiques pour
chacune des valeurs possibles de la variable donnera alors le tableau suivant :

2.2. Distribution par modalités


Dans le tableau (A), nous allons choisir la monnaie officielle utilisée dans chaque
pays comme caractère qualitatif pour effectuer un regroupement par modalités. 16 sur les 35
pays sont dans la modalité « zone euro » et les 19 autres utilisent leur monnaie nationale.

3. Regroupement par catégories


Lorsqu’il y a beaucoup de valeurs ou de modalités, on peut procéder à un regroupement
par catégories de valeurs ou par catégories de modalités.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 15

3.1. Catégories de valeurs


Prenons l’exemple du caractère quantitatif « superficie » dans le tableau (A). Un
regroupement des 35 unités statistiques pour chacune des valeurs possibles de la variable
donnerait un tableau avec 35 valeurs, ce qui n’aurait aucun intérêt. En revanche, on peut créer
des classes de valeurs pour les superficies et répartir les 35 pays à l’intérieur de ces classes.
Comment procéder sachant que le plus petit pays (Malte) n’a qu’une superficie de 316 km2 et
le plus grand pays (La Russie) est caractérisé par une superficie de 17 075 200 km2 ? Si l’on
regarde les superficies des différents pays, on voit qu’un très grand nombre de pays ont des
superficies inférieures à 600 000 km2. Pour le faire apparaître, classons les pays par ordre
croissant de superficies (voir le tableau ci-après).

3.2. Catégories de modalités


Prenons l’exemple du caractère « nom du pays » dans le tableau (A). Un regroupement des
35 unités statistiques pour chacune des modalités possibles du caractère donnerait un tableau
avec 35 modalités, ce qui n’aurait aucun intérêt. En revanche, on peut créer des classes de
modalités pour les pays. On peut par exemple répartir les 35 pays selon les catégories
proposées par l’Organisation Mondiale du Commerce (OMC). Si l’on regroupe nos 35 pays
selon ces 6 catégories on obtient le tableau suivant :
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 16

A noter qu’il s’agit bien d’un regroupement par catégories de modalités car chaque pays
est en lui-même une modalité.

III. Les tableaux statistiques :


1. Les tableaux à simple entrée :
1.1. Les tableaux de variables continues.
Dans ce type de présentation seul un caractère est examiné. Sur la base d’une présentation
à deux colonnes (variable : Xi, effectif : ni), certains développements peuvent être réalisés :
une colonne d’effectifcumulé et defréquence relative pourra être ajoutée, ainsi qu’une
fréquence relative cumulée croissante ou décroissante.

Exemple :
Soit la répartition par classe d’âge des 60 ouvriers de l’entreprise RUBTON SA.

Classes d’âge Effectif 𝒏𝒊


𝒏𝒊 ↑ 𝒇𝒊 = 𝒇𝒊 ↑
(Xi) (ni) 𝑵
10
20 − 25 10 10 𝑓𝑖 = = 0,166 0,1666
60
25 − 30 20 30 0,3333 0.5
30 − 35 30 60 0,5 1
TOTAL 60 1

La colonne des effectifs cumulés ascendants s’interprétera en raisonnant sur la borne


supérieure de l’intervalle, en termes de « moins de » :
Soit :
 10 individus ont moins de 25 ans.
 30 individus ont moins de 30 ans.
 60 individus ont moins de 35 ans.
Les effectifs cumulés décroissants pourront aussi apparaître. Cette colonne s’obtient en
retirant au total de l’effectif des valeurs des effectifs respectifs de chaque ligne.

Classes d’âge Effectif 𝒏𝒊


𝒏𝒊 ↓ 𝒇𝒊 = 𝒇𝒊 ↓
(Xi) (ni) 𝑵
10
20 − 25 10 60 𝑓𝑖 = = 0,166 1
60
1 − 0,1667
25 − 30 20 50 0,3333
= 0,833
30 − 35 30 30 0,5 0,5
TOTAL 60 1

La colonne des effectifs cumulés décroissant s’interprétera en raisonnant sur la borne


inférieure de l’intervalle, en termes de « au moins », soit :
 60 individus ont au moins 20 ans.
 50 individus ont au moins 25 ans.
 30 individus ont au moins 30 ans.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 17

1.2. Les tableaux de variables discrètes :


Ces tableaux peuvent contenir les mêmes extensions que pour les variables continues.
Exemple :
Soit la répartition du nombre de lettres dactylographiées par un « pool » de secrétaires de
quarante personnes :
Nombre de lettres Employés
1 5
2 25
3 10
TOTAL 40

Remarque :
On peut souligner que lorsque la série est longue, il est possible d’opérer un regroupement en
classes et donc de présenter la série en continu.

2. Les tableaux à double entrée :


Il a été montré dans les paragraphes précédents que le tableau à simple entrée ne portait que
sur un seul caractère. Il est possible, moyennant une présentation spécifique, d’intégrer un
nouveau caractère nous conduisant à un tableau à double entrée.

2.1. Les tableaux de variables continues.


Soit l’étude d’une population de classe maternelle concernant les deux caractères
suivants :
 Age ;
 Poids.
Les résultats ci-dessous sont obtenus :

C1 C2 C3 C4 C5
L1 Poids / âge 𝟑−𝟒 𝟒−𝟓 𝟓−𝟔 TOTAUX
L2 < 15 19 7 1 27
L3 𝟏𝟓 − 𝟐𝟎 32 21 12 65
L4 𝟐𝟎 − 𝟐𝟓 3 18 28 49
L5 𝟐𝟓 − 𝟑𝟎 - - 1 1
L6 TOTAUX 54 46 42 142

La lecture peut être faite de la façon suivante :


 C2.L2 : 19 enfants âgés de 3 ans et moins de 4 ans pèsent moins de 15 kg.
 C4.L6 : 42 enfants sont entre 5 ans et moins de 6 ans.
 C5.L3 : 65 enfants pèsent entre 15 kg et moins de 20 kg.

Remarque :
Ces deux caractères quifigurent dans ce tableau auraient pu faire l’objet d’un traitement
séparé, c’est à dire que les résultats auraient pu êtreprésentés dans deux tableaux différents.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 18

2.1.1. Les tableaux de variablesdiscrets


Soit l’évolution du chiffre d’affaire par rapport à l’évolution des indices de la production
industrielle.
Chiffre d’affaires Indice de la
Année
(en millions de DT) production
1 11 110
2 23 140
3 27 180
4 29 150
5 30 150
6 32 185
7 37 190

IV. Application et mise à niveau :


Application 1:
Dans le tableau suivant figure la rémunération horaire d’une population d’ouvriers.

Rémunération 𝒏𝒊
𝟐𝟎 − 𝟐𝟓 22
𝟐𝟓 − 𝟑𝟎 44
𝟑𝟎 − 𝟑𝟓 25
𝟑𝟓 − 𝟓𝟓 16
𝟓𝟓 − 𝟖𝟎 15
𝟖𝟎 − 𝟏𝟎𝟎 8
Total 130

1/ Etablir les extensions qui permettent une interprétation directe.


2/ Interpréter la troisième ligne des cumuls ascendants que vous calculez.

Application 2:
Soit la série donnant les notes observées par une classe de 22 étudiants d’ESTIM :
0, 4, 4, 12, 14, 14, 16, 20, 11, 10, 10, 8, 8, 7, 6, 5, 12, 13, 3, 3, 9, 9.

1/ Etablir le tableau présentant la série de façon discrète, ainsi que les extensions de cumuls
ascendants et descendants.
2/ Présenter la série de façon continue avec les extensions de cumuls.

Application 3:
Une enquête sur le kilométrage de 2000 véhicules de l’entreprise de location « Julien Auto »
nous donne les résultats suivants :

𝟎−𝟓 𝟓 − 𝟏𝟎 𝟏𝟎 − 𝟏𝟓 𝟏𝟓 − 𝟐𝟎 > 20
322 640 740 198 100

1/ Présenter le tableau statistique faisant apparaître les fréquences relatives de la série, ainsi
que les cumuls ascendants et descendant.
2/ Effectuer les interprétations.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 19

Chapitre 2 : Les tableaux et les


graphiques statistiques

CE QU’IL FAUT SAVOIR :

La forme des représentations graphiques des données dépend de la nature du caractère étudié.
Dans le cadre de variables discrètes les représentations pourront être les suivants :
- Un diagramme en bâton ;
- Un diagramme en escalier.
Et dans le cas d’une variable continue :
- Un histogramme ;
- Un polygone statistique ;
- Un polygone cumulatif croissant,
- Un polygone cumulatif décroissant.
La variable qualitative, quand à elle, elle peut être représenté par :
- Le diagramme en bâtons,
- Les tuyaux d'orgue
- la représentation par secteurs.

I. Représentation graphique d’une variable qualitative :


Pour un caractère qualitatif, on utilise principalement deux types de représentation graphique :
le diagramme en bâtons (ou aussi en tuyaux d'orgue)et la représentation par secteurs.

- Le diagramme en tuyaux d’orgue ou en barres(ou piecharten anglais) est constitué d’une


suite de rectangles dont les hauteurs sont proportionnelles à l’effectif (ou à la fréquence)
de la variable et dont les bases sont identiques. La représentation peut être horizontale ou
verticale.

Exemple : On s'intéresse à la variable « état-civil » notée X et à la série statistique des valeurs


prises parX sur 20 personnes. La codification est :
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 20

- Le diagramme en secteurs ou en « camembert » visualise la part relative des catégories de


la variable sur une population. Le cercle représente l’ensemble de la population, les
différentes modalités seront représentées par des secteurs dont la surface est
proportionnelle aux effectifs ou aux fréquences. Une telle représentation n’est
significative que si le total des fréquences est de 100 %.La représentation en secteurs
visualise bien l’importance relative des différentes modalités.
Remarque :Pour faire le graphique en camembert, il reste à calculer la part que chaque
modalité représente dans 360° (voir le tableau ci-dessous).

Xi ni fi % Degrés
45 ∗ 360°
C 9 0,45 45% = 162°
100
35 ∗ 360°
M 7 0,35 35% = 126°
100
10 ∗ 360°
V 2 0,10 10% = 36°
100
D 2 0,10 10% 36°
Total 20 1 100% 360°

II. Représentation graphique d’une variable quantitative :


Dans certains cas, la représentation peut faire appel aux représentations décritesci-dessus.
Deux représentations graphiques retiendront plus particulièrementnotreattention,pourune
distribution statistique à caractère quantitatif :
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 21

- Le diagramme différentiel correspond à une représentation des effectifs ou des


fréquences.
- Le diagramme intégral correspond à une représentation des effectifs cumulés, ou
desfréquences cumulées.

1. La variable statistique discrète :


- Diagramme différentiel : diagramme en bâtons, des effectifs ou des fréquences. La
différence avec le cas qualitatif consiste en ce que les abscisses ici sont les valeurs de la
variable statistique.
- Diagramme intégral : courbe en escaliers des effectifs cumulés ou des fréquences
cumulées.

Exemple : Soit la répartition du nombre de voyages à l’étranger effectués par les membres
d’une même entreprise.

Cumuls
Voyages effectués effectifs fi(%) fi
croissant
0 5 5 5,61 5,61
1 17 22 19,10 24,71
2 31 53 34,83 59,54
3 20 73 22,47 82,01
4 11 84 12,36 94,37
5 4 88 4,5 98,87
6 1 89 1,12 1
Total 89 1

32 Effectif (ni)
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 Xi

Représentation graphique des effectifs

La représentation graphique intégrale correcte est la courbe en escalier : les fréquences des
diversesvaleurs de la variable statistique correspondent aux hauteurs des marches de la courbe
en escalier.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 22

2. La variable quantitative continue :


Les observations sont regroupées en [Link] classe possède une certaine
amplitude, qui est la longueur de l'intervalle définissant laclasse.
Le rapport entre l'effectif d'une classe et son amplitude s'appelle la densité d'effectif.
Le rapport entre la fréquence d'une classe et son amplitude s'appelle la densité de fréquence.

- Diagramme différentiel : histogramme des densités. Nous portons en abscisse les


classes représentant les modalités et en ordonnées des rectangles dont la longueur est
proportionnelle à la densité d'effectif ou à la densité de fréquence.
L'aire d'un rectangle de cet histogramme est alors proportionnelle à l'effectif ou à la fréquence
de la classe.

Exemple : emploi féminin par âge.


Dr. Montassar Zayati : Cours de « Statistique Descriptive » 23

- Diagramme intégral : courbe cumulative des effectifs ou des fré[Link] courbe


cumulative des fréquences doit représenter la fonction de répartition de la
[Link] courbe cumulative des effectifs (ou des fréquences) s’obtient en
joignant lespoints d’abscisse : la borne supérieure de la classe, et d’ordonnée :
l’effectifcumulé croissant correspondant.

3. Le polygone statistique :
Le polygone des fréquences lisse l’histogramme de façon à éliminer les ruptures qui
dépendent du choix du découpage en classe. Cette courbe est obtenue en joignant les sommets
au niveau du centre des classes. L’hypothèse retenue est que : si l’effectif total est
suffisamment grand( 𝑁 → ∞ ), et l’amplitude des classes suffisamment petite ( 𝑎 → 0 )
l’histogramme et le polygone peuvent être confondus, et peuvent admettre pour limite une
courbe continue appelée polygone statistique.

 Le polygone cumulatif :
La réalisation de cette courbe s’appuie sur l’interprétation faite sur les cumuls. On
utilisera donc les bornes supérieures pour les valeurs ascendantes, et les bornes inférieures
pour les valeurs descendantes.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 24

III. Application et mise à niveau :


Application 1 : Soit la représentation suivante :

1) Déterminer la nature de la variable, et préciser les modalités.


2) Présenter le tableau à l’origine de cette représentation.

Application 2 :
Une enquête portant sur les pays visités par les élèves d’un établissement scolaire nous donne
la répartition suivante :

Pays ni
Grande-Bretagne 27
Italie 37
Espagne 24
Portugal 13
Autres 13

1) Déterminer la nature du caractère étudié, ainsi que celle de la variable.


2) Représenter la distribution sur un graphique circulaire après avoir fait les extensions
de tableau nécessaires.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 25

Questions à choix Multiples (QCM):

1. La représentation de variables continues est un diagramme à barre ?


VRAI FAUX
2. La base des diagrammes à barres n’a pas d’importance réelle.
VRAI FAUX
3. Il est important de fermer son polygone statistique pour avoir une surface identique à
l’histogramme.
VRAI FAUX
4. Dans un diagramme circulaire, on peut représenter sans difficultés une variable discrète
ou une variable continue.
VRAI FAUX
5. La représentation en escalier est parfaitement adaptée dans le cas d’une série continue.
VRAI FAUX
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 26

Chapitre 3 : Les caractéristiques


de tendance centrale

CE QU’IL FAUT SAVOIR :


Les tableaux de nombres et les graphiques qui en découlent, donnent des séries statistiques
avec une vision relativement précise, mais permettent difficilement les comparaisons.
Il importe de préciser que certaines valeurs caractéristique d’une distribution diffèrent de part
leur position sur l’axe des abscisses, mais ont néanmoins une tendance à toujours se retrouver
au centre de la distribution : d’où l’appellation de caractéristique de tendance centrale.

I. Le mode :
1. Définition :
Le mode : on appelle mode, la valeur du caractère 𝑋𝑖 correspondant à la fréquence 𝑛𝑖 la
plus importante. On le note 𝐌𝐨 .

2. Détermination du mode en série discrète :


Dans le cas d’une série discrète, la détermination du mode à partir d’un tableau ou d’un
graphique est immédiate.
16 Effectif (ni)
15
14
13
𝑿𝒊 𝒏𝒊 12
11
0 2 10
9
1 3 8
7
2 15 6
5
4
3 3 3
2
Total 23 1
0
0 1 2 3 4 5 6 Xi

Le mode de la série est 𝐌𝐨 = 2, car cette valeur du caractère correspond à la fréquence la


plus élevée.

3. Détermination du mode en série continue :


Dans ce cas, la notion de mode fait place à la notion de classe modale.C’est la densité
maximale par intervalle unitaire. Nous définissons le mode, pour une variable quantitative
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 27

continue, en tenant compte des densités de fréquence des 2 classes adjacentes par la méthode
suivante.

La classe modale [ 𝑥𝑖 ; 𝑥𝑖+1 [ étant déterminée, le mode Mo vérifie :

𝑀𝑜 − 𝑥𝑖 𝑥𝑖+1 − 𝑀𝑜
=
∆1 ∆2

∆1
⟹ 𝑀𝑜 = 𝑥𝑖 + (𝑥 − 𝑥𝑖 )
∆1 + ∆2 𝑖+1

Remarque :
- Lorsque les classes adjacentes à la classe modale ont des densités de fréquences
égales, le mode coïncide avec le centre de la classe modale.
- Le mode dépend beaucoup de la répartition en classes.
- Une variable statistique peut présenter plusieurs modes locaux : on dit alors qu'elle est
plurimodale.

II. La moyenne arithmétique :


Exemple : calculer la moyenne de la série statistique suivante : 8 – 10 – 13 – 8 – 10 – 8.

8 + 10 + 13 + 8 + 10 + 8
𝑋= = 9,5
6

La présentation statistique de cette série est :


𝑿𝒊 𝒏𝒊
8 3 Le calcul de la moyenne peut alors être effectuer da la manière suivante :
10 2 8 ∗ 3 + 10 ∗ 2 + (13 ∗ 1)
𝑋= = 9,5
13 1 6
Total 23

Généralisation :

𝑥𝑖 𝑛𝑖
𝑋=
𝑁
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 28

Remarque :
- Parce qu’elle tient compte de toutes les valeurs de la variable, la moyenne est une
caractéristique attrayante.
- Elle subit malheureusement l’influence de valeurs extrêmes considérées comme
aberrantes.

III. La médiane :
1. Définition :
La médiane : on appelle médiane la valeur du caractère qui sépare l’effectif en deux
parties égales.

Remarque :
Cette définition implique le classement préalable des variables de la série, en ordre croissant
ou décroissant.

2. La Médiane en série discrète :


Deux cas peuvent être retenus.

2.1. La série est impaire :


Dans ce cas, il existe une valeur répondant parfaitement à la définition, et le rang de la
médiane est obtenu par la formule :
𝑁+1
𝑅𝑔 =
2
Exemple :
La série statistique suivante a pour effectif total 𝑁 = 7

Rang 1 2 3 4 5 6 7
𝑿𝒊 12 13 16 17 20 22 22

7+1
Calcul du rang :𝑅𝑔 = = 4𝑖è𝑚𝑒 posistion dans la série. Donc la médiane est 𝑀𝑒 = 17.
2

2.2. La série est paire :


Dans ce cas, il n’existe pas de valeur du caractère répondant à la définition. Il faut donc faire
appel à la notion d’intervalle médian.
Exemple :
La série statistique suivante a pour effectif total 𝑁 = 6

Rang 1 2 3 4 5 6
𝑿𝒊 12 13 16 17 20 22
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 29

Toutes les valeurs appartenant à l’intervalle 16 ; 17 pourront jouer le rôle de médiane. Une
valeur unique de la médiane est obtenu en effectuant la moyenne arithmétique des bornes de
16+17
l’intervalle médian. Donc la médiane est 𝑀𝑒 = = 16,5.
2

3. La médiane en série continue :


Dans le cas d’une série, on recherchera l’intervalle sur lequel se trouve la médiane
(l’intervalle médian). Le calcul se fera par interpolation linéaire.

La médiane, Me, est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5
ou 50%. Elle correspond donc au centre de la série statistique classée par ordre croissant, ou à
la valeur pour laquelle 50% des valeurs observées sont supérieures et 50% sont inférieures.

Exemple :

Soit les classes de rémunération de 40 employés d’une entreprise. Calculer la médiane.

𝑿𝒊 𝒏𝒊 𝒇𝒊 𝑭𝒊
6000 − 7000 5 0.125 0.125
7000 − 8000 13 0.325 0.450
8000 − 9000 19 0.475 0.925
9000 − 9500 3 0.075 1
Total 40 1
8000 ⟶ 0.425
𝑀𝑒 ⟶ 0.5
9000 ⟶ 0.925
Par interpolation linéaire :

𝑀𝑒 − 8000 0.5 − 0.425 0.075


= = = 0.105
9000 − 8000 0.925 − 0.45 0.475
𝑀𝑒 = 0.105 ∗ 9000 − 8000 + 8000 = 8105
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 30

Chapitre 4 : Les caractéristiques


de dispersion

CE QU’IL FAUT SAVOIR :

Les caractéristiques centrales précédemment définies (mode, moyenne, médiane) ne


permettent pas une comparaison suffisante des distributions proposées. Il est donc nécessaire
de définir un certain nombre de valeurs caractéristique qui assureront une comparaison plus
fine des séries. Ces valeurs se trouvent généralement ˝dispersées˝ autour des valeurs centrales,
d’où l’appellation de caractéristiques de dispersion.

I. L’étendue :
L’étendue : on appelle étendue d’une série la différence entre la plus petite et la plus
grande des valeurs d’une distribution.

Elle est notée W : W = X n - X1

Exemple :

Soit la série suivante :

Xi 1 4 6 8 9 19
W = 19 -1 = 18

Étendue

1 4 6 8 9 19

Propriétés :
L’étendue a l’avantage de présenter un calcul facile, du fait de l’utilisation exclusive des
valeurs extrêmes de la série. Elle présente néanmoins le désavantage de ne tenir compte que
des valeurs extrêmes, donc exceptionnelles.

II. L’intervalle interquartile


Avant de définir cette nouvelle caractéristique, il est nécessaire de rappeler quels sont les
éléments constitutifs.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 31
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 32

1. Les quartiles :
Les quartiles : les quartiles sont les trois valeurs du caractère qui séparent l’effectif en
quatre groupes d’effectifs égaux. On les notes Q1, Q2, Q3.

On pourra les identifier de la façon suivante :

75% Q3 25%

50% Q2 50%

25% Q1 75%

Remarque :

Il est possible d’opérer des subdivisions plus importantes en faisant la séparation en 10


effectifs ou en 100 effectifs de valeurs sensiblement égales, on parlera alors de déciles ou de
centiles.

2. Méthode de calcul des quartiles :


Le quartile le plus fréquemment calculé est Q2 car c’est en fait la médiane. La méthode de
calcul a été abordée au chapitre précédent. Les deux autres valeurs (Q1 et Q3) se déterminent
selon la même procédure (par interpolation linéaire proportionnelle).

3. Intervalle interquatile :
Intervalle interquartile : c’est la différence entre le troisième et le premier quartile.

Q3-Q1=Intervalle interquartile.

Exemple :

Soit la série suivante :

Xi ni fi Fi
[0-10[ 5 0,119 0,119
[10-20[ 15 0,357 0,476
[20-30[ 2 0,048 0,524
[30-40[ 20 0,476 1
Total 42 1

Calcul de Q1 :

𝐹 𝑄1 = 0,25 ⟹ 𝑄1 ∈ 10 − 20

10 ⟶ 0.119 𝑄1 − 10 0,25 − 0,119 0,131


𝑄1 ⟶ 0.25 ⟹ = ⟹ 𝑄1 = 10 + ∗ 10 ⟹ 𝑄1 = 13,67
20 − 10 0,476 − 0,119 0,357
20 ⟶ 0.476
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 33

Calcul de Q2 : (la médiane)

𝐹 𝑄2 = 0,5 ⟹ 𝑄1 ∈ 20 − 30

20 ⟶ 0.476 𝑄2 − 20 0,5 − 0,476 0,024


𝑄2 ⟶ 0.5 ⟹ = ⟹ 𝑄2 = 20 + ∗ 10 ⟹ 𝑄2 = 25
30 − 20 0,524 − 0,476 0,048
30 ⟶ 0.524
Calcul de Q3 :

𝐹 𝑄3 = 0,75 ⟹ 𝑄1 ∈ 30 − 40

30 ⟶ 0.524 𝑄3 − 30 0,75 − 0,524 0,226


𝑄3 ⟶ 0.75 ⟹ = ⟹ 𝑄3 = 30 + ∗ 10 ⟹ 𝑄2 = 34,75
40 − 30 1 − 0,524 0,476
40 ⟶ 1
L’intervalle interquartile = 𝑄3 − 𝑄1 = 34,75 − 13,67 = 21,08

Remarque :
L’intervalle interquartile présente l’avantage de ne pas prendre en compte les valeurs
extrêmes de la série et d’être de calcul [Link] présente l’inconvénient de ne pas prendre en
compte l’ensemble des valeurs de la série.

III. L’écart moyen :


L’écart moyen( 𝒆𝒙 ) : c’est la moyenne arithmétique des écarts à la moyenne.
𝑖=𝑝
1
𝑒𝑥 = 𝑋𝑖 − 𝑋 𝑛𝑖
𝑁
𝑖=1
𝑖=𝑝

𝑒𝑥 = 𝑋𝑖 − 𝑋 𝑓𝑖
𝑖=1

Rappel :
On appelle écart d’un nombre 𝑋𝑖 à un nombre n quelconque la valeur absolue de la différence
𝑋𝑖 moins n.
Ecart : 𝑋𝑖 − 𝑛

Exemple :
Soit la série statistique suivante :
𝑿𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 𝑿𝒊 − 𝑿 𝒏𝒊 𝑿𝒊 − 𝑿
0 − 10 5 25 18.8 94
10 − 20 15 225 8.8 132
20 − 30 2 50 1.2 2.4
30 − 40 20 700 11.2 224
Total 42 1000 40 452.4
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 34

𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 1000
𝑋= ⟹𝑋= = 23,8
𝑁 42
𝑖=𝑝
𝑛𝑖 𝑋𝑖 − 𝑋 452,4
𝑒𝑥 = ⟹ 𝑒𝑥 = = 10,77
𝑁 42
𝑖=1
Remarque :

L’écart absolu moyen a l’avantage de prendre en compte l’ensemble des valeurs de la


série. L’utilisation des valeurs absolues n’est pas toujours aisée dans les calculs
algé[Link] ce fait on lui préférera la variance.

IV. La variance (V) :


La variance : c’est la moyenne arithmétique du carré des écarts à la moyenne.
𝑖=𝑝
1
𝑉= 𝑛𝑖 𝑋𝑖 − 𝑋 ²
𝑁
𝑖=1
𝑖=𝑝

𝑉= 𝑓𝑖 𝑋𝑖 − 𝑋 ²
𝑖=1
𝑖=𝑝
1
𝑉= 𝑛𝑖 𝑋𝑖2 − 𝑋²
𝑁
𝑖=1

Exemple :

Soit la série statistique suivante :

𝑿𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 𝑿𝒊 − 𝑿 ² 𝒏𝒊 𝑿𝒊 − 𝑿 ²
0 1 0 45,1584 45,1584
1 2 2 32,7184 65,4368
4 7 28 7,3984 51,7888
7 6 42 0,0784 0,4704
9 7 63 5,1984 36,3888
10 6 60 10,7584 64,5504
Total 29 195 263,794

𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 195
𝑋= ⟹𝑋= = 6,72
𝑁 29
𝑖=𝑝
1 263,794
𝑉= 𝑛𝑖 𝑋𝑖 − 𝑋 ² = = 9,096
𝑁 29
𝑖=1
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 35

Remarque :

Les valeurs ainsi calculées peuvent parfois avoir peu de signification car exprimée au
carré. Par exemple, une dispersion portant sur le nombre d’enfants à charge s’exprimerait en
enfants carré.La nécessité de revenir à une unité plus ‘compréhensible’ conduit à utiliser
l’écart-type.

V. L’écart type :
L’écart type : c’est la racine carré de la variance.

𝜎= 𝑉

Exemple :

Sur les bases de la série précédente, il est possible de donner l’écart type suivante :

𝜎= 9,096 = 3,016

Remarque :L’écart type étant d’un calcul aisé, il est fréquemment utilisé dans des problèmes
de dispersion.

VI. Le coefficient de variation :


Les caractéristiques analysées ne permettent pas une comparaison parfaite de la
dispersion. En effet, l’utilisation d’une unité de mesure K fois plus grande débouche sur une
dispersion K fois plus grande pour une même série, d’où la nécessité d’utiliser une autre
caractéristique : le coefficient de variation.

L’utilisation du coefficient de variation permet de se libérer des problèmes d’unités, car


par définition, un coefficient est un nombre sans unité.

Coefficient de variation : c’est le rapport de l’écart type à la moyenne


𝜎
Coefficient de variation =
𝑋

Exemple :
3,016
Dans le cas précédent on obtient :Coefficient de variation = = 0,449
6,72
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 36

Application :

Calculer l’écart type et la variation de la série suivante :

𝑿𝒊 𝒏𝒊
100 − 200 2
200 − 300 7
300 − 400 10
400 − 600 12
600 − 700 9
TOTAL 40
Réponse :

Etablissons les extensions nécessaires au calcul de l’écart type et de la variance.

𝑪𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 (𝑿𝒊 − 𝑿)² 𝒏 𝒊 𝑿𝒊 − 𝑿 ²
150 2 300 18225 36450
250 7 1750 1729225 12104575
350 10 3500 9394225 93942250
500 12 6000 30969225 3,72E+08
650 9 5850 29322225 2,64E+08
Total 40 17400 71433125 7,42E+08

Calcul de la moyenne :
𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 17400
𝑋= ⟹𝑋= = 435
𝑁 40

Calcul de la variance :
𝑖=𝑝
1 7,42E08
𝑉= 𝑛𝑖 𝑋𝑖 − 𝑋 ² = = 18540350
𝑁 40
𝑖=1

D’où l’écart type suivant :


𝜎 = 18540350 = 4305,85

Le coefficient de variation est le suivant :

𝜎 4305,85
Coefficient de variation = = = 9,898
𝑋 435

Vous aimerez peut-être aussi