Cours de Statistique Descriptive
Cours de Statistique Descriptive
COURS DE STATISTIQUE
DESCRIPTIVE
Sommaire
CHAPITRE 0 : INITIATION A LA STATISTIQUE DESCRIPTIVE 4
I. GENERALITES 4
II. RAPPEL SUR LE SIGNE DE SOMMATION « ∑ » : 5
1. CONVENTION D’ECRITURE : 5
2. LES PROPRIETES DU SYMBOLE « ∑ » : 5
3. QUELQUES SOMMES CLASSIQUES : 5
III. VOCABULAIRE STATISTIQUE : 5
1. UNITES STATISTIQUE : 5
2. POPULATION : 6
3. CARACTERE STATISTIQUE : 6
3.1. Caractère qualitatif : 6
3.2. Caractère quantitatif : 6
4. VARIABLES 6
5. MODALITE : 6
6. EFFECTIF : 7
7. NATURE DE LA VARIABLE : 7
7.1. Les variables qualitatives ordinaux et nominaux : 7
7.2. Les variables quantitatives discrètes et continues : 7
7.2.1. Les variables quantitatives discrètes : 7
7.2.2. Les variables quantitatives continues : 7
8. DENOMBREMENT : 9
8.1. Le recensement : 9
8.2. Le sondage : 9
9. FREQUENCE : 10
IV. APPLICATION ET MISE A NIVEAU : 11
CHAPITRE 1 : PRESENTATION DES SERIES STATISTIQUES 12
I. LE DEPOUILLEMENT : 12
II. MODES DE REGROUPEMENT DES UNITES STATISTIQUES 13
1. SERIE SIMPLE 13
2. DISTRIBUTION PAR VALEURS OU PAR MODALITES 14
2.1. Distribution par valeurs 14
2.2. Distribution par modalités 14
3. REGROUPEMENT PAR CATEGORIES 14
3.1. Catégories de valeurs 15
3.2. Catégories de modalités 15
III. LES TABLEAUX STATISTIQUES : 16
1. LES TABLEAUX A SIMPLE ENTREE : 16
1.1. Les tableaux de variables continues. 16
1.2. Les tableaux de variables discrètes : 17
2. LES TABLEAUX A DOUBLE ENTREE : 17
2.1. Les tableaux de variables continues. 17
2.1.1. Les tableaux de variablesdiscrets 18
IV. APPLICATION ET MISE A NIVEAU : 18
CHAPITRE 2 : LES TABLEAUX ET LES GRAPHIQUES STATISTIQUES 19
I. REPRESENTATION GRAPHIQUE D’UNE VARIABLE QUALITATIVE : 19
II. REPRESENTATION GRAPHIQUE D’UNE VARIABLE QUANTITATIVE : 20
1. LA VARIABLE STATISTIQUE DISCRETE : 21
2. LA VARIABLE QUANTITATIVE CONTINUE : 22
3. LE POLYGONE STATISTIQUE : 23
III. APPLICATION ET MISE A NIVEAU : 24
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 3
Chapitre 0 : Initiation à la
Statistique Descriptive
I. Généralités
Le but de la statistique est de dégager les significations de données(numériques ou non)
obtenues au cours de l'étude d'un phénomène. Il faut distinguer les données statistiques (qui
sont les résultats d'observations recueillies lors de l'étude d'un phénomène), et la méthode
statistique(qui a pour objet l'étude rationnelle des données).
Descriptive Inductive
Tableaux, graphiques, statistiques Extrapolation des résultats d’échantillons
résumées, recherche de corrélation, etc… pour faire des prévisions basées sur des
calculs de probabilités.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 5
La statistique, qu’elle soit descriptive ou mathématique, est employée dans toutes les sciences,
ainsi que dans la vie quotidienne. Son utilisation très intensive dans le champ de l’économie a
fait naître une nouvelle expression : L’économétrie. L’économétrie est la modélisation
économique par l’outil statistique.
Le signe de sommation sera utilisé tout au long de ce cours, il est donc nécessaire d’en
rappeler les principales propriétés.
1. Convention d’écriture :
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 = 𝑥𝑖
𝑖=1
Cette écriture se lit : « somme de xi , i allant de 1 à n ».
Exemple : 𝑥1 = 3 ; 𝑥2 = 7 ; 𝑥3 = −4 ; 𝑥4 = −2 ; 𝑥5 = 0
5
𝑥𝑖 = 3 + 7 − 4 − 2 + 0 = 4
𝑖=1
1. Unités statistique :
Unités statistique : on appel unité statistique l’élément de l’ensemble que l’on veut
étudier.
Exemple :
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 6
Si l’on s’intéresse à l’école ESTIM ; un étudiant est considéré comme une unité statistique.
2. Population :
Population : on appel population l’ensemble des unités statistiques.
Exemple :
Si l’on s’intéresse aux étudiants qui étudies dans une faculté privé en économie à Sousse, on
pourra prendre comme population ESTIM.
3. Caractère statistique :
Caractère statistique : on appelle caractère statistique l’aspect du caractère retenue dans
le cadre de l’analyse.
Chaque unité statistique peut être étudiée selon un certain nombre de caractéristiques.
Exemple :
Au titre des caractères possibles, concernant un étudiant d’ESTIM on pourra trouver : la
couleur des yeux, nationalité, taille, niveau de vie, poids, niveau scolaire…
Remarque : le caractère étudié est soit de nature quantitative soit de nature qualitative.
4. Variables
Variable : on appelle variable l’expression numérique ou littérale du caractère, retenu dans
le cadre de l’analyse. On la note : Xi.
Exemple :
Dans le cadre d’une étude sur la couleur des yeux, la variable exprimera les différentes
couleurs possibles : bleu, noir, vert, etc. Si l’étude porte sur le nombre des étudiants dans
chaque niveau d’étude à ESTIM (L1, L2, Master), alors la variable sera numérique de type :
22, 18, 6, 10, …ainsi de suite.
5. Modalité :
Modalité :on appelle modalité l’aspect du caractère retenu dans le cadre de l’analyse.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 7
Exemple :
Si la caractéristique retenue est la couleur des téléphones portables du groupe d’étudiant
d’ESTIM présent dans ce cours de statistique descriptive pour l’année 2012/2013. Les
variables pourront être les couleurs envisageables soit : rouge, noir, vert, fleurit, blanc, etc.
parmi ces variables certaines seront retenues et forment les modalités par exemple : fleurit,
rouge et noir.
Remarque :
Les modalités doivent être incompatibles : c'est-à-dire, il ne sera pas possible pour les
unités statistiques d’appartenir à deux modalités différentes.
La liste des modalités doivent être exhaustive : c'est-à-dire, une unité statistique n’a
pas la possibilité de n’appartenir à aucune modalité.
6. Effectif :
Effectif : on appelle effectif le nombre d’unités statistiques pouvant être rattaché à la
même modalité. On le note : ni
Exemple :
Dans le cas précédent, on pourra avoir par exemple 6 étudiants qui ont un portable de couleur
noir et 2 étudiants qui ont un portable de couleur rouge.
7. Nature de la variable :
Nature de la variable : une variable peut être soit continue, soit discrète.
Remarque :
La distinction entre caractère quantitatif continuet non continu (discret) peut donc
être présentée ainsi : un caractère quantitatif est dit « à valeurs discrètes » lorsque les
valeurs peuvent être comptées (on peut savoir combien il y en a à l’avance) et est dit « à
valeurs continues » lorsque les valeurs doivent être mesurées (on sait les mesurer mais
on ne peut pas dire directement combien il y en a). En se référant à cette distinction, on
dira alors que le nombre de pièces d’un appartement est un caractère quantitatif discret
car on peut compter le nombre de pièces. Inversement, on dira que la taille des unités
statistiques d’une population est un caractère quantitatif continu car pour savoir combien
mesure chaque unité on devra procéder à une mesure de la taille (idem pour le poids ou la
surface).
En économie, certains caractères quantitatifs sont traités comme s’ils étaient continus,
alors qu’ils ne le sont pas : c’est le cas du revenu. Celui-ci est exprimé en unité
monétaires. Or les unités monétaires se ramènent à des unités discrètes, les centimes.
Mais comme ces valeurs sont très nombreuses et parfois (et même souvent) comportant
plus de 2 chiffres après la virgule, on procède par regroupement. En d’autres termes, on
traite le revenu comme un caractère quantitatif continu, quoiqu’il n’en soit pas un.
Exemple :
Pour la durée d’une conversation téléphonique, la variable pourrait être la suivante pour un
effectif de 42 personnes.
Temps écoulé
Effectif : (ni)
(en minutes)
0 ;5 10
5 ; 15 12
15 ; 30 20
Total 42
8. Dénombrement :
Dénombrement : le dénombrement d’une population peut être effectué de deux façons
différentes soit par sondage soit par recensement.
8.1. Le recensement :
Le recensement est l’action qui consiste à étudier une ou plusieurs caractéristiques de
l’ensemble d’une population. Cet méthode présente l’avantage de passer l’intégralité des
unités statistiques en revue, mais nécessite des moyens d’investigation extrêmement coûteux.
8.2. Le sondage :
Le sondage est l’étude d’une partie de la population appelée échantillon. Cet échantillon doit
respecter un certain nombre de contraintes. Notamment, il doit être représentatif (c'est-à-dire
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 10
présenter les mêmes caractéristiques que la population). Par la suite l’analyse fournira des
informations qui seront généralisés sur toute la population.
9. Fréquence :
Fréquence : elle peut être de deux types : soit absolue (c’est l’effectif lui-même ni), soit
relative (rapport d’un effectif à l’effectif total) ;
A MAITRISER PARFAITEMENT :
Quels peuvent être, pour l’école d’ESTIM, les éléments à définir, afin de déterminer si les
étudiants apprécient l’ensemble de ces services.
Réponses :
La population : l’ensemble des étudiants.
L’unité statistique : l’un des étudiants.
Le caractère statistique : le niveau de contentement des étudiants.
La variable est qualitative : niveau de satisfaction ;
Modalités : il sera possible d’avoir recours au découpage suivant : très satisfait,
satisfait, insatisfait, mécontent, etc.
L’effectif des étudiants est de 120.
Application 2 :
Dans le cadre d’une étude portant sur la couleur des téléphones portable les plus préférés qu’il
commercialise. M. Aristide vous demande comment définir la population, l’unité statistique,
le caractère et sa nature ainsi que les modalités possibles.
La présentation des séries statistiques est l’étape préalable à tout travail statistique. Elle peut
prendre deux formes :
Un tableau ;
Un graphique.
Les tableaux et les graphiques seront retenus en fonction des objectifs de l’étude.
I. Le dépouillement :
La réalisation d’un tableau statistique passe systématiquement par la mise en forme des
données brutes de l’expérience. Cette phase préliminaire est appelée le dépouillement.
Exemple :
L’étude du nombre d’enfant à charge d’une population de 24 personnes employés par
l’entreprise LEMYON SA nous livre les résultats suivants :
P1 5 P13 3
P2 2 P14 3
P3 2 P15 1
P4 3 P16 0
P5 0 P17 0
P6 0 P18 0
P7 1 P19 0
P8 1 P20 2
P9 2 P21 1
P10 2 P22 4
P11 2 P23 2
P12 3 P24 0
Les données ainsi recueillies sont alors présentées dans un tableau, la série étant
préalablement classée en ordre croissant (ou décroissant).
C’est un tableau de données brutes. Nous pouvons lire sur chaque ligne du tableau les
différentes valeurs ou modalités des variables ou des caractères associés à chacune des 35
unités statistiques de la population. Chaque colonne correspond à une série simple de valeurs
numériques ou de modalité[Link] exemple, dans le cas de la dimension « superficie », il y a 35
valeurs différentes. Dans le cas du caractère « monnaie », il y a 20 modalités différentes. Dans
le cas de la dimension « nombre de frontières terrestres avec d’autres pays de l’UE à 27 », les
35 pays se répartissent seulement sur 8 valeurs (si l’on exclut la valeur « 7 ») ou 9 valeurs (si
l’on inclut la valeur « 7 »).
Mais une présentation exhaustive, dans laquelle aucun regroupement n’est effectué, n’est
pas toujours pratique. Le plus souvent les données sont collectées et entrées dans l’ordinateur
sous forme d’un tableau brut, puis elles sont regroupées.
A noter qu’il s’agit bien d’un regroupement par catégories de modalités car chaque pays
est en lui-même une modalité.
Exemple :
Soit la répartition par classe d’âge des 60 ouvriers de l’entreprise RUBTON SA.
Remarque :
On peut souligner que lorsque la série est longue, il est possible d’opérer un regroupement en
classes et donc de présenter la série en continu.
C1 C2 C3 C4 C5
L1 Poids / âge 𝟑−𝟒 𝟒−𝟓 𝟓−𝟔 TOTAUX
L2 < 15 19 7 1 27
L3 𝟏𝟓 − 𝟐𝟎 32 21 12 65
L4 𝟐𝟎 − 𝟐𝟓 3 18 28 49
L5 𝟐𝟓 − 𝟑𝟎 - - 1 1
L6 TOTAUX 54 46 42 142
Remarque :
Ces deux caractères quifigurent dans ce tableau auraient pu faire l’objet d’un traitement
séparé, c’est à dire que les résultats auraient pu êtreprésentés dans deux tableaux différents.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 18
Rémunération 𝒏𝒊
𝟐𝟎 − 𝟐𝟓 22
𝟐𝟓 − 𝟑𝟎 44
𝟑𝟎 − 𝟑𝟓 25
𝟑𝟓 − 𝟓𝟓 16
𝟓𝟓 − 𝟖𝟎 15
𝟖𝟎 − 𝟏𝟎𝟎 8
Total 130
Application 2:
Soit la série donnant les notes observées par une classe de 22 étudiants d’ESTIM :
0, 4, 4, 12, 14, 14, 16, 20, 11, 10, 10, 8, 8, 7, 6, 5, 12, 13, 3, 3, 9, 9.
1/ Etablir le tableau présentant la série de façon discrète, ainsi que les extensions de cumuls
ascendants et descendants.
2/ Présenter la série de façon continue avec les extensions de cumuls.
Application 3:
Une enquête sur le kilométrage de 2000 véhicules de l’entreprise de location « Julien Auto »
nous donne les résultats suivants :
𝟎−𝟓 𝟓 − 𝟏𝟎 𝟏𝟎 − 𝟏𝟓 𝟏𝟓 − 𝟐𝟎 > 20
322 640 740 198 100
1/ Présenter le tableau statistique faisant apparaître les fréquences relatives de la série, ainsi
que les cumuls ascendants et descendant.
2/ Effectuer les interprétations.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 19
La forme des représentations graphiques des données dépend de la nature du caractère étudié.
Dans le cadre de variables discrètes les représentations pourront être les suivants :
- Un diagramme en bâton ;
- Un diagramme en escalier.
Et dans le cas d’une variable continue :
- Un histogramme ;
- Un polygone statistique ;
- Un polygone cumulatif croissant,
- Un polygone cumulatif décroissant.
La variable qualitative, quand à elle, elle peut être représenté par :
- Le diagramme en bâtons,
- Les tuyaux d'orgue
- la représentation par secteurs.
Xi ni fi % Degrés
45 ∗ 360°
C 9 0,45 45% = 162°
100
35 ∗ 360°
M 7 0,35 35% = 126°
100
10 ∗ 360°
V 2 0,10 10% = 36°
100
D 2 0,10 10% 36°
Total 20 1 100% 360°
Exemple : Soit la répartition du nombre de voyages à l’étranger effectués par les membres
d’une même entreprise.
Cumuls
Voyages effectués effectifs fi(%) fi
croissant
0 5 5 5,61 5,61
1 17 22 19,10 24,71
2 31 53 34,83 59,54
3 20 73 22,47 82,01
4 11 84 12,36 94,37
5 4 88 4,5 98,87
6 1 89 1,12 1
Total 89 1
32 Effectif (ni)
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 Xi
La représentation graphique intégrale correcte est la courbe en escalier : les fréquences des
diversesvaleurs de la variable statistique correspondent aux hauteurs des marches de la courbe
en escalier.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 22
3. Le polygone statistique :
Le polygone des fréquences lisse l’histogramme de façon à éliminer les ruptures qui
dépendent du choix du découpage en classe. Cette courbe est obtenue en joignant les sommets
au niveau du centre des classes. L’hypothèse retenue est que : si l’effectif total est
suffisamment grand( 𝑁 → ∞ ), et l’amplitude des classes suffisamment petite ( 𝑎 → 0 )
l’histogramme et le polygone peuvent être confondus, et peuvent admettre pour limite une
courbe continue appelée polygone statistique.
Le polygone cumulatif :
La réalisation de cette courbe s’appuie sur l’interprétation faite sur les cumuls. On
utilisera donc les bornes supérieures pour les valeurs ascendantes, et les bornes inférieures
pour les valeurs descendantes.
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 24
Application 2 :
Une enquête portant sur les pays visités par les élèves d’un établissement scolaire nous donne
la répartition suivante :
Pays ni
Grande-Bretagne 27
Italie 37
Espagne 24
Portugal 13
Autres 13
I. Le mode :
1. Définition :
Le mode : on appelle mode, la valeur du caractère 𝑋𝑖 correspondant à la fréquence 𝑛𝑖 la
plus importante. On le note 𝐌𝐨 .
continue, en tenant compte des densités de fréquence des 2 classes adjacentes par la méthode
suivante.
𝑀𝑜 − 𝑥𝑖 𝑥𝑖+1 − 𝑀𝑜
=
∆1 ∆2
∆1
⟹ 𝑀𝑜 = 𝑥𝑖 + (𝑥 − 𝑥𝑖 )
∆1 + ∆2 𝑖+1
Remarque :
- Lorsque les classes adjacentes à la classe modale ont des densités de fréquences
égales, le mode coïncide avec le centre de la classe modale.
- Le mode dépend beaucoup de la répartition en classes.
- Une variable statistique peut présenter plusieurs modes locaux : on dit alors qu'elle est
plurimodale.
8 + 10 + 13 + 8 + 10 + 8
𝑋= = 9,5
6
Généralisation :
𝑥𝑖 𝑛𝑖
𝑋=
𝑁
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 28
Remarque :
- Parce qu’elle tient compte de toutes les valeurs de la variable, la moyenne est une
caractéristique attrayante.
- Elle subit malheureusement l’influence de valeurs extrêmes considérées comme
aberrantes.
III. La médiane :
1. Définition :
La médiane : on appelle médiane la valeur du caractère qui sépare l’effectif en deux
parties égales.
Remarque :
Cette définition implique le classement préalable des variables de la série, en ordre croissant
ou décroissant.
Rang 1 2 3 4 5 6 7
𝑿𝒊 12 13 16 17 20 22 22
7+1
Calcul du rang :𝑅𝑔 = = 4𝑖è𝑚𝑒 posistion dans la série. Donc la médiane est 𝑀𝑒 = 17.
2
Rang 1 2 3 4 5 6
𝑿𝒊 12 13 16 17 20 22
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 29
Toutes les valeurs appartenant à l’intervalle 16 ; 17 pourront jouer le rôle de médiane. Une
valeur unique de la médiane est obtenu en effectuant la moyenne arithmétique des bornes de
16+17
l’intervalle médian. Donc la médiane est 𝑀𝑒 = = 16,5.
2
La médiane, Me, est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5
ou 50%. Elle correspond donc au centre de la série statistique classée par ordre croissant, ou à
la valeur pour laquelle 50% des valeurs observées sont supérieures et 50% sont inférieures.
Exemple :
𝑿𝒊 𝒏𝒊 𝒇𝒊 𝑭𝒊
6000 − 7000 5 0.125 0.125
7000 − 8000 13 0.325 0.450
8000 − 9000 19 0.475 0.925
9000 − 9500 3 0.075 1
Total 40 1
8000 ⟶ 0.425
𝑀𝑒 ⟶ 0.5
9000 ⟶ 0.925
Par interpolation linéaire :
I. L’étendue :
L’étendue : on appelle étendue d’une série la différence entre la plus petite et la plus
grande des valeurs d’une distribution.
Exemple :
Xi 1 4 6 8 9 19
W = 19 -1 = 18
Étendue
1 4 6 8 9 19
Propriétés :
L’étendue a l’avantage de présenter un calcul facile, du fait de l’utilisation exclusive des
valeurs extrêmes de la série. Elle présente néanmoins le désavantage de ne tenir compte que
des valeurs extrêmes, donc exceptionnelles.
1. Les quartiles :
Les quartiles : les quartiles sont les trois valeurs du caractère qui séparent l’effectif en
quatre groupes d’effectifs égaux. On les notes Q1, Q2, Q3.
75% Q3 25%
50% Q2 50%
25% Q1 75%
Remarque :
3. Intervalle interquatile :
Intervalle interquartile : c’est la différence entre le troisième et le premier quartile.
Q3-Q1=Intervalle interquartile.
Exemple :
Xi ni fi Fi
[0-10[ 5 0,119 0,119
[10-20[ 15 0,357 0,476
[20-30[ 2 0,048 0,524
[30-40[ 20 0,476 1
Total 42 1
Calcul de Q1 :
𝐹 𝑄1 = 0,25 ⟹ 𝑄1 ∈ 10 − 20
𝐹 𝑄2 = 0,5 ⟹ 𝑄1 ∈ 20 − 30
𝐹 𝑄3 = 0,75 ⟹ 𝑄1 ∈ 30 − 40
Remarque :
L’intervalle interquartile présente l’avantage de ne pas prendre en compte les valeurs
extrêmes de la série et d’être de calcul [Link] présente l’inconvénient de ne pas prendre en
compte l’ensemble des valeurs de la série.
𝑒𝑥 = 𝑋𝑖 − 𝑋 𝑓𝑖
𝑖=1
Rappel :
On appelle écart d’un nombre 𝑋𝑖 à un nombre n quelconque la valeur absolue de la différence
𝑋𝑖 moins n.
Ecart : 𝑋𝑖 − 𝑛
Exemple :
Soit la série statistique suivante :
𝑿𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 𝑿𝒊 − 𝑿 𝒏𝒊 𝑿𝒊 − 𝑿
0 − 10 5 25 18.8 94
10 − 20 15 225 8.8 132
20 − 30 2 50 1.2 2.4
30 − 40 20 700 11.2 224
Total 42 1000 40 452.4
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 34
𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 1000
𝑋= ⟹𝑋= = 23,8
𝑁 42
𝑖=𝑝
𝑛𝑖 𝑋𝑖 − 𝑋 452,4
𝑒𝑥 = ⟹ 𝑒𝑥 = = 10,77
𝑁 42
𝑖=1
Remarque :
𝑉= 𝑓𝑖 𝑋𝑖 − 𝑋 ²
𝑖=1
𝑖=𝑝
1
𝑉= 𝑛𝑖 𝑋𝑖2 − 𝑋²
𝑁
𝑖=1
Exemple :
𝑿𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 𝑿𝒊 − 𝑿 ² 𝒏𝒊 𝑿𝒊 − 𝑿 ²
0 1 0 45,1584 45,1584
1 2 2 32,7184 65,4368
4 7 28 7,3984 51,7888
7 6 42 0,0784 0,4704
9 7 63 5,1984 36,3888
10 6 60 10,7584 64,5504
Total 29 195 263,794
𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 195
𝑋= ⟹𝑋= = 6,72
𝑁 29
𝑖=𝑝
1 263,794
𝑉= 𝑛𝑖 𝑋𝑖 − 𝑋 ² = = 9,096
𝑁 29
𝑖=1
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 35
Remarque :
Les valeurs ainsi calculées peuvent parfois avoir peu de signification car exprimée au
carré. Par exemple, une dispersion portant sur le nombre d’enfants à charge s’exprimerait en
enfants carré.La nécessité de revenir à une unité plus ‘compréhensible’ conduit à utiliser
l’écart-type.
V. L’écart type :
L’écart type : c’est la racine carré de la variance.
𝜎= 𝑉
Exemple :
Sur les bases de la série précédente, il est possible de donner l’écart type suivante :
𝜎= 9,096 = 3,016
Remarque :L’écart type étant d’un calcul aisé, il est fréquemment utilisé dans des problèmes
de dispersion.
Exemple :
3,016
Dans le cas précédent on obtient :Coefficient de variation = = 0,449
6,72
Dr. Montassar Zayati : Cours de « Statistique Descriptive » 36
Application :
𝑿𝒊 𝒏𝒊
100 − 200 2
200 − 300 7
300 − 400 10
400 − 600 12
600 − 700 9
TOTAL 40
Réponse :
𝑪𝒊 𝒏𝒊 𝑿𝒊 𝒏𝒊 (𝑿𝒊 − 𝑿)² 𝒏 𝒊 𝑿𝒊 − 𝑿 ²
150 2 300 18225 36450
250 7 1750 1729225 12104575
350 10 3500 9394225 93942250
500 12 6000 30969225 3,72E+08
650 9 5850 29322225 2,64E+08
Total 40 17400 71433125 7,42E+08
Calcul de la moyenne :
𝑝
𝑖=1 𝑥𝑖 𝑛𝑖 17400
𝑋= ⟹𝑋= = 435
𝑁 40
Calcul de la variance :
𝑖=𝑝
1 7,42E08
𝑉= 𝑛𝑖 𝑋𝑖 − 𝑋 ² = = 18540350
𝑁 40
𝑖=1
𝜎 4305,85
Coefficient de variation = = = 9,898
𝑋 435