Statistique descriptive : Concepts clés et calculs
Statistique descriptive : Concepts clés et calculs
Statistique descriptive
(Rappel)
I Concepts et Définitions
I-1 – Population et unités.
• -La population est l’ensemble de référence, c’est-à-dire ensemble
des unités observées. C’est l’ensemble des d’unités statistiques.
• Les unités statistiques, aussi appelées individus ou observations sont
les entités abstraites qui qui pourraient être des personnes, des
animaux ou des objets, etc.. La statistique sert à décrire l’ensemble
• des unités statistiques qui composent la population.
I-2 – Caractères qualitatifs et quantitatifs
• Un caractère (ou variable) est un aspect particulier de l’individu
auquel on s’intéresse. Il peut
• être qualitatif ou quantitatif.
Un caractère est quantitatif s’il est mesurable. Il est discret si les
valeurs observées sont isolées. Il est continu s’il peut prendre
toute valeur d’un intervalle.
• Exemple: salaire, revenu, dépense, consommation, âge, taille,
poids, nombre d’élèves/étudiants, température, pression
atmosphérique, précipitation de pluie, etc.
• Un caractère est qualitatif s’il est lié à une observation ne
faisant pas l’objet d’une mesure.
• Exemple:
couleur de cheveux: noire, bleue, etc.
Statut du temps: le temps est beau, mauvais
L’état matrimonial: célibataire, marié, veuf, divorcé
le sexe: masculin ou féminin
I-3 – Modalités et nomenclature.
• Modalités: ce sont les différentes rubriques associées à un caractère qualitatif.
Le sexe a deux modalités. Les modalités d’un caractère doivent former une
partition, c’est-à-dire doivent être exhaustives et disjointes.
• Nomenclature: ensemble des modalités précédées d’un numéro de code.
II – Effectifs et fréquences
Effectif total: nombre d’individus observés, noté n ou N pour
l’ensemble de population
𝐧𝒊
• 𝒐𝒖 𝒆𝒏𝒄𝒐𝒓𝒆 𝒔𝒊 fi=σ𝐫 *100 alors σ𝒓𝒊=𝟏 𝒇𝒊=100
𝐢=𝟏 𝐧𝐢
xp np fp Fp
Tableau 2: associé à un caractère quantitatif continu
Fréquences
cumulées
Valeurs observées Effectifs Fréquences croissantes
[bi,bi+1[ ni fi Fi
[b1,b2[ n1 f1 F1
…. … … …
[bp,bp+1[ np fp Fp
xi=(bi+bi+1)/2=centre de classe Fréquences cumulées croissantes: cumul des fréquences associées aux
ai=bi+1-bi=amplitude d’une valeurs du caractère inférieures (strictement).
classe • F1=f1
ni/ai=densité de la classe • Fi=σ𝒊𝒋=𝟏 𝒇𝒋 pour i=2 à p
Exemple
Le tableau suivant donne la répartition des ménages d’un
fonkontany X par nombre de population en 2018. Calculer les
fréquences et les fréquences cumulées croissantes.
Nombre
de 7 ou
personnes 1 2 3 4 5 6 plus Total
Nombre
de
ménages 2327 4533 8918 10405 6210 2134 1123 35650
Réponses
Pour calculer les fréquences, on calcule le quotient ni/n où ni est l’effectif
associé à la modalité xi
1° Quelle limite doit-on donner à la dernière classe si l’on veut que toutes les classes aient même
amplitude ?
2° Calculer le centre de chaque classe.
3° Calculer les fréquences associées à chaque classe.
4° Quelle est la proportion d’ouvriers gagnant moins de 35 F de l’heure ?
Salaire (en F) Effectifs
[20;25[ 38
[25;30[ 59
[30;35[ 47
[35;40[ 24
[40;45[ 12
Plus de 45 2
1° Quelle limite doit-on donner à la dernière classe si l’on veut que toutes les classes aient même
amplitude ?
2° Calculer le centre de chaque classe.
3° Calculer les fréquences associées à chaque classe.
4° Quelle est la proportion d’ouvriers gagnant moins de 35 F de l’heure ?
Salaire (en F) Effectifs
[20;25[ 38
[25;30[ 59
[30;35[ 47
[35;40[ 24
[40;45[ 12
Plus de 45 2
Solution
1° Pour que toutes les classes aient même amplitude, il faut que la dernière classe ait une amplitude
de 5. La limite supérieure de cette classe doit donc être 50.
2° Le centre de chaque classe est le milieu de l’intervalle
3° L’effectif total est la somme des effectifs de chaque classe :
n=38+59+…+2=182
Les fréquences correspondent aux quotients de chacun des effectifs par l’effectif total 182 (tableau)
Centres de Fréquences
Salaire (en F) Effectifs classes (%)
[20;25[ 38 22,50 20,88
[25;30[ 59 27,50 32,42
[30;35[ 47 32,50 25,82
[35;40[ 24 37,50 13,19
[40;45[ 12 42,50 6,59
[45;50[ 2 47,50 1,10
total 182 100
a) la moyenne arithmétique
𝑝
σ𝑛
𝑖=1 𝑥𝑖
σ𝑖=1 𝑛𝑖 𝑥𝑖 𝑝
M= 𝑥ҧ = ou M= 𝑥ҧ = 𝑝
σ𝑖=1 𝑛𝑖
avec n=σ𝑖=1 𝑛𝑖
𝑛
b) Moyenne géométrique
𝑝 𝑝
G=( ς𝑖=1 𝒙𝒊 𝒏𝒊 )^(1/n) avec n= σ𝑖=1 𝑛𝑖 ou encore
1 𝑛
lnG= σ𝑖=1(𝑛𝑖 ln 𝑥𝑖 )
𝑛
Exemple
Soit la série statistique: 1 2 5 7 10 13
Calculer la moyenne géométrique
𝟔
G= 1∗ 2 ∗5 ∗7∗10∗13=
1
(1 ∗ 2 ∗ 5 ∗ 7 ∗ 10 ∗ 13)6 =4,57
Ou encore :
ln1+ln2+ln5+ln7+ln10+ln13
lnG= =1,5193
6
= => G=4,57
c) Moyenne harmonique 𝒑
𝒏 σ 𝒏𝒊
•H= 𝒏 𝟏 ou encore H= 𝒑 𝒏𝒊
𝒊=𝟏
σ𝒊=𝟏( ) σ
𝒊=𝟏 𝒙𝒊
𝒙𝒊
d) Moyenne quadratique
𝟏 𝒏 𝟏 𝒏
•Q= σ𝒊=𝟏 𝒙𝒊 ²=(A)^0.5 où A= σ𝒊=𝟏 𝒙𝒊 ²
𝒏 𝒏
𝟏 𝒏
ou encore Q= σ𝒊=𝟏 𝒏𝒊 𝒙𝒊 ²
𝒏
Exemples :
1-Chacune des huit épreuves d’un test étant donnée sur
10, un candidat a obtenu les notes suivantes : 3 5 8 10
7 1 9 9
Calculer la moyenne arithmétique de ce candidat
Réponses
3+5+8+10+7+1+9+9
𝑥=
ҧ =6,5
8
2-Soit la série statistique: 1 2 5 7 10 13
Calculer les moyennes arithmétique, géométrique,
harmonique et quadratique
Réponses
Moyenne arithmétique:
1+2+5+7+10+13
𝑥=
ҧ =6,33
6
Moyenne géométrique:
1
G=(1 ∗ 2 ∗ 5 ∗ 7 ∗ 10 ∗ 13) =4,57
6
Ou encore :
ln1+ln2+ln5+ln7+ln10+ln13
lnG= =1,5193= =>
6
G=4,57
Moyenne Harmonique
6
• H=1 1 1 1 1 1 =2,97
+ + + + +
1 2 5 7 10 13
Moyenne quadratique
12 +22 +52 +72 +102 +132
• Q= ( )= 58=7,61
6
Conclusion : H<G<𝑥<Q
ҧ
3-On considère la série statistique discrète suivante
Calculer les moyennes arithmétique, géométrique, harmonique et quadratique de cette
série
xi 1 2 3 4 5 6
ni 22 31 20 11 4 1
Réponses
• Moyenne arithmétique
22∗1 + 31∗2 + 20∗3 + 11∗4 + 4∗5 +(1∗6) 214
𝑥ҧ = = =2,40
89 89
• Moyenne géométrique
89 22
G= 1 ∗ 231 ∗ 320 ∗ 411 ∗ 54 ∗ 61 =2,12
Ou encore !
22∗𝑙𝑛1 + 31∗𝑙𝑛2 + 20∗𝑙𝑛3 + 11∗𝑙𝑛4 + 4∗𝑙𝑛5 +(1∗𝑙𝑛6) 66,94
𝑙𝑛𝐺 = = =0,752
89 89
= = > G=𝑒 0,752 =2,12
• Moyenne quadratique
22∗12 + 31∗22 + 20∗32 + 11∗42 + 4∗52 +(1∗62 )
Q= =2,68
89
• Moyenne harmonique
H=89/(22/1+31/2+20/3+11/4+4/5+1/6)=1,8586843
ExO4-On considère 5 plaques métalliques carrées, dont les côtés
mesurent respectivement ; 5 cm, 6cm, 9 cm, 10 cm et 12,5cm.
a) Quelle est l’aire moyenne de ces plaques ?
b) Quel est le côté de la plaque moyenne correspondante ?
c) Que représente ce côté par rapport aux 5 côtés des plaques ?
Réponses
a) Les aires des plaques sont respectivement :
25cm², 36 cm², 81cm², 100cm² et 156,25cm²
L’aire moyenne est donc :
25+36+81+100+156,25
Am= =79,65cm²
5
PIB02 −PIB01
TV(PIB)01/02= =1,0%
PIB01
= = > PIB02 = PIB01 + (1,0%)* PIB01 =
PIB01 *(1+0,010)= PIB01 *(1,010)
1,010 est le coefficient multiplicateur du PIB entre 2001 et 2002
De même :
PIB03 = PIB02 + (1,1%)* PIB02 = PIB02 *(1+0,011)
PIB03 =PIB01 *(1+0,10)*(1+0,011)
…
PIB06 =PIB01 *1,010*1,011*1,025*1,017*1,020=PIB01 *1,0857
La médiane, notée Me, est le quantile d’ordre 50%. Elle partage la série des
valeurs observées en deux séries de même taille (Me=Q50).
Les trois quartiles partagent la série en 4 séries de même taille :
25% des observations sont inférieures au 1er quartile Q25 ;
50% des observations sont inférieures au 2ème quartile Q50 ;
75% des observations sont inférieures au 3ème quartile Q75.
Définition
Les quantiles sont des caractéristiques de position
partageant la série statistique ordonnée en k parties
égales.
Pour k =4, les quantiles, appelés quartiles, sont trois
nombres Q1,Q2,Q3 tels que :
– 25% des valeurs prises par la série sont inférieures à Q1,
– 25%des valeurs prises par la série sont supérieures à Q3,
–Q2 est la médiane Me,
–Q3−Q1 est l’intervalle interquartile, il contient 50 % des
valeurs de la série
• Les déciles sont les neuf valeurs de la variable notées Q10 , Q20…, Q90 qui
partagent les observations en dix groupes d’effectifs égaux : 10 % des
individus de la population ont une valeur de la variable inférieure à Q10…,
90 % des individus de la population ont une valeur de la variable
inférieure à Q90.
• Les centiles sont les 99 valeurs de la variable notées Q1 , Q2 …, Q99 qui
partagent les observations en 100 groupes d’effectifs égaux : 1 % des
individus de la population ont une valeur de la variable inférieure à Q1 …,
99 % des individus de la population ont une valeur de la variable
inférieure à Q99.
Détermination de la médiane Me
Cas discret :
• On suppose que les données ponctuelles sont classées en ordre croissant.
Calculer le quantile d’ordre 50%, par exemple, revient à déterminer la valeur
du caractère xi telle que 50% des valeurs observées soient strictement
inférieurs à xi.
• Si le nombre d’observation est impair, on a n=2p+1. On convient de considérer
comme quantile d’ordre 50%, la (p+1) ième valeur de la série observée.
• Si le nombre d’observation est pair, on n=2p. Deux cas possibles :
• -la pième et la (p+1)ième valeur de la série sont égales ; on conviendra de
considérer, comme quantile d’ordre 50%, cette valeur.
• -la pième et la (p+1)ième valeur de la série sont différentes ; on prend, comme
quantile d’ordre 50%, la (p+1)ième valeur de la série (ou on peut prendre la
moyenne de cs deux valeurs par convention).
Exemple: Calculer la médiane de la série statistique
7 18 8 9 16 9 11 12 14 9 16 7 18
Exemple
Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 9
Exemple
Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 8 9 16 7 9 18 10 5 4
Réponses
• n=13=2*6+1 = = > p=6 = = > le quantile d’ordre 50% ou la médiane est
la (p+1)ième valeur ou le 7ième valeur= = > Me=11
7 7 8 9 9 9 11 12 14 16 16 18 18
Exemple
Dans une bibliothèque, l’ensemble des abonnés a
été réparti suivant le nombre d’ouvrages
empruntés durant un mois :
xi 0 1 2 3 4 5 6 7
ni 18 39 57 64 42 33 21 14
Calculer la médiane de cette série.
Réponses
On calcule les fi et Fi
• f1=18/288*100=6,25
• f2=39/288*100=13,54
• F1=f1=6,25
classe [0; 10[ [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ [70; 80[
Nbre ni 18 44 68 54 42 36 16 10
1-Calculer la moyenne arithmétique
2-Calculer la médiane Q50 et
3-Calculer les quartiles de cette série statistique (Q25 et Q75)
Réponse
ni fi Fi ci nici
[0; 10[ 18 6,25 6,25 5 90
[10; 20[ 44 15,28 21,53 15 660
[20; 30[ 68 23,61 45,14 25 1700
[30; 40[ 54 18,75 63,89 35 1890
[40; 50[ 42 14,58 78,47 45 1890
[50; 60[ 36 12,50 90,97 55 1980
[60; 70[ 16 5,56 96,53 65 1040
[70; 80[ 10 3,47 100 75 750
Total 288 100,00 10000
Me= 32,592
M= 34,7222
Réponse
ni fi Fi ci nici
[0; 10[ 18 6,25 6,25 5 90
[10; 20[ 44 15,28 21,53 15 660
[20; 30[ 68 23,61 45,14 25 1700
[30; 40[ 54 18,75 63,89 35 1890
[40; 50[ 42 14,58 78,47 45 1890
[50; 60[ 36 12,50 90,97 55 1980
[60; 70[ 16 5,56 96,53 65 1040
[70; 80[ 10 3,47 100 75 750
Total 288 100,00 10000
Me= 32,592
M= 34,7222
Me=30+(40-30)*((50-45,14)/(63,89-45,14))
Q25 =20+(30-20)*((25-21,53)/(45,14-21,53))
Exemple
1-Calculer la moyenne arithmétique et la médiane de
la série suivante: 14 16 12 9 11 18 7 8 9 16 7 9
18
2-Dépouiller cette série en trois classes:[5;10[;
[10;15[ et [15;20[. Recalculer la moyenne et la
médiane.
3-Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 9 18
Réponses:
nixi fi Fi
[5;10[ 6 7.5 46.2 46.2
[10;15[ 3 12.5 23.1 69.2
[15;20[ 4 17.5 30.8 100.0
13 100.0
Q50=Me= 10.8
APPLICATION: Boîte à moustaches: Détection des valeurs aberrantes:
La Boîte à moustache de l’anglais « Box and Whiskers » ou diagramme de Tuckey,
parfois aussi désignée « box plot », est un graphique qui résume la dispersion
d’une série à partir de 5 valeurs: la valeur minimale et la valeur maximale (ce sont
les moustaches), l’intervalle interquartile (désigné par ses deux valeurs Q1=Q25
et Q3=Q75) et la médiane (ces trois valeurs constituant la « boîte »).
Une valeur peut appelée valeur aberrante si elle s’écarte d’une distance d’au
moins 1,5*(Q3-Q1) au dessus du troisième quartile ou en dessous du premier
quartile: en dessous de Q1- 1,5*(Q3-Q1) ou au-dessus de Q3+ 1,5*(Q3-Q1)
Exo1: La série suivante donne les âges des enfants d’école primaire pour l’année scolaire
2005/06
9 6 7 7 3 9 10 1 8 7 9 9 8 10 5 10 10 9 10 8
1. Déterminer les trois quartiles de la série (Q1 Q2=Q50=Médiane Q3).
2. Déterminer l’écart interquartile.
3. Existe-t-il dans la série, des valeurs aberrantes ?
4. Tracer le diagramme en boîte (ou box-plot)
1.Q1 Q2=Q50=Médiane Q3 2. Déterminer l’écart interquartile+IQR=2,5
Age
1 Valeurs abérrantes
3
5
6
7 Q25=7
7
7
8
8
8 Me=8,5
9
9
9
9
9 Q75=9,5
10
3 .Valleurs aberrantes
Q1-1,5*IQR=7-1,5*2,5=3,25
Q75+1,5*IQR=9,5+1,5*2,5=12,25
Exemple2
La série suivante donne les notes de Stats sur 120 obtenues par les étudiants
de M2 de l’UCM en 2023:
Notes: 50; 25; 53; 21; 58; 110; 60; 61; 103; 65; 67; 68; 98; 71; 72; 72; 67; 99;
79; 80
a) Déterminer la médiane de notes, Q1 (ou Q25), Q3 (ou Q75) et IQR.
b) Calculer Q1-1.5IQR et Q3+I.5IQR.
c) Construire le diagramme en boîte à moustaches de la série des points.
d) Commenter les résultats
Réponse
Variable Min Q25 Q50 Q75 Max IQR
Q25-1.5IQR= 28,25
Q75+1.5IQR= 110,25
IV.1.3 Les modes
Définitions
Le mode se définit comme la valeur de la variable la plus fréquente, d’effectif
maximum; on l'appelle aussi dominante. Dans le cas d’une série discrète, le
mode est la valeur de la variable xi correspondant à l'effectif le plus élevé.
Graphiquement, c’est la valeur de xi pour laquelle le bâton est le plus grand. Dans
le cas d’une série continue, le mode s’identifie à l’intervalle de valeurs x (appelé
alors classe modale) correspondant à l'effectif par unité d'amplitude le plus
élevé. Graphiquement, il s’agit de la classe pour laquelle on a le sommet de
l'histogramme.
1 k k
V ( x) = ni (xi − x ) = f i ( xi − x ) 2 avec
ni 1
fi = V ( x) = ni xi − x
2
2 2
n i =1 i =1 n n i
• L'écart-type de x :
1 k k
( X ) = ni (xi − x ) = fi (xi − x )
2 2
ou
n i =1 i =1
(X ) = V (X )
IV.2.2 Coefficient de variation
Le coefficient de variation est le rapport de l’écart-type à la moyenne.
C’est un nombre sans dimension, indépendant des unités choisies.
Il permet de comparer des séries exprimées dans des unités différentes.
Le Coefficient de variation est défini par:
CV =
x
IV.2.3 Ecarts absolus moyens
𝑝
σ𝑖=1 𝑛𝑖|𝑥𝑖−𝑥|ҧ 𝑝
𝑒𝑥ҧ = =σ1 𝑓𝑖 |𝑥𝑖 − 𝑥|
ҧ
σ𝑛𝑖
i = 1
w = xmax − xmin
IV.2.5 Ecarts interquantiles
• Un intervalle interquantile d’ordre α% contient des valeurs observées centrales,
100−α 100+α
en laissant % des plus petites et % des plus grandes. On note:
2 2
• Iα=[Q(100- α)/2 ; Q(100+α)/2 ]
• Par exemple: L’intervalle interquartile [Q25:Q75] contient 50% des valeurs
observées. Le nombre Q75-Q25 est l’écart interquartile
Les quantiles sont une généralisation de la médiane.
Les quartiles, au nombre de 3 : Q1, Q2, Q3. Ils partagent les observations rangées,
en 4 sous-ensembles d'effectifs égaux. Ce sont les valeurs de la variable
statistique telles que, les observations étant rangées par ordre croissant, un quart
des observations soient inférieures à Q1, un quart comprises entre Q1 et Q2, un
quart comprises entre Q2 et Q3, un quart supérieures à Q3.
Q1 Q2 Q3
504166,6
Médiane Q50= 50,41666667 67
Calcul de Q25
Modalités (104F) Effectifs
Numero i ni CI fi Fi
[0, 10[ 20 5 6,71 6,71
[10, 22[ 36 16 12,08 18,79
[22, 27[ 35 24,5 11,74 30,54
[27, 45[ 45 36 15,10 45,64
[45, 75[ 72 60 24,16 69,80
[75, 120[ 90 97,5 30,20 100,00
Total 298 100
Q25=22+(27-22)*((25-18,79)/(30,54-18,79))=24,64255319
Q25=246425,532
Calcul de Q75
Modalités
Effectifs
(104F)
Numero i ni Ci fi Fi
[0, 10[ 20 5 6,71 6,71
[10, 22[ 36 16 12,08 18,79
[22, 27[ 35 24,5 11,74 30,54
[27, 45[ 45 36 15,10 45,64
[45, 75[ 72 60 24,16 69,80
[75, 120[ 90 97,5 30,20 100,00
Total 298 100
Q75=75+(120-75)*((75-69,8)/(100-69,8))=82,74834437
827483,444
• Calcul de médiale
• La médiale est une médiane de la série nixi
• On détermine la classe qui contient la médiale [a,b[, c’est-à-dire la classe
dans laquelle les valeurs globales cumulées croissantes atteignent 50% ou la
moitié des valeurs globales cumulées.
nixi=val Qi=val gl
Numero i ni Ni xi glob comul
[0, 10[ 20 20 5 100 100
[10, 22[ 36 56 16 576 676
[22, 27[ 35 91 24,5 857,5 1533,5
[27, 45[ 45 136 36 1620 3153,5
[45, 75[ 72 208 60 4320 7473,5
[75, 120[ 90 298 97,5 8775 T=16248,5 T/2= 8124,25
Total 298 16248,5
• 75<Mle<120
• 7473,5<50%<16248,5
• =75+(120-75)*((8124,25-7473,5)/(16248,5-7473,5))= 78,3371795
• Ou encore 783371,795Ar
• La médiane de salaire annuel est égal à 504167 Ar, cela signifie que
50% des employés gagnent moins de 504167 . La médiale implique
que 50% de la masse salariale est versée aux salariés gagnant moins
que 783372.
• Ainsi, plus de 50% des employés gagnent moins de 50% de la masse
salariale.
Exercice
La répartition des subventions par exploitation d’une
population d’agriculteurs est résumée dans le tableau suivant :
Classe (105Ar) Effectif
[10 ;20[ 12
[20 ;30[ 18
[30 ;40[ 36
[40 ;50[ 24
[50 ;70[ 30
La médiale est la valeur de R (revenu) pour laquelle les valeurs globales cumulées atteignent N/2=387 150 000. Cette
valeur se trouve dans la classe [7250 ; 7750[
. En procédant par interpolation linéaire, on a :
Mle= =7250+(7750-7250)*((387150000-370500000)/(438000000-370500000))
= 7373,33333
La médiale est la valeur de R (revenu) pour laquelle les valeurs globales
cumulées atteignent N/2=387 150 000. Cette valeur se trouve dans la
classe [7250 ; 7750[. En procédant par interpolation linéaire, on a :
Mle= =7250+(7750-7250)*((387150000-370500000)/(438000000-
370500000))
= 7373,33333
• Cas d’une variable discrète.
• On vous donne la série suivante : calculer la médiale de cette série
Xi ni
1 3
2 8
3 2
4 5
5 7
Réponse
Xi ni nixi Ni
1 3 3 3
2 8 16 19
3 2 6 25
4 5 20 45
5 7 35 80
Total 80
La médiale est la valeur qui sépare la masse totale ∑nixi rn
deux parties égales
∑nixi/2=80/2=40 On cherche la première valeur plus
grande que 40 dans la colonne Ni
= = > 45 = = > Mle=4
IV.3.2 La courbe de concentration ou la courbe de
Lorenz
• La courbe de concentration ou la courbe de Lorenz (1880 -1962, économiste
américain qui inventa le concept de courbe de Lorenz en 1905) pour décrire
et mesurer les inégalités en termes de revenu, de salaire. Par la suite, cette
courbe qu’il fut le premier à utiliser servit plus généralement à représenter
visuellement la façon dont se répartit une masse (salariale, de revenus, de
richesses, etc.) au sein d’une population pour se faire une idée du caractère
plus ou moins égalitaire de la répartition de cette masse au sein de la
population et comparer ainsi différentes populations entre elles ou comparer
la distribution d’une masse au sein d’une population en deux ou plusieurs
points du temps afin de savoir si l’inégalité augmente ou diminue.
Cette courbe de Lorenz lors des études sur les salaires et les revenus a pour but de décrire les effets de la
concentration dans la population. Sur l’axe des abscisses, on porte les fréquences cumulées croissantes Fi,
et sur l’axe des ordonnées les valeurs globales relatives cumulées croissantes Qi. La courbe de
concentration est inscrite dans un carré.
Interprétation
• Un pourcentage Fi d’individus de la population se partage un
pourcentage Q’i de la masse salariale totale des valeurs globales. Plus
la courbe s’éloigne de la diagonale du carré, plus la concentration est
importante ; plus la courbe se rapproche de la diagonale OC, plus la
répartition est équitable. A la limite, le segment [OC] est une courbe
de concentration associée à une population où il y a équirepartition
de la masse totale des valeurs globales.
Comparaison de repartition de revenu pour deux pays
La courbe de Lorenz se confond La courbe de Lorenz partage La courbe de Lorenz est ODC.
avec la droit OC d’égalité le triangle OCD en deux La surface de A occupe tout le
parfaite. Chaque individu de la surfaces. Plus la surface de A triangle OCD et la surface de B
population possède la même augmente aux dépends de la a disparu. C’est le cas
part de la masse totale. surface de B et plus théorique où un seul individu
l’inégalité augmente possède 100% de la masse
(inégalité modérée). totale et les autres n’ont rien.
IV.3.3 L’indice de concentration ou l’indice de Gini
On dispose de plusieurs paramètres statistiques pour mesurer l’inégalité des
salaires, revenu ou patrimoine au sein d’une population. L’indice de Gini ou le
coefficient de Gini en est un.
L’aire de concentration ou le coefficient de Gini ou l’indice de Gini (Corrado
Gini : 1884 -1965 statisticien, démographe, ethnologue, sociologue et idéologue
italien) est une mesure de l'inégalité associé à la la courbe de Lorenz.
En pratique, lorsqu’on s’intéresse à la répartition d’une masse au sein d’une
population, on trace d’abord une courbe de Lorenz afin d’avoir une idée visuelle de
l’égalité ou de l’inégalité de cette répartition. Ensuite, si l’on désire résumer cette
inégalité par un chiffre, on calcule le coefficient de GINI.
∆ 1
Méthode de différence moyenne : G= ҧ avec Δ= 2 σi<j ni nj |xi − xj |
𝑥 n
Exemple
Tracer la courbe de de concentration ou la courbe de Lorenz
relative aux données suivantes et calculer l’indice de Gini
correspondant.
Classe Effectifs ni
[0 : 10[ 200
[10 : 20[ 200
[20 : 30[ 200
[30 : 40[ 200
[40 : 50[ 200
Réponses
Val
Valeurs Valeurs globales
Centre de globales Freq Freq globales relatives
Effectifs classe nixi relatives cumulée relatives cumulées
Classe ni xi fi Fi f'i Q'i
[0 : 10[ 200 5 1000 0.2 0.2 0.04 0.04
[10 : 20[ 200 15 3000 0.2 0.4 0.12 0.16
[20 : 30[ 200 25 5000 0.2 0.6 0.2 0.36
[30 : 40[ 200 35 7000 0.2 0.8 0.28 0.64
[40 : 50[ 200 45 9000 0.2 1 0.36 1
Total 1000 25000 1 1
Courbe de Lorenz ou de concentraion
Freq
cumulée Val globales cumulées
Fi Qi
0 0
20 4
40 16
60 36
80 64
100 100
Calcul de l’indice de Gini
Valeur
Valeur s Val
s global globale
Centre global Freq Freq es s
de es relativ cumul relativ cumulé
Effecti classe nixi es ée es es
Classe fs ni xi fi Fi qi Qi r FiQi+1 Fi+1Qi FiQi+1-Fi+1Qi
[0 : 10[ 200 5 1000 0,2 0,2 0,04 0,04 1 0,032 0,016 0,016
[10 : 20[ 200 15 3000 0,2 0,4 0,12 0,16 2 0,144 0,096 0,048
[20 : 30[ 200 25 5000 0,2 0,6 0,2 0,36 3 0,384 0,288 0,096
[30 : 40[ 200 35 7000 0,2 0,8 0,28 0,64 4 0,8 0,64 0,16
[40 : 50[ 200 45 9000 0,2 1 0,36 1 5
Total 1000 25000 1 1 G=0,32
Exo 1: Tracer la courbe de Lorenz puis calculer
l’indice de Gini de la distribution suivante:
Effectif
Classe ni
[30;34[ 40
[34;38[ 30
[38;42[ 20
[42;46[ 10
Exo1: Calculer l’indice de Gini de chacune de deux
distributions suivantes. Commenter les résultats
Distribution 2:
Distribution 1
Classe ni
Classe ni
[5;15[ 103
[5;15[ 123
[15;25[ 189 [15;25[ 189
[25;35[ 217 [25;35[ 217
[35;45[ 184 [35;45[ 184
[45;55[ 118 [45;55[ 118
[55;65[ 95 [55;65[ 95
[65;75[ 52 [65;75[ 52
[75;85[ 22 [75;85[ 42
Exo:Le tableau suivant donne la répartition des salariés d’une entreprise selon la tranche de
salaire mensuel.
-Indices de prix :
C’est la moyenne arithmétique des indices élémentaires des prix, pondérés par les
coefficients budgétaires de la période de base.
-Indices des quantités : c’est la moyenne arithmétique des indices élémentaires des
quantités, pondérés par les coefficients budgétaires de la base
• Soit n produits Pj dont on connait les prix (unitaires) et les quantités à deux périodes de différentes,
on appelle coefficient budgétaire du produit Pj, par rapport à l’une de ces périodes, la part
représentée par la valeur (prix*quantité) de ce produit à cette période relativement à la valeur totale
de tous les produits à cette même période. On note :
𝑝𝑗,0∗𝑞𝑗,0
• Par rapport à la période de base : cj,0=σ𝑛 (en indice j,0, i,0)
𝑖=1 𝑝𝑖,0∗𝑞𝑖,0
𝑝𝑗,𝑡∗𝑞𝑗,𝑡
• Par rapport à la période courante: cj,t=σ𝑛
𝑖=1 𝑝𝑖,𝑡∗𝑞𝑖,𝑡
• σ 𝑐𝑗, 0 = 1 𝑒𝑡 σ 𝑐𝑗, 𝑡 = 1
IV.2.2 Indices de Laspeyres
-Indices de prix :
C’est la moyenne arithmétique des indices élémentaires des prix, pondérés par les
coefficients budgétaires de la période de base.
Formule de calcul :
σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,0 σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,𝑡
L(p)t/0=σ𝑛 *100 P(p)t/0=σ𝑛 *100
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,0 𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,𝑡
σ𝑛
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,𝑡 σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,𝑡
L(q)t/0=σ𝑛 *100 P(q)t/0=σ𝑛 *100
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,0 𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,0
Remarque
1 1
L0/t= et P0/t=
𝑃𝑡/0 𝐿𝑡/0
IV.2.4 Indices de Fisher
Considérons une suite de dates : 0, 1,2, …, n et une suite d’indices, exprimés en base 100 de l’année précédente/ I1/0, I2/1, ….,In/n-
1. On construit une suite d’indices-chaines CI1/0, CI2/0,…,CIn/0 de la façon suivante :
CI1/0=I1/0
CI2/0=CI1/0*i2/1
.
.
.
CIn/0=CIn-1/0*in/n-1
𝟏
Ainsi, ∀ t {1,2,3,…,n} : CIt/0= ς𝒕 𝑰 = 𝟏𝟎𝟎 ς𝒕𝒌=𝟏 𝒊𝒌/𝒌−𝟏
𝟏𝟎𝟎𝒕−𝟏 𝒌=𝟏 𝒌/𝒌−𝟏
On obtient a puisque lors l’indice facilement relatif à deux dates quelconques de la suite :
𝐂𝐈𝐭′ /𝟎
∀ t, t’{1,2,3,…,n}, =it’/t
𝐂𝐈𝐭/𝟎
Exo1
Le tableau suivant donne l’évolution des frais de personnel (en 103Ar) d’une
entreprise commerciale entre 2010 et 2015. Quel service a vu ses frais de personnel
augmenter le plus rapidement sur la période considérée ? Lequel les a vu
augmenter le moins rapidement ?
2010 2015
Direction 8500 16300
Personnel 12300 32700
Finances 5200 11700
Administration 26600 63150
Marketing 3600 8500
Réponse Exo1:
Calculons pour chaque service les indices
élémentaires des frais (base 100 en 2010)
2010 2015 Indices It/0
Direction 8500 16300 191,8
Personnel 12300 32700 265,9
Finances 5200 11700 225,0
Administra
26600 63150
tion 237,4
Marketing 3600 8500 236,1
Le frais de personnel du service "Personnel" ont augmenté le plus rapidement (166% en 5 ans),
ceux du du service "Direction" ont augmenté le moins rapidement (92% en 5ans)
Remarque: cette reduction peut provenir par exemple, d'une réduction d'effectif plus grande à la "Direction" que pour le
"Personnel"
Exo 2
i(p)91/89=i(p)91/84/i(p)89/84
i(p)91/84 1.62
i(p)89/84 1.41
i(p)91/89= 1.15
Le prix de ce produit a augmenté de 15% entre 1989 et 1991
Exo3
i(q)= 0.97222222
PV(q)=i(q)-100 -0.02777778
PV(q)=i(q)-100 -2.8=====>Les ventes ont diminué de 3% environ
Exo5
• Calculer à partir des prix moyens des denrées alimentaires suivants les taux d’accroissement des prix moyens.
Année 1974 1975 1976 1977 1978 1979 1980 1981 1982
Pour trois produits P1, P2, P3, le tableau ci-dessous donne les indices élémentaires I(x) de 1990 et les
coefficients budgétaires correspondants. Calculer les indices de Paasche, Laspeyres et Fisher.