Techniques quantitatives – L3 LEA
Indicateurs statistiques
Léo Vigny
Membre du LIEPP, chercheur en contrat postdoctoral à Sciences Po Paris
1
Déroulé du cours
1. Introduction
2. Les indicateurs de tendance centrale et de position
3. Les indicateurs de dispersions
2
1. Introduction
Distribution : La distribution d’une variable est le profil des valeurs , c’est-
à-dire l’ensemble formé de toutes les valeurs possibles et des fréquences
associées à ces valeurs.
3
1 000 000
1 500 000
2 000 000
2 500 000
3 000 000
500 000
0
Nord
Bouches-du-Rhône
Seine-Saint-Denis
Hauts-de-Seine
Loire-Atlantique
1. Introduction
Seine-et-Marne
Val-de-Marne
Isère
Seine-Maritime
Source : Insee.
Bas-Rhin
Ille-et-Vilaine
cumulé croissant
Moselle
La Réunion
Oise
Loire
Haut-Rhin
Meurthe-et-Moselle
Vendée
Loiret
Puy-de-Dôme
Indre-et-Loire
Eure
Sarthe
Vaucluse
Doubs
Aisne
Manche
Savoie
Eure-et-Loir
Dordogne
Guadeloupe
Deux-Sèvres
Martinique
Charente
Yonne
Lot-et-Garonne
Aube
Cher
Aveyron
Ardennes
Jura
Haute-Saône
Haute-Loire
Nièvre
Haute-Corse
Lot
Alpes-de-Haute-Provence
Ariège
Graphique 1 : population des départements en France en 2021 et effectif
Hautes-Alpes
Creuse
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
4
1. Introduction
Graphique = informations visuelles
Mais on peut aller plus loin :
• Information synthétique
5
1. Introduction
• Étudier les « valeurs » centrales de la distribution
• Étudier la variations des valeurs ; « la dispersion »
• Étudier des aspects particuliers (valeurs extrêmes etc.)
6
1. Introduction
Conditions de Yule, un indicateur doit être :
• Défini de façon objective et indépendante
• Dépendant de toutes les observations
• Simple à calculer
• Peu sensible aux fluctuations de l’échantillonage
• Se prêter aisément aux opérations mathématiques classiques
7
2. Les indicateurs de tendance centrale et de position
La moyenne arithmétique :
$
1
𝑥̅ = ∗ ( 𝑥!
𝑛
!"#
8
2. Les indicateurs de tendance centrale et de position
La moyenne arithmétique :
$
1
𝑥̅ = ∗ ( 𝑥!
𝑛
!"#
9
2. Les indicateurs de tendance centrale et de position
La moyenne géométrique :
$
!
𝐺= * 𝑥!
!"#
10
2. Les indicateurs de tendance centrale et de position
Le mode
11
2. Les indicateurs de tendance centrale et de position
Le mode
Effectif
14
12
10
0
1 2 3 4 5 6 7 8 9
12
2. Les indicateurs de tendance centrale et de position
Le mode
Effectif
14
12
10
0
1 2 3 4 5 6 7 8 9
13
2. Les indicateurs de tendance centrale et de position
Le mode
Effectif Effectif 2
14 10
9
12
8
10 7
8 6
5
6
4
4 3
2
2
1
0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
14
2. Les indicateurs de tendance centrale et de position
Le mode
Effectif Effectif 2
14 10
9
12
8
10 7
8 6
5
6
4
4 3
2
2
1
0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
15
2. Les indicateurs de tendance centrale et de position
La médiane : valeur statistique telle qu’il y a autant d’observations
supérieures et d’observations inférieures à cette valeur. Elle partage la
série statistique en deux parties d’effectif égal.
16
2. Les indicateurs de tendance centrale et de position
La médiane : valeur statistique telle qu’il y a autant d’observations
supérieures et d’observations inférieures à cette valeur. Elle partage la
série statistique en deux parties d’effectif égal.
C’est la valeur xème valeur :
• si n est impair, x = (n+1)/2
• Si n est pair, médiane = moyenne { (n/2) ; (n+2/2) }
17
2. Les indicateurs de tendance centrale et de position
Une distribution symétrique :
Effectif des classes
14
12
10
8 Médiane = Moyenne
6
Moyenne = Médiane
18
2. Les indicateurs de tendance centrale et de position
Une distribution dissymétrique à gauche :
Effectif des classes
8
4 Médiane < Moyenne
3
0
1 2 3 4 5 6 7 8 9
Médiane Moyenne
19
2. Les indicateurs de tendance centrale et de position
Une distribution dissymétrique à droit :
Effectif des classes
9
4
Médiane > Moyenne
3
0
1 2 3 4 5 6 7 8 9
Médiane
Moyenne
20
3. Les indicateurs de tendance centrale et de position
Les quantiles : valeurs qui divisent des données ordonnées en intervalle
de même effectif
Exemple :
21
3. Les indicateurs de tendance centrale et de position
Les quantiles : valeurs qui divisent des données ordonnées en intervalle
de même effectif
Exemple :
La médiane est un quantile.
22
3. Les indicateurs de tendance centrale et de position
Les quantiles : valeurs qui divisent des données ordonnées en intervalle
de même effectif
Exemple :
La médiane est un quantile.
Les déciles.
23
3. Les indicateurs de tendance centrale et de position
Les déciles :
Revenu annuel moyen
(en euros par an)
120000
100000
80000
60000
40000
20000
Source :
0
Inférieur à D1 à D2 D2 à D3 D3 à D4 D4 à D5 D5 à D6 D6 à D7 D7 à D8 D8 à D9 Supérieur à Insee
D1 D9
24
3. Les indicateurs de tendance centrale et de position
Les quartiles : un quartile est chacune des trois valeurs qui divisent les
données triées en quatre parts égales, de sorte que chaque partie
représente 1/4 de l'échantillon de population.
25
3. Les indicateurs de tendance centrale et de position
26
3. Les indicateurs de tendance centrale et de position
Pour l’instant on peut :
• Représenter graphiquement
• Etudier les indicateurs de tendances centrales
27
3. Les indicateurs de tendance centrale et de position
Pour l’instant on peut :
• Représenter graphiquement
• Etudier les indicateurs de tendances centrales
=> On va maintenant regarder la dispersion des distributions
28
3. Les indicateurs de dispersions
L’étendu : la différence entre la plus grande et la plus petite valeur
É𝑡𝑒𝑛𝑑𝑢𝑒 = 𝑥%&' − 𝑥%!$
29
3. Les indicateurs de dispersions
L’écart interquartile : c’est la différence entre le 3ème quartile et le 1er.
É𝑐𝑎𝑟𝑡 𝑖𝑛𝑡𝑒𝑟𝑞𝑢𝑎𝑟𝑡𝑖𝑙𝑒 = 𝑄( − 𝑄#
30
3. Les indicateurs de dispersions
L’écart absolu moyen : c’est la moyenne arithmétique de la valeur absolu
des écarts à la moyenne ou à la médiane.
$ $
1 1
𝑥̅ = ∗ ( Ι 𝑥! − 𝑀) Ι 𝑜𝑢 𝑥̅ = ∗ ( Ι 𝑥! − 𝑥Ι̅
𝑛 𝑛
!"# !"#
31
3. Les indicateurs de dispersions
La variance : elle exprime la moyenne des carrés des écarts à la
moyenne, aussi égale à la différence entre la moyenne des carrés des
valeurs de la variable et le carré de la moyenne.
$
1
𝜎* = 𝑉 = ∗ ((𝑥! − 𝑥)̅ *
𝑛
!"#
32
3. Les indicateurs de dispersions
L’écart-type : c’est la racine carré de la variance. C’est la moyenne
quadratique des écarts à la moyenne.
$
1
𝜎= ∗ ((𝑥! − 𝑥)̅ *
𝑛
!"#
33