Généralisation de la médiane
Les quantiles généralisent la médiane
Les quantiles sont les valeurs du caractère qui définissent
les bornes d'une partition en classes d'effectifs égaux.
Nombre
de 2 4 5 10 20 100
parties
Nombre
de 1 3 4 9 19 99
quantiles
Nom
du Médiane Quartile Quintile Décile Vingtile Centile
quantile
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Quartiles : partagent les observations en 4 groupes égaux,
chacun représentant 25% des observations
Déciles : partagent les observations en 10 groupes égaux,
chacun représentant 10% des observations
Centiles : partagent les observations en 100 groupes
égaux, chacun représentant 1% des observations
Généralisation - Si α est un nombre compris entre 0 et 1,
le quantile d’ordre α est le point tel qu’une proportion α des
données se trouve « en dessous » et une proportion 1-α se
trouve « au-dessus »
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Les Quartiles
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Les Déciles
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Calcul des quantiles
Variable discrète : on compare les fréquences
cumulées au quantile recherché
q
Fi 1 Fi
100
avec (q/100) – la fréquence cumulée du quantile
considéré (ex. q=10 – pour décile 1 ou « décile
inférieur »; q=20 – pour quintile 1 ou décile 2; q=25 –
quartile 1; q=75 – quartile 3 ou « supérieur »; q=50 –
médiane…)
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Variable discrète & quartiles :
détermination graphique
100
90
80
F,%(Q3)
70
60
F,%(Q2)50
40
30
F,%(Q1)
20
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Q1= Q3=8
6 Q2=6
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Variables continues dont les valeurs ne sont pas classées :
Sur les données ordonnées de plus petite à plus grande valeur,
calculer l’expression suivante pour obtenir l’observation avec la
valeur du quantile:
q
i = N
100
où N = nombre d’observations, q/100 = fréquence cumulée du
quantile recherché
Si i n’est pas un nombre entier, on l’arrondit à l’entier supérieur
Si i est un nombre entier, on détermine le quantile par la
moyenne entre ce nombre et son supérieur, ou par interpolation
linéaire
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Exemple 1:
avec le PIB des 30 pays : on cherche le 8 ème décile, donc
80% des pays ont un PIB inférieur à ???
80
i = 30 = 24
100
Le 8ème décile se trouve entre la 24ème et la 25ème
position, soit entre l’Espagne et l’Italie
782,929 + 1335,3537
Soit un PIB = 2
= 1059,14
Statistique descriptive UVSQ, Natalia ZUGRAVU
PIB pour 30 pays
PIB en 2003
classement Pays (Milliards
d'euros)
1 Malte 4,4214
2 Estonie 8,6926
3 Lettonie 9,9778
4 Chypre 11,785
5 Lituanie 16,4971
6 Bulgarie 17,7668
7 Slovénie 25,7359
8 Luxembourg 25,8343
9 Slovaquie 29,4856
10 Roumanie 52,613
11 Hongrie 74,5796
12 République tchèque80,9241
13 Portugal 138,5821
14 Irlande 139,4419
15 Finlande 145,938 Me = 158,22
16 Grèce 171,4098
17 Danemark 188,5003
18 Pologne 191,6438
19 Autriche 223,3023
20 Belgique 274,726
21 Suède 275,657
22 Suisse 287,7538
23 Pays-Bas 476,945
24 Espagne 782,929
25 Italie 1335,3537 8ème décile (Q80)
26 France 1594,814 =1059,14
27 Royaume-Uni 1647,0556
28 Allemagne (1) 2163,8
29 Japon 3743,5596
30 Etats-Unis 9689,5332
23 829,3
Total de l'échantillon
(1) : incluant l'ex-RDA à partir de 1991.
Source : EUROSTAT et INSEE
Généralisation de la médiane
Exemple 2:
avec le PIB des 27 pays : on cherche le 1er quartile,
donc 25% des pays ont un PIB inférieur à ???
25
i = 27 = 6,75
100
Le 1er quartile correspond à la 7ème observation soit le
PIB de la Slovénie.
10
Statistique descriptive UVSQ, Natalia ZUGRAVU
PIB pour UE
PIB en 2003
classement Pays (Milliards
d'euros)
1 Malte 4,4214
2 Estonie 8,6926
3 Lettonie 9,9778
4 Chypre 11,785
5 Lituanie 16,4971
6 Bulgarie 17,7668
7 Slovénie 25,7359 1er quartile (Q25)
8 Luxembourg 25,8343 =25,74
9 Slovaquie 29,4856
10 Roumanie 52,613
11 Hongrie 74,5796
12 République tchèque80,9241
13 Portugal 138,5821
14 Irlande 139,4419
15 Finlande 145,938
16 Grèce 171,4098
17 Danemark 188,5003
18 Pologne 191,6438
19 Autriche 223,3023
20 Belgique 274,726
21 Suède 275,657
22 Pays-Bas 476,945
23 Espagne 782,929
24 Italie 1335,3537
25 France 1594,814
26 Royaume-Uni 1647,0556
27 Allemagne (1) 2163,8
Union européenne10 à 27
108,4
(1) : incluant l'ex-RDA à partir de 1991.
Source : EUROSTAT et INSEE
Généralisation de la médiane
Variable continue & quartiles :
détermination graphique
100
90
80
F,%(Q3)
70
60
F,%(Q2)50
40
30
F,%(Q1)
20
10
0
12 13 14 15 16 17 Q218 19 Q320 21 22 23 24 25 26 27
Q1
12
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Variable continue regroupée par classes
• Après avoir défini la classe du quantile recherché avec la
formule (a)
q
(a) Fi 1 Fi
100
• on utilise l’interpolation linéaire (b) pour trouver la valeur du
quantile
Q xi 1 ( q 100) F i 1
( b)
xi xi 1 Fi Fi 1
13
Statistique descriptive UVSQ, Natalia ZUGRAVU
Généralisation de la médiane
Dépenses mensuelles en emplois à domicile
Fréqence
Dépense en Fréqence en centre de
Effectifs cumulées fici
euros % classe (ci)
(%)
[300; 400[ 5 2,38 2,38 350 8,33
[400; 500[ 60 28,57 30,95 450 128,57
[500; 600[ 15 7,14 38,09 550 39,29
[600; 700[ 95 45,24 83,33 650 294,05
[700; 800[ 30 14,29 97,62 750 107,14
[800; 1000[ 5 2,38 100 900 21,43
Total 210 100,00
Moyenne 598,81
Source : B. PY (2007)
0,7 Fi 1
D 7 ei 1 ai
D7 - ? fi
D 7 600 0,7 38,09 70 38,09
D 7 600 100 670,535
700 600 83,33 38,09 45,24
14
Attention, ci-dessus Fi en %
Statistique descriptive UVSQ, Natalia ZUGRAVU