Déterminer les paramètres de position d'un caractère statistique
Le Mode
Définition: Le mode d'une série statistique est la modalité, ou la classe de modalités , la plus
fréquente. C'est donc la valeur du caractère de plus grand effectif et donc de plus grande fréquence.
Le mode est noté M 0.
Propriété 1: Le mode n'est pas nécessairement unique puisqu'il peut y avoir deux modalités ou plus
correspondant à la fréquence maximale. On dit, dans ce cas, que la série est statistique et
multimodale.
Propriété 2: La notion de série statistique multimodale est étendue au cas où, pour un caractère
statistique, deux modalités ou plus ont des fréquences supérieures à celles des modalités voisines.
Dans ce cas, ces modalités sont des modes relatifs.
Exemple: Soit les trois distributions statistiques suivantes correspondant à trois caractères
statistiques X , Y , Z .
X : xi 1 2 3 4 5 6 Somme
Ni 15 20 40 15 5 5 100
Fi 0.15 0.20 0.40 0.15 0.05 0.05 1
Y : xi 1 2 3 4 5 6 Somme
Ni 10 25 15 15 25 10 100
Fi 0.10 0.25 0.15 0.15 0.25 0.10 1
Z : xi 1 2 3 4 5 6 Somme
Ni 5 30 15 10 35 5 100
Fi 0.05 0.30 0.15 0.10 0.35 0.05 1
M 0 ( X )=3 X est une distribution unimodale
M 0 (Y )=2 et 5 Y est une distribution bimodale
M 0 ( Z )=5 Z est une distribution bimodale
En traçant les diagrammes en bâtons des séries discrètes X , Y et Z définies ci-dessus, on obtient les
diagrammes suivants:
0.45 0.3 0.4
0.4 0.35
0.25
0.35 0.3
0.3 0.2 0.25
0.25
0.15 0.2
0.2
0.15 0.1 0.15
0.1 0.1
0.05 0.05
0.05
0 0 0
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6
Caractère X Caractère Y Caractère Z
Distribution unimodale Distribution bimodale Distribution bimodale
Mode = 3 Modes = 2 et 5 Mode = 5
Bien que le caractère Z ne présente qu'un seul mode, M 0 ( Z )=5 , la distribution statistique de Z est
bimodale, car 2 est un mode relatif puisque sa fréquence est supérieure à celle des modalités
voisines 1 et 3.
Dans le cas d'un caractère continue et les classes de modalités ont toutes la même amplitude, la
classe modale est celle correspondant au plus grand effectif ou à la plus grande fréquence.
Exemple: Soit le caractère X de distribution statistique:
Classes de
¿ ¿ ¿ ¿ ¿ Somme
modalités
ni 15 25 40 15 5 100
fi 0.15 0.25 0.40 0.15 0.5 1
La classe modale est la classe ¿ puisqu'elle est d'effectif maximal et que l'amplitude de chaque classe
est de 5. Sur l'histogramme, la classe correspondant au rectangle le plus haut:
0.3
0.25
0.2
0.15
0.1
0.05
0
[0, 10[ [10, 20[ [20,25[ [25, 30[ [30, 40[
Dans le cas d'un caractère continue et les classes de modalités n'ont pas la même amplitude, la classe
modale est celle correspondant au plus grand effectif ou à la plus grande fréquence par amplitude de
base.
Exemple: Soit le caractère X de distribution statistique:
Classes de
¿ ¿ ¿ ¿ ¿ Somme
modalités
ni 15 30 25 15 15 100
fi 0.15 0.30 0.25 0.15 0.15 1
La classe modale est ¿, on obtient aisément ce résultat en déterminant les fréquences par amplitude
de base dans le tableau:
Classes de
¿ ¿ ¿ ¿ ¿ Somme
modalités
ni 15 30 25 15 15 100
fi 0.15 0.30 0.25 0.15 0.15 1
αi 2 2 1 1 2
'
fi 0.075 0.15 0.25 0.15 0.075
L'amplitude de base est 5.
α i: nombre d'amplitudes de base dans la classe de modalités
'
f i=f i /α i
Sur le schéma ci-dessous, on peut remarquer que la classe modale est la classe sur laquelle la pente
de la courbe cumulative croissante est maximale.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 5 10 15 20 25 30 35 40
La médiane et les quantiles
Définition: La médiane d'un caractère statistique quantitatif est une valeur notée M e qui permet de
classer l'ensemble des individus de la population en deux sous-populations de même taille,
composées pour l'une d'individus dont les modalités sont inférieures ou égales à M e et, pour l'autre,
d'individus dont les modalités sont supérieures ou égales à M e.
La médiane pour un caractère discret:
Règles de calcul de la médiane: On suppose une population de taille N et un caractère discret pour
lequel on a classé les individus par modalités croissantes.
Si N est impair, on peut écrire N=2 P+1, et la médiane est la modalité du ( P+1)e individu
dans cette série classée.
Si N est pair, on peut écrire N=2 P , et la médiane est:
La modalité commune des Pe et ( P+1)e individus, si ces modalités sont égales.
La demi-somme des modalités des Pe et (P+1)e individus si ces modalités sont
distinctes.
Exemple: On considére la population formée de l'ensemble des 15 étudiants composant l'équipe de
Football. A chacun d'eux, on a posé les quatres questions suivantes:
Depuis combien d'années jouez-vous au football?
Depuis combien d'années jouez-vous dans l'équipe?
Combien de but avez-vous marqué cette année?
Combien avez-vous effectué de passes décisives?
Les réponses sont données dans le tableau suivant, sauf pour le joueur n° 1 (le gardien de but) auquel
les deux questions n'ont pas été posées.
Joueur n° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Question 1 9 7 4 9 6 10 5 11 5 12 7 9 11 3 8
Question 2 1 2 3 5 1 2 3 1 4 2 3 2 2 2 4
Question 3 0 1 0 0 2 0 1 4 2 3 2 5 4 6
Question 4 0 0 2 0 1 1 3 1 0 5 6 3 3 3
Si on s'interesse au premier caractére: "ancienneté dans le football" et on classe les joueurs par
ancienneté croissante. On obtient le tableau suivant:
Joueur n° 14 3 7 9 5 11 2 15 1 4 12 6 8 13 10
Ancienneté 3 4 5 5 6 7 7 8 9 9 9 10 11 11 12
On dit que 8 ans est la médiane du caractére "ancienneté dans le football". Il y a 15 individus et la
médiane est la modalité du 8 e individu (celui du milieu) quand on a classé les individus par modalités
croissantes.
Si l'on considére la caractére "ancienneté dans l'équipe" et si l'on classe les joueurs par ancienneté
croissante, on obtient le tableau:
Joueur n° 1 5 8 2 6 10 12 13 14 3 7 11 9 15 4
Ancienneté 1 1 1 2 2 2 2 2 2 3 3 3 4 4 5
On dit que 2 ans est la médiane du caractère "ancienneté dans le football". Il y a 15 individus par
modalité du 8 e individu quand on a classé les individus par modalités croissantes.
Si l'on considére le caractére "nombre de buts marqués", et si l'on classe les joueurs, joueur n° 1
excepté, par nombre de buts croissant, on obtient le tableau:
Joueur n° 2 4 5 7 3 8 6 10 12 11 9 14 13 15
NB Buts 0 0 0 0 1 1 2 2 2 3 4 4 5 6
On dit que 2 est la médiane du caractére "nombre de buts marqués". Il y a 14 individus et la médiane
est ici la modalité commune aux 7 e et 8 e individus quand on a classé les individus par modalités
croissantes.
Si l'on considére le caractére "nombre de passes décisives", et si l'on classe les joueurs, joueur n° 1
excepté, par le nombre de passes croissantes, on obtient le tableau:
Joueur n° 2 3 5 10 6 7 9 4 8 13 14 15 11 12
NB Passes 0 0 0 0 1 1 1 2 3 3 3 3 5 6
On dit que tout nombre compris entre 1 et 2, par exemple 1.8, est une médiane du caractère
"nombre de buts marqués". Dans ce cas, on a un intervalle médian, l'intervalle [1, 2] et, par
convention, on prend comme médiane le centre de cet intervalle, soit 1.5.
La médiane pour un caractére continu
La médiane correspond à un partage en deux de la série statistique, donc à une fréquence cumulée
croissante égale à 0.5. Pour déterminer la médiane, on est donc conduit à trouver M e tel que:
F i ( M e )=0.5.
La relation F i+ F i=1 nous montre que si F i ( M e )=0.5, on a également F i ( M e )=0.5 et par suite
' '
'
F i ( M e )=F i (M e ). La médiane se situe à l'intersection des courbes de fréquences cumulées
croissantes et décroissantes.
Exemple: Une entreprise a réalisé une enquete sur le montant de ses factures impayées. L'étude
porte sur 125 factures suivant le tableau statistique:
Classes de ¿ ¿ ¿ ¿ ¿ ¿ Somme
modalités
Effectifs ni 8 27 36 35 19 125
Fréquences fi 0.064 0.216 0.288 0.28 0.152 1
Fréquences Fi 0.064 0.280 0.568 0.848 1
cumulées ↑
Fréquences Fi
'
1 0.936 0.720 0.432 0.152
cumulées ↓
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 100 200 300 500 1000
On détermine d'aprés le tableau statistique l'intervalle dans lequel est comprise la médiane: ici,
l'intervalle [200 ,300 ] puisque F i ( 200 )=0.280<0.5< 0.568=F i (300).
La médiane se détermine ensuite par interpolation linéaire en tenant compte de l'hypothèse
(0.5−0.280)
d'équirépartition. On obtient M e =200+ ∗( 300−200 )=276.39 .
(0.568−0.280)
Définitions: Les quartiles partagent la série en quatre parties de meme taille. Il y a donc trois
quartiles:
Le premier quartile Q 1 correspond à 25% des modalités inférieures Q 1 et donc 75% qui lui
sont supérieures. On a donc F i ( Q 1 ) =0.25 et on détermine Q 1 par interpolation linéaire.
Le second quartile Q 2 correspond à 50% des modalités inférieures à Q 2 et donc 50% qui lui
sont supérieures. Il en découle que le second quartile est la médiane.
Le troisième quartile Q 3 correspond à 75% des modalités inférieures à Q 3 et donc 25% qui lui
sont supérieures. On a donc F i ( Q 3 ) =0.75 et on détermine Q 3 par interpolation linéaire.
Les déciles partagent la série en dix parties de même taille et sont donc au nombre de 9, les centiles
la partagent en 100 et sont au nombre de 99. Le premier quantile D 1 correspond à 10% des
modalités inférieures à D 1 et donc 90% qui lui sont supérieures. On a donc F i ( D1 ) =0.10 et on
détermine D 1 par interpolation linéaire.
On définit de même, les 8 autres déciles ainsi que les 99 centiles.
Exemples: Le tableau statistique montre que le premier quartile est compris entre 100 et 200, car on
a: F i ( 100 ) =0.064< 0.25<0.28=Fi (200) et donc en éfféctuant une interpolation linéaire:
(0.25−0.064 )
Q1=100+ × ( 200−100 )=186.11
(0.280−0.064 )
Le troisiéme quartile est compris entre 300 et 500, car on a
F i ( 300 ) =0.568<0.75< 0.848=F i (500). Le troisiéme quartile se détermine ensuite par
intérpolation linéaire:
(0.75−0.568)
Q3=300+ × ( 500−300 )=430
(0.848−0.568)
Le tableau statistique montre que le 9 e décile est compris entre 500 et 1000 car
F i ( 500 ) =0.848<0.90< 1=Fi (1000). On a donc:
(0.90−0.848)
D9=500 + × ( 1000−500 )=671.05
(1−0.848)
Les moyennes
Définition: Soit un caractère statistique discret X de modalités x 1 , x 2 ,… , x p, classées par ordre
p
croissant. La moyenne arithmétique X du caractère X est le nombre tel que:
∑ ni x i .
X = i =1
N
Exemple: Lorsque le professeur de statistiques corrige 250 copies, notées sur 10, et qu'il classe et
regroupe ses notes pour étudier le caractère statistique "notes à l'examen", il établit le tableau
suivant:
Notes: x i 0 1 2 3 4 5 6 7 8 9 10 Somme
Effectif: ni 15 3 32 24 20 35 42 38 28 12 1 250
Fréquences: f i 0.06 0.012 0.128 0.096 0.08 0.14 0.168 0.152 0.112 0.048 0.004 1
L'opération pour calculer la moyenne de ses notes est:
15∗0+3∗1+ 32∗2+…+ 12∗9+1∗10 1254
m= = =5.016
250 250