0% ont trouvé ce document utile (0 vote)
38 vues9 pages

Mesures de tendance centrale en statistiques

Ce document présente les mesures de tendance centrale et de dispersion en statistiques, en se concentrant sur la moyenne arithmétique, géométrique, harmonique et quadratique, ainsi que sur le mode et la médiane. Chaque mesure est définie avec des formules et des exemples pour illustrer leur calcul et leur application. Les remarques soulignent les avantages et inconvénients de chaque mesure, ainsi que des méthodes pour déterminer le mode et la médiane dans des distributions discrètes et continues.

Transféré par

eroukibii
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
38 vues9 pages

Mesures de tendance centrale en statistiques

Ce document présente les mesures de tendance centrale et de dispersion en statistiques, en se concentrant sur la moyenne arithmétique, géométrique, harmonique et quadratique, ainsi que sur le mode et la médiane. Chaque mesure est définie avec des formules et des exemples pour illustrer leur calcul et leur application. Les remarques soulignent les avantages et inconvénients de chaque mesure, ainsi que des méthodes pour déterminer le mode et la médiane dans des distributions discrètes et continues.

Transféré par

eroukibii
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

UNIVERSITÉ IBN ZOHR

Ecole Nationale de Commerce et de Gestion


Dakhla

Statistique et Probabilités S2

Pr. Elouali Aailal

Chapitre : 2

Les mesures de tendance centrale et de dispersion

Année universitaire :
2024 - 2025
1

1 Les mesures de tendance centrale


Les mesures de tendance centrale permettent de synthétiser un ensemble de données observées
relatives à un caractère (variable) quantitatif. C’est sont des valeurs spéciales autour de lesquelles les
données ont tendance à s’accumuler.

1.1 Les moyennes


1.1.1 La moyenne arithmétique
Définition 1.1.
Soit X une variable (caractère) statistique quantitative. La moyenne arithmétique (pondérée) des
modalités xi de X est la quantité :
k k
1X X
x̄ = ni xi = f i xi ,
n i=1 i=1

avec ni est l’effectif de la modalité xi (si la variable X est continue, xi est le centre de la classe Ci ) et
fi sa fréquence.

Théorème 1.1.
Soit x̄ la moyenne arithmétique de la variable statistique X, alors :

1.
k
X
fi (xi − x̄) = 0.
i=1
2.
k k
fi (xi − b)2 = fi (xi − x̄)2 .
X X
min
b∈R
i=1 i=1
3.
Si Y = aX + b avec (a, b) ∈ R2 , alors la moyenne arithmétique de Y est ȳ = ax̄ + b.

Exemple 1.1.
Le tableau suivant donne le nombre d’amis étrangers pour chaque’un de 20 étudiants, choisis parmi les
étudiants de l’ENCG Dakhla.
xi ni fi en %
0 1 5
1 3 15
2 5 25
3 6 30
4 3 15
5 2 10
Total 20 100%
Donc, la moyenne arithmétique du nombre d’amis étrangers pour chaque’un de ces 20 étudiants est
donné par le tableau suivant (dernière case 2,65) :

xi ni ni xi fi f i xi
0 1 0 0,05 0
1 3 0,3 0,15 0,15
2 5 10 0,25 0,50
3 6 18 0,30 0,90
4 3 12 0,15 0,60
5 2 10 0,10 0,50
Total 20 53 1 2,65

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


2

Remarque 1.1.
- La moyenne arithmétique a l’avantage d’être simple a calculer, mais il a l’inconvénient d’être très
sensible aux valeurs extrêmes.
- Si tous les effectifs d’une variable (caractère) statistique X sont égales à 1, alors on dit que la moyenne
arithmétique est simple.
- Dans la suite de ce cours, sauf indication contraire, les résultats seront arrondis au centième.

1.1.2 La moyenne géometique


Définition 1.2.
Soit X une variable (caractère) statistique quantitative. La moyenne géometique G des modalités xi de
X est la quantité : v
u k
· · · xnk k )1/n
u Y n
G= (x1n1 xn2 2 = n
t x i,
i
i=1

avec ni est l’effectif de la modalité xi ( si la variable X est continue, xi est le centre de la classe Ci ) et
fi sa fréquence.

Remarque 1.2.
- En pratique il est plus utile de faire intervenir le logarithme, car la moyenne géométrique des modalités
xi est la moyenne arithmetique de leurs logarithmes ln(xi ) : ln(G) = ln(xi ) ou G = eyi avec
Y = (y1 , y2 , ..., yk ) = (ln(x1 ), ln(x2 ), ..., ln(xk )).
- Il’y a plusieurs applications pratiques de la moyenne géométrique, entre autres le calcul des taux
d’accroissement moyens et on va utiliser ce type de moyennes par la suite (indices statistiques).

1.1.3 La moyenne harmonique


Définition 1.3.
Soit X une variable (caractère) statistique quantitative. La moyenne harmonique des modalités xi 6= 0
de X est la quantité H telle que :
k k
1 1 X ni X fi
= = ,
H N i=1 xi i=1 xi
avec ni est l’effectif de la modalité xi et fi sa fréquence.

Remarque 1.3.
- La moyenne harmonique est appropriée lorsqu’on a des observations qui tendent à varier en sens
contraire (quantité et prix).
- En général on utilise ce type de moyenne dans le calcul des moyennes de rapports, des durées, des
pourcentages et des vitesses moyennes.

1.1.4 La moyenne quadratique


Définition 1.4.
Soit X une variable (caractère) statistique quantitative. La moyenne quadratique Q des modalités xi
de X est la quantité : v v
u
u1 X k u k
uX
Q= t ni xi = t fi x2i ,
2
n i=1 i=1
avec ni est l’effectif de la modalité xi et fi sa fréquence, c’est la racine carrée de la moyenne arithmétique
des carrées des modalités xi de X.

Remarque 1.4.
- Théoriquement la moyenne quadratique est utile dans le calcul de certains paramètres de dispersion
(la deuxième section de ce chapitre).
- Pour la même série statistique, on a toujours les inégalités : H ≤ G ≤ x̄ ≤ Q (voir les TD).

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


3

1.2 Le mode
Définition 1.5.
Soit X une variable (caractère) statistique quantitative. Le mode, noté Mo , associé à la variable statis-
tique X est la modalité dont l’effectif (ou la fréquence) est plus grand que les effectifs (ou les fréquences)
des modalités voisines. Autrement dit que le mode est la valeur qui se répète le plus souvent (il est
possible qu’il y ait plus qu’un mode).

1.2.1 Détermination du mode


1. Si la variable statistique est discrète, alors le mode est facile à déterminer directement soit en
utilisant le tableau statistique ou le diagramme en bâtons (barres).
2. Si la variable statistique est continue, alors le mode se trouve dans la classe modale, c’est la classe
qui correspond à la plus grande fréquence (Lorsque les classes ont même amplitude A), on a :
Mo = ai−12+ai avec [ai−1 , ai [ est la classe modale et fi sa fréquence.

Exemple 1.2.
.
1. Variable statistique discrète :
- Pour la série statistique 13, 9, 4, 9, 58, 102, 9, 58, 37, le mode est Mo = 9.
- Dans le tableau de l’exemple des amis étrangers, la modalité qui a le plus grand effectif est la
modalité 3, donc Mo = 3.
xi ni fi en %
0 1 5
1 3 15
2 5 25
le mode −→ 3 6 30
4 3 15
5 2 10
Total 20 100%
2. Variable statistique continue :
Soit la série continue donnée par le tableau ci-dessous :
Classe Ci [12 ; 13[ [13 ; 14[ [14 ; 15[ [15 ; 16[ [16 ; 17]
Effectif 28 46 65 32 29
La classe modale de X est [14 ; 15[ puisqu’elle est d’effectif maximal égale à 65, on peut considèrer
que le mode est le centre de cette classe Mo = (14 + 15)/2 = 14, 5 (juste pour simplifier le calcul).

1.3 La Médiane
Définition 1.6.
La Médiane, notée Me, associé à la variable statistique X est la modalité qui partage les modalités
en deux parties d’effectifs égaux, c’est-à-dire qu’il y a autant d’observations inférieures à Me que
d’observations supérieures à Me.

1.3.1 Détermination de la médiane


1. Cas d’une variable statistique discrète.
(a) Pour une série statistique brute :
- Si N est impair : N = 2m + 1 : la médiane est xm+1 .
- Si N est pair : N = 2m : la médiane est l’intervalle [xm , xm+1 ]. Dans ce cas, on convient
souvent de prendre pour médiane le centre de cet intervalle, soit (xm + xm+1 )/2.

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


4

(b) Pour une distribution statistique :


Si toutes les fréquences cumulées Fi sont différentes de 0,5, alors la médiane est la modalité
xi associée à la plus petite fréquence cumulée dépassant strictement 0,5. Sinon, c’est-à-dire
s’il existe une modalité xi telle que Fi = 0, 5, alors dans ce cas on a un intervalle médian :
[xi , xi+1 ] et on peut considérer son milieu xi +x2 i+1 comme une médiane.
2. Cas d’une variable statistique continue :
L’unicité de la médiane est garantie, c’est la valeur qui partage exactement la population en deux
parties égales, autrement dit Me est la solution de l’équation F (x) = 0, 5 avec F est la fréquence
relative cumulée croissante (la fonction de répartition de X).

1.3.2 Méthode graphique de détermination de la médiane (cas continu)


Graphiquement, la médiane est l’abscisse du point de la courbe de fréquences relatives cumulées
croissantes qui a comme ordonnée la valeur 0,5 (ou 50%)(l’abscisse du point de la courbe d’effectifs
relatifs cumulés croissants qui a comme ordonnée la valeur N2 ).

1.3.3 Détermination par interpolation linéaire (cas continu)


A partir de la courbe des fréquences relatives cumulées croissantes, on détermine la classe dont
appartient la médiane, c’est la classe [ai−1 , ai [ (la classe médiane) de telle sorte que Fi−1 ≤ 0, 5 < Fi .
donc on a :
0, 5 − Fi−1
Me = ai−1 + A( )
fi
avec [ai−1 , ai [ est la classe médiane et fi sa fréquence. Fi−1 est la fréquence relative cumulée croissante
de la classe précédente.

Exemple 1.3.
.

1. Cas d’une variable statistique discrète.


- La médiane de la série statistique 1, 1, 1, 2, 2, 3, 5, 6, 15, 19, 31, 54, 60 est Me = x6+1 = 5 car
N = 13 = 2 · 6 + 1 (N est impair).
- La médiane de la série statistique −6, −3, −1, −1, 0, 1, 1, 2, 14, 18 est le centre de l’intervalle
[0, 1], donc Me = x5 +x
2
6
= 0+1
2
= 0, 5 car N = 10 = 2 · 5 (N est pair).
- Lorsqu’on a une distribution statistique (tableau) :
Valeurs xi 0 2 5 6 15 20
Effectifs ni 4 2 1 1 2 1
Effectifs cumulés Ni 4 6 7 8 10 11

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


5

On constate que N/2 = 11/2 = 5, 5 vérifie N1 = 4 < N/2 < N2 = 6. Et qu’en conséquence la
médiane est bien égale à x2 = 2.
2. Cas d’une variable statistique continue.
On considère le tableau suivant :
Classe
Centre ci ni fi fi en % Ni Ni↓ Fi Fi↓
Ci
[50 ;55[ 52,5 1 0,0125 1,25 % 1 80 1,25 % 100 %
[55 ;60[ 57,5 2 0,0250 2,5 % 3 79 3,75 % 98,75 %
[60 ;65[ 62,5 11 0,137 13,70 % 14 77 17,50 % 96,25 %
[65 ;70[ 67,5 10 0,125 12,5 % 24 66 30 % 82,5%
[70 ;75[ 72,5 12 0,150 15 % 36 56 45 % 70 %
[75 ;80[ 77,5 21 0,262 26,25 % 57 44 71,25 % 55 %
[80 ;85[ 82,5 6 0,075 7,5 % 63 23 78,75 % 28,75 %
[85 ;90[ 87,5 9 0,112 11,25 % 72 17 90 % 21,25 %
[90 ;95[ 92,5 4 0,050 5% 76 8 95 % 10 %
[95 ;100] 97,5 4 0,050 5% 80 4 100 % 5%
Total 80 1 100%

Dans cet exemple la classe médiane est [75; 80[ (de fréquence cumulée croissante égale à 71,25 %
qui est immédiatement supérieur ou égale à 50%), donc la médiane est son centre :
Me = 75+80
2
= 77, 5.

Remarque 1.5.
- A noter que dans un souci de simplification du calcul et dans le cas d’un caractère continu, on considère
que le mode est le milieu de la classe modale et que la médiane est le milieu de la classe médiane.
- Les classes sont des intervalles qui forment une partition de l’ensemble des valeurs possibles du
caractère (continu) considéré, c’est-à-dire quelles ne se coupent pas et forment ensemble l’intervalle de
toutes les valeurs possibles du caractère.

2 Les mesures de dispersion


2.1 Les quantiles d’ordre α
Les quantiles (dont la médiane, quartiles, déciles) partagent la série en (deux, quatre, dix) sous-
ensembles. Par exemple, ils indiquent l’âge en dessous duquel se situe 50% (médiane) de la population ;
le salaire au-dessus duquel sont rémunérés les 25% (premier quartile) des salariés les mieux payés ; le
revenu net annuel des 10% (premier décile) des salariés du secteur privé, etc.

Définition 2.1.
Soit α ∈]0, 1[. Un quantile (ou fractile) d’ordre α est un réel x vérifiant : F (x) ≥ α et F (x−) ≤ α,
où F désigne la fréquence cumulée croissante (fonction de répartition des fréquences cumulées) et
F (x−) sa limite à gauche en x. De façon équivalente, un quantile d’ordre α est un réel x vérifiant :
N (x) ≥ α · N et N (x−) ≤ α · N, où N désigne l’effectif cumulé croissant (la fonction de répartition
des effectifs cumulés) et N (x−) sa limite à gauche en x.

2.1.1 Quartiles
Définition 2.2.
Le premier quartile noté Q1 est le quantile d’ordre α = 0, 25, le deuxième quartile noté Q2 est le quantile
d’ordre α = 0, 50 c’est la médiane et le troisième quartile noté Q3 est le quantile d’ordre α = 0, 75.

Dans le cas d’une série à caractère discret, les quartiles s’obtiennent en ordonnant les valeurs dans
l’ordre croissant puis :
– Si N est multiple de 4 alors Q1 est la valeur de rang N4 et Q3 est la valeur de rang 3N4
.
– Si N n’est pas multiple de 4 alors Q1 est la valeur de rang immédiatement supérieur à N4 et Q3
est la valeur de rang immédiatement supérieur à 3N 4
.

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


6

Exemple 2.1.
Soit le tableau suivant :
Nombre d’employés 1 2 3 4 5 6 7 8
Effectif 11 18 20 24 16 14 11 6

Le nombre de données est multiple de 4 : 120. Le premier quartile est donc la 30e valeur et le troisième
quartile la 90e valeur.
On a ainsi : Q1 = 3 et Q3 = 6.

Remarque 2.1.
Dans le cas d’une série à caractère continu, les quartiles peuvent s’obtenir à partir de la courbe des
fréquences cumulées croissantes où Q1 est la valeur correspondant à la fréquence cumulée croissante
égale 0, 25 et Q3 est la valeur correspondant à la fréquence cumulée croissante égale 0, 75.

2.1.2 Quintiles, déciles


Définition 2.3.
On appelle le i-ème quintile i ∈ {1, 2, 3, 4} et on le note qi , le quantile d’ordre 5i . On appelle le i-ème
décile i ∈ {1, 2, 3, ..., 9} et on le note Di , le quantile d’ordre 10i .

La détermination des quantiles :

1. Détermination graphique : Elle est pratiquement la même que celle de la médiane, il suffit de
remplacer 0,5 par α.
2. Détermination par interpolation linéaire : Elle correspond à la plus petite fréquence cumulée
croissante dépassant strictement α.

Remarque 2.2.
- Les quantiles sont des indices de position.
- Dans le cas continu, les trois quartiles partagent l’histogramme de la série en quatre parties de même
surface.

2.2 Les mesures de dispersion


Les mesures de dispersion servent à mesurer la dispersion des observations autour d’une valeur
centrale.

2.2.1 L’étendue
Définition 2.4.
On appelle étendue E d’une variable statistique quantitative X, la différence entre la plus grande et la
plus petite valeur de X : E = xmax − xmin .

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


7

Remarque 2.3.
- Pour une variable statistique quantitative continue, l’étendue E est donnée par : E = ak − a0 .
- l’étendue comme une mesure, a l’inconvenient de surestimer la dispersion des observations, s’il y a des
valeurs plus extrêmes.

2.2.2 Ecarts (intervalles) interquantiles


Définition 2.5.
Les écarts (intervalles) interquantiles sont des mesures de dispersion, donnés par la différence entre le
premier et le dernier quantile :
1. Ecart interquartile : DQ = Q3 − Q1 .
2. Ecart interquintile : Dq = q4 − q1 .
3. Ecart interdécile : DD = D9 − D1 .

Remarque 2.4.
Les écarts relatifs : Afin de comparer des distributions différentes, on peut utiliser :
1. Ecart interquartile relatif : ∆Qr = ∆Q
Me
.
D9
2. Ecart interdécile relatif : ∆Dr = D1 .

2.2.3 La variance et l’écart-type


Définition 2.6.
On appelle variance d’une série statistique a caractère quantitatif discret X. Le nombre :
k k
1 X 2
fi (xi − x)2
X
V (X) = ni (xi − x) =
N i=1 i=1

avec les ni sont les effectifs et fi les fréquences. Autrement dit la variance est la moyenne des écarts
(par rapport à la moyenne) au carrés.

Proposition 2.1.
Soient X et Y deux caractères quantitatifs discrets et (a, b) ∈ R2 , alors :
1. Changement de variable : Si Y = X + b, alors V (Y ) = V (X).
2. Si Y = aX, alors V (Y ) = a2 V (X).

Théorème 2.1 (Koenig).


Soit une série statistique a caractère quantitatif discret X, alors :
k k
1 X
V (X) = (x2 ) − x̄2 = ni x2i − x2 = fi x2i − x2
X
N i=1 i=1

avec les ni sont les effectifs et fi les fréquences.

Remarque 2.5.
.

1. Le théorème de Koenig et aussi appelé la formule développée de la variance, elle donne la variance
comme la différence entre la moyenne des carrés et le carré de la moyenne de X.
2. Pour le calcul de la moyenne dans le cas d’un caractère statistique continu, on considère le milieu
des classes.
3. La variance n’est pas une mesure de dispersion absolue mais plutôt une mesure globale de la
variation d’un caractère de part et d’autre de la moyenne arithmétique.
Pour obtenir une mesure de dispersion absolue, on effectue la racine carrée de la variance, appelé
écart-type.

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025


8

Définition 2.7.
On appel écart-type d’une série statistique a caractère quantitatif discret X, et on le note σX . Le
nombre : v v
q u
u1 X k u k
uX
σX = V (X) = t ni (xi − x) = t fi (xi − x)2
2
N i=1 i=1

avec les ni sont les effectifs et fi les fréquences. Autrement dit, l’écart-type est la racine carrée de la
variance ou encore, la moyenne quadratique des écarts (à la moyenne).

L’écart-type est le paramètre de dispersion absolue le plus utilisé en statistique et il est fourni
par tous les logiciels d’analyse des données, y compris les plus simples (calculatrice). Sa signification
est cependant loin d’être évidente (moyenne quadratique des écarts à la moyenne) et de nombreuses
personnes le confondent avec l’écart absolu moyen qui est quant à lui d’interprétation simple (moyenne
des écarts à la moyenne).

Remarque 2.6.
.

1. Le calcul d’une mesure de dispersion relative n’est possible que pour les caractères quantitatifs
positifs.
2
2. On note aussi la variance en fonction de l’écart-type par σX .

Définition 2.8.
On appel coefficient de variation, noté Cv , d’une série statistique a caractère quantitatif discret et positif
X, de moyenne x et d’écart-type σX , le nombre : Cv = σxX .

Remarque 2.7.
.

1. Le coefficient de variation est sans unité, c’est une des raisons pour lesquelles il est parfois préféré à
l’écart type qui lui ne l’est pas. En effet, pour comparer deux séries de données d’unités différentes,
l’utilisation du coefficient de variation est plus judicieuse.
2. Quand la moyenne est proche de zéro, le coefficient de variation va tendre vers l’infini et sera par
conséquent très sensible aux légères variations de la moyenne.

Exemple 2.2.
Soit le tableau suivant (dans cet exemple, on arrondit les résultats au millième) :

q √
Donc, on a V (X) = 159,920
140
= 1, 140 et σX = V (X) = 1, 140 = 1, 067.
σX 1,067
Pour calculer le coefficient de variation, on a : x̄ = 712
140
= 5, 086, donc Cv = x
= 5,086
= 0, 210.

ENCG Dakhla, SP, S2 Pr. Elouali Aailal 2024/2025

Vous aimerez peut-être aussi