Les moyennes
Moyenne arithmétique
Moyenne arithmétique simple:– c’est le quotient de la somme des
valeurs d’une variable par leur nombre
𝑝
1 avec p – les modalités de x
𝑥lj = 𝑥𝑖
𝑝
𝑖=1
Propriétés de la moyenne arithmétique:
Lorsque la moyenne est substituée à chacune
des valeurs de la série, la somme obtenue ne
change pas
La somme algébrique des écarts des termes de
la série par rapport à la moyenne est nulle
La somme des carrés des écarts par rapport à
une constante est minimale si la dernière=à la
moyenne
1
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Moyenne arithmétique pondérée: Si xi désigne les valeurs
du caractère, ni - les effectifs correspondants et n - l’effectif
total alors la moyenne arithmétique pondérée de la série
statistique est:
1
x = ni x i avec n – les effectifs
n i
• Les pondérations reflètent le fait que toutes les valeurs n’ont pas la
même importance.
• Influence d’autant plus forte sur la moyenne que la dispersion des
valeurs est importante.
• De manière générale, les ni peuvent être des poids arbitraires, on les
appelle alors « coefficients de pondération », ou tout simplement
« coefficients »
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
1
Exemple 1: x=
n i
ni x i x = f i xi
i
Moyenne pondérée des salaires mensuelles
Salaires (xi) ni nixi fi fixi
1200 10 12000 0,13 160 Moyenne simple:
1600 20 32000 0,27 426,67 (1200+1600+2000+240
2000 25 50000 0,33 666,67 0+2800)/5=2000
2400 10 24000 0,13 320
2800 10 28000 0,13 373,33
Total 75 146000 1946,67
Moyenne pondérée:
Moyenne 1946,67 1946,67 x = 146000 / 75 = 1946,67
Source : B. PY (2007)
Groupe 1 Groupe 2
Exemple 2: Coef. Alice Boris Coef. Chloé David
Statistique 2,5 12 6 1 5 15
Microéconomie 1,5 12 10 1 10 10
Théorie éco 1 11 14 2 15 5
Moy. simple 11,67 10,00 10,00 10,00
Moy. pondérée 11,80 8,80 11,25 8,75
4
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Si l’on ne dispose que d’un regroupement en classes, on prendra
pour xi le centre de la ième classe (hypothèse: toutes les observations sont
uniformément reparties et les valeurs sont regroupées au centre des classes).
borne _ gauche + borne _ droite
ci =
2
Moyennes avec des données groupées
Durée des
centre de
audits Nombre (ni) nici
classe (ci)
(jours) (xi)
10-14 4 12 48
15-19 8 17 136
20-24 5 22 110
25-29 2 27 54
30-34 1 32 32
Total 20 380
moyenne 19
6 source : D. ANDERSON, D. SWEENEY et T. WILLIAMS (2001)
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Propriétés de la moyenne arithmétique:
• Si l'on ajoute (ou retranche) un même nombre à chaque valeur
de la série, la moyenne arithmétique se trouve augmentée
(diminuée) de ce nombre.
✓ On peut en particulier retrancher de chaque valeur la moyenne
arithmétique de la série = centrage de la série.
✓ La série centrée a une moyenne arithmétique nulle.
• Si l'on multiplie par un même nombre chaque valeur de la série,
la moyenne arithmétique est multipliée par ce nombre.
✓ Propriété qui implique que la valeur de la moyenne arithmétique est
indépendante du choix de l'unité de mesure.
• Propriété d'associativité (ou d'agrégation) : la moyenne
arithmétique des moyennes arithmétiques calculées sur des
sous-ensembles d'une série est égale à la moyenne arithmétique
générale de la série.
7
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Avantages
• Elle a de bonnes propriétés calculatoires, comme la linéarité :
ax + b = ax + b
• Elle prend en compte l’ensemble des valeurs (contrairement au mode)
Inconvénients
• Elle est très sensible aux valeurs « extrêmes »
✓ Exemple : si dans une entreprise les 10 salariés gagnent chacun 1500€
par mois et que le patron gagne lui 7000€ par mois, le salaire moyen
mensuel est de 2000€…
• Pour être significative, une moyenne doit être calculée sur un grand
échantillon
➢ Attention à l’interprétation! Ex.: 10 000€ prix moyen d’achat des
voitures par les français ≠ en moyenne les français possèdent une
voiture de 10 000€ (car les français sans voiture n’ont pas fait partie
des enquêtés)
8
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Moyenne géométrique
Exemple: L’essence a augmenté de 10% l’an dernier et de 30% cette
année. Quel est le taux d’augmentation moyen annuel ?
Ce n’est pas 20% ! La moyenne arithmétique ne convient pas.
Si t est ce taux, on a bien sûr : 1+ t = 1,11,3 et donc t =0,196=19,6%.
La « bonne » moyenne est ici la moyenne géométrique
Avec les notations précédentes :
G = n x1 ... xn est la moyenne géométrique de la série
dont la croissance est géométrique – c’est la racine nième du produit des n
valeurs positives du caractère x (utilisation la plus courante de G: calcul du
taux annuel
10
moyen de variation/TAMV )
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
• On peut aussi avoir la moyenne géométrique pondérée
✓ Exemple: trouver le taux annuel moyen d’évolution par an (TVAM), si 5%/an
pendant les 2 premières années; 9%/an pendant les 5 années suivantes et 12%/an
pendant les 3 années suivantes
Solution: (1+TVAM)10=(1,05)2 x (1,09)5 x(1,12)3
1+TVAM=[(1,05)2 x (1,09)5 x(1,12)3]1/10
ln (1+TVAM)=[2*ln (1,05) + 5*ln (1,09)+ 3*ln (1,12)]/10
1+ TVAM≈exp(0,087)=1,09 d’où TVAM=0,09, soit 9%
log (G ) = log (G ) = f i log (xi )
ni log (xi )
Expressions en log : 1
n i i
• Le log de la moyenne géométrique pondérée est égal à la moyenne arithmétique
pondérée des log des valeurs xi.
𝑛 𝑛 𝑛 p - nombre de modalités
𝐺= 𝑥1 1 ⋅ … ⋅ 𝑥𝑝 𝑝
ni
D’une façon générale, on a: fi = 𝑓 𝑓
G = 𝑥11 ⋅ 𝑥22 ⋅. . .⋅ 𝑥𝑝𝑝
𝑓
ni
i
12
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Moyenne harmonique
La moyenne harmonique (ici pondérée) d'une série de
valeurs est le nombre qui conserve la somme des inverses
de ces valeurs (calcul d'un taux de change moyen, d'une durée
ou vitesse moyenne …)
n
H=
ni
i ( x )
i
13
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Moyenne harmonique
Quand le phénomène étudié varie comme la variable, il faut choisir la
moyenne arithmétique.
• Ex.: en une heure, un cycliste fait d’abord 45 km, puis, en une autre heure, 35km;
quelle est la vitesse moyenne
𝐾𝑀
=?
𝐻
45𝑘𝑚 35𝑘𝑚
𝐾𝑀 45 + 35 80 +
= = = 40 𝑠𝑜𝑖𝑡 ℎ ℎ = 𝟒𝟎 𝒌𝒎
𝐻 1+1 2 2 𝒉
Quand le phénomène étudié varie comme l’inverse de la variable, il faut
choisir la moyenne harmonique.
• Ex.: sur un trajet de 315 km, on fait 45 km/h à l’aller et 35 km/h au retour; quelle est la
vitesse moyenne
𝐾𝑀
=?
𝐻
𝐾𝑀 315𝑘𝑚 + 315𝑘𝑚 630𝑘𝑚 𝒌𝒎
= = = 𝟑𝟗, 𝟑𝟕𝟓
𝐻 𝑘𝑚 𝑘𝑚 7ℎ + 9ℎ 𝒉
315𝑘𝑚/45 + 315𝑘𝑚/35
ℎ ℎ
15
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Exemple: Un touriste américain a changé 1000 $ contre
des € quand l’€ valait 1,3 $ et 3000 $ quand l’€ valait 1,1 $.
A quel taux moyen a-t-il changé des $ en €?
• Contre ses 1000$, il a obtenu 1000/1,3 = 769 €.
• Contre ses 3000$, il a obtenu 3000/1,1 = 2727 €.
• Contre ses 4000$, il a obtenu 3496 € (769+2727).
Le taux de change moyen:
4000 4000
H= = = 1,14
1000 + 3000 3496
1.3 1.1
17
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Moyenne quadratique
Exemple: Soit 2 carrés de cotés 5cm et 6cm; la somme de leurs
aires est-elle égale à l’aire de 2 carrés avec les cotés de 5,5 cm?
➢On doit avoir: 2*x2=52+62,
(25 + 36)
soit: x2=(52+62)/2 et donc x = = 5,52 cm
2
La moyenne à utiliser est la moyenne quadratique – la
racine carrée de la moyenne arithmétique des carrés des
observations de la série
i i i
n x 2
Q=
n
19
Statistique descriptive UVSQ, Natalia ZUGRAVU
Les moyennes
Relation entre les moyennes
Les différentes moyennes (arithmétique, géométrique,
harmonique, quadratique) d'une série de valeurs ne sont
égales que si la série est formée de valeurs toutes identiques.
Dans tous les autres cas, la relation d'ordre suivante est
vérifiée :
H G x Q
En règle générale, si :
• f(x) = x alors M est la moyenne arithmétique
• f(x) = x2 alors M est la moyenne quadratique
• f(x) = 1/x alors M est la moyenne harmonique (avec xi > 0)
• f(x) = ln(x) alors M est la moyenne géométrique (avec xi > 0)
20
Statistique descriptive UVSQ, Natalia ZUGRAVU
Discussion…
Position relative du mode, de la médiane et de la
moyenne
➢ Renseigne sur une caractéristique la forme de la distribution, à
savoir l'asymétrie.
❖ Distribution symétrique
✓ Mode = Médiane = Moyenne (Lorsque la distribution est
symétrique les trois paramètres sont confondus)
✓ Courbe normale ou courbe de Gauss, ou courbe en
21
cloche
Statistique descriptive UVSQ, Natalia ZUGRAVU
Discussion…
❖ Distribution asymétrique
✓ Oblique à gauche (étalée vers la ✓ Oblique à droite (étalée vers la
droite) gauche )
✓ Mode < Médiane < Moyenne ✓ Mode > Médiane > Moyenne
❖ Les indicateurs de tendance centrale nous renseignent donc sur
l’ordre de grandeur de la série statistique et sur sa forme.
22
Statistique descriptive UVSQ, Natalia ZUGRAVU
Discussion…
Moyenne, mode et médiane : que choisir pour
déterminer le centre d’une série ?
➢ Cela dépend du phénomène étudié et du message que
l’on désire faire passer
➢ Il faut présenter la statistique la plus pertinente
❖ La moyenne prend en compte chaque valeur de la
série
❖ Le mode indique une seule valeur, celle qui à la
fréquence la plus élevée
❖ La médiane/quantile indique un rang
23
Statistique descriptive UVSQ, Natalia ZUGRAVU
Discussion…
Relation empirique
➢ Pour les séries peu dissymétriques, on a la relation
x − Mo = 3( x − Mé )
➢ Ce qui permet de calculer une valeur typique
connaissant les 2 autres, ou de vérifier les résultats.
24
Statistique descriptive UVSQ, Natalia ZUGRAVU
Discussion…
Avantages Inconvénients
-Fortement influencée par les valeurs
Moyenne extrêmes
- Facile à calculer
arithmétique -Représente mal une population
hétérogène (polymodale)
- Pas influencée par les valeurs
extrêmes
- Se prête mal aux calculs statistiques
- Peu sensible aux variations
- Suppose l’équirépartition des données
Médiane d’amplitude des classes
- Ne représente que la valeur qui sépare
- Calculable sur des caractères
l’échantillon en 2 parties égales.
cycliques (saison, etc.) où la moyenne a
peu de signification
- Pas influencée par les valeurs
- Se prête mal aux calculs statistiques
extrêmes
-Très sensible aux variations d’amplitude
-Calculable sur des caractères cycliques
des classes
Mode (saison, etc.) où la moyenne a peu de
- Son calcul ne tient compte que des
signification
individus dont les valeurs se rapprochent de
- Bon indicateur de population
la classe modale
hétérogène
25
Statistique descriptive UVSQ, Natalia ZUGRAVU