0% ont trouvé ce document utile (0 vote)
41 vues140 pages

Statistique descriptive : Concepts clés et calculs

Le chapitre 2 traite de la statistique descriptive, en définissant des concepts clés tels que la population, les unités statistiques, et les caractères qualitatifs et quantitatifs. Il explique également comment calculer les effectifs et les fréquences, ainsi que les représentations graphiques appropriées pour différents types de données. Enfin, il aborde les paramètres de position, notamment les différentes moyennes utilisées pour caractériser des distributions statistiques.

Transféré par

tokysuntzu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
41 vues140 pages

Statistique descriptive : Concepts clés et calculs

Le chapitre 2 traite de la statistique descriptive, en définissant des concepts clés tels que la population, les unités statistiques, et les caractères qualitatifs et quantitatifs. Il explique également comment calculer les effectifs et les fréquences, ainsi que les représentations graphiques appropriées pour différents types de données. Enfin, il aborde les paramètres de position, notamment les différentes moyennes utilisées pour caractériser des distributions statistiques.

Transféré par

tokysuntzu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 2

Statistique descriptive
(Rappel)
I Concepts et Définitions
I-1 – Population et unités.
• -La population est l’ensemble de référence, c’est-à-dire ensemble
des unités observées. C’est l’ensemble des d’unités statistiques.
• Les unités statistiques, aussi appelées individus ou observations sont
les entités abstraites qui qui pourraient être des personnes, des
animaux ou des objets, etc.. La statistique sert à décrire l’ensemble
• des unités statistiques qui composent la population.
I-2 – Caractères qualitatifs et quantitatifs
• Un caractère (ou variable) est un aspect particulier de l’individu
auquel on s’intéresse. Il peut
• être qualitatif ou quantitatif.
Un caractère est quantitatif s’il est mesurable. Il est discret si les
valeurs observées sont isolées. Il est continu s’il peut prendre
toute valeur d’un intervalle.
• Exemple: salaire, revenu, dépense, consommation, âge, taille,
poids, nombre d’élèves/étudiants, température, pression
atmosphérique, précipitation de pluie, etc.
• Un caractère est qualitatif s’il est lié à une observation ne
faisant pas l’objet d’une mesure.
• Exemple:
couleur de cheveux: noire, bleue, etc.
Statut du temps: le temps est beau, mauvais
L’état matrimonial: célibataire, marié, veuf, divorcé
le sexe: masculin ou féminin
I-3 – Modalités et nomenclature.
• Modalités: ce sont les différentes rubriques associées à un caractère qualitatif.
Le sexe a deux modalités. Les modalités d’un caractère doivent former une
partition, c’est-à-dire doivent être exhaustives et disjointes.
• Nomenclature: ensemble des modalités précédées d’un numéro de code.
II – Effectifs et fréquences
Effectif total: nombre d’individus observés, noté n ou N pour
l’ensemble de population

II-1–Effectifs et fréquences relatives (var qualitative).


Effectif ni: nombre de fois où la modalité i a été observée.
Fréquence fi: quotient de l’effectif ni par l’effectif n
• (fi=𝑛𝑖)
𝑛
• Ex: Répartition des salariés d’une entreprise selon le sexe en 2010
Modalités Effectifs Fréquences
Numero i ni fi
1-Homme 139000 48,9
2-Femme 145000 51,1
Total 284000 100
Calcul des fréquences:
Répartition de la population de Madagascar par lien de parenté en 2018
Lien de parenté avec le chef de ménage
(CM) Effectif Fréquence (%)
Chef de ménage(CM) 6 079 876 23,7
Conjoint du CM 4 203 733 16,4
Enfant du CM 12 113 627 47,2
Père/Mère du CM 105 879 0,4
Beau-père/mère du CM 37 888 0,1
Beau-fils/fille du CM 145 552 0,6
Petits-enfants du CM 1 498 563 5,8
Autre parent du CM 990 167 3,9
Parent du conjoint 288 665 1,1
Sans lien 210 246 0,8
Total 25 674 196 100
Remarque
• On a les relations
𝐧𝒊
• n=σ𝒓𝒊=𝟏 𝐧𝒊 fi=σ𝐫 σ𝒓𝒊=𝟏 𝒇𝒊=1
𝐢=𝟏 𝐧𝐢

𝐧𝒊
• 𝒐𝒖 𝒆𝒏𝒄𝒐𝒓𝒆 𝒔𝒊 fi=σ𝐫 *100 alors σ𝒓𝒊=𝟏 𝒇𝒊=100
𝐢=𝟏 𝐧𝐢

• On ne calcule pas les fréquences cumulées pour les


variables qualitatives.
II-2– Effectifs et fréquences cumulées (caractère quantitatif, variable
quantitative).
Fréquences cumulées croissantes: cumul des fréquences associées aux
valeurs du caractère inférieures (strictement).
F1=f1
Fi=σ𝒊𝒋=𝟏 𝒇𝒋 i=2 à p
Tableau 1: associé à un caractère quantitatif discret
Fréquences
Fréquenc cumulées
Valeurs observées Effectifs es croissantes
Xi ni fi Fi
x1 n1 f1 F1

xp np fp Fp
Tableau 2: associé à un caractère quantitatif continu
Fréquences
cumulées
Valeurs observées Effectifs Fréquences croissantes
[bi,bi+1[ ni fi Fi
[b1,b2[ n1 f1 F1
…. … … …
[bp,bp+1[ np fp Fp
xi=(bi+bi+1)/2=centre de classe Fréquences cumulées croissantes: cumul des fréquences associées aux
ai=bi+1-bi=amplitude d’une valeurs du caractère inférieures (strictement).
classe • F1=f1
ni/ai=densité de la classe • Fi=σ𝒊𝒋=𝟏 𝒇𝒋 pour i=2 à p
Exemple
Le tableau suivant donne la répartition des ménages d’un
fonkontany X par nombre de population en 2018. Calculer les
fréquences et les fréquences cumulées croissantes.
Nombre
de 7 ou
personnes 1 2 3 4 5 6 plus Total
Nombre
de
ménages 2327 4533 8918 10405 6210 2134 1123 35650
Réponses
Pour calculer les fréquences, on calcule le quotient ni/n où ni est l’effectif
associé à la modalité xi

Nombre de personnes Nombre de ménages fi Fi


1 2327 6,5 6,5
2 4533 12,7 19,2
3 8918 25,0 44,3
4 10405 29,2 73,4
5 6210 17,4 90,9
6 2134 6,0 96,8
7 ou plus 1123 3,2 100,0
Total 35650 100,0
Par exemple, la proportion de ménages composés 1,2 ou 3 personnes est de
44,3%
Exemple
Les ouvriers d’une entreprise sont répartis en
fonction de leur salaire horaire, dans le tableau
suivant :
Salaire (en F) Effectifs
[20;25[ 38
[25;30[ 59
[30;35[ 47
[35;40[ 24
[40;45[ 12
Plus de 45 2

1° Quelle limite doit-on donner à la dernière classe si l’on veut que toutes les classes aient même
amplitude ?
2° Calculer le centre de chaque classe.
3° Calculer les fréquences associées à chaque classe.
4° Quelle est la proportion d’ouvriers gagnant moins de 35 F de l’heure ?
Salaire (en F) Effectifs
[20;25[ 38
[25;30[ 59
[30;35[ 47
[35;40[ 24
[40;45[ 12
Plus de 45 2
1° Quelle limite doit-on donner à la dernière classe si l’on veut que toutes les classes aient même
amplitude ?
2° Calculer le centre de chaque classe.
3° Calculer les fréquences associées à chaque classe.
4° Quelle est la proportion d’ouvriers gagnant moins de 35 F de l’heure ?
Salaire (en F) Effectifs
[20;25[ 38
[25;30[ 59
[30;35[ 47
[35;40[ 24
[40;45[ 12
Plus de 45 2
Solution
1° Pour que toutes les classes aient même amplitude, il faut que la dernière classe ait une amplitude
de 5. La limite supérieure de cette classe doit donc être 50.
2° Le centre de chaque classe est le milieu de l’intervalle
3° L’effectif total est la somme des effectifs de chaque classe :
n=38+59+…+2=182

Les fréquences correspondent aux quotients de chacun des effectifs par l’effectif total 182 (tableau)

Centres de Fréquences
Salaire (en F) Effectifs classes (%)
[20;25[ 38 22,50 20,88
[25;30[ 59 27,50 32,42
[30;35[ 47 32,50 25,82
[35;40[ 24 37,50 13,19
[40;45[ 12 42,50 6,59
[45;50[ 2 47,50 1,10
total 182 100

4° La proportion d’ouvriers gagnant moins de 35F est égale : 20,88%+32,42%+25,82%=79,12%.


III.4 Représentations graphiques
• Selon le type des variables, il serait mieux de représenter graphiquement
certaines variables. Par exemple, pour les variables qualitatives, on peut
utiliser le diagramme à bandes, le diagramme à secteurs ou secteurs
circulaires ou camembert, des diagrammes figuratifs, etc.
• Pour les variables quantitatives on peut faire des diagrammes en bâton
(variables discrètes), des histogrammes, des diagrammes spécifiques
(triangulaires, radar, des pyramides des âges, etc.), des diagrammes
cartographiques, des boîtes à moustaches ou box plot, des nuages de
points (pour deux variables quantitatives), etc. On peut faire de
regroupement en classe pour avoir des variables du type qualitatif.
Figure 1 : Exemples de graphiques
a) Diagramme à bandes
(répartition des élèves du CP2 enquêtés par DREN)
b) Diagramme à secteurs
(Répartition des enseignants enquêtés par statut
matrimonial)
c) Histogramme de SI100
Score baseline(initial) des élèves du CP2
d) Diagramme à moustaches ou box plot
(largeur constante) de Score initial des élèves du
CP2
Figure 2 : Graphique en radar ou polaire
Graphique en radar pour comparer les parts de
marché d’une entreprise
Entreprise
Chiffre Part de
Entreprise d’affaires marché égalitaire
A 50 31,25 25
B 70 43,75 25
C 10 6,25 25
D 30 18,75 25
Total 160 100
Figure 4 : Diagramme en bâtons
IV. Les distributions statistiques à un caractère
IV.1 Paramètres de position
Un paramètre d’une population est une valeur quantitative ou
numérique qui caractérise un aspect bien particulier de la
distribution d’une (ou de plusieurs) variable(s) numérique(s) de
cette population. Les paramètres de position les plus importants
pour la suite du cours : les moyennes, les quantiles et les modes.
IV.1.1 Les moyennes
Soit X=(xi)i=1 à n une série ou une suite d’observations, Il existe
quatre types de moyennes

a) la moyenne arithmétique
𝑝
σ𝑛
𝑖=1 𝑥𝑖
σ𝑖=1 𝑛𝑖 𝑥𝑖 𝑝
M= 𝑥ҧ = ou M= 𝑥ҧ = 𝑝
σ𝑖=1 𝑛𝑖
avec n=σ𝑖=1 𝑛𝑖
𝑛
b) Moyenne géométrique

G= 𝑛 𝑥1 ∗ 𝑥2 ∗ ⋯ ∗ 𝑥𝑛 =(ς𝑛𝑖=1 𝑥𝑖 )^(1/n) avec xi> 0 ou encore


1 𝑛
lnG= σ𝑖=1 ln 𝑥𝑖 avec ln=Logarithme népérien
𝑛

𝑝 𝑝
G=( ς𝑖=1 𝒙𝒊 𝒏𝒊 )^(1/n) avec n= σ𝑖=1 𝑛𝑖 ou encore
1 𝑛
lnG= σ𝑖=1(𝑛𝑖 ln 𝑥𝑖 )
𝑛
Exemple
Soit la série statistique: 1 2 5 7 10 13
Calculer la moyenne géométrique
𝟔
G= 1∗ 2 ∗5 ∗7∗10∗13=
1
(1 ∗ 2 ∗ 5 ∗ 7 ∗ 10 ∗ 13)6 =4,57
Ou encore :
ln1+ln2+ln5+ln7+ln10+ln13
lnG= =1,5193
6
= => G=4,57
c) Moyenne harmonique 𝒑
𝒏 σ 𝒏𝒊
•H= 𝒏 𝟏 ou encore H= 𝒑 𝒏𝒊
𝒊=𝟏
σ𝒊=𝟏( ) σ
𝒊=𝟏 𝒙𝒊
𝒙𝒊

d) Moyenne quadratique
𝟏 𝒏 𝟏 𝒏
•Q= σ𝒊=𝟏 𝒙𝒊 ²=(A)^0.5 où A= σ𝒊=𝟏 𝒙𝒊 ²
𝒏 𝒏

𝟏 𝒏
ou encore Q= σ𝒊=𝟏 𝒏𝒊 𝒙𝒊 ²
𝒏
Exemples :
1-Chacune des huit épreuves d’un test étant donnée sur
10, un candidat a obtenu les notes suivantes : 3 5 8 10
7 1 9 9
Calculer la moyenne arithmétique de ce candidat
Réponses
3+5+8+10+7+1+9+9
𝑥=
ҧ =6,5
8
2-Soit la série statistique: 1 2 5 7 10 13
Calculer les moyennes arithmétique, géométrique,
harmonique et quadratique
Réponses
Moyenne arithmétique:
1+2+5+7+10+13
𝑥=
ҧ =6,33
6
Moyenne géométrique:
1
G=(1 ∗ 2 ∗ 5 ∗ 7 ∗ 10 ∗ 13) =4,57
6

Ou encore :
ln1+ln2+ln5+ln7+ln10+ln13
lnG= =1,5193= =>
6
G=4,57
Moyenne Harmonique
6
• H=1 1 1 1 1 1 =2,97
+ + + + +
1 2 5 7 10 13
Moyenne quadratique
12 +22 +52 +72 +102 +132
• Q= ( )= 58=7,61
6

Conclusion : H<G<𝑥<Q
ҧ
3-On considère la série statistique discrète suivante
Calculer les moyennes arithmétique, géométrique, harmonique et quadratique de cette
série

xi 1 2 3 4 5 6

ni 22 31 20 11 4 1
Réponses
• Moyenne arithmétique
22∗1 + 31∗2 + 20∗3 + 11∗4 + 4∗5 +(1∗6) 214
𝑥ҧ = = =2,40
89 89
• Moyenne géométrique
89 22
G= 1 ∗ 231 ∗ 320 ∗ 411 ∗ 54 ∗ 61 =2,12
Ou encore !
22∗𝑙𝑛1 + 31∗𝑙𝑛2 + 20∗𝑙𝑛3 + 11∗𝑙𝑛4 + 4∗𝑙𝑛5 +(1∗𝑙𝑛6) 66,94
𝑙𝑛𝐺 = = =0,752
89 89
= = > G=𝑒 0,752 =2,12
• Moyenne quadratique
22∗12 + 31∗22 + 20∗32 + 11∗42 + 4∗52 +(1∗62 )
Q= =2,68
89
• Moyenne harmonique
H=89/(22/1+31/2+20/3+11/4+4/5+1/6)=1,8586843
ExO4-On considère 5 plaques métalliques carrées, dont les côtés
mesurent respectivement ; 5 cm, 6cm, 9 cm, 10 cm et 12,5cm.
a) Quelle est l’aire moyenne de ces plaques ?
b) Quel est le côté de la plaque moyenne correspondante ?
c) Que représente ce côté par rapport aux 5 côtés des plaques ?
Réponses
a) Les aires des plaques sont respectivement :
25cm², 36 cm², 81cm², 100cm² et 156,25cm²
L’aire moyenne est donc :
25+36+81+100+156,25
Am= =79,65cm²
5

b) Le côté moyen serait donc : c= 79,65=8,92cm

c) La moyenne quadratique des côtés est :


52 +62 +92 +102 +12,5²
Q= = 79,65=c
5
Exemple
1-Calculer la moyenne arithmétique de la série
suivante: 14 16 12 9 11 18 7 8 9 16 7 9 18
2-Dépouiller cette série en trois classes:[5;10[;
[10;15[ et [15;20[. Recalculer la moyenne.
3-Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 9 18
5-Le taux de variation du produit intérieur brut (PIB) en volume a été le suivant en
France de 2002 à 2006

Année 2002 2003 2004 2005 2006


Taux de variation 1,0 1,1 2,5 1,7 2,0

Calculer le multiplicateur annuel moyen du PIB de 2001 à 2006.


Réponses
Notons PIB01 le PIB de l’année 2001
PIB02 le PIB de l’année 2002
PIB03 le PIB de l’année 2003
PIB04 le PIB de l’année 2004
PIB05 le PIB de l’année 2005
PIB06 le PIB de l’année 2006

PIB02 −PIB01
TV(PIB)01/02= =1,0%
PIB01
= = > PIB02 = PIB01 + (1,0%)* PIB01 =
PIB01 *(1+0,010)= PIB01 *(1,010)
1,010 est le coefficient multiplicateur du PIB entre 2001 et 2002
De même :
PIB03 = PIB02 + (1,1%)* PIB02 = PIB02 *(1+0,011)
PIB03 =PIB01 *(1+0,10)*(1+0,011)

PIB06 =PIB01 *1,010*1,011*1,025*1,017*1,020=PIB01 *1,0857

• Si m est le coefficient multiplicateur annuel moyen, c’est le coefficient


multiplicateur identique chaque année qui aurait permis globalement au
PIB de connaitre, entre 2001 et 2006, la même croissance que les véritables
coefficients multiplicateurs
• PIB06 =PIB01 *(m)5=PIB01 *1,010*1,011*1,025*1,017*1,020
• (m)5=1,010*1,011*1,025*1,017*1,020
• = = > m=(1,010*1,011*1,025*1,017*1,020)(1/5)
• = = > moyenne géométrique G=(r1*r2*…*rn)(1/n)
6-Un automobiliste effectue un aller–retour
entre deux villes. À l’aller sa vitesse moyenne
est de 130 km/h ; au retour, elle n’est que de 70
km/h. Quelle a été sa vitesse moyenne sur
l’ensemble du parcours?
Réponses
Notons d la distance entre les deux villes.
La distance totale parcourue est égale à D=2d et ;
𝑑 𝑑
T la durée de trajet aller-retour ; T=T1+T2 avec T1= T2=
130 et 70
Distance
V la vitesse moyenne à calculer, V=
Temps
D 2d 2𝑑 2
V= = = =
T T1 +T2 𝑑 + 𝑑 1 + 1
130 70 130 70

= = > V=moyenne harmonique


n
H= 1 1 avec n=2 x1=130 et x2=70
+
x1 x2
8- Dans une entreprise, la répartition des individus par âge et
par sexe est consignée dans le tableau suivant :
Age Homme Femme
[20;25[ 29 38
[25;30[ 48 57
[30;35[ 36 42
[35;40[ 45 39
[40;45[ 49 41
[45;50[ 32 30
[50;55[ 37 18
[55;60[ 28 20
Calculer la moyenne d’âge par sexe.
Calculer la moyenne d’âge de la population totale.
Homme Femme Ensemble
Age xi ni1 ni1xi ni2 ni2xi ni nixi
[20;25[ 22,5 29 652,5 38 855 67 1507,5
[25;30[ 27,5 48 1320 57 1567,5 105 2887,5
[30;35[ 32,5 36 1170 42 1365 78 2535
[35;40[ 37,5 45 1687,5 39 1462,5 84 3150
[40;45[ 42,5 49 2082,5 41 1742,5 90 3825
[45;50[ 47,5 32 1520 30 1425 62 2945
[50;55[ 52,5 37 1942,5 18 945 55 2887,5
[55;60[ 57,5 28 1610 20 1150 48 2760
Total 304 11985 285 10512,5 589 22497,5
Réponses
• Le caractère âge étant regroupé par classe d’âge, il faut calculer la moyenne en utilisant le
centre de chaque classe d’âge xi.
• Les ni1 correspondent aux effectifs masculins
• Les ni2 correspondent aux effectifs féminins
• Les ni correspondent aux effectifs totaux par classe d’âge.

On obtient les moyennes suivantes :


• Moyennes d’âge pour les hommes :
σi=n
i=1 ni1 xi
𝑥1 =
σi=n
i=1 ni1
• Moyennes d’âge pour les femmes:
σ𝑖=𝑛
𝑖=1 𝑛𝑖2 𝑥𝑖
𝑥2 =
σ𝑖=𝑛
𝑖=1 𝑛𝑖2
• Moyenne d’âge de la population totale :
σ𝑖=𝑛
𝑖=1 𝑛𝑖 𝑥𝑖
𝑥ҧ = 𝑖=𝑛
σ𝑖=1 𝑛𝑖
Moyennes d’âge pour les hommes :
σ𝑖=𝑛
𝑖=1 𝑛𝑖1 𝑥𝑖 11985
𝑥1 = = =39,42 ans
σ𝑖=𝑛
𝑖=1 𝑛𝑖1
304

Moyennes d’âge pour les femmes:


σ𝑖=𝑛 𝑛𝑖2 𝑥𝑖 10512,5
𝑥2 = 𝑖=𝑛
𝑖=1 = =36,89 ans
σ𝑖=1 𝑛𝑖2 285
Moyenne d’âge de la population totale :
σ𝑖=𝑛
𝑖=1 𝑛𝑖 𝑥𝑖 22497,5
𝑥ҧ = 𝑖=𝑛 = =38,20 ans
σ𝑖=1 𝑛𝑖 589
e) La médiane
Définitions

La médiane, notée Me, est le quantile d’ordre 50%. Elle partage la série des
valeurs observées en deux séries de même taille (Me=Q50).
Les trois quartiles partagent la série en 4 séries de même taille :
25% des observations sont inférieures au 1er quartile Q25 ;
50% des observations sont inférieures au 2ème quartile Q50 ;
75% des observations sont inférieures au 3ème quartile Q75.
Définition
Les quantiles sont des caractéristiques de position
partageant la série statistique ordonnée en k parties
égales.
Pour k =4, les quantiles, appelés quartiles, sont trois
nombres Q1,Q2,Q3 tels que :
– 25% des valeurs prises par la série sont inférieures à Q1,
– 25%des valeurs prises par la série sont supérieures à Q3,
–Q2 est la médiane Me,
–Q3−Q1 est l’intervalle interquartile, il contient 50 % des
valeurs de la série
• Les déciles sont les neuf valeurs de la variable notées Q10 , Q20…, Q90 qui
partagent les observations en dix groupes d’effectifs égaux : 10 % des
individus de la population ont une valeur de la variable inférieure à Q10…,
90 % des individus de la population ont une valeur de la variable
inférieure à Q90.
• Les centiles sont les 99 valeurs de la variable notées Q1 , Q2 …, Q99 qui
partagent les observations en 100 groupes d’effectifs égaux : 1 % des
individus de la population ont une valeur de la variable inférieure à Q1 …,
99 % des individus de la population ont une valeur de la variable
inférieure à Q99.
Détermination de la médiane Me
Cas discret :
• On suppose que les données ponctuelles sont classées en ordre croissant.
Calculer le quantile d’ordre 50%, par exemple, revient à déterminer la valeur
du caractère xi telle que 50% des valeurs observées soient strictement
inférieurs à xi.
• Si le nombre d’observation est impair, on a n=2p+1. On convient de considérer
comme quantile d’ordre 50%, la (p+1) ième valeur de la série observée.
• Si le nombre d’observation est pair, on n=2p. Deux cas possibles :
• -la pième et la (p+1)ième valeur de la série sont égales ; on conviendra de
considérer, comme quantile d’ordre 50%, cette valeur.
• -la pième et la (p+1)ième valeur de la série sont différentes ; on prend, comme
quantile d’ordre 50%, la (p+1)ième valeur de la série (ou on peut prendre la
moyenne de cs deux valeurs par convention).
Exemple: Calculer la médiane de la série statistique
7 18 8 9 16 9 11 12 14 9 16 7 18
Exemple
Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 9

Exemple
Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 8 9 16 7 9 18 10 5 4
Réponses
• n=13=2*6+1 = = > p=6 = = > le quantile d’ordre 50% ou la médiane est
la (p+1)ième valeur ou le 7ième valeur= = > Me=11
7 7 8 9 9 9 11 12 14 16 16 18 18
Exemple
Dans une bibliothèque, l’ensemble des abonnés a
été réparti suivant le nombre d’ouvrages
empruntés durant un mois :

xi 0 1 2 3 4 5 6 7
ni 18 39 57 64 42 33 21 14
Calculer la médiane de cette série.
Réponses
On calcule les fi et Fi
• f1=18/288*100=6,25
• f2=39/288*100=13,54
• F1=f1=6,25

39,58% des individus empruntent moins de 3 ouvrages


xi ni fi en % Fi en %
0 18 6,25 6,25
1 39 13,54 19,79
2 57 19,79 39,58
3 64 22,22 61,81< = = 50%
4 42 14,58 76,39
5 33 11,46 87,85
6 21 7,29 95,14
7 14 4,86 100,00
Total 288 100
= => la médiane est Me=3
39,58% des individus empruntent moins de 3 ouvrages
Cas continue:
Pour calculer le quantile d’ordre α%, il faut déterminer la classe dans laquelle les
fréquences cumulées croissantes atteignent α%.
Soit [a,b[ cette classe, on note :
a=la limite inférieure de la classe ;
b=la limite supérieure de la classe
F(a)=fréquence cumulée croissante (en pourcentage) au point a
F(b)=fréquence cumulée croissante (en pourcentage) au point b
On prend, comme hypothèse, l’équiprobabilité des valeurs observée dans chaque
classe, ce qui permet de calculer Qα par interpolation linéaire.
𝑄α − 𝑎 α − F(a)
=
𝑏−𝑎 𝐹 𝑏 − 𝐹(𝑎)
ou encore :
α−F(a)
𝑄α =a+(b-a)*( )
𝐹 𝑏 −𝐹(𝑎)
Exemple
Le tableau suivant donne la répartition d’une
population par tranche d’âge:

classe [0; 10[ [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ [70; 80[

Nbre ni 18 44 68 54 42 36 16 10
1-Calculer la moyenne arithmétique
2-Calculer la médiane Q50 et
3-Calculer les quartiles de cette série statistique (Q25 et Q75)
Réponse
ni fi Fi ci nici
[0; 10[ 18 6,25 6,25 5 90
[10; 20[ 44 15,28 21,53 15 660
[20; 30[ 68 23,61 45,14 25 1700
[30; 40[ 54 18,75 63,89 35 1890
[40; 50[ 42 14,58 78,47 45 1890
[50; 60[ 36 12,50 90,97 55 1980
[60; 70[ 16 5,56 96,53 65 1040
[70; 80[ 10 3,47 100 75 750
Total 288 100,00 10000

Me= 32,592
M= 34,7222
Réponse
ni fi Fi ci nici
[0; 10[ 18 6,25 6,25 5 90
[10; 20[ 44 15,28 21,53 15 660
[20; 30[ 68 23,61 45,14 25 1700
[30; 40[ 54 18,75 63,89 35 1890
[40; 50[ 42 14,58 78,47 45 1890
[50; 60[ 36 12,50 90,97 55 1980
[60; 70[ 16 5,56 96,53 65 1040
[70; 80[ 10 3,47 100 75 750
Total 288 100,00 10000

Me= 32,592
M= 34,7222
Me=30+(40-30)*((50-45,14)/(63,89-45,14))
Q25 =20+(30-20)*((25-21,53)/(45,14-21,53))
Exemple
1-Calculer la moyenne arithmétique et la médiane de
la série suivante: 14 16 12 9 11 18 7 8 9 16 7 9
18
2-Dépouiller cette série en trois classes:[5;10[;
[10;15[ et [15;20[. Recalculer la moyenne et la
médiane.
3-Calculer la médiane de la série statistique suivante :
14 16 12 9 11 18 7 8 9 16 7 9 18
Réponses:

nixi fi Fi
[5;10[ 6 7.5 46.2 46.2
[10;15[ 3 12.5 23.1 69.2
[15;20[ 4 17.5 30.8 100.0
13 100.0

Q50=Me= 10.8
APPLICATION: Boîte à moustaches: Détection des valeurs aberrantes:
La Boîte à moustache de l’anglais « Box and Whiskers » ou diagramme de Tuckey,
parfois aussi désignée « box plot », est un graphique qui résume la dispersion
d’une série à partir de 5 valeurs: la valeur minimale et la valeur maximale (ce sont
les moustaches), l’intervalle interquartile (désigné par ses deux valeurs Q1=Q25
et Q3=Q75) et la médiane (ces trois valeurs constituant la « boîte »).
Une valeur peut appelée valeur aberrante si elle s’écarte d’une distance d’au
moins 1,5*(Q3-Q1) au dessus du troisième quartile ou en dessous du premier
quartile: en dessous de Q1- 1,5*(Q3-Q1) ou au-dessus de Q3+ 1,5*(Q3-Q1)
Exo1: La série suivante donne les âges des enfants d’école primaire pour l’année scolaire
2005/06

9 6 7 7 3 9 10 1 8 7 9 9 8 10 5 10 10 9 10 8
1. Déterminer les trois quartiles de la série (Q1 Q2=Q50=Médiane Q3).
2. Déterminer l’écart interquartile.
3. Existe-t-il dans la série, des valeurs aberrantes ?
4. Tracer le diagramme en boîte (ou box-plot)
1.Q1 Q2=Q50=Médiane Q3 2. Déterminer l’écart interquartile+IQR=2,5
Age
1 Valeurs abérrantes
3
5
6
7 Q25=7
7
7
8
8
8 Me=8,5
9
9
9
9
9 Q75=9,5
10
3 .Valleurs aberrantes
Q1-1,5*IQR=7-1,5*2,5=3,25
Q75+1,5*IQR=9,5+1,5*2,5=12,25
Exemple2
La série suivante donne les notes de Stats sur 120 obtenues par les étudiants
de M2 de l’UCM en 2023:
Notes: 50; 25; 53; 21; 58; 110; 60; 61; 103; 65; 67; 68; 98; 71; 72; 72; 67; 99;
79; 80
a) Déterminer la médiane de notes, Q1 (ou Q25), Q3 (ou Q75) et IQR.
b) Calculer Q1-1.5IQR et Q3+I.5IQR.
c) Construire le diagramme en boîte à moustaches de la série des points.
d) Commenter les résultats
Réponse
Variable Min Q25 Q50 Q75 Max IQR

Notes 21 59 67.5 79.5 110 20.5

Q25-1.5IQR= 28,25
Q75+1.5IQR= 110,25
IV.1.3 Les modes
Définitions
Le mode se définit comme la valeur de la variable la plus fréquente, d’effectif
maximum; on l'appelle aussi dominante. Dans le cas d’une série discrète, le
mode est la valeur de la variable xi correspondant à l'effectif le plus élevé.
Graphiquement, c’est la valeur de xi pour laquelle le bâton est le plus grand. Dans
le cas d’une série continue, le mode s’identifie à l’intervalle de valeurs x (appelé
alors classe modale) correspondant à l'effectif par unité d'amplitude le plus
élevé. Graphiquement, il s’agit de la classe pour laquelle on a le sommet de
l'histogramme.

On le note généralement Mo.

Une série possédant plusieurs modes est dite plurimodale.


= = >exemple
xi ni fi en %
0 18 6,25
1 39 13,54
2 57 19,79
3 64 22,22
4 42 14,58
5 33 11,46
6 21 7,29
7 14 4,86
Total 288 100
= => le mode est M0=3
Remarque : comparaison de xത, Me, Mo
• On a : H≤ 𝐺 < 𝑥ҧ ≤ 𝑄
• La moyenne est le paramètre le plus utilisé. Le calcul de la moyenne est
basé sur l’ensemble des valeurs xi, de ce fait, celle-ci est influencée par
les valeurs extrêmes, contrairement à la médiane, paramètre calculé en
fonction de sa position dans la série. La médiane est donc plus stable et
n’est pas sensible aux valeurs aberrantes.
• Le mode est très facile à calculer, mais c’est le paramètre le plus
sensible lors du regroupement des observations. Deux regroupements
différents peuvent conduire à deux modes distincts.
• Lorsque la distribution est parfaitement symétriques, les trois
paramètresതx, Me, Mo sont alors égaux.
IV.2 Les paramètres de dispersion et de forme
• Les paramètres de dispersion sont des nombres qui mesurent la dispersion
des valeurs observées autour d’un paramètre de position(M, Me, …)
• Variance et écart-type
• Coefficients de variation
• Ecarts absolus moyens
• étendue
• Ecarts interquantiles
• Moments
• Paramètres de formes
• Boîtes à moustaches
IV.2.1 Variance et écart-type
k
• Considérons une distribution : X=(xi), ni, avec i=1,2,...,k et n =  ni
i =1
• La variance de x est :

1 k k
V ( x) =  ni (xi − x ) =  f i ( xi − x ) 2 avec
ni 1
fi = V ( x) =  ni xi − x
2
2 2
n i =1 i =1 n n i
• L'écart-type de x :

1 k k
 ( X ) =  ni (xi − x ) =  fi (xi − x )
2 2
ou
n i =1 i =1
 (X ) = V (X )
IV.2.2 Coefficient de variation
Le coefficient de variation est le rapport de l’écart-type à la moyenne.
C’est un nombre sans dimension, indépendant des unités choisies.
Il permet de comparer des séries exprimées dans des unités différentes.
Le Coefficient de variation est défini par:


CV =
x
IV.2.3 Ecarts absolus moyens

• Ecart absolu moyen par rapport à la moyenne:

𝑝
σ𝑖=1 𝑛𝑖|𝑥𝑖−𝑥|ҧ 𝑝
𝑒𝑥ҧ = =σ1 𝑓𝑖 |𝑥𝑖 − 𝑥|
ҧ
σ𝑛𝑖

• Ecart absolu moyen par rapport à la médiane:


𝑝
σ𝑖=1 𝑛𝑖|𝑥𝑖−𝑀𝑒 | 𝑝
𝑒𝑀𝑒 = =σ1 𝑓𝑖 |𝑥𝑖 − 𝑀𝑒 |
σ𝑛𝑖
Exemple
n = 
k

i = 1

On considère la distribution suivante:


ni

Classes [15:25[ [25:35[ [35:45[ [45:55[ [55:65[ [65:75[ [75:85[


Effectifs 9 15 22 29 17 6 2

a) Calculer la moyenne arithmétique et son écart-type


b) Calculer l’écart absolu par rapport à la moyenne
c) Calculer la médiane et l’écart absolu par rapport à la médiane
Réponse:
Effectif
Classes s xi nixi (xi-m)² ni(xi-m)² |xi-m| ni|xi-m| fi Fi ni|xi-Me|
[15:25[ 9 20 180 655,36 5898,24 25,6 230,4 9,0 9,0 237,4

[25:35[ 15 30 450 243,36 3650,4 15,6 234 15,0 24,0 245,7

[35:45[ 22 40 880 31,36 689,92 5,6 123,2 22,0 46,0 140,3


[45:55[ 29 50 1450 19,36 561,44 4,4 127,6 29,0 75,0 105,0
[55:65[ 17 60 1020 207,36 3525,12 14,4 244,8 17,0 92,0 231,6
[65:75[ 6 70 420 595,36 3572,16 24,4 146,4 6,0 98,0 141,7
[75:85[ 2 80 160 1183,4 2366,72 34,4 68,8 2,0 100,0 67,2
Total 100 4560 20264 1175,2 100,0 1169,0
Moyenne= 45,6
V(X)= 202,64
Ecart-type= 14,24
EAM=em=Ecart à la moyenne= 11,75
Médiane=Me= 46,38
IV.2.4 L'étendue (intervalle de variation)
C’est la différence entre la valeur la plus forte et la valeur la
plus faible de la série.
Donc, dans une série rangée par valeur croissante de la
variable, cela correspond à la différence entre la dernière
et la première valeur de la variable. Pour une série continue, il
s'agit de la différence entre la borne
supérieure de la dernière classe et la borne inférieure de la
première classe :

w = xmax − xmin
IV.2.5 Ecarts interquantiles
• Un intervalle interquantile d’ordre α% contient des valeurs observées centrales,
100−α 100+α
en laissant % des plus petites et % des plus grandes. On note:
2 2
• Iα=[Q(100- α)/2 ; Q(100+α)/2 ]
• Par exemple: L’intervalle interquartile [Q25:Q75] contient 50% des valeurs
observées. Le nombre Q75-Q25 est l’écart interquartile
Les quantiles sont une généralisation de la médiane.
Les quartiles, au nombre de 3 : Q1, Q2, Q3. Ils partagent les observations rangées,
en 4 sous-ensembles d'effectifs égaux. Ce sont les valeurs de la variable
statistique telles que, les observations étant rangées par ordre croissant, un quart
des observations soient inférieures à Q1, un quart comprises entre Q1 et Q2, un
quart comprises entre Q2 et Q3, un quart supérieures à Q3.
Q1 Q2 Q3

25% 25% 25% 25%


• L’intervalle interdécile Q90-Q10 contient 80% des valeurs observées
• L’écart interdécile est le nombre Q90-Q10
IV.3 La concentration
• La médiale
• La courbe de concentration
• L’indice de concentration:Gini
IV.3.1 Médiale
• Valeurs globales
On appelle valeurs globales de la série, les valeurs nixi (ni
effectif de la classe de centre xi)
Médiale
La médiale est une médiane calculée relativement aux
valeurs globales relatives. Elle est notée par Mle
Détermination numérique:
On calcule:
- Les valeurs globales qi=nixi
- Les valeurs globales relatives cumulées croissantes Qi
- On détermine la classe qui contient la médiale, càd dans laquelle les
valeurs globales relatives cumulées croissantes atteignent 50% ou T/2
- Soit [a, b[ cette classe avec T=total des nixi
- Qa les valeurs globales relatives cumulées croissantes au point a; Qb
les valeurs globales relatives cumulées croissantes au point b.
- Par interpolation linéaire, on a:
Mle − a T/2 − Qa
=
b−a Qb − Qa
T/2−Qa
Mle=a+(b-a)*
Qb −Qa
Remarque
• La médiale est une valeur du caractère et s’exprime dans la même
unité;
• La médiale est toujours supérieure ou égale à la médiane
Exemples:
Cas continue
• Le tableau suivant donne la répartition des employés d’une entreprise
selon le salaire mensuel. Calculer la médiane (Q50), Q25, Q75 et la
médiale
Modalités (104F) Effectifs
Numero i ni
[0, 10[ 20
[10, 22[ 36
[22, 27[ 35
[27, 45[ 45
[45, 75[ 72
[75, 120[ 90
Total 298
Réponse: médiane
Modalités (104F) Effectifs
Numero i ni CI fi Fi
[0, 10[ 20 5 6,71 6,71
[10, 22[ 36 16 12,08 18,79
[22, 27[ 35 24,5 11,74 30,54
[27, 45[ 45 36 15,10 45,64
[45, 75[ 72 60 24,16 69,80
[75, 120[ 90 97,5 30,20 100,00
Total 298 100

504166,6
Médiane Q50= 50,41666667 67
Calcul de Q25
Modalités (104F) Effectifs
Numero i ni CI fi Fi
[0, 10[ 20 5 6,71 6,71
[10, 22[ 36 16 12,08 18,79
[22, 27[ 35 24,5 11,74 30,54
[27, 45[ 45 36 15,10 45,64
[45, 75[ 72 60 24,16 69,80
[75, 120[ 90 97,5 30,20 100,00
Total 298 100

Q25=22+(27-22)*((25-18,79)/(30,54-18,79))=24,64255319

Q25=246425,532
Calcul de Q75
Modalités
Effectifs
(104F)
Numero i ni Ci fi Fi
[0, 10[ 20 5 6,71 6,71
[10, 22[ 36 16 12,08 18,79
[22, 27[ 35 24,5 11,74 30,54
[27, 45[ 45 36 15,10 45,64
[45, 75[ 72 60 24,16 69,80
[75, 120[ 90 97,5 30,20 100,00
Total 298 100
Q75=75+(120-75)*((75-69,8)/(100-69,8))=82,74834437

827483,444
• Calcul de médiale
• La médiale est une médiane de la série nixi
• On détermine la classe qui contient la médiale [a,b[, c’est-à-dire la classe
dans laquelle les valeurs globales cumulées croissantes atteignent 50% ou la
moitié des valeurs globales cumulées.

nixi=val Qi=val gl
Numero i ni Ni xi glob comul
[0, 10[ 20 20 5 100 100
[10, 22[ 36 56 16 576 676
[22, 27[ 35 91 24,5 857,5 1533,5
[27, 45[ 45 136 36 1620 3153,5
[45, 75[ 72 208 60 4320 7473,5
[75, 120[ 90 298 97,5 8775 T=16248,5 T/2= 8124,25
Total 298 16248,5
• 75<Mle<120
• 7473,5<50%<16248,5
• =75+(120-75)*((8124,25-7473,5)/(16248,5-7473,5))= 78,3371795
• Ou encore 783371,795Ar
• La médiane de salaire annuel est égal à 504167 Ar, cela signifie que
50% des employés gagnent moins de 504167 . La médiale implique
que 50% de la masse salariale est versée aux salariés gagnant moins
que 783372.
• Ainsi, plus de 50% des employés gagnent moins de 50% de la masse
salariale.
Exercice
La répartition des subventions par exploitation d’une
population d’agriculteurs est résumée dans le tableau suivant :
Classe (105Ar) Effectif
[10 ;20[ 12
[20 ;30[ 18
[30 ;40[ 36
[40 ;50[ 24
[50 ;70[ 30

1-Quelle est la population étudiée ?


2-Quel est le caractère étudié ? De quel type s’agit-il ? Quelles sont ses modalités ? Quel
est l’effectif total ?
3-Calculer la subvention moyenne, sa variance, son écart-type, sa médiane sa médiale.
Exemple: Une enquête sur la répartition des ménages suivant le
revenu par personne a permis d’établir le tableau suivant:
Classe Effectif
2750≤ R <3250 7200
3250≤ R <3750 10200
3750≤ R <4250 10800
4250≤ R <5750 22800
5750≤ R <7250 24000
7250≤ R <7750 9000
7750≤ R <8250 13200
8250≤ R <8750 9600
8750≤ R <10250 5400
10250≤ R <11750 2400
11750≤ R <13250 3600
13250≤ R <14750 1200
14750≤ R <17250 600
calculer la médiale
Réponse:
Classe xi=ci ni Val glob nixi val glob cumulée
[2750 ; 3250[ 3 000 7 200 21 600 000 21 600 000
[3250 ; 3750[ 3 500 10 200 35 700 000 57 300 000
[3750 ; 4250[ 4 000 10 800 43 200 000 100 500 000
[4250 ; 5750[ 5 000 22 800 114 000 000 214 500 000
[5750 ; 7250[ 6 500 24 000 156 000 000 370 500 000
[7250 ; 7750[ 7 500 9 000 67 500 000 438 000 000
[7750 ; 8250[ 8 000 13 200 105 600 000 543 600 000
[8250 ; 8750[ 8 500 9 600 81 600 000 625 200 000
[8750 ; 10250[ 9 500 5 400 51 300 000 676 500 000
[10250 ; 11750[ 11 000 2 400 26 400 000 702 900 000
[11750 ; 13250[ 12 500 3 600 45 000 000 747 900 000
[13250 ; 14750[ 14 000 1 200 16 800 000 764 700 000
[14750 ; 17250[ 16 000 600 9 600 000 774 300 000
120 000 774 300 000

La médiale est la valeur de R (revenu) pour laquelle les valeurs globales cumulées atteignent N/2=387 150 000. Cette
valeur se trouve dans la classe [7250 ; 7750[
. En procédant par interpolation linéaire, on a :
Mle= =7250+(7750-7250)*((387150000-370500000)/(438000000-370500000))
= 7373,33333
La médiale est la valeur de R (revenu) pour laquelle les valeurs globales
cumulées atteignent N/2=387 150 000. Cette valeur se trouve dans la
classe [7250 ; 7750[. En procédant par interpolation linéaire, on a :
Mle= =7250+(7750-7250)*((387150000-370500000)/(438000000-
370500000))
= 7373,33333
• Cas d’une variable discrète.
• On vous donne la série suivante : calculer la médiale de cette série

Xi ni
1 3
2 8
3 2
4 5
5 7
Réponse
Xi ni nixi Ni
1 3 3 3
2 8 16 19
3 2 6 25
4 5 20 45
5 7 35 80
Total 80
La médiale est la valeur qui sépare la masse totale ∑nixi rn
deux parties égales
∑nixi/2=80/2=40 On cherche la première valeur plus
grande que 40 dans la colonne Ni
= = > 45 = = > Mle=4
IV.3.2 La courbe de concentration ou la courbe de
Lorenz
• La courbe de concentration ou la courbe de Lorenz (1880 -1962, économiste
américain qui inventa le concept de courbe de Lorenz en 1905) pour décrire
et mesurer les inégalités en termes de revenu, de salaire. Par la suite, cette
courbe qu’il fut le premier à utiliser servit plus généralement à représenter
visuellement la façon dont se répartit une masse (salariale, de revenus, de
richesses, etc.) au sein d’une population pour se faire une idée du caractère
plus ou moins égalitaire de la répartition de cette masse au sein de la
population et comparer ainsi différentes populations entre elles ou comparer
la distribution d’une masse au sein d’une population en deux ou plusieurs
points du temps afin de savoir si l’inégalité augmente ou diminue.
Cette courbe de Lorenz lors des études sur les salaires et les revenus a pour but de décrire les effets de la
concentration dans la population. Sur l’axe des abscisses, on porte les fréquences cumulées croissantes Fi,
et sur l’axe des ordonnées les valeurs globales relatives cumulées croissantes Qi. La courbe de
concentration est inscrite dans un carré.
Interprétation
• Un pourcentage Fi d’individus de la population se partage un
pourcentage Q’i de la masse salariale totale des valeurs globales. Plus
la courbe s’éloigne de la diagonale du carré, plus la concentration est
importante ; plus la courbe se rapproche de la diagonale OC, plus la
répartition est équitable. A la limite, le segment [OC] est une courbe
de concentration associée à une population où il y a équirepartition
de la masse totale des valeurs globales.
Comparaison de repartition de revenu pour deux pays

L’inégalité est plus accentuée pour le Pays B que pour le Pays A


50% des ménages ou de population les plus pauvres possèdent 20% du revenu national
Trois cas typiques sont représentés par les graphiques ci-
dessous

La courbe de Lorenz se confond La courbe de Lorenz partage La courbe de Lorenz est ODC.
avec la droit OC d’égalité le triangle OCD en deux La surface de A occupe tout le
parfaite. Chaque individu de la surfaces. Plus la surface de A triangle OCD et la surface de B
population possède la même augmente aux dépends de la a disparu. C’est le cas
part de la masse totale. surface de B et plus théorique où un seul individu
l’inégalité augmente possède 100% de la masse
(inégalité modérée). totale et les autres n’ont rien.
IV.3.3 L’indice de concentration ou l’indice de Gini
On dispose de plusieurs paramètres statistiques pour mesurer l’inégalité des
salaires, revenu ou patrimoine au sein d’une population. L’indice de Gini ou le
coefficient de Gini en est un.
L’aire de concentration ou le coefficient de Gini ou l’indice de Gini (Corrado
Gini : 1884 -1965 statisticien, démographe, ethnologue, sociologue et idéologue
italien) est une mesure de l'inégalité associé à la la courbe de Lorenz.
En pratique, lorsqu’on s’intéresse à la répartition d’une masse au sein d’une
population, on trace d’abord une courbe de Lorenz afin d’avoir une idée visuelle de
l’égalité ou de l’inégalité de cette répartition. Ensuite, si l’on désire résumer cette
inégalité par un chiffre, on calcule le coefficient de GINI.

L’indice de Gini est le rapport de l’aire A à l’aire du triangle OCD: A A


G=OCD=A+B
C’est un nombre sans dimension,
0≤G≤1
Si G=0 alors la répartition est parfaitement égalitaire
Formules:
𝐴 1 𝐴
G= or A+B= = = > G= 1 =2A
𝐴+𝐵 2
2
1 1
A= –B ==> G=2A=2( – B)=1-2B
2 2
d’où G=1-2B
Si y=g(x) est la fonction de concentration alors on a:
1
G=1-2‫׬‬0 g x dx ou encore
1
G=2‫׬‬0 [x − g x ]dx
𝑥 3 1
Exemples : g(x)=𝑒 - (e - 2)x – 1; f(x)= x+ -1
2 𝑥+1
Calcul de l’indice de Gini par:
A partir du tableau statistique, après calcul des fi, Fi, qi, Qi

Méthode des triangles : G=σr−1


i=1 (Fi Q i+1 − Fi+1 Q i )

Méthode des trapèzes : G=1-[𝑓1 𝑄1 + σr−1


i=2 𝑓𝑖 (𝑄𝑖+1 + 𝑄𝑖 )]

∆ 1
Méthode de différence moyenne : G= ҧ avec Δ= 2 σi<j ni nj |xi − xj |
𝑥 n
Exemple
Tracer la courbe de de concentration ou la courbe de Lorenz
relative aux données suivantes et calculer l’indice de Gini
correspondant.
Classe Effectifs ni
[0 : 10[ 200
[10 : 20[ 200
[20 : 30[ 200
[30 : 40[ 200
[40 : 50[ 200
Réponses
Val
Valeurs Valeurs globales
Centre de globales Freq Freq globales relatives
Effectifs classe nixi relatives cumulée relatives cumulées
Classe ni xi fi Fi f'i Q'i
[0 : 10[ 200 5 1000 0.2 0.2 0.04 0.04
[10 : 20[ 200 15 3000 0.2 0.4 0.12 0.16
[20 : 30[ 200 25 5000 0.2 0.6 0.2 0.36
[30 : 40[ 200 35 7000 0.2 0.8 0.28 0.64
[40 : 50[ 200 45 9000 0.2 1 0.36 1
Total 1000 25000 1 1
Courbe de Lorenz ou de concentraion
Freq
cumulée Val globales cumulées
Fi Qi
0 0
20 4
40 16
60 36
80 64
100 100
Calcul de l’indice de Gini
Valeur
Valeur s Val
s global globale
Centre global Freq Freq es s
de es relativ cumul relativ cumulé
Effecti classe nixi es ée es es
Classe fs ni xi fi Fi qi Qi r FiQi+1 Fi+1Qi FiQi+1-Fi+1Qi
[0 : 10[ 200 5 1000 0,2 0,2 0,04 0,04 1 0,032 0,016 0,016
[10 : 20[ 200 15 3000 0,2 0,4 0,12 0,16 2 0,144 0,096 0,048
[20 : 30[ 200 25 5000 0,2 0,6 0,2 0,36 3 0,384 0,288 0,096
[30 : 40[ 200 35 7000 0,2 0,8 0,28 0,64 4 0,8 0,64 0,16
[40 : 50[ 200 45 9000 0,2 1 0,36 1 5
Total 1000 25000 1 1 G=0,32
Exo 1: Tracer la courbe de Lorenz puis calculer
l’indice de Gini de la distribution suivante:

Effectif
Classe ni
[30;34[ 40
[34;38[ 30
[38;42[ 20
[42;46[ 10
Exo1: Calculer l’indice de Gini de chacune de deux
distributions suivantes. Commenter les résultats
Distribution 2:
Distribution 1
Classe ni
Classe ni
[5;15[ 103
[5;15[ 123
[15;25[ 189 [15;25[ 189
[25;35[ 217 [25;35[ 217
[35;45[ 184 [35;45[ 184
[45;55[ 118 [45;55[ 118
[55;65[ 95 [55;65[ 95
[65;75[ 52 [65;75[ 52
[75;85[ 22 [75;85[ 42
Exo:Le tableau suivant donne la répartition des salariés d’une entreprise selon la tranche de
salaire mensuel.

Salaire (103Ar) [600,900[ [900,1200[ [1200,1500[ [1500,1800[ [1800,2100[ [2100,2400[

Effectif (ni) 31 95 101 59 36 18

1-Quelle est la population étudiée ?


2-Que signifie le nombre 95 du tableau ? Quel est l’effectif total ?
3-Calculer la proportion de salariés qui gagnent moins de 1 500 000Ariary.
4-Calculer le salaire moyen, sa variance, son écart-type, sa médiane et sa médiale.
5-Construire la courbe de Lorenz et calculer l’indice de Gini correspondant à cette
série.
IV.4 Les indices
Les indices sont des nombres sans dimension qui facilitent la
comparaison d’observations quantitatives faites dans des situations
différentes (périodes, dates, endroits/zones ou groupes différents). On
les exprime souvent en pourcentage.
Les données statistiques peuvent varier dans le temps. Les
transformer en indice base 100 permet de les comparer
facilement à partir d'une année choisie comme référence (elle
est appelée année de base).
Pour lire un indice, il suffit de préciser l'année de référence
de la base 100. Utiliser des indices facilite la lecture des
évolutions entre plusieurs séries. Un indice permet de
comparer facilement entre elles et dans le temps des
évolutions de séries de données statistiques. Un indice
supérieur à 100 montre une augmentation tandis qu'un
indice inférieur à 100 montre une diminution.
IV.1 Les indices élémentaires
IV.1.1 Définitions et notations
L’indice d’évolution d’une variable x entre la situation 0 « dite
de base » ou de référence et la situation t « dite courantes »
est :
xt x
i(x)t/0= ou I(x)t/0=x t ∗ 100
x 0
0
Remarque
x x
i(x)0/0= x ou I(x)t/0=x t ∗ 100=100
0
0 0
Exemple: Evolution des PIB de 2005 à 2015

2005 2010 2015


Etats-Unis 13093 14992 18219
France 2196 2643 2438
Allemagne 2861 3417 3381
Chine 2286 6101 11065
Japon 4755 5700 4395
Réponse
2005 2010 2015
Etats-Unis 100 114,5 139,2
France 100 120,4 111,0
Allemagne 100 119,4 118,2
Chine 100 266,9 484,0
Japon 100 119,9 92,4
Le PIB indiciaire base 100 des États-Unis en 2005 est de 114,49, en 2015 il est
de 139,14. »
•« La lecture par indice montre qu'entre 2005 et 2015, le PIB de la Chine a
proportionnellement le plus augmenté avec un indice de 484, le PIB du Japon a
diminué avec un indice 92,42.
b) Proprités
Les indices élémentaires vérifient les propriétés suivantes :
1 100²
i(x)0/t= ou I(x)0/t= (reversivité)
i(x)t 0
I x t/0
/

Transitivité: quels que soient r, s, t :


i(x)r/s*i(x)s/t=i(x)r/t ou encore I(x)r/s*I(x)s/t=100*I(x)r/t
IV.1.2 Pourcentage de variation
On appelle pourcentage de variation le nombre :
(xt −x0 )
PVt/0=𝑟 = *100
𝑥0
PV>0 : augmentation de la variable
PV<0 : diminution de la variable
PV=0 : situation constante
Remarque : PVt/0=It/0-100=100*(it/0-1)
∆X=xt − x0 :variation absolue de la grandeur X au cours de la période ∆t=0 à t
IV.1.3 Taux d’accroissement annuel moyen constant (TAAMC) sur une longue
période
Si le taux d’accroissement annuel r est constant sur une longue période de n
années, alors on a :
Q1 = Q1
Q2 = Q1( 1 + r)

Qn-1 = Qn-2 (1 + r)
Qn = Qn-1 (1 + r)
Qn = Q1(1 + r )n-1
= = > r= (Qn/Q1)1/(n-1) –1
Hypothèses
– La population change par le même taux (pourcentage) par unité temporelle (e.g.
une année)
– Le changement s’opère à intervalles distincts.
IV.1.4 Taux d’accroissement annuel moyen r calculé avec des taux
d’accroissement annuels différents (TAAMD) r1 , r2 …. rn-1, rn
Q1 = Q 1
Q2 = Q1 ( 1 + r1)

Qn-1 = Qn-2 (1 + rn-1)
Q n= Qn-1 (1 + rn)
Qn = Q1 (1 + r1) (1 + r2)…(1 + rn) = Q1(1 + r)n-1
= = >r = {(1 + r1) (1 + r2)… (1 + rn)}1/n-1-1
• IV.2 Les indices synthétiques

• Les indices synthétiques sont des « résumés numériques » de la série


des indices élémentaires d’un ensemble fini de variables de même
nature ou non, évoluant entre une situation de base 0 et une situation
de référence t. Le plus souvent ces variables sont des prix p, des
quantités ou volumes q, des valeurs v=pq.
IV.2.1 Indices de Laspeyres

-Indices de prix :

C’est la moyenne arithmétique des indices élémentaires des prix, pondérés par les
coefficients budgétaires de la période de base.

L(p)t/0=σ𝑛𝑗=1 𝑐𝑗, 0 ∗ 𝐼 𝑝𝑗 𝑡/0

-Indices des quantités : c’est la moyenne arithmétique des indices élémentaires des
quantités, pondérés par les coefficients budgétaires de la base

L(q)t/0=σ𝑛𝑗=1 𝑐𝑗, 0 ∗ 𝐼 𝑞𝑗 𝑡/0


• IV.2.1 Coefficients budgétaires

• Soit n produits Pj dont on connait les prix (unitaires) et les quantités à deux périodes de différentes,
on appelle coefficient budgétaire du produit Pj, par rapport à l’une de ces périodes, la part
représentée par la valeur (prix*quantité) de ce produit à cette période relativement à la valeur totale
de tous les produits à cette même période. On note :

𝑝𝑗,0∗𝑞𝑗,0
• Par rapport à la période de base : cj,0=σ𝑛 (en indice j,0, i,0)
𝑖=1 𝑝𝑖,0∗𝑞𝑖,0

𝑝𝑗,𝑡∗𝑞𝑗,𝑡
• Par rapport à la période courante: cj,t=σ𝑛
𝑖=1 𝑝𝑖,𝑡∗𝑞𝑖,𝑡

• Remarque : La somme des coefficients budgétaires est toujours 1

• σ 𝑐𝑗, 0 = 1 𝑒𝑡 σ 𝑐𝑗, 𝑡 = 1
IV.2.2 Indices de Laspeyres
-Indices de prix :
C’est la moyenne arithmétique des indices élémentaires des prix, pondérés par les
coefficients budgétaires de la période de base.

L(p)t/0=σ𝑛𝑗=1 𝑐𝑗, 0 ∗ 𝐼 𝑝𝑗 𝑡/0

-Indices des quantités : c’est la moyenne arithmétique des indices élémentaires


des quantités, pondérés par les coefficients budgétaires de la base

L(q)t/0=σ𝑛𝑗=1 𝑐𝑗, 0 ∗ 𝐼 𝑞𝑗 𝑡/0


IV.2.3 Indices de Paasche
-Indices de prix :
C’est la moyenne harmonique des indices élémentaires des quantités, pondérés par les coefficients
budgétaires de la période courante.
1 1
=σ𝑛
𝑗 =1 𝑐𝑗, 𝑡 ∗
P(p )t/0 𝐼 (𝑝𝑗 )𝑡/0

-Indices des quantités :


C’est la moyenne harmonique des indices élémentaires des quantités, par les coefficients budgétaires
de la période courante.
1 1
=σ𝑛
𝑗 =1 𝑐𝑗, 𝑡 ∗
P(q )t/0 𝐼 (𝑞𝑗 )𝑡/0

Formule de calcul :
σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,0 σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,𝑡
L(p)t/0=σ𝑛 *100 P(p)t/0=σ𝑛 *100
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,0 𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,𝑡

σ𝑛
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,𝑡 σ𝑛
𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,𝑡
L(q)t/0=σ𝑛 *100 P(q)t/0=σ𝑛 *100
𝑗 =1 𝑝𝑗 ,0∗𝑞𝑗 ,0 𝑗 =1 𝑝𝑗 ,𝑡∗𝑞𝑗 ,0
Remarque

Les indices de Laspeyres et de Paasches ne sont pas transitifs, donc non


réversibles, mais on :

1 1
L0/t= et P0/t=
𝑃𝑡/0 𝐿𝑡/0
IV.2.4 Indices de Fisher

L’indice de Fischer Ft/0(X) de la grandeur complexe X est égal à la


moyenne géométrique des indices de Laspeyres et de Paasche, soit par
définition:

Ft/0(X)= L X t/0 ∗P X t/0


IV.2.5 Les indices -chaines

Considérons une suite de dates : 0, 1,2, …, n et une suite d’indices, exprimés en base 100 de l’année précédente/ I1/0, I2/1, ….,In/n-
1. On construit une suite d’indices-chaines CI1/0, CI2/0,…,CIn/0 de la façon suivante :

CI1/0=I1/0

CI2/0=CI1/0*i2/1
.
.
.

CIn/0=CIn-1/0*in/n-1

𝟏
Ainsi, ∀ t {1,2,3,…,n} : CIt/0= ς𝒕 𝑰 = 𝟏𝟎𝟎 ς𝒕𝒌=𝟏 𝒊𝒌/𝒌−𝟏
𝟏𝟎𝟎𝒕−𝟏 𝒌=𝟏 𝒌/𝒌−𝟏

On obtient a puisque lors l’indice facilement relatif à deux dates quelconques de la suite :

𝐂𝐈𝐭′ /𝟎
∀ t, t’{1,2,3,…,n}, =it’/t
𝐂𝐈𝐭/𝟎
Exo1
Le tableau suivant donne l’évolution des frais de personnel (en 103Ar) d’une
entreprise commerciale entre 2010 et 2015. Quel service a vu ses frais de personnel
augmenter le plus rapidement sur la période considérée ? Lequel les a vu
augmenter le moins rapidement ?
2010 2015
Direction 8500 16300
Personnel 12300 32700
Finances 5200 11700
Administration 26600 63150
Marketing 3600 8500
Réponse Exo1:
Calculons pour chaque service les indices
élémentaires des frais (base 100 en 2010)
2010 2015 Indices It/0
Direction 8500 16300 191,8
Personnel 12300 32700 265,9
Finances 5200 11700 225,0
Administra
26600 63150
tion 237,4
Marketing 3600 8500 236,1
Le frais de personnel du service "Personnel" ont augmenté le plus rapidement (166% en 5 ans),
ceux du du service "Direction" ont augmenté le moins rapidement (92% en 5ans)
Remarque: cette reduction peut provenir par exemple, d'une réduction d'effectif plus grande à la "Direction" que pour le
"Personnel"
Exo 2

On connait deux valeurs de l’indice élémentaire du prix d’un certain


produit:
i(p)89/84=1,41
i(p)91/84=1,62
Pouvez-vous en déduire l’évolution du prix de ce produit de 1989 à
1991?
Rep
L'indice i(p)91/84=i(p)91/89*i(p)89/84

i(p)91/89=i(p)91/84/i(p)89/84

i(p)91/84 1.62
i(p)89/84 1.41

i(p)91/89= 1.15
Le prix de ce produit a augmenté de 15% entre 1989 et 1991
Exo3

En 1991, l’indice des dépenses d’un produit P est:120(base


100 en 1989).Durant cette même période, la quantité
consommée de ce produit a augmenté de 14%.
Le prix de ce produit a-t-il augmenté ou diminué? De
combien?
Rep
On sait que dépenses=quantité*prix
i(D)=i(Q)*i(P)
i(D)= 1.2
Comme Q a augmenté de 14% donc i(Q)= 1.14
i(P)=i(D)/i(Q)= 1.0526

Le prix a augmenté de 5% environ (5,26%)


Exo4

Une entreprise a augmenté son chiffre d’affaires, sur un produit P, de


5% entre juin 90 et juin 91. L’indice des prix de ce produit (juin
91/juin90) est égal à 108.
Durant cette période, les quantités vendues ont-elles augmenté ou
diminué? de combien?
Rép
On convient ou on sait que CA=p*q
i(CA)=i(p)*i(q)
i(q)=i(CA)/i(p)
i(CA)= 1.05
i(p)= 1.08

i(q)= 0.97222222

PV(q)=i(q)-100 -0.02777778
PV(q)=i(q)-100 -2.8=====>Les ventes ont diminué de 3% environ
Exo5
• Calculer à partir des prix moyens des denrées alimentaires suivants les taux d’accroissement des prix moyens.

Année 1974 1975 1976 1977 1978 1979 1980 1981 1982

P 17453 17720 17997 18274 18553 18826 19103 19343 19576

1)- Tracer le graphe représentatif de la série des prix moyens annuels.


2)- Calculer la série des taux d’accroissement annuel des prix moyens (TAA)
3)- Calculer le taux d’accroissement annuel moyen avec les valeurs extrêmes initiale et finale (TAAM)
4)- Calculer le taux d’accroissement annuel moyen différents à partir de la série des taux annuels de croissance des
prix (TAAMD). Conclure.
Exo6

Pour trois produits P1, P2, P3, le tableau ci-dessous donne les indices élémentaires I(x) de 1990 et les
coefficients budgétaires correspondants. Calculer les indices de Paasche, Laspeyres et Fisher.

PRODUITS INDICES COEFFICIENTS


Pi ELEMENTAIRES BUDGETAIRES
1990 1991
P1 110 0,20 0,15
P2 125 0,50 0,30
P3 95 0,30 0,55

Vous aimerez peut-être aussi