0% ont trouvé ce document utile (0 vote)
80 vues24 pages

Séries Statistiques : Définition et Représentations Graphiques

Le document traite des séries statistiques à une variable, définissant leur objectif, leurs représentations graphiques et les caractéristiques des données. Il présente divers outils graphiques comme les diagrammes en bâtons, les histogrammes et les diagrammes en secteurs, ainsi que des indicateurs de position tels que le mode et la médiane. Les exemples illustrent comment analyser et interpréter les données à l'aide de ces outils.

Transféré par

mamapapadz2002
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
80 vues24 pages

Séries Statistiques : Définition et Représentations Graphiques

Le document traite des séries statistiques à une variable, définissant leur objectif, leurs représentations graphiques et les caractéristiques des données. Il présente divers outils graphiques comme les diagrammes en bâtons, les histogrammes et les diagrammes en secteurs, ainsi que des indicateurs de position tels que le mode et la médiane. Les exemples illustrent comment analyser et interpréter les données à l'aide de ces outils.

Transféré par

mamapapadz2002
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Partie Statistiques

Chapitre 2 : Séries statistiques


à une variable
1. Définition :
Une série statistique est l’ensemble des résultats d’une étude menée sur une certaine population,
visant à mesurer la présence d’un certain caractère au sein de cette population. L’objectif de
l’étude d’une série statistique est de résumer et de réunir des informations contenues dans la série
statistique afin de mettre en évidence ses propriétés.
Les données d’une série statistique (appelées observations et notées Oi) sont représentés sous
forme brute (non ordonnés) ensuite on peut les disposer sous forme de tableau dont les modalités
sont des aspects, des valeurs discrètes ou continues en classes.
Exemple d’une série statistique : 20, 18, 21, 18, 19, 18, 17, 17, 19
Le nombre de données d’une série statistique est égal à N (la taille de la population).
Plusieurs outils peuvent être utilisés dans cette étude tel que : les tableaux, les graphiques et
certaines caractéristiques
2. Représentations graphiques :
Les représentations graphiques permettent de visualiser les séries statistiques sous forme de
graphes car ils ont l’avantage d’offrir une meilleure vue d’ensemble des données.
2.1 Diagramme en bâtons :
Le diagramme en bâtons est utilisé pour représenter des séries possédant des variables
quantitatives discrètes. On représente sur l’axe des abscisses les modalités de la variable
statistique (xi), et pour chaque valeur on trace un bâton vertical dont la hauteur représente
l’effectif (ni) correspondant à xi.
Exemple 1:
Dans un quartier résidentiel, on a relevé le nombre de pièces par appartement :
Modalité (nombre de 1 2 3 4 5
pièces) xi
Effectif (nombre 48 72 86 64 30
d’appartements) ni
nicc 48 120 206 270 300

1
fi 0.16 0.24 0.2867 0.2133 0.1
ficc 0.16 0.4 0.6867 0.9 1

100

80
Valeurs de ni

60

40

20

0
1 2 3 4 5
Valeurs de xi

Figure 2-1 Diagramme en bâtons des effectifs pour l’exemple 1

On peut avoir aussi le diagramme pour les effectifs cumulés croissants sous forme d’escalier.

350

300

250
Valeurs de nicc

200

150

100

50

0
0 1 2 3 4 5 6
Valeurs de xi

Figure 2-2 Diagramme des effectifs cumulés croissants pour l’exemple 1

2
De même pour les fréquences cumulées croissantes, le diagramme sous forme d’escalier est
donné en figure (2-3).

1.2
1.1
1
0.9
0.8
0.7
Valeurs de ficc

0.6
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5 6
Valeurs de xi
Figure 2-3 Diagramme des fréquences cumulés croissants pour l’exemple 1
2.2 Histogramme :

L'histogramme est utilisé lorsque les séries possèdent des variables quantitatives continues, on
doit alors construire un graphe avec des rectangles représentant les classes ou les intervalles.
La largeur de chaque ième rectangle est égale à l’amplitude de la classe correspondante et sa
hauteur correspond à l'effectif « ni » associé à la classe « i ».
Exemple 2:
Les revenus mensuels d’une centaine d’ouvriers ont été répartis selon le tableau suivant :
Revenu mensuel (en [0, 40[ [40, 80[ [80, 120[ [120, 160[ [160, 200[
milliers de DA) xi
Effectif (Nombre 35 19 28 12 6
d’ouvriers) ni
𝑛𝑖 0.35 0.19 0.28 0.12 0.06
Fréquence
𝑁

3
2.3 Polygone des effectifs :
Le polygone des effectifs est obtenu en joignant par des segments de droite les milieux des bases
supérieures des rectangles de l’histogramme des effectifs.

35

30

25 Polygone
des
Valeurs de ni

20 effectifs

15

10

0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
Valeurs de xi
Figure 2-4 Histogramme et polygone des effectifs pour l’exemple 2

2.4 Polygone des fréquences :


Le polygone des fréquences est obtenu en joignant par des segments de droite les milieux des
bases supérieures des rectangles de l’histogramme des fréquences.

0.35

0.3

0.25 Polygone
Valeurs des fi

des
0.2 fréquences

0.15

0.1

0.05

0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
Valeurs des xi
Figure 2-5 Histogramme et polygone des fréquences pour l’exemple 2

4
2.5 Diagramme en secteurs (circulaire) :
Il est représenté sur un cercle découpé en tranches issues du centre, et dont l'angle «𝜃𝑖 » associé à
la fréquence relative « 𝑓𝑖 » est calculé suivant cette relation : 𝜃𝑖 = 360𝑓𝑖
Généralement chaque secteur est caractérisé par son effectif donné en pourcentage suivant cette
formule : 𝑆𝑖 = 100𝑓𝑖 % . Ce type de diagramme est utilisé souvent dans le cas de variables
qualitatives.
Exemple 3:
L’analyse du sang de 100 personnes a donné les résultats suivants :
Groupe sanguin xi O A B AB
Effectif (Nombre de 40 43 12 5
personnes) ni
𝑛
Fréquence 𝑓𝑖 = 𝑁𝑖 0.4 0.43 0.12 0.05

5%
12%

40%

43%

Figure 2-5 Diagramme en secteurs pour l’exemple 3

2.6 Diagramme en bandes :

Le digramme en bandes, utilisé pour les variables qualitatives, est construit de telle manière
qu’un grand rectangle est divisé en bandes de hauteur proportionnelle à la fréquence ou l’effectif
de la modalité représentée.

Reprenons le 3ème exemple, on aura les effectifs cumulés croissants donnés par :

5
Groupe sanguin xi O A B AB
Effectif (Nombre de 40 43 12 5
personnes) ni
nicc 40 83 95 100

100
AB
B

80

60 A

40

20 O

0
1 2
Figure 2-6 Diagramme à bandes pour l’exemple 3

3. Caractéristiques (indicateurs) de position :


Un indicateur de position est un nombre réel permettant de situer les valeurs d’une série
statistique d’une variable quantitative. Les indicateurs de position sont le plus souvent des
moyennes (arithmétique, géométrique, quadratique,...) ou des quantiles comme la médiane et les
quartiles
3.1 Le mode :
On appelle mode (ou classe modale) la valeur de la modalité ayant le plus grand effectif.
 Cas de données brutes :
Dans le cas de données brutes, le mode est la valeur de l’observation la plus fréquente.
Exemple 4 : dans la série : 10,4, 4, 6, 1, 4, 6, le mode = 4

6
Remarque 1 :
Si nous avons deux valeurs de la variable qui apparaissent avec le même nombre de fois, alors on
aura deux modes.
Exemple 5 : dans la série : 7, 6, 5, 4, 5,7 les modes sont 5 et 7.
 Cas de tableau à variable quantitative discrète :
Dans le cas d’un tableau à variable discrète, le mode correspond à la valeur de la modalité xi qui
correspond à l'effectif ni le plus grand.
Dans l’exemple 1 des appartements, le mode = 3 car il correspond au plus grand effectif.
 Cas de tableau à variable quantitative continue :
Dans le cas d'une variable de type continue, on ne parle pas de mode mais de classe modale qui
représente la classe la plus dense c'est à dire la classe qui contient le plus d'effectifs par
amplitude.
La densité d'effectif di de la classe « i » se calcule en divisant chaque effectif par l'amplitude
𝑛𝑖
correspondante de la classe : 𝑑𝑖 =
𝐴𝑖

Reprenons l’exemple 2
Revenu mensuel (en [0, 40[ [40, 80[ [80, 120[ [120, 160[ [160, 200[
milliers de DA) xi
Effectif (Nombre 35 19 28 12 6
d’ouvriers) ni
di 35 19 28 12 6
= 0.7 = 0.3 = 0.15
40 40 40 40 40
= 0.875 = 0.475

La plus grande densité est 0.875 alors [0; 40[est la classe modale.
3.2 La médiane :
La médiane (notée par Me) est la valeur de l’observation (ou de la modalité xi) qui partage la
distribution d’une série en deux parties égales (en deux sous séries aux effectifs égaux). Dans la
première série on trouve les valeurs inférieures à la médiane, dans la seconde on trouve les
valeurs supérieures à la médiane.

7
Remarque 2 :
Les observations (ou les modalités) doivent être ordonnées par ordre croissant ou décroissant.
3.2.1. Cas de données brutes:
 Si la série possède un nombre impair d’observations (n=2k+1), alors la médiane sera
𝑛+1 è𝑚𝑒 è𝑚𝑒
𝑀𝑒 = = 𝑘+1 observation
2

Exemple 6 : Soit les données suivantes : 23, 4, 12, 92, 67, 23, 22, 17, 29, 14, 82, 25,40, 24, 77
On ordonne ces valeurs par ordre croissant :4, 12, 14, 17, 22, 23, 23,24, 25, 29, 40, 67, 77, 82, 92
On a n = 15 =2*7+1 (impair) donc la médiane sera Me = (7+1)ème= 8ème observation
Me = 24
 Si la série possède un nombre pair d’observations (n=2k), alors la médiane sera la
è𝑚𝑒 è𝑚𝑒
moyenne des observations 𝑘 et 𝑘 + 1
è𝑚𝑒 è𝑚𝑒
𝑘 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 + 𝑘 + 1 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛
𝑀𝑒 =
2
Exemple 7 : Soient les données suivantes : 8, 14, 3, 19, 24, 52, 1, 6, 10, 37
On ordonne ces valeurs par ordre croissant : 1, 3, 6, 8, 10, 14, 19, 24, 37, 52
On a n = 10 =2*5 (pair) donc la médiane sera
è𝑚𝑒 è𝑚𝑒
5 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 + 6 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 10 + 14
𝑀𝑒 = = = 12
2 2
Remarque 3 :
La valeur de la médiane calculée doit impérativement se trouver parmi les valeurs des
observations. Si ce n’est pas le cas alors on prend la valeur de l’observation immédiatement
supérieure à la médiane calculée. De l’exemple précédent (exemple 7), on remarque que la
valeur de Me =12 ne se trouve pas parmi les valeurs de la série, donc on prend Me = 14.
3.2.2. Cas de tableau à variable quantitative discrète:
𝑁
Pour déterminer la médiane, on repère la valeur « 0.5 » dans la colonne de ficc ou bien dans la
2
colonne de nicc. On choisit ensuite la valeur de ficc égale ou immédiatement supérieure à « 0.5 »
𝑁
ou bien la valeur de nicc égale ou immédiatement supérieure à 2 . La valeur de la médiane sera
𝑁
égale à la valeur de xi se trouvant sur la même ligne que ficc = 0.5 ou 𝑛𝑖 𝑐𝑐 = 2

Reprenons l’exemple 1 des pièces d’appartements.

8
Modalité (nombre de 1 2 3 4 5
pièces) xi
Effectif (nombre 48 72 86 64 30
d’appartements) ni
nicc 48 120 206 270 300
fi 0.16 0.24 0.2867 0.2133 0.1
ficc 0.16 0.4 0.6867 0.9 1
300
D’après le tableau ficc = 0.6867 > 0.5 ou 𝑛𝑖 𝑐𝑐 = 206 > = 150 est atteint pour x3 = 3 donc
2

Me =3
3.2.3. Cas de tableau à variable quantitative continue:
Dans le cas continu, on ne parle pas d’une seule variable de la médiane mais plutôt de classe
médiane qui possède une infinité de valeurs.
On cherche d’abord la classe dans laquelle on atteint (ou on dépasse) la moitié de l’effectif total
𝑁
et cela à partir de l’effectif cumulé croissant. Ensuite on peut calculer la valeur approchée de
2

la médiane en utilisant la relation suivante :


𝑁
𝑀𝑒 = 𝑎𝑖 + 𝐴𝑖 2 − 𝑛 𝑖−1 𝑐𝑐
𝑛𝑖

ai : la borne inférieure de la classe médiane.


Ai : l’amplitude de la classe médiane.
ni : effectif associée à cette classe.
n(i-1)cc : effectif cumulé immédiatement inférieure à ai
N : effectif total.
Reprenons l’exemple 2 :
Revenu mensuel (en [0, 40[ [40, 80[ [80, 120[ [120, 160[ [160, 200[
milliers de DA) xi
Effectif (Nombre 35 19 28 12 6
d’ouvriers) ni
nicc 35 54 82 94 100

9
𝑁 100
On a la moitié de l’effectif total = = 50 (on prend donc 54)
2 2
A partir des valeurs de nicc, la valeur « 54 » se trouve dans la classe [40,80[. La classe médiane
sera donc [40,80[.
ai = 40, ni = 19 et n(i-1)cc= 35
𝑁
𝑀𝑒 = 𝑎𝑖 + 𝐴𝑖 2 − 𝑛 𝑖−1 𝑐𝑐 = 40 + 40
50 − 35
𝑛𝑖 19

𝑀𝑒 ≈ 71.58
3.3 La moyenne :
3.3.1 La moyenne arithmétique :
a) Cas de données brutes :
La moyenne est égale à la somme des observations, divisée par leur nombre total, elle est donnée
par cette relation
𝑛
1
𝑀𝑜𝑦 = 𝑂𝑖
𝑛
𝑖=1
Oi : la ième observation
n : le nombre total d’observations
Pour l’exemple 7, on aura :
8 + 14 + 3 + 19 + 24 + 52 + 1 + 6 + 10 + 37
𝑀𝑜𝑦 = = 17.4
10
b) Cas de tableau à variable quantitative discrète :
La moyenne est égale à la somme du produit des effectifs avec les modalités, divisée par
l’effectif total, elle est donnée par cette relation
𝑟
1
𝑀𝑜𝑦 = 𝑛𝑖 𝑥𝑖
𝑁
𝑖=1

r : le nombre de modalités

On reprend le 1er exemple

1 ∗ 48 + 2 ∗ 72 + 3 ∗ 86 + 4 ∗ 64 + 5 ∗ 30
𝑀𝑜𝑦 = = 2.8533
300

10
c) Cas de tableau à variable quantitative continue :

Pour calculer la moyenne dans le cas où les données sont regroupées en classes, il faut calculer le
centre ci de chaque classe puis on applique la formule :
𝑟
1
𝑀𝑜𝑦 = 𝑛𝑖 𝑐𝑖
𝑁
𝑖=1

On reprend le 2ème exemple

Revenu mensuel (en [0, 40[ [40, 80[ [80, 120[ [120, 160[ [160, 200[
milliers de DA) xi
Effectif (Nombre 35 19 28 12 6
d’ouvriers) ni
ci 20 60 100 140 180

35 ∗ 20 + 19 ∗ 60 + 28 ∗ 100 + 12 ∗ 140 + 6 ∗ 180


𝑀𝑜𝑦 = = 74
100
3.3.2 La moyenne harmonique :
a) Cas de données brutes :
L’inverse de la moyenne harmonique (notée H) est la moyenne arithmétique de l'inverse des
observations, elle est donnée par cette relation :
𝑛
1 1 1 𝑛
=  𝐻=
𝐻 𝑛 𝑂𝑖 𝑛 1
𝑖=1 𝑖=1 𝑂
𝑖
Pour l’exemple 7, on aura : 8, 14, 3, 19, 24, 52, 1, 6, 10, 37
10
𝐻= = 5.1627
1 1 1 1 1 1 1 1 1 1
+ + + + + + + + +
8 14 3 19 24 52 1 6 10 37

b) Cas de tableau à variable quantitative discrète :


L’inverse de la moyenne harmonique est donné par cette relation :
𝑟
1 1 𝑛𝑖 𝑁
=  𝐻=
𝐻 𝑁 𝑥𝑖 𝑟 𝑛𝑖
𝑖=1 𝑖=1 𝑥
𝑖

On reprend le 1er exemple :

11
300
𝐻= = 2.2277
48 72 86 64 30
1 + 2 + 3 + 4 + 5

c) Cas de tableau à variable quantitative continue :


L’inverse de la moyenne harmonique est donné par cette relation :
𝑟
1 1 𝑛𝑖 𝑁
=  𝐻=
𝐻 𝑁 𝑐𝑖 𝑟 𝑛𝑖
𝑖=1 𝑖=1 𝑐
𝑖

On reprend le 2ème exemple :

100
𝐻= = 40.5562
35 19 28 12 6
20 + 60 + 100 + 140 + 180
3.3.3 La moyenne géométrique :
a) Cas de données brutes :
la moyenne géométrique (notée G) est égale à la racine nème du produit des « n » observations de
la série statistique. Elle est donnée par cette relation :
1
𝑛 𝑛 𝑛
𝑛
𝐺= 𝑂𝑖 = 𝑂𝑖
𝑖=1 𝑖=1

Pour l’exemple 7, on aura :


10
𝐺= 8 ∗ 14 ∗ 3 ∗ 19 ∗ 24 ∗ 52 ∗ 1 ∗ 6 ∗ 10 ∗ 37 = 10.5868
b) Cas de tableau à variable quantitative discrète :
La relation de calcul de la moyenne géométrique est donnée par :

𝑟
𝑁
𝐺= 𝑥𝑖 𝑛 𝑖
𝑖=1

Pour l’exemple 1, on aura :


300
𝐺= 148 ∗ 272 ∗ 386 ∗ 464 ∗ 530 = 2.5548
c) Cas de tableau à variable quantitative continue :
La relation de calcul de la moyenne géométrique est donnée par :

12
𝑟
𝑁
𝐺= 𝑐𝑖 𝑛 𝑖
𝑖=1

Pour l’exemple 2, on aura :


100
𝐺= 2035 ∗ 6019 ∗ 10028 ∗ 14012 ∗ 1806 = 55.7264
3.3.4 La moyenne quadratique :
a) Cas de données brutes :
La moyenne quadratique (notée Q) est égale à la racine carrée de la moyenne arithmétique des
carrés des observations. Elle est donnée par cette relation :

𝑛 2
𝑖=1 𝑂𝑖
𝑄=
𝑛
Pour l’exemple 7, on aura :

82 + 142 + 32 + 192 + 242 + 522 + 12 + 62 + 102 + 372


𝑄= = 23.2723
10

b) Cas de tableau à variable quantitative discrète :


La relation de calcul de la moyenne géométrique est donnée par :

𝑟 2
𝑖=1 𝑛𝑖 𝑥𝑖
𝑄=
𝑁
Pour l’exemple 1, on aura :

48 ∗ 12 + 72 ∗ 22 + 86 ∗ 32 + 64 ∗ 42 + 30 ∗ 52
𝑄= = 3.1005
300

c) Cas de tableau à variable quantitative continue :


La relation de calcul de la moyenne géométrique est donnée par :

𝑟 2
𝑖=1 𝑛𝑖 𝑐𝑖
𝑄=
𝑁
Pour l’exemple 2, on aura :

35 ∗ 202 + 19 ∗ 602 + 28 ∗ 1002 + 12 ∗ 1402 + 6 ∗ 1802


𝑄= = 88.9944
100

13
4. Caractéristiques (indicateurs) de dispersion :
Un indicateur de dispersion mesure la variabilité des valeurs d’une série statistique. Il est
toujours positif et d’autant plus grand que les valeurs de la série sont étalées.
4.1.Intervalle de variation (l’étendue)
C’est la différence entre la valeur la plus grande et la valeur plus petite parmi les observations.
e = Omax - Omin
Pour l’exemple 7, on aura e = 52-1 = 51
 Si la variable est discrète, alors on prendra la différence entre la valeur la plus grande et
la valeur plus petite parmi les modalités.
Pour l’exemple 1 des appartements : e = 5-1=4
 Si la variable est continue, alors on prendra la différence entre la valeur la plus grande et
la valeur plus petite parmi les bornes des classes.
Pour l’exemple 2 des revenus mensuels : e = 200-0=200
4.2.Quartiles
On appelle quartile la valeur qui divise les données triées en quatre parts égales, de sorte que
chaque partie représente 1/4 de la population.
 Cas de données brutes :
Soit « n » le nombre de données.
 le 1er quartile est la donnée de la série qui sépare le 1er quart (25 %) des données (notée
Q1) ;
 le 2e quartile est la donnée de la série qui sépare les deux quarts (50 %) (la médiane) des
données (notée Q2).
 le 3e quartile est la donnée de la série qui sépare les trois quarts (75 %) des données
(notée Q3).
 Par extension : le 0ème quartile est la donnée de la série la plus petite (notée Q0, c'est le
minimum) et le 4ème quartile est la donnée de la série la plus grande (notée Q4, c'est le
maximum)

Q0 Q4

14
Figure 2-7 Les quartiles
𝑛 𝑛 3𝑛 𝑛
- si ,et 4 sont des entiers naturels, le premier quartile Q1 est le terme de rang , le
4 2 4
𝑛 3𝑛
deuxième quartile Q2 est le terme de rang et le troisième quartile Q3 est le terme de rang .
2 4
𝑛
- si n'est pas un entier naturel on l’arrondit à la valeur entière supérieure la plus proche et la
4
valeur de Q1 sera le terme correspondant à la valeur arrondie.
On refait la même chose pour Q2 et Q3.
Exemple 8:
Soit la série suivante : 20, 37, 47, 68, 28, 34, 50, 19, 61, 24,1, 11, 15,
On organise les valeurs par ordre croissant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 61, 68.
𝑛
 Le nombre de valeurs est n = 13, = 3.25 n’est pas un entier naturel alors on l’arrondit
4
à 4. Le 1er quartile Q1 est la 4ème valeur, c'est-à-dire Q1=19.
𝑛
 = 6.5 , ce n’est pas un entier naturel alors on l’arrondit à 7. Le 2ème quartile Q2 est la
2
7ème valeur, c'est-à-dire Q2=28.
3𝑛
 = 9.75, ce n’est pas un entier naturel alors on l’arrondit à 10. Le 3ème quartile Q3 est
4
la 10ème valeur, c'est-à-dire Q3=47.
Finalement, les cinq quartiles de la série sont Q0=1, Q1=19, Q2=28, Q3=47 et Q4=68.
 Cas de tableau à variable quantitative discrète :
𝑁
Pour une variable discrète, on calcule la valeur du quart de l’effectif total ( ou son arrondi), on
4
la localise dans les effectifs cumulés croissants puis on repère la valeur de xi correspondante qui
sera le 1er quartile Q1.
𝑁 3𝑁
On fait la même chose pour Q2 et Q3 en prenant, respectivement, et
2 4
Exemple 9 : On a fait une étude statistique sur 50 notes obtenues à un concours. Les résultats
obtenus sont donnés comme suit :
Note du concours (xi) Nombre des concurrents (ni) nicc
0 1 1
1 2 3
2 2 5
3 3 8

15
4 2 10
5 3 13
6 2 15
7 3 18
8 4 22
9 3 25
10 2 27
11 3 30
12 4 34
13 4 38
14 3 41
15 1 42
16 2 44
17 1 45
18 2 47
19 2 49
20 1 50

𝑁
 N = 50, donc = 12.5, on arrondit à 13 donc le 1er quartile Q1 = x6 = 5.
4
𝑁
 = 25 (entier), donc le 2ème quartile Q2 = x10 = 9.
2
3𝑁
= 37.5, on arrondit à 38 donc le 3ème quartile Q3 = x14 = 13.
4
Finalement, les cinq quartiles sont Q0=0, Q1=5, Q2=9, Q3=13et Q4=20.
Remarque 4 : si les valeurs des quartiles ne se trouvent pas parmi les valeurs des x i, alors on
prendra la valeur immédiatement supérieure.
 Cas de tableau à variable quantitative continue :
Pour une variable continue en classes, on calcule les effectifs cumulés croissants puis on localise
𝑁 𝑁 3𝑁
la classe où les valeurs de , et se trouvent. Enfin on utilise la formule générale suivante
4 2 4
pour calculer les trois quartiles (Q1, Q2 et Q3)

16
𝑁
𝑗 ∗ 4 − 𝑛𝑖−1 𝑐𝑐
𝑄𝑗 = 𝑎𝑖 + 𝐴𝑖 , 𝑗𝜖 1, 2, 3
𝑛𝑖

ai : la borne inférieure de la classe trouvée.

Ai : l’amplitude de la classe trouvée.

ni : effectif associée à cette classe.


n(i-1)cc : effectif cumulé immédiatement inférieur à la classe trouvée
N : effectif total.
Exemple 10 : Soit le tableau suivant :

xi ni nicc
[0, 10[ 10 10
[10,20[ 20 30
[20, 30[ 30 60
[30,40[ 50 110
[40, 50[ 40 150
[50, 60[ 30 180

𝑁
 N = 180, donc = 45, donc le 1er quartile Q1ϵ[20, 30[. En utilisant la formule pour le
4

calcul de Q1, on aura :

𝑁
− 𝑛𝑖−1 𝑐𝑐 45 − 30
𝑄1 = 𝑎𝑖 + 𝐴𝑖 4 = 20 + 10 ⇒ 𝑄1 = 25
𝑛𝑖 30
𝑁
 = 90 , donc le 2ème quartile Q2ϵ[30, 40[. En utilisant la formule pour le calcul de Q2,
2

on aura :

𝑁
− 𝑛𝑖−1 𝑐𝑐 90 − 60
𝑄2 = 𝑎𝑖 + 𝐴𝑖 2 = 30 + 10 ⇒ 𝑄2 = 36
𝑛𝑖 50

17
3𝑁
 = 135, donc le 3ème quartile Q3ϵ[40, 50[. En utilisant la formule pour le calcul de
4

Q3, on aura :

3𝑁
− 𝑛𝑖−1 𝑐𝑐 135 − 110
𝑄3 = 𝑎𝑖 + 𝐴𝑖 4 = 40 + 10 ⇒ 𝑄3 = 46.25
𝑛𝑖 40
Finalement, les cinq quartiles sont Q0=0, Q1=25, Q2=36, Q3=46.25 et Q4=60.
Remarque 5 :
Pour calculer la médiane ou bien les quartiles dans le cas de tableaux à variable quantitative
(discrète ou continue) on doit d’abord ordonner les modalités ar ordre croissant ou décroissant.
4.3.Variance
On appelle variance de la série statistique X (notée V(X)) la moyenne de la somme des carrés de
la différence entre les observations et leur moyenne.
 Donnés brutes :
Elle est donnée par la relation suivante :
𝑛 2
𝑖=1 𝑂𝑖 − 𝑥
𝑉(𝑋) =
𝑛
n : nombre d’observations
Reprenons l’exemple 7 : Soient les données suivantes : 8, 14, 3, 19, 24, 52, 1, 6, 10, 37
La moyenne 𝑥 = 17.4, on calcule la variance :
𝑉 𝑋
2 2 2 2 2 2 2
8 − 17.4 + 14 − 17.4 + 3 − 17.4 + 19 − 17.4 + 24 − 17.4 + 52 − 17.4 + 1 − 17.4
=
10
6−17.4 2 + 10−17.4 2 + 37−17.4 2
+
10
V(X) = 238.84
 Cas de tableau à variable quantitative discrète :
Elle est donnée par la relation suivante :
𝑟 2
𝑖=1 𝑛𝑖 𝑥𝑖 − 𝑥
𝑉(𝑋) =
𝑁

18
On reprend le 1er exemple
Modalité (nombre de 1 2 3 4 5
pièces) xi
Effectif (nombre 48 72 86 64 30
d’appartements) ni
La moyenne : 𝑥 = 2.8533, on calcule la variance :
𝑉 𝑋
2 2 2 2 2
48 1 − 2.8533 + 72 2 − 2.8533 + 86 3 − 2.8533 + 64 4 − 2.8533 + 30 5 − 2.8533
=
300
= 1.4718
 Cas de tableau à variable quantitative continue :
Pour une variable continue on utilise la relation suivante :
𝑟 2
𝑖=1 𝑛𝑖 𝑐𝑖
𝑉 𝑋 = − 𝑥2
𝑁
ème
On reprend le 2 exemple
Revenu mensuel (en [0, 40[ [40, 80[ [80, 120[ [120, 160[ [160, 200[
milliers de DA) xi
Effectif (Nombre 35 19 28 12 6
d’ouvriers) ni
ci 20 60 100 140 180
La moyenne : 𝑥 = 74, on calcule la variance :

35 ∗ 202 + 19 ∗ 602 + 28 ∗ 1002 + 12 ∗ 1402 + 6 ∗ 1802


𝑉 𝑋 = − 742 = 2444
100

4.4.Ecart type
L’écart type d’une série statistique représente la racine carrée de la variance, elle est donnée par :

𝜎 𝑋 = 𝑉 𝑋
Pour les exemples précédents, on aura :

1- 𝑉 𝑋 = 238.84 ⇒ 𝜎 𝑋 = 219.04 = 15.4544


2- 𝑉 𝑋 = 1.4718 ⇒ 𝜎 𝑋 = 1.4718 = 1.2132

19
3- 𝑉 𝑋 = 2444 ⇒ 𝜎 𝑋 = 2444 = 49.4368
4.5.Coefficient de variation
Le coefficient de variation (CV) est une mesure de la dispersion des données autour de la
moyenne arithmétique. Il se calcule par le rapport de l'écart-type à la moyenne. Il est
généralement exprimé en pourcentage.
𝜎
𝐶𝑉 = ∗ 100
𝑀𝑜𝑦
Pour les exemples précédents, on aura :
15.4544
1- 𝐶𝑉 = ∗ 100 = 88.8184 %
17.4
1.2132
2- 𝐶𝑉 = ∗ 100 = 42.5192 %
2.8533
49.4368
3- 𝐶𝑉 = ∗ 100 = 66.8065 %
74
5. Caractéristiques de forme :
Les caractéristiques de forme permettent de donner l’allure de la répartition des données d’une
série statistique. Pour décrire cette allure on utilise souvent le diagramme en bâton des effectifs
(ou celui des fréquences) ou bien l’histogramme. Les caractéristiques de forme sont définies à
partir de la notion de moment.
5.1. Analyse de la symétrie de la distribution d’une série statistique
L’analyse du polygone des effectifs (ou bien celui des fréquences) permet de se rendre compte
du caractère symétrique ou non de la distribution des valeurs d’une série statistique.
On distingue trois types de distributions : symétrique, asymétrique à droite et asymétrique à
gauche.
ni
ni ni

xi xi xi
a) b) c)

Figure 2-8 Types de distribution :


a) Symétrique
b) Asymétrique à droite
c) Asymétrique à gauche
20
Remarque 6 :
Dans certains cas où les graphes des polygones ne sont pas clairs, on ne peut pas analyser la
symétrie de la distribution des données nettement. Dans ce cas on fait appel à une comparaison
entre les valeurs du mode, de la médiane et de la moyenne arithmétique, tel que :
Si la moyenne = la médiane = le mode, on est dans le cas symétrique.
Si le mode < la médiane < la moyenne, on est dans le cas de l’asymétrie à droite.
Si la moyenne < la médiane < le mode, on est dans le cas de l’asymétrie à gauche.
Reprenons l’exemple 6 : Soit les données suivantes : 23, 4, 12, 92, 67, 23, 22, 17, 29, 14, 82,
25,40, 24, 77
La moyenne = 36.7333, le mode = 23 et la médiane = 24
On remarque que : le mode < la médiane < la moyenne, donc on peut dire que la distribution est
asymétrique à droite.
Pour l’exemple 1 :
La moyenne = 2.8533, le mode = 3 et la médiane = 3
Les valeurs des trois caractéristiques sont très proches, donc on peut dire que la distribution est
symétrique.
Pour l’exemple 2 :
La moyenne = 74, la classe modale = [0; 40[ et la médiane = 71.58
On remarque que : la classe modale < la médiane < la moyenne, donc la distribution est
asymétrique à droite
5.2. Coefficient de Pearson pour le type de distribution
Ce coefficient, proposé par le mathématicien britannique Karl Pearson sert à mesurer la
dissymétrie. Le coefficient de Pearson se calcule à partir des moments et il est donné par la
relation suivante:
𝜇32
𝛽1 = 3
𝜇2
Avec :
𝜇2 = 𝑚2 − 𝑚21

𝜇3 = 𝑚3 − 3𝑚1 𝑚2 + 2𝑚13
m1, m2 et m3 sont respectivement les moments d’ordre 1, 2 et 3 tel que :
 dans le cas de données brutes, on a :

21
𝑛 𝑛 2 𝑛 3
𝑖=1 𝑂𝑖 𝑖=1 𝑂𝑖 𝑖=1 𝑂𝑖
𝑚1 = , 𝑚2 = , 𝑚3 =
𝑛 𝑛 𝑛

 dans le cas d’une variable quantitative discrète, on a :


𝑟 𝑟 2 𝑟 3
𝑖=1 𝑛 𝑖 𝑥 𝑖 𝑖=1 𝑛 𝑖 𝑥 𝑖 𝑖=1 𝑛 𝑖 𝑥 𝑖
𝑚1 = , 𝑚2 = , 𝑚3 =
𝑁 𝑁 𝑁
 dans le cas d’une variable quantitative continue, on a :
𝑟 𝑟 2 𝑟 3
𝑖=1 𝑛 𝑖 𝑐 𝑖 𝑖=1 𝑛 𝑖 𝑐𝑖 𝑖=1 𝑛 𝑖 𝑐𝑖
𝑚1 = , 𝑚2 = , 𝑚3 =
𝑁 𝑁 𝑁
Le type de distribution dépend de la valeur de 𝛽1 tel que :
𝛽1 < 0 : distribution asymétrique à gauche
𝛽1 = 0 : distribution symétrique
𝛽1 > 0 : distribution asymétrique à droite
Reprenons l’exemple 6 :
𝛽1 = 0.7936 > 0, on aura une distribution asymétrique à droite
Pour l’exemple 1 :
𝛽1 = 0.065 ≈ 0, on aura une distribution symétrique
Pour l’exemple 2 :
𝛽1 = 0.2091 > 0, on aura une distribution asymétrique à droite
5.3. Aplatissement d’une distribution statistique
La mesure d'aplatissement fait partie des mesures qui caractérisent la forme d'une distribution.
Elle caractérise le degré d'aplatissement de la distribution des données par rapport à
l'aplatissement de la distribution normale («courbe en cloche»). Il est alors utile de pouvoir
mesurer si la forme de la distribution présente une déviation par rapport à l'aplatissement de la
distribution normale. Une distribution est platicurtique (ou hyponormale) si la courbe est plus
aplatie que la courbe normale; elle est leptocurtique ou (hypernormale) si la courbe est plus
pointue que la courbe normale

22
Figure 2-9 Types d’aplatissement de la distribution

5.3. Coefficient de Pearson pour l’aplatissement


Comme pour le type de distribution, le mathématicien Pearson a proposé un autre coefficient, qui
permet de définir le type d’aplatissement. Ce coefficient est donné par :
𝜇4
𝛽2 = 2
𝜇2
Avec :
𝜇2 = 𝑚2 − 𝑚21

 dans le cas de données brutes, on a :


𝑛 𝑛 2
𝑖=1 𝑂𝑖 𝑖=1 𝑂𝑖
𝑚1 = , 𝑚2 = ,
𝑛 𝑛
𝑛 4
𝑖=1 𝑂𝑖 − 𝑀𝑜𝑦
𝜇4 =
𝑛
 dans le cas d’une variable quantitative discrète:
𝑟 𝑟 2
𝑖=1 𝑛 𝑖 𝑥 𝑖 𝑖=1 𝑛 𝑖 𝑥 𝑖
𝑚1 = , 𝑚2 = , ,
𝑁 𝑁
𝑟 4
𝑖=1 𝑛𝑖 𝑥𝑖 − 𝑀𝑜𝑦
𝜇4 =
𝑁

23
 dans le cas d’une variable quantitative continue, on a :
𝑟 𝑟 2
𝑖=1 𝑛 𝑖 𝑐 𝑖 𝑖=1 𝑛 𝑖 𝑐𝑖
𝑚1 = , 𝑚2 =
𝑁 𝑁
𝑟 4
𝑖=1 𝑛𝑖 𝑐𝑖 − 𝑀𝑜𝑦
𝜇4 =
𝑁
Le type d’aplatissement de la distribution dépend de la valeur de 𝛽2 tel que :
𝛽2 < 3 : la distribution est platicurtique
𝛽2 = 3 : la distribution est normale
𝛽2 > 3 : la distribution est leptocurtique
Reprenons l’exemple 6 :
𝛽2 = 2.2866 < 3, on aura une distribution platicurtique
Pour l’exemple 1 :
𝛽2 = 2.0808 < 3, on aura une distribution platicurtique
Pour l’exemple 2 :
𝛽2 = 2.1702 < 3, on aura une distribution platicurtique

24

Vous aimerez peut-être aussi