B.T.S. : SE & DSI Professeur : D.
Lamrani
STATISTIQUE DESCRIPTIVE
A- Séries statistiques à une variable
I - Vocabulaire :
La statistique utilise un vocabulaire spécifique, tiré pour l’essentiel de la première activité qui en ait eu
l’usage : la démographie. Nous rencontrerons les termes suivants :
Population : ensemble sur lequel porte l’étude statistique.
Individu : tout élément de la population.
Echantillon : tout sous-ensemble de la population.
Variable ou caractère : propriété étudiée dans la population ou l’échantillon.
Le caractère d’une série statistique est dit qualitatif quand les valeurs prises ne sont pas des nombres.
Le caractère d’une série statistique est dit quantitatif quand les valeurs prises sont des nombres.
Le caractère quantitatif est discret si les valeurs du caractère sont isolées.
Le caractère quantitatif est continu si les valeurs du caractère peuvent prendre toutes les valeurs d’un
intervalle.
Effectif d’une valeur du caractère : c’est le nombre d’individus ayant cette valeur.
Fréquence d’une valeur du caractère: c’est le quotient de l’effectif de la valeur du caractère par l’effectif
ni
total : fi =
N
Pourcentage d’une valeur du caractère : c’est le produit de 100 par la fréquence de la valeur du caractère :
pi = 100 fi 0
0
II – Exemples :
Exemple 01 : Les statistiques de sexe ( caractère qualitatif) des étudiants de BTS du lycée Technique de
Settat pour l’année scolaire 2019/2020 donnent le tableau suivant :
Caractère Masculin Féminin
Effectif 124 86
Exemple 02 : L’étude des avaries dans un atelier composé de 10 machines identiques, pendant une
période de 150 jours ouvrables.
-Le caractère étudié : nombre d’avarie dans l’atelier au cours d’une journée (on admettra qu’une machine
ne peut pas tomber en panne plus d’une fois par jour)
-La population est l’ensemble des 150 journées qui font l’objet de l’étude.
-Les effectifs ni sont le nombre de journées ayant vu xi machine en panne.
Page 1
B.T.S. : SE & DSI Professeur : D. Lamrani
La série statistique étudiée a donné le tableau suivant :
xi 0 1 2 3 4
ni 60 42 24 18 6
Fréquence f i 0 .4 0.28 0.16 0.12 0.04
Pourcentage pi 40 28 16 12 4
Effectif cumulé
croissant N i 60 60+42=102 102+24=126 126+18=144 144+6=150
Exemple 03 : Une étude a été faite sur la concentration en hémoglobine du sang des femmes. On considère
que la concentration en hémoglobine du sang d’une femme en bonne santé est comprise entre 13.2 g/ ml et
15.4 g/ml .On a relevé sur un échantillon de 150 femmes les résultats suivants :
6 ;7 7 ;11 11 ;13 13 ;15 15 ;17 17 ;20
Concentration
( en g / ml )
Effectif 9 15 27 39 45 15
Fréquence f i 0.06 0.1 0.18 0.26 0.3 0.1
Pourcentage pi 6 10 18 26 30 10
Effectif cumulé
9 24 51 90 135 150
croissant
III – Représentations graphiques :
1-Diagramme Camembert :
C’est un diagramme circulaire ou semi-circulaire pour lequel l’angle de chaque secteur est proportionnel
aux effectifs, donc aux fréquences.
Exemple 01 :
garçons : 59,05 %
Caractère Masculin Féminin
Effectif 124 86
Angle en degré 212.6 147.4
filles : 40,95 %
Fig.1
Page 2
B.T.S. : SE & DSI Professeur : D. Lamrani
Exemple 02 :
xi 0 1 2 3 4
ni 60 42 24 18 6
Angle
144 100.8 57.6 43.2 14.4
en degré
Fig.2
2- Diagramme en bâtons : Pour les variables statistiques discrètes
Dans un repère orthogonal, on porte en abscisse les valeurs définissant les classes et en ordonnée les
effectifs.
Pour rendre le diagramme plus lisible, on trace les segments de droite correspondant aux ordonnées des
points ainsi définis.
Exemple 02 :
y
0
1
-1 0 x
Fig.3
3- Histogramme : Pour les variables statistiques continues
On fait correspondre à chaque classe un rectangle dont la largeur est l’amplitude de la classe et dont l’aire
est proportionnelle à l’effectif .
Page 3
B.T.S. : SE & DSI Professeur : D. Lamrani
Exemple 02 :
Fig.4
4- Polygone des effectifs ou fréquences :
-Dans le cas d’une variable statistique discrète, le polygone des effectifs ou fréquences s’obtient en reliant
les extrémités supérieures des segments du diagramme en bâtons.
-Dans le cas d’une variable statistique continue, le polygone des effectifs ou fréquences s’obtient en reliant
les milieux de la largeur supérieure de chacun des rectangles de l’histogramme.
Exemples : voir Fig 3 et Fig 4
IV – Paramètres de position :
1-Moyenne :
a/ Cas d’une variable discrète : Par définition, la valeur moyenne, notée x , de la série statistique
n1 x1 + n2 x2 + ..... + nk xk
( xi , ni )1 i k est : x=
n1 + n2 + ..... + nk
Exemple 02 :
La moyenne de la série statistique de l’exemple 02 est :
0 60 + 1 42 + 2 24 + 3 18 + 4 6 168
x= = =1.12
150 150
b/ Cas d’une variable continue : Par définition, la valeur moyenne, notée x , de la série statistique d’une
n1c1 + n2c2 + ..... + nk ck
variable continue ( x i ; xi +1 , ni )1 i k est : x =
n1 + n2 + ..... + nk
où ci est le centre de l’intervalle xi ; xi +1 .
Page 4
B.T.S. : SE & DSI Professeur : D. Lamrani
Exemple 03 :
La moyenne de la série statistique de l’exemple 03 est :
6.5 9 + 9 15 + 12 27 + 14 39 + 16 45 + 18.5 15 2061
x= = = 13.74
150 150
2-Médiane :
La médiane est le nombre M e qui partage les valeurs du caractère en deux parties de même effectif :
- Les valeurs inférieures à la médiane.
- Les valeurs supérieures à la médiane.
Graphiquement, la médiane est l’abscisse du point d’ordonnée le demi effectif total sur le polygone des
effectifs cumulés croissants.
Exemple 02 :
La médiane de la série statistique de l’exemple 02 est :
xi 0 1 2 3 4
ni 60 42 24 18 6
Effectif cumulé 60 102 126 144 150
croissant
N
On a : N = 150 donc = 75 d’où Me = 1
2
Exemple 03 :
6 ;7 7 ;11 11 ;13 13 ;15 15 ;17 17 ;20
Concentration
( en g / ml )
Effectifs 9 15 27 39 45 15
Effectifs cumulés 9 24 51 90 135 150
La médiane de la série statistique de l’exemple 03 est :
N 90 − 75 15 − M e
On a : N = 150 donc = 75 d’où = M e = 14.23
2 90 − 51 15 − 13
3-Mode :
Pour une série discrète, c’est la valeur de la variable dont l’effectif est le plus important.
Pour une série continue, c’est la classe dont l’effectif est le plus important.
Graphiquement, c’est l’abscisse du maximum du polygone des effectifs ou fréquences.
Exemple 02 : Le mode de la série statistique de l’exemple 02 est : Mo = 0
Exemple 03 : La classe modale de la série statistique de l’exemple 03 est : Mo = 15 ;17
Page 5
B.T.S. : SE & DSI Professeur : D. Lamrani
V -Paramètres de dispersion :
1-Variance :
a/ Cas d’une variable discrète :
Par définition, la variance, notée V , de la série statistique ( xi , ni )1 i k est :
(
ni x i − x ) n x
2
2
2
V = = i i
−x
ni n i
Exemple 02 :
La variance de la série statistique de l’exemple 02 est :
02 60 + 12 42 + 22 24 + 32 18 + 42 6
V = − (1.12 )
2
1.38
150
b/ Cas d’une variable continue :
Par définition, la variance, notée V , de la série statistique d’une variable continue ( x
i ; xi +1 , ni )1 i k
V =
2
nc
où ci est le centre de l’intervalle xi ; xi +1 .
2
est :
i i
−x
n i
Exemple 03 :
La variance de la série statistique de l’exemple 03 est :
( 6.5 ) 9 + ( 9 ) 15 + (12 ) 27 + (14 ) 39 + (16 ) 45 + (18.5 ) 15
2 2 2 2 2 2
V = − (13.74 )
2
150
V
2-Ecart - type :
L’écart type d’une série statistique est : = V où V est la variance.
Exemple 02 :
L’écart type de la série statistique de l’exemple 02 est : = V = 1.38
Exemple 03 :
L’écart type de la série statistique de l’exemple 03 est : = V
Page 6
B.T.S. : SE & DSI Professeur : D. Lamrani
B- Séries statistiques à deux variables
1-Introduction et définition
On observe que, dans certain cas , il semble exister un lien entre deux caractères d’une même population ,
par exemple entre le poids et la taille d’un nouveau-né , entre l’épaisseur d’un mur et sa résistance
thermique , entre le chiffre d’affaire et le montant des charges d’une entreprise , entre la consommation et
la vitesse d’une voiture …..
Pour étudier d’éventuelles liaisons, on est amené à s’intéresser simultanément à deux caractères X et Y
d’une même population .On définit alors une série statistique à deux variables X et Y prenant des valeurs
x1 ; ..... ; xi ; .....; xn et y1 ; ..... ; yi ; .....; yn .
2- Exemple :
Le tableau suivant donne la moyenne y des maxima de tension artérielle en fonction de l’âge x d’une
population donnée.
Age : x 36 42 48 54 60 66
Tension : y 12 13.5 13.6 14.3 15.4 15
3- Nuage de points :
Définition :
Le plan étant muni d’un repère orthogonal, chaque couple ( xi ; yi ) d’une série statistique peut être
considéré comme les coordonnées d’un point M i . L’ensemble des points M i est appelé nuage de points
associé à la série statistique.
On appelle point moyen d’un nuage de n points M i de coordonnées ( xi ; yi ) le point G de
1 n 1 n
coordonnées : xG = x = i
n i =1
x et yG = y = yi
n i =1
Exemple :
Représenter graphiquement le nuage de points M i ( xi ; yi ) dans un repère orthogonal
On prendra pour unité graphique 0.5 cm pour 1 an en abscisse et 2 cm en ordonnée pour l’unité de tension
artérielle, l’origine correspond au point I de coordonnées ( 30 ; 10 ) .
Pour l’exemple précédant
1
on a : xG = x = ( 36 + 42 + 48 + 54 + 60 + 66 ) = 51
6
1
et yG = y = (12 + 13.5 + 13.6 + 14.3 + 15.4 + 15) 13.96
6
Page 7
B.T.S. : SE & DSI Professeur : D. Lamrani
donc G( ; )
11
10
30 31 x
5- Covariance d’une série statistique double:
Définition :
La covariance de la série statistique double de caractère x et y est le nombre réel, noté cov ( x , y ) ou
( )( )
n n
1 1
xy , définie par : cov ( x , y ) = x y =
n i =1
xi − x yi − y =
n
x
i =1
i yi − x y
Exemple :
Pour l’exemple précédant on a :
1
cov ( x , y ) = x y = ( 36 12 + 42 13.5 + 48 13.6 + 54 14.3 + 60 15.4 + 66 15 ) − 5113.96
6
11.04
6- Ajustement affine :
Lorsque le nuage est de forme longiligne, on est tenté de tracer à main levée une droite traversant le nuage
dans une position d’équilibre, de telle sorte que les écarts des points situés de part et d’autre de la droite
Page 8
B.T.S. : SE & DSI Professeur : D. Lamrani
tracée se compensent. Une telle droite, lorsqu’elle passe par le point moyen G du nuage, est appelée droite
d’ajustement.
6-1 Ajustement affine par la méthode de Mayer :
On partage le nuage en deux nuages ayant le même nombre de points.
On détermine les coordonnées des points moyens G1 et G2 de ces deux nuages partiels .
La droite ( G1G2 ) , appelée droite de Mayer, constitue une bonne droite d’ajustement.
Exemple :
Pour l’exemple précédant :
1/déterminer les coordonnées des points G1 et G2 , puis tracer la droite ( G1G2 ) .
2/ Déterminer l’équation de la droite de Mayer ( G1G2 ) .
G2
G1
0 1 x
6-2 Ajustement affine par la méthode des moindres carrés :
On considère une série statistique à deux variables représentée par un nuage justifiant un ajustement affine.
- La droite de régression ( D ) de y en x a pour équation :
Page 9
B.T.S. : SE & DSI Professeur : D. Lamrani
x y
y = ax + b où a = et où b vérifie : y = a x + b
( ( x ) )
2
- La droite de régression ( D ) de x en y a pour équation :
x y
x = a y + b où a = et où b vérifie : x = a y + b
( ( y ) )
2
Les droites ( D ) et ( D ) constituent deux droites d’ajustement.
Si les droites ( D ) et ( D ) sont confondues, on dit que l’ajustement est parfait.
Si les droites ( D ) et ( D ) sont proches l’une de l’autre, on dit qu’il y a une bonne corrélation entre les
deux caractères.
x y
Le nombre réel : r = est appelé coefficient de corrélation linéaire de la série statistique
( x) ( y )
double.
Le coefficient de corrélation linéaire r −1 ; 1
Si r est proche de 1 ou de -1 alors on peut envisager un ajustement affine de la série statistique double ;
Exemple :
Pour l’exemple précédant :
x y
1/ Calculer : x y , ( x ) , ( y ) et r =
( x) ( y )
2/ Déterminer la droite de régression ( D ) de y en x
3/ Déterminer la droite de régression ( D ) de x en y
4/ Tracer Les droites ( D ) et ( D ) .
Page 10
B.T.S. : SE & DSI Professeur : D. Lamrani
y
11
10
30 31 x
Page 11