Statistique descriptive
Récapitulatif
Cours préparé par :
El Haddad Mohamed Yassine
vocabulaire statistique
Population : c’est l’ensemble des éléments statistiques.
Individu : c’est un élément de l’ensemble statistique.
Caractère : un aspect déterminé commun à tous ses éléments.
Modalités : Les modalités sont les différents états ou les différentes valeurs d’un caractère.
Caractère ou variable statistique
Modalités: mots Variable statistique Modalités: nombres
Variable qualitative Variable quantitative
Ce sont les caractères dont les modalités non ce sont les caractères dont les modalités sont
mesurables. mesurables.
Variables Nominal Variables discrètes
Variables ordinal Variables continues
Le tableau statistique d’une variable qualitative nominale peut être représenté par deux
types de graphiques.
Les effectifs sont représentés par un diagramme en barres et les fréquences par un
diagramme en secteurs
Diagramme en secteurs des Diagramme en barres des effectifs
fréquences
Les fréquences d’une variable qualitative ordinale sont représentées au moyen d’un
diagramme en secteurs et les effectifs ou effectifs cumules croissant sont
représentés par un diagramme en barres
Diagramme en secteurs des fréquences Diagramme en barres des effectifs
Quand la variable est discrète, les effectifs sont représentés par des
bâtonnets et Les fréquences cumulées sont représentées au moyen de la
fonction de répartition.
Diagramme en bâtonnets : Fonction de répartition :
Pour les variables continus l’histogramme représente les effectifs des classes par
des rectangles continus dont la surface représente l’effectif. Et les fréquences
cumulées sont représentées au moyen de la fonction de répartition.
Histogramme : Fonction de répartition :
Comment Déterminer l’amplitude a retenir pour
une étude qui n’a pas encore démarré ?
En règle générale, on choisit au moins cinq classes de même
amplitude.
L’intervalle de classe est obtenue ensuite de la manière suivante :
Autrement Dit :
Amplitude à retenir = ( Xi max – Xi min ) / J
Les différentes caractéristiques de la variable statistique quantitative X :
Ses caractéristiques de tendance centrale : Mode, Médiane, quantiles, moyenne
Ses caractéristiques absolues de dispersion : E, IQ, e(X), V(X), σ
Ses caractéristiques relatives de dispersion : Er, IQr, er ,CV
Ses caractéristiques de forme : CYule, CP1, CP2, CF1=γ1
Une caractéristique d’aplatissement : CF2=γ2
Le mode d’une variable statistique est la modalité la plus fréquente dans la distribution. Il correspond alors, à
l’effectif ou à la fréquence la plus élevée.
La détermination du mode se diffère selon la nature du caractère.
Ainsi, dans le cas des caractères qualitatifs ou discrets, le mode est détecté par un simple regard du tableau des
données, c’est la modalité du caractère qui se répète le plus dans la distribution.
Pour un caractère continu et dans le cas d’une distribution à classes égales il va falloir le calculer par une formule.
1 1= nCM-nCM-1
Mode BI CM ampCM 2= nCM-nCM+1
1 2
Pour un caractère continu et dans le cas d’une distribution à classes ne sont pas égales il va falloir corriger les
effectifs avant de le calculer .
Effectif corrigé de la classe i = Effectif d’origine de la classe i * amplitude la plus fréquente (α)/ amplitude de la classe i (a )
i
nc= ni *α/ ai
En suite on applique la formule du Mode sur les effectifs corrigé.
la médiane d’une distribution statistique est la valeur de la variable qui partage
l’effectif total de la distribution en deux parties égales
Pour le caractère continu la médiane va nécessiter un calcul.
N
nCMé 1 cc 0,5 f cc
Me BI CMé amp 2 BI CMé aCMé CMé 1
CMé
nCMé cc nCMé 1 cc
f CMé
cc f CMé 1
cc
Pour les autres caractères il suffit de déterminer ou se trouve N/2 (dans ni cumulé
croissant) la médiane c’est le xi correspondant
Quantiles d’un caractère continu
Comment calculer les quantiles? ( Q , D , C )
Rang (Quantile) nCQuantile 1 cc
Quantile BI CQuantile amp
CQuantile cc nCQuantile 1 cc
nCQuantile
Avec les fréquences la formule suivante:
Rang (Quantile )
f cc
Quantile BI CQuantile amp
CQuantile 1
cc
CQuantile
f CQuantile cc f CQuantile 1
La médiale, notée ML, d’une série d’observations classées préalablement
par ordre croissant, est la valeur de la variable qui partage en deux la masse
globale du caractère.
ML a pour rang ∑ni xi /2
Rang ( Médiale) x n
i i CMédiale 1 cc
Médiale BI CMédiale amp
CMédiale
x n
i i CMédiale
cc x n
i i CMédiale 1 cc
Pour un caractère continu xi correspond au centre des classes
Les moyennes :
Moyenne Arithmétique : Moyenne Géométrique :
k
N xj k
ni xi k
G N xi
ni
X
N
f x i
i 1 N
i
j 1 i 1 i 1
cas ou on a affaire à des valeurs absolues la moyenne de pourcentages
Moyenne Harmonique : Moyenne Quadratique :
k
n i k
f 2
xi
i1
H Q
n
k
i i
i 1
x i1 i
lorsqu’on a affaire a des grandeurs composé pour le calcul de la surface moyenne
Coefficients de dispersion:
1. L’étendue absolue (E) et relative (Er)
Etendue:
absolu relatif
E
E Val . max Val . min Er
Me
2. Les intervalles inter-quantiles
Trois types de quantiles sont à considérer, les quartiles (Q), les
déciles (D) et les centiles (ou les percentiles) (P).
absolu relatif
Iq
I q Q3 Q1 et I qr
Q2
Id
I d D9 D1 et I dr
D5 Me
Ip
I p P99 P1 et I pr
P50
Diagramme en boîte
Un diagramme en boîte montre les principaux indicateurs de
dispersion, notamment l'étendue, les quartiles et l'écart interquartile.
3. L’écart absolu moyen e(x)
l'écart absolu moyen est la moyenne de la valeur absolue des écarts à la
moyenne.
absolu relatif
k
ex f i xi X ex
er x
i 1 2X
4. variance2 , écart type et coefficient de
variation Cv
La variance V(x)= 2(x) ou x V X
V(x) =
Le coefficient de variations :
x
CV
X
Moments centrés et non centrés
a. Le moment simple (non centré) d’ordre r est égal :
k
mr f i xi
r
i 1
b. Le moment centré d’ordre r
k
r f i ( xi X ) r
i 1
Les caractéristiques de forme
Les paramètres mesurant la
symétrie d’une distribution:
• Coefficient de Yule
• Coefficients de Pearson
• Coefficient de Fisher
Courbe asymétrique à gauche Courbe asymétrique à droite Courbe symétrique
Coefficient de Yule
(Q3 Q2 ) (Q2 Q1 )
CY
(Q3 Q2 ) (Q2 Q1 )
Q3 Q1 2Q2
Q3 Q1
Si CY=0, la distribution est symétrique
Si CY> 0, la distribution est dissymétrique à droite
Si CY< 0, la distribution est dissymétrique à gauche
Le premier coefficient de Pearson
X Mo
CP1
X
Si CP1=0, la distribution est symétrique
Si CP1> 0, la distribution est dissymétrique à droite
Si CP1< 0, la distribution est dissymétrique à gauche
Le deuxième coefficient de Pearson
3X Me
CP2
X
Si CP2=0, la distribution est symétrique
Si CP2> 0, la distribution est dissymétrique à droite
Si CP2< 0, la distribution est dissymétrique à gauche
Coefficient de Fisher
3
CF1 1
X
3
Si CF1=0, la distribution est symétrique
Si CF1> 0, la distribution est dissymétrique à droite
Si CF1< 0, la distribution est dissymétrique à gauche
L’aplatissement
L’aplatissement est mesuré par le coefficient 2 de Fisher
4
C F2 2 3
X
4
Si 2 0 alors la courbe de la distribution étudiée est normale
Si 2 0 alors la courbe de la distribution étudiée est pointue
Si 2 0 alors la courbe de la distribution étudiée est aplatie
La concentration
100
nixi/∑nixicc en %
S5
S4
S3
S1 S2
ficc en % 100
B S S1 S 2 S 3 S 4 S 5
iG 1 5000 1 5000 1 5000
où S=S1+S2+S3+S4+S5.
S1 est la surface d’un triangle
Si est la surface d’un trapèze; i=2,3,4,5
100
nixi/∑nixicc en %
GB
S3
PB
S1 B
H h 100
ficc en %
S1= base * hauteur/2 S1=H*B/2
Si= (Petite base + Grande base). hauteur/2; i=2,3,4,5
S3=(PB+GB)*h/2
• iG 1; forte concentration
• iG 0; faible concentration
Exercice : On considère les salariés d’une entreprises que l’on classe en fonction du salaire
mensuel en dirhams. Les résultats de l’observation figurent dans le tableau ci-dessous :
Tranches de Fréquences Fréquences relatives Fréquences relatives
salaire mensuel Effectifs relatives en % Cumulées Croissantes Cumulées Décroissantes
en 1000 DH en % en %
[1,5 ; 2[ 24 --------- --------- ---------
[2 ; 2,5[ --------- --------- --------- 52
[2,5 ; 3[ --------- --------- 86 32
[3 ; 3,5 [ --------- --------- --------- ---------
[3,5 et plus --------- --------- --------- 6
TOTAL --------- --------- --------- ---------
•Compléter le tableau ci-dessus.
•Donnez la signification de la fréquence relative cumulée décroissante correspondant à la
tranche de salaire mensuel 3500 ; 3500 et plus.
•Représentez graphiquement les effectifs en considérant l’égalité des amplitudes.
•Déterminez le mode et la médiane.
•En regroupant les deux derniers intervalles en un seul , représentez la distribution et calculez
les mêmes paramètres que précédemment.
Exercice : Les importations de pétrole brut ont évolués de la façon suivante au cours des années 2018
à 2023 :
Années Pourcentage de variation par rapport à
l’année précédente
2018 -3,8
2019 -18,3
2020 +14,2
2021 -3,1
2022 -1,5
2023 +8,9
•Calculez le taux annuel moyen de variation des importations de pétrole brut au cours de la période
considérée. Quel type de moyennes ce calcul fait-il intervenir ?
•Sachant par ailleurs que le taux moyen d’augmentation des importations de pétrole brut a été de 9,2%
par an pour la période 1992-2005 (13 années) et de 12,4 % par an pour la période 2006-2017 (11
années), calculez le taux annuel moyen de variation des importations de pétrole brut au cours de la
période 1992-2023. De quel type de moyennes s’agit-il ?