Indicateurs de dispersion
L'écart-type, la variance et l'étendue font partie des mesures de dispersion (mesure de la
variabilité) en statistique descriptive. Elles sont calculées pour décrire la dispersion des
valeurs d'un échantillon autour d'un indicateur de position. En termes simples,
les paramètres de dispersion sont une mesure de l'ampleur des fluctuations d'un
échantillon autour d'une valeur moyenne.
La mesure de la tendance centrale vous donne des informations sur le centre de vos
données, tandis que les mesures de dispersion vous donnent des informations sur la
dispersion de vos données autour de ce centre.
L’écart type
L’écart type est une mesure de la dispersion des valeurs d’un ensemble de données par
rapport à leur moyenne. Il est utile pour comprendre à quel point les données sont étalées.
Voici les étapes pour calculer l’écart type d’une population :
1. Calculez la moyenne arithmétique de l’ensemble des données.
2. Pour chaque donnée, calculez la différence entre la donnée et la moyenne, puis
élevez cette différence au carré.
3. Faites la somme de toutes ces valeurs carrées.
4. Divisez cette somme par le nombre total de données pour obtenir la variance.
5. Prenez la racine carrée de la variance pour obtenir l’écart type.
1
L'écart-type indique la dispersion d'une variable autour de sa valeur moyenne. Ainsi,
l'écart-type est la déviation moyenne de toutes les valeurs mesurées par rapport à la
moyenne.
L'écart-type indique par conséquent dans quelle mesure la distribution des valeurs
s'écarte de la valeur moyenne. Si les valeurs individuelles sont fortement dispersées
autour de la valeur moyenne, l'écart-type de la variable est important.
Formule de l’écart-type :
Étendue
L'étendue est la distance entre le minimum et le maximum d'une distribution, c'est-à-dire la
distance entre la plus petite et la plus grande valeur.
Définition de la portée : L'étendue indique la distance entre la valeur la plus élevée et la
valeur la plus faible d'un échantillon.
L'étendue est donc calculée comme suit :
2
Quartile et boite à moustache.
Les quartiles divisent vos données en quatre parties, aussi égales que possible. Pour le
calcul des quartiles, les données doivent être triées de la plus petite à la plus grande
valeur.
Quartile (Q1) : la valeur qui cumul 25 % des données
Quartile (Q2) : la médiane des données, c'est-à-dire que 50% des valeurs sont plus
petites et 50% des valeurs sont plus grandes.
Quartile (Q3) : la valeur qui cumul 75 % des valeurs.
Ainsi, 25% de toutes les valeurs se trouvent dans le quartile inférieur Q1 et 25% de toutes
les valeurs se trouvent dans le quartile supérieur Q3.
Écart interquartile
Contrairement à l'intervalle dans lequel se trouvent 100 % de toutes les valeurs, on
souhaite souvent connaître l'intervalle dans lequel se trouvent les 50 % de valeurs
intermédiaires. Cet indicateur de dispersion est appelé écart interquartile. Les 25%
supérieurs et inférieurs des valeurs ne sont donc pas pris en compte pour l'écart
interquartile.
3
La boite à moustache :
La boîte à moustaches, parfois appelée diagramme en boîte ou diagramme de quartiles,
est un type de diagramme qui permet de visualiser le résumé en cinq nombres. Elle ne
montre pas la distribution avec autant de détails que l’histogramme, mais elle est
particulièrement utile pour indiquer si une distribution est asymétrique et s’il y a des
valeurs potentiellement extrêmes dans l’ensemble de données. La boîte à moustaches est
également idéale pour comparer des distributions, car elle fait apparaître immédiatement
le centre, la dispersion et l’étendue.