Statistiques Descriptives: Tendance et Variabilité
Statistiques Descriptives: Tendance et Variabilité
Calcul des
statistiques
descriptives
Ali.B 3-1
Chapitre 3
Calcul des statistiques descriptives
Agenda
3.1 Les mesures de tendance centrale
Ali.B 3-2
3.1 Les mesures de tendance centrale
Moyenne
pondérée
Ali.B 3-3
La moyenne arithmétique
La moyenne arithmétique est la mesure de
tendance centrale la plus commune.
• On calcule la moyenne en additionnant
l’ensemble des valeurs et en divisant par le
nombre d’observations.
Ali.B 3-4
La moyenne arithmétique
Formule pour la moyenne d’échantillon :
Où = la moyenne de l’échantillon
= les valeurs observées
Ali.B 3-5
La moyenne arithmétique
Formule de la moyenne de la population
où = la moyenne de la population
(lettre greque “myou”)
N = Le nombre de valeurs à
observer dans la population
Ali.B 3-6
Calcul de la moyenne arithmétique
Exemple :
Un échantillon de taille n = 5 donne les valeurs
suivantes :
6,2 7,1 4,8 9,0 3,3
La moyenne est :
Ali.B 3-7
La moyenne pondérée
Une moyenne pondérée vous permet d’allouer
plus de poids à certaines valeurs et moins de
poids à d’autres
• Formule de la moyenne pondérée:
Ali.B 3-8
Exemple de moyenne pondérée
4
𝑖=1 𝑖 𝑖
(4)(3) + (7)(4) + (6)(5) + (3)(6)
4
𝑖=1 𝑖 4+7+6+3
Ali.B 3-11
La Médiane
La médiane (M) est la valeur parmi l'ensemble des données
pour laquelle la moitié des observations est supérieure et
l’autre moitié des observations est inférieure.
• Commencez par organiser les données par ordre
croissant.
• Calculer un indice pour déterminer la position de la
médiane dans l'ensemble de données.
Formule pour l’indice de la médiane :
Ali.B 3-13
La Médiane
Ali.B 3-14
La Médiane
Ali.B 3-15
La Médiane
Exemple avec un échantillon de n = 6:
145 157 170 182 204 209
• L’indice est :
i = 0.5(n) = 0.5(6) = 3
Ali.B 3-16
Le Mode
Ali.B 3-17
Le Mode
Exemple avec des données quantitatives :
• Nombre d’enfants par famille sur un échantillon de
24 familles :
0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,4,5
Nombre Fréquence
d’enfants
0 4
1 5
2 8
0 1 2 3 4 5
3 4
4 2
5 1
Mode = 2
Ali.B 3-18
Le Mode
Ali.B 3-19
Exemple complet
Forme
Symétrique Asymétrique
Etalée à Etalée à
gauche droite
Ali.B 3-21
Utiliser Excel pour calculer les mesures
de tendance centrale
Voici les trois fonctions Excel
Exemple: le nombre de
souscriptions à des
revues électroniques
pour 12 foyers
Ali.B 3-22
Utiliser Excel pour calculer les mesures
de tendance centrale
Les valeurs sont obtenues avec les fonctions
Excel ou l’outil utilitaire d’analyse.
2
1
Choisir l’outil
“statistiques
descriptives”
3
Ali.B 3-23
Utiliser Excel pour calculer les mesures
de tendance centrale
Output de Statistiques descriptives :
Ali.B 3-24
Quelle mesure pour quel usage?
Ali.B 3-25
Avantages et inconvénients
Ali.B 3-26
3.2 Les mesures de variabilité
Ali.B 3-27
Etendue
Simple à calculer
La différence entre la valeur maximum et la
valeur minimum
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Etendue = 13 - 1 = 12
Ali.B 3-28
Etendue
Avantages:
• Facile à calculer et à comprendre
Inconvénients:
• Basée seulement sur deux valeurs
(Aucune idée sur la distribution des données )
• Sensible aux valeurs aberrantes
Exemple:
Formule :
Où = moyenne de l’échantillon
n = taille de l’échantillon
= la différence entre chaque observation
et la moyenne de l’échantillon
Ali.B 3-30
Calcul de la variance
Exemple : 4 6 8 9 11 12 12 18
n=8 Moyenne = = 10
La variance mesure la
variabilité des points observés
autour de la moyenne.
Ali.B 3-31
L’écart-type
Ali.B 3-32
Calcul de l’écart-type corrigé
Données
E l’échantillon (xi) : 4 6 8 9 11 12 12 18
n=8 Moyenne = = 10
Mesure la distance, en
Moyenne, de chaque point
observé par rapport à la
moyenne
Ali.B 3-33
Des formules simplifiées
Formule de l’écart-
type :
Ali.B 3-34
La variance et l’écart-type de la
population
Utilisés pour décrire la population entière et
non un échantillon
Formule de la variance :
Où = moyenne de la population
N = taille de la population
= la différence entre la valeur de chaque
point observé et la moyenne de la
population
Ali.B 3-35
La variance et l’écart-type de la
population
Utilisés lorsque la série statistique représente
toute la population
Formule de l’écart-type :
Formule de
Moyenne des carrés –
l’écart-type :
moyenne au carré
Ali.B 3-37
Exemple avec les formules
simplifiées
On suppose les effectifs des classes de mathématiques suivants :
34 25 41 32 25 29
34 1156
25 625
41 1681
32 1024
25 625
29 841
∑ ∑
= = 31
Ali.B 3-38
Utiliser Excel pour le calcul de la variance
et de l’écart-type
Les fonctions Excel pour la variance et l’écart-
type d’un échantillon:
=VAR.S(nombres)
=[Link](nombres)
Ali.B 3-39
Utiliser Excel pour le calcul de la
variance et de l’écart-type
A partir du résultat de l’outil Excel Statistiques
Descriptives :
Ali.B 3-40
3.3 Utiliser la moyenne et l’écart-type
ensemble
En gestion, l’écart-type est un outil de mesure
souvent utilisé pour faire respecter les
standards de qualité.
• L’écart-type mesure la quantité de variabilité
autour de la moyenne.
L’écart-type est affecté par l’unité de mesure.
• Il n’est donc pas pertinent de comparer des écart-
types pour des populations ayant des moyennes
très éloignées.
Ali.B 3-41
Le Coefficient de Variation
Ali.B 3-42
Le Coefficient de Variation
Formule pour le coefficient de variation d’un échantillon:
Où s = écart-type de l’échantillon
= moyenne de l’échantillon
Où = écart-type de la population
= moyenne de la population
Ali.B 3-43
Exemple avec le Coefficient de
Variation
Prix de l’action de Nike: Prix de l’action Google:
Prix moyen = $59,67 Prix moyen = $1045,85
Ecart-type = $6,64 Ecart-type = $68,70
Coefficient de Variation:
Nike:
Même si Google a
Google: un écart-type
supérieur, le prix
de son action est
plus cohérent.
Source : [Link]
Ali.B 3-44
Le Score Z
où = la valeur étudiée
= la moyenne de l’échantillon
= l’écart-type de l’échantillon
Ali.B 3-46
Exemple avec le Score z
Trouver le score z et interpréter
Nom du hamburger Restaurant Calories
Cheeseburger McDonald's 300
Single with everything Wendy's 470
Big Mac McDonald's 540
Whopper Burger King 677
Bacon Cheeseburger Sonic 820
Baconator Wendy's 970
Question: Quelle est la
Triple Whopper with cheese Burger King 1230
2/3 lb. Monster thickburger Hardee's 1300
distance entre 1230 et la
Moyenne 788,4 moyenne 788,4 en unités
Ecart-type 359,5 d’écart-types?
𝑘 𝑘
𝑓𝑖 = la fréquence relative de la classe i
𝑛= 𝑛𝑖 = le nombre total d’observations
𝑖 𝑖
𝑖=1
𝑖=1 k = le nombre de classes
• La moyenne est seulement une estimation étant donné que le
centre de classe estime la valeur de la classe.
Formule pour la Moyenne 𝑘
de la population avec 𝑖=1 𝑖 𝑖
données groupées :
Ali.B 3-49
La moyenne avec données groupées
Ali.B 3-50
La médiane avec données groupées
La formule pour calculer la médiane de l’échantillon
avec données groupées:
Où : 𝑖 = la borne inférieure de la classe
médiane
𝑖
𝑖 𝑖−1 𝑎𝑖 = l’amplitude de la classe médiane
𝑖
[1 - 5[ 6
[5 - 9[ 12
[9 - 13[ 10
[13- 17[ 4
Ali.B 3-53
Exemple: la médiane des données
groupées
Le client classé à la position 16 (32/2) divise la série
statistique en deux parties à effectif égal. Cet individu
est situé à la deuxième classe.
En utilisant la formule de la médiane des données
groupées avec fréquences relatives, on obtient :
𝑖
𝑖 𝑖−1
𝑖
Ali.B 3-54
La Variance et l’écart-type pour données
groupées
Formule pour la variance (échantillon): Données groupées
Où : = moyenne de l’échantillon
𝑘 2 𝑖 = la fréquence de la classe i
2 𝑖=1 𝑖 𝑖
= le centre de la classe i
k = le nombre de classes
Ali.B 3-55
La variance et l’écart-type avec données
groupées
Exemple: Nombre de Centre Fréquence
pages (ci) (fi)
[1 - 5[ 3 6
[5 - 9[ 7 12
[9 - 13[ 11 10
[13- 17[ 15 4
Calculer la variance et l’écart-type: Pour rappel: = 8.5.
2
∑𝑘𝑖=1(𝑐𝑖 − 𝑥̅ )2 𝑛𝑖
𝑠 ≈
𝑛−1
(3 − 8.5)2 × 6 + (7 − 8.5)2 × 12 + (11 − 8.5)2 × 10 + (15 − 8.5)2 × 4
=
(6 + 12 + 10 + 4) − 1
440
= = 14.194
31
Centiles Quartiles
Ali.B 3-57
Centiles
Ali.B 3-58
Centiles
Pour trouver les centiles manuellement:
• Classer les données du plus petit au plus grand
• Calculer l’indice, i
où: p = le centile voulu
n = le nombre d’observations
Ali.B 3-60
Quartiles
Ali.B 3-61
Quartiles
Ali.B 3-62
Quartiles
Ali.B 3-63
Ecart interquartile
EIQ = Q3 – Q1
Ali.B 3-64
Box plot (boîte à moustaches)
Une Box plot est une représentation graphique de la
position relative des trois quartiles par une boîte sur
une ligne.
Cette représentation donne aussi les valeurs extrêmes
et les valeurs aberrantes.
Forme:
* *
Ali.B 3-65
Valeurs aberrantes
Ali.B 3-66
Dessiner la box plot (boîte à moustaches)
Ali.B 3-67
Exemple: Box plot
L’indice de Q1:
Q3
On arrondi la position de
Q2 Q1 à 4.
Q1 = 2.37
Q1
De même, on trouve:
Q2 = 3.27
Q3 = 4.26
Ali.B 3-68
Exemple: Box plot
• On calcule l’EIQ :
EIQ = Q3 – Q1 = 4,26 – 2,37 = 1,89
• On complète la boîte:
Min Q1 Q2 Q3 Max
0.59 2.37 3.27 4.26 5.97 11.31
(aberrante)
Ali.B 3-70
3.6 Mesures d’association entre deux
variables
Dans cette section, on étudie deux
statistiques descriptives qui mesurent la
relation linéaire entre deux variables.
Les mesures d’association
entre deux variables
La covariance Le coefficient
d’un de correlation
échantillon d’un échantillon
Ali.B 3-71
La covariance de l’échantillon
La covariance de l’échantillon, COV(x,y) , mesure le
sens de la relation linéaire entre deux variables.
• Une relation est dite linéaire si le nuage de points entre la variable
dépendante et la variable indépendante prend une forme linéaire.
Ali.B 3-73
Exemple: Covariance et corrélation
Nuage de points
Semaine Nombre de Nombre de
commerciaux voitures
(x) vendues (y)
1 2 4
2 5 10
3 3 7
4 4 7
5 3 6
6 4 8
Ali.B 3-75
Calcul de la covariance
Nombre
Nombre de
de voitures
commerciaux vendues
xi y
2 3,5 -1,5 4 7 -3 4,5
5 3,5 1,5 10 7 3 4,5
3 3,5 -0,5 7 7 0 0
4 3,5 0,5 7 7 0 0
3 3,5 -0,5 6 7 -1 0,5
4 3,5 0,5 8 7 1 0,5
= 10
Ali.B 3-76
Calcul de la covariance
Calcul de la covariance:
𝑥 𝑦
Ali.B 3-78
Le coefficient de corrélation
Ali.B 3-79
Le coefficient de corrélation
Exemples de relations entre x et y :
Ali.B 3-80
Excel pour calculer la covariance et le
coefficient de corrélation
Les fonctions Excel pour la covariance et le
coefficient de corrélation simple pour un
échantillon:
= [Link](matrice1;matrice2)
=[Link](matrice1;matrice2)
Ali.B 3-81
Notions clés (1 de 4)
La tendance centrale:
1. La moyenne arithmétique
2. La médiane (meilleure si la série possède
des valeurs aberrantes)
3. Le mode
Ali.B 3-82
Notions clés (2 de 4)
La dispersion :
1. Etendue
2. Variance et écart-type
3. L’écart-type est le plus utilisé, a la même
unité que les valeurs observées
4. Le CV permet de comparer la dispersion
entre deux séries statistiques en % de la
moyenne de chacune.
Ali.B 3-83
Notions clés (3 de 4)
Ali.B 3-84
Notions clés (4 de 4)
Ali.B 3-85