Statistique Descriptive Qmichchou
Statistique Descriptive Qmichchou
Mohammed QMICHCHOU
UNIVERSITE IBN TOFAIL - FSJES KENITRA
STATISTIQUE DESCRIPTIVE 2015
AVERTISSEMENT
Ce document est conçu comme support de cours à partir de différents supports (livres
et manuels) et ressources (cours et tutoriaux) accessibles sur Internet.
Voir la bibliographie et la webographie.
MOHAMMED QMICHCHOU 1
STATISTIQUE DESCRIPTIVE 2015
INTRODUCTION _________________________________________________________________________________ 4
1.5.1.2. LE MODE______________________________________________________________________________27
MOHAMMED QMICHCHOU 2
STATISTIQUE DESCRIPTIVE 2015
1.5.3.1. DEFINITION___________________________________________________________________________40
BIB LIOGRAPHIE________________________________________________________________________________96
WEB OGRAPHIE_________________________________________________________________________________96
MOHAMMED QMICHCHOU 3
STATISTIQUE DESCRIPTIVE 2015
INTRODUCTION
Il n'existe pas de définition universelle et totalement aboutie de la statistique. Selon le
Larousse, c’est « la science des grands nombres regroupant l'ensemble de méthodes
mathématiques qui, à partir du recueil et de l'analyse de données réelles, permettent
l'élaboration de modèles probabilistes autorisant les prévisions ».
La Statistique est considérée comme « une discipline scientifique intermédiaire qui n'a
plus d'objet privilégié (l'Etat, la population, les entreprises, les particules de la
physique…) mais qui propose une méthode, utilisable par toutes les sciences de la
nature et de l'homme, de production et de traitement de l'informa tion à des fins de
connaissance et de décision ».
Elle est aussi définie comme étant une « méthode qui vise à la description quantitative
des ensembles nombreux ». Elle est un « ensemble de méthodes permettant de prendre
une bonne décision face à l’incertitude ».
Cette méthode permet de passer de la donnée à la connaissance. Elle porte sur le
traitement, l’analyse et la transmission.
1 • Identifier le problème
MOHAMMED QMICHCHOU 4
STATISTIQUE DESCRIPTIVE 2015
Statistique
Descriptive Mathématique
S’intéresse à extrapoler des résultats issus
Tableaux, graphiques, statistiques d’échantillons en vue de caractériser une
population mère inconnue, de faire des
résumées, recherche des corrélations, ...
prévisions de comportements basées sur
le calcul de probabilités.
Qu’elle soit descriptive ou mathématique, la statistique est employée dans toutes les
sciences :
MOHAMMED QMICHCHOU 5
STATISTIQUE DESCRIPTIVE 2015
Analyses statistique
Uni-variée Bi-variée Multi-variée
On étudie ici la relation qui peut
On étudie la répart ition d'une
exister entre deu x variables S'intéresse à la distribution
population selon une variable (
(entre la taille et le poids, par conjointe de plusieurs variables.
la taille, le poids ...). exemple...).
1.1.Eléments de vocabulaire
Elément de Signification
vocabulaire
Ensemble des techniques du statisticien pour décrire,
Statistique descriptive
numériquement, les populations.
Tout nombre, calculé à propos d’une population, et qui contribue
Statistique (ou à décrire un aspect de cette population, est une statistiq ue.
paramètre statistique) Fréquences, médianes, quartiles, déciles, moyennes, variances,
etc. sont des statistiques.
MOHAMMED QMICHCHOU 6
STATISTIQUE DESCRIPTIVE 2015
𝑁 = ∑ 𝑛𝑖
𝑖=1
Rapport d’un effectif particulier d’individus à la taille de la
Fréquence (ou population. (Excel confond parfois fréquence et effectif).
proportion) 𝑛 𝑛
𝑓𝑖 = 𝑖 = 𝑛 𝑖
𝑁 ∑𝑖 =1 𝑛𝑖
Recensement, Recueil des valeurs de la totalité des individus de la population.
Dénombrement Les valeurs recueillies sont les données.
Sondage, n- Un sondage est le recueil des valeurs d’une partie (l’échantillo n)
échantillon, base de d’effectif n (d’où l’expression n-échantillon) de la population
sondage, taux de (dite base de sondage). Le taux de sondage est le rapport n/N.
sondage
Sous-ensemble construit et représentatif d'une population donnée.
Echantillon Lorsque l'on parle d'échantillon on parle en général de population
mère, c'est-à-dire de la population dont est issu l'échantillon.
Il est fréquent qu'une population soit divisée en sous-ensembles
cohérents construits à partir de critères déterminés de façon à
réduire la taille des tableaux de données et à en faciliter la lecture,
Classe
l'analyse et l'interprétation. Cette division induit un regroupement
des individus et la formation de classes rassemblant chacune des
individus présentant des caractères similaires.
MOHAMMED QMICHCHOU 7
STATISTIQUE DESCRIPTIVE 2015
nominale
qualitatif continue
ordinale
intervalle
quantitatif discrète
proportionnelle
Exemple
Sur une population de 100 voitures, on étudie la couleur de la carrosserie : c'est un caractère
qualitatif ; si on étudie leur puissance fiscale, c'est un caractère quantitatif discret ; si on étudie
la taille de leur conducteur, c'est un caractère quantitatif continu.
Exercice 1
Une étude portant sur une entreprise de la zone industrielle de Kenitra nous a permis de relever
les données suivantes :
Raison sociale
Effectif
Activité
Chiffre d’affaire
Capital
Forme juridique
Nationalité du dirigeant
Classement en export
Résultat
Exercice 2
Quelle est la nature des caractères ci-dessous ?
Nombre d’actions vendues chaque jour à la bourse
Rémunérations des enseignants d’un lycée
Indicateur du moral des ménages
Écart de rémunération entre hommes et femmes
Les pays de l’Union européenne
Les niveaux de formation des salariés
Les formes de contrat de travail
MOHAMMED QMICHCHOU 8
STATISTIQUE DESCRIPTIVE 2015
1.3.Symboles et notations
Ces symboles sont utilisés pour simplifier l'écriture de longues séries (par exemple en évitant
d'utiliser des pointillés). On utilise dans chacun de ces cas une variable dite variable muette qui
va prendre des valeurs dans un ensemble précis. Cette variable muette va alors permettre la
description d'un terme générique placé après le symbole.
∑ 𝒙𝒊 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝒊=𝟏
Propriétés
𝒏 𝒏 𝒏
∑(𝒙𝒊 + 𝒚𝒊 ) = ∑ 𝒙𝒊 + ∑ 𝒚𝒊
𝒊=𝟏 𝒊=𝟏 𝒊=𝟏
∑ 𝒂𝒙𝒊 = 𝒂 ∑ 𝒙𝒊
𝒊=𝟏 𝒊=𝟏
MOHAMMED QMICHCHOU 9
STATISTIQUE DESCRIPTIVE 2015
∏ 𝒙𝒊 = 𝒙𝟏 × 𝒙𝟐 × … × 𝒙𝒏
𝒊=𝟏
𝒏! = ∏ 𝑲 = 𝟏 × 𝟐 × 𝟑 × … × 𝒏
𝟏≤𝑲≤𝒏
1.3.6. Logarithmes
Pour « a » positif, la fonction exponentielle y=ax est monotone. À toute valeur de y correspond
une valeur et une seule de x. Cette fonction qui fait correspondre à chaque valeur de y une
valeur de x est la fonction inverse de la fonction exponentielle. On l'appelle fonction logarithme.
y=ax ⇒x= log a x
« x » est le logarithme dans la base « a » de « y ».
MOHAMMED QMICHCHOU 10
STATISTIQUE DESCRIPTIVE 2015
Seuls les nombres positifs ont un logarithme car, pour a > 0, y=ax est nécessairement positif.
MOHAMMED QMICHCHOU 11
STATISTIQUE DESCRIPTIVE 2015
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑁 𝑂𝑢 ∑ 𝑛𝑖 = 𝑁
𝑖 =1
Il en résulte
n1 n 2 n n +n +…+nk
f1 +f2 +…+fk = + +…+ k = 1 2 =1
n n n n
𝑛
∑ 𝑓𝑖 = 1
𝑖=1
Un tableau statistique décrivant une population P suivant un caractère K se présente sous la
forme générale suivante :
Effectif de chaque
Caractère étudié
modalité
𝑀1 𝑛1
𝑀2 𝑛2
…
…
𝑀𝑖 𝑛2
…
…
𝑀𝑘 𝑛𝑘
Total N
Exercice 3
Soit la série donnant les notes observées par une classe de 22 élèves :
0, 4, 4, 12, 14, 14, 16, 20, 11, 10, 10, 8, 8, 7, 6, 5, 12, 13, 3, 3, 9, 9.
T.A.F :
1. Établir le tableau présentant la série de façon discrète, ainsi que les extensions de cumuls
ascendant et descendants.
2. Présenter la série de façon continue avec les extensions de cumuls.
Exercice 4
Soit la série suivante :
0, 1, 2, 4, 6, 7, 9, 7, 8, 0, 0, 0, 4, 6, 7, 9, 7, 8, 3, 5, 5, 7, 8, 8, 1, 2, 6.
T.A.F :
Présenter la série de deux façons différentes :
1. discrète.
2. Continue.
MOHAMMED QMICHCHOU 12
STATISTIQUE DESCRIPTIVE 2015
Exercice 5
Dans le tableau suivant figure la rémunération horaire d’une population d’ouvriers.
Rémunération Effectifs
[20-25[ 22
[25-30[ 44
[30-35[ 25
[35-55[ 16
[55-80[ 15
[80-100[ 8
Total
T.A.F :
1. Établir les extensions qui permettent une interprétation directe.
2. Interpréter la 3ème ligne des cumuls que vous calculerez.
Exercice 6
Une enquête sur le kilométrage de 2000 véhicules d’une entreprise de location nous donne les
résultats suivants (en milliers de Km). Cette entreprise cède tout véhicule qui atteint 30000 Km.
<5 >5 et <10 >10 et <15 >15 et <20 >20
322 640 740 198 100
T.A.F :
Présenter le tableau statistique faisant apparaître les fréquences relatives en % de la série ainsi
que les cumuls ascendants et descendants.
MOHAMMED QMICHCHOU 13
STATISTIQUE DESCRIPTIVE 2015
Variable Cumuls
Quantitative Qualitative
MOHAMMED QMICHCHOU 14
STATISTIQUE DESCRIPTIVE 2015
Diagramme figuratif : Les effectifs sont représentés par des images (silhouette s,
bâtiments, ...) rappelant la population étudiée. Ces images ont une taille proportionne lle
à l'effectif. Il existe alors un danger de mauvaise représentation ou de mauvaise
interprétation. Si un doublement de l'effectif correspond seulement à un allonge me nt
d'un facteur deux de l'image dans une seule direction, la règle des aires est respectée.
Mais si le doublement de l'effectif correspond à une doublement de la taille de l'ima ge,
l'œil humain perçoit en réalité une multiplication par 4 (facteur 2 en largeur et facteur
2 en hauteur). L'interprétation de la représentation graphique est alors faussée.
Diagramme en rectangles ou à barres: Si les rectangles ont même base, les hauteurs
proportionnelles aux effectifs respectent la règle des aires.
Dans le diagramme en barres, la largeur de la base des barres est identique pour toutes les
barres, la base de chacun des rectangles étant centrée sur les points représentés sur l’axe des
abscisses.
MOHAMMED QMICHCHOU 15
STATISTIQUE DESCRIPTIVE 2015
Le diagramme en barres multiples présente plusieurs barres parallèles pour les valeurs
observées chez le même individu.
Le diagramme à barres empilées regroupe, dans chaque barre, les valeurs observées, à
différentes reprises, chez le même individu.
Le diagramme en bandeaux est semblable à un diagramme en barres, sauf que les effectifs
sont placés sur l’axe des abscisses.
MOHAMMED QMICHCHOU 16
STATISTIQUE DESCRIPTIVE 2015
Amine
Najat
Saida
Ali
Amine
Najat
Saida
Ali
Ajout d'un polygone rejoignant les sommets du diagramme en bâtons. Cette tentative
de lissage de la représentation graphique ne respecte pas tout à fait la règle des aires
(l'aire sous le polygone ne correspond pas tout à fait à l'effectif ou la fréquence) mais a
le mérite de présenter une courbe se rapprochant de la courbe de densité de probabilité.
200000
150000
100000
50000
0
Ali Saida Najat Amine
CA 2011 Polygone
MOHAMMED QMICHCHOU 17
STATISTIQUE DESCRIPTIVE 2015
11%
24% Grande-Bretagne
11% Italie
Espagne
21% Portugal
33% Autres
MOHAMMED QMICHCHOU 18
STATISTIQUE DESCRIPTIVE 2015
On utilise l'histogramme en respectant la règle des aires. Pour éviter tout danger, il est
préférable de travailler avec des classes d'amplitude constante. Dans ce cas, les hauteurs des
rectangles sont proportionnelles aux effectifs (ou aux fréquences). Le cas des classes
d'amplitudes variables se révèle plus délicat et est traité dans statistiques élémenta ires
continues. On trouve aussi pour les variables continues la même tentative de lissage avec la
même réserve sur la règle des aires.
30
25
Nombre de salariés
20
15
10
Tranche de revenu
100% 120%
90%
100%
80%
70%
80%
60%
50% 60%
40%
40%
30%
20%
20%
10%
0% 0%
1 2 3 4 5 6 7 8 9
Exercice 7
Soit la liste suivante des prénoms d’un groupe de stagiaires de la filière commerce suivis entre
parenthèses d’une indication du nombre de livres lus dans l’année (A = exceptionnel, B =
MOHAMMED QMICHCHOU 19
STATISTIQUE DESCRIPTIVE 2015
beaucoup, C = moyen, D = peu) : Ali (C), Jamila (C), Abdelhak (A), Said (B), Amina (A), Sara
(B), Driss (C), Ahmed (B), Bouchra (B), Ilham (C), Jaouad (D), Aziz (B), Meriem (A), Khadija
(C), Issam (C), Safae (C), Majid (C), Fatima (D), Hafida (C), Mohammed (C).
1. Définissez la distribution de ces étudiants suivant leur appétit de lecture (populatio n,
caractère, etc.).
2. Construisez le tableau représentatif de cette distribution.
3. Représentez cette distribution à l’aide des graphiques appropriés.
Exercice 8
Soit la représentation suivante :
xi 0 1 2 3 4 5 6 7 8
ni 15 15 30 30 45 30 30 15 15
T.A.F :
1. Représenter graphiquement cette série.
2. Présenter les colonnes des cumuls ascendants et descendants.
Exercice 9
Une enquête portant sur les pays visités par les élèves d’un établissement scolaire nous donne
la répartition suivante :
Pays Effectifs
Grande-Bretagne 27
Italie 37
Espagne 24
Portugal 13
Autres 12
Total
T.A.F :
1. Déterminer la nature du caractère étudié.
2. Représenter la distribution sur un graphique circulaire après avoir fait les extensions de
tableau nécessaires.
Exercice 10
Une entreprise vous demande d’étudier l’évolution des ventes d’un produit qu’elle souhaite
commercialiser sous une marque propre, mais existant déjà dans d’autres pays.
Pour ce faire, elle vous livre les résultats suivants :
Pays Ca (en millions d’€)
Grande-Bretagne 4.2
Suisse 1.2
Belgique 2.2
Espagne 3.4
Total
T.A.F :
Présenter ces données de manière à avoir une meilleure vue d’ensemble du phénomène.
Exercice 11
MOHAMMED QMICHCHOU 20
STATISTIQUE DESCRIPTIVE 2015
Effectuer sur un graphique semi-circulaire la représentation d’un vote de conseil munic ipa l
composé de 27 conseillers.
Résultats du vote :
Pour la motion proposée -------------------- 15
Contre la motion proposée ------------------ 10
Abstentions ---------------------------------- 2
Exercice 12
Le revenu mensuel déclaré des employés d’une entreprise est réparti comme suit :
Revenu mensuel en € Effectifs
[2000-2200[ 12
[2200-2400[ 24
[2400-2600[ 10
[2600-2800[ 7
[2800-3000[ 4
Total
T.A.F :
Représenter sur un histogramme cette série statistique.
Exercice 13
Soit la série qui présente les ventes mensuelles (en milliers de DH) d’un commercial de matériel
informatique sur la ville de Kénitra.
Mois CA en 2011 CA en 2012
Janvier 3054 7105
Février 6138 7067
Mars 8684 6358
Avril 6889 7543
Mai 7209 8588
Juin 6115 4288
Juillet 4989 5166
Août 5904 6106
Septembre 7019 4559
Octobre 4797 5547
Novembre 3555 5100
Décembre 3509 7238
T.A.F :
Représenter graphiquement cette série statistique.
Exercice 14
On étudie la distribution selon la distance de « domicile familial – travail » des salariés d’une
entreprise. Après répartition par classes, on obtient le tableau suivant :
Distances (km) Effectifs
[1 ; 5[ 250
[5 ; 10[ 328
[10 ; 20[ 165
[20 ; 30[ 91
[30 ; 50[ 46
MOHAMMED QMICHCHOU 21
STATISTIQUE DESCRIPTIVE 2015
T.A.F :
1. Quelle proportion de salariés habite à moins de 20 km de l’entreprise ?
2. Tracer l’histogramme correspondant à cette série.
3. Déterminer la valeur de la médiane.
4. L’écart interquartiles est 10,45 et le troisième quartile est 14,97 (on ne demande pas de
calculer ces valeurs). Déterminer le premier quartile.
5. Calculer la moyenne correspondant à cette série. Donner la formule utilisée.
6. Calculer l’écart–type.
Exercice 15
Le top 10 des ventes de voitures personnelles en 2012 sur le marché Marocain est le suivant :
Marques Ventes
DACIA 22356
RENAULT 19145
PEUGEOT 11244
FORD 7351
HYUNDAI 6590
VOLKSWAGEN 5947
CITROEN 5770
TOYOTA 4726
KIA 4683
FIAT 4027
T.A.F :
1. Décrire la série statistique (population, échantillon éventuel, caractère observé :
modalités, quantitatif/qualitatif, discret/continu, ordinal/nominal).
2. Donner une représentation graphique adaptée à la situation observée.
3. Donner la distribution en fréquence.
Exercice 16
Entreprises artisanales selon le nombre de salariés au 1er janvier 2010, en %.
Nombre de salariés Pourcentage d’entreprises
0 salarié 48,50
1 salarié 12,90
2 à 3 salariés 16,38
4 à 5 salariés 8,17
6 à 10 salariés 8,41
11 à 15 salariés 2,58
16 à 19 salariés 0,94
20 salariés ou plus 1,71
TOTAL 100,00
T.A.F :
Transformez les données suivantes en diagramme circulaire.
MOHAMMED QMICHCHOU 22
STATISTIQUE DESCRIPTIVE 2015
Caractéristiques de
Position Dispersion
x x xi+⋯+ xn
Moyenne • X = 1+ 2+⋯+
n
arithmétique n
∑i=1 xi
non pondérée • X = n
∑ 𝑛
𝑛𝑖 𝑥𝑖
Moyenne • 𝑋̅ = ∑𝑖=1
𝑛 𝑛
arithmétique 𝑖=1 𝑖
pondérée • 𝑋̅ = ∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
MOHAMMED QMICHCHOU 23
STATISTIQUE DESCRIPTIVE 2015
Renvoie la moyenne (arithmétique) des arguments. Par exemple, si la plage A1:A20 contient des
nombres, la formule =MOYENNE(A1:A20) renvoie la moyenne de ces nombres.
Syntaxe
MOYENNE(nombre1;[nombre2];...)
La syntaxe de la fonction MOYENNE comporte les arguments suivants :
nombre1 Obligatoire. Premier nombre, référence de cellule ou plage dont vous voulez obtenir
la moyenne.
nombre2; ... Facultatif. Nombres, références de cellules ou plages supplémentaires dont vous
voulez obtenir la moyenne (255 maximum).
Moyenne •G = n n x
i=1 i
géométrique n
1
Moyenne
𝑁 𝑘 𝑥 𝑛𝑖
géométrique •𝐺 = 𝑖=1 𝑖 (Avec 𝑁 = ∑𝑛𝑖=1 𝑛𝑖 )
pondérée
MOHAMMED QMICHCHOU 24
STATISTIQUE DESCRIPTIVE 2015
Moyenne
∑n
i=1 x i
2 2 ∑n xi 2
quadratique • Q2 =
n
⇒Q= i=1
n
non pondérée
Moyenne
∑𝑘
𝑖=1 𝑛𝑖 𝑥𝑖
2 2 ∑𝑘
𝑖=1 𝑛𝑖 𝑥𝑖
2
quadratique • 𝑄2 = ⇒𝑄=
∑𝑘
𝑖=1 𝑛𝑖 ∑𝑘
𝑖=1 𝑛𝑖
pondérée
Q2 = moyenne arithmétique des xi 2
Moyenne 𝑛 𝑛
harmonique • H= 1 1 1 = 1
+ +⋯+
x1 x2 xn ∑n
i=1 xi
non pondérée
MOHAMMED QMICHCHOU 25
STATISTIQUE DESCRIPTIVE 2015
Exercice 17
Soit la série suivante :
xi ni
[0-100[ 10
[100-200[ 20
[200-300[ 5
[300-600[ 7
[600-700[ 8
T.A.F :
Après avoir fait les extensions de tableaux nécessaires, calculer :
1. La moyenne arithmétique ;
2. La moyenne géométrique par les Log ;
3. La moyenne quadratique ;
4. La moyenne harmonique.
Exercice 18
On vous propose les deux séries suivantes :
4 6 7 4 2 6 4 1 0 2
1 2 3 6 6 0 0 1
T.A.F :
Donner les modes et les médianes des deux séries.
Exercice 19
Soit le tableau donnant la répartition de l’âge des enfants dans une population quelconque :
xi ni
[0-4[ 12
[4-8[ 10
[8-12[ 5
[12-18[ 4
Total
T.A.F :
1. Calculer les fréquences relatives de la série ;
2. Tracer le graphe de la série ;
3. Calculer les moyennes ;
4. Déterminer par le graphique et par le calcul :
a. Le mode ;
b. la médiane.
Exercice 20
On vous communique les résultats d’une étude portant sur la taille (en cm) de 12 enfants pris
au hasard dans une maternelle : 75, 78, 80, 85, 82, 84, 79, 78, 75, 80, 82, 75.
T.A.F :
1. Présenter le tableau statistique de la distribution.
2. Préciser les caractéristiques de cette série.
3. Calculer les caractéristiques centrales.
MOHAMMED QMICHCHOU 26
STATISTIQUE DESCRIPTIVE 2015
1.5.1.2. Le mode
Le mode correspond à la réalisation la plus fréquente. Le mode d'une série, ou dominante d'une
distribution, est la valeur de la variable (ou de l’unité statistique) qui revient le plus
fréquemment dans la série. C'est la valeur centrale de la classe qui a le plus grand effectif.
Le mode est l'indice le plus simple à déterminer puisqu'il suffit de lire un graphique ou de
regarder le tableau des effectifs.
Mode (Mo)
Série discrète :
Ex : Soit la série {8 ; 4 ; 4 ; 3 ; 4 ; 3 ; 8 ; 2 ; 5} La valeur la plus fréquente de cette série est 4.
Le mode est donc égal à 4. L'effectif associé à ce mode est 3.
Exemple : Soit la série présentant le nombre d’enfants des ménages habitant un quartier
résidentiel :
Nombre de d’enfants Nombre d’habitants
xi ni
0 36
1 133
2 274
3 128
4 41
5 27
Total 639
Le mode correspond, dans ce cas, à la valeur de la variable (2) qui correspond au plus grand
effectif (274).
Série continue :
Exemple ; Soit la série donnant le CA mensuel réalisé par les commerciaux d’une entreprise :
CA mensuel des clients Nombre de clients
xi ni
]0-4000[ 27
[4000-8000[ 183
[8000-12000[ 290
[12000-16000[ 148
[16000-20000[ 14
Total 662
Dans ce cas, on détermine :
La classe modale : qui est la classe ([8000-12000[) qui correspond à l’effectif le plus
grand (290).
MOHAMMED QMICHCHOU 27
STATISTIQUE DESCRIPTIVE 2015
Avec :
j : Rang de la classe modale ;
𝑏1,𝑗 : Borne inférieure de la classe modale ;
A : Amplitude de la classe modale ;
𝑛𝑗 : Effectif de la classe modale ;
𝑛𝑗+1 : Effectif de la classe qui suit la classe modale ;
𝑛𝑗−1 : Effectif de la classe qui précède la classe modale.
o Soit par le graphique :
1.5.1.3. La médiane
La médiane est un paramètre d'une série statistique simple, et plus exactement un paramètre de
position, c'est le nombre qui permet de de partager une série numérique ordonnée en deux
parties de même nombre d'éléments. Ce paramètre est utile pour donner la répartition du
caractère étudié, car 50 % environ de la population étudiée a une modalité inférieure à
la médiane et 50 % une modalité supérieure à la médiane.
Médiane (Me )
MOHAMMED QMICHCHOU 28
STATISTIQUE DESCRIPTIVE 2015
En général, une médiane est, dans une série ordonnée, une valeur M e telle qu'il y ait autant de
valeurs supérieures ou égales à Me que de valeur inférieures ou égales à Me.
Exemple : {1 ; 3 ; 5 ; 7 ; 9} la médiane est 5.
Série discrète :
Le médiane d'une série statistique rangée dans l'ordre croissant (x1 , x2 , x3 , x4 , ....., xn ) est le
nombre Me = Q2 (parce qu'on l'appelle aussi deuxième quartile) défini de la façon suivante :
Si n = 2p est pair, Me est le centre de l'intervalle [xp ; xp+1 ] ;
Si n est impair, Me est le nombre xp où p = (n + 1)/2.
Notes Effectifs CC n = 50 est pair, il faut donc prendre le centre
0 1 1 de [9 ; 10]
1 2 3
2 2 5 Utilisons la colonne des effectifs cumulés
3 3 8 pour déterminer la médiane : il y a 50 notes,
4 2 10 la 25ème note est 9 et la 26ème : 10.
5 3 13
6 2 15
Voilà la répartition des notes pour
7 3 18
comprendre :
8 4 22
9 3 25
10 2 27
11 3 30
12 4 34
13 4 38 Dans le tableau il n'y a pas de valeur
14 3 41 partageant la série statistique en deux
15 1 42 groupe de même effectif, (l’effectif total est
16 2 44 pair) dans ce cas l'intervalle médian est
17 1 45 [9;10] et on prendre pour médiane le centre
18 2 47 de cet intervalle : 9,5
19 2 49
20 1 50
Total 50
Série continue :
Si la variable est continue (regroupement par intervalle des résultats) le calcul de la médiane se
fait autrement :
MOHAMMED QMICHCHOU 29
STATISTIQUE DESCRIPTIVE 2015
Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ont même
coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu) :
𝑀𝑒 − 8 12 − 8 𝑀 −8 4 4 14
= ⇒ 𝑒 = ⇒ 𝑀𝑒 − 8 = − 7 ⇒ 𝑀𝑒 = 8 + = 10,33
25 − 18 30 − 18 7 12 12 7
La médiane est environ 10,33 ; c'est-à-dire que 50 % environ des personnes ont eu moins de 10,33
et 50 % plus de 10,33.
300
CC
250
200
150
100
50
Me CD
0
10000 20000 30000 100000
100%
90%
CC
80%
70%
60%
50%
40%
30%
20%
10% Me
0%
1 2 3 4 5 6 7 8 9
MOHAMMED QMICHCHOU 30
STATISTIQUE DESCRIPTIVE 2015
Exercice 21
Un commerçant décide à la fin de la journée de calculer le montant médian des chèques
encaissés.
Montant des chèques
Effectif ni ECC
(en DH)
[0 ; 20[ 25 25
[20 ; 40[ 40 65
[40 ; 60[ 36 101
[60 ; 100[ 5 106
Total 106
TAF :
1. Déterminer les caractéristiques de cette série statistique ;
2. Représenter cette série à l’aide du graphique adéquat ;
3. Déterminer :
3.1. La Moyenne
3.1.1. Arithmétique par les fréquences absolues et relatives ;
3.1.2. Géométrique avec et sans les Log ;
3.1.3. Quadratique ;
3.1.4. Harmonique ;
3.2. Le Mode ;
3.3. La Médiane par le calcul et par le graphique ;
1.5.1.4. La médiale
La médiale ne doit pas être confondue avec la médiane.
La médiale Ml se calcule de la même façon que la médiane mais à partir de la masse c'est-à-
dire à partir des nixi. Autrement dit, la médiale est la valeur de la variable qui coupe en deux
la masse∑𝑛𝑖=1 𝑛𝑖 𝑥 𝑖.
MOHAMMED QMICHCHOU 31
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 32
STATISTIQUE DESCRIPTIVE 2015
10
n
o
m
b
5
r
e
52 57 62 67 72 77 82 87 poids (kg)
étendue
35 kg
MOHAMMED QMICHCHOU 33
STATISTIQUE DESCRIPTIVE 2015
Renvoie la moyenne des écarts absolus des observations par rapport à leur moyenne
arithmétique. ECART.MOYEN mesure la dispersion dans un ensemble de données.
Syntaxe
AVEDEV (nombre1,nombre2, ...)
nombre1,nombre2, ... représentent 1 à 30 arguments pour lesquels vous recherchez la
moyenne des écarts par rapport à leur moyenne.
Notes
Les arguments doivent être des nombres ou des références de colonnes contenant des
nombres.
Si un argument est une référence de colonne qui contient du texte, des valeurs logiques ou
qui est vide, ces valeurs sont ignorées ou renvoient la valeur d’erreur #VALEUR! ; la valeur
zéro est cependant prise en compte.
MOHAMMED QMICHCHOU 34
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 35
STATISTIQUE DESCRIPTIVE 2015
L'écart-type est zéro si toutes les valeurs d'un ensemble de données sont les mêmes
(parce que chaque valeur est égale à la moyenne).
Mode opératoire Excel :
Fonction ECARTYPEP
Calcule l'écart-type sur la base de la population entière indiquée par les arguments. L'écart-type
mesure la dispersion des valeurs par rapport à la valeur moyenne (moyenne).
Syntaxe
ECARTYPEP(nombre1; nombre2;... )
MOHAMMED QMICHCHOU 36
STATISTIQUE DESCRIPTIVE 2015
pouvez utiliser la fonction QUARTILE pour déterminer les 25 % de revenus les plus élevés d'une
population.
Syntaxe
QUARTILE(matrice;quart)
MOHAMMED QMICHCHOU 37
STATISTIQUE DESCRIPTIVE 2015
La superposition de boîtes à moustaches peut être utile pour comparer plusieurs séries associées
à un même caractère sur des populations différentes.
Exemple
Soit une variable statistique X dont le maximum est 55, le minimum 20, la médiane 38, le
premier quartile 32,5 et le troisième quartile 45, on construit alors le diagramme en boîte
suivant :
Exercice 23
Soit la série suivante :
0 1 0 2 4 7 8 8 6
T.A.F :
MOHAMMED QMICHCHOU 38
STATISTIQUE DESCRIPTIVE 2015
Exercice 24
Calculer pour la série suivante :
L’étendue ;
L’écart absolu moyen ;
L’écart relatif moyen (par rapport à la moyenne) ;
La variance ;
l’écart type.
Xi ni
[100-200[ 2
[200-300[ 7
[300-400[ 10
[400-600[ 12
[600-700[ 9
Total
Exercice 25
Le relevé de l’âge des individus d’un groupe de personnes partant pour voyage organisé nous
livre les résultats suivants :
Classe d’âge Effectifs
Xi ni
[22-26[ 7
[26-28[ 12
[28-35[ 9
[35-40[ 6
[40-45[ 4
T.A.F :
1. Calculer la variance de la série.
2. Déduire l’écart type des âges des personnes du groupe.
3. L’écart type, dans ce cas, a-t-il une signification concrète ?
Exercice 26
Soit la série nous donnant le nombre d’individus par foyer dans un village :
Individus 1 2 3 4 5 6 7
Foyers 5 10 30 24 13 9 4
T.A.F :
Calculer pour cette série :
1. l’étendue.
2. L’écart absolu moyen.
3. l’écart relatif moyen.
4. L’écart type et la variance.
Exercice 27
MOHAMMED QMICHCHOU 39
STATISTIQUE DESCRIPTIVE 2015
Exercice 28
Soit le nombre de visites effectuées par une infirmière durant une semaine :
Jours Lundi Mardi Mercredi Jeudi Vendredi
Visites 9 7 4 6 2
T.A.F :
1. Calculer les quartiles de la distribution.
2. Calculer l’écart type te la variance.
Exercice 29
Jamila a commencé à travailler dans un magasin d'informatique il y a un an. Son supervise ur
lui a demandé de tenir un dossier du nombre d'ordinateurs qu'elle a vendus chaque mois.
L'ensemble de données qui suit indique le nombre d'ordinateurs qu'elle a vendus mensuelle me nt
au cours des 12 derniers mois :
34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37.
Utilisez les dossiers des ordinateurs vendus par Jamila pour trouver :
a. l'étendue
b. la médiane
c. les quartiles supérieur et inférieur
d. l'écart interquartile
1.5.3.1. Définition
La concentration d’une distribution mesure sa répartition « observée » par rapport à une
« norme » de répartition (la répartition à laquelle on s’attend). Donc il s’agit de comparer deux
séries de fréquences cumulées. Elle est souvent utilisée dans l’analyse des parts distributives
des salaires, des fortunes, des parts de marché des entreprises, etc…C’est aussi une mesure de
l’état des inégalités dans la distribution.
La courbe de concentration exige comme pour la médiale, la connaissance pour chaque classe
du nombre d’observations et de la somme des valeurs correspondantes.
MOHAMMED QMICHCHOU 40
STATISTIQUE DESCRIPTIVE 2015
Soit Fi la fréquence cumulée des observations et FQi le pourcentage cumulé de la somme des
valeurs. Alors, la courbe de concentration est obtenue en traçant le graphe de FQi (ordonnée)
en fonction de Fi (abscisse). On obtient alors la courbe suivante :
La courbe de Lorenz joint donc toujours le point (0,0) au point (1,1). Elle est située sous le
segment joignant ces deux points. Un point de la courbe doit être interprété de la façon suivante
: « les 30% les moins riches de la population possèdent 10% de la population totale ».
Le mode opératoire pour tracer la courbe de Lorenz est le suivant :
MOHAMMED QMICHCHOU 41
STATISTIQUE DESCRIPTIVE 2015
Tracer la bissectrice.
La bissectrice
Calculer des déciles, représente la
Classer les valeurs
c’est-à-dire les 9 répartition égalitaire :
obtenues pour chaque Tracer la courbe des
valeurs qui séparent la 20 % de la population
individu en ordre population en 10 répartitions.
détient 20 % des
croissant.
classes égales. revenus, 60 % en
détient 60 % des
revenus, etc.
La courbe de Lorenz est située en dessous de cette diagonale de référence. Plus la courbe est
éloignée de la diagonale, plus la répartition des revenus est inégalitaire.
MOHAMMED QMICHCHOU 42
STATISTIQUE DESCRIPTIVE 2015
𝐧 𝐧
𝟏
𝐆𝐢𝐧𝐢 = 𝟏 − ∑(𝐲𝐢 + 𝐲𝐢+𝟏 ) = 𝟏 − ∑(𝐱 𝐢 − 𝐱 𝐢−𝟏 )(𝐲𝐢 + 𝐲𝐢+𝟏 )
𝐍
𝐢+𝟏 𝐢+𝟏
Exercice 30
Nous disposons des données suivantes sur les salaires perçus par les employés d’une PME.
Salaires
Salariés
(en milliers de DH)
1 4
2 6
3 8
4 9
5 10
6 12
7 17
8 26
9 28
10 30
TA F :
1. Tracer et commenter la courbe de Lorenz.
2. Calculer et interpréter l’indice de Gini.
Exercice 31
Dans une entreprise de 100 personnes, on a relevé les salaires suivants :
Salaires 1000-1200 1200-1500 1500-2000 2000-3000 3000-5000 5000-10000
Nombre de salariés 50 20 10 8 7 5
Travail à faire :
1. Tracer et commenter la courbe de Lorenz.
2. Calculer et interpréter l’indice de Gini.
MOHAMMED QMICHCHOU 43
STATISTIQUE DESCRIPTIVE 2015
SUJETS D’EXAMENS
Examen session 2012-2013
Licence : Sciences Economiques et de Gestion Semestre : I
Module : Techniques Quantitatives de gestion Matière : Statistique Descriptive-I
Tous les groupes Barème : 20 PTS
MOHAMMED QMICHCHOU 44
STATISTIQUE DESCRIPTIVE 2015
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère. (3PTS)
2. Calculez la moyenne, la variance et l’écart type du caractère X. (4PTS)
MOHAMMED QMICHCHOU 45
STATISTIQUE DESCRIPTIVE 2015
Il vous est demandé d’apporter un soin particulier à la présentation de votre copie (l’utilisation du
Blanco est strictement interdite).
MOHAMMED QMICHCHOU 46
STATISTIQUE DESCRIPTIVE 2015
Une variable
Deux variables quantitative et une Deux variables
quantitatives variable qualitatives
qualitative
Lorsque le domaine de variation d’une variable quantitative a été découpé en classes et
que les observations sont présentées dans un tableau à double entrée, alors cette variable
peut être traitée comme une variable qualitative et dans ce cas, on a plusieurs méthodes
pour l’étude de la liaison.
Faire un ajustement
Dégager des tendances Etudier la corrélation
(ou régression) linéaire
MOHAMMED QMICHCHOU 47
STATISTIQUE DESCRIPTIVE 2015
Tableaux
Séries statistiques doubles
Graphiques
La distribution conjointe
MOHAMMED QMICHCHOU 48
STATISTIQUE DESCRIPTIVE 2015
∑ 𝑥 𝑖 ∑ 𝑦𝑗
𝑖=1 𝑗 =1
𝑋 = ∑ 𝑥 𝑖. = ∑ (∑ 𝑥 𝑖𝑗 )
𝑖=1 𝑖 =1 𝑗=1
Ou
𝑚 𝑚 𝑛
𝑋 = ∑ 𝑥 .𝑗 = ∑ (∑ 𝑥 𝑖𝑗 )
𝑗=1 𝑗=1 𝑖=1
y1 … yj … yl Total
Modalités de X
MOHAMMED QMICHCHOU 49
STATISTIQUE DESCRIPTIVE 2015
𝒏𝒊.= ∑ 𝒏𝐢𝐣
𝒋=𝟏
Montant des achats [0-1000[ [1000-2000[ [2000-3000 [ [3000-5000[
Nombre de clients 68 47 34 12
L’effectif 𝐧 .𝐣 est le nombre total d’observations de la modalité 𝐲𝐣 de Y, quelle que soit la
modalité de X :
Modalités de Y y1 … yj … yl
Total n.1= ∑𝒌𝒊=𝟏 𝑛i1 … n.j= ∑𝒌𝒊=𝟏 𝑛ij … n.l= ∑𝒌𝒊=𝟏 𝑛il
𝒌
𝒏 .𝒋= ∑ 𝒏𝐢𝐣
𝒊=𝟏
Nombre des achats 1 2 3 4 5
Nombre de clients 71 49 28 10 3
On a évidemment :
𝒍 𝒌
∑ 𝒏𝐢𝐣 = ∑ 𝒏𝐢𝐣 = 𝒏
𝒋=𝟏 𝒊=𝟏
MOHAMMED QMICHCHOU 50
STATISTIQUE DESCRIPTIVE 2015
Exercice 32
Une étude menée par un groupe de compagnies d’assurances auprès de 30000 assurés
pour le risque « véhicules à moteur » a permis de déterminer les proportions (en
pourcentage) d’assurés correspondant à la puissance fiscale, notée X, du véhicule assuré
et au kilométrage parcouru au cours de la dernière année, noté Y. Les résultats sont
reportés dans le tableau suivant :
Y (milliers de km)
<10 [10 ; 20[ [20 ; 30[ [30 ; 40[ ≥40
X (chevaux fiscaux)
<4 4,4 1,6
MOHAMMED QMICHCHOU 51
STATISTIQUE DESCRIPTIVE 2015
Exercice 33
Dans une entreprise, on étudie la répartition de 100 salariées femmes (cf. tableau 1) et
140 salariés hommes (cf. tableau 2) selon le salaire mensuel brut X exprimé en € et
l’ancienneté Y exprimée en années.
Tableau 1 – Salariées femmes
Y
X [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]
[1 200 ; 1 800[ 12 10 10 8
[1 800 ; 2 200[ 8 14 5 4 4
[2 200 ; 3 000[ 6 5 6 3
[3 000 ; 4 200] 2 3
Tableau 2 – Salariés hommes
Y
[0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]
X
[1 200 ; 1 800[ 10 6
[1 800 ; 2 200[ 4 9 18 8 8
[2 200 ; 3 000[ 4 8 16 12 4
[3 000 ; 4 200] 5 8 8 12
Travail à faire :
1. Définissez la population étudiée, l’unité statistique, les caractères étudiés et leur
nature.
2. Quel pourcentage de femmes gagnent moins de 2200 € parmi les femmes qui ont
moins de 8 ans d’ancienneté ?
3. Quel pourcentage de hommes gagnent plus de 2200 € parmi les hommes qui ont
plus de 8 ans d’ancienneté ?
4. Représentez le graphe des fréquences cumulées de la distribution marginale de
l’ancienneté des femmes.
5. Représentez le graphe des fréquences cumulées de la distribution marginale du
salaire mensuel brut des hommes.
6. Calculez la distribution (en pourcentage) de l’ancienneté des femmes gagnant au
moins 1800 €.
MOHAMMED QMICHCHOU 52
STATISTIQUE DESCRIPTIVE 2015
Exercice 34
Une entreprise a effectué un sondage auprès de sa clientèle pour connaître son
appréciation sur le service livraison. Les résultats ont été les suivants :
Pas du tout Plutôt pas Plutôt Très
satisfait satisfait satisfait satisfait
Clients de plus de 2 ans 10 50 245 195
d’ancienneté
Clients d’au plus 2 ans d’ancienneté 40 90 205 165
Travail à faire :
1. Calculez le pourcentage total de clients plutôt satisfaits ou très satisfaits.
2. Calculez le pourcentage de clients de plus de 2 ans d’ancienneté parmi les clients
plutôt satisfaits ou très satisfaits.
3. Donnez le tableau des profils en ligne.
4. Donnez le tableau de contingence obtenu en regroupant :
d’une part les clients pas du tout satisfaits et plutôt pas satisfaits ;
et d’autre part les clients plutôt satisfaits et très satisfaits.
5. Si les 2 caractères étaient indépendants, combien aurait-on de clients de plus de
2 ans d’ancienneté dans la catégorie plutôt satisfait ou très satisfait ?
2.2.2. Graphiques
Chronogramme
Nuage de points
Chronogramme
Séquentiel
Parallèle
MOHAMMED QMICHCHOU 53
STATISTIQUE DESCRIPTIVE 2015
Source : www.hcp.ma
100 000
2009 0 2003
2008 2004
2007 2005
IMPORTATIONS (y compris ATSP2006
) EXPORTATIONS (y compris les ATSP)
MOHAMMED QMICHCHOU 54
STATISTIQUE DESCRIPTIVE 2015
couple (xi; yi) de la série statistique le point M i de coordonnées (xi ; yi). Le graphique
ainsi obtenu constitue un nuage de points. On ne figure donc plus ici des effectifs mais
des individus en fonctions des valeurs prises dans chacune des variables.
Ce type de graphique revêt une importance fondamentale en statistique descriptive car
il permet, entre autres choses, d'identifier et d'évaluer la relation entre deux variables et
d'opérer une analyse sur les individus (hiérarchisation, regroupement, etc.).
Graphique 3: Nuage de point des exportations de marchandises et de services d’un panel de pays
Exportations de marchandises et de services en 2011
160000000
Exportations de services en milliers US D
140000000 Espagne
120000000
100000000
80000000
60000000
40000000
20000000
Maroc Arabie Saoudite
0 Algérie
0 100000000 200000000 300000000 400000000
Exportations de marchandises en milliers USD
Source : www.trademap.org
Exercice 35
Soit le tableau suivant donnant, en M.DH, les exportations et le PIB du Maroc sur la
période 2000-2011.
Année 2000 2001 2002 2003 2004 2005
Exportations 78826 80667 86389 83887 87896 99265
PIB courant 393381 426402 445426 477021 505015 527679
Année 2006 2007 2008 2009 2010 2011
Exportations 111979 125517 155740 113020 149583 173977
PIB courant 577344 616254 688843 732449 764030 802607
Source : DTFE, www.finances.gov.ma
Travail à faire :
1. Représenter la série des exportations à l’aide d’un chronogramme.
2. Représenter la série du PIB à l’aide d’un graphique radar.
3. Représenter les exportations et le PIB sur deux nuages de points différents.
MOHAMMED QMICHCHOU 55
STATISTIQUE DESCRIPTIVE 2015
𝒚 = 𝒂𝒙 + 𝒃
Où :
y = Variable dépendante ou variable expliquée
x = Variable indépendante ou variable explicative
a = Pente de la droite de régression
b = Ordonnée à l’ origine de la droite de régression
Cette relation suppose que y est une fonction de x, c'est-à-dire que la valeur de y
dépend de celle de x, ou bien encore que la valeur de y est expliquée par la valeur
de x.
Ainsi, la façon dont évoluera la valeur de y dépendra, de manière plus ou moins
forte, de la façon dont évoluera celle de x.
x est alors appelée variable explicative, sa variation expliquant tout ou partie de
la variation de y, elle-même appelée variable expliquée.
Il nous reste à décrire les deux dernières composantes de l'équation de la droite de
tendance et de la droite de régression à savoir a et b :
a représente la pente de la droite (coefficient directeur en mathématique), c'est-
à-dire son inclinaison ou, en d'autres termes, l'ampleur de la variation de la
variable expliquée y quand la variable explicative x varie d’une unité. Plus la
variation de y sera importante pour la variation d'une unité de x, plus la pente
MOHAMMED QMICHCHOU 56
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 57
STATISTIQUE DESCRIPTIVE 2015
Cette méthode n’est cependant pas très satisfaisante. Elle porte son inconvénient déjà
dans son nom car elle ne tient compte que de des deux points extrêmes de la série
statistique.
MOHAMMED QMICHCHOU 58
STATISTIQUE DESCRIPTIVE 2015
Exemple :
Trimestre 1 2 3 4 5 6 7 8 9 10 11 12
CA 500 550 900 650 520 580 900 670 540 600 1000 700
Ici, la série comporte 12 périodes, on peut la couper en deux parties de poids égal : les
trimestres 1 à 6 et les trimestres 7 à 12.
Premier couple de coordonnées : Second couple de coordonnées :
A1 (x1 ; y1) A2 (x2 ; y2 )
x1 = (1+2+3+4+5+6) / 6 = 3,5 x2 = (7+8+…+12) / 6 = 9,5
y1 = (500+550+…+580) = 616,6 y2 = (900+…+700) = 735
On peut tracer la droite sur le nuage de points :
MOHAMMED QMICHCHOU 59
STATISTIQUE DESCRIPTIVE 2015
1200
1000
800
600
400
200 A1 A2
0
0 2 4 6 8 10 12 14
MOHAMMED QMICHCHOU 60
STATISTIQUE DESCRIPTIVE 2015
Nous allons chercher la meilleure droite au sens des moindres carrés, c’est-à-dire telle
que :
Cov(x, y) δxy
a= =
Var (x) δx
1 n
La pente de la droite ∑i=1(xi − x̅ )(yi − y̅) ∑n (x − x̅ )(y − y̅)
= n =
i=1 i i
d’ajustement 1 ∑n ( ∑n
xi − x̅)2 ̅ )2
i=1(xi − x
n i=1
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
= 𝑛
∑𝑖=1 𝑥𝑖 2 − 𝑛𝑥̅ 2
L’ordonnée à l’origine b = y̅ − ax̅
La formalisation de la relation par l'intermédiaire d'une équation ne renseigne pas non
plus sur la qualité et l'intensité d'une supposée liaison entre deux variables. On peut en
effet déterminer une équation matérialisant une relation que l'on juge probable et logique
et qui cependant n'est pas ou peu marquée ou qui n'est pas systématique dans la réalité.
Nous sommes donc en présence de deux problèmes :
d'une part un problème lie à l'identification de l'existence ou non d'une relation
de cause à effet entre deux variables que l'on souhaite confronter ;
MOHAMMED QMICHCHOU 61
STATISTIQUE DESCRIPTIVE 2015
Covariance
Coefficient de corrélation
Coefficient de détermination
Du résultat obtenu par cette mesure on en déduit que plus la covariance est faible et
plus les séries sont indépendantes et inversement plus elle est élevée et plus les séries
sont liées. Une covariance nulle correspondant à deux variables totalement
indépendantes mais la réciproque est fausse.
−𝟏 ≤ 𝐫 ≤ 𝟏
MOHAMMED QMICHCHOU 62
STATISTIQUE DESCRIPTIVE 2015
Sa valeur mesure la force de la liaison tandis que son signe renseigne sur le sens de la
corrélation :
Lorsque (𝐫 = 𝟏), la relation entre les variables x et y est proportionnelle et
parfaite ;
Lorsque (𝐫 = −𝟏), la relation entre les variables x et y est inversement
proportionnelle et parfaite ;
Lorsque (𝐫 = 𝟎), la relation entre les variables x et y est statistiquement
inexistante.
Entre ces bornes, tous les cas de figures sont possibles avec des degrés de liaison
variables.
Corrélation Négative Positive
Faible de −0,5 à 0 de 0 à 0.5
Forte de −1 à −0,5 de 0,5 à 1
𝟎 ≤ 𝒓𝟐 ≤ 𝟏
Ce coefficient est compris entre 0 et 1. Plus il est proche de 1 et plus la qualité globale
de la régression est bonne.
Exercice 36
L’observation des quantités offertes sur un marché de raisin de table et des prix de vente
a donné les résultats suivants :
Quantité X à la vente (tonnes) 100 120 84 78 87 80 110 95
Prix moyen Y par kg (euros) 1,60 1,40 1,95 2,10 1,75 2,25 1,50 1,80
Travail à faire :
1. Calculez et interpréter
a. La covariance de X et Y.
b. le coefficient de corrélation linéaire entre X et Y.
c. le coefficient de détermination linéaire entre X et Y.
2. Déterminez l’équation de la droite des moindres carrés de Y en X.
3. Estimer le prix moyen Y si la quantité X à la vente était de 90 tonnes.
Exercice 37 (D’après sujet d’examen)
Soit le tableau suivant qui concerne 19 sociétés sur 76 cotés à la bourse de Casablanca, et qui
affichent des taux de rendement supérieur à 5%.On veut savoir s'il existe une liaison entre les
dividendes et le cours de ces actions :
Sociétés côtés Dividende par action Cours à fin Mars 2010
(en DH) (en DH)
Afric Industries 29 279
Nexans 25 274
Microdata 55 675
MOHAMMED QMICHCHOU 63
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 64
STATISTIQUE DESCRIPTIVE 2015
introduit dans une région, une vaste campagne publicitaire a accompagné son lancement. La
société s’intéresse à analyser l’effet de ces campagnes publicitaires sur les ventes enregistrées
au cours de la première année. Les données observées pour les 14 régions sont dans tableau
suivant :
Région Pub (Millions de DH) Ventes (Millions de DH)
1 1,8 104
2 1,2 68
3 0,4 39
4 0,5 43
5 2,5 134
6 2,5 127
7 1,5 87
8 1,2 77
9 1,6 102
10 1 65
11 1,5 101
12 0,7 46
13 1 52
14 0,8 33
Travail à faire :
1. Calculer a et b.
2. Calculer le coefficient de corrélation linéaire simple.
3. Calculer le coefficient de détermination R2 , discuter la qualité du modèle.
4. Estimer les ventes pour une publicité de 4 Millions de dirhams.
MOHAMMED QMICHCHOU 65
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 66
STATISTIQUE DESCRIPTIVE 2015
3. SERIES CHRONOLOGIQUES
« Mon intérêt réside dans le futur car je me prépare à y passer le reste de ma vie ».
C.F. Kettering
MOHAMMED QMICHCHOU 67
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 68
STATISTIQUE DESCRIPTIVE 2015
les mouvements cycliques sur une grande période autour du trend. Ces
mouvements peuvent être périodiques (exemple : récession et expansion
économique, etc.) ;
MOHAMMED QMICHCHOU 69
STATISTIQUE DESCRIPTIVE 2015
CA en milliers de DH
250
200
150
100
50
0
Trim 1
Trim 3
Trim 1
Trim 2
Trim 4
Trim 2
Trim 4
Trim 2
Trim 3
Trim 2
Trim 4
Trim 3
Trim 1
Trim 3
Trim 1
Trim 4
la méthode Analytique (méthode du tableau de Buys et Ballot) consiste à
calculer les moyennes et écarts-types pour chacune des périodes considérées et
on calcule la droite des moindres carrés :
o Si l’écart type est indépendant de la moyenne (𝐚 = 𝟎), c’est un modèle
additif ;
o Si l’écart type est fonction de la moyenne (𝐚 ≠ 𝟎), le modèle est
multiplicatif.
Exemple : soit la série chronologique “Nouvelles immatriculations de voitures
particulières, commerciales et utilitaires neuves selon le mois :
Année
2008 2009 2010 2011 2012
Janvier 2006 2247 2433 3127 3016
Février 3224 3862 3723 4437 4671
Mars 3789 3586 4325 5478 5218
Avril 4153 4047 4493 4384 4746
Mai 3100 2838 3399 3552 4814
Juin 2527 2727 3083 3678 3545
Mois 3015 2730 3247 3611 3341
Juillet
Août 1504 1648 1928 2260 2439
Septembre 1847 2007 2377 2699 2637
Octobre 2314 2450 2831 3071 3085
Novembre 1673 1966 2388 2510 2737
Décembre 1602 1695 2126 2182 2055
MOHAMMED QMICHCHOU 70
STATISTIQUE DESCRIPTIVE 2015
6000
5000
4000
3000
2000
1000
0
13
16
25
28
37
40
49
52
55
10
19
22
31
34
43
46
58
1
4
7
5000
4000
3000
2000
1000
MOHAMMED QMICHCHOU 71
STATISTIQUE DESCRIPTIVE 2015
Série temporelle
8
7
6
5
Valeur
4
3
2
1
0
t1 t2 t3 t4 t5 t6 t7 t8 t9
Période
MOHAMMED QMICHCHOU 72
STATISTIQUE DESCRIPTIVE 2015
Exemple : Si nous calculons les moyennes mobiles d’ordre 3, nous obtenons les
valeurs suivantes :
Période t1 t2 t3 t4 t5 t6 t7 t8 t9
Valeur 4 6 5 3 7 5 4 3 6
Moyennes mobiles d’ordre 3 5,00 4,67 5,00 5,00 5,33 4,00 4,33
Moyennes mobiles d’ordre 5 123,80 137,80 116,20 126,80 131,00 144,60
Moyennes mobiles d’ordre 4 123,8 125,9 127,3 128,1 130,3 132,5
En représentant graphiquement ces résultats, nous remarquons bien la tendance au
« lissage » de la représentation originale avec l’utilisation de la technique des moyennes
mobiles.
230
210
190
170
150
130
110
90
70
50
Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Le choix de l’ordre :
Ordre adapté à la périodicité des variations saisonnières ;
Cependant, plus l'ordre est élevé :
o plus le lissage est violent ;
o plus on perd de valeurs.
Valeur
8
6
y = -0,0167x + 4,8611
4
2
t1 t2 t3 t4 t5 t6 t7 t8 t9
MOHAMMED QMICHCHOU 73
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 74
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 75
STATISTIQUE DESCRIPTIVE 2015
t yt ft st sj s'j CVS
1 3,6 5,49 -1,89 -1,72 -1,72 5,32
2 7 5,47 1,53 1,13 1,13 5,87
3 7,6 5,44 2,16 2,01 2,01 5,59
4 3,7 5,42 -1,72 -1,42 -1,42 5,12
5 3,6 5,39 -1,79 -1,72 -1,72 5,32
6 6,7 5,37 1,33 1,13 1,13 5,57
7 7,4 5,34 2,06 2,01 2,01 5,39
8 3,9 5,32 -1,42 -1,42 -1,42 5,32
9 3,7 5,29 -1,59 -1,72 -1,72 5,42
10 6,4 5,27 1,13 1,13 1,13 5,27
11 7,1 5,24 1,86 2,01 2,01 5,09
12 4,1 5,22 -1,12 -1,42 -1,42 5,52
13 3,6 5,20 -1,60 -1,72 -1,72 5,32
14 5,7 5,17 0,53 1,13 1,13 4,57
15 7,1 5,15 1,95 2,01 2,01 5,09
16 3,7 5,12 -1,42 -1,42 -1,42 5,12
8
7,5
7
6,5
6
5,5
5
4,5
4
3,5
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Yt CVS
MOHAMMED QMICHCHOU 76
STATISTIQUE DESCRIPTIVE 2015
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Yt Yt estimée
MOHAMMED QMICHCHOU 77
STATISTIQUE DESCRIPTIVE 2015
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Yt Ft CVS Yt estimée
MOHAMMED QMICHCHOU 78
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 79
STATISTIQUE DESCRIPTIVE 2015
8
7,5
7
6,5
6
5,5
5
4,5
4
3,5
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Yt Yt estimée
3.4.1. Progressions
La progression mesure le sens et l'intensité du changement intervenu sur une variable
numérique V a différents temps t. Au temps t la variable s'écrit par convention Vt (V
indice t).
Lorsque t = 0 la variable s'écrit V0,
quand t = 1 elle s'écrit V1,
lorsque t = n on a Vn .
A chaque temps t la variable V est caractérisée par une valeur différente.
MOHAMMED QMICHCHOU 80
STATISTIQUE DESCRIPTIVE 2015
∆𝐕 𝐕𝟏 − 𝐕𝟎
𝐠𝐭 = =
𝐕𝟎 𝐕𝟎
3.4.2. Indices
L'indice d'une grandeur est 1 « le rapport entre la valeur de cette grandeur au cours d'une
période courante et sa valeur au cours d'une période de base ». Il mesure la variation
relative de la valeur entre la période de base et la période courante. Souvent, on multiplie
le rapport par 100 ; on dit : indice base 100 à telle période.
Les indices permettent de calculer et de comparer facilement les évolutions de plusieurs
grandeurs entre deux périodes données. L'indice est avant toute chose un résumé
d'informations.
Il faut distinguer les indices élémentaires des indices synthétiques :
les indices élémentaires décrivent le changement relatif d’une seule variable ;
les indices synthétiques ou indices composés permettent de décrire par un
nombre unique la comparaison de l’ensemble des valeurs que prennent plusieurs
variables dans une certaine situation par rapport à l’ensemble des valeurs des
mêmes variables dans une situation de référence.
1 www.insee.fr
MOHAMMED QMICHCHOU 81
STATISTIQUE DESCRIPTIVE 2015
𝐠𝟏
𝐈𝟏/𝟎 = × 𝟏𝟎𝟎
𝐠𝟎
La situation de base, ou de référence (g0 ), est toujours placée au dénominateur, le
numérateur (g1) étant occupé par la situation dite courante.
Indice élémentaire Formule
𝐏𝟏
des prix 𝐈(𝐏)𝟏/𝟎 =
𝐏𝟎
𝐐𝟏
des quantités 𝐈(𝐐)𝟏/𝟎 =
𝐐𝟎
𝐕𝟏 𝐏𝟏 𝐐𝟏
de valeur (ou de dépense) 𝐈(𝐕)𝟏/𝟎 = = = 𝐈(𝐏)𝟏/𝟎 × 𝐈(𝐐)𝟏/𝟎
𝐕𝟎 𝐏𝟎 𝐐𝟎
La détermination d'un indice peut ne pas se limiter à la comparaison des mesures d'une
seule grandeur. On peut envisager de suivre l'évolution simultanée de plusieurs
grandeurs et de calculer un indice synthétique ou composé.
MOHAMMED QMICHCHOU 82
STATISTIQUE DESCRIPTIVE 2015
www.hcp.ma
2
Étienne Laspeyres (économiste et statisticien allemand d’origine française) et Hermann Paasche (statisticien allemand)
proposèrent ces formules respectivement en 1864 et 1874.
MOHAMMED QMICHCHOU 83
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 84
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 85
STATISTIQUE DESCRIPTIVE 2015
𝐅 = √𝐋 × 𝐏
On peut aussi le calculer soit en prix soit en quantités.
𝐅(𝐏) = √𝐋(𝐏) × 𝐏(𝐏)
𝐅(𝐐) = √𝐋(𝐐) × 𝐏(𝐐)
Indice Des prix Des quantités
LASPEYRES 105,49 105,49
PAASCHE 103,52 102,85
FISHER 104,50 104,16
L’indice de FISHER, la moyenne géométrique des deux indices de LASPEYRES et de
PAASCHE, se veut donc un indice idéal représentant un compromis entre ces deux indices.
MOHAMMED QMICHCHOU 86
STATISTIQUE DESCRIPTIVE 2015
Exercice 42
1. Construire une série chronologique X, composée de 16 points et définie par :
xt = 2 . t + 100
Où t représente le temps, avec t variant de 1 à 16.
2. Calculer les moyennes mobiles centrées de longueur 3 et de longueur 4 sur la
série X, qui seront notées respectivement M 3(X) et M4 (X).
3. Comparer la série X aux deux moyennes mobiles M 3(X) et M4 (X). Commenter
les résultats.
4. Construire une nouvelle série chronologique Y composée également de 16 points
et définie par :
yt = 3 t + 200
Où t représente le temps, avec t variant de 1 à 16.
5. Calculer les moyennes mobiles centrées de longueur 3 et longueur 4 sur la série
Y, qui seront notées respectivement M 3 (Y) et M4 (Y).
6. Calculer la somme Z des deux séries chronologiques X et Y. Calculer les
moyennes mobiles de longueur 3 et longueur 4 sur Z, qui seront notées
respectivement M3 (Z) et M4 (Z).
7. Calculer les sommes M3 (X) + M3 (Y) et M4 (X) + M4 (Y). Comparer ces résultats
à ceux de la question 5. Que peut-on constater ?
Exercice 43
Le tableau ci-dessous donne le chiffre d'affaires trimestriel de l'entreprise TrucNet sur la période
2008 à 2011.
Exercice 44
La compagnie aérienne régionale AirHub désire connaître la structure du trafic aérien d'une de
ses lignes. Pour cela elle vous donne la série mensuelle du nombre de passagers entre 2008 et
2012.
janvier février mars avril mai juin juillet août septembre octobre novembre décembre
2008 713 630 940 1040 720 1 260 812 380 870 1 120 1 200 910
2009 800 700 1 030 1 280 840 1 520 1 010 510 1 060 1 280 1 350 1 000
2010 900 820 1 190 1 450 880 1 730 1 034 590 1 203 1 500 1 550 1 140
2011 1 092 1 000 1 380 1 700 960 1 950 1 203 660 1 282 1 600 1 700 1 160
2012 1 070 1 030 1 440 1 720 1 060 2 200 1 190 730 1 278 1 760 1 940 1 320
Travail à faire :
1. Tracer la série chronologique X.
MOHAMMED QMICHCHOU 87
STATISTIQUE DESCRIPTIVE 2015
Exercice 45
Le tableau suivant donne la série chronologique bimestrielle du transport des voyageurs sur le
réseau Air France International (en milliards de passagers-km) de 2008 à 2011.
Janv.-Fév Mars-Avril Mai-Juin Juil.-Août Sept.-Oct. Nov.-Déc.
2008 13,3 15,1 14,8 16,3 14,8 14,2
2009 13,8 14,2 14,1 17 15,2 14,8
2010 14,4 16 16,2 18,5 16,2 15,3
2011 15,4 16,8 17,4 19,9 17,9 17,4
Travail à faire :
1. On choisit de modéliser cette chronique par un schéma additif. Justifiez ce choix.
2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles de
longueur adaptée, et représentez-la sur le même graphique que la série initiale.
3. Calculez les coefficients saisonniers.
4. Calculez la série corrigée des variations saisonniè res. Ajustez cette chronique par une
droite en utilisant la méthode des moindres carrés.
5. Au vu des résultats, quelles prévisions pouvait-on faire fin 2005 pour janvier-févr ier,
mars-avril et mai-juin 2012.
Exercice 46
Voici pour ses trois premiers mois d’ouverture, le nombre de places yt vendues par semaine par
le cinéma PARADISO (t désignant le numéro de la semaine varie de 1 à 12) :
t 1 2 3 4 5 6 7 8 9 10 11 12
Yt 3428 3295 3376 3195 3573 3334 3434 3300 3703 3411 3545 3327
Travail à faire :
1. Représentez cette chronique graphiquement. A-t-elle une composante saisonnière ? Si
oui, de quelle période ?
2. Calculez la suite des moyennes mobiles de longueur appropriée pour évaluer la tendance
de la série chronologique. Représentez cette suite sur le graphique précédent.
3. On choisit un modèle multiplicatif. Évaluez les coefficients saisonniers.
4. Calculez la série corrigée des variations saisonnières (série CVS) et représentez-la sur
le graphique précédent. Calculez la série des résidus.
5. Ajustez la série CVS par une droite en utilisant la méthode des moindres carrés.
Représentez cette droite sur le graphique précédent.
6. Donnez une prévision pour le nombre de places vendues pendant les deux premières
semaines du quatrième mois.
MOHAMMED QMICHCHOU 88
STATISTIQUE DESCRIPTIVE 2015
MOHAMMED QMICHCHOU 89
STATISTIQUE DESCRIPTIVE 2015
a. Calculer la Tendance ;
b. Calculer les coefficients saisonniers ;
c. Calculer l’aléa ;
d. Déterminer la série Corrigée des Variations Saisonnières.
MOHAMMED QMICHCHOU 90
STATISTIQUE DESCRIPTIVE 2015
1. Calculez l’indice des prix de Laspeyres en 2010 base 100 en 2009. Interprétez.
2. A prix constant (base 2009), quelle est l’augmentation des quantités entre 2009 et 2010 ?
Quel indice connu avez-vous calculé ?
3. Calculez l’indic²e des quantités de Paasche en 2010 base 100 en 2010. Interprétez.
4. A quantités constantes (base 2010), quelle est l’augmentation du prix des biens entre
2009 et 2010 ? Quel indice connu avez-vous calculé ?
MOHAMMED QMICHCHOU 91
STATISTIQUE DESCRIPTIVE 2015
SUJETS D’EXAMENS
Année : 2012-2013
Licence fondamentale : SEG
Semestre : II
Session : Normale
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 2 Heures
Professeur : QMICHCHOU Mohammed
MOHAMMED QMICHCHOU 92
STATISTIQUE DESCRIPTIVE 2015
Année : 2012-2013
Licence fondamentale : SEG
Semestre : II
Session : Rattrapage
Date : Vendredi 21/06/2013
Matière : Statistique descriptive
Durée : 1h30mn
Professeur : QMICHCHOU Mohammed
Nous disposons des 2 tableaux suivants donnant les prix et les quantités à la vente de 4 produits
observés à 3 dates différentes :
Tableau 1: Prix Tableau 2: Quantités
T0 T1 T2 T0 T1 T2
P1 120 125 135 P1 230 210 200
P2 80 90 70 P2 170 180 190
P3 15 12 18 P3 500 500 500
P4 35 40 42 P4 340 320 250
Travail à faire :
Rappeler la signification et l’utilité des indices statistiques. (2 Pts)
Donner les formules de calcul des paramètres statistiques suivants : (2 Pts)
Paramètre Formule
Variation absolue
Taux de croissance (en
%)
Taux de croissance
moyen
Indice élémentaire
Présenter, dans un tableau unique, la distribution des prix et quantités des 4 produits en T1.
Qu’appelle-t-on cette distribution ? (2 Pts)
Déduire la distribution des valeurs des 4 produits en T1. (2 Pts)
Calculer et interpréter, dans le tableau suivant, les indices de LASPEYRES, PAASCHE et
FISHER des prix et des quantités. (12 Pts)
Application
Indice Formule Résultat Commentaire
numérique
𝐿(𝑃)T1⁄
T0
𝑃(𝑃)T1⁄
T0
𝐹(𝑃)T1⁄
T0
𝐿(𝑄)T2⁄
T1
𝑃(𝑄)T2⁄
T1
𝐹(𝑄)T2⁄
T1
MOHAMMED QMICHCHOU 93
STATISTIQUE DESCRIPTIVE 2015
Année : 2013-2014
Licence fondamentale : SEG
Semestre : II
Session : Normale
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 2 Heures
Professeurs : QMICHCHOU M., EL HARAOUI I.
Exercice 1 (4 Points) :
Donnez la signification des concepts de statistique descriptive suivants :
Concept Signification
Population
Caractère
Modalités
Effectif
Exercice 2 (4 Points) :
1. Donnez les catégories de variables et spécifiez les types de chacune. (2 PTS)
2. Donnez quatre exemples de domaines d’application de la statistique descriptive. (2
PTS).
Exercice 3 (12 Points) :
Répartition du CA des entreprises dans une zone franche X
CA en million de Dhs Effectif (ni)
[5 - 10[ 55
[10 - 15[ 110
[15 - 35[ 185
[35 -50[ 54
[50 - 80[ 47
Total 451
MOHAMMED QMICHCHOU 94
STATISTIQUE DESCRIPTIVE 2015
Année : 2013-2014
Licence fondamentale : SEG
Semestre : II
Session : Rattrapage
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 1h30mn
Professeurs : QMICHCHOU M., EL HARAOUI I.
2012 2013
Année/Produit
P2012 Q2012 P2013 Q2013
A 18 10 25 6
B 15 6 19 4
C 12 4 13 3
D 7 2 9 2
MOHAMMED QMICHCHOU 95
STATISTIQUE DESCRIPTIVE 2015
BIBLIOGRAPHIE
WEBOGRAPHIE
www.er.uqam.ca/nobel/r30574/PSY1300
www.apprendre-en-ligne.net/MADIMU2/STATI/COMPLET.PDF
www.nymphomath.ch
www.ebsi.umontreal.ca
http://tice.inpl-nancy.fr/modules/unit-stat/
www.hcp.ma
www.insee.fr
MOHAMMED QMICHCHOU 96
STATISTIQUE DESCRIPTIVE 2015
Boîte à moustaches (boxplot) : Graphique résumant l'information fournie par l'étendue, ainsi
que par les trois quartiles et les intervalles qui les séparent.
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités,
s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que
moyenne, somme, ..., n'ont pas de sens.
Caractère quantitatif : Une variable statistique est quantitative si ses valeurs sont des nombres
sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens.
Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les
individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative.
Centiles : Les centiles C1, C2, ..., C99 divisent une série statistique en 100 parties d'effectifs égaux.
Classe modale : C'est la classe correspondant au maximum de l'histogramme, dans le cas d'une
distribution continue unimodale.
Classes : Intervalles de valeurs d'une variable continue, l'ensemble des classes formant une
partition de l'ensemble des valeurs possibles de la variable. Par exemple, si tous les salaires des
employés d'une entreprise se situent entre 750 et moins de 3 000 MAD, on peut construire (par
exemple) les classes : [750 - 900 [, [900 - 1 500 [, [1 500 - 2 250 [, [2 250 - 3 000 [, Chaque valeur
observée de la variable doit appartenir à une classe et une seule.
Coefficient de variation : Ecart-type divisé par la moyenne arithmétique. Cette mesure relative de
dispersion s'exprime généralement en %.
Déciles : Quantiles d'ordre 1/10, 2/10, ..., 9/10 ; ces 9 quantiles partitionnent la série statistique
ordonnée en 10 groupes contenant chacun (environ) 10% des observations.
MOHAMMED QMICHCHOU 97
STATISTIQUE DESCRIPTIVE 2015
Dispersion : Un paramètre statistique est dit de dispersion s'il s'agit d'un nombre clé résumant la
plus ou moins grande disparité des observations, leur plus ou moins grande variabilité de part et
d'autre de la tendance centrale : étendue, écart-type sont des paramètres de dispersion.
Distribution (ou répartition) des individus selon une ou deux variables : Tableau (croisé s'il
y a deux variables) des valeurs d’une (ou deux) variables avec les effectifs correspondants.
Distribution groupée (D.G.1) : Une distribution groupée se construit à partir d'une série
statistique en regroupant les observations de la série dans un certain nombre de classes et en
associant à chaque classe son effectif, c'est-à-dire le nombre d'observations de la série qu'elle
contient. Distribution observée (D.O.1) : Une distribution observée se construit à partir d'une série
statistique en faisant la liste des valeurs distinctes qui apparaissent dans la série statistique et en
associant à chaque valeur distincte son effectif, c'est-à-dire le nombre de fois que la valeur apparaît
dans la série.
Distribution marginale : Distribution d'une variable statistique, obtenue dans la marge d'un
tableau de contingence, en ajoutant les effectifs, ligne par ligne, ou colonne par colonne.
Distribution : Ensemble des valeurs, modalités ou classes d'une variable statistique, et des effectifs
ou fréquences associées.
Ecart médian absolu : Moyenne des valeurs absolues des différences entre les observations et
leur médiane.
Ecart moyen absolu : Moyenne des valeurs absolues des différences entre les observations et leur
moyenne arithmétique.
Effectif total : C'est le nombre d'observations, d'une série statistique brute, nombre d'individus de
la population étudiée.
Effectif : Nombre d’individus, d’une population ou d’une partie quelconque de cette population.
MOHAMMED QMICHCHOU 98
STATISTIQUE DESCRIPTIVE 2015
Etendue : Différence entre la plus grande et la plus petite des observations d'une série statistique.
C'est un paramètre de dispersion.
Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique
étudiée. Pour chaque individu, on dispose d'une ou plusieurs observations.
Médiane : Valeur typique qui se situe au milieu des observations rangées par ordre croissant ; il
s'agit du quantile d'ordre 1/2.
Mesure de dispersion : Valeur quantifiant globalement l'importance des écarts entre les
observations ou encore leur dispersion autour d'une valeur centrale.
Modalité : Les modalités d'une variable sont les différentes valeurs que peut prendre celle-ci.
Mode : Valeur ou modalité observée à laquelle est associé l'effectif le plus élevé.
Moyenne tronquée : Moyenne calculée après avoir éliminé de la série statistique la plus petite et
la plus grande observations.
Percentiles : Quantiles d'ordre 1/100, 2/100, ..., 99/100 ; ces 99 quantiles partitionnent la série
statistique ordonnée en 100 groupes contenant chacun (environ) 1% des observations.
MOHAMMED QMICHCHOU 99
STATISTIQUE DESCRIPTIVE 2015
Population statistique : Une population statistique est l'ensemble sur lequel on effectue des
observations.
Quantile : Le quantile d'ordre p (0<p<1) est une valeur partitionnant la série statistique ordonnée
en deux groupes, le premier contenant les (environ) np plus petites observations, le second
contenant les (environ) n(1-p) plus grandes observations.
Quartiles : Quantiles d'ordre 1/4, 1/2 et 3/4 ; ces 3 quantiles partitionnent la série statistique
ordonnée en 4 groupes contenant chacun (environ) 25% des observations.
Recensement : Recueil des valeurs de la totalité des individus de la population. Les valeurs
recueillies sont les données.
Série statistique (ou distribution observée) : Ensemble des modalités, valeurs, ou classes d'une
variable, avec les effectifs observés correspondants.
Série statistique : Une série statistique est obtenue par l'observation d'une variable
chez n individus (ou éléments, unités...) ; elle correspond à la liste des valeurs ou modalités prises
par la variable chez chacun des n individus.
Sondage, n-échantillon, base de sondage, taux de sondage : Un sondage est le recueil des
valeurs d’une partie (l’échantillon) d’effectif n (d’où l’expression n-échantillon) de la population
(dite base de sondage ). Le taux de sondage est le rapport n/N.
Statistique (ou paramètre statistique) : Tout nombre, calculé à propos d’une population, et qui
contribue à décrire un aspect de cette population, est une statistique. Fréquences, mé dianes,
quartiles, déciles, moyennes, variances, etc. sont des statistiques.
Tendance centrale : Un paramètre statistique est dit de tendance centrale s'il s'agit d'un nombre
clé autour duquel les observations sont réparties : mode, médiane, moyenne sont des paramètres
de tendance centrale.
Unimodale : Une distribution est unimodale si elle présente un maximum marqué, correspondant
à une valeur appelée mode.
Unité statistique (ou individu(s)) : Les individus sont les éléments de la population statistique
étudiée.
Valeur typique : Valeur quantifiant une certaine caractéristique (de position, de dispersion ou de
forme) d'une série statistique ou d'une distribution observée (D.O.1 ou D.G.1).
Variable (ou caractère) statistique, valeurs : Une variable est une information dont on recueille
(ou observe ou mesure) la valeur sur chaque individu. On parle de variable parce que la valeur de
l’information n’est pas la même d’un individu à l’autre. C’est à partir des valeurs observées que le
statisticien construit ses classements d’individus.
Variable continue : C'est une variable quantitative pouvant prendre par nature une infinité de
valeurs, généralement tout un intervalle réel.
Variable d’intérêt, variable explicative : Une variable est dite explicative si elle influence une
autre variable, dite d’intérêt c’est-à-dire qui fait l’objet de l’étude statistique. Une variable explicative
peut servir à stratifier la population.
Variable dichotomique : C'est une variable qualitative qui ne peut prendre que 2 modalités : OUI
ou NON ; masculin ou féminin ; bon ou mauvais, etc ...
Variable discrète : C'est une variable quantitative pouvant prendre par nature un nombre fini (ou
dénombrable) de valeurs.
Variable qualitative (ou caractère qualitatif) : Une variable statistique est qualitative si ses
valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations
arithmétiques telles que moyenne, somme, ..., n'ont pas de sens.
Variable qualitative nominale : C'est une variable qualitative dont les modalités ne sont pas
ordonnées.
Variable qualitative ordinale : C'est une variable qualitative dont les modalités sont naturellement
ordonnées selon un ordre total : on peut dire que selon un certain sens la modalité A est moins
forte que la B, qui est moins forte que la C, etc...
Variable quantitative (ou caractère quantitatif) : Une variable statistique est quantitative si ses
valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ...
ont un sens.
Variable statistique (ou caractère statistique) : C'est ce qui est observé ou mesuré sur les
individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative.
Variance corrigée : Somme des carrés des différences entre les observations et leur moyenne
arithmétique, divisée par n-1 (au lieu d'être divisée par n, le nombre d'observations, comme pour
la variance « classique »).
Variance : Moyenne des carrés des différences entre les observations et leur moyenne
arithmétique.