Cours de Statistique Descriptive
Cours de Statistique Descriptive
Statistique Descriptive
Chapitre 1 : Vocabulaire de base de la statistique descriptive
I- Aperçu historique sur l’évolution de la statistique
II- Eléments du vocabulaire statistique
Population ; Caractère, Echantillon, Recensement,…
III- Les procédés d’observation des séries statistiques
1- Recensement ou enquête exhaustive Caractère quantitatif
2- Enquête non exhaustive ou sondage
IV- Le dépouillement des observations
V- Groupement des données en classes
Chapitre 1
La statistique Descriptive peut être définie comme étant une méthode qui vise la
description quantitative des ensembles nombreux. Elle a pour but de recueillir, de présenter, de
résumer et d’analyser ou d’interpréter les données observées.
Elle est à la base de toute recherche scientifique. En effet, pour effectuer des analyses et
des calculs économiques, il est essentiel d’utiliser l’instrument statistique pour confirmer ou
infirmer les hypothèses, pour dégager les lois économiques et pour faire des prévisions.
L’objet de ce chapitre est de donner un aperçu historique sur la statistique, d’en préciser la
signification des concepts de base et d’en présenter les procédés d’observation.
I- Aperçu historique sur l’évolution de la statistique
Le mot statistique est apparu au XVII siècle avec l’émergence de deux écoles qui se
partageaient les disciples :
L’école descriptive allemande sous la conduite de Gottfried Achenwall et ;
L’école anglaise des arithméticiens politiques.
En fait depuis l’antiquité des dénombrements des populations humaines et des terres ont été
réalisés pour les besoins de la guerre et de l’impôt. Plus tard, l’introduction du calcul
mathématique va permettre d’exprimer les faits observés par des proportions et des rapports.
Enfin la statistique connaîtra son plein développement avec l’utilisation du calcul probabiliste.
Bernouilli (1654-1705) et Bayes (1702-1761) ont été parmi les premiers à avoir introduit la
probabilité en statistique. L’application des probabilités aux sciences économiques serait faite
principalement par L. Quetelet (1796-1874) qui organisa en 1853 à Bruxelles le premier congrès
de la statistique.
III- Eléments du vocabulaire statistique
Population : c’est l’ensemble des éléments statistiques. Elle est appelée aussi ensemble
statistique ou univers statistique.
Individu : c’est un élément de l’ensemble statistique. On l’appelle aussi l’unité
statistique. Exemples : Population : population du Maroc ; Individu : un marocain.
Population : les entreprises exportatrices ; Individu : une entreprise exportatrice.
Caractère : Dans l’étude d’une population, l’attention sera portée généralement sur un
aspect déterminé commun à tous ses éléments et appelé caractère. Si l’unité statistique
est l’étudiant par exemple, les caractères pourront être : sa nationalité, son âge, son
poids, sa taille, son sexe, son lieu de résidence, …
Modalités : Les modalités sont les différents états ou les différentes valeurs d’un
caractère. Si le caractère par exemple est l’état matrimonial, les modalités seront donc
au nombre de quatre : Célibataire, marié, divorcé, veuf.
La liste de toutes les modalités d’un caractère étudié est appelée une nomenclature.
Caractères qualitatifs : ce sont les caractères dont les modalités ne sont pas mesurables.
C’est le cas par exemple des caractères : Profession, Types d’activité, les goûts des
consommateurs,…..
Caractères quantitatifs : ce sont les caractères dont les modalités sont mesurables. C’est
le cas par exemple des caractères : Taille, Poids, Revenu, Dépenses de consommation…
Les modalités de ce type de caractère seront donc des nombres. Ces caractères peuvent
être désignés comme des variables et ils sont de deux types les variables discrètes et les
variables continues.
Les variables statistiques discrètes : une variable statistique est discrète ou discontinue
lorsque les valeurs possibles prises par cette variable sont des valeurs isolées, en général
des valeurs entières. Exemples : Le nombre d’enfant par ménage, le nombre de têtes de
bétail par exploitation,…..
Les variables statistiques continues : une variable statistique est continue lorsqu’elle
peut prendre toutes les valeurs d’un intervalle, autrement dit si ses valeurs possibles sont
en nombre infini. Exemples : l’âge des étudiants de la première année en section
économie, distances parcourues par les étudiants pour se rendre à la faculté, le revenu
mensuel des employés d’une entreprise, ….
Il s’agit de relever les données brutes en interrogeant les unités statistiques. Pour cela, on
a recours à un document dit questionnaire sur lequel seront relevées toutes les informations
sujettes de l’étude. On distingue deux types de procédés d’observation d’une population
donnée :
1- Recensement ou enquête exhaustive
C’est une opération qui consiste à observer et à traiter toutes les unités statistiques d’une
population donnée. Parmi les opérations du genre on peut citer le recensement général de la
population et de l’habitat réalisé au Maroc au bout de chaque décennie, le recensement
industriel, le recensement agricole, ….
2- Enquête non exhaustive ou sondage
C’est une opération qui consiste à observer une fraction de la population considérée.
Une telle fraction qui est appelée échantillon, doit être représentative de toute la population.
Exemples : Sondage d’opinions, Sondage de contrôle de la qualité, Sondage d’étude de
marché,…
Deux grands types de sondage sont connus :
a- Sondage par choix raisonné
Le sondage par choix raisonné consiste à prélever dans la population étudiée les éléments
qui sont représentatifs de l’ensemble. La sélection des unités ne se fait pas au hasard, mais
après réflexion de l’enquêteur que tel ou tel individu doit figurer dans l’échantillon.
Parmi les méthodes, dites par choix raisonné, deux sont couramment utilisées :
La méthode des unités types : elle consiste à sélectionner des unités dont les
caractéristiques sont les plus proches des valeurs moyennes de l’ensemble de la
population.
La méthode des quotas : c’est la plus célèbre et la plus employée des méthodes de
sondage. Elle consiste à bâtir un modèle réduit de la population étudiée, c-à-d un
échantillon qui comporte des unités statistiques en mêmes proportions que la population
mère pour des variables essentielles, comme l’âge, le sexe, la catégorie sociale. Les
enquêteurs choisissent eux mêmes les personnes à interroger en respectant, les quotas,
qui leur sont fixées
b- Sondage Aléatoire
Ce type de sondage consiste à ce que toutes les unités statistiques ont la même chance de
faire partie de l’échantillon. Cela nécessite la mise à jour d’une liste de l’ensemble des unités
statistiques de la population avant de procéder au tirage. Une telle liste est appelée base de
sondage.
IV- Le dépouillement des observations
Il s’agit de présenter de façon claire les renseignements bruts relevés sur les unités
statistiques dans les questionnaires. Cette exploitation des questionnaires (dépouillement)
s’effectue manuellement dans les cas les plus simples, ou par des machines spéciales
(machines mécanographiques, ordinateurs,…) dans les cas les plus compliqués.
1 //// //// // 12
2 //// // 7
3 //// / 6
4 /// 3
5 // 2
6 //// 4
La codification était faite par perforation sur des cartes de 12 lignes et 80 colonnes. Ces cartes
réalisées par des perforatrices et corrigées par des vérificatrices étaient alors confiées
premièrement à des machines appelées trieuses qui effectuaient des classements selon des
critères prédéfinis, ensuite à des tabulatrices pour la confection de tableaux et l’impression des
résultats.
Ce procédé mécanographique est aujourd’hui délaissé au profit des techniques
électroniques qui ont accompagnes le développement informatique. Celui-ci a concerné aussi
bien le Hardware (le matériel) que le software (les logiciels). Les logiciels de statistique sont
des programmes qui permettent la saisie et le traitement des données avec des gains en fiabilité,
en rapidité et aussi en coût. Parmi ces programmes nous pouvons Statgphrafics , Spss, Sas,
Chadoc, Systat etc..
De nombreuses fonctions statistiques sont également disponibles dans des logiciels à
caractère plus général comme les tableurs : Lotus123, Excel, Multiplan, Super Calc, … ou dans
des logiciels appelés gestionnaires de base de données tels Dbase, Access, FoxPro,..
de classes se traduira par une perte d’informations. L’une des deux méthodes empiriques
suivantes peut être utilisée pour déterminer le nombre de classe :
Formule générale
2K n
Formule de Sturges
K = 1 + 3,3 log n
On désigne par :
K : le nombre de classe
n : le nombre d’observations
log : le logarithme décimal
Détermination des amplitudes
Cas où les amplitudes sont égales
M m
a i
K
M : la modalité maximale
m : la modalité minimale.
Chapitre 2
Distributions statistiques et représentations graphiques
Après classement selon le caractère retenu, les observations forment une série distribution ou
statistique. Celle-ci met en correspondance les différentes modalités d’un caractère avec les n
Un caractère qualitatif peut être représenté par des diagrammes, circulaire ou semi-circulaire,
rectangulaires, en tuyaux d’orgues etc…
Célibataire
Marié(e)
Divorcé(e)
Veuf(ve)
Situation familiale
10% Célibataire
5%
Marié(e)
25% Divorcé(e)
60% Veuf(ve)
0,7
0,6
0,5
0,4
Série1
0,3
0,2
0,1
0
Chapitre 3
1- Le mode
Le mode d’une variable statistique est la modalité la plus fréquente dans la distribution. Il
correspond alors, à l’effectif ou à la fréquence la plus élevée. La détermination du mode se
diffère selon la nature du caractère. Ainsi, dans le cas des caractères qualitatifs ou discrets, le
mode est détecté par un simple regard du tableau des données, c’est la modalité du caractère
qui se répète le plus dans la distribution. Pour un caractère continu et dans le cas d’une
distribution uni –modale à classes égales, la détermination du mode se fait de la façon suivante :
1
M o I i ai
1 2
Dans le cas d’une distribution à classes inégales, les effectifs ou les fréquences utilisés dans
la dernière formule devront être remplacés par les effectifs ou les fréquences corrigés.
2- La médiane
La médiane est la valeur de la variable statistique qui partage en deux effectifs égaux les
individus de la population supposés rangés par ordre croissant ou décroissant du caractère.
Ainsi, la médiane d’une distribution statistique est la valeur de la variable qui partage l’effectif
total de la distribution en deux parties égales, telles que la première moitie des observations soit
inférieure (ou égale) à Me et la deuxième moitié soit supérieure (ou égale) à Me.
Si la variable est continue, on effectue une interpolation à l’intérieur de la classe médiane.
N
ni 1 cc 0,5 f cc
Me I i ai 2 I i ai i 1 où :
ni cc ni 1 cc f cc f cc
i i 1
i. ni-1cc (fi-1cc) : effectif (fréquence) cumulé de la classe précédant la classe
médiane;
ii. nicc (ficc) : effectif (fréquence) cumulé de la classe médiane ;
iii. N /2 et 0,5 : le rang de la médiane en terme d’effectif (respectivement de
fréquence) cumulé.
Les déciles, notés D1, D2, …, D10 (respectivement les percentiles, notés P1, P2, P3, …, P99)
partagent l’effectif total d’une distribution statistique rangée par ordre croissant (ou décroissant)
en dix (respectivement en cent) parties égales. D’après ce qui précède les relations suivantes
sont vérifiées : Me=Q2=D5=P50 ; D1=P10 ; D8=P80.
Les calculs faits pour la médiane sont donc les mêmes pour la recherche des quantiles.
3- La médiale
La médiale, notée ML, d’une série d’observations classées préalablement par ordre croissant,
est la valeur de la variable qui partage en deux la masse globale du caractère. La médiale se
calcule de la même manière que la médiane avec le rang ML= nixi/2
4- La moyenne
La moyenne arithmétique d’une variable statistique est la somme pondérée des valeurs des
k
modalités par leur fréquence relative. X f x i
i
i 1
La moyenne X est la plus rencontrée dans les études économiques. Ainsi, pour calculer le
revenu moyen, le chiffre d’affaires moyen, l’âge moyen, la taille moyenne, … on utilise X . En
plus de cette moyenne, il existe d’autres types de moyennes qui sont :
k
n i
a- La moyenne harmonique (H), H i 1
n
k
i
x i 1 i
La moyenne harmonique est utilisée dans le cas où on chercher à déterminer le prix moyen, le
rendement moyen, la vitesse moyenne, …
1 k
k
log G log x
n
N i 1 ni i
G N
i 1
xi
i
Cette moyenne est utilisée souvent en finance pour le calcul des taux moyens et taux
équivalents ou pour faire des extrapolations des problèmes évoluant de manière géométrique.
k
c- La moyenne quadratique (Q), Q f xi2
i 1
i
Chapitre 4
L’étendue d’une variable statistique est égale à la différence entre la valeur maximale et la
valeur minimale du caractère. Il est appelé aussi, intervalle de variation.
Iq
I q Q3 Q1 et I qr
Q2
ii. Les intervalles inter-déciles absolu (Id) et relatif (Idr)
Id
I d D9 D1 et I dr
D5
iii. Les intervalles inter- percentiles absolu (Ip) et relatif (Ipr)
Ip
I p P99 P1 et I pr
P50
4- L’écart absolu moyen e(x) et l’écart moyen relatif er(x)
k
e x
e x f i xi x et er x
i 1 2X
L’écart- type d’une variable statistique est la moyenne quadratique de ses écarts à la moyenne.
k
k
x
x V X f (x i i X ) 2 ; et CV .
i 1 X
Tous ces coefficients de dispersion seront nuls lorsque la distribution étudiée est égalitaire.
A moyenne arithmétique donnée, plus la dispersion des valeurs de la variable étudiée est forte,
plus la variance, l’écart type et le coefficient de variation seront importants. Plus ces mesures
sont faibles et s’approchent de zéro, plus la moyenne arithmétique est significative.
D’un autre côté, les mesures relatives de la dispersion permettent de faire des comparaisons de
dispersion entre deux ou plusieurs distributions.
a- Le coefficient de Yule
CY
Q3 Q2 Q2 Q1 et 1 CY 1
Q3 Q1
X Mo 3 X Me
C P1 CP 2
X X
et
c- Coefficient de Fisher
3
CF1 1
X
3
b. L’aplatissement
La concentration
La notion de la concentration a une importance particulière dans les études socio-
économiques notamment l’étude de la répartition des revenus. Ainsi, on parle de la
concentration des exploitations agricoles, du chiffre d’affaires, du pouvoir, du revenu…etc.
L’évaluation de la concentration se base sur un graphique, appelé courbe de concentration de
Lorenz, ainsi que sur un l’indice de Gini.
Cette courbe met en relation les fréquences cumulées croissantes en pourcentage (ficc en %)
et la masse globale du caractère cumulée croissante en pourcentage (fixicc en %)
Courbe de Lorenz
100
90
80
fi Xi cc en %
70
60
50
40
30
20
10
0
0 20 40 60 80 100 120
ficc en %
Aire de concentration
Trapèze élémentaire (l’aire S3)
Indice de concentration de Gini (iG) est égal au rapport entre aire de concentration et l’aire du
triangle se trouvant au-dessous de la diagonale.
Aire de concentration S
i G
1
Aire du triangle au dessous de la diagonale 5000
où S=S1+S2+S3+S4+S5.
S3= (Petite base + Grande base). Hauteur/2
Chapitre 6
Analyse des séries statistiques à deux dimensions
Contrairement à l’analyse unidimensionnelle de la population où celle-ci est étudiée
selon un seul caractère, le traitement statistique se fera maintenant sur la base de deux
caractères X et Y. Ces séries statistiques doubles seront pondérées ou non et sur lesquels nous
pouvons mener différentes analyses suivant le besoin.
Deux points sont à traiter dans ce chapitre, le tableau de contingence et la corrélation.
Y y1 y2 ... yj … yp Colonne
marginale
X ni.
x1 n11 n12 … n1j … n1p n1.
x2 n21 n22 … n2j … n2p n2.
… … … … ... … … …
xi ni1 ni2 … nij … nip ni.
… … … … … … … …
xk nk1 nk2 … nkj … nkp nk.
Ligne
marginale n.1 n.2 … n.j … n.p N=n..
n.j
2- Distributions marginales
Le tableau de contingence, présenté précédemment, contient deux distributions marginales, la
variable X prise indépendamment du caractère Y et celui-ci pris indépendamment de X.
3- Distributions conditionnelles
La distribution conditionnelle X sachant que Y=yj (notée X/ Y=yj) est constituée par les
individus possédant la modalité yj et toutes les modalités de X.
Ainsi, à partir du tableau précédent, on compte 2 distributions marginales et autant de
distributions conditionnelles qu’il y a de modalités de X et de Y.
4- Indépendance de caractères
k p
n ( x ij i x )( y j y ) k p
Cov( X , Y ) i 1 j 1
f xy i
xy
N i 1 j 1
ij j
Si pour chaque individu i on observe un couple d’observation (xi,yi), c’est à dire i=j=1,2,..,k ;
alors la cov(X, Y) sera :
k
n (x i i x )( yi y ) k
Cov( X , Y ) i 1
fi xy i
xy
N i 1
j
Une covariance positive indique que les deux caractères varient dans le même sens ;
alors que si elle est négative les deux variables évoluent en sens contraire.
2- L’ajustement
Dans ce point nous allons essayer de déterminer la forme de la fonction f qui ajuste au
mieux les observations (xi,yj). Il s’agit d’établir une relation entre Y et X qui peut être de
forme linéaire ou non linéaire. Quand cette forme s’avère analytique, la méthode utilisée pour
réaliser l’ajustement (détermination des coefficients de régression) est la méthode des
Moindres Carrés Ordinaires (MCO). Cette dernière consiste à minimiser la somme des carrés
des écarts des points observés à la courbe de régression.
a- MCO
On appelle la droite des (MCO) du nuage de points (X,Y), la droite d’équation :
y ax b , telle que la somme
k
( y
i 1
j
(axi b)) 2 soit minimale
La droite des MCO est la droite qui s’ajuste aux mieux (c-à-d l’écart moyen entre yi et
axi+b est le plus faible) au nuage de points (xi,yi)i=1,..,k.
( xi x )( yi y )
Cov( X , Y )
aˆ i 1
k
x2 bˆ y aˆx
(x
et
i x) 2
i 1
--------------------------------------------------------------------------------------------------------
Chapitre 5
Les indices statistiques
Les indices statistiques nous renseignent aussi bien, sur l’ordre de grandeur que sur
l’évolution d’une variable ou plusieurs variables soit dans le temps soit dans l’espace. Un
indice a pour objet de caractériser par un nombre unique la variation d’un élément ou d’un
ensemble d’éléments entre deux situations, une situation de base et une situation actuelle. Deux
sortes d’indices seront traités dans ce chapitre, les indices élémentaires et les indices
synthétiques.
G
G t
I t/0
ce rapport est un nombre indice sans unité de
G 0
mesure.
Remarques :
* Pour une interprétation aisée des valeurs prises par l’indice, il est d’usage de
l’exprimer en % :
G
G t
100
I t/0
on a ainsi un indice de base 100.
G 0
Exemple 2 : Selon la même source les exportations marocaines ont enregistrées 35,4
et 33,7 MDH respectivement en 1988 et en 1989. Calculer le taux de variation entre
les deux dates en considérant 1988 comme année de base.
Ip P
i
t
i
100 c’est l’indice prix du produit i
t/0
P 0
- L’indice de valeur est un indice faisant intervenir des grandeurs ‘‘dépense p.q’’
i i
v
i
pq
Iv 100 100
i t t t
t/0 i i i
v 0 pq0 0
b- La transférabilité ou la circularité
Un indice élémentaire est transférable car
I 0/t
I t / t ' I t '/ 0
c- L’enchaînement
I t/0
I t / t 1 I t 1 / t 2 I t 2 / t 3 ... I 2 / 1 I 1 / 0
d- Autres propriétés
- L’indice d’un produit est le produit des indices
- l’indice d’un rapport est le rapport des indices
L
G i i
t/0 0
t
i 0 k
0
c’est le poids relatif de Gi dans
G i 1
G
i
0
0
i 1
p q t
i
0
i
Lp i 1
k
100
p
t/0
0 0
i q i
i 1
p 0
i qit
Lq i 1
k
100
p
t/0
0 0
i q i
i 1
p q t
i
t
i
Lv t/0
i 1
k
100
p q
i 1
0
i
0
i
2- Indices de Paâsche
Considérons un ensemble G formé des grandeurs Gi avec i =1,2,3,…,k.
i
G
i
t
1 , avec
k
G
G
0
P t/0 i
i
G
k i
0 t
t i i 1
G
i 1
t
Pq i 1
k
100
pit qi0
t/0
i 1
Pv t/0
i 1
k
100
pi0 qi0
i 1
3- Indices de Fisher
Cet indice est la moyenne géométrique des indices de Laspeyers et de Paâsche.
G G G
F t/0 L P t/0 t/0
Chapitre 7
Les séries chronologiques
Une série chronologique ou chronique est une suite d'observations d'un phénomène au cours
du temps. La statistique des importations trimestrielles constitue une série chronologique, de
même que l'évolution mensuelle de l’indice du coût de la vie, ou encore du chiffre annuel de
la production intérieure brute.
Une série chronologique qui retrace l’évolution d’une variable statistique est une série à deux
dimensions dont l’un est le temps.
Nous pouvons avoir facilement accès à un grand nombre de séries intéressantes, soit d'origine
national (les statistiques des différents ministères ou de la Direction des Statistiques) soit
d'origine internationale (les statistiques de l’UE ou de l’OCDE). Mais ces données ne sont
généralement pas utilisables en ‘‘état brut’’ ; la formalisation puis le traitement des séries
chronologiques sont deux étapes préalables à leur utilisation, surtout, en matière de prévision.
Cette composante recouvre toutes les fluctuations qui surviennent irrégulièrement. Il s’agit
des fluctuations attribuables soit aux fêtes religieuses mobiles car liées au calendrier de
l’Hégire, soit aux élections, à la coupe du monde, aux jeux olympiques, aux grèves, etc..
La valeur observée à la date t de la variable étudiée, Yt ,est fonction des valeurs prises à
cette même date par les diverses composantes : Yt = f(Tt , Ct, St, Rt, ). Deux schémas de
composition principaux sont étudiés : le modèle additif et le modèle multiplicatif.
a- le modèle additif:
Dans ce modèle, la valeur Yt est la somme des valeurs prises par les différentes composantes:
Yt = Tt + Ct+ St + Rt
On constate que, dans ce modèle additif, l'effet d'une variation de l'une quelconque
des composantes sur Yt est indépendant de la valeur prise par les autres
composantes.
b- le modèle multiplicatif :
Yt= Tt x Ctx St xRt
Mais ce modèle multiplicatif peut être traduit sous forme additive si l'on utilise les
logarithmes avec :
Log Yt = Log T t+ Log Ct + Log St + Log Rt.
Traiter une série chronologique consiste à mettre en évidence ses différentes composantes
à l'aide d'une procédure de décomposition donnée.
Plusieurs techniques sont utilisées pour dégager l’évolution à moyen terme du phénomène,
c'est-à-dire la combinaison de T et de C. Une fois cette opération réalisée, il devient possible
de déterminer la valeur des coefficients saisonniers, de même que de la composante résiduelle.
1- Détermination du trend-cycle (T x C) ;
Y t at b
Avec,
k
cov(t , y )
t y Nt y
i i
a i 1
k
t
V (t )
Nt
2 2
i
i 1
et
b y at
1
m 3(y y y )
1 1 2 3
1
m 2
(y y y)
3 4 5 6
1
m 3
(y y y)
3 7 8 9
... y )
1
M 1
(y y y
p 1 2 3 p
1
M2 (y
p 2
y y
3 4
... y )
p 1 etc…
y t i
M t
i 0
, avec, t=1,2,…n
p
1 yt 2 y
M t
4 2
yt 1 yt yt 1. 2 t 2
1 yt 1 y
M y t 1
t
2 2 t 2
Pour une série de données mensuelles, les moyennes mobiles
pondérées seront de la forme :
1 yt 6 5 5 yt 6
M y y
t
12 2 i 1
t i
i 0
t 1 2
= Yt / Sj.
Cas du modèle additif
Ycvs = Y t- Sj
Y (Mdh) 1 2 3
X (Mdh)
2 1 0 0
4 0 2 0
6 2 0 1
8 0 3 1
Exercice 1 :
Dans une administration, les fonctionnaires sont sollicités à répondre à un
questionnaire. Les questions concernent leur situation familiale, le nombre de personnes à
charge, le salaire mensuel perçu, le nombre de jours d'absence par an , leur sexe, la distance
qui sépare le lieu de travail de leur domicile, les conditions de travail (mauvaises, acceptables,
bonne, excellente), leur âge et leur poids.
1- Identifier et définir chacun de ces caractères.
2- Indiquer deux modalités pour chacun de ces caractères.
3- Les réponses relatives au nombre de jours d'absence par année et par fonctionnaire se
présentent comte comme suite :
13 - 11 - 8 - 9 - 4 - 9 - 11 - 5 -1 - 0 - 5 - 6 - 9 - 12 - 11 - 5 - 8 - 19 - 11 - 0 - 0 - 3 - 8 - 6 - 2 -
3 - 6 - 8 - 4 - 3- 2- 4 -8 - 12 - 15-16 - 13 - 14 - 4 - 3 - 6 - 19 - 8 -9-5 - 12 - 13 - 19 - 20 - 5 -
19 - 3- 14 -3 - 2 -1 - 8 -16 - 13 - 15 -5- 9- 1- 1- 5- 15 -3 -7- 6 - 9- 6- 4 -5- 6 -8-
9- 3 - 14 - 5 - 4- 13- 11- 12- 6- 13- 16- 20- 6- 5- 4 -3-14 -7- 8 -14 -12-16-5-19-20.
Exercice2:
Une enquête a été réalisée par la direction de la statistique auprès de 6000 jeunes dont
l'âge est compris entre 13 et 34 ans.
Les deux variables retenues par l'enquête sont le milieu d’habitations (urbaines ou rurales) et
l'activité.
Sur l'ensemble de la population étudiée :
- l'artisanat occupe 29% de citadins et 10% des ruraux ;
- un jeune sur cinq en ville travaille dans une administration ou dans un établissement
public contre deux sur cent jeunes ruraux;
- les exploitations agricoles emploient 11% de ruraux contre 1% des urbains ;
- 9% des urbains travaillent dans la grande entreprise contre 1% dans la compagne ;
- la petite et moyenne entreprise emploie 14% des jeunes actifs urbains et 3% des jeunes
actifs ruraux.
1- Déterminez :
la population statistique ;
l’individu statistique ;
le caractère statistique.
2- Présenter le tableau des effectifs et des fréquences.
3- Représentez graphiquement ce caractère.
4- Commentez.
Exercice 3 : On considère les salariés d’une entreprises que l’on classe en fonction du salaire
mensuel en dirhams. Les résultats de l’observation figurent dans le tableau ci-dessous :
Exercice 4 :
Les températures moyennes mensuelles enregistrées durant les années 1999 et 2000 dans une
ville marocaine se présentent comme suit :
Exercice 6 :
Les revenus annuels de 200 ménages sont présentés dans le tableau suivant :
[b2 - 40[ 48
[40-50[ n3
[50-56[ n4
[56-68[ 20
Total N
1- Le 3ième quartile étant égal à 51.103 DH, démontrer que: n3=46 ménages et n4=36 ménages.
2- Si la moyenne arithmétique est égale à 37,04.103 DH, quelle sera la valeur de la borne b2 ?
3- Calculer le mode et la médiane.
Exercice 7 : Une société de financement propose une ligne de crédit dont le remboursement est
étalé sur 20 ans. L'obtention de ce genre de crédits est régie par le système des intérêts composés
selon les conditions suivantes :
- un taux annuel de 7,5% appliqué sur la première période de 2 années ;
- un taux annuel de 11% appliqué sur la 2ième période de 4 années ;
- un taux annuel de 14% appliqué sur la 5ième période de 6 années ;
- un taux annuel de 16% appliqué sur la dernière période.
Déterminer le taux d'intérêt annuel moyen se rapportant à ce genre de crédits.
Exercice 8 : Les importations de pétrole brut ont évolués de la façon suivante au cours des
années 1974 à 1979 :
Années Pourcentage de variation par rapport à
l’année précédente
1974 -3,8
1975 -18,3
1976 +14,2
1977 -3,1
1978 -1,5
1979 +8,9
1- Calculez le taux annuel moyen de variation des importations de pétrole brut au cours de la
période considérée. Quel type de moyennes ce calcul fait-il intervenir ?
2- Sachant par ailleurs que le taux moyen d’augmentation des importations de pétrole brut a
été de 9,2% par an pour la période 1949-1962 (13 années) et de 12,4 % par an pour la
période 1962-1973
(11 années), calculez le taux annuel moyen de variation des importations de pétrole brut au
cours de la période 1949-1973. De quel type de moyennes s’agit-il ?
Exercice 9 :
Soit une population de 75 millions qui a crû au taux annuel de 15 %, quelle était cette
population il y a 15 ans ?
Exercice 10 :
Une plante aquatique quadruple de taille tous les 4 ans.
1- Quel est son taux de croissance global sur la période ?
2- Quel est son taux de croissance annuel moyen ?
Exercice 11 :
Un infirmier possède 16 écuries de forme carré : de 20 m de côté pour les 4 premières,
de 22 m pour les 5 suivantes, et de 30 m pour les 7 dernières.
1- Quelle est la dimension du côté moyen ?
2- Quelle est la dimension de l’écurie moyenne dont la surface est la surface moyenne des
15 écuries ?
Exercice 12:
Le nombre d'actionnaires d'une entreprise cotée en bourse présente un caractère
saisonnier. Les rapports au trend (les coefficients partiels) sont donnés dans le tableau suivant :
Trimestre 1 2 3 4
Année
1998 1,05 1,78 0,50 0,81
1999 0,97 0,98 0,76 0,35
2000 0,76 1,11 0,58 1,05
2001 0,97 1,41 0,78 1,16
Sachant que l'équation de la droite d'ajustement, obtenue par la méthode des moindres carrés
exprimant le nombre d'actionnaire par rapport au temps, est donnée par :
Y = 2,8t+116,5
Exercice 13:
4 biens A, B, C et D sont achetés aux prix p et aux quantités Q suivants:
1- Calculez les indices de prix de Laspeyres L(p) et de Paâsche P(p). Comparez ces deux indices
et interprétez.
2- Calculez l'indice quantité de Laspeyres L(q). interprétez.
Exercice 14 :
L’indice des prix à la consommation est obtenu à partir de 4 groupes de biens B1, B2, B3
et B4 dont les dépenses de consommations représentent respectivement en 2000 : 24% ; 36%,
26% et 14% du budget des ménages considérés.
En 2001, les prix des biens du groupe B1 ont connu une augmentation de 20%, ceux du
groupe B2 ont augmenté de 15,5%, les prix du groupe B3 sont à l’indice 94 et ceux du dernier
groupe B4 sont à l’indice 106 (année de base 2000).
1- Déterminez les indices élémentaires des groupes B1,B2 ,B 3 et B4 en 2001 (année de base
2000).
2- Déterminez l’indice de Laspeyers des prix en 2001 année de base 2000.
Exercice 15:
L'évolution du nombre d'actionnaires d'une entreprise nouvellement cotée en bourse se
présente comme suit :
Trimestre 1 2 3 4
Année
1998 125 217 63 104
1999 127 131 103 49
2000 108 161 85 158
2001 140 220 124 187
Exercice 16:
Le directeur commercial du Groupe BETA vous a chargé de lui établir une liaison entre le
bénéfice (Y) et le chiffre d'affaires (X). Pour vous faciliter la tache, il vous a donné les informations
suivantes :
Le groupe est composé de 30 entreprises ;
Le coefficient de corrélation r(X,Y)=0,98 ;
Les écart-types (X)=2,64 (Y) ;
Le bénéfice total réalisé par le groupe est égal à 33 millions de DH et le chiffre d'affaires a
atteint une somme totale de 132 millions de DH.
1- Déterminez l'équation de la droite de régression de Yen X par la méthode des moindres carrés
ordinaires.
2- Quel serait le bénéfice réalisé par une entreprise si elle a pu faire 2 millions de DH de chiffre
d'affaires?
Exercice 17 :
Une entreprise spécialisée dans l’habillement consacre X DH pour la
rémunération de ses 200 salariés. Les dépenses salariales de l’entreprise se
présentent comme suit :
X ( en 103 DH ) Effectif
[1-2[ 30
[2-3[ 50
[3-4[ 64
[4-6[ 42
[6-10[ 14
Total 200
Exercice 18 :
Afin de bien connaître sa clientèle, une entreprise a réalisé un
sondage. Parmi les informations collectées, la répartition par âge des clients :
Age Moins de 30 [30-40[ [40-50[ [50-60[ 60 et plus
Proportion 17 22 28 15 18
en %
Le gérant a constaté que la clientèle est formé des gens adultes et que l'âge maximum est de 80 ans.
1- Construire l'histogramme et le polygone des fréquences.
2- Déterminer le mode.
3- Calculer la médiane.
4- Déterminer la variance à l'aide d'une variable auxiliaire.
5- Calculer la dispersion de cette série.
6- Calculer la médiale.
7- Calculer l'indice de concentration de cette série. Interpréter.
Exercice 19: Une machine produit automatiquement des composantes électroniques de forme circulaire.
A la sortie de cette machine, on a effectué 30 mesures des diamètres et on a obtenu les résultats suivants
en millimètres :
90,2 90,1 89,9 89,9 90,1 90,1 90 90,1 90,2 90 89,6 90 90,1 89,8 90
90 90,1 90,3 90 89,7 90,1 89,9 90 89,8 89,9 90 90,4 89,9 90 89,9
1- Dresser à partir de ces données, le tableau statistique (modalités, effectifs, fréquences,. ..)
2- Compléter le tableau précédent par les colonnes nécessaires aux calculs des statistiques suivantes:
mode, médiane, moyenne et écart-type.
3- Interpréter les résultats obtenus et préciser la forme de la distribution.
Exercice 20:
200 entreprises qui travaillent dans le secteur de l'habillement consacrent X milliers de
dirhams (mDH) pour la publicité et réalisent Y millions de dirhams (MDH) comme bénéfice
annuel. Une étude de ce secteur a révélé les informations suivantes :
[0-20[ 12 8 6 4
[20-30[ 6 28 10 6
[30-40[ 2 40 16
[40-60[ 0 2 12 28
[60-100[ 0 0 4
1- Déterminer et , sachant que 21,5% des entreprises ont pu réaliser un bénéfice annuel compris
entre 1 et 2 millions de dirhams et 7,5% des entreprises ont consacré pour la publicité un budget
annuel compris entre 60 et 100 mille dirhams.
2- Si maintenant =6 et =10.
a- Calculer la moyenne et l'écart- type de X .
b- Calculer le mode et la médiane de X.
c- Interpréter et commenter ces résultats.
3- Soit la série double (X, Y).
a- Calculer les moyennes et les variances marginales.
b- Déterminer la droite de régression de Yen X
c- Calculer le coefficient de corrélation linéaire. Conclure.
d- Une firme de ce secteur consacre 4000 dirhams par mois pour sa publicité. Donner une
estimation de son bénéfice.
Exercice 21:
La mesure de la concentration d'une substance dans le sang de 28 sujets a donné les
résultats suivants (en micro-gramme par litre (g/l))
30 30 24 38 40 41 30 41 30 27 41 30 40 50
38 17 24 17 24 40 38 30 24 40 38 38 30 27
Exercice n°1
Une entreprise spécialisée dans l’habillement consacre X dirhams (dh) pour la
rémunération de ses 200 salariés. Les dépenses salariales de l’entreprise se présentent
comme suit :
X(dh) Effectif
[1000; 2000[ 30
[2000 ; 3000[ 50
[3000 ; 4000[ 64
[4000 ; 6000[ 42
[6000 ; 10000[ 14
Total 200
Exercice n°2
En considérant un échantillon de 6 entreprises, un étudiant chercheur a mis en
relation les quantités demandées X d’un bien et son prix Y. Les résultats obtenus sont
les suivants :
Les entreprises Y X
Extra1 1,978 2,017
Extra2 2,114 1,763
Extra3 2,170 1,568
Extra4 2,322 1,342
Extra5 2,398 1,079
Extra6 2,519 0,954
Total 13,501 8,723
Exercice 1 : Une étude économétrique a porté sur la répartition des exploitations agricoles en fonction
du nombre de fellahs de la région Nord-Est. Les résultats obtenus sont les suivants :
On désigne par gi l’effectif des fellahs cumulé croissant en pourcentage ; et hi la fréquence cumulée
croissante des exploitations. Ainsi, nous pouvons lire que dans la région Nord-Est, 70% des fellahs
détiennent 20% des terres agricoles.
1- Sur un repère cartésien, représenter graphiquement la distribution en joignant les points de
coordonnées (gi, hi) ; i =1,…,8.
Qu’appelle-t-on la courbe ainsi obtenue ?
2- Quel est le pourcentage des exploitations détenues par 75% des fellahs ?
3- Quel pourcentage des exploitations se partagent les 20 % des fellahs les plus fortunés?
4- Quel est le pourcentage des fellahs dont les exploitations sont inférieures à la médiale?
5- Calculer l’indice de Gini et commenter.
Exercice 2 : Une fabrique produit deux type de pièce différentes. Sur une dizaine de jour, les ventes
journalières x et y, respectivement, de la 1ère pièce et de la 2ème, ont été comme suite :
x = 540 dh ; y = 785 dh
1- Calculer l’intensité de liaison entre les ventes journalières de la 1ère pièce et les ventes
journalières de la 2ème pièce. Commenter.
2- Quelle serait la valeur des ventes journalières de la 2ème pièce si celle de la 1ère est de 55 dh ?
Exercice 3: Une machine produit automatiquement des composantes électroniques de forme circulaire.
A la sortie de cette machine, on a effectué 30 mesures des diamètres et on a obtenu les résultats suivants
en millimètres :
90, 90, 89, 89, 90, 90, 90 90, 90, 90 89, 90 90, 89, 90
2 1 9 9 1 1 1 2 6 1 8
90 90, 90, 90 89, 90, 89, 90 89, 89, 90 90, 89, 90 89,
1 3 7 1 9 8 9 4 9 9
Exercice 1 : Pour connaître l’importance du Marketing dans le développement des entreprises, un jeune
chercheur a fait une étude portant sur le type de relation qui peut exister entre le chiffre d’affaires (X) et
les frais de publicité (Y). Pour cela, ce chercheur a pu collecter, auprès d’un ensemble d’entreprises, les
données relatives aux variables X et Y :
- Aucune entreprise n’a pu réaliser un chiffre d’affaires qui dépasse 20 millions de dh.
- Toutes les entreprises n’ont pas assez de moyens pour engager plus de 470 000 dh de frais de
publicité.
1- Construire le tableau de contingence.
2- Etudier la concentration, graphiquement et par le calcul, du chiffre d’affaires des entreprises.
Commenter.
Exercice2: La mesure de la concentration d'une substance dans le sang de 28 sujets a donné les résultats
suivants (en micro-gramme par litre (g/l))
30 30 24 38 40 41 30 41 30 27 41 30 40 50
38 17 24 17 24 40 38 30 24 40 38 38 30 27
1- Calculez 1a concentration moyenne et l'écart -type.
4- Donnez la valeur de l'étendue et Calculez le coefficient de variation.
5- Deux mois plus tard, le réexamen des mêmes sujets a donné une concentration moyenne de 54,8
g/l avec un écart-type de 9,4 g/l. Commenter
6- Calculer le coefficient d’aplatissement et le coefficient d’asymétrie de la distribution.
Interpréter.
Exercice 1 : La société ‘‘Zerda’’, des produits laitiers, a mis sur le marché un nouveau
produit, nommé ‘‘Rosa’’ dont la demande n’a cessé d’augmenter grâce notamment à la
politique des prix adoptée par l’entreprise et grâce aussi à une compagne publicitaire très
réussie. Ainsi, dans une petite ville de 10000 personnes et durant la première moitié de 2002,
le prix et la consommation du produit Rosa ont été comme suite :
6- Déterminez la demande totale que la société Zerda a satisfait dans cette petite ville, durant les
six premiers mois de 2002.
7- Calculez la dépense totale consacrée à l’acquisition du produit Rosa, durant la 1ère moitié de
2002.
8- Calculez le coefficient de corrélation linéaire entre le prix et la demande globale.
9- A combien estimez-vous la demande globale de décembre 2002, sachant que la baisse des prix
a continu à raison de 5% par mois. En déduire la demande en kilogramme par personne.
Exercice 2 : La production céréalière (PC) d’un pays a atteint 30millions de quintaux en 1991, année
qualifiée d’année de bonne pluviométrie. Après cette année et au bout de 6 ans, la production a triplé.
3- Quel est le taux d’accroissement annuel moyen de cette production?
4- Quel est le taux d’accroissement global de la production sur la période considérée?
5- Après 1997, la sécheresse a frappé ce pays à plusieurs reprises, causant une baisse notable dans
la production des céréales, comme le montre le tableau suivant :
Exercice 3: Les résultats d’une enquête, portant sur la répartition des salaires journaliers de 2000
ouvriers dans le secteur de la mécanique industrielle, ont révélé les informations suivantes :
Exercice 1 :
Exercice 2 :
En l’an 2001 et pendant chaque mois, le grossiste Essalmi a distribué à 5 détaillants d’un
village des kilogrammes d’un produit de nettoyage en quantités suivantes : 10, 10, 10, 10, 10.
En l’an 2002, la quantité mensuelle distribuée de ce détergent a fortement baissé au point
qu’Essalmi n’arrive à fournir à ces mêmes détaillants que les quantités suivantes : 0, 0, 0, 0, 10.
Calculer l’indice de concentration de la quantité de ce produit de nettoyage distribuée dans
ce village en 2001 et en 2002. Commenter les résultats obtenus.
Exercice 3 : La consommation annuelle d’un nouveau produit par les ménages d’un quartier
est fonction du prix selon le tableau suivant :
10- Calculer les indices élémentaires valeurs en considérant l’année 1996 comme base.
Commentaire.
11- Calculez la moyenne annuelle et l’écart-type de la dépense ménagère.
12- A combien estimez-vous la dépense des ménages en 2010 ? En déduire la dépense d’un ménage.
N.B. L’usage, strictement personnel, des calculatrices non alphanumériques est autorisé
Barème :1/4pts, 2/4pts, 3/3pts, 4/3pts, 5/6pts
Durée : 1h30
Exercice n°2 :
X est une variable aléatoire admettant la distribution géométrique de paramètre
p. Déterminez l’estimateur du maximum de vraisemblance de p à partir d’un
échantillon aléatoire simple [ x1, x2,...,xn ]
Exercice n°4 : L’équipe de contrôle de la qualité de l’entreprise GAMA est chargée de vérifier
la résistance à la chaleur des pièces fabriquées par l’entreprise en question. Cette résistance est
évaluée sur une échelle graduée de 0 à 200 et elle est considérée comme une variable normale.
Un échantillon de 26 pièces, examiné par les contrôleurs de la qualité, a fournit une
moyenne de 125 et un écart-type de 10.
a- Déterminez des intervalles de confiance pour la résistance moyenne et la variance de la
population, au niveau de confiance 0,98. Commentez.
b- A quel niveau de probabilité peut-on dire que la résistance moyenne se situe entre 120
et 130. Commentez.
Exercice n°5 :Le tableau suivant est relatif à la distribution observée des différences Di de
prix d’une denrée à deux époques différentes, relevées auprès de 100 commerçants de la
région orientale.
Di -2 -1 0 1 2 3
Ni 4 15 30 35 10 6
Sachant que les données sont appariées, testez l’hypothèse d’égalité des prix moyens de la
denrée, aux deux époques considérées, au seuil de signification 0,02. Commentez.