0% ont trouvé ce document utile (0 vote)
26 vues39 pages

Stats Descriptives

Transféré par

7hwcvjywv4
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
26 vues39 pages

Stats Descriptives

Transféré par

7hwcvjywv4
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Année d’émission : 2024

Version – 2 GROUPE EM GABON-UNIVERSITE


EM-GABON BUSINESS SCHOOL (EMG-BS)

MODELE DE SYLLABUS ET SUPPORT DE COURS DETAILLE

Classe : Tronc commun


Niveau : Licence 1 Semestre : 1
Module : Statistiques descriptives
Volume horaire : 30 heures
Enseignant(s) : Messieurs NYEMECK Paul A., IBOUANA Hans Junior, AMEKOUVO
Noublasso, NDO ASSOUMOU Daniel, FOTSO Kamga et OBAME Obiang.
Profil de(s) l’enseignant(s) ……………………………………….…
Objectifs du cours : - Apprendre les principales techniques de statistique descriptive univariée et bivariée.
- Etre capable de mettre en œuvre ces techniques de manière appropriée dans un
contexte donné.
- Développer le sens critique nécessaire lors de la mise en œuvre de l’interprétation d’un
traitement statistique.
Prérequis : Mathématiques

Compétences - Compréhension de l’intérêt de la statistique descriptive.


acquises : - Traitement, analyse et interprétation des données statistiques.
Plan du cours : - Chapitre 1 : Les concepts de base
- Chapitre 2 : Présentation des résultats sous forme de tableau et calcul de
fréquences
- Chapitre 3 : Représentation graphique des distributions statistiques
unidimensionnelles
- Chapitre 4 : Les caractéristiques de tendance centrale ou de position
- Chapitre 5 : Les caractéristiques de dispersion
- Chapitre 6 : Les indices statistiques
- Chapitre 7 : Les méthodes d’ajustement
Type de - Cours magistral.
séances (CM-TD-TP) - Séances de travaux dirigés.

Types d’examen Intra et final


prévus (justifier le
choix dans le cas où
un travail de terrain
ou un exposé est
nécessaire) :

Les références 1- WALDER Masiéri, statistique et calcul des probabilités, Dalloz, Paris, 2001
(bibliographie et/ou 2- Anderson-Sweeney-Williams, Statistique pour l’économie et la gestion, 4e édition
webographie) : française de la 6e édition américaine par Claire Borsenberger, De boeck, Paris, 2013.
3- GIARD Vincent, statistique appliquée à la gestion, 8e édition, Economica, Paris, 2.
4- Abdnasser Chekroun, 2018, « Statistiques descriptives et exercices », NBER,
working paper, n°20893 Janvier 2015.
5- Blard-Laborderie. J. (2015), « L’essentiel des outils de statistique descriptive pour
aborder des études en Sciences humaines et sociales », 2015.
6- Dodge Y. (2003), « Premiers pas en statistique », Springer.
Chapitre 1 : LES CONCEPTS DE BASE
Dans le langage courant le mot « statistiques », au pluriel, désigne des collections de chiffres,
présentées souvent sous formes de tableaux, parfois sous formes de graphiques, et qui regroupent
toutes les observations effectuées sur des faits nombreux, relatifs à un même phénomène.

Il est bien certain qu’une pareille définition ne saurait suffire. Le statisticien, placé en face de
ces relevés chiffrés, devra les examiner de plus près, « de manière à obtenir des rapports
numériques sensiblement indépendants des anomalies du hasard et qui dénotent l’existence de
causes régulières dont l’action s’est combinée avec celle des causes fortuites ».

Nous pourrons alors dire que la « Statistique », au singulier, sera constituée par l’ensemble
des procédés ou des méthodes qui auraient pour but l’étude mathématique des statistiques.

Si nous retenons ces deux définitions du terme « statistique » nous dirons que la Statistique
est l’outil avec lequel on travaille une matière première constituée par les statistiques.

1) Définitions

Population statistique ou ensemble statistique est l’ensemble des éléments considérés dans une
étude particulière. Par exemple l’ensemble des étudiants d’une école ou l’ensemble des employés
d’une entreprise.

Unité statistique ou élément statistique est un élément constitutif de la population statistique.


C’est donc l’ensemble des unités statistiques que l’on appelle la population statistique.

Caractères statistiques ce sont les propriétés des unités statistiques.


Lorsque le caractère n’est ni mesurable, ni repérable, il est dit qualitatif : la nationalité d’une
personne, sa situation matrimoniale…

Lorsque, au contraire, le caractère peut être mesuré (l’âge d’une personne, son revenu annuel…)
ou repéré (la température en un lieu à un instant donné), il est dit quantitatif (variable
statistique).

Dans le cas où les valeurs numériques que peut prendre une variable statistique sont des nombres
entiers (par exemple le nombre d’enfants à charge d’une personne), la variable est dite discrète
ou discontinue.

Dans le cas contraire, c’est-à-dire lorsque la variable statistique peut prendre pour valeur
numérique tout réel d’un intervalle de R, elle est dite continue : la taille d’enfants mesurée à
l’occasion d’une visite médicale.

Modalités sont des différentes situations dans lesquelles peuvent se trouver les caractères : âge
(moins de 20 ans).

Exemple 1 Répartition des étudiants d’une grande école selon la filière.

 Population statistique : l’ensemble des étudiants de cette grande école


 Unité statistique : un étudiant de cette grande école
 Caractère étudié : filière
 Modalités du caractère : Banque assurance, gestion des ressources humaines, logistique
et transport, comptabilité et gestion.
Exemple 2 Répartition des employés de l’entreprise ALPHA selon le nombre d’enfants à charge

 Population statistique : ensemble des employés de l’entreprise ALPHA


 Unité statistique : un employé de l’entreprise ALPHA
 Caractère étudié : le nombre d’enfants à charge
 Les modalités du caractère : 0 ; 1 ; 2 ; 3 ; 4 ; 5 ; 6.

2) Enquête statistique et dépouillement des données

L’enquête statistique est l’opération de base de la collecte des données. Cette enquête peut
porter sur l’ensemble de la population statistique. Dans ce cas, on parle de recensement, ou sur
une partie de cette population, on parle de sondage.

Les unités étudiées à l’occasion du sondage constituent un échantillon statistique.

a) Dépouillement dans le cas d’un caractère qualitatif


Le dépouillement consiste au décompte des unités statistiques considérées vis-à-vis du
caractère étudié.
Intéressons-nous par exemple à la statistique portant sur la catégorie
socioprofessionnelle de 30 employés d’un certain secteur d’activité. Le caractère qui est ici la
catégorie socioprofessionnelle, est un caractère qualitatif dont les modalités sont : Manœuvre,
Agent de bureau, Agent de maîtrise, Cadre moyen, Cadre supérieur. Pour faciliter le dépouillement,
établissons le code suivant : Manœuvre (1), Agent de bureau (2), Agent de maîtrise (3), Cadre
moyen (4), Cadre supérieur (5).

Les 30 personnes interrogés ont fourni les réponses suivantes : 4, 2, 1, 1, 5, 5,


2, 4, 1, 5, 2, 2, 3, 5, 3, 1, 1, 5, 1, 2, 2, 4, 2, 5, 5, 2, 2, 2, 3, 4.

Le dépouillement va consister à dénombrer combien, parmi les unités statistiques observées,


correspondent à la modalité répertoriées 1, à la modalité répertoriées 2, et ainsi de suite.
Manuellement, le dépouillement pourra se présenter de la manière suivante :
Catégorie Socioprofessionnelle Dépouillement Effectifs

Manœuvre (1) 6

Agent de bureau (2) 10

Agent de maîtrise (3) 3

Cadre moyen (4) 4

Cadre supérieur (5) 7

Total 30

b) Cas d’une variable statistique discrète


Dans ce cas, le dépouillement se fera de la même façon que dans le cas d’un caractère
qualitatif, étant entendu que les différentes modalités sont des valeurs numériques isolées.
c) Cas d’une variable statistique continue
Supposons, pour envisager le cas d’une variable statistique continue, que l’on ait pesé, à
l’occasion d’une compétition, 25 athlètes.
Les résultats sont les suivants, l’unité de poids retenu étant le kilogramme (kg) :
77,450 63,320 55,930 59,930 60,000
81,290 67,820 71,660 71,440 65,010
56,410 63,220 74,370 74,310 64,990
62,200 63,280 61,330 77,830 70,000
78,540 71,280 68,720 67,410 58,540

Dans pareil cas, pour pouvoir dresser une statistique, nous devons diviser le domaine de
variation de la variable en classes de valeurs, de préférence d’amplitude constante. Par exemple,
en prenant comme amplitude 5 kg, le dépouillement pourra se présenter comme suit :

Tranches de poids (en kg) Dépouillement Effectifs

Moins de 60 4

60 à moins de 65 7

65 à moins de 70 4

70 à moins de 75 6

75 à moins de 80 3

80 et plus 1
Total 25

CHAPITRE 2: PRÉSENTATION DES RÉSULTATS SOUS FORME DE


TABLEAU ET CALCUL DE FRÉQUENCES
2.1- NOTION DE TABLEAU

Un tableau est un ensemble de lignes et de colonnes. Mais cela ne suffit pas. Le tableau
doit présenter certaines caractéristiques.

2.1.1- Titres et sous-titres


Ils indiquent le contenu du tableau et se placent toujours au-dessus de celui-ci. Leur
principale qualité est la précision. Le titre est généralement libellé sous la forme suivante :
« Répartition (ou distribution) de telle population selon tel caractère ». Par exemple
: « répartition des employés de l’entreprise LAMBDA selon la catégorie socioprofessionnelle
».
2.1.2- Titres des lignes et des colonnes
Leur rôle est de préciser le contenu du tableau statistique. Ils doivent être aussi courts
que possible. On aura quelque fois avantage à numéroter les lignes et les colonnes. L’on n’est
pas toujours obligé de tracer les lignes et les colonnes, mais les en-têtes de celles-ci ne doivent
souffrir d’aucune confusion.
2.1.3- Unités de mesure
Les unités de mesure doivent être choisies de façon à tirer le plus de renseignement
possible des mesures obtenues, mais aussi de façon à ce que les nombres écrits ne comportent
pas trop de chiffres.
2.1.4- Notes complémentaires
Les nombres figurant dans un tableau peuvent nécessiter des précisions
supplémentaires. Il sera généralement indiqué de faire figurer ces précisions au bas du tableau.

2.1.5- Source des informations


Si les informations contenues dans le tableau sont obtenues à partir d’une étude menée
par une autre personne, physique ou morale, il est nécessaire de le préciser. La source sera
placée au bas du tableau, en petit caractère si nécessaire.

2.2- TABLEAU STATISTIQUE SIMPLE

Le tableau statistique le plus simple est celui où figurent deux colonnes seulement :
- la première, réservée à l’inscription des modalités du caractère, est intitulée par le
nom du caractère ;
- la deuxième, réservée à l’inscription des effectifs correspondants aux diverses
modalités du caractère, est généralement désigné par
𝑛𝑖
 Exemple 1 : Cas d’un caractère qualitatif :

Tableau 1 : Répartition des employés de l’entreprise ALPHA selon la catégorie


socioprofessionnelle

Catégorie Socioprofessionnelle ni
Manœuvre (1) 6

Agent de bureau (2) 10

Agent de maîtrise (3) 3

Cadre moyen (4) 4

Cadre supérieur (5) 7


Total 30

Exemple 2 : Cas d’une variable statistique discrète

Tableau 2 : Distribution des employés de l’entreprise GAMMA au 1er Janvier 2013 selon le
nombre d’enfants à charge (X)
Nombre d’enfants à charge (X) ni
0 5
1 17
2 13
3 20
4 11
5 4
6 1
Total 71

 Exemple 3 : Cas d’une variable statistique continue

Tableau 3 : Répartition des athlètes selon leur poids X (en kg)

Tranches de poids (en kg) ni


[55, 60[ 4
[60, 65[ 7
[65, 70[ 4
[70, 75[ 6
[75, 80[ 3
[80, 85[ 1
Total 25

2.3- TABLEAU STATISTIQUE A DOUBLE ENTRÉE

Il est fréquent qu’on soit conduit à observer sur une même unité statistique deux
caractères ou plus. La traduction par un tableau, de l’observation de deux caractères X et Y, se
fera à l’aide d’un tableau à double entrée. Les valeurs de X seront notées xi et les valeurs de
Y seront notées y j (voir tableau 4)
Tableau 4 : Répartition des enfants de l’école maternelle les PYRAMIDES selon l’âge
et le poids.

Poids Y (en kg) Totaux


[10, 15[ [15, 20[ [20, 25[ [25, 30[
Age X (en années)
[3, 4[ 25 40 8 0 73
[4, 5[ 12 29 22 0 63
[5, 6[ 6 20 30 8 64
Totaux 43 89 60 8 200

Interprétation de quelques valeurs du tableau

- La classe [4, 5[est la tranche d’âge de 4 à moins de 5 ans


- La classe [20, 25[est la tranche de poids de 20 à moins de 25 kg
- 29 est le nombre d’enfants âgés de 4 à moins de 5 ans et pesant 15 à moins de 20
kg
- 73 est le nombre d’enfants âgés de 3 à moins de 4 ans
- 43 est le nombre d’enfants pesant 10 à moins de 15 kg
- 200 est le nombre d’enfants de l’école maternelle les PYRAMIDES

2.4.1- Fréquences absolues


Ce sont les effectifs 𝑛𝑖 attachés aux diverses modalités du caractère. La somme des effectifs 𝑛𝑖 est
l’effectif total n. On note: n=∑𝑘𝑖=1 𝑛𝑖 pour une distribution de k modalités.
2.4.2- Fréquences relatives
On appelle fréquence relative de la modalité 𝑀𝑖 et on note 𝑓𝑖 , le rapport de l’effectif de cette
𝑛𝑖
modalité à l’effectif total. On note 𝑓𝑖 = où n=∑𝑘𝑖=1 𝑛𝑖 .
𝑛

La somme de toutes les fréquences relatives est égale à l’unité : ∑𝑘𝑖=1 𝑓𝑖 =1.

2.4.3- Fréquences cumulées

Les colonnes de fréquences relatives ou absolues peuvent donner lieu à la présentation


des colonnes de fréquence cumulées (croissantes ou décroissantes) permettant de répondre aux
différents types de questions suivantes :
 Quel est le nombre d’individus qui présentent une valeur du caractère de
moins de xi ?

 Quel est la proportion d’individus qui présentent une valeur du caractère de


moins de xi ?

 Quel est le nombre d’individus qui présentent une valeur du caractère au


moins égale à xi ?

 Quel est la proportion d’individus qui présentent une valeur du caractère au


moins égale à xi ?

Remarque : pour ce qui concerne les variables statistiques continues,


L’expression « moins de xi » fait référence aux bornes supérieures

des classes. Elle fait également allusion aux colonnes de fréquences


cumulées croissantes.

o L’expression « au moins égale à xi » fait référence aux bornes


inférieures des classes. Elle fait également allusion aux colonnes de
fréquences cumulées décroissantes.
o Le mot « nombre » signifie que l’on considère les colonnes des effectifs
cumulés
o Le mot « proportion » signifie que l’on se rapporte aux colonnes des
fréquences relatives cumulées.
Tranche de salaire ni Effectifs Effectifs fi Fréquences Fréquences
X (en 104 F CFA) cumulés cumulés cumulées cumulées
croissants décroissants croissantes décroissantes
i
[15, 20[ 17 17 50 0,34 0,34 1
[20, 25[ 22 39 33 0,44 0,78 0,66
[25, 30[ 5 44 11 0,10 0,88 0,22
[30, 35[ 2 46 6 0,04 0,92 0,12
[35, 40[ 4 50 4 0,08 1 0,08
Total 50 - - 1 - -

Interprétation de quelques valeurs du tableau

o La classe [15, 20[ est la tranche de salaire de 150 000 à moins de 200 000 F CFA
o Le nombre 22 de la 2e colonne du tableau est le nombre de cadres qui gagnent
200 000 à moins de 250 000 FCFA
o 44 est le nombre de cadres qui gagnent moins de 300 000 F CFA
o 6 est le nombre de cadres qui gagnent au moins 300 000 F CFA
o 0,10 es la proportion de cadres qui gagnent 250 000 à moins de 300 000 FCFA
o 0,92 es la proportion de cadres qui gagnent moins de 350 000 FCFA
o 0,12 es la proportion de cadres qui gagnent au moins 300 000 FCFA

CHAPITRE 3 : REPRÉSENTATION GRAPHIQUE DES


DISTRIBUTIONS STATISTIQUES UNIDIMENSIONNELLES
3.1- PRESENTATION

Lorsque l’on dispose de données relatives à un seul caractère, on dit qu’on a une
distribution statistique unidimensionnelle.
Le graphique est une première étape vers l’analyse des informations chiffrées. Il est une
espèce de maquette de la distribution, et permet de déceler au premier coup d’œil sa structure
qui ne peut toujours être visible à travers le tableau. Le type de graphique dépend de la nature
du caractère et du message que l’on désire transmettre à travers celui-ci. Quelque soit la nature
du caractère, l’on aura à choisir entre plusieurs types de diagrammes.

3.2- DISTRIBUTIONS A CARACTÈRE QUALITATIF


3.2.1- Présentation

On dispose d’un caractère de k modalités𝑀1 , 𝑀2 ,…, 𝑀𝑖 ,… ; 𝑀𝑘 d’effectifs respectifs


𝑛1, 𝑛2,… 𝑛𝑖,…, 𝑛𝑘 . Dans la représentation graphique des caractères qualitatifs, chaque modalité est
représentée par une surface et le principe de cette représentation est la proportionnalité des
surfaces représentatives aux effectifs représentés. Les surfaces doivent être hachurées ou
coloriées avec des motifs différents, avec une légende si nécessaire.

Les diagrammes les plus courants sont les diagrammes en tuyaux d’orgues, les diagrammes en
barre ou à bandes et les diagrammes en secteurs (circulaires ou semi-circulaires).

Nous prendrons l’exemple suivant pour illustrer les différents cas :

Tableau 6 : Répartition des employés de l’entreprise BETA selon la catégorie


socioprofessionnelle

Catégorie i (en
Socioprofessionnelle ni fi fi (%) Fi (%) degré)
Manœuvre 10 0,20 20 20 72

Agent de bureau 17 0,34 34 54 122,4

Agent de maîtrise 5 0,10 10 64 36

Cadre moyen 6 0,12 12 76 43,2

Cadre supérieur 12 0,24 24 100 86,4


Total 50 1,00 100 - 360

3.2.2- Les diagrammes en tuyaux d’orgue ou en colonnes

Graphique 1 : Diagramme en tuyaux d’orgue de l’exemple précédent

fi (%)

40

30

20

10

0
Manœuvre Agent B. Agent M. Cadre M. Cadre Sup

3.2.3- Diagrammes en barre ou à bandes

Il s’agit d’un rectangle découpé en plusieurs parties, chaque partie représentant une
modalité du caractère étudié. Ce type de diagramme a l’avantage d’être celui qui permet le
mieux la comparaison de plusieurs distributions données. La barre est représentée soit
horizontalement, soit verticalement. On se sert d’un axe gradué par les fréquences relatives
cumulées en pourcentage pour découper la barre en bandes.

Graphique 2 : Diagramme en barre ou à bandes de l’exemple précédent


3.2.4- Les diagrammes en secteurs
On parle aussi de fromage ou de camembert. Il s’agit d’un disque ou d’un demi-disque
découpés en plusieurs secteurs, chaque secteur représentant une modalité du caractère.
Ce système de visualisation permet sans doute, mieux que les tuyaux d’orgue, de
visualiser la part relative de chaque modalité du caractère dans l’ensemble de la population.

On détermine la valeur i (en degré) du secteur angulaire représentant la modalité

M i en appliquant le coefficient de proportionnalité correspondant fi à 360° pour le


o
diagramme circulaire ou à 180 pour un diagramme semi-circulaire.
3.3- DISTRIBUTIONS A CARACTÈRE QUANTITATIF

On distingue, pour la représentation graphique des caractères quantitatifs, le


diagramme différentiel et le diagramme intégral ou diagramme cumulatif.
3.3.1- Le diagramme différentiel
C’est la représentation des effectifs ou des fréquences relatives simples correspondant
à chaque valeur de la variable.

[Link]- Variable statistique discrète


Dans ce cas, le diagramme différentiel est encore appelé « diagramme en bâtons ». Les
diagrammes en bâtons sont des diagrammes plans en axes perpendiculaire qui en général ne
sont pas munis de la même échelle. Les valeurs xi sont placées en abscisse et
les 𝑛𝑖 𝑜𝑢 (𝑓𝑖 ) en ordonnées
et à chacun
On représente tous les points de coordonnées (xi , ni ) ou (xi , fi )
de ces points, on abaisse la perpendiculaire à l’axe des abscisses.

Exemple : Supposons que l’on s’intéresse à l’étude du nombre de chèques de montant élevé
(montant supérieur à 7 500 000 F CFA) traités par l’entreprise ALPHA au cours de
25 jours d’observation comme l’indique le tableau ci-après :
Tableau 7 : Répartition des 25 jours selon le nombre de chèques de montant élevé

Nombre de chèque ( xi ) Nombre de jours ( ni ) fi Fi


0 5 0,20 0,20
1 8 0,32 0,52
2 6 0,24 0,76
3 3 0,12 0,88
4 2 0,08 0,96
5 1 0,04 1
Total 25 1

Graphique 4 : Diagramme en bâtons

3.3.1-2- Variable statistique continue


Dans ce cas, le diagramme différentiel est encore appelé « histogramme de fréquence
».

Dans un système d’axes perpendiculaires, on représente les différentes bornes des


classes en abscisse et les effectifs par unité d’amplitude ou les fréquences relatives par unité
d’amplitude en ordonnées. Une classe donnée, [xi1, xi[ , a pour image un rectangle dont la

base est un segment de l’axe des abscisses compris entre les bornes xi1 et xi et dont la

hauteur est mesurée par la fréquence par unité d’amplitude correspondante. On trouve ainsi
une suite de rectangles adjacents qui donnent le graphique appelé histogramme de
fréquences.

Pour trouver les fréquences par unité d’amplitude, la procédure est la suivante :
1- On choisit une unité d’amplitude « a » qui, en général, est le plus grand diviseur commun
des diverses amplitudes 𝑎𝑖 des classes,
2- On trouve ensuite le nombre d’unité d’amplitude 𝑑𝑖 par classe en divisant l’amplitude 𝑎𝑖
𝑎
correspondante par l’unité d’amplitude choisie : 𝑑𝑖 = 𝑎𝑖 ,
3- On obtient la fréquence par unité d’amplitude de la classe [𝑥𝑖−1, 𝑥𝑖 [, 𝑛𝑖, ou 𝑓𝑖, , en divisant
𝑛
la fréquence originelle, 𝑛𝑖 𝑜𝑢 𝑓𝑖 , par le nombre d’unité d’amplitude correspond : 𝑛𝑖, =𝑑𝑖 ou
𝑖
𝑓
𝑓𝑖, = 𝑖 .
𝑑𝑖

Exemple : Prenons l’exemple du service recouvrement des créances de l’entreprise ALPHA et


supposons que durant la journée du 3 juin 2012, 300 chèques ont été traités par le service selon
5
leur montant en 10 F CFA comme l’indique le tableau 8.
5
Tableau 8 : Répartition des chèques selon leur montant en 10 F CFA

Montant X (en ni fi Fi ai di ni' fi '


105 F CFA )
[5, 10[ 3 0,010 0,010 5 1 3 0,010
[10, 15[ 7 0,023 0,033 5 1 7 0,023
[15, 20[ 6 0,020 0,053 5 1 6 0,020
[20, 30[ 21 0,070 0,123 10 2 10,5 0,035
[30, 40[ 57 0,190 0,313 10 2 28 ,5 0,095
[40, 60[ 107 0,357 0,670 20 4 26,75 0,089
[60, 80[ 73 0,243 0,913 20 4 18,25 0,061
[80, 100[ 26 0,087 1 20 4 6,5 0,022
Total 300 1 - - - -

On choisit 5 comme unité d’amplitude car 5 divise toutes les autres amplitudes
3.3.2- Le diagramme intégral ou cumulatif

C’est la représentation des effectifs cumulés ou des fréquences relatives cumulées en


pourcentage ou non correspondant à chaque valeur de la variable. Par définition, la courbe
cumulative est le graphe de la fonction N ou F qui, à toute valeur de l’axe des abscisses, fait
correspondre le nombre d’individus (ou la proportion d’individus) présentant une valeur
inférieure à cette valeur. Cette fonction N ou F, définie pour toutes valeurs de l’axe des
abscisses, est aussi appelée fonction de répartition de la distribution.
[Link]- Variable statistique discrète

Dans ce cas, le diagramme cumulatif est une courbe en escalier. Les paliers horizontaux
de l’escalier ont pour ordonnées :
𝑁𝑖 = ∑𝑖−1 𝑖−1
𝑗=1 𝑛𝑗 ou 𝐹𝑖 = ∑𝑗=1 𝑓𝑗

et les marches de l’escalier correspondent aux valeurs possibles 𝑥𝑖 .


Pour tout couple disjoint (𝑥𝑖 , 𝑥𝑖+1) la fonction cumulative vérifie 𝐹(𝑥) = 𝐹𝑖 ou 𝑁(𝑥) =
𝑁𝑖 pour 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1
Ainsi la fonction cumulative est définie par
0 𝑠𝑖 𝑥 < 𝑥1 0 𝑠𝑖 𝑥 < 𝑥1
𝐹(𝑥) = {𝐹𝑖 𝑠𝑖 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1 ou 𝑁(𝑥) = {𝑁𝑖 𝑠𝑖 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1
1 𝑠𝑖 𝑥 ≥ 𝑥𝑘 𝑛 𝑠𝑖 𝑥 ≥ 𝑥𝑘
Graphique 6 : Diagramme cumulatif de la distribution du tableau 7

3.3.2-2- Variable statistique continue


La représentation se fait point par point. Les observations étant groupées par classe, on ne
connait de la fonction de répartition que les valeurs qui correspondent aux extrémités 𝒙𝒊 des
classes et pour lesquelles on a :
𝑭(𝒙) = 𝑭𝒊 ( ou N(𝒙𝒊 )= 𝑵𝒊 )
La courbe cumulative est celle qui passe par les points représentatifs de ces valeurs.

Graphique 7 : Diagramme cumulatif de la distribution tableau 8


CHAPITRE 4 : LES CARACTÉRISTIQUES DE TENDANCE CENTRALE OU DE
POSITION

4.1- PRÉSENTATION

Ce sont des indicateurs qui se proposent de synthétiser l’ensemble des valeurs d’une
série statistique en faisant ressortir une valeur centrale du caractère étudié.
On distingue plusieurs caractéristiques de tendance centrale :
- le mode ou la valeur modale,
- la médiane,
- les moyennes.

4.2- LE MODE OU LA VALEUR MODALE

Le mode est la valeur 𝒎𝟎 de la variable qui présente l’effectif le plus élevé ( ou la


fréquence la plus élevée). C’est la valeur la plus observée par unité d’amplitude dans le cas
d’une variable statistique continue. On l’appelle encore valeur dominante.
Lorsque la variable statistique est discrète, le mode est défini sans ambiguïté : c’est la
valeur de la variable qui a l’effectif le plus élevé (ou la fréquence la plus élevée). On le découvre
à travers le tableau statistique ou même à travers le diagramme en bâtons : c’est la valeur qui
se trouve au pied du bâton le plus élevé.
Lorsque la variable statistique est continue, on trouve d’abord la classe modale, c’est-à-
dire celle qui contient la valeur modale 𝑚0 . Si la valeur modale 𝑚0 appartient à la classe
[𝑥𝑖−1 , 𝑥𝑖 [ , alors elle est donnée par la formule :
𝑑1
𝑚0 = 𝑥𝑖−1 + 𝑎𝑖 𝑑 où
1 +𝑑2

−𝑥𝑖−1 est la borne inférieure de la classe modale,


−𝑎𝑖 est l’amplitude de la classe modale,
−𝑑1 est la différence entre la fréquence maximale par unité d’amplitude et la fréquence qui la
précède.
−𝑑2 est la différence entre la fréquence maximale par unité d’amplitude et la fréquence qui la
suit.

Exemple : prenons le cas de la variable statistique continue consigné dans le tableau 8. Il ressort
de ce tableau que la fréquence maximale par unité d’amplitude est 0,095 (la fréquence qui la
précède est 0,035 et celle qui la suit est 0,089) qui correspond à la classe [30, 40[ qui
est la classe modale. La valeur modale 𝑚0 est la suivante :
0,095−0,035 0,06
𝑚0 = 30 +10(0,095−0,035)+(0,095−0,089) = 30 + 100,06+0,006
= 39,1
𝑚0 = 39,1× 105 F CFA= 3 910 0000 F CFA

Cela signifie que les chèques dont le montant est de 3 910 000 F CFA sont les plus nombreux.

N.B. On utilise les fréquences par unité d’amplitude pour tracer l’histogramme de fréquences et
calculer la valeur modale.

4.3- LA MÉDIANE

4.3.1- Présentation

La médiane est la valeur me de la variable qui divise les observations, préalablement


classées par ordre de valeur croissante (ou décroissante) en deux groupe d’effectifs égaux. La
médiane est donc située au centre de la distribution. Elle est également définie comme étant la
valeur me de la variable telle que les unités statistiques qui ont une valeur inférieure à cette
valeur, représentent la moitié (50 %) des observations.
Par exemple : la médiane d’une distribution de salaire est le niveau de salaire tel que les
employés qui gagnent moins de ce niveau de salaire, représentent la moitié des employés de
l’entreprise.
Dans un secteur d’activité donné, le chiffre d’affaires médian est le niveau de chiffre d’affaires
tel que les entreprises qui réalisent moins de ce niveau de chiffre d’affaires, représentent 50%
des entreprises du secteur.

4.3.2- Détermination de la médiane

La médiane ne se calcule pas pour des caractères qualitatifs. On la détermine à partir des
effectifs cumulés ou des fréquences relatives cumulées en pourcentage ou non. Elle est la
solution de l’équation :

𝑛
𝑁(𝑥) = ou 𝐹(𝑥)= 0,50
2

[Link]- Cas d’une variable statistique continue


𝑛
- La médiane peut se lire directement dans le tableau statistique si est une des
2
valeurs des effectifs cumulés (respectivement si 0,50 est une des valeurs des
fréquences relatives cumulées). La médiane est alors la borne supérieure de la
classe correspondante.
𝑛
- La médiane peut s’obtenir par interpolation linéaire, dans le cas où n’est pas
2
une des valeurs des effectifs cumulés (respectivement le cas où 0,50 n’est pas
une des valeurs des fréquences relatives cumulées), de la manière suivante :

𝑥𝑖−1 < 𝑚𝑒 < 𝑥𝑖 𝑚𝑒 −𝑥𝑖−1


𝑛
−𝑁𝑖−1
2
{𝑁 <𝑛<𝑁 ⟹ = 𝑁 −𝑁 (1)
𝑖−1 𝑖 𝑥𝑖 −𝑥𝑖−1 𝑖 𝑖−1
2

Ou de la même manière :
𝑥𝑖−1 < 𝑚𝑒 < 𝑥𝑖 𝑚𝑒 −𝑥𝑖−1 0,5−𝐹𝑖−1
{ ⟹ = (2)
𝐹𝑖−1 < 0,5 < 𝐹𝑖 𝑥𝑖 −𝑥𝑖−1 𝐹𝑖 −𝐹𝑖−1

La médiane est alors solution de l’équation à une inconnue (1) ou (2).

Si nous prenons l’exemple de la distribution du tableau 8, on a :

40 < 𝑚𝑒 < 60 𝑚𝑒 −40 0,500−0,313


{ ⟹ = 0,670−0,313
0,313 < 0,500 < 0,670 60−40

𝑚𝑒 −40 0,187 20(0,187)


D’où = 0,357 ⟺ 𝑚𝑒 − 40 = = 10,476
20 0,357

C’est-à-dire 𝑚𝑒 = 50,476× 105 F CFA= 5 047 600 F CFA

Cela signifie que les chèques qui ont une valeur de moins de 5 047 600 F CFA représentent
la moitié des chèques traités dans le service recouvrement de l’entreprise ALPHA le 3 juin
2012.

Graphiquement, la médiane se détermine à partir de la courbe cumulative


𝑛
qui est dans ce cas une courbe continue. On repère sur l’axe des ordonnées 2 (ou
éventuellement 0,50). On projette ce point sur la courbe et au point de
projection, on abaisse la perpendiculaire à l’axe des abscisses. Au pied de cette
perpendiculaire se trouve la médiane (voir sur le graphique 7).

[Link]- Cas d’une variable statistique discrète


𝑛
- Si 2 est une des valeurs des effectifs cumulés (respectivement si 0,50 est
une des valeurs des fréquences relatives cumulées) alors la médiane est la
𝑛
modalité qui présente 2.
𝑛
- Si 2 n’est pas une des valeurs des effectifs cumulés (respectivement si
0,50 n’est pas une des valeurs des fréquences relatives cumulées), la
médiane existe. Elle est la valeur de la variable qui correspond à la valeur
𝑛
d’effectif cumulé qui suit directement 2 (respectivement la valeur de la
fréquence relative cumulée qui suit directement 0,50).
Si nous prenons l’exemple de la distribution du tableau 7, on voit que 0,50 n’est pas
une des valeurs de fréquences relatives cumulées : c’est dire que la médiane existe. La valeur
de fréquences relatives cumulées qui suit directement 0,50 est 0,52. La valeur de la
variable correspondante est 1. La médiane est donc me  1. Cela signifie que 50% des

jours observés ont eu au plus 1 chèque de montant élevé.

Graphiquement, la médiane se détermine à partir du diagramme cumulatif qui est dans


n
ce cas le diagramme en escalier. On repère sur l’axe des ordonnés (ou éventuellement
2
0,50 ) . On projette ce point sur le diagramme :
- Si le point de projection tombe sur un palier de l’escalier, la médiane est
indéterminée ;
- Si le point de projection tombe sur un support de l’escalier, la médiane est la
valeur de la variable qui se trouve au pied de ce support (voir sur le graphique 6).
5- La moyenne arithmétique
La moyenne arithmétique de la variable X est généralement notée 𝑋̅ . Elle est donnée
par par la formule :
1
̅=
𝑋 ∑𝑘𝑖=1 𝑛𝑖 𝑥𝑖 où 𝑛 = ∑𝑘𝑖=1 𝑛𝑖 ; 𝑖 = 1,2,3, … 𝑘.
𝑛

CHAPITRE 5 : LES CARACTÉRISTIQUES DE DISPERSION.


5.1- PRESENTATION
Les caractéristiques de dispersion servent à étudier la dispersion des observations autour
de la caractéristique de position retenue (le plus souvent la moyenne). Elles permettent de
donner une signification réelle à la caractéristique de position qui ne suffit pas à caractériser
une série statistique.
Prenons par exemple le cas des deux distributions de salaire horaire (en F CFA)
suivantes de deux établissements différents.
Distribution 1 : 1100; 1140; 1240; 1300; 1360

Distribution 2 : 940; 960; 1240; 1280; 1720

Nous constatons que les deux distributions ont même médiane (1240 F) , même
moyenne arithmétique (1228 F). On ne peut cependant conclure que les deux établissements
accordent les mêmes salaires. Dans la première distribution, les données sont resserrées autour
de la valeur moyenne 1228 F ; dans la deuxième, elles sont dispersées sur une large étendue.
On dira simplement que la première a une faible dispersion par rapport à la deuxième. Il y a là
le besoin de définir et de calculer les caractéristiques de dispersion qui permettrons de mesurer
cette dispersion et ainsi de pouvoir comparer des distributions comme les deux précédentes
pour lesquelles les caractéristiques de tendance centrale se sont avérées être des instruments
insuffisants.
Les caractéristiques de dispersion les plus couramment utilisées sont : l’étendue, les
intervalles interquartiles, l’écart absolu moyen par rapport à la médiane, l’écart absolue moyen
par rapport à la moyenne et l’écart type.

5.2- DISPERSION EN TERMES D’INTERVALLES

Ce type de dispersion regroupe l’étendue et les intervalles interquartiles.

5.2.1- L’étendue ou intervalle de variation


C’est tout simplement la différence entre la plus grande valeur et la plus petite valeur
observées :
E= 𝑿𝒎𝒂𝒙 − 𝑿𝒎𝒊𝒏
Elle permet juste de se faire une idée de l’écart entre ces deux valeurs, mais ne suffit
pas à rendre compte de la dispersion dans son ensemble.
5.2.2- Les quartiles et l’intervalle interquartile

La définition de l’intervalle intervalle interquartile suppose la connaissance préalable de la


notion de Quartile.
On appelle Premier Quartile( ou Quartile inférieur) d’une distribution statistique, et on
désigne par 𝑸𝟏 , la valeur telle que 25% des valeurs prises par la variable, donc 25% de l’effectif
total étudié, lui soient inférieurs, et 75% supérieures.
On appelle Troisième Quartile (ou Quartile supérieur) d’une distribution statistique, et on
désigne par 𝑸𝟑 , la valeur telle que 75% des valeurs prises par la variable lui soient inférieures, et
25% supérieures.
En conséquence de ces définitions le Second Quartile, 𝑸𝟐 , se confond évidemment avec la
valeur médiane.
L’intervalle interquartile est la différence du Troisième et du Premier Quartile.
Intervalle interquartile = 𝑸𝟑 -𝑸𝟏
Un quart des effectifs présentant des valeurs de la variable inférieures au Premier Quartile, et
un quart de ces effectifs présentant des valeurs de la variable supérieures au Troisième Quartile,
l’Intervalle intervalle contient des valeurs de la variable présentées par la moitié centrale des
effectifs observés.

Exemple de détermination des quartiles 𝑸𝟑 et 𝑸𝟏 et de l’Intervalle interquartile (Distribution des


salaires horaires de 250 ouvriers)

Salaire horaire (euros) Effectifs 𝒏𝒊 Effectifs cumulés croissants


[𝟖; 𝟖, 𝟒[ 10 10
[𝟖, 𝟒; 𝟖, 𝟖[ 30 40
[𝟖, 𝟖; 𝟗, 𝟎[ 60 100
[𝟗, 𝟎; 𝟗, 𝟐[ 72 172
[𝟗, 𝟐; 𝟗, 𝟔[ 40 212
[𝟗, 𝟔; 𝟏𝟎, 𝟐[ 24 236
[𝟏𝟎, 𝟐; 𝟏𝟎, 𝟗[ 14 250
Total 250

Utilisons la colonne des effectifs cumulés croissants.


𝟐𝟓
Le Premier Quartile, 𝑸𝟏 , est le salaire correspondant à la 62,5e observation (250× 𝟏𝟎𝟎) = 62,5 , les
observations étant rangées par ordre de valeurs croissantes. Il se situe dans l’intervalle[𝟖, 𝟖; 𝟗, 𝟎[.
Nous aurons, en faisant à l’intérieur des classes de salaire, la meme hypothèse de distribution
uniforme que lors de la détermination du salaire médian,

𝟔𝟐,𝟓−𝟒𝟎
𝑸𝟏 = 8,8+(9-8,8) = 8,875 euros
𝟏𝟎𝟎−𝟒𝟎

𝟕𝟓
Le Troisième Quartile, 𝑸𝟑 , est le salaire correspondant à la 250× 𝟏𝟎𝟎 = 187,5e observation. Il se
trouve dans l’intervalle [𝟗, 𝟐; 𝟗, 𝟔[

𝟏𝟖𝟕,𝟓−𝟏𝟕𝟐
𝑸𝟑 = 9,2+ (9,6-9,2) 𝟐𝟏𝟐−𝟏𝟕𝟐 = 9, 355 euros.
L’intervalle interquartile 𝑸𝟑 -𝑸𝟏 est donc 9,355-8,875= 0,48 euros. Ainsi, dans la distribution
considérée un intervalle de 0, 48 euros, soit seulement 16,5% de l’étendue, égale à 10,9-8= 2,9
euros, englobe 50% des effectifs étudiés. La population étudiée est donc plutôt regroupée autour
des valeurs centrales.
5.3- DISPERSION EN TERMES D’ÉCARTS
Ce type de dispersion regroupe entre autres l’écart absolu moyen par rapport à la
médiane, l’écart absolu moyen par rapport à la moyenne et l’écart type.

5.3.1- L’écart absolu moyen par rapport à la médiane


L’écart absolu moyen par rapport à la médiane d’une variable statistique X est la

moyenne arithmétique des écarts absolus des valeurs X à la médiane. Pour l’obtenir, l’on
calcule la moyenne arithmétique de la nouvelle variable|𝑋 − 𝑚𝑒 |.
1
D’où 𝑒𝑚 = 𝑛 ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑚𝑒 | = ∑𝑘𝑖=1 𝑓𝑖 |𝑥𝑖 − 𝑚𝑒 |

5.3.2- L’écart absolu moyen par rapport à la moyenne

L’écart absolu moyen par rapport à la moyenne d’une variable statistique X est la moyenne
arithmétique des écarts absolus des valeurs X à la moyenne. Pour l’obtenir, l’on calcule la
moyenne arithmétique de la nouvelle variable|𝑿 − 𝑿 ̅ |.

1
D’où 𝑒𝑥̅ = 𝑛 ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑥̅ | = ∑𝑘𝑖=1 𝑓𝑖 |𝑥𝑖 − 𝑥̅ |

On a toujours 𝑒𝑚 ≤ 𝑒𝑥̅

5.3.3- La variance et l’écart type

[Link]- La variance

La variance d’une variable statistique X est la moyenne arithmétique des carrés des
écarts des valeurs X à la moyenne. Pour l’obtenir, l’on calcule la moyenne arithmétique de la
nouvelle variable(𝑥 − 𝑥̅ )2 . Elle est généralement notée 𝑉(𝑋) ou 𝜎𝑥2 .Elle est donnée par la
x
formule :
1 ∑(𝑥𝑖 −𝑥̅ )²
V(X) = 𝑛 ∑𝑘𝑖=1 𝑥𝑖2 𝑛𝑖 -𝑥̅ 2 = = ∑(𝑥𝑖 − 𝑥̅ )² 𝑓𝑖
𝑛

[Link]- L’écart type


L’écart type est la racine carré de la variance. C’est la caractéristique de dispersion la

plus utilisée. Il est toujours positif ou nul. Il est généralement noté  et est donné par :

√𝑉(𝑋)√𝑛 ∑𝑘𝑖=1 𝑥2𝑖 𝑛𝑖 − 𝑥̅2 


1

5.4- Le coefficient de variation


Le coefficient de variation, qui est un nombre sans dimension, permet de comparer des
séries hétérogènes positives. Il a pour expression :

𝜎𝑥
𝑐𝑣 = 𝑥̅

Ce coefficient mesure d’autre part l’homogénéité de la distribution. Plus il est petit, plus
la distribution est homogène.

EXEMPLE :
Prenons encore l’exemple du service recouvrement des créances de l’entreprise
ALPHA qui suppose que durant la journée du 3 juin 2012, 300 chèques ont été traités par le
service selon leur montant en 105 F CFA comme l’indique le tableau 8 et calculons par
exemple les quartiles, l’intervalle interquartile, la variance, l’écart-type et le coefficient de
variation.
CHAPITRE 6 : LES INDICES STATISTIQUES
6-1- NOTION ET DEFINITION D’UN INDICE SIMPLE (OU INDICE ELEMENTAIRE)
6-1-1- EXEMPLE
A une date donnée 𝑡0 le prix d’une denrée s’élève à 2 500 F CFA. A une date 𝑡1 , postérieure à la
date 𝑡0 , le prix de cette denrée s’élève à 2 700 F CFA.
Nous désirons caractériser de façon chiffrée l’évolution- ici l’augmentation- du prix de la denrée
en question, de la date 𝑡0 à la date 𝑡1 .
2700
Nous avons : 2500 × 100 = 108, ce qui indique que la quantité de marchandises qui coûtait 100 F
CFA à la date 𝑡0 , coûte 108 F CFA à la date 𝑡1 ( soit une augmentation du prix de 108-100=8 pour
100) ;c’est le nombre 108 qui, à la date 𝑡1 , est appelé indice du prix de la denrée étudié, sur la
base 100 à la date 𝑡0 .
6-1-2- FORMULE
Si nous désignons par :
𝑃0 la mesure à la date 𝑡0 , d’une grandeur étudiée, la date 𝑡0 étant dite date de base, et par 𝑃1 la
mesure à la date 𝑡1 , de la même grandeur, l’indice simple 𝐼1/0 de la grandeur, à la date 𝑡1 , calculé
sur la base 100, est :
𝑃
𝐼1/0 = 𝑃1 × 100
0

Cet indice est dit simple, ou élémentaire, car il ne porte que sur une seule grandeur.
6-2- IINDICES SYNTHETIQUES ( OU INDICES COMPOSES)
La détermination d’un indice peut ne pas se limiter à la confrontation des mesures d’une seule
grandeur aux dates 𝑡0 et 𝑡1 .
On peut en effet envisager de caractériser avec un indice unique l’évolution simultanée de
plusieurs grandeurs et de calculer non plus un indice simple, mais un indice synthétique (ou
indice composé).
6-2-1- EXEMPLE
Les mesures des prix unitaires de trois denrées A, B, C à deux dates 𝑡0 et 𝑡1 sont données dans le
tableau suivant, avec les coefficients de pondération accordés à chacune des denrées, les quantités
consommées de ces denrées étant d’inégale importance pendant la durée qui sépare 𝑡0 de 𝑡1 .
Denrées Prix unitaires Pondérations
Date 𝑡0 Date 𝑡1
A 2 3 5
B 3 4 3
C 5 8 2
10

Calculer un indice synthétique des prix à la date 𝑡1 (base 100 à la date 𝑡0 )


Désignons par 𝑃0,𝑖 les prix respectifs des 𝑘 denrées à la date 𝑡0 , par 𝑃1,𝑖 les prix de ces mêmes
denrées à la date 𝑡1 et par 𝑄𝑖 les coefficients de pondération :

∑𝑖=𝑘 𝑃1,𝑖 ×𝑄𝑖


𝐼1/0 = ∑𝑖=1
𝑖=𝑘 × 100
𝑖=1 𝑃0,𝑖 ×𝑄𝑖

que nous noterons aussi, pour alléger l’écriture,


∑𝑃 𝑄
𝐼1/0 = ∑ 𝑃1 𝑄 × 100
0

(3×5)+(4×3)+(8×2)
𝐼1/0 = (2×5)+(3×3)+(5×2) × 100 = 148,27

Ainsi on dépense 148,27 F CFA à la date 𝑡1 pour se procurer la disposition de ce qui coûtait 100
F CFA à la date 𝑡0 ( en se limitant aux trois denrées A,B, C).
Ou encore les prix ont augmenté de 48,27% de la date 𝑡0 à la date 𝑡1 .
6-2-2- PONDERATION EN MATIERE D’INDICES
Dans les calculs d’indices qui viennent d’être envisagés les pondérations retenues étaient celles
constatées à la date de base 𝑡0 . Il est naturellement possible d’exécuter des calculs similaires en
prenant les pondérations de la date de calcul 𝑡1 , en supposant, ce qui n’a rien d’invraisemblable,
que les pondérations se soient modifiées entre les deux dates.
6-2-2-1- L’INDICE DE Laspeyres DES PRIX
Des calculs fondés sur les pondérations de la date de base 𝑡0 sont effectués avec la pondération
dite de Laspeyres.
∑ 𝑷 𝟏 𝑸𝟎
𝑳𝟏/𝟎 = ∑ 𝑷𝟎 ×𝑸𝟎
× 𝟏𝟎𝟎

6-2-2-2- L’INDCE DE Paasche DES PRIX


Des calculs d’indices exécutés d’après les pondérations de la date de calcul 𝑡1 , sont effectués
avec la pondération dite de Paasche. Ils ont l’avantage d’utiliser, au moment où l’indice est
calculé, des pondérations d’actualité.
∑ 𝑷𝟏 ×𝑸𝟏
𝑷𝟏/𝟎 = ∑ 𝑷 𝟎 𝑸𝟏
× 𝟏𝟎𝟎

6-2-2-3- APPLICATION
Les mesures en 2 003 et en 2 005, des prix unitaires (en milliers de F CFA) et des quantités
consommées des articles A, B, C, D, sont données dans le tableau ci-après :
2003 2005
Articles Prix 𝑃0 Quantité 𝑄0 Prix 𝑃1 Quantité 𝑄1
A 5 100 7 80
B 20 15 30 25
C 10 50 12 90
D 3 200 4 200
Calculer les indices synthétiques des prix en 2 005 calculés sur la base 100 en 2 003 avec :
-la pondération Laspeyres.
- la pondération Paasche.
Calcul de l’indice Laspeyres des prix :
∑ 𝑷 𝟏 𝑸𝟎
𝑳𝟏/𝟎 = ∑ 𝑷𝟎 ×𝑸𝟎
× 𝟏𝟎𝟎

(7×100)+(30×15)+(12×50)+(4×200)
= (5×100)+(20×15)+(10×50)+(3×200) × 100

2 550
= 1 900 × 100 = 134,21.

Calcul de l’indice Paasche des prix :


∑ 𝑷𝟏 ×𝑸𝟏
𝑷𝟏/𝟎 = ∑ 𝑷 𝟎 𝑸𝟏
× 100

(𝟕×𝟖𝟎)+(𝟑𝟎×𝟐𝟓)+(𝟏𝟐×𝟗𝟎)+(𝟒×𝟐𝟎𝟎)
= (𝟓×𝟖𝟎)+(𝟐𝟎×𝟐𝟓)+(𝟏𝟎×𝟗𝟎)+(𝟑×𝟐𝟎𝟎) × 100
3 190
= 2 400 ×100= 132,90.

Remarque :
De même que nous avons jusqu’ici calculé des indices des prix pondérés par des quantités
(pondération Laspeyres ou Paasche) on pourrait calculer des indices des quantités pondérés par
les prix.
Ainsi :
∑𝑄 𝑃
𝐼1/0 = ∑ 𝑄 1×𝑃0 : Indice des quantités pondérées par les prix (pondération Laspeyres).
0 0

∑𝑄 𝑃
𝐼1/0 = ∑ 𝑄 1×𝑃1 : Indice des quantités pondérées par les prix (pondération Paasche).
0 1

6-3- REVERSIBILITE D’UN INDICE


L’indice simple d’une grandeur, à la date 𝑡1 , calculé sur la base 100 à la date 𝑡0 , est
𝑃
𝐼1/0 = 𝑃1 × 100.
0

L’indice simple d’une grandeur, à la date 𝑡0 , calculé sur la base 100 à la date 1, est
𝑃
𝐼0/1 = 𝑃0 × 100.
1

On dit qu’un indice est réversible si :


𝐼1/0 1 𝐼1/0 0/1 𝐼
= 𝐼0/1 Ou × 100 = 1.
100 100
100

𝐼1/0 𝑃 𝐼0/1 𝑃
= 𝑃1 = 𝑃0
100 0 100 1

𝐼1/0 𝐼
0/1 𝑃 𝑃
d’où × 100 = 𝑃1 × 𝑃0 = 1.
100 0 1
Nous en conclurons qu’un indice simple est réversible.
6-4-TRANSFERABILITE D’UN INDICE
Si nous considérons les mesures 𝑃0 ,𝑃1 ,𝑃2 , d’une grandeur aux dates 𝑡0 ,𝑡1 ,𝑡2 , nous pouvons
calculer les trois indices simples : 𝐼1/0 , 𝐼2/0 , 𝐼2/1 .

On dit qu’un indice est transférable si :


𝐼2/0 𝐼 𝐼 𝐼
= 1/0 × 100
2/1 2/1
ou 𝐼2/0 = 𝐼1/0 × 100 .
100 100

Or, pour les trois indices simples 𝐼1/0 ,𝐼2/0 ,𝐼2/1 , et comme :
𝑃2 𝑃1 𝑃2 𝐼2/0 𝐼1/0 𝐼2/1
= × nous avons = × ce qui montre qu’un indice simple est transférable.
𝑃0 𝑃0 𝑃1 100 100 100
CHAPITRE 7 : LES MÉTHODES D’AJUSTEMENT

7.1- LA NOTION D’AJUSTEMENT

Soit (X, Y) une série double à indice simple. Elle se présente sous la forme d’un
tableau à deux lignes ou deux colonnes seulement :

𝑥 𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑛
𝑦 𝑦1 𝑦2 … 𝑦𝑖 … 𝑦𝑛

Le nuage de points est le lieu géométrique des points de coordonnées (𝑥𝑖 ,𝑦𝑖 ) donné par
une série double à indice simple ou par un ensemble de 𝑛 points. Les 𝑥𝑖 sont en abscisse et
les 𝑦𝑖 sont en ordonnée.
Chaque point a donc pour abscisse la valeur 𝑥𝑖 du caractère X de la première série et
pour ordonnée 𝑦𝑖 de la deuième série.
S’il existait une liaison stricte entre les variables, les points du nuage seraient sur une
courbe représentative de la fonction 𝑦 = 𝑓(𝑥) liant les deux variables. Ce n’est généralement
pas le cas. De ce fait, la représentation exacte par le nuage est lourde et peu maniable.

Si à l’occasion d’une représentation graphique les points du nuage semblent se répartir


suivant une configuration assez régulière, le statisticien peut envisager d’ajuster la série par une
courbe. On conçoit donc, à l’aide de l’exemple graphique simple ci-dessus, que la première
étape des opérations d’ajustement consiste en la recherche de la forme générale de la courbe
d’ajustement, la seconde étape en la détermination de l’équation de la courbe
d’ajustement, équation de la forme𝑦 = 𝑓(𝑥). Le graphique permet alors de mettre en évidence
deux éléments :

- L’existence ou la non existence d’une liaison apparente stricte entre les deux
variables ;

- La forme générale de la liaison : fonction croissante ou décroissante, linéaire ou


non.
On peut remarquer que dans le graphique 9 précédent, les points semblent se répartir de
façon linéaire. On peut, dans ce cas, ajuster la série par une droite.
Il existe plusieurs méthodes d’ajustement. On peut citer entre autres la méthode des
moyennes mobiles, la méthode des moindres carrés ordinaires (mco), la méthode de MAYER.

7.2- L’AJUSTEMENT LINÉAIRE PAR LA MÉTHODES DES


MOINDRES CARRES

6.2.1- Présentation
Lorsque le nuage de points est rectiligne, on utilise la fonction 𝑦 = 𝑓(𝑥) où
𝑓(𝑥) = 𝑎𝑥𝑏 : l’ajustement est dit linéaire et la courbe devient la courbe des
moindres carrés.

7.2.2- Droite d’ajustement ou droite de régression de y en x :


yˆ aˆx bˆ

La droite d’ajustement de y en x permet, grâce à sa formule, de calculer une valeur


numérique approximative yˆde y pour chaque valeur numérique observée de x.

Définition : La droite d’ajustement de y en x est la droite pour laquelle la somme des


carrés des écarts ( di  yi  ŷi ), entre les points du nuage et les points de même abscisse de la
droite es minimale, c’est-à-dire la droite pour laquelle ∑𝑛𝑖=1 𝑑𝑖² =(𝑦𝑖 − 𝑦ˆ )² est minimale

̂ sont des paramètres de la droite d’ajustement, paramètres dont les valeurs sont à
̂ et 𝒃
𝒂
déterminer.
Recherche des paramètres de la droite des moindres carrés

On démontre et nous admettons que la droite qui minimise les écarts passent par un point
caractéristique, le point moyen de coordonnées 𝒙̅ 𝒆𝒕 𝒚
̅ et que sa pente

∑𝒏
𝒊=𝟏(𝒙𝒊 −𝒙
̅)(𝒚𝒊 −𝒚
̅)
̂=
𝒂 ∑𝒏 ̅)²
̅=𝒂
et son équation 𝒚 − 𝒚 ̂(𝒙 − 𝒙
̅)
𝒊=𝟏(𝒙𝒊 −𝒙

𝟏 𝟏
̅= ∑𝒏𝒊=𝟏 𝒙𝒊 et 𝒚
𝒙 ̅= ∑𝒏𝒊=𝟏 𝒚𝒊 .
𝒏 𝒏

Définition :

On appelle covariance entre les variables 𝒙 𝒆𝒕 𝒚 notée 𝒄𝒐𝒗(𝒙, ), le réel défini par

𝟏 𝟏 𝒄𝒐𝒗(𝒙,𝒚)
𝒄𝒐𝒗(𝒙, 𝒚) = ∑𝒏𝒊=𝟏(𝒙𝒊 -𝒙 ̅) = ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 -𝒙
̅ )(𝒚𝒊 -𝒚 ̅𝒚̅ d’où 𝒂
̂= et
𝒏 𝒏 𝝈²𝒙

̂ =𝒚
𝒃 ̅-𝒂
̂𝒙̅.

7.2.3- Droite d’ajustement ou droite de régression de x en y :


xˆ aˆy bˆ
La droite d’ajustement de x en y permet, grâce à sa formule, de calculer une valeur
numérique approximative xˆ de x pour chaque valeur numérique observée de y .
Définition : La droite d’ajustement de x en y est la droite pour laquelle la somme des
carrés des écarts (𝑑𝑖′ =𝑥𝑖 -𝑥̂𝑖 ), entre les points du nuage et les points de même ordonnée de la droite
est minimale ; c’est-à-dire la droite pour laquelle ∑𝑛𝑖=1 𝑑𝑖′² =∑𝑛𝑖=1(𝑥𝑖 − 𝑥̂𝑖 )² est minimale
̂ et 𝒃′
Formule de calcul de 𝒂′ ̂

̂ = 𝒄𝒐𝒗(𝒙,𝒚)
𝒂′ et ̂ ′=𝒙
𝒃 ̅-𝒂 ̅.
̂′𝒚
𝝈𝒚²

Exemple d’ajustement linéaire par la méthode des moindres carrés : On

considère la série double à indice simple suivante ;

xi 1 3 4 6 8 9 11 14
yi 1 2 4 4 5 7 8 9

T.A.F. Déterminer les équations des droites d’ajustement de y en x et de x en y.

7.2.4- Mesure de la corrélation : le coefficient de corrélation linéaire.

Le coefficient de corrélation est une mesure descriptive de la robustesse de l’association entre


deux variables 𝑥 et 𝑦. Il est désigné par 𝑟 peut être calculé comme suit :

∑(𝒙𝒊−𝒙)(𝒚𝒊−𝒚) 𝑐𝑜𝑣(𝑥,𝑦)
r= =
√∑(𝒙𝒊−𝒙)²×∑(𝒚𝒊−𝒚)² 𝜎𝑥 ×𝜎𝑦

-1≤ 𝒓 ≤ +𝟏

-le signe du coefficient de corrélation linéaire r, indique le sens, positif ou négatif de la


corrélation,

-la valeur absolue de r est inférieure ou égale à 1, et la corrélation est d’autant plus serrée que
cette valeur absolue est plus voisine de 1.
7.3- L’AJUSTEMENT LINÉAIRE PAR LA DROITE DE MAYER
7.3.1- Principe de la méthode

Le principe de la méthode est le suivant : l’ensemble des points à ajuster est partagé en deux-
ensembles de même effectif, dans l’ordre ou les points se présentent.

Chacun des deux-sous groupes est alors remplacé par le point dont les coordonnées sont
respectivement :
-en abscisse la moyenne arithmétique des abscisses des points du sous-groupe,
-en ordonnée la moyenne arithmétique des ordonnées des points du sous-groupe.
On dispose alors de deux points dont les cordonnées sont connues, par lesquels passe la
droite dite de Mayer.
7.3.2- Application

On considère la série double à indice simple suivante :

xi yi
2 7
4 10
6 13
8 15
9 20
13 28

Les coordonnées des trois premiers du tableau conduiront à :


2+4+6
Abscisse du point représentant le premier sous-groupe : =4
3
7+10+13
Ordonnée de ce point : =10.
3
L’autre sous-groupe nous donne : 10 et 21.
La droite de Mayer, d’équation 𝑦̂ = 𝑎̂𝑥 +𝑏̂ passe par les deux points de coordonnées
(4 ; 10) et (10 ; 21).
On peut écrire 10=4𝑎̂+𝑏̂
21=10𝑎̂+𝑏̂
𝑎̂=1,83 et 𝑏̂=2,67
La droite de Mayer a donc pour équation : 𝑦̂=1,83𝑥+2,67.

Vous aimerez peut-être aussi