Stats Descriptives
Stats Descriptives
Les références 1- WALDER Masiéri, statistique et calcul des probabilités, Dalloz, Paris, 2001
(bibliographie et/ou 2- Anderson-Sweeney-Williams, Statistique pour l’économie et la gestion, 4e édition
webographie) : française de la 6e édition américaine par Claire Borsenberger, De boeck, Paris, 2013.
3- GIARD Vincent, statistique appliquée à la gestion, 8e édition, Economica, Paris, 2.
4- Abdnasser Chekroun, 2018, « Statistiques descriptives et exercices », NBER,
working paper, n°20893 Janvier 2015.
5- Blard-Laborderie. J. (2015), « L’essentiel des outils de statistique descriptive pour
aborder des études en Sciences humaines et sociales », 2015.
6- Dodge Y. (2003), « Premiers pas en statistique », Springer.
Chapitre 1 : LES CONCEPTS DE BASE
Dans le langage courant le mot « statistiques », au pluriel, désigne des collections de chiffres,
présentées souvent sous formes de tableaux, parfois sous formes de graphiques, et qui regroupent
toutes les observations effectuées sur des faits nombreux, relatifs à un même phénomène.
Il est bien certain qu’une pareille définition ne saurait suffire. Le statisticien, placé en face de
ces relevés chiffrés, devra les examiner de plus près, « de manière à obtenir des rapports
numériques sensiblement indépendants des anomalies du hasard et qui dénotent l’existence de
causes régulières dont l’action s’est combinée avec celle des causes fortuites ».
Nous pourrons alors dire que la « Statistique », au singulier, sera constituée par l’ensemble
des procédés ou des méthodes qui auraient pour but l’étude mathématique des statistiques.
Si nous retenons ces deux définitions du terme « statistique » nous dirons que la Statistique
est l’outil avec lequel on travaille une matière première constituée par les statistiques.
1) Définitions
Population statistique ou ensemble statistique est l’ensemble des éléments considérés dans une
étude particulière. Par exemple l’ensemble des étudiants d’une école ou l’ensemble des employés
d’une entreprise.
Lorsque, au contraire, le caractère peut être mesuré (l’âge d’une personne, son revenu annuel…)
ou repéré (la température en un lieu à un instant donné), il est dit quantitatif (variable
statistique).
Dans le cas où les valeurs numériques que peut prendre une variable statistique sont des nombres
entiers (par exemple le nombre d’enfants à charge d’une personne), la variable est dite discrète
ou discontinue.
Dans le cas contraire, c’est-à-dire lorsque la variable statistique peut prendre pour valeur
numérique tout réel d’un intervalle de R, elle est dite continue : la taille d’enfants mesurée à
l’occasion d’une visite médicale.
Modalités sont des différentes situations dans lesquelles peuvent se trouver les caractères : âge
(moins de 20 ans).
L’enquête statistique est l’opération de base de la collecte des données. Cette enquête peut
porter sur l’ensemble de la population statistique. Dans ce cas, on parle de recensement, ou sur
une partie de cette population, on parle de sondage.
Manœuvre (1) 6
Total 30
Dans pareil cas, pour pouvoir dresser une statistique, nous devons diviser le domaine de
variation de la variable en classes de valeurs, de préférence d’amplitude constante. Par exemple,
en prenant comme amplitude 5 kg, le dépouillement pourra se présenter comme suit :
Moins de 60 4
60 à moins de 65 7
65 à moins de 70 4
70 à moins de 75 6
75 à moins de 80 3
80 et plus 1
Total 25
Un tableau est un ensemble de lignes et de colonnes. Mais cela ne suffit pas. Le tableau
doit présenter certaines caractéristiques.
Le tableau statistique le plus simple est celui où figurent deux colonnes seulement :
- la première, réservée à l’inscription des modalités du caractère, est intitulée par le
nom du caractère ;
- la deuxième, réservée à l’inscription des effectifs correspondants aux diverses
modalités du caractère, est généralement désigné par
𝑛𝑖
Exemple 1 : Cas d’un caractère qualitatif :
Catégorie Socioprofessionnelle ni
Manœuvre (1) 6
Tableau 2 : Distribution des employés de l’entreprise GAMMA au 1er Janvier 2013 selon le
nombre d’enfants à charge (X)
Nombre d’enfants à charge (X) ni
0 5
1 17
2 13
3 20
4 11
5 4
6 1
Total 71
Il est fréquent qu’on soit conduit à observer sur une même unité statistique deux
caractères ou plus. La traduction par un tableau, de l’observation de deux caractères X et Y, se
fera à l’aide d’un tableau à double entrée. Les valeurs de X seront notées xi et les valeurs de
Y seront notées y j (voir tableau 4)
Tableau 4 : Répartition des enfants de l’école maternelle les PYRAMIDES selon l’âge
et le poids.
La somme de toutes les fréquences relatives est égale à l’unité : ∑𝑘𝑖=1 𝑓𝑖 =1.
o La classe [15, 20[ est la tranche de salaire de 150 000 à moins de 200 000 F CFA
o Le nombre 22 de la 2e colonne du tableau est le nombre de cadres qui gagnent
200 000 à moins de 250 000 FCFA
o 44 est le nombre de cadres qui gagnent moins de 300 000 F CFA
o 6 est le nombre de cadres qui gagnent au moins 300 000 F CFA
o 0,10 es la proportion de cadres qui gagnent 250 000 à moins de 300 000 FCFA
o 0,92 es la proportion de cadres qui gagnent moins de 350 000 FCFA
o 0,12 es la proportion de cadres qui gagnent au moins 300 000 FCFA
Lorsque l’on dispose de données relatives à un seul caractère, on dit qu’on a une
distribution statistique unidimensionnelle.
Le graphique est une première étape vers l’analyse des informations chiffrées. Il est une
espèce de maquette de la distribution, et permet de déceler au premier coup d’œil sa structure
qui ne peut toujours être visible à travers le tableau. Le type de graphique dépend de la nature
du caractère et du message que l’on désire transmettre à travers celui-ci. Quelque soit la nature
du caractère, l’on aura à choisir entre plusieurs types de diagrammes.
Les diagrammes les plus courants sont les diagrammes en tuyaux d’orgues, les diagrammes en
barre ou à bandes et les diagrammes en secteurs (circulaires ou semi-circulaires).
Catégorie i (en
Socioprofessionnelle ni fi fi (%) Fi (%) degré)
Manœuvre 10 0,20 20 20 72
fi (%)
40
30
20
10
0
Manœuvre Agent B. Agent M. Cadre M. Cadre Sup
Il s’agit d’un rectangle découpé en plusieurs parties, chaque partie représentant une
modalité du caractère étudié. Ce type de diagramme a l’avantage d’être celui qui permet le
mieux la comparaison de plusieurs distributions données. La barre est représentée soit
horizontalement, soit verticalement. On se sert d’un axe gradué par les fréquences relatives
cumulées en pourcentage pour découper la barre en bandes.
Exemple : Supposons que l’on s’intéresse à l’étude du nombre de chèques de montant élevé
(montant supérieur à 7 500 000 F CFA) traités par l’entreprise ALPHA au cours de
25 jours d’observation comme l’indique le tableau ci-après :
Tableau 7 : Répartition des 25 jours selon le nombre de chèques de montant élevé
base est un segment de l’axe des abscisses compris entre les bornes xi1 et xi et dont la
hauteur est mesurée par la fréquence par unité d’amplitude correspondante. On trouve ainsi
une suite de rectangles adjacents qui donnent le graphique appelé histogramme de
fréquences.
Pour trouver les fréquences par unité d’amplitude, la procédure est la suivante :
1- On choisit une unité d’amplitude « a » qui, en général, est le plus grand diviseur commun
des diverses amplitudes 𝑎𝑖 des classes,
2- On trouve ensuite le nombre d’unité d’amplitude 𝑑𝑖 par classe en divisant l’amplitude 𝑎𝑖
𝑎
correspondante par l’unité d’amplitude choisie : 𝑑𝑖 = 𝑎𝑖 ,
3- On obtient la fréquence par unité d’amplitude de la classe [𝑥𝑖−1, 𝑥𝑖 [, 𝑛𝑖, ou 𝑓𝑖, , en divisant
𝑛
la fréquence originelle, 𝑛𝑖 𝑜𝑢 𝑓𝑖 , par le nombre d’unité d’amplitude correspond : 𝑛𝑖, =𝑑𝑖 ou
𝑖
𝑓
𝑓𝑖, = 𝑖 .
𝑑𝑖
On choisit 5 comme unité d’amplitude car 5 divise toutes les autres amplitudes
3.3.2- Le diagramme intégral ou cumulatif
Dans ce cas, le diagramme cumulatif est une courbe en escalier. Les paliers horizontaux
de l’escalier ont pour ordonnées :
𝑁𝑖 = ∑𝑖−1 𝑖−1
𝑗=1 𝑛𝑗 ou 𝐹𝑖 = ∑𝑗=1 𝑓𝑗
4.1- PRÉSENTATION
Ce sont des indicateurs qui se proposent de synthétiser l’ensemble des valeurs d’une
série statistique en faisant ressortir une valeur centrale du caractère étudié.
On distingue plusieurs caractéristiques de tendance centrale :
- le mode ou la valeur modale,
- la médiane,
- les moyennes.
Exemple : prenons le cas de la variable statistique continue consigné dans le tableau 8. Il ressort
de ce tableau que la fréquence maximale par unité d’amplitude est 0,095 (la fréquence qui la
précède est 0,035 et celle qui la suit est 0,089) qui correspond à la classe [30, 40[ qui
est la classe modale. La valeur modale 𝑚0 est la suivante :
0,095−0,035 0,06
𝑚0 = 30 +10(0,095−0,035)+(0,095−0,089) = 30 + 100,06+0,006
= 39,1
𝑚0 = 39,1× 105 F CFA= 3 910 0000 F CFA
Cela signifie que les chèques dont le montant est de 3 910 000 F CFA sont les plus nombreux.
N.B. On utilise les fréquences par unité d’amplitude pour tracer l’histogramme de fréquences et
calculer la valeur modale.
4.3- LA MÉDIANE
4.3.1- Présentation
La médiane ne se calcule pas pour des caractères qualitatifs. On la détermine à partir des
effectifs cumulés ou des fréquences relatives cumulées en pourcentage ou non. Elle est la
solution de l’équation :
𝑛
𝑁(𝑥) = ou 𝐹(𝑥)= 0,50
2
Ou de la même manière :
𝑥𝑖−1 < 𝑚𝑒 < 𝑥𝑖 𝑚𝑒 −𝑥𝑖−1 0,5−𝐹𝑖−1
{ ⟹ = (2)
𝐹𝑖−1 < 0,5 < 𝐹𝑖 𝑥𝑖 −𝑥𝑖−1 𝐹𝑖 −𝐹𝑖−1
Cela signifie que les chèques qui ont une valeur de moins de 5 047 600 F CFA représentent
la moitié des chèques traités dans le service recouvrement de l’entreprise ALPHA le 3 juin
2012.
Nous constatons que les deux distributions ont même médiane (1240 F) , même
moyenne arithmétique (1228 F). On ne peut cependant conclure que les deux établissements
accordent les mêmes salaires. Dans la première distribution, les données sont resserrées autour
de la valeur moyenne 1228 F ; dans la deuxième, elles sont dispersées sur une large étendue.
On dira simplement que la première a une faible dispersion par rapport à la deuxième. Il y a là
le besoin de définir et de calculer les caractéristiques de dispersion qui permettrons de mesurer
cette dispersion et ainsi de pouvoir comparer des distributions comme les deux précédentes
pour lesquelles les caractéristiques de tendance centrale se sont avérées être des instruments
insuffisants.
Les caractéristiques de dispersion les plus couramment utilisées sont : l’étendue, les
intervalles interquartiles, l’écart absolu moyen par rapport à la médiane, l’écart absolue moyen
par rapport à la moyenne et l’écart type.
𝟔𝟐,𝟓−𝟒𝟎
𝑸𝟏 = 8,8+(9-8,8) = 8,875 euros
𝟏𝟎𝟎−𝟒𝟎
𝟕𝟓
Le Troisième Quartile, 𝑸𝟑 , est le salaire correspondant à la 250× 𝟏𝟎𝟎 = 187,5e observation. Il se
trouve dans l’intervalle [𝟗, 𝟐; 𝟗, 𝟔[
𝟏𝟖𝟕,𝟓−𝟏𝟕𝟐
𝑸𝟑 = 9,2+ (9,6-9,2) 𝟐𝟏𝟐−𝟏𝟕𝟐 = 9, 355 euros.
L’intervalle interquartile 𝑸𝟑 -𝑸𝟏 est donc 9,355-8,875= 0,48 euros. Ainsi, dans la distribution
considérée un intervalle de 0, 48 euros, soit seulement 16,5% de l’étendue, égale à 10,9-8= 2,9
euros, englobe 50% des effectifs étudiés. La population étudiée est donc plutôt regroupée autour
des valeurs centrales.
5.3- DISPERSION EN TERMES D’ÉCARTS
Ce type de dispersion regroupe entre autres l’écart absolu moyen par rapport à la
médiane, l’écart absolu moyen par rapport à la moyenne et l’écart type.
moyenne arithmétique des écarts absolus des valeurs X à la médiane. Pour l’obtenir, l’on
calcule la moyenne arithmétique de la nouvelle variable|𝑋 − 𝑚𝑒 |.
1
D’où 𝑒𝑚 = 𝑛 ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑚𝑒 | = ∑𝑘𝑖=1 𝑓𝑖 |𝑥𝑖 − 𝑚𝑒 |
L’écart absolu moyen par rapport à la moyenne d’une variable statistique X est la moyenne
arithmétique des écarts absolus des valeurs X à la moyenne. Pour l’obtenir, l’on calcule la
moyenne arithmétique de la nouvelle variable|𝑿 − 𝑿 ̅ |.
1
D’où 𝑒𝑥̅ = 𝑛 ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑥̅ | = ∑𝑘𝑖=1 𝑓𝑖 |𝑥𝑖 − 𝑥̅ |
On a toujours 𝑒𝑚 ≤ 𝑒𝑥̅
[Link]- La variance
La variance d’une variable statistique X est la moyenne arithmétique des carrés des
écarts des valeurs X à la moyenne. Pour l’obtenir, l’on calcule la moyenne arithmétique de la
nouvelle variable(𝑥 − 𝑥̅ )2 . Elle est généralement notée 𝑉(𝑋) ou 𝜎𝑥2 .Elle est donnée par la
x
formule :
1 ∑(𝑥𝑖 −𝑥̅ )²
V(X) = 𝑛 ∑𝑘𝑖=1 𝑥𝑖2 𝑛𝑖 -𝑥̅ 2 = = ∑(𝑥𝑖 − 𝑥̅ )² 𝑓𝑖
𝑛
plus utilisée. Il est toujours positif ou nul. Il est généralement noté et est donné par :
𝜎𝑥
𝑐𝑣 = 𝑥̅
Ce coefficient mesure d’autre part l’homogénéité de la distribution. Plus il est petit, plus
la distribution est homogène.
EXEMPLE :
Prenons encore l’exemple du service recouvrement des créances de l’entreprise
ALPHA qui suppose que durant la journée du 3 juin 2012, 300 chèques ont été traités par le
service selon leur montant en 105 F CFA comme l’indique le tableau 8 et calculons par
exemple les quartiles, l’intervalle interquartile, la variance, l’écart-type et le coefficient de
variation.
CHAPITRE 6 : LES INDICES STATISTIQUES
6-1- NOTION ET DEFINITION D’UN INDICE SIMPLE (OU INDICE ELEMENTAIRE)
6-1-1- EXEMPLE
A une date donnée 𝑡0 le prix d’une denrée s’élève à 2 500 F CFA. A une date 𝑡1 , postérieure à la
date 𝑡0 , le prix de cette denrée s’élève à 2 700 F CFA.
Nous désirons caractériser de façon chiffrée l’évolution- ici l’augmentation- du prix de la denrée
en question, de la date 𝑡0 à la date 𝑡1 .
2700
Nous avons : 2500 × 100 = 108, ce qui indique que la quantité de marchandises qui coûtait 100 F
CFA à la date 𝑡0 , coûte 108 F CFA à la date 𝑡1 ( soit une augmentation du prix de 108-100=8 pour
100) ;c’est le nombre 108 qui, à la date 𝑡1 , est appelé indice du prix de la denrée étudié, sur la
base 100 à la date 𝑡0 .
6-1-2- FORMULE
Si nous désignons par :
𝑃0 la mesure à la date 𝑡0 , d’une grandeur étudiée, la date 𝑡0 étant dite date de base, et par 𝑃1 la
mesure à la date 𝑡1 , de la même grandeur, l’indice simple 𝐼1/0 de la grandeur, à la date 𝑡1 , calculé
sur la base 100, est :
𝑃
𝐼1/0 = 𝑃1 × 100
0
Cet indice est dit simple, ou élémentaire, car il ne porte que sur une seule grandeur.
6-2- IINDICES SYNTHETIQUES ( OU INDICES COMPOSES)
La détermination d’un indice peut ne pas se limiter à la confrontation des mesures d’une seule
grandeur aux dates 𝑡0 et 𝑡1 .
On peut en effet envisager de caractériser avec un indice unique l’évolution simultanée de
plusieurs grandeurs et de calculer non plus un indice simple, mais un indice synthétique (ou
indice composé).
6-2-1- EXEMPLE
Les mesures des prix unitaires de trois denrées A, B, C à deux dates 𝑡0 et 𝑡1 sont données dans le
tableau suivant, avec les coefficients de pondération accordés à chacune des denrées, les quantités
consommées de ces denrées étant d’inégale importance pendant la durée qui sépare 𝑡0 de 𝑡1 .
Denrées Prix unitaires Pondérations
Date 𝑡0 Date 𝑡1
A 2 3 5
B 3 4 3
C 5 8 2
10
(3×5)+(4×3)+(8×2)
𝐼1/0 = (2×5)+(3×3)+(5×2) × 100 = 148,27
Ainsi on dépense 148,27 F CFA à la date 𝑡1 pour se procurer la disposition de ce qui coûtait 100
F CFA à la date 𝑡0 ( en se limitant aux trois denrées A,B, C).
Ou encore les prix ont augmenté de 48,27% de la date 𝑡0 à la date 𝑡1 .
6-2-2- PONDERATION EN MATIERE D’INDICES
Dans les calculs d’indices qui viennent d’être envisagés les pondérations retenues étaient celles
constatées à la date de base 𝑡0 . Il est naturellement possible d’exécuter des calculs similaires en
prenant les pondérations de la date de calcul 𝑡1 , en supposant, ce qui n’a rien d’invraisemblable,
que les pondérations se soient modifiées entre les deux dates.
6-2-2-1- L’INDICE DE Laspeyres DES PRIX
Des calculs fondés sur les pondérations de la date de base 𝑡0 sont effectués avec la pondération
dite de Laspeyres.
∑ 𝑷 𝟏 𝑸𝟎
𝑳𝟏/𝟎 = ∑ 𝑷𝟎 ×𝑸𝟎
× 𝟏𝟎𝟎
6-2-2-3- APPLICATION
Les mesures en 2 003 et en 2 005, des prix unitaires (en milliers de F CFA) et des quantités
consommées des articles A, B, C, D, sont données dans le tableau ci-après :
2003 2005
Articles Prix 𝑃0 Quantité 𝑄0 Prix 𝑃1 Quantité 𝑄1
A 5 100 7 80
B 20 15 30 25
C 10 50 12 90
D 3 200 4 200
Calculer les indices synthétiques des prix en 2 005 calculés sur la base 100 en 2 003 avec :
-la pondération Laspeyres.
- la pondération Paasche.
Calcul de l’indice Laspeyres des prix :
∑ 𝑷 𝟏 𝑸𝟎
𝑳𝟏/𝟎 = ∑ 𝑷𝟎 ×𝑸𝟎
× 𝟏𝟎𝟎
(7×100)+(30×15)+(12×50)+(4×200)
= (5×100)+(20×15)+(10×50)+(3×200) × 100
2 550
= 1 900 × 100 = 134,21.
(𝟕×𝟖𝟎)+(𝟑𝟎×𝟐𝟓)+(𝟏𝟐×𝟗𝟎)+(𝟒×𝟐𝟎𝟎)
= (𝟓×𝟖𝟎)+(𝟐𝟎×𝟐𝟓)+(𝟏𝟎×𝟗𝟎)+(𝟑×𝟐𝟎𝟎) × 100
3 190
= 2 400 ×100= 132,90.
Remarque :
De même que nous avons jusqu’ici calculé des indices des prix pondérés par des quantités
(pondération Laspeyres ou Paasche) on pourrait calculer des indices des quantités pondérés par
les prix.
Ainsi :
∑𝑄 𝑃
𝐼1/0 = ∑ 𝑄 1×𝑃0 : Indice des quantités pondérées par les prix (pondération Laspeyres).
0 0
∑𝑄 𝑃
𝐼1/0 = ∑ 𝑄 1×𝑃1 : Indice des quantités pondérées par les prix (pondération Paasche).
0 1
L’indice simple d’une grandeur, à la date 𝑡0 , calculé sur la base 100 à la date 1, est
𝑃
𝐼0/1 = 𝑃0 × 100.
1
𝐼1/0 𝑃 𝐼0/1 𝑃
= 𝑃1 = 𝑃0
100 0 100 1
𝐼1/0 𝐼
0/1 𝑃 𝑃
d’où × 100 = 𝑃1 × 𝑃0 = 1.
100 0 1
Nous en conclurons qu’un indice simple est réversible.
6-4-TRANSFERABILITE D’UN INDICE
Si nous considérons les mesures 𝑃0 ,𝑃1 ,𝑃2 , d’une grandeur aux dates 𝑡0 ,𝑡1 ,𝑡2 , nous pouvons
calculer les trois indices simples : 𝐼1/0 , 𝐼2/0 , 𝐼2/1 .
Or, pour les trois indices simples 𝐼1/0 ,𝐼2/0 ,𝐼2/1 , et comme :
𝑃2 𝑃1 𝑃2 𝐼2/0 𝐼1/0 𝐼2/1
= × nous avons = × ce qui montre qu’un indice simple est transférable.
𝑃0 𝑃0 𝑃1 100 100 100
CHAPITRE 7 : LES MÉTHODES D’AJUSTEMENT
Soit (X, Y) une série double à indice simple. Elle se présente sous la forme d’un
tableau à deux lignes ou deux colonnes seulement :
𝑥 𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑛
𝑦 𝑦1 𝑦2 … 𝑦𝑖 … 𝑦𝑛
Le nuage de points est le lieu géométrique des points de coordonnées (𝑥𝑖 ,𝑦𝑖 ) donné par
une série double à indice simple ou par un ensemble de 𝑛 points. Les 𝑥𝑖 sont en abscisse et
les 𝑦𝑖 sont en ordonnée.
Chaque point a donc pour abscisse la valeur 𝑥𝑖 du caractère X de la première série et
pour ordonnée 𝑦𝑖 de la deuième série.
S’il existait une liaison stricte entre les variables, les points du nuage seraient sur une
courbe représentative de la fonction 𝑦 = 𝑓(𝑥) liant les deux variables. Ce n’est généralement
pas le cas. De ce fait, la représentation exacte par le nuage est lourde et peu maniable.
- L’existence ou la non existence d’une liaison apparente stricte entre les deux
variables ;
6.2.1- Présentation
Lorsque le nuage de points est rectiligne, on utilise la fonction 𝑦 = 𝑓(𝑥) où
𝑓(𝑥) = 𝑎𝑥𝑏 : l’ajustement est dit linéaire et la courbe devient la courbe des
moindres carrés.
̂ sont des paramètres de la droite d’ajustement, paramètres dont les valeurs sont à
̂ et 𝒃
𝒂
déterminer.
Recherche des paramètres de la droite des moindres carrés
On démontre et nous admettons que la droite qui minimise les écarts passent par un point
caractéristique, le point moyen de coordonnées 𝒙̅ 𝒆𝒕 𝒚
̅ et que sa pente
∑𝒏
𝒊=𝟏(𝒙𝒊 −𝒙
̅)(𝒚𝒊 −𝒚
̅)
̂=
𝒂 ∑𝒏 ̅)²
̅=𝒂
et son équation 𝒚 − 𝒚 ̂(𝒙 − 𝒙
̅)
𝒊=𝟏(𝒙𝒊 −𝒙
𝟏 𝟏
̅= ∑𝒏𝒊=𝟏 𝒙𝒊 et 𝒚
𝒙 ̅= ∑𝒏𝒊=𝟏 𝒚𝒊 .
𝒏 𝒏
Définition :
On appelle covariance entre les variables 𝒙 𝒆𝒕 𝒚 notée 𝒄𝒐𝒗(𝒙, ), le réel défini par
𝟏 𝟏 𝒄𝒐𝒗(𝒙,𝒚)
𝒄𝒐𝒗(𝒙, 𝒚) = ∑𝒏𝒊=𝟏(𝒙𝒊 -𝒙 ̅) = ∑𝒏𝒊=𝟏 𝒙𝒊 𝒚𝒊 -𝒙
̅ )(𝒚𝒊 -𝒚 ̅𝒚̅ d’où 𝒂
̂= et
𝒏 𝒏 𝝈²𝒙
̂ =𝒚
𝒃 ̅-𝒂
̂𝒙̅.
̂ = 𝒄𝒐𝒗(𝒙,𝒚)
𝒂′ et ̂ ′=𝒙
𝒃 ̅-𝒂 ̅.
̂′𝒚
𝝈𝒚²
xi 1 3 4 6 8 9 11 14
yi 1 2 4 4 5 7 8 9
∑(𝒙𝒊−𝒙)(𝒚𝒊−𝒚) 𝑐𝑜𝑣(𝑥,𝑦)
r= =
√∑(𝒙𝒊−𝒙)²×∑(𝒚𝒊−𝒚)² 𝜎𝑥 ×𝜎𝑦
-1≤ 𝒓 ≤ +𝟏
-la valeur absolue de r est inférieure ou égale à 1, et la corrélation est d’autant plus serrée que
cette valeur absolue est plus voisine de 1.
7.3- L’AJUSTEMENT LINÉAIRE PAR LA DROITE DE MAYER
7.3.1- Principe de la méthode
Le principe de la méthode est le suivant : l’ensemble des points à ajuster est partagé en deux-
ensembles de même effectif, dans l’ordre ou les points se présentent.
Chacun des deux-sous groupes est alors remplacé par le point dont les coordonnées sont
respectivement :
-en abscisse la moyenne arithmétique des abscisses des points du sous-groupe,
-en ordonnée la moyenne arithmétique des ordonnées des points du sous-groupe.
On dispose alors de deux points dont les cordonnées sont connues, par lesquels passe la
droite dite de Mayer.
7.3.2- Application
xi yi
2 7
4 10
6 13
8 15
9 20
13 28