N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
MS.5.1. SERIE STATISTIQUE À DEUX VARIABLES
0. Définitions
0.1. Population et individus
Une population est un ensemble fini de personnes, d'animaux, d'objets, de végétaux, de pays,…
sur lequel peut être menée une étude statistique. Les éléments d'une population sont appelés individus
ou unités statistiques.
NB : Si le nombre d'individus d'une population est très élevé, ou si l'on ne peut pas contacter tous les
individus alors on s'intéresse à une partie de la population appelée échantillon.
0.2. Caractère et modalités
• Un caractère est une propriété commune à tous les individus d'une population. (EX : âge,
taille, sexe, groupe sanguin, …)
• Une modalité est une valeur prise par un caractère déterminé. (Ex : pour le caractère âgé, on
à 10 ans, 12 ans ,…)
On distingue deux sortes de caractères : caractère qualitatif et caractère quantitatif
Les modalités correspondantes à un caractère seront notées x1 , x2 , … xn
0.3. Série statistique
On appelle une série statistique ou distribution statistique, la donnée des modalités 𝑥1 , 𝑥2 , … 𝑥𝑝
d’un caractère et celle de leurs effectifs respectifs 𝑛1 , 𝑛2 , … 𝑛𝑝 . Une série statistique est souvent
donnée de la manière suivante.
Modalité xi x1 x2 x3 … xp
Effectifs ni n1 n2 n3 … np
Ou
Modalité xi Effectifs ni
x1 n1
x2 n2
x3 n3
… …
xp np
0.4. Série statistique à deux variables
Une série statistique à deux variables(caractères) appelée aussi série bivariée est une série
statistique où deux variables sont étudiées simultanément.
Considérons deux variables statistiques 𝑥 et 𝑦 observées sur une même population de 𝑛 individus.
On note x1 , x2 , … xn les valeurs relevées pour la variable 𝑥 et y1 , y2 , … yn les valeurs relevées pour la
variable 𝑦. Les couples (x1 , y1 ); (x2 ; y2 ); … ; (xn ; yn )forment une série statistique à deux variables.
06. Nuage de points
Dans un repère orthogonal, l’ensemble des points Mi de coordonnées (xi , yi ) avec 1 ≤ i ≤ n,
est appelé nuage de points associé à la série statistiques (x1 , y1 ); (x2 ; y2 ); … ; (xn ; yn ) à deux
variables.
Page |1
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
1. Représentation d’une série statistique à deux variables au moyen d’un nuage des
points
Le tableau suivant présente l’évolution du budget publicitaire et du chiffre d’affaires d’une société au
cours des 6 dernières années :
Budget publicitaire
8 10 12 14 16 18
en milliers d’euros xi
Chiffre d’affaire en
40 55 55 70 75 95
milliers d’euros yi
2. Point moyen d’un nuage des points.
1
On appelle point de moyen d’un nuage de point, le point G de coordonnées (𝑥̅ , 𝑦̅) où x̅ = n ∑ni=1 xi et
1
y̅ = n ∑ni=1 yi .
Exemple
Le point moyen de l’exemple ci-dessus est G(13, 65)
EXERCICE
En vue de concrétiser la prime en Maths des élèves de la 3ème HSC de l’Institut SALEMA I,
l’enseignant de mathématiques de cette classe, sur ordre du chef d’établissement, a dû procéder au
prélèvement des notes, cotées sur 20, de Mathématiques et de TIC de chaque élève.
Page |2
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
Les données recueillies sont reprises dans le tableau ci-dessous :
xi 3 6 9 8 9 11 10 11 13 10 11 12 12 12 13 12 13 15 14 16
yi 4 7 3 5 12 13 9 10 12 13 13 10 11 12 12 7 9 14 9 15
L’enseignant demande à ses élèves de :
1. Noter les cotes de chaque élève sous forme de couple.
2. Représenter ces couples de points dans un système cartésien.
3. Déterminer les coordonnées du point moyen
4. Représenter ce point (point moyen) dans le plan cartésien.
Résolution
Page |3
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
Page |4
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
MM5.19 : AJUSTEMENT LINEAIRE
L’ajustement linéaire (ou régression linéaire) est une méthode mathématique utilisée pour
modéliser la relation entre deux variables en traçant une droite qui représente au mieux les données
observées.
Lorsque les points d’un nuage sont sensiblement alignés, on peut construire une droite, appelé
droite d’ajustement (ou droite de régression), passant « au plus près » de ces points
a. La méthode de la droite des extrêmes
Considérons et représentons graphiquement la série statistique double indiquant le poids X en kgf et
la taille Y en cm de 8 personnes d'une famille.
Xi 40 48 54 60 68 72 85 92
Yi 135 142 150 163 171 174 183 188
Cette méthode d'ajustement consiste à relier les deux
points extrêmes du nuage. En considérant l'exemple
précédent, on constate que la droite d'ajustement
passe par les points extrêmes
A (40,135) et B (92,174)
Ainsi, elle a pour équation :
188−135 53 4900
y − 135 = (x − 40) ou y = 52 x + ou
92−40 52
y = 1,01x + 94,2
b. Méthode de Mayer
Elle consiste à partager le nuage en deux parties
égales (sous nuages) de même effectif et
l'ajustement se fait à l'aide de la droite reliant les
deux points moyens de deux sous nuages.
Le point moyen du premier sous nuages est
G1 (50,5; 147,5) et celui du deuxième sous-
nuages est G2 (79,25; 179).La droite d'ajustement
passe par G1 et G2 .
Son équation est :
179 − 147,5 126 21159
y − 147,5 = (× −50,5)ou y = x+ ou encore
79,25 − 50,5 115 230
y = 1,09x + 91,9
Page |5
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
c. Méthode des moindres carrés
Cette méthode porte le nom de « moindre carrés » car elle
consiste à rechercher la position de la droite d’ajustement tel que
la somme des carrés des longueurs donnant les distances
respectives (en vert) entre la droite et les points soit minimale.
Le principe consiste donc à déterminer les coefficients 𝑎 et 𝑏
d’une droite d’équation 𝑦 = 𝑎𝑥 + 𝑏 de sorte qu’elle passe le «
plus près possible » des points du nuage.
Les écarts verticaux sont : y1 − (axi + b). La somme de carré
de ces écarts verticaux est : S = ∑ni=1( yi − (axi + b))2 . Elle est appelée somme de résidus en y. la
droite répondant à ce critère est la meilleure droite d’ajustement et elle passe par le point moyen
G(x̅, y̅). Elle a pour équation
𝐲 = 𝐚𝐱 + 𝐛 avec
𝐂𝐨𝐯(𝐱,𝐲) 1
𝐚= où Cov(x, y) = n [(x1 − x̅)(y1 − y̅) + (x2 − x̅)(y2 − y̅) + ⋯ + (xn − x̅)(yn − y̅)] et
𝐕(𝐱)
1
v(x) = n [(x1 − x̅)2 + (x2 − x̅)2 + (x3 − x̅)2 + ⋯ + (xn − x̅)2 ]
∑𝐧
𝐢=𝟏(𝐱 𝐢 −𝐱
̅)(𝐲𝐢 −𝐲̅)
ou a = ∑𝐧
et
̅)𝟐
𝐢=𝟏(𝐱 𝐢 −𝐱
𝐛 = 𝐲̅ − 𝐚𝐱̅
Exemple
On considère la série statistique à deux variables données dans le tableau suivant :
xi 5 10 15 20 25 30 35 40
yi 15 25 35 45 50 65 75 90
1) Déterminer le point moyen
5 + 10 + 15 + 20 + 25 + 30 + 35 + 40
̅
X= = 22,5
8
15 + 25 + 35 + 45 + 50 + 65 + 75 + 90
̅=
Y = 50
8
D’où G(22,5 ; 50)
Page |6
N OT E D E S TAT I S T I Q U E , T R O I S I E M E H S C
2) Déterminer une équation de la droite d’ajustement par la méthode des moindres carrés.
xi 5 10 15 20 25 30 35 40
yi 15 25 65 35 50 45 75 90
xi − x̅ -17,5 -12,5 -7,5 -2,5 2,5 7,5 12,5 17,5
yi − y̅ -35 -25 15 -15 0 -5 25 40
(xi − x̅)(yi − y̅) 612,5 312,5 -112,5 37,5 0 -37,5 312,5 700
2
(xi − x̅) 306,25 156,25 56,25 6,25 6,25 56,25 156,25 306,25
On sait que l’équation de la droite de régression est y = ax + b
∑𝐧𝐢=𝟏(𝐱 𝐢 − 𝐱̅)(𝐲𝐢 − 𝐲̅) 𝟏𝟖𝟐𝟓 𝟕𝟑
a= = =
∑𝐧𝐢=𝟏(𝐱 𝐢 − 𝐱̅)𝟐 𝟏𝟎𝟓𝟎 𝟒𝟐
𝟕𝟑 𝟑𝟎𝟓
𝐛 = 𝐲̅ − 𝐚𝐱̅ = 𝟓𝟎 − × 𝟐𝟐, 𝟓 =
𝟒𝟐 𝟐𝟖
𝟕𝟑 𝟑𝟎𝟓
On a donc y = ax + b ⟺ y = 𝟒𝟐 𝐱 + 𝟐𝟖
100
yi
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40 45
Exercices
Page |7