Statistique Descriptive Bivariée
Régression
Pr. L. A. Allamy
Université Cadi Ayyad
Faculté des Sciences Semlalia Marrakech
9 décembre 2022
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 1 / 18
Partie 2 du chapitre
Statistique Descriptive
Bivariée
Régression
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 2 / 18
Remarque
Dans cette partie, on ne considèrera que les variables
statistiques quantitatives.
Exemple
(X , Y ) = (taille (en cm), poids (en kg ))
X 155 163 170 178 185
Y 47 61 54 70 73
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 3 / 18
Coecient de corrélation
Considérons deux variables statistiques quantitatives X et Y.
Souvent, on se pose la question d'existence d'un lien, d'une
relation entre X et Y et éventuellement l'exprimer
mathématiquement.
Nuage de points
Soient (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), n observations du couple
(X , Y ) (un n-échantillon de (X , Y ).
Ces couples peuvent être représentés dans un plan orthogonal
(xi en abscisse et yi en ordonnée) et donnent alors naissance à
ce qu'on appelle un nuage de points.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 4 / 18
Dénition
On mesure le lien de dépendance linéaire entre deux variables
quantitatives X et Y par le coécient de corrélation, noté
rXY , déni par :
sXY
rXY =
sX sY
1 1 X 2
xi yi − x̄ ȳ et sX2 = x − x̄ 2
X
où sXY = .
n i n i i
1 X 1 X
On rappelle que x̄ = xi , ȳ = yi
n i n i
Remarque
rXY ∈ [−1, 1]
|rXY | = 1 ⇔ dépendance linéaire parfaite entre X et Y.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 5 / 18
Exemple-suite
La taille moyenne est : x̄ = 170, 2 cm.
Le poids moyen est : ȳ = 61 kg.
52373
sXY = ( ) − x̄ ȳ = 92, 4.
5
1
sX2 = (145403) − (x̄)2 = 112, 56 −→ sX = 10, 6094.
5
1
sY2 = (19075) − (ȳ )2 = 94 −→ sY = 9, 695359.
5
92.4
rXY = √ = 0.89829 ⇒ il y a une forte liaison
94 × 112.56
linéaire entre la taille et le poids.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 6 / 18
Représentation d'un nuage de points
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 7 / 18
Droite de régression
En régression linéaire, on cherche à déterminer une droite qui
ajuste le mieux possible le nuage.
On utilise la méthode des moindres carrés.
Cette méthode consiste à trouver la droite (D) : y = ax + b
qui approche le mieux le nuage, au sens des moindres carrés.
Ceci revient à minimiser la somme des carrés des écarts entre :
yi (ordonnée de xi dans le nuage) et
axi + b (ordonnée de xi sur la droite).
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 8 / 18
Droite de régression
n
(yi − (axi + b))2
X
On cherche alors à minimiser :
i=1
On obtient alors ce minimum pour :
sXY
â = 2 et b̂ = ȳ − âx̄
sX
1 X 1 X 1 X
où x̄ = xi , ȳ = yi , sXY = xi yi − x̄ ȳ et
n i n i
n i
1 X 2
sX2 = x − x̄ 2
n i i
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 9 / 18
Equation de la droite de régression
L'équation de la droite de régression est donnée par :
(D) : y = âx + b̂
sXY
où â = et b̂ = ȳ − âx̄
sX2
Remarque
La droite de régression passe par le point (x̄, ȳ ).
Elle donne un modèle de prédiction. On peut prédire des
valeurs qui ne gurent pas dans le tableau, à partir de
l'équation de la droite.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 10 / 18
Relation entre les coecients
On a la relation suivante, entre â et rXY :
sY
â = rXY ×
sX
sXY sXY sY sY
en eet : â = 2 = × = rXY ×
sX s X × sY sX sX
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 11 / 18
Exemple-suite
Exemple-suite
La taille moyenne est : x̄ = 170, 2 cm.
Le poids moyen est : ȳ = 61 kg.
52373
sXY = ( ) − x̄ ȳ = 92, 4.
5
1
sX2 = (145403) − (x̄)2 = 112, 56 −→ sX = 10, 6094.
5
1
sY2 = (19075) − (ȳ )2 = 94 −→ sY = 9, 695359.
5
sXY
â = 2 ' 0, 82089.
sX
b̂ = ȳ − âx̄ ' −78, 7.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 12 / 18
Exemple-suite
L'équation de la droite de régression est : y = 0, 821x − 78, 7
−→ On voudrait prédire le poids d'une personne ayant une
taille de 1, 80 m :
y = 0, 821 × 180 − 78, 7 = 69, 08
Le poids recherché est presque égal à 69 kg .
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 13 / 18
Représentation du nuage de points
Nuage de points
70
65
Poids (en Kg)
60
55
50
155 160 165 170 175 180 185
Taille (en cm)
Figure 2 Nuage de points taille-poids
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 14 / 18
Tracé du nuage de points et de la droite de
régression
Nuage de points et droite de régression
70
65
Poids (en Kg)
60
55
50
155 160 165 170 175 180 185
Taille (en cm)
Figure 3 Nuage de points avec la Statistique
Pr. L. A. Allamy droite de régression
Descriptive Bivariée Régression 15 / 18
Résidus ou erreurs de prédiction
Les résidus de la régression linéaire sont dénis par :
ei = yi − (âxi + b̂) = yi − yi∗ ; i = 1, ..., n
Le résidu ei est l'erreur que l'on commet en utilisant la
droite de régression linéaire pour prédire yi à partir de xi .
Les résidus sont les diérences entre :
- les valeurs observées yi ; i = 1, ..., n et
∗
- les valeurs ajustées yi ; i = 1, ..., n .
n n
1 X 1 X
• Moyenne résiduelle : ē = ei = (yi − (âxi + b̂))
n i=1
n i=1
n
2 1
ei2 − (ē)2
X
• Variance résiduelle : se =
n i=1
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 16 / 18
Remarques
n
X
On a toujours ei = 0.
i=1
La variance résiduelle s'écrit alors :
n
2 1 X 2
se = e = sY2 [1 − rXY2
].
n i=1 i
La variance résiduelle est la variance non expliquée par la
droite de régression de Y en X.
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 17 / 18
BON COURAGE
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 18 / 18