0% ont trouvé ce document utile (0 vote)
29 vues18 pages

StatDesc Dim (2) Partie2 Allamy

Ce document décrit la régression linéaire entre deux variables quantitatives, en définissant le coefficient de corrélation et en expliquant comment tracer la droite de régression qui ajuste au mieux le nuage de points.

Transféré par

Meryem Kachani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
29 vues18 pages

StatDesc Dim (2) Partie2 Allamy

Ce document décrit la régression linéaire entre deux variables quantitatives, en définissant le coefficient de corrélation et en expliquant comment tracer la droite de régression qui ajuste au mieux le nuage de points.

Transféré par

Meryem Kachani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Statistique Descriptive Bivariée

Régression

Pr. L. A. Allamy

Université Cadi Ayyad


Faculté des Sciences Semlalia Marrakech

9 décembre 2022

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 1 / 18


Partie 2 du chapitre
Statistique Descriptive
Bivariée
 Régression 

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 2 / 18


Remarque

Dans cette partie, on ne considèrera que les variables


statistiques quantitatives.

Exemple

(X , Y ) = (taille (en cm), poids (en kg ))

X 155 163 170 178 185


Y 47 61 54 70 73

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 3 / 18


Coecient de corrélation

Considérons deux variables statistiques quantitatives X et Y.


Souvent, on se pose la question d'existence d'un lien, d'une
relation entre X et Y et éventuellement l'exprimer
mathématiquement.

Nuage de points

Soient (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), n observations du couple


(X , Y ) (un n-échantillon de (X , Y ).
Ces couples peuvent être représentés dans un plan orthogonal
(xi en abscisse et yi en ordonnée) et donnent alors naissance à
ce qu'on appelle  un nuage de points.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 4 / 18


Dénition

On mesure le lien de dépendance linéaire entre deux variables


quantitatives X et Y par le coécient de corrélation, noté
rXY , déni par :
sXY
rXY =
sX sY
1 1 X 2
xi yi − x̄ ȳ et sX2 = x − x̄ 2
X
où sXY = .
n i n i i
1 X 1 X
On rappelle que x̄ = xi , ȳ = yi
n i n i

Remarque

rXY ∈ [−1, 1]
|rXY | = 1 ⇔ dépendance linéaire parfaite entre X et Y.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 5 / 18


Exemple-suite

La taille moyenne est : x̄ = 170, 2 cm.

Le poids moyen est : ȳ = 61 kg.


52373
sXY = ( ) − x̄ ȳ = 92, 4.
5
1
sX2 = (145403) − (x̄)2 = 112, 56 −→ sX = 10, 6094.
5
1
sY2 = (19075) − (ȳ )2 = 94 −→ sY = 9, 695359.
5
92.4
rXY = √ = 0.89829 ⇒ il y a une forte liaison
94 × 112.56
linéaire entre la taille et le poids.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 6 / 18


Représentation d'un nuage de points

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 7 / 18


Droite de régression

En régression linéaire, on cherche à déterminer une droite qui


ajuste le mieux possible le nuage.
On utilise la méthode des moindres carrés.

Cette méthode consiste à trouver la droite (D) : y = ax + b


qui approche le mieux le nuage, au sens des moindres carrés.
Ceci revient à minimiser la somme des carrés des écarts entre :

yi (ordonnée de xi dans le nuage) et

axi + b (ordonnée de xi sur la droite).

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 8 / 18


Droite de régression

n
(yi − (axi + b))2
X
On cherche alors à minimiser :
i=1
On obtient alors ce minimum pour :
sXY
â = 2 et b̂ = ȳ − âx̄
sX
1 X 1 X 1 X
où x̄ = xi , ȳ = yi , sXY = xi yi − x̄ ȳ et
n i n i
n i
1 X 2
sX2 = x − x̄ 2
n i i

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 9 / 18


Equation de la droite de régression

L'équation de la droite de régression est donnée par :

(D) : y = âx + b̂
sXY
où â = et b̂ = ȳ − âx̄
sX2

Remarque

La droite de régression passe par le point (x̄, ȳ ).


Elle donne un modèle de prédiction. On peut prédire des
valeurs qui ne gurent pas dans le tableau, à partir de
l'équation de la droite.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 10 / 18


Relation entre les coecients

On a la relation suivante, entre â et rXY :

sY
â = rXY ×
sX
sXY sXY sY sY
en eet : â = 2 = × = rXY ×
sX s X × sY sX sX

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 11 / 18


Exemple-suite

Exemple-suite

La taille moyenne est : x̄ = 170, 2 cm.

Le poids moyen est : ȳ = 61 kg.


52373
sXY = ( ) − x̄ ȳ = 92, 4.
5
1
sX2 = (145403) − (x̄)2 = 112, 56 −→ sX = 10, 6094.
5
1
sY2 = (19075) − (ȳ )2 = 94 −→ sY = 9, 695359.
5
sXY
â = 2 ' 0, 82089.
sX
b̂ = ȳ − âx̄ ' −78, 7.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 12 / 18


Exemple-suite

L'équation de la droite de régression est : y = 0, 821x − 78, 7

−→ On voudrait prédire le poids d'une personne ayant une


taille de 1, 80 m :

y = 0, 821 × 180 − 78, 7 = 69, 08


Le poids recherché est presque égal à 69 kg .

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 13 / 18


Représentation du nuage de points
Nuage de points

70
65
Poids (en Kg)

60
55
50

155 160 165 170 175 180 185

Taille (en cm)

Figure 2  Nuage de points taille-poids


Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 14 / 18
Tracé du nuage de points et de la droite de

régression
Nuage de points et droite de régression

70
65
Poids (en Kg)

60
55
50

155 160 165 170 175 180 185

Taille (en cm)

Figure 3  Nuage de points avec la Statistique


Pr. L. A. Allamy droite de régression
Descriptive Bivariée Régression 15 / 18
Résidus ou erreurs de prédiction

Les résidus de la régression linéaire sont dénis par :

ei = yi − (âxi + b̂) = yi − yi∗ ; i = 1, ..., n

Le résidu ei est l'erreur que l'on commet en utilisant la


droite de régression linéaire pour prédire yi à partir de xi .
Les résidus sont les diérences entre :
- les valeurs observées yi ; i = 1, ..., n et

- les valeurs ajustées yi ; i = 1, ..., n .

n n
1 X 1 X
• Moyenne résiduelle : ē = ei = (yi − (âxi + b̂))
n i=1
n i=1
n
2 1
ei2 − (ē)2
X
• Variance résiduelle : se =
n i=1
Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 16 / 18
Remarques
n
X
On a toujours ei = 0.
i=1
La variance résiduelle s'écrit alors :
n
2 1 X 2
se = e = sY2 [1 − rXY2
].
n i=1 i
La variance résiduelle est la variance non expliquée par la
droite de régression de Y en X.

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 17 / 18


BON COURAGE

Pr. L. A. Allamy Statistique Descriptive Bivariée Régression 18 / 18

Vous aimerez peut-être aussi