0% ont trouvé ce document utile (0 vote)

416 vues30 pages

Régression Linéaire Simplifiée

Ce document présente le modèle de régression linéaire simple. Il décrit la méthode des moindres carrés pour estimer les paramètres du modèle, le coefficient de détermination pour mesurer l'ajustement du modèle, et les hypothèses et tests associés au modèle.

Transféré par

Hanae BELEKHDAR

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

416 vues30 pages

Régression Linéaire Simplifiée

Transféré par

Hanae BELEKHDAR

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

STATISTIQUE APPLIQUEE

Chap. III : Régression linéaire simple

Rachid MCHICH
I. Modèle de régression linéaire simple

Le modèle de régression utilisé dans une régression

linéaire simple s’écrit :

y = β0 + β1 x + ε

y : variable à expliquer (dépendante)

x : variable explicative (indépendante)

β0 et β1 correspondent aux paramètres du modèle

ε est une variable aléatoire appelée: terme d’erreur.
Ce terme prend en compte la variabilité de y qui
n’est pas expliquée par la relation linéaire entre x et
y.
Le terme ε mesure la différence entre les valeurs
réellement observées et les valeurs qui auraient été
observées si la relation spécifiée avait été
rigoureusement exacte. Ce terme regroupe donc trois
erreurs :

Une erreur de spécification : le fait que la seule

variable explicative n’est pas suffisante pour rendre
compte de la totalité du phénomène expliqué;

une erreur de mesure, les données ne représentent

pas exactement le phénomène;

une erreur de fluctuation d’échantillonnage : d’un

échantillon à l’autre les observations, et donc les
estimations, sont légèrement différentes.
Chaque distribution des valeurs de y a sa propre
moyenne. L’équation qui décrit comment la
moyenne de y est liée à x est appelée : équation
de la régression linéaire simple. Elle est donnée
par :
E(y) = β0 + β1 x
CasA: CasB: CasC:
Relation linéaire positive Relation linéaire négative Pas de relation

E(y) E(y) E(y)

Ordonnée
à l'origine
Ordonnée
{Jo
à l'origine La pentcp,est nulle
( )IIIUlIlléc
{Jo 1--------
l'UIIKIIlC Droite de régression
{Jo
Droite de régression

~------------------x L------------------x

YI 12.1 Droites de régression possibles dallS une régressiOlllinéllire simple

En pratique, la valeur des paramètres n’est pas connue
et doit être estimée en utilisant les données d’un
échantillon. D’où l’équation estimée de la
régression linéaire simple :
ŷ = b0 + b1 x
(droite de régression estimée)
II. La méthode des moindres carrés :

La méthode des moindres carrés est une procédure qui

permet d’utiliser les données de l’échantillon pour estimer
l’équation de la régression (b0 et b1). Elle consiste à
minimiser la somme des écarts au carré :

2
min ∑ (yi − ŷi )

Ainsi, la pente et l’ordonnée à l’origine de l’équation

estimée de la régression sont données par :

b =
∑ (x − x )(y − y)
i i
1 b0 = y − b1 x
∑(x − x )
i
2
Exemple : Considérons les données collectées sur les
ventes mensuelles d’un échantillon de 10 restaurants d’une
chaîne de restaurants, par-rapport à la population locale :

Restaurant i Population Ventes mensuelles

(en milliers : xi) (en milliers de dh)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
III. Coefficient de détermination :

Une fois l’équation estimée de la régression établie,

la question qui se pose est : Dans quelle mesure
cette équation s’ajuste-t-elle aux données?

Nous montrerons ainsi que le coefficient de

détermination fournit une mesure de l’adéquation
de l’équation estimée de la régression.
Pour la ième observation, le ième résidu (ou erreur
commise) est donné par :

yi − ŷi

La somme de ces résidus, ou erreurs, au carré

correspond à la quantité minimisée par la
méthode des moindres carrés. Cette quantité,
aussi appelée : somme des carrés des résidus,
est donnée par :

2
SCres = ∑ (yi − ŷi )
D’autre part, pour estimer les yi sans utiliser les xi,
on utilise y la moyenne des yi. Ainsi, pour la ième
observation, yi − y fournit une mesure de l’erreur
commise en utilisant y pour estimer les ventes.

D’où la somme des carrés totale donnée par:

2
SCT = ∑ (yi − y )
Enfin, pour déterminer dans quelle mesure les
valeurs ŷ de la droite de régression dévient de la
moyenne ,yune autre somme des carrés est calculée.

Cette somme est appelée somme des carrés de

la régression, et elle est donnée par :

2
SCreg = ∑ ( ŷi − y )

Ainsi, on a :

SCT = SCreg + SCres

D’autre part, le coefficient de corrélation de
l’échantillon peut être calculé de la façon suivante :

rxy = (signe de b1 ) r 2
IV. Hypothèses du modèle :

Même avec une valeur du coefficient de

détermination assez élevé, une analyse approfondie
de la robustesse du modèle supposé doit être faite.

Pour cela, des tests de signification doivent être

effectués et sont basés sur les hypothèses suivantes,
concernant le terme d’erreur ε :
Hypothèses sur le terme d’erreur ε dans le modèle
de la régression : y = β0 + β1 x + ε

(H1) E(ε ) = 0 (donc E(y) = β0 + β1 x )

(H2) La variance de ε notée σ 2 est la même pour

toutes les valeurs de x.

(H3) Les valeurs de ε sont indépendantes entre

elles.

(H4) Le terme d’erreur ε est une v. a. normalement

distribuée (et donc y aussi).
V.Test de signification :

Pour l’équation de régression simple, on a :

E(y) = β0 + β1 x

Ainsi, si β1 = 0 alors E(y) = β0 ; càd x et y ne sont

pas liées; sinon, les deux variables le sont (si
). β1 ≠ 0

Il faudrait donc effectuer un test d’hypothèses pour

déterminer si β1 = 0 .
Estimation de σ 2 :

La moyenne des carrés des résidus fournit

une estimation de σ 2 :
2 SCres
s = MCres =
n−2
((n-2) ddl)

MCres fournit une estimation sans biais de σ 2 .

Erreur type de l’estimation :

SCres
s = MCres =
n−2
V-1 Test t de Student :

On teste les hypothèses suivantes concernant β1 :

H 0 : β1 = 0
H a : β1 ≠ 0

Notons d’abord que b0 et b1 sont des statistiques

d’échantillonnage qui ont leur propre distribution
d’échantillonnage; ainsi :
Les propriétés de la distribution d’échantillonnage
pour b1 sont données par :

Espérance : E(b1 ) = β1

σ
Ecart type de b1 : σ b1 =
∑ i
(x − x ) 2

Forme de la distribution: Normale.

Comme σ n’est pas connue, alors on calcule :

s
Ecart type estimé de b1 : sb1 =
∑ i
(x − x ) 2
Test de signification de Student dans le cadre
d’une régression linéaire simple :
H 0 : β1 = 0
H a : β1 ≠ 0

b1
Statistique de test : t=
sb1

Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
t ≤ −tα /2 ou t ≥ tα /2
où tα /2 est basé sur la distribution de Student à (n-2) ddl.
Intervalle de confiance pour β1 :

L’intervalle de confiance pour β1 est :

b1 ± tα /2 sb1

au coefficient de confiance (1− α ) et à (n-2) ddl.

Au seuil de 99%, l’intervalle de confiance nous offre une

alternative pour conclure le test d’hypothèses dans le cadre
de notre exemple.

En effet, puisque 0, la valeur hypothétique de β1 n’appartient

pas à l’intervalle de confiance, nous pouvons alors rejeter H0
et conclure qu’une relation statistiquement significative
existe entre la taille de la population et les ventes
mensuelles.
V-2 Test F de Fisher :

Si β1 = 0, alors la moyenne des carrés de la

régression fournit une autre estimation de σ 2 :
SCreg
MCreg =
Nbr ddl
Pour les modèles de régression considérés ici, le
nombre ddl = nbr de var. indépendantes; càd. :

SCreg SCreg
MCreg = =
Nbr de var. indépendantes 1
Test F de Fisher :

Statistique du test de Fisher :

MCreg
F=
MCres
MCreg suit une loi de Fisher avec 1 ddl au
MCres
numérateur et n-2 ddl au dénominateur
Test de signification de Fisher:

H 0 : β1 = 0
H a : β1 ≠ 0

Statistique de test : F = MCreg

MCres

Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
F ≥ Fα
où Fαest basé sur la distribution de Fisher à 1 ddl au
numérateur et (n-2) ddl au dénominateur.
Tableau ANOVA :

Source Somme Degrés Moyenne des carrés F

de la des de liberté
variation carrés
Régression SCreg 1 SCreg MCreg
MCreg = F=
1 MCres

SCres
Résidu SCres n-2 MCres =
n−2

Totale SCT n-1

Inférence sur β0 :
Distribution d échantillonnage
FSTG Marrakech

La distribution d’échantillonnage de l’estimateur b0 est une distribution

normale :
) # & ,
1/2

+ % ( .
2
+ % 1 x ( .
Régression Linéaire II

b0 N + β0 ;σ + n .
%n 2 (
+
+ % ∑ ( xi − x ) ( .
.
* $ i=1 ' -
Pr. AIT BABRAM Mohamed

b0 − β0
z=
σ ( b0 )
z N (0,1)
Inférence sur b
Remarque : Dans le cas d’un petit échantillon, l’écart réduit suit une loi
de Student :
FSTG Marrakech

b0 − β 0
t= T (n − 2)
s ( b0 )
Régression Linéaire II

1/ 2
# &
% (
%1 x2 (
s (b0 ) = s% + (
n n
Pr. AIT BABRAM Mohamed

2
% ∑ ( xi − x) (
%
$ i =1
(
'
Remarque : Dans le cas où la taille de l échantillon est grande, la
distribution de l écart réduit est

b0 − β 0
t= N ( 0;1)
s ( b0 )
Intervalle de confiance pour β0 :
FSTG Marrakech

L’intervalle de confiance pour β0 est :

b0 − s ( b0 ) × tα /2; (n−2) ≤ β0 ≤ b0 − s ( b0 ) × tα /2; (n−2)

Régression Linéaire II

f(n-2)
1-α
Pr. AIT BABRAM Mohamed

α/2 α/2

- ta / 2;(n -2 ) t a / 2 ;( n - 2 )
Densité de probabilité de la loi
Student avec (n-2) degré de liberté
Exercice :
Considérons le tableau d’observations suivant:
xi 1 2 3 4 5
yi 3 7 5 11 14

a) Représenter le nuage de points associé à ces données.

b) Développer l’équation estimée de la régression.
c) Utiliser l’équation estimée de la régression pour prévoir
la valeur de y lorsque x=4.
d) Calculer la MCres et l’erreur type de l’estimation.
e) Calculer l’écart type estimé de b1.
f) Utiliser le test de Student et de Fisher pour tester les
hypothèses suivantes :
H 0 : β1 = 0
H a : β1 ≠ 0
g) Présenter les résultats sous forme d’un tableau ANOVA.

Vous aimerez peut-être aussi

S6 TD1
Pas encore d'évaluation
S6 TD1
9 pages
Analyse Corrélation Endettement-Rentabilité
Pas encore d'évaluation
Analyse Corrélation Endettement-Rentabilité
3 pages
Exercices de régression linéaire multiple
Pas encore d'évaluation
Exercices de régression linéaire multiple
15 pages
Analyse de la Régression Linéaire Simple
Pas encore d'évaluation
Analyse de la Régression Linéaire Simple
95 pages
Cours Intervalle de Confiance
Pas encore d'évaluation
Cours Intervalle de Confiance
7 pages
Methodes Reduction Variance
Pas encore d'évaluation
Methodes Reduction Variance
78 pages
TD - Régression Linéaire
Pas encore d'évaluation
TD - Régression Linéaire
2 pages
Calcul de Probabilites - Faseg-Licprossa - 23-24 Def - Et
Pas encore d'évaluation
Calcul de Probabilites - Faseg-Licprossa - 23-24 Def - Et
41 pages
TD1 1
100% (1)
TD1 1
3 pages
Serie TD1 Statistiques
100% (1)
Serie TD1 Statistiques
2 pages
Estimation Statistique Simplifiée
100% (1)
Estimation Statistique Simplifiée
30 pages
Probabilité Pourr L'assurance
Pas encore d'évaluation
Probabilité Pourr L'assurance
5 pages
Méthode des Différences Finies EDP
Pas encore d'évaluation
Méthode des Différences Finies EDP
50 pages
Chapitre 5 - SDCP 2023
Pas encore d'évaluation
Chapitre 5 - SDCP 2023
95 pages
Devoir Semaine 3
Pas encore d'évaluation
Devoir Semaine 3
1 page
Série #2 - Économétrie
100% (1)
Série #2 - Économétrie
3 pages
Logarithmes et Exponentielles : Concepts Clés
Pas encore d'évaluation
Logarithmes et Exponentielles : Concepts Clés
4 pages
Analyse de Données pour M1 Info
Pas encore d'évaluation
Analyse de Données pour M1 Info
94 pages
Cours de Probabilité et Statistique: Exercices et Solutions
Pas encore d'évaluation
Cours de Probabilité et Statistique: Exercices et Solutions
11 pages
Université Paris Ouest Nanterre La Défense U.F.R. Segmi Année Universitaire 2013 2014. Méthodes Numériques
Pas encore d'évaluation
Université Paris Ouest Nanterre La Défense U.F.R. Segmi Année Universitaire 2013 2014. Méthodes Numériques
61 pages
Pratique Du Maximum de Vraisemblance
100% (1)
Pratique Du Maximum de Vraisemblance
6 pages
TD Matrices et Systèmes Linéaires 2024
Pas encore d'évaluation
TD Matrices et Systèmes Linéaires 2024
2 pages
TD - La Modélisation Mathématique
Pas encore d'évaluation
TD - La Modélisation Mathématique
2 pages
Test d'hypothèse sur les pièces de monnaie
Pas encore d'évaluation
Test d'hypothèse sur les pièces de monnaie
6 pages
Mémoire Lionel
Pas encore d'évaluation
Mémoire Lionel
98 pages
Cours Extremes
Pas encore d'évaluation
Cours Extremes
40 pages
Introduction aux Vecteurs Aléatoires et Fonctions Génératrices
Pas encore d'évaluation
Introduction aux Vecteurs Aléatoires et Fonctions Génératrices
37 pages
Optimisation sous contraintes : Concepts et Exercices
Pas encore d'évaluation
Optimisation sous contraintes : Concepts et Exercices
19 pages
Dénombrement Et Probabilité
Pas encore d'évaluation
Dénombrement Et Probabilité
10 pages
Statistiques Appliquées (L3 D'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé
Pas encore d'évaluation
Statistiques Appliquées (L3 D'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé
7 pages
Propriétés et Calculs de la Loi Normale
Pas encore d'évaluation
Propriétés et Calculs de la Loi Normale
21 pages
Corrigés TD4 2022
Pas encore d'évaluation
Corrigés TD4 2022
15 pages
Statistique Mathématique Master I
100% (1)
Statistique Mathématique Master I
80 pages
Wa0003.
Pas encore d'évaluation
Wa0003.
2 pages
TD 1 Version 1
Pas encore d'évaluation
TD 1 Version 1
2 pages
Espérance Conditionnelle et Chaînes de Markov
100% (1)
Espérance Conditionnelle et Chaînes de Markov
169 pages
Théorie et Applications du Contrôle
Pas encore d'évaluation
Théorie et Applications du Contrôle
263 pages
Diﬀérentiabilité des fonctions multivariables
Pas encore d'évaluation
Diﬀérentiabilité des fonctions multivariables
54 pages
02 Ex Processus Stoch
Pas encore d'évaluation
02 Ex Processus Stoch
16 pages
Méthodes Numériques Pour Le Pricing D'options
Pas encore d'évaluation
Méthodes Numériques Pour Le Pricing D'options
10 pages
Introduction à l'Économétrie S1
Pas encore d'évaluation
Introduction à l'Économétrie S1
4 pages
Chapitre - 3 - Régression Multiple
Pas encore d'évaluation
Chapitre - 3 - Régression Multiple
27 pages
TD Probabilité 2
100% (3)
TD Probabilité 2
3 pages
Statistiques Descriptives et Analyses de Données 2023-2024
100% (1)
Statistiques Descriptives et Analyses de Données 2023-2024
8 pages
Série de TD1: CH1 Statistiques Descriptives 1 Exercice 1
Pas encore d'évaluation
Série de TD1: CH1 Statistiques Descriptives 1 Exercice 1
10 pages
Modélisation des Séries Chronologiques
Pas encore d'évaluation
Modélisation des Séries Chronologiques
19 pages
TD 2
Pas encore d'évaluation
TD 2
12 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
20 pages
Serie D'exercices Corrigés-1
Pas encore d'évaluation
Serie D'exercices Corrigés-1
6 pages
Diagonalisation
Pas encore d'évaluation
Diagonalisation
22 pages
Jour 08 - Le Coefficient de Détermination
Pas encore d'évaluation
Jour 08 - Le Coefficient de Détermination
12 pages
Analyse Math PR - Ait Daoud TD
Pas encore d'évaluation
Analyse Math PR - Ait Daoud TD
48 pages
Régression Linéaire en Économétrie
100% (1)
Régression Linéaire en Économétrie
4 pages
Cours de Statistiques Appliquée
Pas encore d'évaluation
Cours de Statistiques Appliquée
19 pages
Echantillonnage Et Estimation
Pas encore d'évaluation
Echantillonnage Et Estimation
48 pages
Method Probabilistes Pour Des Modeles Financiers PDF
Pas encore d'évaluation
Method Probabilistes Pour Des Modeles Financiers PDF
50 pages
Régression Linéaire Simple et Tests Statistiques
Pas encore d'évaluation
Régression Linéaire Simple et Tests Statistiques
36 pages
Cours2 ADD
Pas encore d'évaluation
Cours2 ADD
45 pages
Méthode Linéaire Gaussienne Simple
Pas encore d'évaluation
Méthode Linéaire Gaussienne Simple
60 pages
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
Pas encore d'évaluation
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
26 pages
Random Forest
Pas encore d'évaluation
Random Forest
17 pages
Exercices de Synthèse Corrigés AFC 2-Fi22261063
Pas encore d'évaluation
Exercices de Synthèse Corrigés AFC 2-Fi22261063
10 pages
Guide SPSS pour la Régression Linéaire
Pas encore d'évaluation
Guide SPSS pour la Régression Linéaire
103 pages
Régression Linéaire Poids Pères-Fils
Pas encore d'évaluation
Régression Linéaire Poids Pères-Fils
1 page
Cours 601
Pas encore d'évaluation
Cours 601
22 pages
Cours Logiciel R
Pas encore d'évaluation
Cours Logiciel R
42 pages
TP 2 Proba Stats: 1 Jeux de Donn Ees
Pas encore d'évaluation
TP 2 Proba Stats: 1 Jeux de Donn Ees
4 pages
Ch4 - Les Statistiques À Deux Variables
Pas encore d'évaluation
Ch4 - Les Statistiques À Deux Variables
51 pages
Cours AFC
Pas encore d'évaluation
Cours AFC
27 pages
Cours ADD - ACP - SUP MTI - P2 - Ouazza
Pas encore d'évaluation
Cours ADD - ACP - SUP MTI - P2 - Ouazza
53 pages
Corrigé Examen Proba-Stat L1
Pas encore d'évaluation
Corrigé Examen Proba-Stat L1
5 pages
Cours de Machine Learning: Théorie et Pratique
Pas encore d'évaluation
Cours de Machine Learning: Théorie et Pratique
84 pages
Analyse de séries temporelles avec R
Pas encore d'évaluation
Analyse de séries temporelles avec R
6 pages
Statistiques Bivariées Simplifiées
Pas encore d'évaluation
Statistiques Bivariées Simplifiées
7 pages
Ajust 01
Pas encore d'évaluation
Ajust 01
9 pages
Test de Chow et Loi de Fisher
Pas encore d'évaluation
Test de Chow et Loi de Fisher
13 pages
Syllabus Stat
Pas encore d'évaluation
Syllabus Stat
4 pages
Cours 08 (20-12-2023)
Pas encore d'évaluation
Cours 08 (20-12-2023)
14 pages
Econométrie I: Mounir JERRY Année Universitaire 2021-2022
Pas encore d'évaluation
Econométrie I: Mounir JERRY Année Universitaire 2021-2022
68 pages
02-Chap2 Supervised-Learn Reg Lin Simp-2024
Pas encore d'évaluation
02-Chap2 Supervised-Learn Reg Lin Simp-2024
343 pages
Variabel E-Commerce
Pas encore d'évaluation
Variabel E-Commerce
2 pages
Méthode Driscoll-Kraay en économétrie
100% (1)
Méthode Driscoll-Kraay en économétrie
5 pages
Perceptron Multicouche
Pas encore d'évaluation
Perceptron Multicouche
6 pages
Analyse du transport public à Tripoli
Pas encore d'évaluation
Analyse du transport public à Tripoli
22 pages
Présentation ANOVA
Pas encore d'évaluation
Présentation ANOVA
28 pages
Analyse Descriptive Des Données
Pas encore d'évaluation
Analyse Descriptive Des Données
21 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
SPAD Decision
Pas encore d'évaluation
SPAD Decision
210 pages
TD Statistique
Pas encore d'évaluation
TD Statistique
2 pages