0% ont trouvé ce document utile (0 vote)

250 vues26 pages

Régression linéaire : influence des prédicteurs

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

250 vues26 pages

Régression linéaire : influence des prédicteurs

Transféré par

Norbert Durand

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

2 juin 2006 1

Introduction à la régression
cours n°3
Influence d’un prédicteur

ENSM.SE – 1A
Olivier Roustant
2 juin 2006 2

Objectif du cours
 Utiliser les résultats théoriques sur
l’estimation des paramètres pour savoir si un
prédicteur d’un modèle linéaire est influent
2 juin 2006 3

Influent ou non influent ?

yi = β0 + β1xi + ei avec e1, …, e4 i.i.d N(0, 0.042)
Imaginer un pèse-
personne avec une
erreur de mesure
de 50 kg !

"ˆ1 (# ) < 0 "ˆ1 (# ') > 0 !!

En fait ici, l’erreur d’estimation sur β1 = |β1| !! (=0.2)

! !
2 juin 2006 4

Influent ou non influent (suite)

Le même ex., mais en planifiant mieux les expériences

Cette fois, l’erreur d’estimation sur la pente = 0.0536

2 juin 2006 5

Exercice
 Vous pouvez réaliser n expériences pour estimer un
phénomène linéaire sur [a,b] impliquant 1 prédicteur
 Comment répartir les expériences dans le domaine expérimental
[a,b] de façon à ce que l’estimation soit la plus précise possible ?
2 juin 2006 6

Influent ou non influent (suite)

Le même exemple, planification optimale (voir diapo. 26)

L’erreur d’estimation sur la pente = 0.04

2 juin 2006 7

Influent ou non influent ?

Morale de l’exemple

 Prendre en compte l’erreur d’estimation d’un

paramètre pour savoir s’il est important ou pas
→ Décision en milieu incertain : test statistique

 L’impossibilité de décider peut venir d’une

mauvaise planification des expériences
2 juin 2006 8

Formalisation
 Considérons le modèle linéaire
yi = β0 +β1x1,i + … + βpxp,i + ei
avec e1, …, en i.i.d N(0,σ2)

 Le prédicteur xi est influent si βi ≠ 0

 Test statistique opposant les hypothèses
{βi = 0} et {βi ≠ 0}
2 juin 2006 9

Construction du test statistique

 1ère étape : hypothèse H0
 On veut contrôler le risque de décider qu’un
prédicteur est influent alors qu’il ne l’est pas.
Quelle est l’hypothèse H0 ?

H 0 = {" i = 0}

 Autre raison : pouvoir faire les calculs !

!
2 juin 2006 10

Construction du test (suite)

 2ème étape : choix d’une statistique de décision
 On part de l’estimateur des moindres carrés (EMC)
de βi
 Matriciellement, on vérifie qu’on a :
(Y-Xβ)’(Y-Xβ) minimum ssi X’(Y-Xβ) = 0
ssi (X’X) β = X’Y
D’où
ˆ #1
" = (X' X) X'Y
2 juin 2006 11

Construction du test (suite)

 2ème étape (suite) : loi de l’EMC sous H0 ?
 Une combinaison linéaire de v.a. de lois normales
indépendantes est encore de loi normale (admis)
 Ici, "ˆ = (X' X)#1 X'Y = (X' X)#1 X'(X" + e)
d’où "ˆ = " + (X' X)#1 X'e

!  Chaque "ˆ i est donc une combinaison linéaire des e ,

i
! centrée sur β ⇒ loi normale centré sur β
i i

!
2 juin 2006 12

Construction du test (suite)

 2ème étape (suite)
 Exercice. Pour un vecteur u, n×1, on définit la
matrice de covariance par cov(u)= (cov(ui,uj))1≤i,j≤n
a) Mq Cov(u) = E((u-m)(u-m)’), avec m=E(u) (vect. n×1)
b) Mq Cov(e) = σ2 In
c) Déduire de a) et b) que cov("ˆ ) = # 2 (X' X)$1
puis que var("ˆ i ) := # i 2 = # 2 ((X' X)$1 ) ii

 Conclusion : sous
! H , l’EMC est de loi N(0, σ 2)
0 i
!
2 juin 2006 13

Construction du test (suite)

 2ème étape (suite)
 La loi de l’estimateur dépend des paramètres
 Intuitivement, sous H0 :
ˆ
"
"ˆ i ~ N(0,# ((X' X) ) ii ) %
2 $1 i
$1
& N(0,1)
#ˆ ((X' X) ) ii
 Résultat exact : remplacer la loi N(0,1) par la loi de
Student tn-p-1.
!
"ˆ i
 Conclusion : choix de la statistique T =
#ˆ ((X' X)$1 ) ii
2 juin 2006 14

Construction du test (suite)

 2ème étape (résumé)
"ˆ i
 Choix de la statistique de décision T =
#ˆ ((X' X)$1 ) ii

 Interprétation : estimation du paramètre rapporté à

son écart-type d’estimation
!
 Vocabulaire : T est appelé t-ratio (à cause de la loi
de Student, notée t)
– Propriété : T est de loi de Student tn-p-1
→ En pratique, dès que n-p-1≥20, on approche tn-p-1 par
N(0,1)
2 juin 2006 15

Construction du test (suite)

 3ème étape : détermination d’un seuil
"ˆ i,obs
 Notation : Tobs =
#ˆ obs ((X' X)$1 ) ii

 Au niveau 5%, on rejette H0

–!n-p-1≥20 : si Tobs dépasse 1.96 en valeur absolue
– n-p-1<20 : utiliser les tables de la loi de Student
– Mieux (dans tous les cas) : utiliser la p-valeur
2 juin 2006 16

Construction du test (fin)

 3ème étape : p-valeur
 On appelle p-valeur la probabilité d’obtenir
pire que ce qu’on a :
p - valeur = PH 0 ( T > Tobs )

 Permet de ne pas avoir à calculer de seuil :

 p-valeur < 5% ⇒ rejet au niveau 5%
!
 p-valeur < 1% ⇒ rejet au niveau 1%
…
2 juin 2006 17

Test de signification : pratique

 En pratique, les logiciels donnent le tableau
suivant :
erreur
coefficient estimation t " ratio p " valeur
d'estimation
#ˆ i,obs
#i #ˆ i,obs $ˆ i,obs Tobs = PH 0 ( T > Tobs )
$ˆ i,obs

!
2 juin 2006 18

Exemple 1
Données de pollution (cf cours 1)
2 juin 2006 19

Régression avec R
Le fichier de données : NO3 SO4
(format .txt) 0,45 0,78
0,09 0,25
lm : 1,44 2,39
linear model … …

> pollution <- read.table("pollution.txt", header=TRUE, dec=",", sep="\t")

> modele_degre_1 <- lm(log(NO3)~log(SO4), data=pollution)
> summary(modele_degre_1)
> modele_degre_2 <- lm(log(NO3)~log(SO4)+I(log(SO4)^2), data=pollution)
> summary(modele_degre_2)
2 juin 2006 20

Sorties à commenter
Call:
lm(formula = log(NO3) ~ log(SO4),
Comme
datan-p-1>20,
= pollution)
on peut aussi se baser
sur le fait que |t-ratio| > 2
Residuals: ou
Min 1Q Median 3Q Maxque l’erreur d’estimation est
-0.80424 -0.14485 -0.01087 0.16564 0.56666
< la moitié de l’estimation

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.43642 0.03679 -11.86 <2e-16 ***
log(SO4) 0.92168 0.03356 27.47 <2e-16 ***
---
p-valeur
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1<‘ 0.05
’1
⇒ paramètres significatifs au niveau 5%
Residual standard error: 0.2417 on (on
165est mêmeoftrès
degrees large : p=2e-16 !)
freedom
Multiple R-Squared: 0.8205, Adjusted R-squared: 0.8195
F-statistic: 754.4 on 1 and 165 DF, p-value: < 2.2e-16
2 juin 2006 21

Call:
lm(formula = log(NO3) ~ log(SO4)
Comme
+ I(log(SO4)^2),
n-p-1>20, ondata
peut
= pollution)
aussi se baser
sur le fait que |t-ratio| < 2
Residuals: ou
Min 1Q Median 3Q Max que l’erreur d’estimation est
-0.79819 -0.14085 -0.01470 0.16158 0.57136
> la moitié de l’estimation

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.42918 0.03955 -10.852 <2e-16 ***
log(SO4) 0.95337 0.07098 13.432 <2e-16 ***
I(log(SO4)^2) 0.01886 0.03720 0.507 0.613
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2423 on 164 degreesp-valeur > 0.05

of freedom
Multiple R-Squared: 0.8208, paramètreR-squared:
⇒ Adjusted non significatif
0.8186au niveau 5%
F-statistic: 375.7 on 2 and 164 DF, p-value: < 2.2e-16
2 juin 2006 22

Exemple 2
Retour sur les simulations (cf transp. n°3)
yi = β0 + β1xi + ei avec e1, …, e4 i.i.d N(0, 0.042)
2 juin 2006 23

Call:
La t-valeur est > 1.96 en valeur absolue,
lm(formula = ysim ~ experiences)
Pourtant on ne rejette pas H0
Cela est dû au fait qu’on ne peut pas utiliser
Residuals:
l’approximation normale (ici n=4 << 20)
1 2 3 4
La p-valeur est calculée à partir de la loi de Student
0.038612 -0.038612 0.002785 -0.002785

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.1404 0.0987 11.554 0.00741 **
experiences -0.4099 0.1936 -2.118 0.16838
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Moralité : la pente de la droite est négative,
Residual standard error: 0.03871Maison 2l’erreur
degreesd’estimation
of freedom est trop importante
Multiple R-Squared: 0.6916, Et le paramètre
Adjusted est statistiquement
R-squared: 0.5374 non
significatif
F-statistic: 4.485 on 1 and 2 DF, p-value: au niveau 5% …rassurant !
0.1684
2 juin 2006 24

Exemple 2 (suite)
Retour sur les simulations (cf transp. n°6)
yi = β0 + β1xi + ei avec e1, …, e4 i.i.d N(0, 0.042)
2 juin 2006 25

Call:
lm(formula = ysim ~ experiences)
Moralité : la pente de la droite est négative,
Residuals: Cette fois l’erreur d’estimation est assez faible
1 2 3 4 Et le paramètre est statistiquement
0.01300 -0.01300 0.03190 -0.03190
significatif au niveau 5% (mais pas 1%)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.97956 0.02436 40.22 0.000618 ***
experiences -0.26142 0.03444 -7.59 0.016921 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.03444 on 2 degrees of freedom

Multiple R-Squared: 0.9664, Adjusted R-squared: 0.9497
Remarque : la pente
F-statistic: 57.6 réelle (inconnue)
on 1 and est
2 DF, p-value: 0.01692
- 0.2
2 juin 2006 26

Exercice : planification des

expériences en dimension 1
 Vérifier que, en dimension 1
1 1 " x (x%
2
"1 x% (1
X' X = n$ ' puis ( X' X ) = $ '
#x x 2& n x ( x #(x 1 &
2 2

2
# 1
puis var "ˆ1 = cov("ˆ1, "ˆ1 ) = (# 2 (X' X)$1 )11 =
( ) n x2 $ x2
!  En déduire que pour minimiser l’erreur d’estimation de la pente, il
faut que la variance empirique des xi soit la plus grande possible
!  Prenons n pair, et considérons le domaine expérimental [-1,1]. Montrer que
le maximum est atteint lorsque la moitié des points est placée sur le bord
gauche (en x = -1), et l’autre moitié sur le bord droit (x = 1)

Vous aimerez peut-être aussi

Regression Linéaire Simple PDF
Pas encore d'évaluation
Regression Linéaire Simple PDF
7 pages
Régression Linéaire Simple: Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire Simple: Concepts et Estimations
7 pages
CM Regression Modelegaussien
Pas encore d'évaluation
CM Regression Modelegaussien
54 pages
7.cours Regression
Pas encore d'évaluation
7.cours Regression
8 pages
TD de Economitrie - 2022 - 2023
Pas encore d'évaluation
TD de Economitrie - 2022 - 2023
26 pages
Partie 2-1 Régression Linéaire Simple
Pas encore d'évaluation
Partie 2-1 Régression Linéaire Simple
25 pages
S6-Sections 3 - 4-Chap 2-Partie1-20-22
Pas encore d'évaluation
S6-Sections 3 - 4-Chap 2-Partie1-20-22
44 pages
Formulaire de Statistique Inférentielle
100% (2)
Formulaire de Statistique Inférentielle
8 pages
Chapitre1 Eco Explication-2024-2025
Pas encore d'évaluation
Chapitre1 Eco Explication-2024-2025
15 pages
Modèle de régression linéaire multiple
Pas encore d'évaluation
Modèle de régression linéaire multiple
12 pages
Tests Et Prévisions
Pas encore d'évaluation
Tests Et Prévisions
21 pages
Variables Expliquées et Explicatives
Pas encore d'évaluation
Variables Expliquées et Explicatives
20 pages
S6 TD1
Pas encore d'évaluation
S6 TD1
9 pages
Régression Linéaire
Pas encore d'évaluation
Régression Linéaire
20 pages
Stat Cours
Pas encore d'évaluation
Stat Cours
27 pages
Régression Linéaire Simplifiée
Pas encore d'évaluation
Régression Linéaire Simplifiée
37 pages
Régression Linéaire: Concepts et Applications
Pas encore d'évaluation
Régression Linéaire: Concepts et Applications
21 pages
Suite Chapitre 1
Pas encore d'évaluation
Suite Chapitre 1
3 pages
Analyse de régression et ajustement statistique
Pas encore d'évaluation
Analyse de régression et ajustement statistique
13 pages
Cours m1 Econometrie Appliquee Slide34
100% (2)
Cours m1 Econometrie Appliquee Slide34
60 pages
Apprentissage 1516 Lasso
Pas encore d'évaluation
Apprentissage 1516 Lasso
46 pages
ST M Modlin Regmult
Pas encore d'évaluation
ST M Modlin Regmult
13 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
83 pages
Corrigé d'Économétrie Avancé
Pas encore d'évaluation
Corrigé d'Économétrie Avancé
15 pages
TD Modele Lineaire 21 22
Pas encore d'évaluation
TD Modele Lineaire 21 22
22 pages
Régression Linéaire et Conductivité
Pas encore d'évaluation
Régression Linéaire et Conductivité
6 pages
Modélisation Linéaire et ANOVA
Pas encore d'évaluation
Modélisation Linéaire et ANOVA
46 pages
Exams
Pas encore d'évaluation
Exams
7 pages
Introduction à l'économétrie et variance
Pas encore d'évaluation
Introduction à l'économétrie et variance
19 pages
Tests de Student et Fisher en Statistique
Pas encore d'évaluation
Tests de Student et Fisher en Statistique
7 pages
Interprétation des résultats en Eviews
Pas encore d'évaluation
Interprétation des résultats en Eviews
3 pages
Régression Linéaire Avancée
Pas encore d'évaluation
Régression Linéaire Avancée
74 pages
Analyse statistique du stress et régression
Pas encore d'évaluation
Analyse statistique du stress et régression
4 pages
Cours5-Review Stats in R
Pas encore d'évaluation
Cours5-Review Stats in R
38 pages
Chap2 2024 2025
Pas encore d'évaluation
Chap2 2024 2025
14 pages
Examen de Rattrapage - StatMath - 2023-2024 - Section A-B
Pas encore d'évaluation
Examen de Rattrapage - StatMath - 2023-2024 - Section A-B
2 pages
Introduction à la Régression Linéaire
100% (1)
Introduction à la Régression Linéaire
49 pages
EXER CORR Modèle Linéaire Simple
100% (1)
EXER CORR Modèle Linéaire Simple
15 pages
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
Pas encore d'évaluation
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
31 pages
Modèle de Régression Linéaire Multiple
Pas encore d'évaluation
Modèle de Régression Linéaire Multiple
52 pages
Régression Linéaire Simplifiée
Pas encore d'évaluation
Régression Linéaire Simplifiée
30 pages
MOOC Cours 15 RegLin3 V2 Impression
Pas encore d'évaluation
MOOC Cours 15 RegLin3 V2 Impression
14 pages
Regression Lineaire Ols
Pas encore d'évaluation
Regression Lineaire Ols
63 pages
Cours RLMultiple
100% (2)
Cours RLMultiple
60 pages
Estimations et Tests Statistiques sur Échantillons
Pas encore d'évaluation
Estimations et Tests Statistiques sur Échantillons
53 pages
Seance 8
Pas encore d'évaluation
Seance 8
10 pages
Corrigé TD Statistique M1-GEO Rennes 2
Pas encore d'évaluation
Corrigé TD Statistique M1-GEO Rennes 2
21 pages
Regression HD
Pas encore d'évaluation
Regression HD
64 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
42 pages
Stat Proba 2
Pas encore d'évaluation
Stat Proba 2
20 pages
Économétrie et SAS : Cours M1 IES
Pas encore d'évaluation
Économétrie et SAS : Cours M1 IES
60 pages
Exercices d'économétrie et régression linéaire
Pas encore d'évaluation
Exercices d'économétrie et régression linéaire
2 pages
TD 2
Pas encore d'évaluation
TD 2
12 pages
Statistique Bivariée
Pas encore d'évaluation
Statistique Bivariée
9 pages
Statist Econom Trie AES 1997 Exo 1
Pas encore d'évaluation
Statist Econom Trie AES 1997 Exo 1
4 pages
Exercices de régression linéaire multiple
Pas encore d'évaluation
Exercices de régression linéaire multiple
15 pages
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
Pas encore d'évaluation
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
26 pages
Résumé Cours
Pas encore d'évaluation
Résumé Cours
4 pages
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
Pas encore d'évaluation
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
18 pages
Paul Genton
Pas encore d'évaluation
Paul Genton
1 page
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
29 pages
Estimation Ponctuelle : Exercices et Solutions
Pas encore d'évaluation
Estimation Ponctuelle : Exercices et Solutions
14 pages
Slide MIFC1
Pas encore d'évaluation
Slide MIFC1
108 pages
Méthodes de Prévision I - Cours ULB
Pas encore d'évaluation
Méthodes de Prévision I - Cours ULB
12 pages
Slide MIFC4
Pas encore d'évaluation
Slide MIFC4
87 pages
Ch1 Introduction
Pas encore d'évaluation
Ch1 Introduction
15 pages
Notes Cours Processus Stochastiques
Pas encore d'évaluation
Notes Cours Processus Stochastiques
60 pages
Estimation et Tests en Modèles Linéaires
Pas encore d'évaluation
Estimation et Tests en Modèles Linéaires
11 pages
Mon Cours de SGBD
Pas encore d'évaluation
Mon Cours de SGBD
53 pages
Fiches HG Apc 5eme 2025 Version Finale Apc PDF Ok
Pas encore d'évaluation
Fiches HG Apc 5eme 2025 Version Finale Apc PDF Ok
156 pages
Introduction au système Linux et fichiers
Pas encore d'évaluation
Introduction au système Linux et fichiers
7 pages
Conjugaison des verbes en -ER au présent
Pas encore d'évaluation
Conjugaison des verbes en -ER au présent
1 page
Activités sur "Ma ville" pour l'année 2
Pas encore d'évaluation
Activités sur "Ma ville" pour l'année 2
20 pages
Algèbre 1, IA25-26
Pas encore d'évaluation
Algèbre 1, IA25-26
118 pages
Book 2 - Le Français
Pas encore d'évaluation
Book 2 - Le Français
78 pages
Examens Régionaux
Pas encore d'évaluation
Examens Régionaux
63 pages
Hypothèses Exercices
Pas encore d'évaluation
Hypothèses Exercices
2 pages
Ab Smit
Pas encore d'évaluation
Ab Smit
15 pages
Informatique Traitement de Texte
0% (1)
Informatique Traitement de Texte
62 pages
Libro de Los Gatos
100% (1)
Libro de Los Gatos
149 pages
Formation PHP
Pas encore d'évaluation
Formation PHP
12 pages
ACCES Calcul Mental CM1 - Période 1
Pas encore d'évaluation
ACCES Calcul Mental CM1 - Période 1
15 pages
Exercices de Diagrammes de Flux
Pas encore d'évaluation
Exercices de Diagrammes de Flux
20 pages
3 Java Swing
Pas encore d'évaluation
3 Java Swing
41 pages
Les Appels À Enseigner
Pas encore d'évaluation
Les Appels À Enseigner
90 pages
Création et destruction dans La Peau de Chagrin
Pas encore d'évaluation
Création et destruction dans La Peau de Chagrin
17 pages
Valeurs et Normes en Bien-Être Social
Pas encore d'évaluation
Valeurs et Normes en Bien-Être Social
10 pages
Introduction à l'électrotechnique
Pas encore d'évaluation
Introduction à l'électrotechnique
27 pages
CST4 Savoirs-2025
Pas encore d'évaluation
CST4 Savoirs-2025
8 pages
Mpi Rappels 1
Pas encore d'évaluation
Mpi Rappels 1
20 pages
Plan de construction et plomberie F4
Pas encore d'évaluation
Plan de construction et plomberie F4
2 pages
Technologies éducatives et IA en 2023
Pas encore d'évaluation
Technologies éducatives et IA en 2023
10 pages
Prolog
Pas encore d'évaluation
Prolog
4 pages
106-Article Text-101-1-10-20170103
Pas encore d'évaluation
106-Article Text-101-1-10-20170103
8 pages
Réussir son exposé : conseils pratiques
100% (10)
Réussir son exposé : conseils pratiques
9 pages
Activités de français 4 AM
Pas encore d'évaluation
Activités de français 4 AM
27 pages
Mémoire de Master BENTRARI Mohammed El Amine
Pas encore d'évaluation
Mémoire de Master BENTRARI Mohammed El Amine
96 pages
Formation Google Workspace
Pas encore d'évaluation
Formation Google Workspace
5 pages