Economists
Economists
Économétrie
3ème LFF
2024/2025
SANA BEN SALAH 1
Plan
INTRODUCTION A L’ECONOMETRIE
Chapitre 1 : LE MODELE LINEAIRE SIMPLE
• Définition et écriture du modèle
• Estimation du modèle
• Propriétés des estimateurs
• Tableau d’analyse de la variance et mesure de la qualité d’ajustement
• Inférence statistique sur le modèle linéaire simple
• Prévision dans un modèle linéaire simple
1
SANA BEN SALAH 10/08/2024
Plan
Plan
• Le modèle quasi-général
2
SANA BEN SALAH 10/08/2024
Introduction à l’économétrie
Définition
L’économétrie est un ensemble de techniques statistiques utilisées pour estimer des
relations économiques, évaluer ou implémenter des politiques publiques ou
industrielles. L’application la plus "visible" de l’économétrie est la prévision des
grands indicateurs économiques comme le taux de croissance du PIB ou des taux
d’intérêt.
Elle peut également être utilisée pour prévoir la demande adressée à un bien, évaluer
les effets d’une réforme, ...
SANA BEN SALAH 5
Introduction à l’économétrie
Les questions qu’on va se poser sont en général de la forme : "quelle est la relation
entre une variable Y et une variable X1 ? Ou entre Y et X2 ?" On formalise cela sous
la forme : Y = f(X1, . . . , Xk)
3
SANA BEN SALAH 10/08/2024
Introduction à l’économétrie
Les données disponibles:
Les données utilisées par l’économètre sont de plusieurs types, chacun soulevant des
problèmes spécifiques:
1. Les données en coupe : elles consistent en un échantillon de données sur des
salariés, des consommateurs, des pays... collectées à un moment donné du temps.
2. Les séries temporelles : elles consistent en des données sur une ou plusieurs
variables collectées à intervalles réguliers : les plus fréquentes sont les variables
macroéconomiques et les données financières.
3. Les données de panel : elles consistent en un échantillon de données sur des
salariés, des consommateurs, des pays,... collectées à intervalles réguliers du temps.
Elles fournissent donc l’histoire d’un ensemble d’individus à plusieurs dates.
SANA BEN SALAH 7
Introduction à l’économétrie
Ces données proviennent généralement d’échantillons supposés représentatifs issus
de la population totale. Cela signifie en particulier que l’on ne pourra calculer
qu’une estimation des paramètres à partir de cet échantillon ; il n’est jamais certain
qu’on "identifie" le vrai paramètre.
4
SANA BEN SALAH 10/08/2024
Introduction à l’économétrie
Paramètre estimé, vrai paramètre
Comment estimer les paramètres ?
Tout d’abord, en terme pratique, il s’agit de calculer des estimateurs des paramètres
βj du modèle. Nous allons dans une première partie présenter une procédure
d’estimation simple, celle des moindres carrés ordinaires.
Quelles sont leurs propriétés statistiques ?
Au delà de la question "technique" du calcul des estimateurs, il faut s’interroger sur
leurs propriétés statistiques. En fait, il s’agit de savoir si on estime "bien" les "vrais"
paramètres βj.
Les notions auxquelles on se réfère ici sont celles de l’inférence statistique. Il faut se
souvenir que ce paramètre est estimé à partir d’un échantillon donné, c’est-à-dire un
nombre fini N d’observations pour lesquelles on dispose des mesures des variables
qui nous intéressent. SANA BEN SALAH
9
Introduction à l’économétrie
Même s’il est tiré aléatoirement, cet échantillon est rarement parfait : il y a toujours
un risque qu’il ne soit pas exactement représentatif de la population qu’il est censé
représenter.
Le paramètre estimé à partir d’un échantillon ne correspondra donc pas exactement
au vrai paramètre. Il est a priori dépendant de l’échantillon à partir duquel il a été
calculé : si on utilise deux échantillons différents pour estimer les mêmes
paramètres, il y a de grandes chances pour que les deux estimations soient
différentes.
On va alors s’intéresser à la distribution de ce paramètre. Pour bien comprendre ce
dont il s’agit, il faut imaginer qu’on puisse disposer d’un très grand nombre
d’échantillons tirés à partir de la même population initiale, et qu’on calcule à partir
de chacun de ces échantillons un estimateur du même paramètre : la distribution de
notre estimateur correspond à la manière dont cet ensemble de valeurs se répartit. 10
10
5
SANA BEN SALAH 10/08/2024
Introduction à l’économétrie
La première propriété attendue d’un estimateur est qu’il soit sans biais, c’est-à-dire
que son espérance soit égale au "vrai" paramètre.
Une autre propriété importante est qu’il soit convergent, c’est-à-dire que si la taille
de l’échantillon augmente, le risque de se tromper diminue : à la limite, si on
pouvait observer tout le monde, on s’attend à trouver le vrai paramètre.
Dans la réalité, on ne dispose que d’un seul échantillon, de taille finie, et donc d’un
seul estimateur. Il est nécessaire de pouvoir établir un "diagnostic" à partir de cet
estimateur : est ce qu’on est très loin de la vraie valeur ? Pour cela, la moyenne, ou
l’espérance du paramètre ne suffit pas : il faut connaître toute la distribution du
paramètre. Il sera alors possible de calculer un intervalle de confiance, c’est-à-dire
un intervalle de valeurs auquel le vrai paramètre appartient avec une probabilité
donnée. SANA BEN SALAH 11
11
12
6
SANA BEN SALAH 10/08/2024
• H2 : E u i 0 i
• H3 : V ui 2 i
COV u i ,u j 0 i j , ce qui signifie que ui et uj sont non corrélées
• H4 : u i ~ N 0, 2 i : hypothèse supplémentaire nécessaire pour l’inférence
statistique .
13
14
7
SANA BEN SALAH 10/08/2024
Hypothèses : E u 1 0
. .
E U .
.
E u 0
n
COV u 1 , u n 0
2
V u1 COV u1 , u 2 . . 0 . .
. V u2 . . . . 2 . . .
V U . . . . . . . . .
2
. In
. . . . . . . . . 0
. V u n
. . . . . . . 2
U ~ N n 0, 2 I n (vecteur gaussien)
SANA BEN SALAH 15
15
Observable Y X
Non observable U a et b
16
8
SANA BEN SALAH 10/08/2024
• H2 : E u i 0 i
• H3 : V ui 2 inconnue et COV u i ,u j 0 i j
• H4 : u i ~ N 0, 2 i
SANA BEN SALAH 17
17
18
9
SANA BEN SALAH 10/08/2024
Calcul de â et b̂ :
n
Min Q a,b y a bx
i 1
i i
2
Q a, b
a aˆ 0 1
a
b bˆ
Q a, b
b a aˆ 0 2
b bˆ
SANA BEN SALAH 19
19
n n n
x y nXY
y xnXY i i x X y Y
i i i i
ˆ
d 'où b i 1 i 1 i 1
Sxy
b̂ n
n n
S2x
2 2
xi X
2 x 2 nX 2
x i nXi
i 1
i 1 i 1
20
10
SANA BEN SALAH 10/08/2024
b̂
x X y y Y x
i i i i
b
x X b x X
i i i i
x X x X x X x X
2 2 2 2
i i i i
SANA BEN SALAH 21
21
22
11
SANA BEN SALAH 10/08/2024
yi N a bx i ; 2 i
Calcul de la vraisemblance:
n
L y1, y 2 ,...y n ;a, b, 2
f yi ;a, b, 2
i 1
où f yi ;a, b, 2 1
2
1 2
exp 2 yi a bx i
2
n 1
n
L y1, y 2 ,...y n ;a, b, 2 2 2 2 2
exp 2
2 yi a bxi 2
23
23
a,b, 2
Max Log L y1, y 2 ,...y n ;a, b, 2
Avec :
n
2
n
2
1
Log L y1, y 2 ,...y n ;a, b, 2 Log 2 Log 2 2
2
y a bx
i i
2
n
1
Max Log L Max Log 2 2
2 2
yi a bxi 2
SANA BEN SALAH 24
24
12
SANA BEN SALAH 10/08/2024
n
y a bx
C.N. Log L a a 1 2
0 2 3 2
4 i i 0
b b b 2 2
2 2
Somme des carrés
Log L a a des résidus
2 b b
0 3
2 2
25
25
Principe de M.V :
Max Log L Max
a,b a,b
yi a bxi 2 Min yi a bxi 2
a,b
26
13
SANA BEN SALAH 10/08/2024
P3 : V aˆ
2 x 2
i
2 1 X2
n 2
x X x i X
n 2
i
2
V bˆ
ˆ bˆ
et COV a,
2 X
x X
2
xi X
2
i
P4 : ˆ 2
S 2 û est un estimateur sans biais de la variance de l’erreur.
2
i
n2 SANA BEN SALAH
27
27
Théorème de Gauss-Markov
Parmi les estimateurs linéaires sans biais, les estimateurs des MCO sont à
variance minimale c.-à-d il n'existe pas d'autres estimateurs linéaires sans biais
présentant une plus petite variance.
Les estimateurs des MCO sont dits BLUE (best linear unbiased estimator). Ce sont
des estimateurs efficaces.
SANA BEN SALAH 28
28
14
SANA BEN SALAH 10/08/2024
Soit : yi a bx i u i
Avec : E ui 0
V u i 2 i
COV ui , u j 0 i j
29
y Y y yˆ yˆ Y uˆ yˆ Y uˆ yˆ Y
2 2 2 2
i i i i i i 2 i i
0
y Y yˆ Y uˆ
1 2 1 2 1 2 ˆ
i i i avec Y Y d’après les équations
n n n normales
S2Y S2Yˆ S2uˆ
VT VE VR
L’équation d’analyse de la variance peut être présentée sous cette forme:
y Y yˆ Y uˆ
2 2 2
i i i
30
15
SANA BEN SALAH 10/08/2024
y Y y nY
2 2 2
Avec: SCT i i
SCE yˆ Y bˆ x X
2 2 2
i i
31
32
16
SANA BEN SALAH 10/08/2024
• Dans un modèle sans terme constant du type : yi=axi+ui , R2 ne mesure pas la qualité
d’ajustement. Dans ce cas, R2 peut être négatif, il peut être supérieur à 1 et il est
différent de 1-(SCR/SCT). On ne parle plus d’équation d’analyse de la variance et
SCT ≠ SCE + SCR.
SANA BEN SALAH 33
33
a. Loi de b̂
b̂
x X y
i i
c’est une fonction linéaire d’une loi normale donc:
x X
2
i
2 b̂ b
b̂ N b , 2
et N 0,1
xi X b̂
34
34
17
SANA BEN SALAH 10/08/2024
b. Loi de â
ˆ
â Y bX
â N a ,
2 x 2
i
,
â a
N 0,1
2
n
x Xi
â
c. Loi de S2
S2 SCR
On montre que: n 2 2
2 n 2 ; avec S2 ˆ 2
n2 35
SANA BEN SALAH
35
V. 2. Intervalle de confiance:
36
18
SANA BEN SALAH 10/08/2024
b̂ b
xi X
2
b̂ b
Student n 2
S S
x X
2
i
b̂ b
Student n 2
ˆ b̂
S
avec : ˆ b̂ l’écart type estimé de b̂
x X
2
i SANA BEN SALAH 37
37
b̂ b n 2
P t1n2 t1 1
2
ˆ 2
b̂
P bˆ ˆ bˆ t1n2 b bˆ ˆ bˆ t1n2 1
2 2
IC1 b bˆ ˆ bˆ t1n2
2
avec t n 2 : quantile d’ordre 1 2 d’une loi de Student à (n-2) degrés de liberté.
1
2 SANA BEN SALAH 38
38
19
SANA BEN SALAH 10/08/2024
De même on a:
IC1 a aˆ ˆ aˆ t1n2
2
avec : ˆ â
S x 2
i
l’écart type estimé de â
x X
2
n
i
39
40
20
SANA BEN SALAH 10/08/2024
41
C
n 2
Région critique du test au risque : W Tˆ t1 2
Si TˆC est dans la région critique, on a moins de chances de se tromper en rejetant
l’hypothèse H0 (risque de première espèce).
42
21
SANA BEN SALAH 10/08/2024
2
En pratique, on compare Tˆc à t1n 2:
Rej H0 Rej H0
43
44
22
SANA BEN SALAH 10/08/2024
Ce test est d’une utilité particulière surtout lorsqu’il s’agit du paramètre de la pente,
en effet la significativité de la variable explicative est associée à la significativité de
son paramètre multiplicatif.
45
Remarque:
Le test H0 :1 1 contre H1:1 1 peut être conçu comme un test de Fisher ou un
test d’analyse de la variance. En effet on a :
2
ˆ1 1 ˆ
Normale 0,1 1 1 2 1
ˆ ˆ
ˆ1 1
2
1 1
S2 F 1,n 2
n 2 2
2 n 2 ˆ 2ˆ
1
ˆ 1 et S² sont indépendants
46
23
SANA BEN SALAH 10/08/2024
Ce test peut également être conçu comme instrument qui aide à tester le pouvoir
explicatif du modèle (vérifier si SCE est significative ou non). En effet:
x X
2
ˆ 12 ˆ 12 i SCE SCE
SCE
Fc Fc 1 F 1, n 2
S2 S 2
S2 SCR SCR
n 2 n 2
x X
2
i
SANA BEN SALAH 47
47
48
24
SANA BEN SALAH 10/08/2024
49
50
25
SANA BEN SALAH 10/08/2024
51
52
26
SANA BEN SALAH 10/08/2024
53
si q 1 2
qC q 2
non rejet de H0 au risque
avec q1 2: valeur de d’une loi 2 n 2 ayant la probabilité 1 2 d’être dépassée
q : valeur de d’une loi 2 n 2 ayant la probabilité d’être dépassée
2 2
SANA BEN SALAH 54
54
27
SANA BEN SALAH 10/08/2024
55
56
28
SANA BEN SALAH 10/08/2024
57
si ep 0 sous estimation
si ep 0 sur estimation
SANA BEN SALAH 58
58
29
SANA BEN SALAH 10/08/2024
ep y n h yˆ n h N 0, e2p
y n h yˆ n h
N 0,1
IP y n h yˆ n h ˆ ep t1
e p 1 2
S2
n 2 2 n 2
2
1 xn h X
2
Avec ̂ep l’écart type estimé de l’erreur de prévision: ˆ ep S 1
xi X
n 2
59
30