Économie
Une introduction à l’économétrie
des séries temporelles
Sébastien LECHEVALIER, chargé de TD à l’université Paris-I
L’économétrie a envahi l’analyse économique, si bien qu’il est devenu courant
de rencontrer au fil d’un article les termes suivants : ARMA, VAR, non stationnaire,
tendance stochastique… L’objectif de cette présentation est de rendre intelligibles
ces concepts et les techniques fondamentales qui leur sont associées.
On pourra alors espérer avoir accès aux enjeux théoriques d’un outil très utile
mais non neutre, qui se cachent derrière un discours parfois obscur
et très souvent technique.
C
omment expliquer le développement de l’écono- la mise au point d’un certain nombre de techniques pour
métrie des séries temporelles? Pourquoi ne s’être un traitement économétrique (c’est-à-dire à fondements
pas contenté des méthodes économétriques probabilistes). C’est là la première raison du développe-
usuelles, les «Moindres Carrés Ordinaires», et leurs ment de l’économétrie des séries temporelles.
divers prolongements (MCG, MCQG…)? On peut répondre Ces problèmes sont les suivants : la prévision, l’identi-
à cette double question selon deux points de vue. fication et le retrait de la tendance, la correction des varia-
Tout d’abord, le développement de la macrodynamique tions saisonnières, la détection de rupture, la séparation
théorique a débouché sur un certain nombre de problèmes du court terme et du long terme, l’étude des anticipa-
empiriques spécifiques qui nécessitaient la mise au point tions des agents…
d’outils appropriés.
Ensuite, dans un certain nombre de cas, la méthode d’es- Les différentes approches
timation des MCO ne s’applique pas, tout simplement. et les différentes modélisations
Après avoir précisé ces deux arguments, l’attention se
portera successivement sur les profils théoriques On n’évoque les techniques descriptives simples (désai-
de séries temporelles, sur le travail concret d’estimation sonnalisation par moyenne mobile, prévision par lissage)
et enfin sur les problèmes d’analyse de la tendance et de que pour faire le lien avec ce que connaît le lecteur et
son extraction de la série brute. montrer l’avantage d’une modélisation.
La modélisation elle-même n’est pas unifiée même si
QU’EST-CE QU’UNE SÉRIE elle repose la plupart du temps sur la méthodologie de
Box et Jenkins et le recours aux processus (S) ARIMA,
TEMPORELLE ?
qui seront l’objet de cette présentation. Cette méthodo-
Le terme «séries temporelles» désigne à la fois les séries logie s’applique d’ailleurs à différentes approches dont
réelles chronologiques et une suite théorique de variables l’usage n’est pas exclusif. Une première approche est
aléatoires indicées par le temps et qui va servir à modé- constituée par l’analyse spectrale directement importée
liser ces premières. de la physique : on décompose un processus Xt en com-
posantes périodiques en adoptant le critère des fréquences
Quelques problèmes spécifiques (les petites fréquences correspondent au long terme de
posés par les séries temporelles type composante tendancielle tandis que les grandes fré-
quences correspondent au court terme de type compo-
Il existe toute une gamme de problèmes spécifiques aux sante saisonnière). Une seconde approche est l’analyse
séries chronologiques qui ne sont pas étrangers aux pra- temporelle proprement dite qui consiste en l’étude directe
ticiens de statistiques descriptives et qui vont nécessiter des corrélations entre Xt et les valeurs passées de X.
DEES 113 / OCTOBRE 1998 . 45
Un premier type de modélisation est particulièrement La démarche économétrique va consister à formaliser le
pratique pour la description des différentes composantes problème sous une forme probabiliste, en associant à
d’un processus : Xt = mt + st + ut où : chacune des séries d’observations une variable aléatoire
– mt est la composante tendancielle (évolution à long et en distinguant entre la variable expliquée et les
terme) ; variables explicatives (dont on suppose en fait qu’elles
– st est la composante saisonnière (purement périodique, sont certaines c’est-à-dire mesurées sans erreurs).
évolution à court ou moyen terme) ; On doit dès maintenant préciser les notations probabi-
– ut est la composante conjoncturelle (résultat de pertur- listes usuelles :
bations, c’est la partie purement aléatoire du processus). – E : espérance ;
On peut envisager d’autres combinaisons de ces com- – V : variance ;
posantes que la forme additive (multiplicative, mixte…). – COV : covariance.
On considère de plus que les deux premières compo- Pour simplifier on considérera ici le cas d’une régres-
santes expliquent l’espérance mathématique de Xt tan- sion simple c’est-à-dire avec une seule variable explica-
dis que ut explique sa variabilité (sa variance et sa cova- tive. On cherche alors à écrire à partir des données une
riance). Cette modélisation nécessite d’avoir identifier relation du type : yi = axi + b où est n indice qui repré-
au préalable les différentes composantes : il existe pour sente des classes d’individus, le temps, etc.
cela différentes méthodes, descriptives ou plus théo- Il ne faut pas oublier que la validité de cette méthode est
riques, dont on abordera certains aspects dans la dernière soumise à la vérification d’un certain nombre d’hypo-
partie consacrée à la non stationnarité et à la décompo- thèses que l’on rappelle ici :
sition tendance-cycle. – H1. La première hypothèse est celle d’un modèle
Un second type de modélisation fait appel aux processus linéaire : y est considérée comme une variable aléatoire ;
ARIMA qui seront présentés ici plus en détail. Ils font partie x comme une variable certaine (c’est-à-dire mesurée sans
d’une classe plus générale de modèles dits «autoprojec- erreurs); la relation entre x et y est en moyenne une fonc-
tifs » qui sont de la forme : Xt = f (Xt-1, f (Xt-2,… g (ut )). tion linéaire. On peut formaliser ainsi :
Soulignons enfin qu’on se limitera ici au cas univarié yi = axi + b + ui
mais on doit dire quelques mots sur les représentations E (yi) = âxi + b
vectorielles autorégressives (modèles VAR). Ces dernières où ui désigne le résidu non expliqué par la régression qui
sont particulièrement utiles pour les économistes car elles est supposé nul en moyenne ;
permettent d’étudier l’impact d’un choc sur un environ- – H2. Dans le cas d’un modèle à plusieurs variables expli-
nement ainsi que les relations de causalité entre diffé- catives, ces dernières doivent être linéairement indépen-
rentes variables, si bien que « l’économétrie des VAR » dantes ce qui assure l’unicité des coefficients estimés ;
est un domaine de recherche particulièrement actif. Elles – H3. Les résidus sont non corrélés (absence d’autocor-
sont en fait une généralisation des représentations pré- rélation des résidus) entre eux et leur variance est
cédentes puisqu’il s’agit alors d’expliquer une variable Yt constante (homoscédasticité).
non seulement par ses valeurs passées (Yt-1, Yt-2, Yt-3…) V (ui) = σ2
pour i ≠ j
mais aussi par les valeurs présentes et passées d’autres COV (ui, uj) = 0
variables (Xt, Xt-1… Zt, Zt-1…). L’écriture vectorielle Sous ces hypothèses, la régression par les MCO donne
s’avère alors tout à fait adaptée et les représentations les résultats suivants :
multivariées sont aux représentations univariées ce qu’est COV (x, y)
la régression simple à la régression multiple dans le cadre â=
V (x)
des MCO. Mais un petit rappel s’avère peut-être ici néces-
saire car en soi rien ne s’oppose au recours de ce cadre b = y – âx
pour étudier des séries chronologiques. N
∑ ui2
QUELQUES RÉSULTATS σ2 = i=1
n
SUR LES PROCESSUS UNIVARIÉS
A priori, on peut appliquer cette méthode aux séries tem-
Un rappel sur les MCO porelles, c’est-à-dire quand l’indice i désigne le temps.
Mais il existe des cas où ce n’est pas possible. Concrè-
On dispose de plusieurs séries d’observations (chrono- tement, dans l’exemple 1 on peut appliquer les MCO ;
logiques, spatiales,…) sur plusieurs phénomènes et on mais pas dans l’exemple 2.
cherche à expliquer l’un d’entre eux à partir des autres ou Exemple 1 : Xt = ϕXt-1 + εt avec ϕ < 1
bien à prévoir la valeur de l’un d’entre eux à partir des
autres. Plus généralement, on cherche s’il existe une rela- Exemple 2 : Xt = ϕXt-1 + εt – θεt –1
tion linéaire entre une variable et une ou plusieurs
variables. avec ϕ < 1 et avec θ < 1
46 . DEES 113 / OCTOBRE 1998
Quelques définitions Une fois qu’on a écrit les séries temporelles sous forme
et outils pour l’analyse de polynômes, on peut utiliser toutes les règles de l’al-
gèbre linéaire. En particulier, dans l’étude des ARMA on
des séries temporelles
est conduit à inverser
1 1
Stationnarité du second ordre (1 − λL) = (1 − L) = − ( L − z) ,
z z
et innovation d’un processus
Il existe une définition de la stationnarité au sens strict ce qui est possible si z ≠ 1 , c’est-à-dire si le module de
mais on se limite le plus souvent au critère d’une sta- la racine est différent de 1.
tionnarité du second ordre. On rencontre ici pour la deuxième fois la notion de racine
Un processus Xt est stationnaire du second ordre si et unitaire à la base de la définition de la non stationnarité.
seulement si : L’innovation d’un processus est la partie non prévisible
∀t, E( Xt ) = m, V ( Xt ) = σ 2 de ce processus étant données les observations dont on
∀(t, h), COV ( Xt , Xt + h ) = γ (h)
dispose. On peut montrer que l’innovation d’un proces-
sus stationnaire est un bruit blanc. Si l’on veut, l’inno-
où m et σ2 sont indépendants du temps et où les cova- vation est le résidu de la régression à la date t.
riances (appelées autocovariances et notées γ (h) dépen-
dent uniquement du délai h entre les deux dates consi- « UNE GALERIE DE PORTRAITS » :
dérées.
LES PROCESSUS ARMA(P, Q)
De façon moins technique, une série est non stationnaire
si sa variabilité évolue au cours du temps ou si les valeurs Les économètres ont mis au point toute une galerie de
à chaque date sont corrélées entre elles et dessinent ainsi profils théoriques de processus temporels qui permettent
une certaine tendance. de modéliser une gamme étendue de séries chronolo-
Exemple 1 : le processus ε t est un bruit blanc (noté giques (c’est-à-dire les données dont on dispose).
BB(o,σ2)) si et seulement si : Les processus MA(q), AR(p), ARMA(p, q) sont respecti-
∀ t , E ( εt ) = 0,V ( εt ) = σ 2∆ vement de la forme :
q
∀h ≠ o, COV (ε t , ε t+ h ) = 0 ∀t , X t = µ + ε t + ∑θ k ε t −k
k =1
Un bruit blanc est donc stationnaire par définition.
Exemple 2 : soit le processus Xt- défini par : ∀t , X t + ∑ ϕk X t − k = Φ ( L) X t = µ + εt
X t = X t −1 + ε t −1 q
∀t , X t + ∑ ϕk X t − k = µ + ε t + ∑θk εt − k ⇔ Φ( L) X t = Θ ( L)ε t
où ε1 est un bruit blanc. k =1
Xt est une marche aléatoire. On peut montrer qu’il est
non stationnaire (sa variance varie dans le temps). où µ ∈ ℜ , moyenne du processus que l’on suppose
On remarquera la présence du coefficient devant le souvent nulle, (θ1 ,...,θ q ) ∈ ℜ q , (ϕ 1 ,..., ϕ p ) ∈ℜ p
terme Xt-1. et où ε t BB( 0, σ ∆)
2
.
Exemple 3 : les processus ARMA sont stationnaires tandis
que les processus ARIMA ne le sont pas. MA désigne un processus « moyenne mobile » (Moving
Average) et AR un processus auto-régressif (Autoregres-
L’opérateur retard sive). On voit que les ordres p et q désignent le retard le
On le note L (Lag) ou B (Backward). plus élevé.
On entre ici dans la partie la plus technique qui est pour- Ces processus sont stationnaires. C’est vrai par défini-
tant nécessaire. En effet, le recours à l’opérateur retard tion pour les MA(q) (car ils sont le cas particulier de
n’est pas seulement un problème d’écriture puisqu’il processus MA(∞) dont on peut prouver la stationnarité).
conduit à faire de l’algèbre (manipulation de polynômes Il faut le supposer pour les AR(p) pour les distinguer des
et en particulier détermination de ces racines) une part marches aléatoires présentées dans l’exemple 2
importante du travail des économètres ! Il est en parti- ci-dessus.
culier très utile pour écrire de façon compacte les pro- On s’intéresse particulièrement à ce que l’on appelle la
cessus ARMA étudiés plus bas. représentation canonique de ces processus c’est-à-dire
On a : le cas où toutes les racines des polynômes retard ont un
LX t = X t −1 , L∆
2
X t = X t −2 , Lk X t = X t − k …. module supérieur à 1 car on peut montrer que dans ce
cas εt est l’innovation du processus. On peut également
On peut ainsi écrire un polynôme à l’aide de l’opérateur montrer qu’on peut toujours se ramener à cette repré-
retard : sentation canonique.
p p
∑a k X t −k = ∑ a k L k X t
k =0
D’autre part, il est important de souligner qu’on peut
k =0
opérer des transformations pour passer d’une représen-
DEES 113 / OCTOBRE 1998 . 47
tation à une autre, de façon absolue ou par approximation. Précisons que pour réaliser ces différentes étapes, on uti-
En particulier, par inversion des polynômes retard on lise des logiciels d’économétrie – dont le plus utilisé est
peut toujours transformer un ARMA(p, q) en un MA(∞) SAS – qui donnent la représentation de la série brute, qui
ou en un AR(∞). calculent les divers autocorrélogrammes pour des niveaux
Une classe plus générale de processus est constituée par de différenciation définis et estiment enfin les coeffi-
les SARIMA(s, p, d, q) qui permettent de rendre compte des cients des séries théoriques retenues.
phénomènes de périodicité (ou de saisonnalité : S) et de
non stationnarité (ou d’intégration : I). On peut le modé- LA NON-STATIONNARITÉ
liser de la façon suivante à l’aide des polynômes retard :
DES SÉRIES TEMPORELLES
∀t ,(1 − L) (1 − Ls )Φ ( L) X t = Θ( L) εt .
d
d désigne donc l’ordre d’intégration de la série (ou si
ET LA DÉCOMPOSITION
l’on veut le nombre de racines unitaires) et s l’ordre de la TENDANCE-CYCLE
saisonnalité. Par exemple, si on a des données mensuelles Le point de départ est le constat empirique suivant : la
et si on modélise la série avec s = 12, alors on a une plupart des données empiriques sont non stationnaires.
périodicité annuelle. Quant à l’intégration des séries on Le problème posé aux économètres est de modéliser cette
a déjà donné un exemple avec la marche aléatoire qui non stationnarité. Se dégagent deux grandes optiques qui
est en fait un ARIMA (0, 1, 0). ne sont pas neutres du point de vue de l’analyse de la
Enfin, on trouvera en annexe des simulations de plusieurs tendance et du cycle et du point de vue de la théorie
ARMA et d’une marche aléatoire pour des valeurs don- macroéconomique.
nées des coefficients ϕ et θ. En fait, on a déjà rencontré ces deux optiques à travers
deux modélisations. La première l’a été à travers l’équa-
UN EXEMPLE tion suivante :
X1 = m1 + u1,
D’ESTIMATION-MODÉLISATION
ce qui peut être écrit sous une autre forme si on considère
Par cet exemple on veut essayer de montrer en quoi que
consiste le travail concret des économistes. On distingue s1 = 0 et m1 = α + βt : X1 = α1 + βt + ut .
plusieurs étapes dans le cadre de la méthodologie de Box On a ici une tendance déterministe. Une fois qu’on a
et Jenkins : extrait la tendance on dit que la série est stationnaire en
– il s’agit tout d’abord d’étudier la courbe représentative écart.
pour repérer les saisonnalités et la tendance éventuelle ; L’autre modélisation possible est le recours au proces-
– dans la phase suivante (appelée phase d’identification), sus ARIMA c’est-à-dire intégrés d’ordre 1. Une fois qu’on
il faut identifier d’abord les ordres de différenciation et de a retiré la tendance on dit que la série est stationnaire
saisonnalité puis p et q. Pour cela on utilise les caracté- en différence.
risations de processus AR, MA,…, faisant appel à des Ces deux types de modélisation renvoient à des modes
outils (fonctions d’autocorrélation et d’autocorrélation différents de décomposition tendance-cycle et à des
partielle…) non développés dans la partie précédente et conceptions différentes du cycle. La première s’appuie sur
on procède de façon très empirique à partir de représen- des méthodes traditionnelles de décomposition comme
tations graphiques appelées autocorrélogrammes. En le lissage par moyenne mobile ou l’estimation directe
général, à la fin de cette phase, on a en main plusieurs d’un trend déterministe. Elle est loin d’être définitive-
modèles théoriques parmi lesquels il faudra choisir lors ment rejetée et elle a même connu un certain renouveau
des phases suivantes ; tant d’un point de vue pratique avec des méthodes sophis-
– puis vient la phase d’estimation proprement dite des tiquées de décomposition (comme le filtrage à la Hodrick-
différents modèles retenus pour des valeurs de p, d, q, s Prescott) que d’un point de vue plus théorique avec la
données. Plus précisément il s’agit d’estimer les coeffi- mise en avant par Pierre Perron de la robustesse de la
cient ϕ et θ, ainsi que la variance de l’innovation, σ2, modélisation à l’aide de changements structurels pour la
selon les notations précédemment utilisées. Pour cela, pente et le niveau de la tendance. On a ici une conception
dans certains cas on peut appliquer les MCO et dans du cycle comme écart à la tendance.
d’autres non. On a alors recours à des méthodes d’esti- La seconde repose sur la décomposition de Beveridge-
mation plus complexes (maximum de vraisemblance à Nelson (dont l’article de 1982 a été le point de départ
l’aide de l’algorithme des innovations par exemple) ; des recherches et des débats récents) à partir des pro-
– enfin, on soumet les différents ajustements à un cer- cessus ARIMA. La conception des composantes tendan-
tain nombre de tests (tests d’autocorrélation des résidus, cielle et cyclique se fonde alors sur le fait que la ten-
tests de nullité des coefficients estimés…) et on applique dance rend compte de toutes les composantes
un certain nombre de critères (qualité de la prévision à permanentes de la série (trend déterministe et impact à
l’horizon 1, critères AIC et BIC portant sur la qualité de long terme des chocs, ce qu’on appelle la tendance
l’information…) pour choisir le modèle finalement retenu. stochastique) et que le cycle résulte de l’impact transi-
48 . DEES 113 / OCTOBRE 1998
BIBLIOGRAPHIE
Il n’existe pas d’ouvrage d’introduction aux séries D’autre part l’une des ambitions de cette présen-
temporelles qui évite un discours trop technique et tation était de donner des outils permettant de
qui présente des exemples concrets de procédure déchiffrer certains encadrés d’articles d’Écono-
d’estimation-modélisation. mie et Statistiques où est fait appel à l’économé-
La bible en la matière, remarquable tant par sa trie des séries temporelles. Voici quelques exemples
rigueur et son exhaustivité est un ouvrage écrit en récents :
MAUREL Françoise, 1990, « Dynamique de l’emploi
anglais :
et tendance de la productivité dans les années
James D. HAMILTON, 1994, Times Series Analysis, 80 », Économie et Statistiques , n o 237-238.
Princeton University Press. Recours intensif à l’économétrie des séries tem-
Mais cet ouvrage a un double défaut : son prix et sa porelles et encadré sur « Stationnarité et persis-
difficile accessibilité. tance des variables économiques ».
GAUTIER Bernard, 1995, « Le marché automobile :
Deux autres ouvrages en français dont l’aspect est un cycle spécifique ? », Économie et Statistiques,
assez rebutant car ils adoptent un discours très tech- no 282. Encadrés sur l’analyse spectrale non
abordée ici et sur les nouveaux modes d’analyse
nique et très formel mais ils développent quelques
du cycle, sur le filtre d’Hodrick et Prescott.
exemples concrets :
BOUTHEVILLAIN Karine et MATHIS Alexandre, 1995,
Christian GOURIÉROUX et Alain MONFORT, 1990, Séries « Prévisions : mesures, erreurs et principaux résul-
temporelles et modèles dynamiques, Économica. tats », Économie et Statistiques, no 285-286. Sur
Georges BRESSON et Alain PIROTTE, 1995, Économétrie la prévision, une des principales applications de
des séries temporelles. Théorie et applications, Puf. l’économétrie des séries temporelles.
B OUTHEVILLAIN Karine, 1996, « Les cycles des
grands pays industrialisés. Des croissances plus
Enfin une référence « historique » : proches mais des zones déphasées », Économie
BOX et JENKINS, 1976, Times series Analysis. Fore- et Statistiques, no 298. Encadré sur les méthodes
casting and control, Holden Day. de décomposition tendance-cycle.
toire des chocs. On a aussi une autre conception de à la suite des critiques de Lucas et de ses disciples !
l’articulation entre le court terme et le long terme avec Soulignons enfin que l’on n’a pas là seulement une querelle
l’idée d’une persistance (propriétés d’hystérésis) de techniciens et que les enjeux théoriques sont
des chocs de court terme sur le sentier de croissance de considérables puisque la reconnaissance de la présence
long terme. Ainsi ces idées développées initialement de racines unitaires dans les séries temporelles et la mise
dans le cadre de théories relevant du « néo-clacissisme en avant du concept de tendance stochastique ont
fondamentaliste » (théorie des cycles d’affaire réels) donné un fondement empirique sinon été une source d’ins-
ont été récupérées par des néo-keynésiens qui y piration pour les théories de la croissance endogène qui
voyaient le moyen de réévaluer l’importance des portent ainsi en elles une conception stochastique de la
mécanismes de court terme déconsidérés justement croissance.
DEES 113 / OCTOBRE 1998 . 49
Annexe
QUELQUES SIMULATIONS D’AR, DE MA ET D’UNE MARCHE ALEATOIRE
Les représentations suivantes ont pour objectif de les rendre moins abstraites. En termes de stationnarité, la
référence est donnée par le bruit blanc (graphique 1). Les cinq graphiques suivants (graphiques 2 à 6)
représentent des processus stationnaires, mais on observe que leur allure concrète varie beaucoup en fonc-
tion des valeurs des paramètres ϕ et θ. En particulier, plus ceux-ci sont proches de 1, plus apparaissent des
caractéristiques de non stationnarité. Dans le cas limite (racine unitaire), on aboutit à un processus non-
stationnaire (une marche aléatoire dans le cas du graphique 7).
Graphique 1. Innovation (εt → ΒΒ (0, σ2))
4
3
2
1
0
-1
-2
-3
-4
Graphique 2. AR(1) : Xt = 0,5Xt-1 +εt
4
3
2
1
0
-1
-2
-3
Graphique 3. AR(1) : Xt = 0,9 Xt-1 + εt
8
6
4
2
0
-2
-4
-6
50 . DEES 113 / OCTOBRE 1998
Graphique 4. AR(1) : Xt = 0,96 Xt-1 + εt
15
10
-5
-10
Graphique 5. MA(1) : Xt = εt + 0,5εt-1
4
3
2
1
0
-1
-2
-3
Graphique 6. MA(1) : Xt = εt + 0,9 εt-1
8
6
4
2
0
-2
-4
-6
Graphique 7. Marche aléatoire : Xt = Xt-1 +εt
50
40
30
20
10
0
-10
L’auteur tient à remercier Fabrice Lenglart (Insee) pour l’aide apportée dans la réalisation de cette annexe. ■
DEES 113 / OCTOBRE 1998 . 51