0% ont trouvé ce document utile (0 vote)
122 vues59 pages

ECONOMETRIE Syllabus ISIPA

Ce manuel de cours sur l'économétrie, destiné aux étudiants de licence à ISIPA/MATADI, présente les concepts fondamentaux de cette discipline essentielle pour les économistes et gestionnaires. Il aborde les définitions, l'historique, les objectifs, les étapes d'analyse économétrique, ainsi que les modèles de régression linéaire et leurs méthodes d'estimation. Le document souligne l'importance de l'économétrie pour la validation des théories économiques à travers des données empiriques.

Transféré par

TAYLOR
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
122 vues59 pages

ECONOMETRIE Syllabus ISIPA

Ce manuel de cours sur l'économétrie, destiné aux étudiants de licence à ISIPA/MATADI, présente les concepts fondamentaux de cette discipline essentielle pour les économistes et gestionnaires. Il aborde les définitions, l'historique, les objectifs, les étapes d'analyse économétrique, ainsi que les modèles de régression linéaire et leurs méthodes d'estimation. Le document souligne l'importance de l'économétrie pour la validation des théories économiques à travers des données empiriques.

Transféré par

TAYLOR
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

~1~

PREFACE

Le présent manuel de cours que nous mettons à la


disposition des étudiants de première et deuxième année de licence à ISIPA/
MATADI, est un fruit de plus de 16 ans d’expérience pendant laquelle nous
dispensons ce cours aux universités et instituts supérieurs de Matadi, Muanda,
Boma et ailleurs. Il reprend les notions essentielles d’économétrie, science qui
parait indispensable dans la formation des économistes, gestionnaires et autres.

Certes, l’économétrie est vaste et ne peut être résumé


dans un manuel de moins de 60 pages. Cependant, nous osons croire que les
approches abordées dans le présent syllabus permettront, non seulement aux
étudiants de comprendre les notions essentielles d’économétrie en vue de
pouvoir les appliquées dans les recherches scientifiques, mais aussi à tout
commun de mortel d’avoir une idée générale et précise sur l’économétrie qui
connaît un développement remarquable ces dernières années. Les aspects non
approfondies restent sujets de consultation des ouvrages économétriques
appropriés.

Les principaux ouvrages consultés pendant son


élaboration sont, bien sûr, repris dans la bibliographie. Toutefois, il nous parait
indispensable de manifester notre gratitude au Professeur ordinaire E.G.
KINTAMBU MAFUKU, non seulement pour sa formation et encadrement
combien louable qu’il nous a assuré, mais aussi pour la disponibilité de son
ouvrage intitulé « Principes d’Econométrie » qui nous a servi de document de
base dans l’élaboration de la présente note de cours.

Nous ne pouvons mettre terme à ce propos sans pour


autant congratuler tous ceux qui, d’une manière ou d’une autre, nous ont
assistés. Qu’ils trouvent ici l’expression de notre profonde gratitude.

J.D TIANSENGA ZANZI


Chef de Travaux

1
~2~

CHAP I: GENERALITE
L’économétrie est décrite comme la partie de l’économie qui
s’occupe de la mesure ou du quantitatif. Elle applique les méthodes statistiques
aux données empiriques issues de l’économie. Héritière à la fois des
mathématiques, de l’économie et des Statistiques, elle se fonde sur des modèles
économiques qu’elle vient confronter à un ensemble de données observées
(données de panel, série temporelle, etc.). L’économétrie vise à estimer les
paramètres de ces modèles et à en vérifier la validité. Le modèle étant la
formalisation d’idées ou de théories sur les mécanismes économiques.

Il revient à la théorie économique de spécifier le modèle, d’en


sélectionner les variables pertinentes, et d’établir, à priori, une distinction entre
les variables, suivant leur rôle dans l’explication des faits. L’ensemble des
variables et le système de relations qui les lient (équations, inéquations)
constituent le modèle.

1.1 DEFINITIONS

L'économétrie peut être définie comme étant la combinaison de


l’économie, de la mathématique et de la statistique en vue de fournir les valeurs
numériques des paramètres des relations économiques, des valeurs marginales et
de vérifier les théories économiques. Elle étudie des relations quantitatives de la
vie économique faisant appel à l'analyse statistique et à la formulation
mathématique.

L'économétrie se définie aussi comme étant une branche de la


science économique qui a pour objectif d'estimer et de tester les modèles
économiques, à partir de données issues de l'observation du fonctionnement
réel de l'économie ou provenant d'expériences contrôlées.

En bref, l'économétrie est une branche de l'économie qui traite


de l'estimation pratique des paramètres des relations économiques.

Elle exprime quantitativement les corrélations pouvant exister


entre des phénomènes économiques dont la théorie affirme l'existence. La
théorie économique fournit des idées sur les processus qui déterminent les
grandeurs économiques, l'économétrie apporte une vérification empirique et
établit quantitativement les corrélations qui apparaissent valides.

Elle est en fait une méthode spécifique de recherche et


d’analyses économiques dans laquelle on part de la théorie économique, on

2
~3~

les exprime en termes mathématique et on construit des modèles en fin que


ces relations puissent être mesurées et testées.
La finalité de l’économétrie est, bien sûr, d’obtenir des
estimateurs numériques des coefficients des relations économiques. Etant
entendu que les relations économiques contiennent des éléments aléatoires
qui sont ignorés par la théorie économique et par l’économie mathématique.
L’économétrie prend tous ces éléments en compte pour ressortir les relations
exactes entre les différentes grandeurs économiques.

1.2 BREVE HISTORIQUE DE L’ECONOMETRIE

On considère généralement que l'économétrie naît dans les


années 1930 avec la création de la société d'économétrie et de la Cowles
commission aux États-Unis d'une part et au département d'économie
appliquée de l'université de Cambridge au Royaume-Uni d'autre part.
Néanmoins, certains auteurs comme Mary Morgan ou Philippe Le Galles sont
attachés à montrer qu'il a existé avant les années 1930 des programmes
scientifiques qui se rapprochent de l'économétrie, notamment par la volonté
de rapprocher l'économie et les statistiques.

1.3 OBJECTIFS DE L’ECONOMETRIE


Les trois principaux Objectifs de l’économétrie sont :
1) Faire l’analyse du modèle et vérifier sa validité.
2) L’élaboration de la politique économique à partir des estimateurs
numériques obtenus
3) faire la prévision : les estimateurs numériques des coefficients servent à
prévoir les valeurs futures des grandeurs économiques.

1.4 ETAPES D’ANALYSE ECONOMETRIQUE


1) On part des théories économiques
2) On exprime la théorie économique en termes mathématiques
3) On ressort le modèle économétrique
4) On confronte le modèle avec les données de l’échantillon tiré d’une
population donnée
5) On accepte la théorie si elle est compatible avec les données, ou bien
on la rejette si elle est incompatible avec les données. Dans ce dernier
cas, on revisse la théorie, on refait un autre modèle et on le confronte
avec les nouvelles données.

3
~4~

Théorie économique

Modèle mathématique

Modèle économétrique

Confrontation des données (estimation)

1.
Acceptation rejet

Révision de la théorie

Confrontation des nouvelles


données

1.5 METHODE DE RECHERCHE EN ECONOMETRIE

Pour mener une recherche en économétrie, il sied dès lors de


suivre la procédure suivante :

a) Spécifier le modèle sur lequel on veut travailler ou les construire c.à.d.


connaitre sa forme mathématique, le nombre d’équations, la forme
linéaire ainsi que les variables

b) Estimer les paramètres ; en effet, après avoir construit le modèle on


procède à son estimation c.à.d. chercher à obtenir les estimateurs
numériques des paramètres ou coefficients du modèle par des méthodes
appropriées

4
~5~

c) Evaluer les résultats obtenu ; cette évaluation consiste à décider si les


estimateurs des paramètres sont statistiquement satisfaisant. pour se faire,
il existe plusieurs critères classés en trois groupes ;

- Critères économiques appelés critères à préciser qui sont


déterminés par la théorie économiques
- Critères statistiques qui sont déterminés par la statistique
- Critères économétrique sont déterminés par la théorie
économétrique

d) Evaluer le pouvoir des prévisions du modèle estimé. Ceci permet de


faire de la prévision qui cadre avec le modèle.

5
~6~

CHAP II : MODELE DE REGRESSION LINEAIRE


2.1 LE MODELE

C’est une formalisation mathématique d’idées, des faits ou de


théories. Il comprend l’ensemble des variables et le système de relations qui les
lient ; et se présente sous forme d’équations ou d’inéquations.

2.2 CONTENU DU MODELE

Un modèle comprend les éléments ci-après :

a) Les variables

Le comportement du consommateur a été très tôt un sujet de


prédilection pour l’économétrie (enquêtes de satisfaction, etc.).
Considérons par exemple la fonction de consommation des ménages liant le
revenu et la consommation, sous l’hypothèse d’une liaison linéaire entre la
consommation C et le revenu R,
On peut écrire : C = aR + b
La consommation C, est dite variable endogène (ou
dépendante, ou à expliquer), en ce sens qu’elle est "interne " au modèle.
Le revenu R est dit variable exogène (ou indépendante, ou explicative), c’est
une variable extérieure au modèle, qui est observée.
Ce qui revient à dire que :
- Les variables endogènes ou prédéterminées ou encore
expliquées ; ce sont des variables dépendantes
- Les variables exogènes ou indépendantes sont ceux qui ont un
contenu économique précis
- Variables stochastique ; qui prend en compte l’omission d’un
certain nombre des variables explicatives et la spécification
imparfaite de la forme mathématique du modèle.

b) Les paramètres

Les variables dépendantes et indépendantes sont liées par des


facteurs de pondérations appelés paramètres structurels qui ont
une signification économique concrète.

Exemple :

C = a + bY + µ

6
~7~

C : variable endogène
Y : variable exogène
µ : Variable stochastique qui prend en compte
l’omission d’un certain nombre des variables
explicatives et la spécification imparfaite de la
forme mathématique du modèle.
a et b : sont des paramètres

On peut aussi affiner le modèle en introduisant une troisième


variable, par exemple X; le niveau de liquidités avec le modèle :
On écrira alors :
+ +

Avec deux variables explicatives, il est appelé modèle de régression


multiple prenant en compte un nombre n de variables explicatives.

c) Les équations

Les équations qu’on retrouve dans un modèle économétrique


sont de trois ordres ; équation de comportement qui expliquent le mode
d’agissement des agents économiques
.
Exemple : l’équation de consommation de KEYNES
+ +
: La consommation

: Le revenu ou salaire

Les équations technologiques qui expliquent les modes de


production incorporés dans l’activité économique.

Exemple : la fonction de production COBB-DOUGLAS

Q=A
Q : production ; L : travail ; K : capital

Les équations institutionnelles : qui reflètent les effets que


produisent, dans un modèle économétrique, l’existence des lois ou d’un ordre
institutionnel donné.

7
~8~

Exemple : Le revenu national

Y= C+G+I+( X-M )
C : La consommation des ménages
G : les dépenses du gouvernement
I : les investissements
( X-M ) : la balance commerciale ( X : les exportations et
M : les importations)

2.3 DIFFERENTS TYPES DES MODELES

2.3.1 Modèle statique


Le modèle présenté sur la consommation est un modèle statique
au sens où il fait les différentes variables au même instant.

2.3.2 Modèle dynamique


Dans un modèle dynamique le temps, t joue un rôle explicite et on
étudie l’enchaînement temporel des différentes variables.
Exemple: modèle prévisionnel des ventes pour la semaine t :

+ + ̂

2.3.3 Modèles déterministes ou stochastiques

Nous avons vu que la théorie qui explique la consommation par le


revenu n’est qu’approchée ; on peut évidemment trouver dans un échantillon
d’une population des familles ayant le même revenu et des consommations
différentes ; en fait on peut mesurer pour chaque couple la différence entre la
valeur observée de la consommation et la valeur estimée par le modèle ; cette
différence est notée µ et est appelée erreur ou résidu.
On adoptera alors comme écriture du modèle :
C = aR+b+µ;
µ désignant une variable appelée résidu et qui rassemble les variables autres que
le revenu, qui expliquent la consommation. Si l’on assimile l’écart µ à une
variable aléatoire, le modèle devient un modèle aléatoire et les paramètres seront
alors estimés en utilisant la théorie de l’estimation statistique.

8
~9~

2.4 DEFINITION DE LA REGRESSION LINEAIRE.

L’adoption de schémas linéaires pour représenter la liaison entre


variables économiques peut apparaître comme une simplification éloignée de la
réalité. L’expérience nous montre que cette hypothèse est très souvent
raisonnable ; par ailleurs la simplicité des calculs auxquels conduit l’hypothèse
linéaire est souvent déterminante dans son choix.

Précisons que quand on parle de modèle linéaire en économétrie,


on évoque la linéarité par rapport aux paramètres que l’on doit estimer. C’est
ainsi en économétrie, un modèle de régression linéaire est un modèle de
régression d'une variable expliquée sur une ou plusieurs variables explicatives
dans lequel on fait l'hypothèse que la fonction qui relie les variables explicatives
à la variable expliquée est linéaire dans ses paramètres.

2.5 FORME DU MODELE DE REGRESSION LINEAIRE.

Formellement, on modélise la relation entre une variable


aléatoire Y et un vecteur de variables aléatoires X. D’une manière générale, le
modèle linéaire peut s'écrire de la manière suivante :

+ + +…+ +
Y désigne la variable expliquée. Le vecteur x désigne l'ensemble des variables
explicatives : . µ désigne le terme d'erreur. Il est parfois appelé
perturbation.

On suppose qu'on dispose de données sur les variables


. On cherche à estimer le vecteur ß des paramètres :
. La régression est dite linéaire parce qu'elle impose une forme
fonctionnelle linéaire dans les paramètres du modèle.

2.6 IMPORTANCE DU MODELE DE REGRESSION LINEAIRE

Le modèle linéaire est utilisé dans un grand nombre de champs


disciplinaires. Il en résulte une grande variété dans la terminologie. En
économétrie Le modèle de régression linéaire a de nombreuses applications
pratiques. Il permet notamment de faire des analyses de prédiction. Après avoir
estimé un modèle de régression linéaire, on peut prédire quel serait le niveau de
Y pour des valeurs particulières de X.

Il permet également d'estimer l'effet d'une variable sur une


autre en contrôlant par d'autres facteurs. Par exemple, dans le domaine des
sciences de l'éducation, on peut évaluer l'effet de la taille des classes sur les

9
~ 10 ~

performances scolaires des enfants en contrôlant par la catégorie socio-


professionnelle des parents ou par l'emplacement géographique de
l'établissement.

En général, le modèle de régression linéaire désigne un modèle


dans lequel l'espérance conditionnelle de Y sachant X est une transformation
affine de X. Cependant, on peut aussi considérer des modèles dans lesquels c'est
la médiane conditionnelle de y sachant x ou n'importe quel quantile de la
distribution de Y sachant x qui est une transformation affine de X.

2.7 METHODES D’ESTIMATION

Le modèle de régression linéaire est souvent estimé par la


méthode des moindres carrés mais il existe aussi de nombreuses autres
méthodes pour estimer ce modèle. On peut par exemple estimer le modèle par
maximum de vraisemblance ou encore par inférence bayésienne.

Bien qu'ils soient souvent présentés ensemble le modèle linéaire


et la méthode des moindres carrés ne désignent pas la même chose. Le modèle
linéaire désigne une classe de modèles qui peuvent être estimés par un grand
nombre de méthodes et la méthode des moindres carrés désigne une méthode
d'estimation. Elle peut aussi être utilisée pour estimer différents types de
modèles.

Soulignons qu’on distingue :

- Le modèle de régression linéaire simple et

- Le modèle de régression linéaire multiple

10
~ 11 ~

CHAP III : PRESENTATION DU MODELE DE


REGRESSION LINEAIRE SIMPLE
3.1 DEFINITION

On appelle modèle de régression linéaire simple un modèle de


régression linéaire avec deux variables ; variable endogène et variable exogène.

3.2 FORME DU MODELE

Ce modèle est souvent présenté sous la forme suivante :

+ +
Ou bien

+ +
Dans le présent cours, nous optons pour la deuxième forme

3.3 METHODE DES MOINDRES CARRES

La méthode des moindres carrés, indépendamment élaborée


par LEGENDRE en 1805 et GAUSS en 1809, permet de comparer des données
expérimentales, généralement entachées d’erreurs de mesure, à un modèle
mathématique censé décrire ces données.

Ce modèle peut prendre diverses formes. Il peut s’agir de lois de


conservation que les quantités mesurées doivent respecter. La méthode des
moindres carrés permet alors de minimiser l’impact des erreurs expérimentales
en « ajoutant de l’information » dans le processus de mesure.

Dans le cas le plus courant, le modèle théorique est une famille


de fonctions f (x ; θ) d’une ou plusieurs variables muettes x, indexées par un ou
plusieurs paramètres θ inconnus. La méthode des moindres carrés permet de
sélectionner parmi ces fonctions, celle qui reproduit le mieux les données
expérimentales. On parle dans ce cas d’ajustement par la méthode des
moindres carrés. Si les paramètres θ ont un sens physique, la procédure
d’ajustement donne également une estimation indirecte de la valeur de ces
paramètres.

11
~ 12 ~

3.4 DEMONSTRATION DE CRITERES DE MOINDRE

CARRE ET EQUATION NORMALE

Pour mieux appréhender cette notion Partons de


l’exemple suivant:
3.4.1 Exemple
Pendant neuf jours, au marché de MVUADU, on prélève : le
prix d’une tête de légume ( X ) et Y, le prix du kilo de tomates ( Y ) en dollars us
. On obtient le tableau suivant :
JOURS X Y
Lundi 0,8 1,96
Mardi 0,95 2,15
Mercredi 0,83 1,99
Jeudi 1,12 2,34
Vendredi 1,2 2,42
Samedi 1,05 2,27
Lundi 0,92 2,1
Mardi 1,17 2,4
Mercredi 0,97 2,18

Cette situation peut être représentée graphiquement ; C’est le


traçage du nuage de points ou nuage statistiques qui se fera de la manière
suivante :

Y x y=a+bx
µ

2,5 x x
x x
G (1 ; 2,2)
2 xx
µ
1,5 Nuage statistique
x

0,5

0,5 1 1,5 2 X

12
~ 13 ~

Pour déterminer « autour » de quelles valeurs les


séries statistiques simples X et Y se situent, on calcule leur moyenne et .

̅ 9,01=1 et ̅ = 2 ,2

Lorsqu’on fait autant pour tous les points de la


distribution, on obtient plusieurs coordonnées dont l’ensemble est appelé
Nuage statistique.

On place alors le point G de coordonnées G ( ̅ ̅ )


c.à.d. G (1 ; 2,20). Dans le repère utilisé pour tracer le nuage de points ; G ( ̅ ̅ )
est le point moyen du nuage statistique de la série double (X, Y). C’est la partie
qui est encerclée dans le graphique ci-dessus

3.4.2 Droite d’ajustement

Lorsque le nuage de points de la série double (X, Y) est à peu


près aligné, on cherche une relation entre X et Y de la forme y = a + b x, qui
donne de façon approchée Y en fonction de X ; c'est ce que l'on appelle un
ajustement
La droite ainsi trouvée est appelé droite de régression,
d’estimation ou d’ajustement. En économétrie elle a la forme suivante :

+
Ou bien

Deux questions se posent. En premier lieu, quelles sont les


différentes méthodes pour obtenir les valeurs des paramètres et ?

En second lieu Comment utiliser cet ajustement pour


déterminer des valeurs de Y en connaissant des valeurs de X ?

D’où l’utilisation de critères de moindre carré car qui permet de


déterminer le « meilleur » ajustement possible.

Soulignons ce qui suit :

13
~ 14 ~

 Le choix des unités sur les axes du repère est important. Il faut obtenir
une représentation qui ne soit ni trop resserrée, ni trop grande.
 La forme de ce nuage de points est essentielle. Si les points sont
proches d’une courbe d’équation y = f(x), cela peut sous-entendre
que X et Y sont liées et que la valeur de X permet d’estimer celle de Y
en lui appliquant la fonction f.
 On se limite souvent au cas de figure où le lien entre X et Y est
« affine ». Si le nuage de points est à peu près aligné, on peut
effectivement penser que X et Y sont liées par une fonction affine du
type : y = a + b x

3.4.3 Les Estimateurs des moindres carrés ordinaires

L'estimateur des moindres carrés ordinaires est la solution du


programme de minimisation de la somme des carrés des écarts ou erreurs entre
les valeurs prédites et les valeurs observées par rapport aux deux paramètres
et

En effet, les nuages statistiques qui sont représentés dans le


graphique supra reprennent les points des observations d’une distribution
statistiques donnée. à partir de ces points nous avons tracé une droite appelé la
droite de régression ou droite d’estimation.

Cependant, en réalité nous remarquons que certains points des


observations ne passent pas par cette droite qui est sensée de ramasser tous ces
points.

Ce qui fait que la distance entre un point donné et cette droite


estimée est appelée erreurs symbolisée par .
Cette droite a la forme suivante :

̂ = ̂ +̂

̂ ̂ Sont des estimateurs de moindre carrée.

La vraie droite serait : =̂

14
~ 15 ~

Et l’erreur sera alors : -̂

Les critères de moindre carré veut que la somme des carrés des
erreurs soit minimisée c.à.d. soit égale à Zéro .Cela nous conduit au
raisonnement suivant :

∑ =0

∑ = ∑ ̂

∑ =∑( -̂ +̂ )²

D’où nous aurons :

.f ( , =∑( -̂ +̂ )²
En faisant la différentielle nous aurons :

=-2∑( -̂ +̂ )=0

= 2∑( -̂ +̂ ) (– =0

Ceci nous donne les systèmes d’équations suivantes :

∑ ̂ ̂
{
∑ ̂ ̂

∑ ̂ ̂ ∑
{ ̂ ∑ ̂ ∑

∑ ̂ ̂ ∑
{
∑ ̂ ∑ ̂ ∑

En résolvant ce système sous forme matricielle nous aurons :


∑ ∑ ∑ ∑ ∑
∑ =
∑ ∑
∑ ∑

15
~ 16 ~

Après développement, nous aurons :

̂

En termes des déviations, on peut partir de la relation ci-après :

∑ ̂ ̂ ∑

En divisant tous les membres par N on a :

∑ ̂ ̂ ∑
= +
Or :

̅=∑ et ̅=∑

Donc : ̅=̂ +̂ ̅

̂ ̅- ̂ ̅

16
~ 17 ~

Exemple A :

Soit les données ci- après tiré d’un échantillon qui représente le
chiffre d’affaire réalisé par la société GRACIA sprl par rapport aux dépenses
de publicité.

TD : Faites la régression par la méthode de Moindre carré

ANNEES CA PUBL
2001 63 43
2002 56 25
2003 51 57
2004 54 63
2005 52 65
2006 83 68
2007 26 42
2008 56 81
2009 23 33
2010 44 81
2011 15 22
2012 5 8

Le modèle économique stipule que le chiffre d’affaire réalisé est


fonction des dépenses de publicité.

Dès lors, la forme de la droite de régression sera :

̂ = ̂ +̂

Les paramètres à estimer seront les suivantes :


̂ et ̂ ̅+ ̂ ̅

Avec ̅=∑ et ̅=∑

17
~ 18 ~

D’où le tableau ci-après :

ANNEES Y X X² XY Y²
2001 63 43 1849 2709 3969
2002 56 25 625 1400 3136
2003 51 57 3249 2907 2601
2004 54 63 3969 3402 2916
2005 52 65 4225 3380 2704
2006 83 68 4624 5644 6889
2007 26 42 1764 1092 676
2008 56 81 6561 4536 3136
2009 23 33 1089 759 529
2010 44 81 6561 3564 1936
2011 15 22 484 330 225
2012 5 8 64 40 25
TOTAL 528 588 35064 29763 28742

̅=∑ = = 49

̅=∑ = = 44

̂ ∑
= = 0,849

̂ ̅ - ̂ ̅ = 44 -0,849(49) = 2,408

La droite d’estimation à la forme suivante :

̂ = +

3.5 TEST DE FIABILITE DE L’AJUSTEMENT

Après avoir fait l’ajustement, il est question de vérifier la


fiabilité de ceci .Pour ce faire, on calcule le coefficients de corrélation( r ) ainsi
que le coefficient de détermination( R²).

18
~ 19 ~

.
3.5.1 Coefficients de corrélation( r )

Etudier la corrélation entre deux ou plusieurs variables


aléatoires ou statistiques numériques, c’est étudier l’intensité de la liaison qui
peut exister entre ces deux variables. La liaison recherchée est une relation
affine.

Une mesure de cette corrélation est obtenue par le calcul du


coefficient de corrélation linéaire. Ce dernier indique s’il y a une relation entre
la variable dépendante Y et la variable indépendante X.

Le coefficient de corrélation est compris entre -1 et 1.

- Lorsque r = -1 : Il existe une parfaite corrélation négative entre


X et Y c.à.d. lorsque X varie, Y varie aussi mais dans le sens
contraire et vice versa ;
- Lorsque r = 0 : Il a absence de corrélation entre X et Y
- Lorsque r = +1 : Il existe une parfaite corrélation positif entre
X et Y c.à.d. lorsque X varie, Y varie aussi mais dans le même
sens et vice versa ;

Formules

La formule simplifiée suivante :

√∑
r =̂
√∑

3.5.2. Coefficient de détermination( R²).

La qualité de l’ajustement est mesurée par le coefficient de


détermination (R ) donné par le rapport entre la variance de ̂ et la variance de
2

Y. Ce coefficient mesure quantitativement le pourcentage expliqué par la droite


de régression par rapport au nuage des points .Sa valeur est comprise entre 0 et
1. Une valeur proche de 1 indique que la qualité de l’ajustement est bonne.

- Lorsque R² = 0: Il n’y a pas de relation entre la variable


indépendante et la variable dépendante (la droite n’est pas
acceptée)

19
~ 20 ~

- Lorsque R² = +1 : ou proche de +1 la droite d’ajustement est


acceptée

Si par exemple le coefficient de détermination R2 égal à 0,9


signifie que 90% des variations de la variable endogène sont expliquées par le
modèle.

Le coefficient de détermination( R²)est égale au carré de


coefficient de corrélation( r )

R² = ( r )²
Sa formule la plus simple est la suivante :

R² = ̂

En se référant à l’exemple A, nous avons la résolution


suivante dans le cadre du test de fiabilité de cette droite de régression :

a) Coefficients de corrélation


r= √
= 0,938

Il existe une corrélation positive entre le chiffre d’affaire et les


dépenses de publicité. c.à.d. lorsque dépenses de publicité X varie, le chiffre
d’affaire Y varie aussi dans le même sens et vice versa ;

b) Coefficient de détermination

R² = (r ²) ² = (0,938) ² = 0,879

La droite est acceptée.

20
~ 21 ~

----------------------------------------------------------------------------
TP №:1
Nom et post nom : ……………………………………………………………………………
Promotion et option : ……………………………………………………
№ D’ordre :……..

Une divergence d’idées se manifeste entre la consommation d’un


produit et sa fabrication au sein d’une industrie de fabrication des denrées
alimentaires.
Le Directeur de cette firme confirme qu’une ressemblance se
manifesterait entre la production et la consommation de cet output en terme
d’avantage ; argument que les autres nient catégoriquement.
Un échantillon, ci-dessous, de 10 semaines a été tiré à cet effet, en
vue de départager les deux opinions.
Qu’elle est votre réaction en tant que membre du conseil
d’administration de cette firme. Argumentez vos réponses avec des tests
économétriques appropriés. (Faites la régression).

Semaines Production Consommation


1 220 126
2 208 109
3 174 97
4 145 137
5 165 57
6 152 49
7 154 47
8 149 59
9 93 46
10 87 45

Résolution

Semaines Y X X² XY Y²
1 220 126
2 208 109
3 174 97
4 145 137
5 165 57
6 152 49
7 154 47
8 149 59
9 93 46
10 87 45

21
~ 22 ~

3.5.3 La loi des ecarts

La loi des écarts permet de relier l’erreur associée à


l’hypothèse nulle et l’erreur associée à l’hypothèse « Y dépend de X » càd la
somme des carrés des écarts des Y par rapport à la moyenne :

Somme des Somme des carrés Somme des carrés


carrés Total = Expliquée = Résiduelle

Ou encore :

Dispersion Total = Dispersion Expliquée = Dispersion Résiduelle

∑ ̅ = ∑ ̂ ̅ +∑ ̂

D’où le coefficient de détermination sera :

∑ ̂ ̅
R² = =
∑ ̅

Le coefficient de corrélation sera :

∑ ̂ ̅̅̅̅

R =√
∑ ̅̅̅̅

3.6 TEST DE SIGNIFICATION DES ESTIMATEURS DES

PARAMATRES

Etant donné que les paramètres ̂ et ̂ sont des estimateurs


d’échantillons des paramètres de la population et , il est nécessaire de
tester leurs signification statistique c à d s’assurer de leur proximité aux vrais
valeurs des paramètres de la population.

22
~ 23 ~

Pour ce faire, on doit appliquer les tests qui nécessitent la


connaissance de la moyenne et de la variance de ces estimateurs.
Soulignons que les qualités exigées pour un bon estimateur sont :

- Etre sans biais


- Etre efficace
- Etre convergent
A ce niveau, il sied de faire un petit rappel sur la notion des
tests d’hypothèses et vérification des hypothèses.

3.7 RAPPEL SUR LA NOTION DES TESTS D’HYPOTHESES


ET VERIFICATION DES HYPOTHESES.

3.7.1 Définition

La méthode scientifique utilisée par l’être humain pour


établir une connaissance quelconque peut se résumer en 3 étapes suivantes :

1) Observation d’un fait ou d’un phénomène

2) Formulation d’une explication de ce fait sous forme d’une


Hypothèse

3) Vérification d’hypothèse au moyen d’une expérience ou d’un


Test.

Lors par une expérience quelconque on arrive à confirmer ou à


infirmer une hypothèse s’appelle un test d’hypothèse ou test statistique

On appelle hypothèse statistique un énoncé, une affirmation


concernant une ou plusieurs populations. Cette hypothèse sera dite
paramétrique s’il s’agit d’un énoncé quantitatif concernant un paramètre de
l’énoncé, sinon elle est dite non paramétrique.

3.7.2 Principe des tests

Le principe des tests d’hypothèse est de poser une hypothèse


de travail et de prédire les conséquences de cette hypothèse pour la
population ou l’échantillon. On compare ces prédictions avec les observations
et l’on conclut en acceptant ou en rejetant l’hypothèse de travail à partir de
règles de décisions objectives.

23
~ 24 ~

Définir les hypothèses de travail, constitue un élément essentiel


des tests d'hypothèses de même que vérifier les conditions d'application de ces
dernières (normalité de la variable, égalité des variances, etc.).
3.7.3 Types d’hypothèses
Dans tous les tests d’hypothèses on établit deux hypothèses
mutuellement exclusives qui sont à confronter ; une seule d’entre elles sera
acceptée .Il s’agit d’une part de l’hypothèse nulle que l’on note par Ho qui est
toujours affirmative .C’est l’hypothèse qui sera vérifiée. Elle sera rejetée s’il y a
suffisamment d’évidence contre elle.
D’autre part, il y a l’hypothèse alternative ou contre hypothèse
notée par H1 .Elle est acceptée lorsque hypothèse nulle est rejetée. C’est elle qui
apporte un changement qui implique une action à entreprendre.
3.7.4 Etapes d’un test d’hypothèses
Un test d’hypothèses comprend les étapes suivantes :
(1) définir l’hypothèse nulle (notée par H0) à vérifier,
(2) choisir une hypothèse rivale qui sera acceptée si l’hypothèse nulle est
rejetée ; c’est H1,
(3) définir la règle de la prise de décision
(4) définir le niveau de signification du test ou seuil critique notée par α
.si ce dernier n’est pas donné, dans ce cas on utilise α = 0,05
(5) calculer, à partir des données fournies par l’échantillon, les valeurs de
la statistique appropriées
(6) prendre une décision concernant l’hypothèse posée et faire une
interprétation

3.7. 5 Choix de la nature d’un test statistique

Ce choix dépend de la nature des données, du type d’hypothèse


que l’on désire contrôler, des affirmations que l’on peut admettre concernant la
nature des populations étudiées (normalité, égalité des variances) et d’autres
critères.
Car un test statistique ou une statistique est une fonction des
variables aléatoires représentant l’échantillon dont la valeur numérique obtenue
pour l’échantillon considéré permet de distinguer entre H0 vraie et H0 fausse.

On distingue deux test ; le test unilatéral et le test bilatéral

24
~ 25 ~

C’est la nature de H0 détermine la façon de formuler H1 et par


conséquence la nature unilatérale ou bilatérale du test.

a) Test bilatéral

Si H0 : p = p0 et H1 : p  p0
Le test sera bilatéral car on considère que la fréquence p peut
être supérieure ou inférieure à la fréquence p0 .
La région critique  correspond à une probabilité /2 de part
et d’autre de la courbe.
b) Test unilatéral

Si l’on fait l’hypothèse

H0 : p < p0 et H1 : p > p0
Le test sera unilatéral car on considère que la fréquence p ne
peut être que supérieure à la fréquence p0 .
La région critique  correspond à une probabilité .
Le raisonnement inverse peut être formulé avec l’hypothèse
suivante :
H0 : p > p0 et H1 : p < p0
Selon la nature unilatérale ou bilatérale du test, la définition de
la région critique varie, nous pouvons résumer cette situation dans le tableau ci-
après :
Test unilatéral Test bilatéral
H0 : p < p0 H0 : p > p0 H0 : p = p0
Hypothèse H1 : p > p0 H1 : p < p0 H1 : p  p0
alternative
Valeur de S sous H1 S>0 S<0 S  0
S = p – p0
Niveau de α α
signification 

3.7. 5 règles de décision


Il existe des stratégies pour prendre une décision en ce qui
concerne un test d’hypothèse ; on choisira α = 0 ,05 s’il n’est pas donné.

25
~ 26 ~

3.7. 5.1. Région de rejet


Cette région est constituée par le sous-ensemble des valeurs de
la distribution d'échantillonnage qui sont si extrêmes que lorsque H0 est vrai, la
probabilité que l'échantillon observé ait une valeur parmi celles-ci est très faible

Dans un test unilatéral, la région de rejet est entièrement située


à une des extrémités de la distribution d'échantillonnage, alors que dans un test
bilatéral, cette région est située aux deux extrémités de la distribution.

La taille de cette région de rejet est définie par alpha α. Si alpha


est α = 0,05 (5%), la taille de la région de rejet correspond à 5% de l'espace
inclus dans la courbe de la distribution d'échantillonnage. Cela signifie que dans
d'une distribution suivant une loi normale, il n'y a que 5 chances sur 100 pour
qu’on soit dans le bon.

3.7. 5.2. GRAPHIQUES DE DECISION

a) test unilatéral avec HO > H1


H1

–3 –2 -1 0 1   4

b) test unilatéral avec HO < H1




–4 –2 -1 0 1   4

26
~ 27 ~

c) Test bilatéral


H1 

–4 –2 -1 0 1   

En bref, trois types de tests sont possibles en fonction de l'hypothèse


alternative choisie :

Le test bilatéral :
H0 : µ1 = µ2
H1 : µ1 ≠ µ2
Le test unilatéral à gauche
H0 : µ1 > µ2
H1 : µ1 < µ2
Le test unilatéral à droite
H0 : µ1 < µ2
H1 : µ1 > µ2

3.8 Test Z des estimateurs de moindre carré

Soit un échantillon aléatoire de taille n supérieure ou égale à trente


observations. On souhaite savoir si la moyenne observée s’éloigne d’une moyenne
standard m pour un risque d’erreur donné.

On suppose que la distribution suit une loi normale, ce qui est vérifiable par
un test de normalité. Mais plus l’échantillon est grand, plus on s’affranchit sans vergogne
de cette condition car l’espérance des moyennes de nombreux échantillons suit de toute
façon une loi normale, sauf cas particuliers. C'est le théorème central-limite.

Vous l'avez deviné, il faut procéder à un test d’hypothèses et plus


précisément à un test de conformité. Selon le cas à traiter, le test est unilatéral ou bilatéral.

27
~ 28 ~

Nous ferons le parallélisme avec le test de Student, employé sur les petits
échantillons.

La statistique z utilise la formule suivante:

̂
Z=

Avec :


=
∑ ̂
ou bien =

La différence avec la statistique t de Student, c’est que z utilise l’écart-


type empirique σ.

Donc, on peut très bien appliquer ce test sur un petit échantillon du


moment que l’on connaît la dispersion de la population de référence, par définition non
biaisée… De fait, des auteurs (et des logiciels) préfèrent appliquer le terme « test z » à ce
cas plus général où l’on connaît la vraie variance de la population, quel que soit l’effectif.

En résumé, on utilise le test z soit lorsque l’échantillon est grand c.à.d. N ≥ 30, soit
lorsque la vraie variance de la population est connue. lorsque l’échantillon est petit c.à.d.
N < 30 on utilise le test t de student.

Le seuil de confiance ainsi que les valeurs critiques sont représentées


dans le tableau suivant :

Seuil de confiance 99,73% 99% 98% 96% 95,45% 95% 90% 80% 68,27% 50%

Z /2 3 2,58 2,33 2,05 2 1,96 1,645 1,28 1 0,6745


Valeurs critiques
Z 2,78 2,33 2,05 1,75 1,6 1,645 1,28 0,84 0,475 0

28
~ 29 ~

3.9 Le t de Student

Le test t, ou test de Student désigne un ensemble de tests


d’hypothèse paramétriques où la statistique calculée suit une loi de Student. Un
test t peut être utilisé notamment pour tester statistiquement l’hypothèse
d’égalité de deux moyennes.

3.9.1 Principe

Le principe du test t est le suivant : on veut déterminer si la valeur


d’espérance μ d’une population de distribution normale et d’écart type σ non
connu est égale à une valeur déterminée μ0. Pour ce faire, on tire de cette
population un échantillon de taille n dont on calcule la moyenne et l'écart-type.

Ce test t de student est utilisé lorsque l’échantillon est petit c.à.d.


N < 30

Le degrés de liberté dL = n-k. ce qui permet la consultation de la


table t de student avec le seuil de signification α

Bien entendu que les mêmes graphiques supra présenté sont utilisé
dans la prise de décision. Tandisque son tableaux ou table de t de student sera
présenté en annexe.

3.9.2 Formule

̂
t=


Avec : =

EXEMPLE B

Au cours d’une réunion extraordinaire convoquée par l’DAG


de la société DEBOMEGRA s.a.r.l, une dichotomie oppose deux groupes ; les
uns stipulent que le lancement de la nouvelle gamme d’output B préconisé par
ladite société provoquera une synergie négative vis-à-vis de l’ancien output A.
Tandisque les autres soutiennent l’avis contraire.

29
~ 30 ~

Pour départager les deux tendances, l’ADG a proposé la


production concomitante de l’ancien et nouveau produit pendant une période
de douze semaines. Le résultat obtenu par rapport aux avantages comparatifs
journaliers se présente comme suit : (le produit A étant la variable exogène).
semaines A B
1 6 4
2 5 5
3 4 8
4 2,5 5,5
5 6 2
6 5 2,3
7 3 2
8 2 1,2
9 3,5 1,7
10 3 4
11 2 2
12 1 4

Par ailleurs, l’ADG stipule que les moyennes des deux produits
sont égales à l’égard des avantages hebdomadaires attendus. Tandisque les
autres sont contre cette affirmation.

Quelle est votre opinion entant que conseillé économique et


membre du conseil d’Administration de cette société.

(Pour les calculs arrondissez à 3 chiffres après la virgule et


prière interpréter les résultats à chaque niveau)

RESOLUTION

I. La forme de la droite de régression sera :

̂ = ̂ +̂

Les paramètres à estimer sont les suivants :


̂

̂ ̅+ ̂ ̅

Avec ̅=∑ et ̅=∑

30
~ 31 ~

Le présent tableau nous permet de faire les calculs

semaines Y X X² XY Y² µt µ²
1 6 4 16,00 24,00 36,00 1,99 3,97
2 5 5 25,00 25,00 25,00 0,18 0,03
3 4 8 64,00 32,00 16,00 -3,24 10,49
4 2,5 5,5 30,25 13,75 6,25 -2,72 7,40
5 6 2 4,00 12,00 36,00 3,61 13,02
6 5 2,3 5,29 11,50 25,00 2,37 5,60
7 3 2 4,00 6,00 9,00 0,61 0,37
8 2 1,2 1,44 2,40 4,00 0,25 0,06
9 3,5 1,7 2,89 5,95 12,25 1,35 1,82
10 3 4 16,00 12,00 9,00 -1,01 1,02
11 2 2 4,00 4,00 4,00 -0,39 0,15
12 1 4 16,00 4,00 1,00 -3,01 9,05
43 41,7 188,87 152,60 183,50 0,00 52,99

31
~ 32 ~

Le tableau ci-dessus nous permet de calculer les grandeurs


suivantes :

̅=∑ = = 3,475

̅=∑ = = 3,583

̂ ∑
= = 0,808

̂ ̅ - ̂ ̅ = 3,583 -0,808 (3,475) = 0,776

La droite d’ajustement a la forme suivante :

̂ = 0,776 +

II. TEST DE FIABILITE DE L’AJUSTEMENT

a) Coefficients de corrélation ( r )

√∑
r =̂
√∑


r= √
= 0,82

Commentaire :

Il existe une corrélation positive entre les outputs A et B c.à.d.


lorsque outputs A (X) varie, outputs B (Y) varie aussi dans le même sens et vice
versa .

32
~ 33 ~

c) Coefficient de détermination

R² = (r ²) ² = (0,82) ² = 0,67

La droite est acceptée.

III. TEST DE SIGNIFICATION DES ESTIMATEURS DES


PARAMETRES

Test d’hypothèses comprend :


1) l’hypothèse nulle H0 :
H0 : moyenne de A = moyenne de B
2) hypothèse rivale ou l’hypothèse nulle : H1
H1 : moyenne de A ≠ moyenne de B
3) définir la règle de la prise de décision
Il s’agit du test t de student car. N < 30

En plus nous ferons le test bilatéral car :


H1 : moyenne de A ≠ moyenne de B

4) le niveau de signification du test ou seuil critique :

α = 0,05

5) calculs à partir des données fournies par l’échantillon, les valeurs


appropriées
n = 12 dL = n – k
= 12 – 2
= 10
Formules :

̂
t= = = 28,80

Avec :


= = = 5,30

33
~ 34 ~

Soulignons que l’erreur µ est calculée de la manière suivante :


= -̂
µ = – (0,776 + )= – [0,776 + = 1,99

µ = – (0,776 + )= – [0,776 + = 0,18

µ = – (0,776 + )= – [0,776 + = -3,24

µ = – (0,776 + )= – [0,776 + = -2,72

µ = – (0,776 + )= – [0,776 + = 3,61

µ = – (0,776 + )= – [0,776 + = 2,37

µ = – (0,776 + )= – [0,776 + = 0,61

µ = – (0,776 + )= – [0,776 + = 0,25

µ = – (0,776 + )= – [0,776 + = 1,35

µ = – (0,776 + )= – [0,776 + = -1,01

µ = – (0,776 + )= – [0,776 + = -0,39

µ = – (0,776 + )= – [0,776 + = -3,01

6) prendre une décision concernant l’hypothèse posée et faire une


interprétation ; Valeur de la table : 2,228

H1 H0 H1

x
-2,228 2,228 28,80

H0 est rejetée ; Tandisque H1 est acceptée

34
~ 35 ~

----------------------------------------------------------------------------
TP №:2
Nom et post nom : ……………………………………………………………………………
Promotion et option : ……………………………………………………
№ D’ordre :……..

Considérant le TP №:2 de la page 20 ainsi que les explications supra, Faites les
tests appropriés

Résolution
semaines Y X X² XY Y² µt µ²
1 220 126
2 208 109
3 174 97
4 145 137
5 165 57
6 152 49
7 154 47
8 149 59
9 93 46
10 87 45

35
~ 36 ~

CHAP IV : ANALYSE DE LA REGRESSION


LINEAIRE MULTIPLE
4.1 LE MODELE DE REGRESSION LINEAIRE MULTIPLE

PAR L’APPROCHE MATRICIELLE

4.1.1 Présentation du modèle

La régression linéaire multiple est une généralisation de la


régression linéaire à p variables explicatives,

Elle est une analyse économétrique qui décrit les variations d'une
variable endogène associée aux variations de plusieurs variables exogènes.

Par exemple, une analyse de régression multiple peut révéler une


relation positive entre la demande de lunettes de soleil et différents caractères
démographiques (âge, salaire …) des acheteurs de ce produit. La demande
augmente et baisse avec les variations de ces caractéristiques.

La problématique reste la même que pour la régression simple :

 estimer les paramètres b1, b2, b3...bK, en exploitant les observations ;


 évaluer la précision de ces estimateurs ;
 mesurer le pouvoir explicatif du modèle ;
 évaluer l'influence des variables dans le modèle :
o globalement (les p variables en bloc) et,
o individuellement (chaque variable) ;
 évaluer la qualité du modèle lors de la prédiction (intervalle de
prédiction) ;
 détecter les observations qui peuvent influencer exagérément les résultats
(points atypiques).

4.1.2. Forme du modèle

+ +
Ou bien :

yi = b0 + b1x1i + b2x2i + b3x3i +....bKxKi + εi


avec:
i = 1,...N, N étant le nombre d'observations

36
~ 37 ~

yi : la variables expliquée (variable endogène)


xki : les variables explicatives (variables exogènes) k = 1,...K
εi: un aléa ou erreur
b1, b2, b3...bK : sont des paramètres à estimer
Sous forme matricielle lorsque le modèle comporte une
constante, par exemple si x1i prend la valeur 1 quel que soit i=1,...N, le modèle
s'écrit:

Y  X B  ε
(N,1) (N,K) (K,1) (N,1)

 y1  1 x 21 . . x K1  b1   ε1 
      
 y 2  1 x 22 . . x K2  b 2   ε 2 
  .   . . . . .  .    . 
      
 .  . . . . .  .   . 
      
 y N  1 x 2N . . x KN  b K   ε N 

Nous pouvons aussi adopter une écriture condensée qui rend la


lecture et la manipulation de l'ensemble plus facile. Les équations suivantes :

Qui peuvent être résumées avec les notations matricielles suivantes :

Soit de manière compacte:

avec

37
~ 38 ~


y est de dimension (n, 1)
 X est de dimension (n, p + 1)
 a est de dimension (p+1, 1)
 ε est de dimension (n, 1)
 la première colonne sert à indiquer que nous procédons
à une régression avec constante.

4.1.3 Méthode d'estimation des Moindres Carré Ordinaire (MCO):

Ce modèle de régression multiple peut être estimé par la méthode


des moindres carrés ordinaires. L'estimateur des moindres carrés ordinaires peut
s'écrire comme suit :

Il consiste à minimiser la somme des carrés des erreurs

MinY  XB
' Y  XB
B

A partir des conditions du premier ordre on obtient les paramètres


estimés :

B̂  (X' X)X' Y
D’une manière detaillée ,nous aurons :

̂ (X’X) - 1 X’Y

̂
( ̂ ) = ( X’X ) – 1 X’Y
̂

La matrice de variance covariance des paramètres estimés s’écrit :

Var( B̂)  E(B̂  E(B̂))( B̂  E(B̂) ' )  σ 2 (X' X) 1

4.1.4 Equation d'analyse de la variance et qualité de l'ajustement

La droite de régression de l’échantillon étant donnée par

ŷi  b̂1  b̂2 x 2i  ...b̂K x Ki

38
~ 39 ~

L’écart entre les valeurs observées et les valeurs estimées de y sont


appelés le résidu. La série des résidus a une moyenne nulle et on montre que la
variance de y est la somme de la variance de ̂ et de la variance des résidus :

N N N

 y
i 1
i  y  2
 ŷ
i 1
i  y 
2
e
i 1
i
2

4.1.5. Calcul de coefficient de détermination (R2)

La qualité de l’ajustement est mesurée par le coefficient de


détermination (R2) donné par le rapport entre la variance de ̂ et la variance de
y. Ce coefficient est compris entre 0 et 1. Une valeur proche de 1 indique que la
qualité de l’ajustement est bonne.

N N

 ŷ  y
i 1
i
2
e i 1
i
2

R2  N
 1 N

 y  y 
i 1
i
2
 y  y 
i 1
i
2

Un R2 égal à 0,9 signifie que 90% des variations de la variable


endogène sont expliquées par le modèle.

2 ̂
Ou encore : R =
Soulignons par ailleurs que dans la régression linéaire multiple la variance se
calcule par la formule suivante :

= Avec : Γ= Ӏ- X(X’X)
-1
X’

La formule de l’analyse de la variance, coefficient de détermination et


coefficient de corrélation linéaire multiple empirique sera :

Variance Total = Variance Expliquée = Variance Résiduelle

Cette relation peut s’exprimée par :

(Y’Y) = ( ̂ ’X’Y) + (Y’ΓY)

39
~ 40 ~

Le coefficient de détermination sera calculé alors par le rapport suivant :


̂
R2 = =

Soulignons que lorsque les données sont importantes, il convient


d’utiliser les logiciels économétriques appropriés .Par exemple EXCELL,
STATA 12…

EXEMPLE C

Faisons l’estimation pour savoir s’il y a une dépendance entre un revenu (Y)
d’une part et d’autre part les coûts fixes (x1) et dépenses des publicités (x2)
dont l’échantillon ci-après :

Mois Y X₁ X₂
Janvier 3 3 5
Février 1 1 4
Mars 8 5 6
Avril 3 2 4
Mai 5 4 6

La régression étant multiple puisqu’il s’agit de trois variables, nous procédons


par l’approche matricielle.

Forme du modèle : yi = b0 + b1x1 + b2x2


Forme du modèle à estimer : ̂ =̂ + ̂ x1 + ̂ x2
Formules à utiliser pour estimer les paramètres : ̂ (X’X) - 1 X’Y
Avec :

40
~ 41 ~

̂
̂ (̂ )
̂

Résolution :

1° Estimation du modèle

Y= X= X’ = ( ).

( ) ( )

(X’X) = ( ). ( )

( )
–1
Calcul de l’inverse (X’X) ; posons cette matrice = A

A= ( )

L’inverse : A-1 = C étant la matrice des cofacteurs

Le déterminant = 20

=( ) =( )

41
~ 42 ~

A-1 = ( )

–1
=( ) C’est l’inverse (X’X)

Calcul de X’Y

X’Y = ( )

( )

=( )

(X’X ) – 1 X’Y = ( ) ( )

=( )

Or

̂
̂ ( ̂ ) = ( X’X ) – 1 X’Y = ( )
̂

Donc
̂
(̂ ) ( )
̂

42
~ 43 ~

̂ ̂ ̂

Le modèle estimé est le suivant : ̂ = 4+2,5 x1 -1,5 x2

2
2° Calcul de R

̂
2
R =
̂ = (̂ ̂

=( ( )

AY = Y – I ̅

̅ =4

AY = - .4

( ) ( )

( )

43
~ 44 ~

( )
( )
R2 = ( )

( )

= 0,946

3° Test « F » de FISHER

Hypothèse nulle H0 : il existe une dépendance:


H0 : Y = x1 et x2
Hypothèse rivale ou alternative H1: pas de dépendance
H1 : Y ≠ x1 et x2

( )
Formule : =

F=

= 17,5

F de table ;

= 19 voir table

44
~ 45 ~

H0

H1

17,5 19

H0 est acceptée ; Tandisque H1 est rejetée

45
~ 46 ~

----------------------------------------------------------------------------
TP №:3
Nom et post nom : ……………………………………………………………………………
Promotion et option : ……………………………………………………
№ D’ordre :……..

Supposons que les services de la Police souhaitent établir un modelé


de régression linéaire reliant la variable endogène (taux de criminalité juvénile )
mesuré par un indicateur Y, à la densité de la population urbaine mesurée par un
indicateur X₁ et au taux de scolarité X₂. On a relevé un échantillon de 5
observations ci-dessous :

Y X₁ X₂
1 2 4
1 3 2
2 5 2
3 7 1
3 8 1

T.D : Présentez le modèle et faites la régression par l’approche matricielle ainsi


que les tests appropriés.

46
~ 47 ~

CHAP V : VIOLATION DES HYPOTHESES DE BASE


5.1. AUTOCORRELATION

Le terme AUTOCORRELATION peut être défini comme étant


la corrélation qui existe entre les éléments d’une même série d’observation
ordonnés dans le temps ou dans l’espace

Il y a autocorrélation lorsque

E( , ) ≠ 0 pour tout i=j

L’autocorrélation donne des estimateurs non consistant ;


plusieurs raisons expliquent l’autocorrélation .il s’agit entre autre ce qui suit :

- autocorrélation peut provenir des variables explicatives


provenant de la mauvaise spécification de la forme
mathématique du modèle ;
- autocorrélation peut provenir aussi de l’interprétation dans les
observations statistiques ( ex : extrapolation de certaines
données)
- autocorrélation peut provenir encore de la mauvaise
spécification de la valeur aléatoire µ

5.1.1 Test de VON NEUMAN pour détecter l’autocorrélation

Il existe plusieurs test qui servent à la détermination


l’autocorrélation .Cependant dans le présent cours nous retenons celui de VON
NEUMAN qui est donné sous forme des ratios suivant :


𝝈
= ∑ ̅ Pour n ≥ 30
𝝈

Ce test ne s’applique pas pour détecter l’autocorrélation de µ


lorsque n < 30 .Dans ce dernier cas, on utilise le test de DURBAIN –
WATSON.

47
~ 48 ~

5.1.2 Test de DURBAIN – WATSON

a) l’expression mathématique

L’expression mathématique du test de Durain-Watson est la


suivante :

Sa valeur est comprise entre 0 et 4. Une valeur proche de zéro


indique une autocorrélation positive, les valeurs situées autour de 2 montrent
une absence d’autocorrélation et si l’on s’approche de 4, il existe une
autocorrélation négative (valeurs tantôt au-dessus et tantôt au-dessous de la
tendance).

Pour une interprétation plus précise on se réfère à une table, à


moins que le logiciel n’intègre un petit commentaire dans ses restitutions. On
trouve rarement des tables qui donnent des valeurs en-deçà de quinze
observations, les conclusions n’étant alors pas très significatives.

La table comprend, en fonction du nombre d’observations,


deux limites entre lesquelles il y a un doute (d1 et d2, mais cette écriture n’est
pas normalisée) :

0 d1 d2 4 - d2 4 - d1
autocorrélation zone de zone de autocorrélation
pas d'autocorrélation
positive doute doute négative

En général, ces zones de doute sont considérées comme


« probablement sans autocorrélation ».

b) Démarches du test de DURBAIN – WATSON

1. Faites la régression de moindre carré et obtenez les résidus ou erreurs


µ
2. Calculez d (DW)
3. Calculez les valeurs critiques dL et dU par la taille de l’échantillon et
le nombre des variables explicatives
4. Faites le test à l’aide du graphique suivant :

48
~ 49 ~

Graphique

H1 H0 H1

x
-2,228 2,228 28,80

NB au cas où l’autocorrélation persistait, on fait le remède

5.2 HETEROSCEDASTICITE

On parle de l’ homoscedasticite lorsque les observations ont


une même variance c.à.d:

E ( ) = 𝜎²

Par contre, si cette hypothèse est violée, on parle de


l’hétéroscedasticité.

Il existe plusieurs test qui servent à la détermination


l’hétéroscedasticité .Cependant dans le présent cours nous retenons celui de
GLEJSER et de SPEARMAN

5.2.1 TEST DE GLEJSER

Brièvement, le test de GLEJSER n’est utilisé que pour


détecter l’hétéroscedasticité dans des grands échantillons c.à.d. lorsque n ≥ 30.

Sa démarche est la suivante :

- Faire la régression de moindre carré

49
~ 50 ~

- Calculez les erreurs


- Expérimentez les expressions ci-après :

 | |= +
 | |= √ +
 | |= +
 | |= +

 | |=√
 | |=√

5.2.2 TEST DE SPEARMAN

Le TEST DE SPEARMAN est utilisé lorsque n < 30 .Il


comprend les étapes suivantes :

- Les valeurs de sont transformées en valeurs absolue et


ordonnée en ordre croissant
- Les valeurs de ̂ sont également ordonnée en ordre croissant
- On fait la différence entre les rangs correspondant ;c’est
- On calcule le coefficient de SPEARMAN par la formule
suivante :

Soulignons que ce coefficient, appelé rhô ou rs, est calculé


de la façon suivante (di étant la différence entre le rang de l’observation i et celui
de sa valeur)

- Ensuite, on calcul t par la formule suivante :


t=

50
~ 51 ~

- Si t calculé excède le t de la table de STUDENT au seuil de


signification choisi, alors il n’y a pas d’hétéroscedasticité.

NB : au cas où l’hétéroscedasticité persistait, on procède au remède

5.3. MULTICOLINEARITE

Crée par RAGNAR FRISH (norvégien), le terme signifie qu’il


existe une relation linéaire parfait ou exacte entre quelques variables
explicatives d’un modèle de régression. Dans ce cas le coefficient de corrélation
entre les variables = 1.ce qui entraine comme conséquence l’indépendante des
paramètres due à la non invisibilité de la matrice.

5.3.1 TEST POUR DETECTER LA MULTICOLINEARITE

Il existe plusieurs critère pour détecter la


MULTICOLINEARITE ; ces critères sont des critères pratiques .C’est entre
autre quand R² = 0,95 mais la plus part des β ne sont pas significatif. Ceci peut
être dû à la présence de la MULTICOLINEARITE.

Donc si en examinant le R² de la régression, on constate que


sa valeur est assez relevé mais que les coefficients son non significatifs, on
peut conclure qu’il y a la MULTICOLINEARITE entre les variables.

Il y a une quatre pratiques proposées par KLEIN qui consiste


à examiner les corrélations entre les paires des variables. Si ces corrélations sont
élevées, il y a la présence de la MULTICOLINEARITE.si non on procède
comme suit :

5.3.2 Test de KLEIN

La procédure est la suivante :

- Faire la régression
- Calculer :

= ⇒𝐅

51
~ 52 ~

Si le F calculé avec cette formule excède la valeur tabulaire


de F de FISHER, alors la variance particulière de est colinéaire avec les
autres variables du modèle.

La table a consulté est celui se F de FISHER SNEDECOR qui


sera présenté en annexe.

Précisons enfin que pour KLEIN la MULTICOLINEARITE


est indésirable que seulement si les R² calculés sont supérieurs au R² de la
régression.

52
~ 53 ~

BIBLOGRAPHIE

1. CORNILLON Pierre-André et MATZNER-LOBER Eric, Régression : Théorie et


applications, éd. Springer, 2007, 1re éd., 302 p.

2. Brigitte DORMONT, Introduction à l'économétrie, Paris, Montchrestien, 2007,


2e éd.

3. KINTAMBU MAFUKU. Principes d’Econométrie, éd. PUK, KINSHASA ,2009

4. TIANSENGA ZANZI J.D La pollution de l’environnement à Muanda – Une


menace réelle de l’écosystème - » éd. CRIDHAC, UNIKIN,
20 ème année, n° 052 Vol. II , Septembre 2016.

5. TIANSENGA ZANZI J.D Elément d’Econométrie, cours inédit, L1, UNIC,


Matadi, 2019

53
~ 54 ~

TABLE du t de student

α 0,9 0,5 0,3 0,2 0,1 0,05 0,02 0,01 0,001


dl
1 0,158 1 1,963 3,078 6,314 12,706 31,821 63,657 636,619
2 0,142 0,816 1,386 1,886 2,92 4,303 6,965 9,925 31,598
3 0,137 0,765 1,25 1,638 2,353 3,182 4,541 5,841 12,924
4 0,134 0,741 1,19 1,533 2,132 2,776 3,747 4,604 8,61
5 0,132 0,727 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6 0,131 0,718 1,134 1,44 1,943 2,447 3,143 3,707 5,959
7 0,13 0,711 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,13 0,706 1,108 1,397 1,86 2,306 2,896 3,355 5,041
9 0,129 0,703 1,1 1,383 1,833 2,262 2,821 3,25 4,781
10 0,129 0,7 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,129 0,697 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,695 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,694 1,079 1,35 1,771 2,16 2,65 3,012 4,221
14 0,128 0,692 1,076 1,345 1,761 2,145 2,624 2,977 4,14
15 0,128 0,691 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,128 0,69 1,071 1,337 1,746 2,12 2,583 2,921 4,015
17 0,128 0,689 1,069 1,333 1,74 2,11 2,567 2,898 3,965
18 0,127 0,688 1,067 1,33 1,734 2,101 2,552 2,878 3,922
19 0,127 0,688 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,687 1,064 1,325 1,725 2,086 2,528 2,845 3,85
21 0,127 0,686 1,063 1,323 1,721 2,08 2,518 2,831 3,819
22 0,127 0,686 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,685 1,06 1,319 1,714 2,069 2,5 2,807 3,767
24 0,127 0,685 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,684 1,058 1,316 1,708 2,06 2,485 2,787 3,725
26 0,127 0,684 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,684 1,057 1,314 1,703 2,052 2,473 2,771 3,69
28 0,127 0,683 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,127 0,683 1,055 1,311 1,699 2,045 2,462 2,756 3,659
30 0,127 0,683 1,055 1,31 1,697 2,042 2,457 2,75 3,646

∞ 0,126 0,674 1,036 1,282 1,645 1,96 2,326 2,576 3,291

54
~ 55 ~

Test F de Fisher

Valeur f de la variable de Fisher-Snedecor F ( ν1 ; ν2 ) ou F ( k1 ; k2 )

V₁ ou K₁ : degrés de liberté du numérateur ; V₂ ou K₂ : degrés de liberté du dénominateur

55
~ 56 ~

V₁ ou K₁ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
V₂ ou K₂
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88 242.98 243.90 244.69 245.36 245.95 246.47 246.92 247.32 247.69 248.02
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.65
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.28 2.25 2.22 2.20 2.18 2.16 2.14 2.12 2.11 2.10
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.26 2.23 2.20 2.17 2.15 2.13 2.11 2.10 2.08 2.07
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.24 2.20 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.22 2.18 2.15 2.13 2.11 2.09 2.07 2.05 2.04 2.03
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.20 2.16 2.14 2.11 2.09 2.07 2.05 2.04 2.02 2.01
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.18 2.15 2.12 2.09 2.07 2.05 2.03 2.02 2.00 1.99
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.17 2.13 2.10 2.08 2.06 2.04 2.02 2.00 1.99 1.97
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.15 2.12 2.09 2.06 2.04 2.02 2.00 1.99 1.97 1.96
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.14 2.10 2.08 2.05 2.03 2.01 1.99 1.97 1.96 1.94
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.06 2.04 2.01 1.99 1.98 1.96 1.95 1.93

56
~ 57 ~

PLAN DU COURS

PREFACE
CHAP I : GENERALITE

1.1 DEFINITION

1.2 BREVE HISTORIQUE DE L’ECONOMETRIE

1.3 OBJECTIFS DE L’ECONOMETRIE

1.4 ETAPES D’ANALYSE ECONOMETRIQUE

1.5 METHODE DE RECHERCHE EN ECONOMETRIE

CHAP II : MODELE DE REGRESSION LINEAIRE

2 .1 LE MODELE

2.2 CONTENU DU MODELE

2.3 DIFFRRENTS TYPES DES MODELES


2.3.1 Modèle statique
2.3.2 Modèle dynamique
2.3.3 Modèles déterministes ou stochastiques
2 .4 DEFINITION DE LA REGRESSION LINEAIRE.

2.5 FORME DU MODELE DE REGRESSION LINEAIRE.

2.6 IMPORTANCE DU MODELE DE REGRESSION LINEAIRE

2.7 METHODES D’ESTIMATION

CHAP III : PRESENTATION DU MODELE DE

REGRESSION LINEAIRE SIMPLE

3.1 DEFINITION

3.2 FORME DU MODELE

3.3 METHODE DES MOINDRES CARRES

3.4 DEMONSTRATION DE CRITERES DE MOINDRE

CARRE ET EQUATION NORMALE

57
~ 58 ~

3.4.1 Exemple

3.4.2 Droite d’ajustement

3.4.3 Les Estimateurs des moindres carrés ordinaires

3.5 TEST DE FIABILITE DE L’AJUSTEMENT

3.5.1. Coefficients de corrélation( r )

3.5.2. Coefficient de détermination( R²).

3.6 TEST DE SIGNIFICATION DES ESTIMATEURS DES

PARAMATRES

3.7 RAPPEL SUR LA NOTION DES TESTS D’HYPOTHESES


ET VERIFICATION DES HYPOTHESES.

3.8 TEST Z DES ESTIMATEURS DE MOINDRE CARRE

3.9 Le t DE STUDENT

CHAP IV : ANALYSE DE LA REGRESSION LINEAIRE MULTIPLE

4.1. LE MODELE DE REGRESSION LINEAIRE MULTIPLE

PAR L’APPROCHE MATRICIELLE

4.1.1 Présentation du modèle

4.1.2. Forme du modèle


4.1.3. Méthode d'estimation des Moindres Carré Ordinaire

4.1.4 Equation d'analyse de la variance et qualité de l'ajustement

4.1.5 Calcul de coefficient de détermination (R2)

4.2. EVALUATION GLOBALE DE LA REGRESSION

4.2.1 Tableau d'analyse de variance et coefficient de détermination

CHAP V : VIOLATION DES HYPOTHESES DE BASE

5.1. AUTOCORRELATION

5.1.1 Test de VON NEUMAN pour détecter l’autocorrélation

5.1.2 Test de DURBAIN – WATSON

5.2. HETEROSCEDASTICITE

5.2.1 TEST DE GLEJSER

58
~ 59 ~

5.2.2 TEST DE SPEARMAN

5.3. MULTICOLINEARITE

5.3.1 TEST POUR DETECTER LA MULTICOLINEARITE

5.3.2 Test de KLEIN

BIBLOGRAPHIE

ANNEXES

59

Vous aimerez peut-être aussi