2016 KA Diff
2016 KA Diff
Modélisation de la Croissance
pro-pauvre
Philippe Augé
3
Remerciements
Je tiens à remercier tous ceux sans qui cette thèse n’aurait jamais vu le jour. En
tout premier lieu à :
• Madame Françoise Seyte qui fit le pari il y a quelques années de diriger cette
thèse. Sa disponibilité, sa rigueur scientifique, ainsi que sa bienveillance discrète
ont été déterminantes dans l’accomplissement de ce travail. Je tiens à lui témoi-
gner ici toute ma gratitude.
• Monsieur Mussard Stéphane, qui m’a d’abord fait découvrir la régression Gini.
Mais aussi, qui a bien voulu accepter de m’accompagner dans cette entreprise
de recherche si exaltante. Par ses conseils avisés et ses remarques pertinentes, il
m’a permis d’améliorer la qualité de ce travail. J’ai apprécié la disponibilité, le
soutien constant dont il m’a fait preuve et qui m’ont donné la possibilité et la
volonté d’avancer. Qu’il trouve ici l’expression de ma gratitude. J’ai beaucoup
apprécié le fait de travailler avec lui.
• Mes sincères remerciements vont à Monsieur Philippe Van Kerm et Monsieur
Alexandru Minea pour m’avoir fait l’honneur de rapporter cette thèse.
• J’exprime ma gratitude à Monsieur Benoit Mulkay et Monsieur François Benh-
mad qui m’ont fait l’honneur d’examiner ce travail.
Cette thèse a été réalisée au sein du Laboratoire Montpelliérain d’économie
théorique et appliquée(LAMETA) où régnait une atmosphère conviviale. Merci
à : Ayad Assoil, Olfa Bouallegue, Nour Wehbi, Peguy Ndodjang, Mht Hisseine
Saad, Boumediene Souiki, Diogoye Faye, Zoul Moumouni, Abdou salam Diallo,
Mamadou Diop, Peguy, Maïté Stéphan ainsi que tous les doctorants du LAMETA
pour avoir tous contribué à ma construction.
A mes parents, pour m’avoir éduqué et transmis la meilleure part d’eux
même. A ma mère, pour m’avoir soutenu de manière indéfectible durant toutes
ces années. A mes frères et sœours.
A Aldiouma mme KA, pour avoir été mon compagnon de route durant toutes
ces années, pour avoir supporté avec patience les externalités négatives de ce
travail qui n’aurait certainement pas pu arriver à terme sans son soutien, des
remerciements sont très peu de chose.
Il me faut aussi remercier le secrétariat du World income Inequality database
de nous avoir fourni plusieurs versions de leur base de données.
Toutes ces personnes, à des degrés variables, ont contribué, directement ou
4
indirectement, au contenu de ce document, sans que leur responsabilité puisse
être engagée en ce qui concerne les erreurs qui pourraient s’y trouver. Je reste,
bien évidemment, seul responsable des manquements qui subsisteraient.
5
SOMMAIRE
Remerciements
Notations
Introduction
Conclusion Générale
Annexes
6
Notations
ARCH : AutoRegressif Conditionalal Heteroscedastixity.
CL : la Courbe de Lorenz.
D S : Deininger et Squire
7
OCDE : Organisation de coopération et de développement économiques.
VI : Variable Instrumentale.
8
Table des matières
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Sommaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 La méthodologie Gini 72
2.1 Généralités sur la méthodologie de Gini . . . . . . . . . . . . . . . . 74
2.1.1 La différence moyenne de Gini et Co-Gini . . . . . . . . . . . 74
2.1.2 Corrélation au sens de Gini : la G-corrélation . . . . . . . . . 78
2.1.3 Décomposition de la différence moyenne du Gini . . . . . . 80
9
2.2 La régression Gini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.2.1 Sensibilité de l’estimateur des MCO aux transformations
monotones et aux points aberrants . . . . . . . . . . . . . . . 85
2.2.2 L’approche paramétrique . . . . . . . . . . . . . . . . . . . . 87
2.2.3 L’approche semi-paramétrique . . . . . . . . . . . . . . . . . 89
2.2.4 Similarités et différences entre la régression Gini et les MCO 92
2.2.5 Les conditions de "Grenander modifiées" . . . . . . . . . . . 94
2.2.6 Traitement des ex aequo . . . . . . . . . . . . . . . . . . . . . 96
2.2.7 La régression Gini-VI . . . . . . . . . . . . . . . . . . . . . . . 97
2.2.8 Inférence et variance des estimateurs . . . . . . . . . . . . . 99
2.3 L’estimateur Gini en Données de Panel . . . . . . . . . . . . . . . . . 102
2.3.1 L’estimateur Gini du modèle à effets fixes . . . . . . . . . . . 104
2.3.2 Inférence sur l’estimateur intragroupe . . . . . . . . . . . . . 106
2.3.3 Simulations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.3.4 Test de l’existence de spécificités individuelles . . . . . . . . 111
2.4 Les perturbations non sphériques . . . . . . . . . . . . . . . . . . . . 115
2.4.1 Test de Shelef (2014) . . . . . . . . . . . . . . . . . . . . . . . 116
2.4.2 Extension du test de Shelef (2014) . . . . . . . . . . . . . . . 119
2.4.3 L’estimateur Gini du modèle à effets aléatoires . . . . . . . . 122
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
10
Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
3.3.1 Quelques U-statistiques . . . . . . . . . . . . . . . . . . . . . 173
3.3.2 Similarités et différences entre la régression Gini et les MCO 173
3.3.3 Décomposition de l’Aitken Gini . . . . . . . . . . . . . . . . 175
3.3.4 Estimation de notre modèle sur les différents quintiles MCO 178
11
Liste des tableaux
12
3.12 Estimation de notre modèle sur le premier quintile Gini . . . . . 153
3.13 Tests d’endogéneité . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
3.14 Quelques U-statistiques . . . . . . . . . . . . . . . . . . . . . . . . . 173
3.15 Estimation de notre modèle sur les différents quintiles MCO . . . 178
3.16 Estimation de notre modèle sur les différents quintiles MCO . . . 179
3.17 Estimation de notre modèle sur les différents quintiles Gini . . . 180
3.18 Estimation de notre modèle sur les différents quintiles Gini . . . 181
13
Université de Montpellier
Faculté d’Économie
14
Pro-poor growth modelling
15
Introduction
Les inégalités de revenu ont pendant longtemps été considérées comme un
problème passager qui disparaîtrait tout naturellement avec le processus de crois-
sance économique. Par conséquent, il n’était pas question de mener des poli-
tiques sociales coûteuses qui risqueraient d’engendrer des distorsions fiscales ;
pour cela, on pouvait compter seulement sur l’accumulation du capital. Kuznets
est certainement l’un des premiers auteurs à formaliser cette idée. Déjà, au milieu
des années 1950, il affirmait que les inégalités et la croissance entretiennent une
relation en forme d’une fonction en « U »inversée. En effet, selon lui, les inégali-
tés augmentent dans un premier temps avec le processus de croissance. Ensuite,
elles retombent avec le développement économique. Cependant, loin d’observer
ce phénomène, les inégalités continuent de persister malgré des périodes de forte
croissance économique. Davantage d’individus se considèrent aujourd’hui mar-
ginalisés.
Pourtant, la montée des inégalités a toujours été au cœur des préoccupations
des pouvoirs publics. Par exemple, George Bush affirmait en 2007 lors de l’une de
ses allocutions que "Nos citoyens déplorent que notre économie dynamique laisse
à la traîne certains d’entre eux. [. . .] l’inégalité des revenus est indéniablement ;
elle s’accroît depuis plus de 25 ans". Toutefois, malgré l’importance de cette ques-
tion et l’intérêt qu’elle a suscité, décideurs et analystes n’ont qu’une connaissance
imparfaite du sujet. Pourtant, le véritable enjeu pour mener une bonne politique
de développement passe nécessairement par la compréhension des interactions
entre distribution du revenu et croissance économique.
Depuis les travaux de Kuznets (1955), de nombreux modèles théoriques ont
été développés pour rendre compte de l’impact des inégalités sur le processus
de développement. Un premier courant de pensée suggère l’existence d’une re-
lation positive entre les inégalités de revenu et la croissance. Deux arguments
principaux fondent ce courant. Le premier s’appuie sur le modèle de croissance
de Kaldor selon lequel la propension marginale à épargner (Pms) est plus forte
chez les riches que chez les pauvres. Le second s’appuie sur le caractère indi-
visible de l’investissement. Dans un contexte de marchés financiers imparfaits,
une concentration de la richesse serait nécessaire pour financer les coûts fixes
liés à la promotion de nouvelles activités industrielles et d’innovations technolo-
giques Galor and Tsiddon (1997). De nombreuses critiques ont été formulées par
16
la suite à leur encontre. La vision dominante serait aujourd’hui plutôt celle d’un
impact négatif des inégalités sur le taux de croissance. Une première justification
est d’ordre socio-politique (socialpolitical unrest). De fortes inégalités de revenu
peuvent engendrer des mouvements de contestation sociale, des activités crimi-
nelles et donc une situation d’instabilité qui inhibe l’investissement. Par ailleurs,
dans une société démocratique si le revenu moyen dépasse de loin le revenu mé-
dian un système de vote à la majorité simple serait favorable à une redistribu-
tion des ressources des riches vers les pauvres (transferts, dépenses publiques,
etc.) ce qui pourrait conduire à des distorsions fiscales et détourner ainsi la classe
riche de l’investissement. Ces modèles particulièrement connus sous le nom de
modèles d’économie politique ont la particularité d’endogénéiser les politiques
redistributives.
Les débats entamés depuis le début des années 1990 sur les alternatives pos-
sibles à la littérature sur les inégalités ont fait porter un nouveau regard sur le
concept de croissance pro-pauvre (ou croissance inclusive). Il est important de
noter qu’il est à la fois trompeur et incertain de croire qu’une croissance éco-
nomique forte conduit forcément à une réduction des inégalités. Cette nouvelle
conception, portée par des auteurs comme Anand and Kanbur (1993b), Bourgui-
gnon (2003), Kakwani (1993), Klasen (2005), discute des conditions sous lesquelles
la croissance profite aux plus pauvres. Et comme le souligne Klasen (2005), cette
approche ne tente nullement à réfuter l’idée selon laquelle la croissance réduit,
à terme, la pauvreté. Bien au contraire, elle consiste à accroître l’influence de la
croissance sur la réduction de la pauvreté. Promouvoir la croissance pro-pauvre
revient donc à donner la priorité aux politiques ayant un impact favorable à la
fois sur la croissance et sur la réduction des inégalités. Historiquement, on consi-
dère deux approches pour aborder ce thème : dans la première, dite relative, la
croissance est pro-pauvre lorsqu’elle se manifeste par une réduction des inéga-
lités en faveur des pauvres. La seconde approche, dite absolue, considère que la
croissance est pro-pauvre lorsqu’elle s’accompagne d’une réduction du taux de
pauvreté en terme absolu. Chacune de ces approches présente des insuffisances
majeures et certains chercheurs ont tenté de proposer des approches alternatives.
Aujourd’hui, la question la plus importante et sans nul doute la plus difficile
est celle de la mesure de la croissance pro-pauvre. Plus concrètement, comment
identifier une croissance inclusive. De combien de point de pourcentage de crois-
17
sance les pauvres doivent-ils bénéficier afin de la qualifier de pro-pauvre ? Ces
dernières années, les praticiens ont développé une multitude de mesures pour
déterminer empiriquement l’impact de la croissance sur les plus démunis. Nous
pouvons citer en guise d’exemple la courbe d’incidence de la croissance (CIC) de
Ravallion and Chen (2003) ; le taux de croissance pro-pauvre de Ravallion and
Chen (2003) ; la courbe de croissance de la pauvreté de Son (2004) ; le biais de
pauvreté de croissance de McCulloch and Baulch (1999) ; l’indice de la croissance
pro-pauvre de Kakwani et al. (2000) ; etc. Toutefois, malgré la grande diversité des
indices, d’un point de vue empirique, un travail important est encore nécessaire
sur cette question de quantification de la croissance pro-pauvre. En effet, à l’heure
actuelle, il n’existe pas de mesure de la croissance pro-pauvre faisant l’unanimité.
L’une des principales limites de ces indices est qu’ils se focalisent uniquement sur
la dimension monétaire de la pauvreté. Ce qui peut paraître très restrictif bien que
nous reconnaissons le lien entre la dimension monétaire et non monétaire de la
pauvreté. En outre, en plus de leur caractère partiel, ces indices peuvent conduire
à des résultats contradictoires. C’est pourquoi, ces années récentes ont vu naître
une approche alternative pour quantifier le caractère pro-pauvre de la croissance.
Cette seconde approche utilise généralement des modèles économétriques afin
d’établir une causalité entre croissance pro-pauvre et indicateurs de bien-être.
Cette thèse s’inscrit dans la continuité de cette dernière approche. Plus précisé-
ment, l’objet de cette thèse est de développer des techniques d’estimation qui
nous permettront de conclure avec plus de rigueur quant à la question du signe
de cette relation.
Globalement, bien que l’approche économétrique présente l’avantage d’in-
clure la dimension non monétaire de la pauvreté, elle est sujette à deux types
de biais que sont le biais de sélection et le biais d’endogenéité. Ces derniers s’ex-
pliquent principalement par les limites inhérentes aux données. En effet, malgré
les améliorations considérables de ces dernières années, les données sur la crois-
sance pro-pauvre continuent de poser de sérieux problèmes aux chercheurs. Ces
derniers déplorent le nombre élevé d’observations manquantes et la présence de
points aberrants. La grande totalité des données est de piètre qualité et est sujette
à d’importantes erreurs de mesure. Malgré, les efforts visant à améliorer (ou élar-
gir) les données existantes, elles restent insatisfaisantes. Les données sur la crois-
sance pro-pauvre diffèrent entre les pays en termes de couverture géographique
18
(couverture nationale, urbaine ou rurale), d’unités statistiques (familles, ménages
ou individus) et de définition de revenu (dépenses de consommation, revenu dis-
ponible ou revenu brut). Ces erreurs de mesure engendrent une sous-estimation,
en valeur absolue, de la vraie valeur du paramètre de la variable sujette à cette
erreur de mesure.
Par ailleurs, dans la plupart des travaux empiriques les échantillons sont com-
posés d’une soixantaine de pays parmi lesquels les pays développés sont surre-
présentés et les pays pauvres surtout ceux d’Afrique sub-saharienne quasiment
inexistants, ceci conduit à des échantillons très hétérogènes et à une sélection
drastique. A cela s’ajoute, le fait que la dimension temporelle des données est ex-
trêmement limitée. En conséquence, la variance inter-individuelle est largement
supérieure à la variance inter-temporelle (Cogneau et al., 2002; White and An-
derson, 2001; Ghura et al., 2002, entre autres). En outre, il serait nécessaire de
tester la robustesse des conclusions en analysant les canaux de transmission et de
voir aussi si les résultats restent valables dans d’autres échantillons et également
avec des combinaisons différentes de variables explicatives. D’ailleurs, certains
auteurs, (Barro, 2000; Ghura et al., 2002, entre autres), montrent la sensibilité des
résultats au type d’échantillon et aux formes fonctionnelles retenues. L’une des
particularités de notre travail est justement de proposer un modèle de correction
de ces trois limites. A cet effet, nous utiliserons la régression Gini. Cette dernière
introduit par Olkin and Yitzhaki (1992) présente plusieurs avantages : elle est
moins sensible que les méthodes traditionnelles aux erreurs de mesures et aux
points aberrants (outliers). Mais aussi, elle est plus robuste car les estimateurs
obtenus par cette approche sont insensible aux formes fonctionnelles retenues et
au biais de sélection.
Formellement, la régression Gini consiste à utiliser la différence moyenne du
Gini (GMD) comme mesure de dispersion. Cette dernière a été introduite en 1912
par Corrado Gini, et depuis, plusieurs opérateurs ou coefficients ont été déduits
comme la covariance au sens de Gini (co-Gini), la corrélation au sens de Gini (G-
corrélation), l’analyse du Gini (ANOGI). Comme nous le verrons plus loin la co-
Gini n’est pas symétrique. Cela explique d’ailleurs le fait qu’il existe deux types
de régression Gini. La première consiste à minimiser la GMD des erreurs. Les
estimateurs obtenus par cette approche ont la propriété d’optimalité. La seconde
approche consiste à construire l’estimateur en question de sorte qu’il soit moins
19
sensible aux outliers. Cette seconde approche, puisqu’elle ne découle pas d’un
programme de minimisation et par conséquent ne requiert pas de définir une
forme fonctionnelle quelconque, est qualifiée de régression semi-paramétrique.
L’estimateur obtenu par cette dernière approche est similaire à celui obtenu par
les MCO ; excepté que chaque variance est remplacée par la GMD et chaque co-
variance par la co-Gini appropriée voir Ka and Mussard (2015).
D’un point de vue théorique et empirique, un travail important est encore
nécessaire sur la régression Gini notamment en panel. En effet, introduite par
Olkin and Yitzhaki (1992), la réflexion sur la régression Gini a été étendue aux
variables instrumentales par Yitzhaki and Schechtman (2004) et aux séries tem-
porelles par (Shelef and Schechtman, 2011; Shelef, 2014; Carcea and Serfling, 2015,
entre autres). Nous proposons de l’étendre aux données de panel. C’est dans ce cadre que
nous avons développé l’estimateur par effet fixe en utilisant la GMD comme mesure de
dispersion Ka and Mussard (2016). Nous proposons également le test de l’existence de
spécificités individuelles et l’estimateur du modèle à effets aléatoires. L’intérêt essentiel
de développer la régression Gini en panel réside dans la volonté de pouvoir ex-
ploiter au mieux les avantages spécifiques de ces données. En particulier, la pos-
sibilité de prendre en compte les outliers. Puisqu’un échantillon de données de
panel contient un très grand nombre d’observations, on peut penser a priori que
cet ensemble d’observations est capable de ”neutraliser” l’influence de quelques
points aberrants. En réalité, ce n’est pas vraiment le cas. Huber (1980) a montré
que seulement 3% de valeurs atypiques dans un échantillon suffisent à perturber
significativement la qualité des estimations. Plus généralement, dans le cadre de
l’économétrie sur données de panel, et comme nous le verrons d’ailleurs dans le
chapitre suivant, quelques points atypiques peuvent suffire à modifier considé-
rablement les résultats d’une estimation.
Cette thèse est composée de trois chapitres structurés de la manière suivante.
Le premier chapitre est une revue de la littérature de la croissance pro-pauvre.
Il est composé de deux sections. La première section s’intéresse principalement
aux définitions. Aujourd’hui, il existe une multitude de définitions et de mesures
de la croissance pro-pauvre. Et le lecteur non averti peut se perdre facilement
dans cette vaste littérature. C’est pour cette raison que nous avons envisagé de
rédiger cette section, dans l’objectif de faire une synthèse de toutes ces mesures
et définitions. La seconde section examine les modèles théoriques et empiriques
20
portant sur les interactions entre distribution du revenu et croissance. Ainsi, il
vise essentiellement à rendre accessible au lecteur cette vaste littérature. Il s’agit
principalement d’un travail de présentation, d’éclaircissement et de critique des
principaux courants impliqués dans ce débat.
Le second chapitre s’intéresse à la régression Gini. La première section de ce
chapitre revient sur les généralités de la méthode Gini. Nous allons y présenter
entre autres la différence moyenne du Gini, le co-Gini, la corrélation au sens de
Gini et les différentes méthodes de décomposition de l’indice de Gini. La seconde
section s’intéresse aux régressions Gini, à leurs propriétés et aux hypothèses sur
la matrice des moments. Une remarque additionnelle sera également portée au
traitement des ex-æquo. Dans la troisième section nous développons l’estima-
teur intragroupe et intergroupe au sens de Gini du modèle à effets fixes et le test
d’existence de l’effet individuel et enfin la dernière section constitue nos derniers
développements théoriques.
Le dernier chapitre constitue une application empirique. Il s’intéresse parti-
culièrement aux limites des indices de la croissance pro-pauvre mais également
aux conséquences de la méthode d’estimation et de la sélection de l’échantillon.
Dans la première section de ce chapitre 3 nous proposons une étude compara-
tive de quelques indices de la croissance inclusive. Plus précisément, nous allons
étudier le caractère inclusif de la croissance Thaïlandaise en utilisant plusieurs
indices. Ceci nous permettra de constater que ces derniers peuvent conduire à
des résultats contradictoires. La seconde section s’intéresse aux conséquences de
la limitation des données, des choix de spécification et à la méthode d’estimation.
La sensibilité des estimateurs par effets fixes standards aux outliers, aux erreurs
de mesures et aux formes fonctionnelles fait que nous privilégierons l’utilisation
de notre estimateur intra-individuel (ou intragroupe) de la régression Gini. Cette
dernière est plus robuste que l’estimateur intra basé sur les MCO Ka and Mussard
(2016).
Nous allons maintenant aborder le premier chapitre de cette thèse sur la crois-
sance pro-pauvre.
21
Chapitre 1
22
férieure à 1%, selon le pays et la période Ravallion (2004). Ceci nous amène à nous
demander pourquoi la croissance ne profite pas toujours aux plus pauvres. Dans
une économie décentralisée, les réponses à cette question résident dans le degré
d’accès des pauvres aux marchés et plus généralement aux inégalités de revenu
et sociales. Par conséquent, la prise en compte du lien entre la distribution des
revenus et la croissance est cruciale pour toute politique tendant à assurer une
croissance pro-pauvre.
Manifestement, le véritable enjeu pour mener une bonne politique de déve-
loppement passe nécessairement par la compréhension des interactions entre dis-
tribution du revenu et croissance économique. En effet, comme le souligne Bour-
guignon (2004) et comme la réalité tend à le montrer, la réduction de la pauvreté
réside beaucoup plus dans les interactions entre inégalités de revenu et crois-
sance que dans les relations entre, d’une part, pauvreté et croissance et, d’autre
part, pauvreté et inégalités, qui restent essentiellement arithmétiques. Une forte
croissance économique, par exemple, a été le principal levier de réduction de la
pauvreté en Extrême-Orient et en Asie du Sud-Est où la proportion des gens vi-
vant dans la pauvreté est passée respectivement de 33% en 1990 à 9,9% en 2004 et
de 41% à 29,5% (durant la même période). Par contre, en Afrique sub-saharienne
où la croissance économique a été relativement faible, l’incidence de la pauvreté
n’a diminué que légèrement, de 47% en 1990 à 41% en 2004 Wiggins and Hig-
gins (2008). De même, plusieurs travaux tendent à montrer qu’une détérioration
de la distribution des revenus favorise l’augmentation de la pauvreté. Toutefois,
une question intéressante est de savoir si la distribution du revenu et la crois-
sance sont étroitement liées ou si, au contraire, elles sont indépendantes ? De-
puis les travaux de Kuznets dans les années 1950, le débat sur cette question ne
cesse d’être alimenté par de nouveaux arguments. Cette hypothèse de Kuznets,
selon laquelle les inégalités de revenu augmentent dans les premières phases du
processus de croissance puis retombent avec le développement économique, lar-
gement corroborée par les travaux empiriques antérieurs (Adelman and Morris,
1973; Ahluwalia, 1976; Papanek and Kyn, 1986) a très vite laissé place à la contro-
verse. Tout d’abord, Anand and Kanbur (1993a) montrent que sur le plan em-
pirique l’apparition de la courbe de Kuznets dépendrait en grande partie de la
forme fonctionnelle retenue. Ensuite et surtout peut être, dans les années 1990,
un nouveau fait stylisé issu de l’économétrie révèle une relation de causalité in-
23
verse entre les inégalités de revenu et la croissance. Ces travaux sont l’œuvre
de Persson and Tabellini (1994). De nombreux modèles théoriques ont été éla-
borés pour rendre compte de cette régularité. Nous pouvons citer déjà à titre
d’exemple les modèles d’économie politique Persson and Tabellini (1994) et Ale-
sina and Rodrik (1994), les modèles d’imperfection du marché du crédit (Banerjee
and Newman, 1993; Galor and Zeira, 1993), les modèles portant sur l’instabilité
sociopolitique que pourraient engendrer de fortes inégalités de revenu Alesina
and Perotti (1996) etc. Malheureusement, cette nouvelle relation, tout comme la
courbe de Kuznets d’ailleurs, a très vite montré sa fragilité. En effet, ces premiers
travaux ont été largement remis en cause par les analyses sur données de panel.
Ces dernières ont trouvé une relation positive, non linéaire, voire nulle entre les
inégalités de revenu et la croissance (Forbes, 2000; Barro, 2000; Banerjee and Du-
flo, 2003; Deininger and Squire, 1998). D’ailleurs c’est la raison pour laquelle cette
nouvelle conception portée par des auteurs comme Anand and Kanbur (1993a),
(Kakwani et al., 2000; Bourguignon, 2004; Klasen, 2004) discute des conditions
sous lesquelles la croissance profite aux plus pauvres. Cependant, tout comme
la pauvreté, il est difficile de définir ce nouveau concept. Schématiquement, il
s’agit d’une croissance qui engendre une diminution significative de la pauvreté
OCDE (2001) 2 . Toute la difficulté tient au mot ”significatif” ce qui conduit ainsi à
plusieurs approches définitionnelles.
La croissance est manifestement favorable aux pauvres lorsqu’elle entraîne
l’augmentation de leurs revenus. Toutefois, comme le souligne Lopez (2004), la
question la plus importante et sans nul doute la plus difficile est celle de savoir de
combien les pauvres doivent bénéficier de la croissance pour qu’elle soit qualifiée
de pro-pauvre. Cette question s’intéresse donc à la mesure de la croissance pro-
pauvre. Heureusement, les chercheurs ont proposé une multitude de mesures
pour déterminer empiriquement l’impact de la croissance sur les plus démunis :
la courbe d’incidence de la croissance (CIC) de Ravallion and Chen (2003) ; le taux
de croissance pro-pauvre de Ravallion and Chen (2003) ; la courbe de croissance
de la pauvreté de (Son, 2004) ; le biais de pauvreté de croissance de McCulloch
and Baulch (1999) ; l’indice de la croissance pro-pauvre de Kakwani et al. (2000) ;
etc. Ces indices étant largement connus, quelques brefs rappels sont seulement
proposés dans ce chapitre. Toutefois, malgré la grande diversité des indices, d’un
2. (Pro-pauvre growth may be referred as growth that benefits the poor and provides them
with opportunities to improve their economic situation OCDE (2001)).
24
point de vue empirique, un travail important est encore nécessaire sur cette ques-
tion de quantification de la croissance pro-pauvre. En effet, à l’heure actuelle, il
n’existe pas de mesure de la croissance pro-pauvre faisant l’unanimité. L’une des
principales limites de ces indices est qu’ils se focalisent uniquement sur la dimen-
sion monétaire de la pauvreté, ce qui peut paraître très restrictif bien que nous
reconnaissant le lien entre la dimension monétaire et non monétaire de la pau-
vreté. En outre, comme nous allons le voir plus loin dans cette thèse (chapitre3),
une réflexion en profondeur nous permet de constater que ces derniers peuvent
aboutir à des conclusions contradictoires. C’est pourquoi, ces années récentes ont
vu naître une approche alternative pour quantifier le caractère pro-pauvre de la
croissance. Cette seconde approche utilise généralement des modèles économé-
triques afin d’établir une causalité entre croissance pro-pauvre et indicateurs de
bien-être.
Dans l’objectif d’introduire cette réflexion sur la problématique de la crois-
sance pro-pauvre et les limites des approches traditionnelles, ce chapitre propose
une synthèse de la littérature sur les concepts de base. Ainsi, nous tenterons de
recenser les définitions et principales mesures de la croissance pro-pauvre. Il com-
prend deux grandes sections.
La première section est consacrée aux concepts de base : définitions, mesures
et politiques pro-pauvres. Plus précisément, dans cette première section nous
présenterons les différentes définitions, indices et politiques de croissance pro-
pauvre. Dans la seconde section, nous faisons une revue sélective des avancés
théoriques et empiriques sur la réflexion dans la relation entre inégalités de re-
venu et croissance.
25
1.1 Pauvreté et croissance économique
La croissance pro-pauvre est au centre du débat économique ce qui témoigne
de sa popularité ces dernières années même si sa définition reste difficile. Sché-
matiquement, la croissance est qualifiée de pro-pauvre lorsqu’elle s’accompagne
d’une réduction significative de la pauvreté OCDE (2001). Toutefois, cette dé-
finition est vaste et nous fournit peu d’informations. En effet, nous ne savons
pas de combien les pauvres doivent bénéficier de la croissance pour que celui-ci
soit qualifiée de pro-pauvre. Que signifie une diminution signification de la pau-
vreté ? Toutes ces interrogations font l’objet de divergence dans les définitions et
conduisent à plusieurs approches quant à sa mesure. Certains favorisent une ap-
proche relative pour définir la croissance pro-pauvre, en considérant que la crois-
sance est pro-pauvre lorsqu’elle s’accompagne d’une réduction des inégalités de
revenu (White and Anderson, 2001; Klasen, 2004). 3 D’autres préfèrent l’approche
absolue qui définit la croissance pro-pauvre comme étant une croissance qui ré-
duit le taux de pauvreté (Kakwani et al., 2000, 2002). Comme nous allons le voir
chacune de ces approches présente des limites et certains chercheurs ont tenté
de proposer des approches alternatives (exemple Osmani et al. (2005)). Toutefois,
la question la plus importante est celle de savoir de combien l’incidence de la
pauvreté doit diminuer pour que la croissance soit considérée comme étant pro-
pauvre Lopez (2004). Cette question s’intéresse donc à la mesure de la croissance
pro-pauvre. Deux grandes approches se sont dégagées pour mesurer une telle
croissance. Une première se fonde sur des indices. 4 Et la seconde utilise des mo-
dèles économétriques afin d’établir une causalité entre croissance pro-pauvre et
indicateurs de bien-être. Ainsi, cette section établit un rapprochement de ces deux
méthodes afin de pouvoir dégager leurs limites. Mais, nous exposerons dans un
premier temps les différentes approches retenues dans la littérature en termes de
définition. Ceci semble être indispensable car quelle que soit la méthode utilisée,
elle reste largement tributaire de la définition considérée. Nous nous intéresse-
rons également aux politiques pro-pauvres.
3. Intuitivement, dans le contexte d’une croissance économique, une baisse des inégalités de
revenu signifie que les pauvres ont profité plus de la croissance que les autres.
4. Ces indices étant largement connus, la formalisation sera volontairement réduite au mini-
mum nécessaire.
26
1.1.1 Définitions de la croissance pro-pauvre
Au cours des années 90, la littérature sur la croissance pro-pauvre a fait l’objet
d’évolutions profondes. En effet, elle a montré que les stratégies fondées sur la
seule promotion de la croissance sont insuffisantes pour engendrer une réduc-
tion significative de la pauvreté. L’idée de base est relativement simple : la crois-
sance est un vecteur indéniable de réduction de la pauvreté ; toutefois à crois-
sance égale, certains pays parviennent mieux que d’autres à réduire la pauvreté.
Par exemple, comme le montre le graphique ci-dessous, bien qu’en général la
croissance s’accompagne d’une réduction de la pauvreté, on constate de fortes
divergences entre les pays : le Salvador a vu durant les années 90 une réduction
de la pauvreté plus importante que l’Inde et l’Ouganda malgré une croissance
plus lente. La croissance n’explique pas à elle seule la totalité de l’évolution de la
pauvreté.
27
deux grandes approches se sont développées pour définir la croissance pro-
pauvre. Certains comme (White and Anderson, 2001; Klasen, 2004) favorisent
l’approche relative et d’autres, (Ravallion and Chen, 2003; Kraay, 2006), préfèrent
l’approche absolue.
28
limites et se concentre essentiellement sur le lien entre pauvreté et croissance et
non sur la distribution du revenu. Sous l’angle absolu, la croissance est dite pro-
pauvre lorsqu’elle se traduit par une réduction du taux de pauvreté en terme
absolu. Cette seconde approche est beaucoup moins contraignante que la précé-
dente dans la mesure où elle se focalise sur les variations de l’indice de mesure de
la pauvreté suite à un épisode de croissance. D’ailleurs, elle est partagée par Ra-
vallion and Chen (2003) et Kraay (2006) qui ont fondé leurs mesures de croissance
pro-pauvre sur cette définition. Il serait également intéressant d’insister sur le fait
que selon cette approche la croissance sera dite pro-pauvre lorsqu’elle se traduit
par une variation positive des revenus des plus pauvres, peu importe la pro-
portion. Cependant, tout comme la première, cette approche n’est pas exempte
de critiques. En effet, un problème lié à cette seconde définition est qu’elle peut
considérer une croissance économique accompagnée d’une forte augmentation
des inégalités de revenu comme étant pro-pauvre.
Osmani et al. (2005) propose une version particulière en agrégeant les deux
approches précédentes. Ainsi, selon lui, la croissance sera pro-pauvre lorsqu’elle
réduit à la fois la pauvreté et les inégalités. Cette approche a le mérite d’insister
sur les interactions possibles entre croissance, inégalité et pauvreté.
Rappelons que, trois grandes étapes sont généralement nécessaires pour effec-
tuer une analyse de la croissance pro-pauvre d’un pays : choisir un indicateur de
bien-être, définir un seuil de pauvreté et enfin utiliser une mesure de la croissance
pro-pauvre. Ce dernier point fait l’objet de la section suivante.
De façon générale, on utilise les revenus ou les dépenses de consommation
comme indicateur de bien-être. Cependant, la littérature privilégie les dépenses
pour deux raisons principales. D’abord, elles reflètent assez bien le niveau de
vie des ménages puisqu’elles constituent une bonne approximation des revenus.
Ensuite, les dépenses sont plus faciles à mesurer que les revenus surtout dans
les pays en voie développement où ces derniers proviennent en grande partie du
secteur informel. Ces approches permettent de déterminer un seuil de pauvreté
(ligne de pauvreté) nécessaire à la mesure agrégée de la pauvreté. 5
5. On peut se référer aux méthodes basées soit sur l’énergie calorifique (Food Energy Intake
(FEI)) soit sur le coût des besoins de base (Cost of Basic Needs, CBN).
29
1.1.2 Les mesures agrégées de la croissance pro-pauvre
Les mesures traditionnelles de la pauvreté
Ces indices satisfont notamment les axiomes suivants. Soit P une mesure de pau-
vreté.
Définition 1.1.1 – Axiome focus – Une mesure de pauvreté doit être invariante aux
changements chez les riches. Pour tout vecteur de revenus y obtenu à partir de x avec une
augmentation du revenu d’au moins une personne riche alors :
Définition 1.1.2 – Axiome de Monotonie – Toute perte (gain) de revenu d’un indi-
vidu pauvre accroît (réduit) la pauvreté P .
Ces indices sont aussi connus pour leurs propriétés liées à l’approche par do-
minance stochastique. 6 Cependant, quantifier l’impact de la croissance sur la ré-
duction de la pauvreté nécessite d’aller plus loin dans l’utilisation des indices
6. Il s’agit d’une méthode (comparaisons de courbes) dont l’objectif est d’obtenir des résultats
30
agrégés. A croissance égale, certains pays parviennent mieux que d’autre à ré-
duire la pauvreté. C’est pour cette raison que ces dernières années plusieurs cher-
cheurs ont tenté de proposer des mesures basés à la fois sur la croissance écono-
mique et les indicateurs agrégés de pauvreté. Les premières tentatives d’évalua-
tion de la croissance pro-pauvre se basent sur l’idée selon laquelle la réduction de
la pauvreté peut être décomposée en une composante ”croissance” et une com-
posante ”redistribution” Kakwani (2000) à laquelle pourrait s’ajouter éventuelle-
ment un résidu Datt and Ravallion (1992).
31
F IGURE 1.2 – Décomposition de la pauvreté.
32
Pt = P (z/µt ; CLt ), (1.4)
∆Pt,t+1 = [P (µt+1 , CLt ) − P (µt , CLt ] + [P (µt , CLt+1 ) − P (µt , CLt ] + Rt+1 , t .
ü ûú ý ü ûú ý ü ûú ý
effet croissance effet redistribution résidu
(1.6)
Les effets obtenus sont :
l’effet croissance G(t; t + n; r) = P (z/µt+n ; CLt ) − P (z/µt ; CLt ) ;
l’effet redistributif D(t; t + n; r) = P (z/µt ; CLt+n ) − P (z/µt ; CLt ) ;
r étant la date de référence à laquelle le changement observé dans la pauvreté
est décomposé. Selon Datt and Ravallion (1992), pour r = t le terme résiduel noté
R(t; t + n; r) devient :
R(t; t+n; r) = G(t; t+n; t+n)−G(t; t+n; t) = D(t; t+n; t+n)−D(t; t+n; t). (1.7)
33
riante de cette décomposition de la pauvreté sans le terme résiduel de Datt and
Ravallion (1992). Selon Kakwani (2000) la principale explication d’une variation
globale de la pauvreté réside dans l’effet croissance et l’effet redistribution.
′
yt (p) = F−1
t (p) = CLt (p)µt . (1.8)
Avec :
yt′ (p) > 0 ;
CLt (p) la pente de la courbe de Lorenz ;
′
µt le revenu moyen.
Par conséquent, entre deux périodes t − 1 et t, le taux de croissance du piéme
centile donne un point de la courbe d’incidence de la croissance (CIC) :
CL′t(p)
Gt(p) = (γ + 1) − 1, ∀p ∈ [0, 1], (1.10)
CL′t−1(p)
où γ = (µt /µt−1 ) − 1 représente le taux de croissance du revenu moyen. L’in-
térêt de cette dernière présentation est qu’elle permet de mieux comprendre la
34
décomposition de la pauvreté précédente de Datt and Ravallion (1992). En effet,
lorsque la courbe de Lorenz CL reste inchangée entre t − 1 et t, c’est à dire lorsque
l’effet redistributif est nul (CL′t−1(p) = CL′t(p) ) alors Gt(p) = γ : il s’agit de l’effet
croissance Ravallion and Chen (2003).
Selon cette approche la croissance est dite pro-pauvre lorsqu’il y’a dominance
stochastique de premier ordre entre les distributions relatives aux deux périodes.
Autrement dit, lorsque les taux de croissance Gt(p) sont tous positifs, pour tout
p, jusqu’à un certain point p∗ critique, la croissance est pro-pauvre en terme ab-
solue. Par contre, lorsque la dominance stochastique de premier ordre n’est pas
satisfaite, c’est-à-dire lorsque les courbes se croisent (changement de signe pour
Gt(p) ), il devient impossible de conclure sur la seule base de cet indicateur.
En conclusion, nous pouvons constater que la CIC présente deux insuffisances
majeures. En premier lieu, cette mesure est considérée par Duclos (2009) comme
étant trop ”contraignante”. En effet, elle considère la croissance comme étant pro-
pauvre que lorsque le taux de croissance de tous les centiles est supérieur au
taux de croissance du revenu moyen. En second lieu, sur le plan pratique, il faut
faire attention sur les résultats de cette mesure au niveau de la robustesse de
l’évolution des taux de croissance aux queues de la distribution des revenus. Plus
précisément, comme le souligne Ravallion and Chen (2003), la variabilité entre les
deux périodes due à l’erreur de mesure est très importante dans les extrémités de
la distribution des revenus.
35
en supposant que les inégalités de revenu restent inchangées et une composante
redistribution∆Pi ou inégalité mesurant le changement de pauvreté engendré par
une variation de la distribution des revenus pour un revenu moyen fixe :
BP C = −∆Pi . (1.12)
La principale limite de cette approche tient au fait qu’un indice élevé (BPC élevé)
ne correspond pas toujours à une importante réduction de la pauvreté. En effet,
cette dernière dépend également de l’effet croissance qui n’est pas pris en compte
dans cette approche. Ainsi, cet indice ne satisfait pas l’axiome de monotonie.
Selon Kakwani et al. (2000) la croissance est pro-pauvre lorsque les pauvres
en bénéficient de façon plus proportionnelle que les non pauvres.
Soit η, l’élasticité de la pauvreté à une augmentation de la croissance lorsqu’on
suppose les inégalités de revenu inchangées.
Soit δ, l’élasticité globale de la pauvreté à la croissance, c’est-à-dire, la varia-
tion de la pauvreté, suite à une période de croissance économique.
La mesure δ peut être aussi définie comme étant la baisse de la pauvreté résul-
tant d’une croissance économique d’un point. Elle peut être décomposée comme
la somme de deux composantes : η (composante croissance) et ε (composante re-
distribution). Cette dernière représente la baisse de la pauvreté résultant d’une
variation des inégalités de revenu (évidemment en supposant qu’il n’y ait pas de
croissance économique) :
δ = η + ε. (1.13)
δ η+ε
Ψ= = . (1.14)
η η
L’indice de croissance pro-pauvre est égal au rapport entre la réduction totale de
36
la pauvreté et la réduction de la pauvreté obtenue en supposant les inégalités de
revenu inchangées.
Puisque la mesure η est toujours négative si le taux de croissance est positif (la
pauvreté diminue), alors Ψ sera supérieur à un si et seulement si ε < 0, en effet :
δ η+ε ε
Ψ= = = + 1. (1.15)
η η η
37
les bénéfices de la croissance sont distribués entre les membres de la société. Ce
dernier correspond à l’indice de croissance pro-pauvre. Formellement :
Notons que lorsque Ψ = 1 alors chaque membre de la société reçoit la même pro-
portion des bénéfices de la croissance. A partir de l’équation (1.16), nous avons :
f (g ∗ , 1) = δg ∗ . (1.19)
38
cas. La croissance sera alors considérée comme étant pro-pauvre (respectivement
pro-riche) lorsque g ∗ est supérieur (inférieur) à g. Si g ∗ prend une valeur comprise
entre 0 et g, la croissance conduit à une hausse des inégalités de revenu, mais la
pauvreté diminue tout de même.
Le TCEP peut être défini comme ”le taux de croissance efficace pour réduire
la pauvreté” (Kakwani and Son, 2002). En outre, selon les auteurs la réduction
de l’incidence de la pauvreté est une fonction croissante de g ∗ . Ainsi, maximiser
l’ampleur de la réduction de la pauvreté est tout à fait équivalant à maximiser g ∗ .
Par conséquent, pour atteindre une réduction rapide de la proportion des gens
vivant dans l’extrême pauvreté, les pouvoirs publics devraient chercher à maxi-
miser le TCEP plutôt que le taux de croissance du PIB. Malheureusement, même
s’il respecte l’axiome de monotonie, ce taux reste très sensible au seuil de pau-
vreté choisi.
Elle représente la part du revenu moyen de la population (µ) des p% les plus bas
de la distribution, où µp est le revenu moyen des p% du bas de la distribution. En
prenant le logarithme de cette équation, il s’ensuit :
39
croissance de pauvreté (Son, 2004) :
9. Cela signifie que davantage de considérations éthiques sont prises en compte. Précisément,
l’ordre 2 de dominance stochastique est associé au respect des transferts de revenus de Pigou-
Dalton.
40
1.1.4 Les mesures absolues de la croissance pro-pauvre
Une croissance est dite pro-pauvre, de manière absolue, lorsqu’elle engendre
une diminution de la pauvreté.
dWt
T CP P = gtp = · γt . (1.26)
dWt∗
Avec :
gtp le taux de croissance pro-pauvre du pays p au temps t ;
dWt le changement réel de la pauvreté qui s’est produit en utilisant l’indice de
Watts ;
dWt∗ le changement de la pauvreté qui se serait produit avec une distribution
de la croissance neutre ;
γt le taux de croissance global au temps t.
Plus généralement le TCPP est définit par :
1 Ú Ht−1
T CP Pt ≡ gt (p)dp. (1.27)
Ht−1 0
Tout déplacement de la distribution en faveur (respectivement en défaveur) des
pauvres engendrera un taux de croissance pro-pauvre supérieur (respectivement
inférieur) au taux de croissance ordinaire.
41
Soit yt (p) le revenu de la piéme quantile de la distribution du revenu à la date
t. Il peut être réécrit comme une fonction des revenus moyens µt et de la courbe
de Lorenz CLt (p) :
dCLt (p)
yt (p) = µt . .
dp
Pour une mesure de pauvreté Pt :
Ú 1
Pt = f (yt (p))dp (1.28)
0
En différenciant Pt , on obtient :
A B A B
dPt Ú 1 df (yt (p)) dyt (p) 1
= .yt (p) . . dp. (1.29)
dt 0 dyt (p) dt yt (p)
Pour simplifier :
df (yt (p))
ηt (p) = .yt (p), (1.30)
dyt (p)
et
dyt (p) 1
gt (p) = . , (1.31)
dt yt (p)
où ηt (p) représente l’élasticité de la mesure de pauvreté aux variations des reve-
nus moyens et gt (p) correspond à la croissance des revenus moyens. D’où :
dPt Ú 1
= ηt (p).gt (p)dp. (1.32)
dt 0
1 2
µt 1
En ajoutant et en retranchant .
dt µt
, on obtient :
A B C A BD
dPt µt 1 Ú 1 Ú 1
µt 1
= . ηt (p).dp + ηt (p).dp gt (p) − . . (1.33)
dt dt µt 0 0 dt µt
Cette équation montre trois sources principales de croissance pro-pauvre : une
croissance des revenus moyens (A), une forte sensibilité de la pauvreté à la crois-
sance des revenus moyens (B), et enfin une évolution des revenus relatifs (C) :
A B C A BD
dPt µt 1 Ú 1 Ú 1
µt 1
= . ηt (p).dp + ηt (p).dp gt (p) − . . (1.34)
dt dt µt 0 ü 0 ûú ý dt µt
ü ûú ý ü ûú ý
A B C
42
qui aurait été observée s’il n’y avait pas eu de modification des revenus relatifs,
c’est-à-dire pas de changement dans la distribution des revenus au cours de la
période. La composante B capte la part de l’évolution de la pauvreté attribuable
au changement des revenus relatifs.
Au niveau empirique, Kraay (2006) montre lorsque l’incidence de la pauvreté
diminue, il est de loin très probable que la raison en soit une forte augmenta-
tion de la composante croissance. Autrement dit, selon lui cette dernière domine
largement.
Avant de conclure cette sous-section, il faudra noter qu’à l’heure actuelle, il
n’existe pas de mesure de la croissance pro-pauvre faisant l’unanimité. L’une des
principales limites de ces indices est qu’ils se focalisent sur la dimension mo-
nétaire de la pauvreté. Ce qui peut paraître très restrictif bien que nous recon-
naissons le lien entre la dimension monétaire et non monétaire de la pauvreté. En
outre, comme nous allons le voir dans le chapitre3, ces derniers peuvent aboutir à
des conclusions contradictoires. C’est pourquoi, ces années récentes ont vu naître
une approche alternative pour quantifier le caractère pro-pauvre de la croissance.
Cette seconde approche utilise généralement des modèles économétriques afin
d’établir une causalité entre croissance pro-pauvre et indicateurs de bien-être
(monétaires et/ou non-monétaires).
43
duisant l’effet redistribution sur la valeur estimée de l’élasticité du taux de pau-
vreté. Ravallion (1997) régresse le taux de réduction de la pauvreté sur un en-
semble de variables : l’indice de Gini, le taux croissance du revenu moyen, l’in-
teraction entre ces deux variables et leur carré. Il trouve que c’est la croissance
corrigée des inégalités de revenu qui importe le plus. En effet, ces résultats d’es-
timations indiquent que, plus l’indice de Gini est faible, plus est forte la valeur
estimée de l’élasticité du taux de pauvreté : lorsque l’indice de Gini égal à 0,25,
l’élasticité au revenu moyen du taux de pauvreté vaut en moyenne -3,3, contre
-1,8 si le Gini est égal à 0,59. Toutefois, ces calculs ne prennent pas compte l’effet
de la position de la ligne de pauvreté par rapport au revenu moyen. Plus récem-
ment, Bourguignon (2003) 10 trouve que la prise en compte du niveau de déve-
loppement améliore sensiblement le pouvoir explicatif de la régression du taux
de réduction de la pauvreté et que de forte inégalités réduit considérablement le
caractère pro-pauvre de la croissance.
Globalement, la littérature empirique sur la croissance pro-pauvre s’attelle à
montrer que la croissance joue significativement sur la réduction de la pauvreté.
Malheureusement, ces résultats nous disent peu sur le rôle des inégalités sur la ré-
duction de la pauvreté ? Encore moins sur la vitesse de réduction de la pauvreté ?
Sur ce point, Kraay (2006) montre que pour lutter contre la pauvreté la priorité
devrait être donnée aux politiques favorisant la croissance et il ne faudrait pas
attendre beaucoup de résultats des politiques de redistribution des revenus.
En résumé, bien que l’approche économétrique présente l’avantage d’inclure
la dimension non monétaire de la pauvreté, elle présente plusieurs faiblesses. En
premier lieu, ces premiers travaux sur la croissance pro-pauvre ont été largement
contestés par Bhalla (2002). Ce dernier montre que la plupart de ces travaux sous-
estimeraient considérablement le rythme de réduction du taux de pauvreté abso-
lue. En effet, il reproche à ces travaux d’utiliser des évaluations sur des estima-
tions directes tirées des enquêtes auprès des ménages et donc sujettes à d’impor-
tantes erreurs de mesure. Son argumentaire est que la consommation moyenne
estimée à partir des enquêtes (auprès des ménages) est généralement plus faible
que celle trouvée dans la comptabilité nationale. Ainsi, en utilisant ces enquêtes
comme seule source de données, ces travaux surestimeraient systématiquement
le seuil de pauvreté dans les pays étudiés et aurait donc tendance à sous-estimer
10. Sur un échantillon plus large de 113 épisodes de croissance correspondant à 51 pays
44
le taux de réduction de la pauvreté. En outre, plusieurs travaux montrent que ces
résultats sont sensibles aux formes fonctionnelles des modèles. En second lieu,
si le concept d’élasticité totale par rapport à la croissance paraît intéressant, il
faut néanmoins l’interpréter avec prudence étant donné la multitude de variables
dont il dépend et sa sensibilité au ligne de pauvreté choisi Cling et al. (2004). Par
ailleurs, estimer le taux de réduction de la pauvreté ne nous dit rien sur le carac-
tère pro-pauvre de la croissance. Encore moins sur la répartition des bénéfices de
la croissance sur les différents couches de la populations. Sur ce point, White and
Anderson (2001) ont proposé une approche innovante qui consiste à régresser le
taux de croissance des différents quantiles sur la croissance, les inégalités et un
ensemble d’autres variables de contrôle. Leurs résultats d’estimation suggèrent
que les inégalités constituent bien une dimension importante du problème à ne
pas négliger dans la lutte contre la pauvreté. Cette piste de recherche devrait être
mieux explorée. En effet, pour déployer une stratégie de croissance pro-pauvre, il
est crucial de comprendre les facteurs permettant d’accroître le revenu des quan-
tiles inférieurs. En outre, cette technique présente plusieurs avantages : elle per-
met d’évaluer plus facilement le caractère pro-pauvre de la croissance et les esti-
mations obtenues par cette approche sont insensibles au seuil de pauvreté choisi.
Ce dernier point est particulièrement important. Comme nous l’avons souligné
précédemment, estimer une ligne de pauvreté est un exercice risqué : les infor-
mations disponibles ne sont pas souvent suffisantes pour définir des seuils de
privations rigoureusement fondés sur la méthode des coûts et des besoins de
base.
45
relation simple entre croissance et réduction de la pauvreté et inégalités. Ceci ex-
plique en grande partie les faibles performances en matière de réduction de la
pauvreté enregistrées dans certains pays malgré une croissance élevée.
L’approche par la croissance inclusive cherche encore ses repères. Et comme
le souligne Klasen (2005), cette approche ne tente nullement à réfuter l’idée selon
laquelle la croissance réduit, à terme, la pauvreté. Bien au contraire, elle consiste à
accroître l’influence de la croissance sur la réduction de la pauvreté. Promouvoir
la croissance pro-pauvre revient donc à donner la priorité aux politiques ayant
un impact favorable à la fois sur la croissance et sur la réduction des inégali-
tés. Il n’existe pas de recette toute faite pour promouvoir une croissance inclu-
sive. Néanmoins, certains grands principes se dégagent pour permettre une telle
croissance. Généralement, les dépenses publiques qui ont le plus d’influence sur
la réduction de la pauvreté sont les dépenses dans le domaine de l’agriculture, de
l’éducation de la santé et d’infrastructures (Klasen, 2004; Lopez, 2004; Fan et al.,
2004b). Chen and Ravallion (2004) observent qu’en Chine, la croissance du sec-
teur primaire a un impact sur la pauvreté environ quatre fois plus important que
celle des secteurs secondaire et tertiaire.
Plus concrètement, c’est par la création d’emploi que la croissance devrait
conduire à une réduction soutenue de la pauvreté. Ceci semble plaider en fa-
veur de l’utilisation de techniques intensives en travail comme l’agriculture. Cette
dernière joue un rôle essentiel et favorable à la croissance pro-pauvre. Cela s’ex-
plique notamment du fait d’une élasticité de la réduction de la pauvreté à la crois-
sance bien plus élevée dans le secteur agricole que dans les autres secteurs. En
effet, dans les pays à faible revenu, les activités agricoles représentent la princi-
pale ressource des pauvres. Ainsi, au Burkina Faso et au Ghana plus de 70% des
pauvres sont regroupés dans le monde rural et vivent essentiellement de l’agri-
culture (Klasen, 2004). En outre, l’histoire a montré que seuls les pays qui ont
réussi à mettre en œuvre des politiques de promotion de l’agriculture ont obtenu
une baisse significative de la pauvreté. La hausse de la productivité et des reve-
nus dans le monde rural peut donc jouer un rôle très important à court terme.
La croissance agricole augmente la demande rurale de produits non agricoles qui
ont tendance à afficher un rapport travail-capital élevé, ce qui crée un cercle ver-
tueux de croissance et de repli de la pauvreté Mellor (2000). D’ailleurs, Fan et al.
(2004a) ont montré qu’à dépense égale, c’est la recherche agricole qui a le plus
46
permis de réduire la pauvreté au Vietnam suivie par l’éducation, l’électricité, et
l’irrigation. Évidemment, il est important de promouvoir les facteurs permettant
aux ménages de tirer parti des activités non agricoles en zone rurale et dans les
villes. Comme nous pouvons le voir dans le graphique ci-dessous, dans les an-
nées 90, le PIB non agricole a progressé cinq fois plus vite que le PIB agricole.
Généralement, une croissance soutenue de l’agriculture s’accompagne de la pro-
gression de l’emploi et des revenus non agricoles des ménages vivant dans les
villes et dans les zones rurales les moins isolées. En outre, les ménages exerçant
un emploi non agricole ont davantage de chances de sortir de la pauvreté que
ceux travaillant dans l’agriculture, car la productivité est souvent plus forte dans
les autres secteurs et la croissance généralement plus rapide. Au Vietnam, l’inci-
dence de la pauvreté a reflué de 31% pour la main-d’œuvre agricole, de 41% pour
les travailleurs du secteur informel et de 62% pour le secteur formel Lopez (2004).
47
en accroissant le capital humain des pauvres, devraient leur ouvrir de nouvelles
opportunités. L’alphabétisation des femmes joue un rôle majeur dans la capacité
de la croissance à faire reculer la pauvreté. En Inde, elle a été le principal respon-
sable des différences entre les États en termes d’incidence de la croissance non
agricole sur la pauvreté Ravallion and Datt (1996). Il faut toutefois souligné que
les infrastructures directement utiles aux pauvres sont plus efficaces lorsqu’elles
sont conçues dans une logique de réseaux au niveau national et régional. Évidem-
ment, il est impératif de réduire les dysfonctionnements des infrastructures exis-
tants avant d’envisager de nouvelles réalisations Chataîgner and Rafinot (2005).
A mesure que le pays se développe, l’État peut également compléter le revenu
perçu par les pauvres sur le marché par des transferts publics, ce qui permet aux
ménages déshérités de profiter indirectement de la croissance grâce à une poli-
tique redistributive. Cependant, dans les pays pauvres avec des capacités finan-
cières et administratives limitées il serait difficile d’imaginer que les transferts
publics puissent avoir une influence significative sur la réduction de la pauvreté.
En outre, il est important de noter qu’effectuer des transferts de revenus à grande
échelle n’est pas une réponse adaptée pour réduire la pauvreté. Tout d’abord,
dans la réalité, il existe très peu d’exemple de cas où pareilles politiques ont en-
traîné une réduction significative de la pauvreté. D’ailleurs, plusieurs travaux
empiriques (Wiggins and Higgins, 2008, par exemple) montrent que la réduction
substantielle de la pauvreté dans les pays de l’OCDE au court du XXI ème siècle
est attribuée à une croissance soutenue avec de modestes transferts de revenus.
En outre, une telle politique redistributive pourrait ralentir la croissance en frei-
nant l’incitation à investir, à innover et même à travailler. Par exemple Jha and
Srinivasan (2001) ont montré que la plupart des subventions destinées à l’agri-
culture (notamment au riz et au blé) n’ont pas permis de faire reculer la malnu-
trition des enfants. En outre, une réduction des subventions en Andhra Pradesh
(Inde) n’a eu qu’un effet mineur sur la situation nutritionnelle des enfants Tarozzi
(2005).
48
TABLE 1.1 – Impact des transferts publics sur la répartition des revenus
49
mentent dans les premières phases du processus de croissance puis retombent
avec le développement économique, largement corroborée par les travaux em-
piriques antérieurs (Adelman and Morris, 1973; Ahluwalia, 1976; Papanek and
Kyn, 1986) a très vite laissé place à la controverse. Tout d’abord, Anand and Kan-
bur (1993b) montrent que sur le plan empirique l’apparition de la courbe de Kuz-
nets dépendrait en grande partie de la forme fonctionnelle retenue. Ensuite et
surtout peut être, dans les années 1990, un nouveau fait stylisé issu de l’écono-
métrie révèle une relation de causalité inverse entre les inégalités de revenu et
la croissance. Ces travaux sont l’œuvre de Persson and Tabellini (1994). De nom-
breux modèles théoriques ont été élaborés pour rendre compte de cette régularité.
Nous pouvons citer à titre d’exemple les modèles d’économie politique Persson
and Tabellini (1994); Alesina and Rodrik (1994), les modèles d’imperfection du
marché du crédit (Banerjee and Newman, 1993; Galor and Zeira, 1993), les mo-
dèles portant sur l’instabilité sociopolitique que pourraient engendrer de fortes
inégalités de revenu Alesina and Perotti (1996), etc. Malheureusement, cette nou-
velle relation, tout comme la courbe de Kuznets d’ailleurs, a très vite montré sa
fragilité. En effet, ces premiers travaux ont été largement remis en cause par les
analyses sur données de panel. Ces dernières ont trouvé une relation positive,
non linéaire, voire nulle, entre la distribution des revenus et la croissance (Dei-
ninger and Squire, 1998; Barro, 2000; Banerjee and Duflo, 2003; Forbes, 2000).
Comprendre la nature générale de cette relation requiert tout d’abord un ré-
examen attentif de cette littérature théorique (première sous-section) mais égale-
ment d’analyser les résultats empiriques disponibles, obtenus à l’aide de modèles
économétriques (deuxièmes sous-section).
50
de nouvelles entreprises exige souvent des coûts fixes particulièrement impor-
tants, dans un contexte de marché financier imparfait, une forte concentration de
la richesse serait indispensable pour l’innovation et la croissance Galor and Tsid-
don (1997). Cependant, ces modèles ont été largement contestés par les travaux
contemporains. Ces nouveaux travaux concluent à une relation négative entre les
inégalités de revenu et la croissance de long terme (Galor and Zeira, 1993; Persson
and Tabellini, 1994; Durlauf, 1994; Alesina and Perotti, 1996).
S = f (R), (1.35)
avec f ′ > 0 donc Sr > Sp . Plusieurs critiques peuvent être adressées à ce modèle.
Tout d’abord, elle suppose une relation linéaire entre la propension marginale à
épargne et le revenu. Ce qui n’est pas forcément le cas. D’ailleurs, cette relation
aurait la forme d’une fonction en ”U” inversée Ray (1998). En effet, la hausse de
la propension marginale à épargner serait plus forte chez les revenus inférieurs
et moyens. Elle diminuerait même chez les riches. Par conséquent, cette relation
positive entre inégalité de revenu et croissance serait observée qu’à des niveaux
de revenus faibles où une concentration de la richesse favorise l’accumulation.
51
Ensuite, lorsqu’on s’intéresse de près à ce modèle on se rend compte qu’il est
plus adapté aux pays développés où la répartition des revenus est en grande par-
tie constituée de salaires et de bénéfices Aghion et al. (1999). Enfin, ce modèle
considère qu’une redistribution des ressources réduit l’épargne et donc est défa-
vorable à la croissance. Ceci n’est vrai que dans le cas où l’investissement n’est
financé que par l’épargne nationale.
52
ont la particularité d’endogénéiser les politiques de redistribution. Cette redistri-
bution peut prendre la forme de transferts, de dépenses publiques en faveur des
pauvres (en éducation et santé), de réforme fiscale (faire varier le prix des biens)
favorable aux plus pauvres. Ces dernières ont été mises en œuvre dans certains
pays comme le Mexique et l’Égypte.
Selon Alesina and Rodrik (1994) cette relation négative entre inégalités de
revenu et croissance se vérifie également dans les dictatures. En effet, le dicta-
teur tient à la stabilité de son régime donc à la demande sociale et aux situations
conflictuelles. D’ailleurs, Benabou (1996) a généralisé cette conclusion dans les so-
ciétés non démocratiques. En outre, (Perotti, 1993; Saint Paul and Verdier, 1996)
ont aussi développé leurs modèles d’économie politique où la distribution du
revenu affecte l’investissement et la croissance.
En réalité, l’influence négative des inégalités de revenu sur le processus de
croissance peut apparaître dans les modèles d’économie politique même en de-
hors de la redistribution. Les riches peuvent empêcher l’application des poli-
tiques de redistribution à travers des lobbies et l’achat de vote aux législateurs. 11
Malheureusement, ce type d’action peut conduire à un cercle vicieux. En effet,
plus la concentration de la richesse est forte, plus la demande de redistribution
sera importante. Ce qui conduit les lobbies à accroître leurs efforts pour empê-
cher la redistribution. Ainsi, l’intervention de ces groupes d’intérêt en favorisant
la corruption affecte les performances économiques. Par conséquent, l’inégalité
des revenus peut avoir un effet négatif sur la croissance d’une économie, même
si aucune redistribution de revenu n’est observée.
Globalement deux mécanismes sont à l’œuvre dans ces modèles. Le premier
conclut à une relation positive entre inégalités de revenu et taxation. Le second
s’intéresse à l’effet désincitatif de la taxation sur l’investissement et par consé-
quent sur la croissance.
En même temps que cette vaste littérature théorique, l’intérêt pour la dyna-
mique du processus de croissance et l’évolution de la distribution des revenus a
suscité plusieurs analyses empiriques. Ces dernières sont abordées dans la sous-
section suivante.
11. Dans certains pays ces groupes d’intérêt se permettent parfois de financer les campagnes
électorales dans le seul but de bénéficier d’avantages fiscaux après les élections
53
1.2.2 Les approches empiriques
Les modèles d’économie politique
Tout d’abord, selon les modèles d’économie politique une distribution inéga-
litaire des ressources génère une forte demande de redistribution. En s’inspirant
de Benabou (1996), nous avons répertorié les principaux résultats des travaux
empiriques consacrés à l’examen de la relation entre inégalités de revenu et re-
distribution (la Table 1.2). Ces résultats sont particulièrement décevants. En effet,
l’influence des inégalités de revenu sur la redistribution est rarement significa-
tive. En outre, le signe de cette relation varie d’une étude à l’autre en raison des
nombreuses spécifications retenues.
Persson and Tabellini (1994) expliquent ces résultats par les difficultés in-
hérentes à la mesure de la redistribution. Ils font remarquer que la mesure de
la redistribution est un exercice extrêmement complexe. La redistribution peut
prendre plusieurs formes autres que les transferts comme par exemple : les im-
pôts progressifs, les lois sur le salaire minimum, les restrictions commerciales,
certaines dépenses publiques, la législation sur les brevets, la réglementation et
la protection des droits de propriété, etc. Cela est certainement vrai. Cet argument
est d’autant plus justifié que la plupart (mais pas tous) des travaux empiriques
antérieurs répertoriés dans la Table 1.2 (ci-dessous) utilisent comme mesure de
redistribution les taux de prélèvement moyen et marginaux. Cependant, cet ar-
gument n’est pas tout à fait convaincant. Premièrement, ces études incluent déjà
certaines de ces variables comme les taux d’imposition ou les dépenses d’édu-
cation. Deuxièmement, selon Benabou (1996), il est difficile de comprendre pour-
quoi l’augmentation de la pression pour la redistribution se manifesterait que par
des voies indirectes et non par les effets directs.
Ensuite, le second mécanisme conclut à une relation négative entre la redis-
tribution et la croissance. Ce lien traduit l’effet désincitatif de la taxation sur la
croissance. A nouveau, les travaux empiriques rejettent largement cette hypo-
thèse. Selon Lindert (1996), la redistribution serait favorable à la croissance, de
plus la relation est statistiquement significative. L’analyse de la Table 1.2 révèle
que ce résultat est loin d’être une exception. En effet, ces conclusions sont confir-
mées par plusieurs travaux comme ceux de Perotti (1996).
54
TABLE 1.2 – les résultats empiriques des modèles d’économie politique
55
le plan théorique. Tout d’abord, selon Saint Paul and Verdier (1996), les inégali-
tés de revenu peuvent évoluer sans que la position médiane soit affectée. Cette
évolution peut très bien être limitée à la population la plus pauvre. Ensuite Ed-
sall (1984) et Conway (1991) montrent que les individus démunis (et les moins
instruits généralement) ont un faible taux de participation dans les activités po-
litiques (élection entre autre). Si un tel résultat est avéré, l’électeur décisif serait
plus riche que l’électeur médian. Enfin, il semble que les dépenses sociales béné-
ficient plus à la classe moyenne et aux plus riches.
A côté des modèles d’économie politique, il existe d’autres arguments non
moins pertinents qui considèrent que les inégalités de revenu ralentissent les
performances économiques, à travers l’instabilité socio-politique qu’elles en-
gendrent.
L’instabilité socio-politique
56
TABLE 1.3 – Analyses empiriques des relations inégalité / instabilité et instabi-
lité / croissance
57
Socio-Political Instability) : 13
L’éducation et la fécondité
58
cification où les variables exogènes sont le taux de croissance et l’investissement
en capital humain, il conclut à une relation négative entre inégalités de revenu et
investissement en capital humain et positive entre investissement-croissance.
La courbe de Kuznets
De nombreuses études empiriques ont été développées pour analyser les in-
teractions entre processus de croissance et la distribution du revenu. Globale-
ment, les premiers modèles analysant l’impact des inégalités de revenu sur la
croissance remontent aux années 1970. En effet, dans les années 1970, les don-
nées transversales réunies sur les PED par Ahluwalia (1976) semblaient corro-
borer l’hypothèse de Kuznets Ahluwalia (1976). Cependant, la robustesse de ces
résultats fut de courte durée. Tout d’abord, Anand and Kanbur (1993b) montrent
que l’apparition de la courbe de Kuznets dépendrait en grande partie de la forme
fonctionnelle retenue. Ensuite, dans les années plus récentes, un nouveau fait sty-
lisé issu de l’économétrie des inégalités et de la croissance révèle une relation de
causalité inverse. Ces travaux trouvent que les inégalités sont défavorables à la
croissance (Persson and Tabellini, 1994; Alesina and Rodrik, 1994). Malheureuse-
ment, la relation statistique exposée dans ces dernières études s’est révélée bien
plus faible qu’elle ne la paraissait au premier abord et plusieurs études ont en-
suite remis en question les résultats obtenus. En effet, ces premiers travaux ont
été largement contestés par les analyses sur données de panel. Ces dernières ont
trouvé une relation nulle, non linéaire, voire positive, entre les inégalités de re-
venu et la croissance (Deininger and Squire, 1998; Forbes, 2000; Barro, 2000; Ba-
nerjee and Duflo, 2003).
A partir d’un échantillon composé de 60 pays, Ahluwalia (1976) analyse la
relation suivante :
où,
Yi est la part du revenu du groupe i ;
D une variable indicatrice (1 = pays socialiste et 0 = Non).
59
En estimant l’équation précédente, Ahluwalia arrive aux résultats suivants :
Ŷi (20% les plus riches) = −57, 58 + 89, 95 log(PIB/tête) − 17, 56 log(PIB/tête)2 − 20, 15D
Ŷi (40% médians) = 87, 03 − 45, 59 log(PIB/tête) + 9, 25 log(PIB/tête)2 + 8, 21D
Ŷi (20% les plus pauvres) = 27, 31 − 16, 97 log(PIB/tête) + 3, 06 log(PIB/tête)2 + 5, 54D.
Tous les coefficients estimés sont statistiquement significatifs, en plus il fournit les
points de retournement pour chaque groupe. Rappelons que la possibilité d’une
baisse de la part de revenu des groupes les plus pauvres soulève deux questions
fondamentales quant à l’influence du processus de développement sur le bien-
être. Plus précisément, la littérature théorique distingue deux façons d’envisager
le processus sous-jacent à l’hypothèse de Kuznets. Selon Adelman and Morris
(1973), ce schéma (la courbe de Kuznets) peut très bien refléter un processus d’ap-
pauvrissement absolu des groupes à faible revenu. Malheureusement, nous ne
pouvons pas écarter cette possibilité a priori. En effet, l’apparition d’une courbe
de Kuznets peut résulter d’une érosion des structures économiques tradition-
nelles sous l’impact d’un secteur moderne en pleine expansion qui fait concur-
rence aux secteurs traditionnels à la fois pour les marchés et les ressources. Il
en résulterait une rupture du système économique existant qui conduirait à un
appauvrissement absolu de certains groupes. Cependant, il y a une autre façon
d’envisager l’apparition de la courbe de Kuznets. Dans cette seconde approche,
la concentration de la richesse se renforce non pas parce que des groupes plus
pauvres baissent en valeur absolue mais parce qu’ils évoluent (progressent) à un
rythme moins rapide que ceux des tranches supérieures. Ainsi, si le développe-
ment se traduit par une croissance économique favorable (au départ) aux riches
et s’il n’existe pas de lien très puissant entre le revenu de ces groupes et celui des
tranches les plus pauvres, il doit en résulter un accroissement de l’inégalité rela-
tive qui ne va pas nécessairement de pair avec un appauvrissement absolu. La
distinction essentielle entre ces deux approches réside dans la question de savoir
si le bouleversement des activités économiques traditionnelles à faible revenu est
une condition essentielle à la croissance du secteur moderne ou si le problème
est simplement imputable à un manque d’intégration de deux secteurs. Dans ce
dernier cas, le problème n’apparaît plus aussi grave car nous n’avons plus à faire
face à une contradiction inhérente au processus de développement. Les résultats
60
de Ahluwalia (1976) ne nous permettent pas de choisir clairement l’une ou l’autre
de ces possibilités.
En résumé les résultats de Ahluwalia (1976) confirment largement l’hypothèse
de Kuznets. Il existe bien un processus global de croissance des inégalités ini-
tiales suivie (accompagner) d’un resserrement au-delà d’un certain revenu par
tête. Cependant, ces résultats ne sont pas exempts de critiques. Tout d’abord, ils
sont extrêmement sensibles à la forme fonctionnelle retenue mais aussi à la com-
position de l’échantillon de base Anand and Kanbur (1993b). En outre, comme le
souligne Ahluwalia (1976) les résultats établis ci-dessus ne sont tout au plus que
des descriptions de comportements moyens des pays de l’échantillon alors que
des différences considérables peuvent exister entre les pays. Pour tenir compte de
ces différences, Li et al. (1998) ont analysé la courbe de Kuznets en coupe instanta-
née. Malheureusement, leurs résultats mettent en évidence une certaine fragilité
de la courbe de Kuznets. La relation dominante serait plutôt celle d’une relation
inverse allant des inégalités vers la croissance. Ce dernier point fait l’objet de la
sous-section suivante.
Persson and Tabellini (1994) font partis des premiers auteurs à avoir souli-
gné l’influence néfaste des inégalités de revenu sur la croissance. Même si le pa-
pier n’a été publié qu’en 1994, une version préliminaire circulait déjà en 1991.
A l’aide d’un modèle d’économie politique, ils montrent qu’une forte concen-
tration de la richesse induit une demande de redistribution des ressources des
riches vers les pauvres. Cette dernière se fait à travers une taxe sur le revenu du
capital (physique ou humain), et un transfert forfaitaire. En effet, pour accroître
son revenu courant, l’électeur médian exige un taux de taxation sur le capital
le plus élevé possible. Cependant, cela à un effet désincitatif sur l’accumulation
du capital et donc déprime le taux de croissance de l’économie. Econométrique-
ment, les auteurs cherchent à expliquer le taux de croissance. Pour ce faire, ils
construisent deux échantillons : le premier est composé de 9 pays industriels et le
second regroupe les données d’après-guerre de 56 pays sur la période 1960-1985.
Les variables explicatives sont des mesures de l’inégalité des revenus et le degré
de démocratisation. Ils incluent également dans toutes leurs régressions un effet
de ”convergence ”, ici mesuré par le PIB initial par tête et le taux de scolarisa-
61
tion primaire. L’intérêt de cette dernière est de prendre en compte le capital hu-
main. ”N’apparaissent pas les variables endogènes mises en avant par la théorie,
comme le taux d’investissement et le taux de scolarisation, au cours de la période
analysée”. A l’aide des MCO, ils trouvent une corrélation négative entre les in-
égalités de revenu et la croissance économique. Cependant, cette relation néfaste
n’est vérifiée que dans les démocraties et non dans les pays non démocratiques.
Les résultats semblent être robustes malgré les importantes erreurs de mesure.
Dans une approche semblable, Alesina and Rodrik (1994) montrent que le co-
efficient de Gini est corrélé négativement à la croissance économique. Cependant,
contrairement à Persson and Tabellini (1994), ils ne trouvent pas d’interaction si-
gnificative entre le degré de démocratisation et les inégalités de revenu. Cette
différence peut être expliquée par le fait que les deux études reposent sur des sé-
ries distinctes de données pour les variables de distribution. En effet, les données
de distribution dans Persson and Tabellini (1994) viennent de Paukert (1973), un
pionnier dans l’étude de la courbe de Kuznets transversale. Alesina and Rodrik
(1994) utilisent des sources différentes : (Jain et al., 1975; Lecaillon et al., 1984). La
relation statistique exposée dans ces études s’est révélée bien plus faible qu’elle
ne paraissait au premier abord et plusieurs études (Deininger and Squire, 1998;
Barro, 2000; Forbes, 2000; Banerjee and Duflo, 2003) ont ensuite remis en question
les résultats obtenus. Fishlow (1996) a montré la sensibilité de la corrélation à
l’intégration de variables indicatrices régionales dans les variables explicatives. Il
avance que l’inclusion d’une variable indicatrice pour les pays d’Amérique latine
dans son échantillon rend le coefficient de Gini non significatif.
Dans un registre différent, Barro (2000) va plus loin que Fishlow (1996). En
effet, il montre une sensibilité des résultats obtenus aux types d’échantillons rete-
nus. Selon ses résultats, les inégalités de revenu seraient favorables à la croissance
dans les pays riches et défavorables à la croissance dans les pays pauvres. Mais
globalement, l’impact des inégalités de revenu sur la croissance et l’investisse-
ment est faible et statistiquement non significatif. Le modèle de Barro (2000) est
une extension des modèles de croissance néoclassique.
Pour tester son modèle, Barro (2000) effectue une régression du taux de crois-
sance moyen du PIB réel par habitant sur l’inégalité de revenu mesurée par l’in-
dice de Gini et un ensemble d’autres variables explicatives en utilisant des don-
nées de panel pour 100 pays sur trois décennies 1965-75, 1975-85 et 1985-95. L’ana-
62
lyse empirique inclut des pays dont les niveaux de développement sont très dif-
férents, et sont exclus uniquement les pays dont les données sont manquantes.
L’estimation de ce modèle a été faite par la méthode des triples moindres carrés
ordinaires.
63
TABLE 1.4 – Synthèse de quelques résultats empiriques
64
1.3.1 La causalité inverse entre inégalités et croissance
La question de l’influence des inégalités de revenu sur le processus de crois-
sance à toujours était considérée comme une préoccupation centrale des déci-
deurs. Cependant, les interactions entre distribution du revenu et croissance sont
complexes et loin d’être comprises d’ailleurs. La croissance affecte la distribution
du revenu qui elle même rétroagit sur la croissance et la pauvreté. En effet, le pro-
cessus de développement d’une économie agit sur la distribution des ressources
entre secteurs ; les rémunérations relatives des facteurs et les dotations des indi-
vidus. Ces changements ont une influence directe sur l’évolution des inégalités,
(et ceci) quel que soient les caractéristiques de la société concernée. La célèbre
courbe de Kuznets s’identifie à cette idée. ”Elle repose sur les différentiels de pro-
ductivité entre secteurs et la modification de leur importance relative au cours du
processus de développement, dans un contexte de marché du travail imparfait”.
Ainsi, ce différentiel de revenu résultant de ce processus crée les inégalités.
Dans les années plus récentes, une nouvelle approche est apparue sur la thé-
matique des inégalités. Celles-ci ne sont plus considérées comme une consé-
quence de la croissance économique mais comme un déterminant majeur de la
trajectoire de l’économie. Selon cette approche, les inégalités affectent le proces-
sus de croissance directement ou indirectement. A ce niveau d’ailleurs plusieurs
thèses peuvent être avancées en guise d’exemple. Parmi lesquelles figure celle de
l’instabilité socio-politique, du caractère indivisible de l’investissement, de l’effet
désincitatif des politiques de redistribution etc. C’est cette causalité inverse qui
est aujourd’hui clairement identifiée dans la littérature théorique qu’on appelle
endogénieité.
Aujourd’hui, si des techniques d’estimations permettent d’isoler le sens de
cette causalité, ce domaine reste peu exploré. En outre, les techniques de correc-
tion sont sensibles aux erreurs de mesure qui sont aussi non négligeables. Cette
question de données est devenue un nouvel axe de recherche particulièrement
intéressant dans le domaine des inégalités.
65
1.3.2 La qualité des données
”if science consists in a search for patterns in data, then the study of economic
inequality suffers from an original sin : the job of measurement was badly done”,
Galbraith (2009).
66
sous-estimation est d’autant plus importante que la part de la variance de l’erreur
de mesure dans la variance totale de la variable observée est élevée et/ou que le
coefficient estimé est lui même élevé. Et malheureusement ce problème s’empire
dans les modèles de régression multiple. En effet, dans ce cas, cela induit une
sous-estimation (respectivement une surestimation) du coefficient des autres va-
riables, dès lors que leur covariance avec celle mesurée avec l’erreur est négative
(respectivement positive).
67
moyennes d’inégalités pour l’Amérique latine et pour l’Afrique (respectivement
50,15 et 44) semblent trop élevées, alors que le niveau moyen de l’Asie de l’Est
parait trop faible 36. Enfin, ”si l’on considère les différences entre pays, il est sur-
prenant de constater la forte hétérogénéité des pays européens”. Ces graves limi-
tations ont conduit d’ailleurs Galbraith (2009) à construire un nouvel ensemble
de données en se basant sur les différences de salaires dans le secteur industriel.
Ces données de salaires ont été collectées dans pratiquement tous les pays du
monde depuis le début des années 1960. Malheureusement, malgré une amélio-
ration notable de la couverture et de la qualité des données, le jeu de données de
Galbraith (2009) présente des limites, la plus grave est certainement les données
retenues pour mesurer les inégalités. En effet, il est difficile de justifier comment
les différences de salaires dans le secteur industriel puissent être utilisées pour
tester l’impact de la distribution des ressources sur la croissance, puisqu’elles ne
peuvent pas être considérées comme une variable indicatrice fiable pour les in-
égalités du revenu. Elles pourraient en revanche être utiles pour mesurer l’impact
de la croissance sur les inégalités de revenu mesurées par les différences des sa-
laires.
Face à ce problème d’hétérogénéité plusieurs pistes de recherches ont été en-
visagées, la plus sérieuse consiste à s’en tenir qu’aux seules données homogènes.
Cette technique consiste à regrouper les pays (données) qui ont des caractéris-
tiques assez proches en termes d’inégalité : exemple Barro (2000) montre que les
inégalités sont favorables à la croissance dans les pays riches et défavorables dans
les pays pauvres mais globalement non significatives. Ce type de traitement a été
fréquemment repris dans la littérature empirique. Cependant, il n’est pas entière-
ment satisfaisant. En effet, ceci réduit considérablement la taille des échantillons
ce qui n’est pas sans conséquence sur les résultats. Comme nous le savons l’esti-
mateur GMM-Arellano -Bond largement utilisé dans les travaux empiriques an-
térieurs est biaisé vers le bas en petit échantillon. Ce qui fait que la significativité
des paramètres estimés s’avère particulièrement douteuse. En effet, l’étude par
simulation d’Arellano et Bond montre la possibilité d’une sous-estimation de 20
à 30% des écarts-types des coefficients en petit échantillon. Autrement dit quand
vous divisez votre échantillon les T-stat ”explosent” ce qui augmente la proba-
bilité de rejeter l’hypothèse nulle alors qu’elle est vraie c’est-à-dire de conclure à
68
tort à la significativité des paramètres estimés 16 . En outre, il est important de no-
ter que l’estimateur d’Arellano and Bond (1991) a été proposé dans le but d’éviter
les deux causes d’inefficacité de l’estimateur en différence première connu sous
le nom de l’estimateur d’Anderson et Hsiao. En effet, ce dernier est extrêmement
sensible au biais de simultanéité et aux erreurs de mesure. Mais malheureuse-
ment, tout comme l’estimateur d’Anderson et Hsiao, les estimateurs d’Arellano
et Bond souffrent de la perte d’information associée à l’écriture du modèle en
différences premières ; perte d’information qui se traduit souvent par des estima-
teurs peu précis et parfois erratiques Baltagi (2008).
Par ailleurs, cette approche qui consiste à partitionner les échantillons en re-
groupant les données homogènes bien qu’intéressante ne résout en rien le pro-
blème lié aux points aberrants (”outliers”). Ce problème est bien connu en écono-
métrie. Considérons un PED qui ne maîtrise pas les techniques de production et
dont la production est agricole. Sa production peut tripler en une année à la suite
d’une bonne pluviométrie, ou être divisée par deux après une période de séche-
resse. Ces observations isolées ont souvent posé aux économètres de réelles dif-
ficultés. Traditionnellement, les chercheurs éliminent ces points ”extrêmes” pour
estimer ce type de modèle (méthode jugée non rigoureuse) ou construisent un pa-
nel pour limiter cette forte variabilité. En effet, un avantage décisif des données de
panel par rapport aux autres types de données tient au fait qu’elles sont souvent
extrêmement nombreuses. En panel, il est très facile de disposer d’échantillon de
plusieurs milliers d’observation. Le principal avantage que présente la grande
taille de ces échantillons et qu’ils conduisent systématiquement à des estimateurs
dont les propriétés peuvent être assimilées aux propriétés asymptotiques des mé-
thodes utilisées. Ainsi, la mise en oeuvre d’un estimateur convergent conduit à
un estimateur très proche de la vraie valeur des paramètres. En réalité, le nombre
élevé des observations permet de considérer que le biais et la variance des esti-
mations tendent vers zéro. De fait, l’un des intérêts des estimateurs basés sur un
très grand nombre d’observations est leur grande précision.
Toutefois, d’abord dans les données portant sur les inégalités de revenu, la
variabilité est tellement forte que même en panel des pays entiers apparaissent
16. Notons au passage que Windmeijer (2005) a développé une méthode de correction de ces
écarts-types en petit échantillon. Cependant, les contraintes rédactionnelles ne nous permettent
pas d’intégrer cette méthode dans ce travail.
69
comme des outliers 17 . ” C’est le cas du Sénégal, Mali, Uganda, Pologne et Hon-
grie ” Deininger and Squire (1998). En outre, puisqu’un échantillon de données de
panel contient un très grand nombre d’observations, on peut penser a priori que
cet ensemble d’observations est capable de ”neutraliser” l’influence de quelques
points aberrants. En réalité, ce n’est pas vraiment le cas. Huber (1980) a montré
que seulement 3% de valeurs atypiques dans un ensemble d’observations suf-
fisent à perturber significativement la qualité des estimations.
Pour conclure sur ces difficultés associées aux observations aberrantes, il faut
noter que, jusqu’à une passé récente, il était d’usage d’éliminer toutes les observa-
tions relatives à un individu, dès lors que l’une d’elles apparaissait comme aber-
rante. Une telle pratique (qu’on appelle cylindrage) conduisait en effet souvent à
éliminer une très forte proportion des observations et donc, à perdre beaucoup
d’informations ; ceci induisant, au mieux, une moindre précision des estimations
et au pire, un risque de biais. C’est pourquoi d’ailleurs que certains chercheurs ont
préféré corriger ces points aberrants au lieu de les éliminer. Malheureusement,
dans ce cas aussi il est indispensable que l’information disponible soit suffisante
pour que la correction soit acceptable.
1.4 Conclusion
Il est aujourd’hui évident qu’un long travail est encore nécessaire sur cette
question d’évaluation de la croissance pro-pauvre. En effet, malgré la grande di-
versité des mesures, à l’heure actuelle, il en n’existe pas une faisant l’unanimité.
Tout d’abord, ces indices peuvent parfois conduire à des résultats contradictoires.
En outre, bien que plusieurs travaux aient montré le caractère multidimensionnel
de la pauvreté et l’importance de prendre en contact la dimension non monétaire
(éducation, santé, inégalité genre etc), tous ces indices se basent sur la dimension
monétaire de la pauvreté. Ce qui peut paraître très restrictif. Ces travaux (sur
les indices de mesures de croissance pro-pauvre) font l’hypothèse qu’il existe un
lien étroit entre la dimension monétaire et non monétaire de la pauvreté. En ef-
fet, ils soutiennent qu’en générale une croissance du revenu induit souvent une
croissance non-monétaire et inversement. L’idée est qu’un accroissement du re-
venu des pauvres leurs permettent d’accéder à l’éducation et à la santé et inver-
17. The biggest outliers are Mali, Senegal, Uganda, Poland and Hungary.
70
sement une meilleurs éducation (meilleurs état de santé) favorisent les pauvres à
accroître leurs revenus ou leurs consommations. Malheureusement, le lien entre
les dimensions monétaire et non monétaire de la pauvreté n’est pas aussi simple
(voir Drèze and Sen, 1989 ; Klasen, 2000, 2002a). En fait, comme plusieurs travaux
le montrent il arrive souvent qu’un individu dispose des ressources monétaires
nécessaires pour satisfaire ses besoins de bases, sans que certains biens ou infra-
structures ne soient pas disponibles dans la localité où il demeure. Par ailleurs, la
prise en compte de la dimension non-monétaire permet aux décideurs l’instau-
ration de politiques plus adaptées favorisant la réduction des risques de distor-
sion par rapport à une intervention d’ordre général. C’est pourquoi, ces années
récentes ont vu naître une approche alternative. Cette dernière utilise générale-
ment des modèles économétriques afin d’établir une causalité entre croissance
pro-pauvre et indicateurs de bien-être. Cette approche présente l’avantage d’in-
clure la dimension non monétaire de la pauvreté. Malheureusement, elle est aussi
critiquable à plusieurs niveaux. En premier lieu, l’objectif principal était de tenter
d’identifier la valeur de l’élasticité du taux de pauvreté au revenu moyen. En se-
cond lieu, la grande totalité des données sont de piètres qualités et sont sujettes à
d’importantes erreurs de mesure. D’ailleurs, beaucoup de travaux ont montré la
sensibilité des résultats aux formes fonctionnelles choisies.
Par ailleurs, étant donné que l’ampleur du recul de la pauvreté sous l’effet
de la croissance varie considérablement d’un pays à l’autre et d’un épisode de
croissance à l’autre, les meilleurs résultats sont obtenus là où les inégalités sont
faibles et/ou là où les politiques en place améliorent la capacité des pauvres à
bénéficier de la croissance. Considérer la croissance dans une perspective pro-
pauvre impose donc de comprendre les interactions entre distribution de revenu
et croissance. Il apparaît ainsi clair que de plus amples recherches seront néces-
saires pour déterminer la nature de cette relation. Sur ce point la régression Gini
semble être une approche particulièrement intéressante. En effet, comme nous al-
lons le voir dans le prochain chapitre, ce type de régression présente plusieurs
avantages : elle est moins sensible que les méthodes traditionnelles aux erreurs
de mesures et aux points aberrants. Mais aussi, elle est plus robuste car les es-
timateurs obtenus par cette approche sont insensible aux formes fonctionnelles
retenues.
71
Chapitre 2
La méthodologie Gini
Durant ces dernières décennies, une attention particulière a été portée au co-
efficient de Gini, à la courbe de concentration et à la courbe de Lorenz. En effet,
des chercheurs d’horizons différents ont redécouvert l’intérêt d’utiliser ces pa-
ramètres dans de nombreuses disciplines. Par exemple Atkinson (1970) souligne
l’avantage d’utiliser la courbe de Lorenz dans le cas de la finance, (Kakwani, 1977,
1980) montre que la courbe de Lorenz et la courbe de concentration permettent
d’estimer l’élasticité des biens de consommation de manière non paramétrique et
plus récemment, Olkin and Yitzhaki (1992) puis (Yitzhaki and Schechtman, 2004,
et 2013) ont développé et popularisé la régression Gini qui consiste à utiliser la
différence moyenne de Gini (GMD) comme mesure de dispersion au lieu de la
variance.
De toutes les mesures de dispersion la variance est la plus connue. En statis-
tique comme dans beaucoup d’autres disciplines la variance et la covariance sont
les deux principales mesures utilisées pour mener à bien une étude. La technique
des MCO qui consiste à minimiser la variance des erreurs est un cas d’école en
économétrie. Les estimateurs des MCO jouissent de très bonnes propriétés tant à
distance finie qu’asymptotiquement : absence de biais, convergence et efficacité.
Ceci ne signifie pas pour autant que le recours à d’autres estimateurs soit sans
grand intérêt. En réalité, dans la littérature économétrique avancée, elle consti-
tue un point de départ d’analyses plus approfondies. En effet, la bonne propriété
des estimateurs des MCO repose sur des hypothèses assez fortes : l’hypothèse
de linéarité, la stricte exogénéité, homoscédasticité, etc. En outre, son utilisation
devient difficile à justifier lorsqu’il existe des points extrêmes dans l’échantillon
72
ou plus généralement lorsque l’hypothèse de normalité n’est plus satisfaite. Les
estimateurs des MCO sont sensibles aux observations aberrantes pour la simple
raison que cette méthode vise à minimiser la somme des carrés des résidus. Ceci
fait que les grands résidus (positifs ou négatifs) reçoivent un poids plus impor-
tant. 1 Par ailleurs, l’estimateur des MCO est sensible à la transformation mono-
tone des données Yitzhaki (1990). Une approche alternative pour surmonter cette
extrême sensibilité de l’estimateur des MCO aux observations isolées consiste à
utiliser une autre mesure de la dispersion des résidus moins sensible aux va-
leurs aberrantes que la variance comme la différence moyenne de Gini (GMD)
par exemple. Cette dernière a été introduite en 1912 par Corrado Gini, et depuis,
plusieurs paramètres ont été déduits comme la covariance au sens de Gini (co-
Gini), la corrélation au sens de Gini, l’analyse du Gini (ANOGI).
Comme nous le verrons dans ce chapitre, la GMD partage plusieurs propriétés
avec la variance ; toutefois elle fournit plus d’information sur la distribution sous-
jacente des données. En réalité, ces deux mesures sont très similaires, la différence
fondamentale tient sur la norme utilisée. La variance se base sur la distance eu-
clidienne (norme ℓ2 ) tandis que la GMD utilise la ”city block” distance (norme ℓ1 )
(Ka and Mussard, 2015).
Il est intéressant de noter qu’il existe deux types de régression Gini. La pre-
mière consiste à minimiser la GMD des erreurs. Les estimateurs obtenus par cette
approche ont la propriété d’optimalité. La seconde approche consiste à construire
l’estimateur en question de sorte qu’il soit moins sensible aux outliers. Cette se-
conde approche, puisqu’elle ne découle pas d’un programme de minimisation et
par conséquent ne requiert pas de définir une forme fonctionnelle quelconque, est
qualifiée de régression semi-paramétrique. L’estimateur obtenu par cette dernière
approche est similaire à celui obtenu par les MCO ; excepté que chaque variance
est remplacée par la GMD et chaque covariance par la co-Gini appropriée.
D’un point de vue théorique et empirique, un travail important est encore né-
cessaire sur la régression Gini notamment en panel. En effet, introduite par Olkin
and Yitzhaki (1992), la réflexion sur la régression Gini a été étendue aux variables
1. Sur le plan pratique, l’existence d’observations extrêmes peut s’expliquer de deux façons.
Le cas le plus simple à traiter est celui où une erreur s’est glissée au moment de l’encodage des
données. Par exemple, ajouter des zéros ou déplacer la virgule peut, en effet, détériorer sensible-
ment les estimateurs par MCO. Elles peuvent également apparaître lorsque l’échantillon est tiré
d’une petite population au sein de laquelle une ou plusieurs unités sont très différentes du reste
de la population Wooldridge (2015).
73
instrumentales par Yitzhaki and Schechtman (2004) et aux séries temporelles par
Serfling (2010) et par Shelef and Schechtman (2011). Nous proposons de l’étendre
aux données de panel. C’est dans ce cadre que nous avons développé l’estimateur
par effets fixes en utilisant la GMD comme mesure de dispersion Ka and Mussard
(2016). Nous proposons également le test de l’existence de spécificités individuelles et l’es-
timateur du modèle à effets aléatoires. L’intérêt essentiel de développer la régression
Gini en panel réside dans la volonté de pouvoir exploiter de mieux en mieux les
avantages spécifiques de ces données. En particulier, la possibilité de prendre en
compte les outliers. Puisqu’un échantillon de données de panel contient un très
grand nombre d’observations, on peut penser a priori que cet ensemble d’obser-
vations est capable de ”neutraliser” l’influence de quelques points aberrants. En
réalité, ce n’est pas vraiment le cas. Huber (1980) a montré que seulement 3%
de valeurs atypiques dans un ensemble d’observations suffisent à perturber si-
gnificativement la qualité des estimations. Plus généralement, dans le cadre de
l’économétrie sur données de panel, et comme nous le verrons d’ailleurs dans le
chapitre suivant, quelques points atypiques peuvent suffire à modifier considé-
rablement les résultats d’une estimation.
La première section de ce chapitre revient sur les généralités de la méthode
Gini. Nous allons y présenter entre autres la différence moyenne du Gini, le co-
Gini, la corrélation au sens de Gini et les différentes méthodes de décomposition
du Gini. La seconde section s’intéresse aux régressions Gini, à leurs propriétés
et aux hypothèses sur la matrice des moments. Une remarque additionnelle sera
également portée au traitement des ex-æquo. Dans la troisième section nous pré-
senterons le modèle à effets fixes dans le cas du Gini et le test d’existence de l’effet
individuelle et enfin la dernière section constitue nos derniers développements
théoriques.
74
finit la GMD comme l’écart espéré entre deux réalisations tirées au hasard (avec
remise) d’une population. Soit xi et xj deux réalisations (d’une même variable
aléatoire x) indépendantes et identiquement distribuées. Formellement, pour une
variable aléatoire x à valeurs positives, la GMD se présente de la manière sui-
vante :
Une présentation alternative assez intéressante est donnée par les formes sui-
vantes :
Ú
GM D(x) = 2 Fx (t) [1 − Fx (t)] dt, (2.2)
L’un des attraits essentiels de cette dernière présentation est qu’elle ouvre la voie
à plusieurs développements. En effet, la présentation du GMD en forme de cova-
riance conduit naturellement à la corrélation au sens de Gini et plus généralement
à la régression Gini – et à beaucoup d’autres développements théoriques comme
la régression Gini avec variables instrumentales, les séries temporelles en Gini,
etc.
En réalité, la GMD partage plusieurs propriétés avec la variance, la différence
fondamentale tient sur la norme utilisée. La variance est définie par :
1
Var(x) = E (xi − xj )2 , (2.4)
2
alors que la GMD est :
Ainsi, comme nous pouvons le remarquer, la principale différence entre ces deux
mesures de dispersion est la norme utilisée. La variance se base sur la distance
euclidienne (ℓ2 ) tandis que la GMD utilise la "city block" distance (ℓ1 ). La première
des propriétés qu’elles partagent est le fait que ces deux mesures peuvent être
écrites en covariance :
75
Var(x) = Cov(x, x), (2.6)
Ainsi, on peut exprimer la GMD comme la pente d’une régression par MCO.
En effet, puisque Fx (x) est une fonction cumulative, elle est distribuée selon une
loi uniforme sur [0 ;1], alors Var(Fx (x)) = Cov(Fx (x), Fx (x)) = 1/12. Par consé-
quent :
1 Cov(x, Fx (x))
GM D(x) = 4Cov (x, Fx (x)) = . (2.8)
3 Var(Fx (x))
En outre, comme on peut le voir à partir de (2.4) et (2.5), les deux indices peuvent
être définis sans référence à un paramètre de localisation spécifique, tel que la
moyenne. Cette propriété peut expliquer pourquoi il est possible de contraindre
les régressions MCO et Gini à passer par la médiane (Yitzhaki et al., 2003).
Une autre similarité entre ces deux mesures de dispersion est le fait que la
décomposition de la variance peut être vue comme un cas particulier de la dé-
composition de la GMD. En effet, comme nous allons le voir dans la sous-section
suivante, la décomposition de la GMD est très similaire à celle de la variance, la
différence fondamentale tient au fait qu’elle fait intervenir un terme additionnel.
En réalité, lorsque la distribution des données est normale la GMD et la variance
sont quasiment identiques. Lorsque x suit une loi normale on a :
√
π
Var(x) = GM D(x). (2.9)
2
Cette dernière expression nous permet de comprendre pourquoi les estimateurs
sont identiques dans le cas des MCO et du Gini lorsque la distribution des ré-
gresseurs est normale. Pour une présentation plus générale des similitudes et des
différences entre la GMD et la variance le lecteur intéressé pourra se référer à
(Yitzhaki et al., 2003) et (Yitzhaki and Schechtman, 2013, p. 21-22).
Plus généralement, la GMD peut être vue comme un élément d’un ensemble
ou d’une famille de paramètres que l’on appelle l’indice de Gini généralisé (”the
extended Gini”) :
76
Lorsque r = 1, on retrouve la GMD et lorsque r = 2 nous retrouvons deux fois la
variance ; ce qui nous permet de comprendre que la variance est un cas particulier
de l’indice de Gini généralisé. Notons que ce dernier peut aussi s’écrire sous la
forme suivante :
et
Cog(y, x) = Cov [y, Fx (x)] (2.13)
77
Elles s’expriment aussi de la manière suivante :
Ú Ú
Cog(x, y) = 2 x(2Fy (y) − 1)dF(x, y), (2.14)
Ú Ú
Cog(y, x) = 2 y(2Fx (x) − 1)dF(x, y). (2.15)
Lorsqu’il est égal à 1(−1), on peut conclure qu’il existe une relation affine
croissante (décroissante) entre les variables. Une corrélation égale à 0 signifie que
les variables ne sont pas corrélées (la réciproque est fausse). En effet, le coeffi-
cient de Pearson indique une dépendance linéaire. Par conséquent, il est inap-
78
proprié pour étudier des relations qui ne seraient pas linéaire et non linéarisable
(exponentielle, puissance, etc.). En outre, il est extrêmement sensible aux points
aberrants.
D’une manière générale, un coefficient de corrélation proche de (±1) est asso-
cié à une forte association entre les variables. Au contraire, un coefficient de corré-
lation proche de 0 indique une absence d’association. Malheureusement, ces deux
assertions posent problèmes. Tout d’abord, un coefficient de corrélation proche de
0 ne correspond pas toujours à une absence d’association, cf. Denuit and Dhaene
(2003). Par exemple, il peut arriver que deux variables aléatoires aient un coeffi-
cient de corrélation proche de (0) alors qu’elles sont liées par une transformation
monotone. Ensuite, les distributions multivariées peuvent avoir naturellement
des coefficients de corrélation compris dans l’intervalle [−1/3; 1/3].
Le coefficient de corrélation de Spearman qui est une mesure non paramé-
trique permet de rendre compte de l’intensité de la relation entre des variables
non linéaires (ou linéaires) et monotone. Il est fondé sur le rang des variables
et est préférable au coefficient de Pearson lorsque la distribution comporte des
valeurs extrêmes. En réalité, il est un cas particulier du coefficient de Pearson,
en effet, c’est le coefficient de Pearson lui-même appliqué au rang des variables.
Notons Ri (x) le rang de la ième observation de la variable aléatoire x. Ainsi, le
coefficient de corrélation de Spearman (Rs) entre les variables x et y est :
qn 1 21 2
n+1 n+1 qn
i=1 Ri (x) − 2
Ri (y) − 2 6 i=1 (Ri (x) − Ri (y))2
Rsx,y = n(n2 −1)
= 1− . (2.17)
n2 − n
12
79
Cov(x, Fy (y)) Cov(y, Fx (x))
Gx,y = ; Gy,x = . (2.18)
Cov(x, Fx (x)) Cov(y, Fy (y))
Lorsque que Gx,y ou Gy,x est égale à 1 ou (−1), on peut dire que y est une
fonction monotone croissante (décroissante) de x. Des coefficients égaux à zéro
indiquent une indépendance statistique entre x et y. Gx,y est invariant à toute
transformation strictement monotone de y. Pour terminer :
1. −1 ≤ Gx,y ≤ 1.
2. Lorsque x est une fonction monotone croissante (décroissante) de y alors
Gx,y et Gy,x sont égaux à 1(−1).
3. Si y et x sont indépendantes alors Gx,y = Gy,x = 0.
4. Gx,y = −Gx,−y = −G−x,y = G−x,−y .
5. Gx,y est invariant à toute transformation monotone stricte de y.
6. Gx,y = Gy,x si et seulement si Gx,y est symétrique en (x, y) lorsque ax + B
et cy + D sont permutées.
7. Lorsque (x, y) suit une loi normale bivariée alors Gx,y = Gy,x = ρx,y .
80
Décomposition d’une combinaison linéaire de variable
où ρjk représente le coefficient de corrélation linéaire (de Pearson) entre les va-
riables xj et xk . En utilisant les propriétés de la covariance nous pouvons égale-
ment décomposer la GMD. Il faudra toutefois noter que contrairement à la va-
riance il existe deux types de décomposition qu’on appelle habituellement la dé-
composition marginale (”one step decomposition”) et la décomposition complète
(”two-step décomposition”).
81
2. Décomposition complète du GMD :
AK B K
Ø Ø Ø
2
GM D βk xk = βk2 GM D2 (xk ) + βk βj GM D(xk )GM D(xj )Gxk ,xj .
k=1 k=1 kÓ=j
(2.25)
Cette décomposition plus complexe que la première est basée sur une imi-
tation de la décomposition de la variance, cf. Wodon et al. (2003).
Décomposition en sous-groupes
où,
2Cov(ȳ, Fy )
Gb = (2.27)
µ
représente le Gini intergroupe (l’inégalité entre les groupes k), Gk représente le
Gini intragroupe (l’inégalité dans le groupe k) et,
Cov(y, Fy (y))
Ok = (2.28)
Cov(y, Fyk (yk ))
82
également :
n
Ø Ø Ø
Ok = pj Okj = pk Okk + pj Okj = pk + pj Okj (2.29)
j=1 jÓ=i jÓ=i
avec,
Cov(y, F(y))
Okj = (2.30)
Cov(y, Fyk (y))
Le terme Okj représente le chevauchement du groupe k avec le groupe j, et
Okk = 1 puisqu’il représente l’indice de chevauchement du groupe k avec lui-
même. Pour une description plus complète de l’indice de chevauchement et ses
propriétés voir Dagum (1997) et Frick et al. (2006). Nous pouvons toutefois no-
ter que Okj ≥ 0, l’indice est égal à zéro lorsqu’il y a une stratification parfaite
entre le groupe k et le groupe j, autrement dit, l’indice est nul lorsque les deux
distributions ne se chevauchent pas.
Plus généralement, plus la variabilité intragroupe est faible plus la stratifi-
cation est élevée (moins le terme d’interaction est important). Une dernière re-
marque peut être faite sur l’indice de Gini intergroupe (Gb ). Ce dernier, introduit
par Yitzhaki and Lerman (1991), est défini comme le double de la covariance entre
le revenu moyen de chaque groupe et son rang moyen dans la population globale
rapportée au revenu moyen. Par conséquent, l’indice de Gini intergroupe Gb dif-
fère de celui qui est traditionnellement retenu dans la littérature, cf. (Pyatt, 1976,
entre autres), Mookherjee and Shorrocks (1982), Silber (1989). La différence ré-
side dans le rang des revenus choisi. En effet, l’indice de Gini intergroupe Gbp
est traditionnellement défini comme étant deux fois la covariance entre le revenu
moyen de chaque groupe et le rang des moyennes de chaque groupe rapporté
au revenu moyen, tel que Gbp ≥ Gp . Lorsque les sous-groupes ne se chevauchent
pas, alors Gbp = Gp . Par ailleurs, Gb peut être négatif dans certaines situations,
par exemple, lorsqu’un groupe est composé d’individus avec de faibles revenus
et qu’un autre groupe possède des revenus extrêmement élevés. C’est pour cette
raison, qu’il n’est pas véritablement un indice de Gini. La décomposition peut
être réécrite de la manière suivante :
K
Ø K
Ø
Gu = Sk G k + Sk Gk (Ok − 1) + Gbp + (Gb − Gbp ). (2.31)
k=1 k=1
Pour conclure, l’indice de Gini est à la fois sensible à la distribution des reve-
83
nus et à la distribution des rangs, c’est-à-dire à la stratification. C’est principale-
ment pour cette raison qu’on dit que la décomposition de l’indice de Gini est plus
complète que celle de la variance. Par conséquent, l’ANOGI semble plus appro-
priée que l’ANOVA lorsque la stratification a des implications sur l’interprétation
des résultats. L’ANOGI peut donc être pertinente pour l’analyse des régressions.
84
programme de minimisation, ne requiert pas de définir une forme fonctionnelle
quelconque et est qualifiée de régression semi-paramétrique. Une combinaison
de ces deux approches permet de tester l’hypothèse de linéarité du modèle.
Cet exemple suffit à montrer que les MCO sont sensibles aux transformations
monotones des données. Ceci cache un problème plus général qui est que les es-
timateurs des MCO sont fortement sensibles aux formes fonctionnelles choisies.
Formellement, une mauvaise spécification de la forme fonctionnelle d’un mo-
dèle peut avoir de lourdes conséquences comme : l’autocorrélation des erreurs,
85
des estimateurs imprécis, des variances biaisées et donc des tests d’hypothèses
probablement erronés. Cependant, dans certains cas, utiliser les logarithmes des
variables ou ajouter des termes quadratiques est suffisant pour détecter un bon
nombre de relations non linéaires. Toutefois, il peut être difficile dans certaines si-
tuations d’identifier la raison pour laquelle une forme fonctionnelle est mal spéci-
fiée. C’est pour cette raison qu’il paraît préférable d’utiliser une technique moins
sensible à la spécification du modèle.
Parallèlement, la pente de la droite des MCO, β̂ peut être vue comme une
moyenne pondérée de tangentes. Pour cela, il faut l’exprimer sous une nouvelle
forme :
q
Cov(x, y) n
(yi − ȳ)(xi − x̄)
β̂ = = i=1qn
Cov(x, x) i=1 (xi − x̄)
2
n
Ø (xi − x̄)2 (yi − ȳ)
= q . . (2.33)
i=1 (xi − x̄)2 (xi − x̄)
ü ûú ý ü ûú ý
wi bi0
n n n
1Ø 1Ø 1 Ø Ø
Cov(x, y) = xi yi − x̄ȳ = xi yi − 2 xi yi (2.34)
n i=1 n i=1 n i=1
1Ø 1 Ø 2 Ø
= xi yi − 2 xi yi − 2 xi yj
n n n i>j
(n − 1) Ø 2 Ø 1 èØ é 2 Ø
= 2
x y
i i − 2
x y
i j = 2
x y
i i (n − 1) − 2 xi yj
n n i>j n n i>j
1Ø 1Ø 1Ø
= [xi yi + xj yj ] − [xi yj + xj yi ] = [xi yi + xj yj − xi yj − xj yi ]
n n n
1Ø
= (xi − xj )(yi − yj ).
n
86
n
1Ø
Cov(x, x) = (xi − xj )(xi − xj ). (2.35)
n i=1
D’où :
qn
(xi − xj )(yi − yj )
β̂ = qi=1
n
i=1 (xi − xj )(xi − xj )
n
Ø (xi − xj )2 (yi − yj )
= qn .
2 (x − x )
. (2.36)
i=1 i=1 (xi − xj ) i j
ü ûú ý ü ûú ý
wij bij
L’estimateur β̂ apparaît ainsi comme une moyenne pondérée de toutes les tan-
gentes possibles entre les paires de points (xi , yj ). Une méthode de régression
non paramétrique peut donc consister à trouver une pente β̂ sans recourir aux
méthodes d’optimisation.
Par ailleurs, d’après cette nouvelle formule de β̂, on remarque bien que plus
les données sont hétérogènes, c’est à dire plus les écarts xi − xj sont élevés plus
les poids wij seront volatiles, du fait que les xi − xj sont élevés au carré. Ceci
accroît l’influence exercée par les points aberrants, conduisant à des variances
trop élevées et donc à des estimateurs instables.
Il existe deux approches pour surmonter cette extrême sensibilité de l’estima-
teur des MCO aux observations isolées. La première consiste à utiliser une autre
mesure de la dispersion des résidus moins sensibles aux valeurs aberrantes que
la variance. Dans ce cadre lorsque les erreurs sont indépendantes et normalement
distribuées alors l’estimateur converge vers la vraie valeur du paramètre. Cette
première approche correspond donc à une méthode paramétrique car l’estima-
teur découle de la minimisation de ce nouvel indicateur de dispersion choisi. La
seconde approche consiste à construire l’estimateur en question de sorte qu’il soit
moins sensible aux outliers. Cette seconde approche puisqu’elle ne découle pas
d’un programme de minimisation – et par conséquent ne requiert pas de définir
une forme fonctionnelle – est qualifiée de régression semi-paramétrique.
87
y = α + βx + ε. (2.37)
Supposons que l’estimateur passe par le point moyen et que E(ε) = 0. Ainsi, en
notant e le vecteur des résidus, et R(x) = nF(x) le vecteur rang de x, l’estimateur
β̂ P qui minimise la GMD des résidus est l’estimateur de la régression paramé-
trique suivant :
Øn Ø
n ; <
P 1
β̂ = arg min |ei − ej | = arg min Cov(e, R(e)) . (2.38)
i=1 j=1 n
Notons que cet estimateur ne peut être obtenu que numériquement et corres-
pond en réalité à la R-régression de Jureckova (1971), Jaeckel (1972), McKean and
Hettmansperger (1976). En effet, minimiser la GM D des erreurs est équivalent
qn
à minimiser 4 i=1 ei Ri (e), ce qui montre que la R-régression est une régression
Gini.
Néanmoins, puisque la GMD des erreurs n’est pas une fonction continue l’es-
timateur β̂ P qui le minimise n’est pas forcément unique. Pour simplifier suppo-
sons que cette dérivée existe et est unique :
Au même titre que la régression par quantile, l’estimateur obtenu par cette
4. En effet,
n n n n
1Ø 1 Ø Ø 1Ø
Cov(e, R(e)) = ei Ri (e) − 2 ei Ri (e) = ei Ri (e)
n i=1 n i=1 i=1 n i=1
88
approche n’a pas d’expression explicite et il ne peut être obtenu que de manière
numérique. Cet estimateur est toutefois convergent et a l’avantage d’être optimal
puisqu’il découle d’un programme de minimisation.
Ø (xi − xj )2 (yi − yj )
β̂ = q 2
. . (2.43)
i<j i<j (xi − xj ) (xi − xj )
ü ûú ý ü ûú ý
wij bij
D’après cette formule, plus les données sont hétérogènes, c’est-à-dire plus les
écarts xi − xj sont élevés, plus les wij sont volatiles, puisque les xi − xj sont
élevés au carré. Ceci accroît l’influence des points aberrants, conduisant à des
variances trop élevées et donc à des estimateurs peu fiables ou instables. Pour
surmonter cette limite, Olkin and Yitzhaki (1992) proposent de substituer les wij
par les poids vij moins volatiles :
(xi − xj )
vij = q . (2.44)
i<j (xi − xj )
Ø Ø (xi − xj ) (yi − yj )
β̂ sp = vij bij = q . . (2.45)
i<j i<j i<j (xi − xj ) (xi − xj )
ü ûú ý ü ûú ý
vij bij
89
En réalité, la substitution de wij par vij revient à remplacer dans la formule des
MCO chaque covariance par la co-Gini appropriée. En effet, soit le modèle de
régression suivant :
y = α + βx + ε. (2.46)
Cov(y, x)
β̂ M CO = . (2.48)
Cov(x, x)
Cov(y, R(x))
β̂ sp = . (2.49)
Cov(x, R(x))
Dans le cas d’une régression multiple, l’estimateur du Gini est donné par l’ex-
pression suivante :
sp
β̂ = (R(X)X)−1 (R(X)y), (2.50)
sp
β̂ = (ZX)−1 (Zy). (2.51)
Ceci permet de montrer que la régression Gini est plus robuste que les MCO
lorsque les instruments R(X) sont appropriés. Rappelons que l’idée d’utiliser le
rang comme instrument n’est pas nouvelle. Elle a été proposée par Durbin (1954).
Ce dernier n’avait pas remarqué que ceci correspondait à la régression Gini.
90
L’approche est très proche de celle des MCO. En réalité, elle se fonde sur une
imitation des MCO. C’est pour cette raison d’ailleurs que certains concepts uti-
lisés dans le cadre des MCO peuvent être transposés au cadre de la régression
Gini. Parmi ces concepts, nous pouvons citer le coefficient de détermination R2 .
L’équivalent de ce dernier dans la régression Gini est noté GR2 :
A B
Cov(e, R(e))
GR2 = 1 − . (2.52)
Cov(y, R(y))
Toutefois, puisque le décomposition du Gini est plus complexe que la décomposi-
tion de la variance, les propriétés du GR2 diffèrent de ceux du R2 . Le GR2 obtenu
dans l’approche par minimisation est toujours plus élevé que celui obtenu par
l’approche semi-paramétrique. Plus généralement, les estimateurs obtenus dans
ces deux approches diffèrent, mais ils sont équivalents lorsque le modèle est li-
néaire. Dans ce cas les GR2 sont aussi identiques. Par conséquent, nous pouvons
tester l’hypothèse de linéarité en comparant les estimateurs, ou les GR2 , des deux
types de régression Gini. Lorsque les deux estimateurs convergent vers la même
limite alors nous pouvons accepter l’hypothèse de linéarité du modèle. Olkin and
Yitzhaki (1992) ont proposé une formalisation de ce test de linéarité. Reconsidé-
rons le modèle de régression simple suivant :
y = α + βx + ε. (2.53)
91
.
.
. H0 : Cov(x, Fε (εsp )) = 0
.
. (2.54)
. H1 : Cov(x, Fε (εsp )) Ó= 0.
Lorsque H0 est acceptée, l’hypothèse de linéarité du modèle est acceptée. Comme
nous allons le voir dans la section suivante, Cov(x, Fε (εsp )) est une U-statistique.
Elle peut être estimée de manière convergente par l’estimateur Un :
Øn
1
Un = xi Ri (e). (2.55)
n(n − 1) i=1
Pour conclure sur cette procédure de test nous pouvons souligner qu’il est
possible d’inverser cette démarche en commençant par estimer le modèle par
l’approche paramétrique puis vérifier la condition orthogonalité de l’approche
semi-paramétrique. Toutefois, nous suggérons la procédure ci-dessus pour les
raisons suivantes.
92
cette distance au carré. Autrement dit, dans le cas de la méthode Gini les poids
sont issus de la norme ℓ1 alors que dans le cas des MCO ils sont issus de la norme
ℓ2 . Par conséquent, la régression Gini donne de meilleurs résultats en présence de
points aberrants.
Parallèlement, la décomposition en sous-groupes du Gini est plus informative
que celle de la variance. En effet, le Gini est à la fois sensible à la distribution et
à la stratification. En utilisant les propriétés de la covariance, nous allons tenter
de décomposer les coefficients de régression du Gini et des MCO en estimateurs
intragroupes et intergroupes. Soient :
– (y, x) un couple de variables aléatoires représentatif de la distribution totale
d’une population et (ym , xm ) avec m = 1, . . . , M , M couples de variables
représentant les M sous-groupes disjoints de la population totale.
– (ymj , xmj ) m = 1, . . . , M et j = 1, . . . , nm un couple de variables aléatoires
représentatif du groupe m.
qM
– N= m=1 nm
– β̂ sp
l’estimateur sémi-paramétrique obtenu dans la population totale et βm
le coefficient de régression obtenu dans le groupe m,
– ymj la jéme observation de ym , y.. la moyenne de y et ym. la moyenne de
ym
– Fx (x)) la fonction cumulative de x et F.. la moyenne des Fx (x).
– pm = nm
N
Ainsi, l’estimateur de la régression Gini peut être réécrit (voir preuve en an-
nexe 3.3.2) :
I M J
1 Ø
sp
β̂ = pm Covm (y, F(x)) + CovB (ym. , Fm. (x))
Cov(x, F(x)) m=1
I M
1 Ø Covm (y, F(x)) Covm (x, F(x))
= pm Covm (x, Fm (x))
Cov(x, F(x)) m=1 Covm (x, F(x)) Covm (x, Fm (x))
+CovB (ym. , Fm. (x))} . (2.56)
Soit :
sp Covm (y, F(x))
β̂m = (2.57)
Covm (x, F(x))
93
l’estimateur sémi-paramétrique dans le groupe m. Et
M
Ø
β̂ sp = sp
Vn βm + Vb βbsp (2.59)
m=1
pm Om GM Dm (x)
Avec Vn = GM D(x)
la part du groupe m dans la distribution totale. La pre-
mière partie 2.59 peut être interprétée comme l’intra et la seconde partie l’inter.
La décomposition de l’estimateur des MCO est :
M
Ø
β= Wn βm + Wb βb . (2.60)
m=1
La régression Gini fait intervenir un terme additionnel qui est le terme d’in-
teraction. Les deux régressions sont identiques dans les termes intragroupes et
intergroupes. La différence fondamentale tient au terme d’interaction. Lorsque
les distributions ne se chevauchent pas la décomposition du coefficient de régres-
sion Gini est identique à celle de la variance. Par contre lorsque les distributions
se chevauchent, la part de la composante intergroupe dans le Gini est totalement
différente de celle de la variance. Comme le note Frick et al. (2006), plus le che-
vauchement entre les groupes est important moins la composante intergroupe est
faible, ce qui n’est pas le cas des MCO.
Après avoir introduit les (éléments) fondamentaux de la régression Gini, nous
allons à présent nous intéresser aux conditions requises pour assurer le ”bon
comportement” de la régression Gini.
94
Soit un modèle de régression à plusieurs régresseurs, avec X la matrice des
variables exogènes de taille n × (K + 1), R(X) la matrice rang associée et xk est la
kième colonne de X .
(G’1) Aucune variable ne doit dégénérer en une séquence de zéros :
Par conséquent :
46 44
R′ (X)X = . (2.63)
46 44
Donc
det(R′ (X)X) = 0, et donc R′ (X)X est non inversible. (2.64)
95
2.2.6 Traitement des ex aequo
Une autre remarque importante peut être faite sur la manière de traiter les
ex aequo. Dans la pratique trois possibilités ont été avancées pour traiter cette
question.
(i) La première possibilité est de prendre le rang supérieur. Malheureuse-
ment cette procédure pose problème dans la mesure où elle conduit à une sur-
pondération des poids et donc un biais vers le haut des estimateurs :
1
3
1 3
x= 5
=⇒ R(x) = 6 .
(2.65)
2 4
3 5
(ii) La seconde possibilité est de prendre le rang inférieur. Cette option en-
traîne une sous-pondération des poids et donc des estimateurs biaisés vers le
bas :
1
1
1 1
x= 5
=⇒ R(x) = 5 . (2.66)
2 3
3 4
(iii) La dernière option consiste à prendre le rang du point moyen. L’intérêt
essentiel que présente cette dernière démarche est qu’elle conduit à des estima-
teurs non biaisés contrairement aux deux précédentes Yitzhaki and Schechtman
(2013) :
2
1.5
2 1.5
x= 5 =⇒ R(x) = 5 . (2.67)
3 3
4 4
Autre exemple :
96
1
1.5
x = 1 =⇒ R(x) = 1.5 (2.68)
7 3
Ce dernier cas correspond à ce qui se fait avec la régression Gini. Notons que
le rang n’est qu’une approximation de la fonction cumulative. Cependant, seul
le dernier cas permet de retrouver Fx (x) = R(x)/n. Rappelons tout de même
que des pistes de recherche peuvent être effectuées sur les approches non para-
métriques par noyau avec les estimateurs d’Epanechnikov notamment. Mais ceci
n’est pas l’objet de la thèse.
30
30
F(x) = 100 = R(x)/n. (2.69)
60
80
y = α + βx + ε. (2.70)
Supposons par ailleurs que la matrice colonne x soit endogène et que la matrice
colonne z soit un instrument valide de ce modèle. De sorte que le modèle se ré-
écrit comme suit :
y = α + β1 x + β2 z + ε. (2.71)
Selon Yitzhaki and Schechtman (2004), l’estimateur Gini avec variables instru-
mentales est :
Cov(y, Fz (z))
β̂ GIV = , (2.72)
Cov(x, Fz (z))
où Fz (z) représente la fonction cumulative de z, qui peut être approximée par la
97
matrice rang de z. Par ailleurs, tout comme l’estimateur βˆG de la régression Gini,
l’estimateur de la régression Gini avec variables instrumentales β̂ GIV peut être
exprimé comme une moyenne pondérée :
n
Ø
β̂ GIV = Vi bi . (2.73)
i=1
La seule différence concerne les poids Vi . Ces derniers s’écrivent dans le cas de la
régression Gini-VI comme suit :
5 6
p∆xi n+1
Vi = − R̄(z) , (2.74)
nCov(x, R(z)) 2
d’où : 5 6
p∆xi n+1 (yi+1 − yi )
β̂ GIV = − R̄(z) , (2.75)
nCov(x, R(z) 2 (xi+1 − xi )
avec p = i/n, ∆xi = xi+1 − xi et R̄(z) représentant la moyenne des rangs.
Dans le cas de la régression multiple, l’estimateur Gini-VI est donné par la
formule suivante :
GIV
β̂ = (R′ (Z)X)−1 R′ (Z)Y, (2.76)
98
2.2.8 Inférence et variance des estimateurs
L’objectif d’une régression ne se limite pas simplement à trouver l’estimateur
des paramètres de la régression mais également de déterminer ses propriétés et
de s’assurer notamment de sa convergence. D’après Yitzhaki and Schechtman
(2013), tous les estimateurs développés dans le cadre de la régression Gini sont
des U-statistiques. La théorie des U-statistiques a été introduite par Hoeffding
(1948). 5 L’un des principaux avantages de montrer que les paramètres découlant
de la régression Gini sont des U-statistiques, ou des fonctions de U-statistiques,
réside dans le fait que cette propriété garantit l’absence de biais et la convergence
de l’estimateur et permet de calculer facilement sa variance. Nous ne dévelop-
perons pas en détail la théorie des U-statistiques ci-après, le lecteur intéressé par
cette littérature pourra se référer à Denker (1985), (Serfling, 2009, Chapitre 5) et
(Lehmann, 1999, Chapitre 6). Nous nous intéressons dans cette section aux pro-
priétés des U-statistiques et leurs liens avec la GMD.
Soit {x1 , x2 , . . . , xn } une séquence de n variables aléatoires i.i.d. d’une famille
P . Les estimateurs de cette famille peuvent s’écrire
avec h une fonction symétrique, que l’on appelle le noyau. Dans ce cas, il est
possible de montrer qu’un estimateur sans biais de ϑ est donné par l’expression
suivante :
Ø Ø
Un = (nm )−1 ... h(xi1 , xi2 . . . xim ). (2.78)
i1 ,i2 ...im
99
buées. Considérons la statistique
avec,
h (xi1 , xi2 . . . xim , yi1 , yi2 . . . yim ) (2.80)
Ø 1Ø
U1 = (n1 )−1 xi = xi . (2.82)
n
(ii) La Variance : ϑ = 21 E(xi − xj )2 , m = 2 et h(xi , xj ) = 12 (xi − xj )2 . La U-statistique
correspondante est :
n
A B
2 Ø (xi − xj )2 1 Ø
U2 = = x2 − nU21 . (2.83)
n(n − 1) i<j 2 (n − 1) i=1 i
correspondante est :
2 Ø
U3 = |xi − xj |. (2.84)
n(n − 1) i<j
100
La variance d’une U-statistique, Var(U), pour le paramètre ϑ est donnée par :
m
Ø 1 2
Var(U) = (nm )−1 (m
i )
n−m
m−i ξi , (2.86)
i=1
Ainsi, 1 21 21 2
m2 ( m1 n1 −m1 m2 n2 −m2
m1 Ø
Ø i ) m1 −i j m2 −j
Var(Un1 ,n2 ) = 1 2−1 1 2−1 ξij .
i=1 i=1 n1 n2
m1 m2
avec,
ξij = Var[h (xi1 , xi2 . . . xim , yi1 , yi2 . . . yim )]. (2.88)
L’expression de cette variance est assez complexe et son utilisation pratique est
de ce fait très délicate. En effet, elle peut conduire à des formes complexes surtout
lorsque m > 1. Une approche alternative pour obtenir la variance asymptotique
d’une U-statistique consiste à utiliser la méthode du Jackknife. En effet, Arvesen
(1969) a montré que cette dernière permet d’obtenir une estimation convergente
de la variance d’une U-statistique :
N N
C D2
N −1Ø 1 Ø
V ar(U) = U−i − U−i ,
N i=1 N i=1
avec U−i l’estimateur de U basé sur l’échantillon de taille N sans la iéme observa-
tion.
Comme nous l’avons souligné précédemment, les U-statistiques jouissent de
bonnes propriétés à savoir l’absence de biais et la convergence asymptotique.
Malheureusement, la principale difficulté est de montrer qu’une statistique est
bien une U-statistique et de déterminer son degré et son noyau. Heureusement,
Lenth (1983) d’abord (pour l’ordre 1) puis Schechtman and Schechtman (2002)
(généralisation à l’ordre m) ont proposé une manière très simple de vérifier si une
statistique est une U-statistique. En effet, selon eux Un en est une, si et seulement
si, pour n suffisamment grand et Un une fonction symétrique, cette dernière est
invariante par Jackknife. Intuitivement, puisque la technique du Jackknife per-
met de réduire le biais et qu’une U-statistique est toujours sans biais alors, tout
101
U-statistique est invariante au Jackknife.
Après avoir introduit les généralités de la régression Gini, nous allons à pré-
sent proposer une extension de cette méthode à l’économétrie des données de
Panel.
102
suivant) savent que quelques points atypiques peuvent suffire à modifier consi-
dérablement les résultats d’une estimation.
Par ailleurs, il faut signaler que, jusqu’à une période récente, il était d’usage
d’éliminer toutes les observations relatives à un individu, dès lors que l’une
d’elles apparaissait comme aberrante. Une telle pratique (qu’on appelle cylin-
drage) conduisait en effet souvent à éliminer une très forte proportion d’observa-
tions et donc, à perdre beaucoup d’informations ; ceci induisant, au mieux, une
moindre précision des estimations et au pire, un risque de biais. C’est pourquoi
d’ailleurs certains chercheurs ont préféré corriger ces points aberrants au lieu de
les éliminer. Malheureusement, dans ce cas aussi il est indispensable que l’infor-
mation disponible soit suffisante pour que la correction soit acceptable.
Pour toutes ces raisons évoquées, il serait tout-à-fait préférable d’utiliser une
technique d’estimation moins sensible aux points aberrants comme la régression
Gini. En effet, la correction des points aberrants quoi qu’intéressante conduit
souvent à des erreurs de mesure dommageables à la qualité des estimations. En
outre, le fait de développer la régression Gini en panel présente plusieurs autres
avantages : la régression Gini est une méthode par variable instrumentale donc
plus robuste que les méthodes standards : moins sensible aux erreurs et à la spé-
cification du modèle. Ainsi, cette section se propose d’étendre la réflexion sur la
régression Gini en panel, notamment, nous y développons l’estimateur par ef-
fet fixe en utilisant la GMD comme mesure de dispersion, cf.(Ka and Mussard
(2016)). Nous proposons également le test de l’existence de spécificités indivi-
duelles. 6
6. Koenker and Bassett Jr (1978) avait déjà proposé une technique d’estimation particulière-
ment adaptée lorsque les données sont contaminées par des points aberrants. Il s’agit de la régres-
sion par quantile. L’objectif est de minimiser une fonction de perte absolue différente en positive
ou en négative :
îØ Ø ï
min q |yi − xi′ β| + (1 − q) |yi − xi′ β| . (2.89)
Cette méthode peut être vue comme un cas particulier de l’approche paramétrique de la régres-
sion Gini, cf. Olkin and Yitzhaki (1992).
103
2.3.1 L’estimateur Gini du modèle à effets fixes
Dans cette sous-section nous proposons une nouvelle technique de régression,
la régression Gini en panel. Considérons le modèle à effets fixes suivant :
C N T D−1 C N T D
ØØ ØØ
′
β̂ W M CO = (xnt − xn. )(xnt − xn. ) (xnt − xn. )(ynt − yn. ) .
n=1 t=1 n=1 t=1
(2.91)
Il s’agit de l’estimateur des MCO appliqué au modèle écrit en écarts par rapport
aux moyennes individuelles :
avec
1 1 1
yn. = ynt xn. = xnt et εn. = εnt . (2.93)
T T T
L’estimateur par effet fixe couramment appelé l’estimateur "intra" résulte de la
décomposition de la variabilité totale en variabilité intragroupe et en variabilité
intergroupe. Une décomposition semblable peut être envisagée dans le cas du
Gini.
Soit , x.. le vecteur (K × 1) des moyennes des variables explicatives contenu
dans X soit Rx =: (R′11 (X), . . . , R′nt (X), . . . , R′N T (X)) la matrice rang de X avec
R ′nt (X) la nt-iéme ligne Rx , qui est , un vecteur 1 × K . Soient R n. (X) le vecteur
rang des moyennes individuelles K × 1, R .. (X) le vecteur des rangs moyens (de
qT
dimension K × 1 ), R n. (X) = t=1 R nt (X), le vecteur rang des moyennes indi-
1
T
1 qN qT
viduelles et R.. (X) = N T n=1 t=1 Rnt (X), le vecteur rang des moyennes totales.
104
Alors, la décomposition de la matrice des co-Gini, Rx′ X, est :
N Ø
Ø T
Gtotal
xx = (xnt − x.. )(Rnt (X) − R.. (X))′ (2.94)
n=1 t=1
ØN Ø T
= (xnt + xn. − xn. − x.. )R′nt (X)
n=1 t=1
ØN Ø T N Ø
Ø T
= (xnt − xn. )R′nt (X) + (xn. − x.. )R′nt (X)
n=1 t=1 n=1 t=1
ØN Ø T N Ø
Ø T
′
= (xnt − xn. )[ Rnt (X) − Rn. (X)] + (xn. − x.. )[ Rnt (X) − R.. (X)]′ .
n=1 t=1 n=1 t=1
ü ûú ý ü ûú ý
Variabilité intragroupe : Ginter
xx Variabilité intergroupe : Ginter
xx
Gtotal intra
xx = Gxx + Ginter
xx et Gtotal
xy = Gintra
xy + Ginter
xy . (2.95)
WG
β̂ = [Gintra
xx ]
−1
[Gintra
xy ]. (2.96)
Rc = ((R11 (X) − R1. (X))′ , . . . , (Rnt (X) − Rn. (X))′ , . . . , (RN T (X) − RN. (X))′ ) .
(2.97)
L’estimateur intragroupe peut être réécrit comme suit :
WG
β̂ = (Rc′ Xc )−1 Rc′ yc . (2.98)
105
BG è é−1 è é
β̂ = Ginter
xx Ginter
xy . (2.99)
è é−1
Fintra = Gintra
xx + Ginter
xx Gintra
xx (2.100)
è é−1
Finter = Gintra
xx + Ginter
xx Ginter
xx . (2.101)
G è é−1 è é
β̂ = [Gtotal −1 total intra
xx ] [Gxy ] = Gxx + Ginter
xx Gintra
xy + Ginter
xy
è é−1 5 6
WG BG
= Gintra
xx + Ginter
xx Gintra
xx β̂ + Ginter
xx β̂
WG BG
= Fintra β̂ + Finter β̂ . (2.102)
Comme nous l’a suggéré Yihzhaki dans une communication privée, une se-
conde famille d’estimateurs intragroupes et intergroupes peuvent être détermi-
née avec le Gini. En effet, puisque la co-Gini n’est pas symétrique, (Cog(x, y) =
Cov(y, F(x)) Ó= Cov(x, F(y)) = Cog(y, x), nous pouvons décomposer aussi Gtotal
yx
et donc déduire les estimateurs intragroupes et intergroupes de la second ap-
proche de la régression Gini. Toutefois, pour simplifier la présentation de nos ré-
sultats, cette seconde approche ne sera pas présentée, nous pouvons néanmoins
souligner que ces deux estimateurs convergent vers la même limite lorsque la
taille de l’échantillon est importante.
106
1 2−1 Ø
m 1 2
N
Var(U) = m (m ) N −m ξ i m−i i.
i=1
N N
C D2
N −1Ø 1 Ø
Var(U) = U−i − U−i , (2.103)
N i=1 N i=1
avec U−i l’estimateur basé sur l’échantillon de taille N privé de la iéme observa-
tion. L’estimation indirecte est en pratique assez souvent retenue dans la mesure
où elle est plus simple d’utilisation surtout lorsque le degré de la U-statistique est
supérieur à 1.
WG
Afin de montrer que β̂ est une fonction de U-statistiques, considérons R ck
la kéme colonne de la matrice Rc et xkc la kéme colonne de la matrice Xc , k =
WG
1, . . . , K. Puisque l’estimateur intragroupe est β̂ = (β̂1W G , . . . , β̂K
WG
) alors,
107
Soit le vecteur colonne suivant b̂0 := (β̂01 , . . . , β̂0K ) and b̂ε := (β̂ε1 , . . . , β̂εK ), alors :
−1
β̂ W G 1 β̂21 . . . β̂K1 β̂01 − β̂ε1
1
..
.. .. ..
..
è é
. = . . ... . . =: B̂−1 b̂0 − b̂ε .
WG
β̂K β̂1K β̂2K . . . 1 β̂0K − β̂εK
(2.111)
WG a
β̂ ∼ N (β, Var(U)). (2.112)
2.3.3 Simulations
Dans l’objectif d’illustrer l’avantage de nos estimateurs intragroupe et inter-
groupe nous proposons une simulation dont l’algorithme est décrit ci-dessous.
Elle consiste à estimer le modèle (2.90) et comparer à chaque fois les MSE.
Simulation de référence
108
¯ ¯ ¯ ¯ ¯
β̂ W M CO (β̂ BG et β̂ BM CO sont les moyennes des estimateurs inter enfin β̂ G et β̂ M CO
la moyenne des estimateurs globaux).
G
TABLE 2.1 – Estimateur Gini Global β̂
BG
TABLE 2.2 – Estimateur Gini intergroupe β̂
A présent nous nous intéressons aux estimateurs non biaisés. Comme nous
le savons l’estimateur intragroupe est sans biais. Nous pouvons remarquer une
forte similarité entre les estimations obtenues par l’application des MCO et du
Gini en l’absence de points extrêmes. Ce résultat est usuel puisque lorsque la
distribution des régresseurs est normale multivariée, la régression Gini est équi-
valente à celle des MCO. Par contre, les estimations avec contamination sont no-
tablement différentes. Une dernière remarque peut être faite quant à la procédure
109
de contamination. Dans la table 2.3 ci-dessous, nous avons contaminé p = 1% des
observations au hasard en remplaçant ces p observations par 2 fois le maximum
des régresseurs. Même si cette procédure conduit à des résultats biaisés vers le
haut, le Gini est plus robuste (voir les MSE).
WG
TABLE 2.3 – Estimateur Gini intragroupe β̂
Dans la table 2.5 ci-dessous une valeur aberrante négative de 50 est ajoutée à
1% de l’échantillon tiré au hasard. Il est évident que toutes les estimations intra-
groupes sont biaisées vers le bas. Il est également important de noter que les MSE
des MCO sont très élevés par rapport à ceux de Gini.
Enfin, nous nous intéressons aux distributions non gaussienne (table 2.7). ,20) ;
110
• x2 ∼ Weibull(10, 15) ;
• x2 ∼ Exponentielle(15) ;
• l’effet individuelle βn ∼ U [5, 20]).
Estimates → β̂ W G β̂ W OLS
0.7 0.7032 (0.0099) 0.8501 (1.07564)
1.23 1.2312 (0.0081) 1.29012 (2.74206)
0.13 0.1308 (0.0531) 0.199 (4.4869)
111
dans le cadre des régressions sur indice de Gini. Ceci revient à discriminer entre
le modèle,
Ø
k
ynt = β0 + βk xnt + εnt , (2.113)
Dans le cas des MCO, cette hypothèse H0 est testée en utilisant un test de Fisher.
Ce dernier conduit à comparer la statistique F ci-dessous au fractile de la loi de
Fischer à (N − 1, N (T − 1) − K) degrés de liberté :
SCRo − SCR N (T − 1) − k
F = . ∼ F(N − 1, N (T − 1) − K), (2.116)
SCR N −1
Covc (y, Fy (y)) = Covc (ŷ, Fy (y)) + Covc (e, Fy (y)), (2.117)
Cov(y, Fy (y)) = Cov(ŷ, Fy (y)) + Cov(e, Fy (y)), (2.118)
où Covc représente la covariance issue du modèle avec contrainte sur les para-
112
mètres, i.e., le modèle (2.113). Tester l’égalité de la variabilité expliquée entre les
deux modèles revient à tester :
.
.
. H0′ : Covc (ŷ, Fy (y)) = Cov(ŷ, Fy (y))
.
. (2.119)
. H1′ : Covc (ŷ, Fy (y)) Ó= Cov(ŷ, Fy (y)).
Covc (y, Fy (y)) − Covc (e, Fy (y)) = Cov(y, Fy (y)) − Cov(e, Fy (y)). (2.120)
Notons que e et y peuvent être permutés, voir Olkin and Yitzhaki (1992), alors
pour le modèle (2.114) :
d’où
Puisque Cov(ŷ, R(e)) = 0 8 alors la précédente équation peut être réécrite comme
suit :
{Cov(e, F(e))}2
Cov(e, Fy (y)) = . (2.124)
Cov(y, Fy (y))
De même pour le modèle contraint (2.113) :
Puisque sous H0 , Covc (y, Fy (y)) = Cov(y, Fy (y)) alors tester Cov(ε, Fy (y)) =
Covc (ε, Fy (y)), i.e. H0 : α1 = α2 = α3 = . . . = αi = β0 , est tout à fait équivalent
à tester Covc (ε, F(ε)) = Cov(ε, F(ε)). Ainsi nous pouvons construire un test basé
8. Cov(ŷ, R(e)) = Cov(â + β̂x, R(e)) = β̂Cov(x, R(e)) = 0.
113
sur la différence entre les GMD des deux modèles :
.
.
. H0′′ : Covc (ε, F (ε)) − Cov(ε, F (ε)) = 0
.
. (2.126)
. H1′′ : Covc (ε, F (ε)) − Cov(ε, F (ε)) Ó= 0.
Notons que U1 = Covc (e, R(e)) et U2 = Cov(e, R(e)) sont deux U-statistiques.
Il s’agit d’estimateurs sans biais de respectivement, Covc (ε, F(ε)) et Cov(ε, F(ε)),
dont la forme est donnée pour chacun des modèles par :
Øn
1
U= ei Ri (e). (2.127)
n(n − 1) i=1
= Gc ρ2 − Gρ2 . (2.131)
114
Pour réaliser le test, il faut un estimateur convergent de Z. Puisque
Cov(y, Fy (y)) = Covc (y, Fy (y)), ce dernier se réécrit :
U22 − U21
Ẑ = , (2.133)
U23
q q
avec U3 = (n2 )−1 i<j |yi − yj |. Donc la statistique de test permettant de tester
H0′′′ est donnée par :
Ẑ
T′ = ñ , (2.134)
V̂ (Ẑ)
y = Xβ g + εg , (2.136)
115
où X est de taille n × (K + 1). Notons Var(εg ) la variance du terme d’erreur de
telle sorte que Var(εg ) = σg2 Ω, avec Ω une matrice de taille n × n, donnée par
1
Ω = CΛC′ où Ω−1 = P′ P et P′ = CΛ− 2 . Soit y∗ := Py, X∗ := PX et ε∗g := Pεg il
en résulte que :
Ainsi
′
E[ε∗g ε∗g ] = Pσg2 ΩP′ = σg2 In . (2.138)
æ′ := R∗ P. L’application de la
De plus X∗ := PX, R∗ := Rx′ ∗ , y∗ := Py et X
régression Gini semi-paramétrique donne estimateur Aïtken Gini :
æ′ X)−1 X
β̂ g = (Rx′ ∗ X∗ )−1 Rx′ ∗ y∗ = (R∗ PX)−1 R∗ Py = (X æ′ y. (2.139)
Comme nous l’a suggéré Yitzhaki lui-même, cet estimateur dépend de la va-
riance. Un réel estimateur de type Aïtken devrait être obtenu en utilisant l’indice
de Gini comme mesure de variabilité. C’est ce que nous proposons un peu plus
loin.
L’objectif principal de cette section est d’illustrer l’intérêt de cette méthode par
deux exemples d’applications théoriques : améliorer le test de Shelef et proposer
l’estimateur à effets aléatoires.
yt = β0 + β1 yt−1 + εt . (2.140)
Cov(yt , Ry (yt−1 ))
b̂G
1 = . (2.141)
Cov(yt−1 , Ry (yt−1 ))
Puisque b̂G
1 est une U-statistique, nous pouvons estimer son écart-type de manière
116
convergente en utilisant la procédure du Jackknife :
ö
õ
õn − 1 Ø 1 G 22
ŜD(b̂G
1) =
ô b̂ G
1(−i) − b̂1(.) , (2.142)
n i
avec bG
1(.) l’estimateur de la régression Gini calculé sur l’ensemble de l’échantillon
et bG
1(−i) l’estimateur de la régression Gini calculé après suppression d’une obser-
vation (i = 1, . . . , n). La statistique de test de Shelef (2014) est :
b̂G
1 −1
GDF = . (2.143)
ŜD(b̂G
1)
Pour réussir à faire une approche pratique du test, nous avons décidé de partir
sur un modèle autorégressif d’ordre 1 avec l’hypothèse que le processus d’inno-
vation est un bruit blanc, comme la procédure de Shelef l’indique. Le but étant
de vérifier la puissance de ce test par le biais de plusieurs étapes détaillées de la
façon suivante :
– Génération d’une série yt = β0 + β1 yt−1 + εt avec εt suivant une loi normale.
– Calcul de la statistique de test GDF .
– Calcul des résidus de la régression Gini eG G1
t = yt − (β0 + β̂1 yt−1 ).
1
117
Notons que les valeurs critiques sont obtenues en calculant les résidus de la
régression Gini eG
t
t∗
de telle sorte que la série bootstrap est ensuite calculée sous
l’hypothèse nulle H0 avec β = 1 :
ytG1∗ = yt−1
G1∗
+ eG
t
1∗
, (2.144)
β̂1G1 ∗ − 1
GDF = ∗
, (2.145)
ŜD(β̂1G1 ∗ )
où φ̂G
1 ∗ est l’estimateur de régression Gini, calculé sur l’échantillon bootstrap,
1
G∗ Cov(yt∗ , R(yt−1
∗
))
β̂1 1 = . (2.146)
Cov(yt−1 , R(yt−1 ))
∗ ∗
Cette procédure GDF ∗ est employée pour imiter la distribution de test sous l’hy-
pothèse nulle (H0 : β1 = 1) afin d’obtenir les valeurs critiques.
Globalement, ce test semble être à la fois robuste et valide pour une large
gamme de distributions. Toutefois, comme nous pouvons le voir dans le tableau
ci-dessous, ce test souffre d’une perte de puissance lorsque l’hypothèse d’absence
d’autocorrélation n’est plus satisfaite. La prise en compte de l’autocorrélation im-
pacte directement la puissance du test. Soit le modèle auto-corrélé
yt = φ0 + φ1 yt−1 + εt , (2.147)
avec εt = ρεt−1 + ut . On montre ainsi que la puissance n’est plus constante, elle
baisse au fur et à mesure que le coefficient de corrélation ρ augmente, passant
ainsi de 0.07 à 0.05. Ces résultats nous permettent d’observer les limites du test
de Shelef en présence d’autocorrélation. En effet, la significativité du test s’en voit
considérablement altérée. Les résultats auxquels nous aboutissons avec différents
coefficients d’autocorrélation sont les suivants.
118
TABLE 2.7 – Perte de puissance du Test de Shelef
εt = ρ1 εt−1 + ut , (2.148)
Cov(εt , εt−1 )
ρ1 = ñ . (2.149)
Var(εt )Var(εt−1 )
Suivant Shelef and Schechtman (2011), si εt est strictement stationnaire, deux
fonctions d’autocorrélation Gini peuvent être définies à partir de deux co-Gini :
Cog(εt , εt−s ) := Cov(εt , F(εt−s )) et Cog(εt−s , εt ) := Cov(εt−s , F(εt )). La première
est la suivante :
Cov(εt , F(εt−s ))
ρG
s =
1
, (2.150)
Cov(εt , F(εt ))
La seconde est donnée par :
Cov(εt−s , F(εt ))
ρG
s =
2
. (2.151)
Cov(εt−s , F(εt−s ))
119
Le processus εt est dit stationnaire au sens de Gini si :
Cog(ut , εr ) = 0 ∀t, r = 1, . . . , T.
Cog(ut−r , εt−s )
=: bG
r,s , (2.152)
Cog(εt−s , εt−s )
avec
s−1
Ø
εt = [ρG s
1] + [ρG r
1 ] ut−r . (2.153)
r=0
s−1
Ø
Cog(εt , εt−s ) = E(ε′t F(εt−s )) = [ρG s
1 ] g0 + Cog(ut−r , εt−s ) = [ρG s
1 ] g0 . (2.154)
r=0
Rappelons que Var(εg ) := σg2 Ω, avec Ω étant une matrice n × n. Il en résulte que :
120
Ainsi l’application de la régression Gini semi-paramétrique conduit à l’estima-
teur Aïtken Gini :
æ′ X)−1 X
β̂ g = (Rx′ ∗ X∗ )−1 Rx′ ∗ y∗ = (Rx′ ∗ Ω−1/2 X)−1 Rx′ ∗ Ω−1/2 y = (X æ′ y. (2.157)
T
Ø T
Ø
U′1 = [1/ (T − 1) T ] Rt (et−s )et et U′2 = [1/ (T − 1) T ] Rt (et )et . (2.159)
t=1 t=1
−1/2 −1/2
∗
β̂ g = (RG ΩG X)−1 RG
∗
ΩG ∗
y = (RG X∗ )−1 RG
∗ ∗
y (2.160)
−1/2
avec RG
∗
= R(ΩG X).
Ainsi, comme nous pouvons l’observer dans la table 2.8 ci-dessus, l’applica-
tion du test de Shelef (2014) avec processus autocorrélé ne pose plus aucun pro-
121
blème de perte de puissance lorsque les erreurs sont autocorrélées.
K
Ø
ynt = β0 + βxknt + εnt , (2.161)
k=1
avec
εnt = Un + Wnt (2.162)
Avec
E(ε1 ε′1 ) E(ε1 ε′2 ) . . . E(ε1 ε′N )
E(ε2 ε′1 ) E(ε2 ε′2 ) . . . E(ε2 ε′N )
Ω = E(εε′ ) =
.. .. ... ..
(2.164)
. . .
E(εN ε′1 ) E(εN ε′2 ) . . . E(εN ε′N )
L’estimateur MCG peut être vu comme une combinaison linéaire des variabilités
inter et intra-individuelles des observations. En effet
122
î ï−1 î ï
β̂ M CG = Sintra
xx + θSinter
xx Sintra
xy + θSinter
xy , (2.165)
avec Sintra
xx et Sinter
xx les variabilités intra et inter-individuelles :
N Ø
Ø T
Sintra
xx = (xnt − xn. )(xnt − xn. ) (2.166)
n=1 t=1
N Ø T
Ø σw2
Sinter
xx = (xn. − x.. )(xn. − x.. ) et θ = (2.167)
n=1 t=1 σw2 + T σu2
Ceci montre que β̂ M CG est une moyenne pondérée des estimateurs intra et inter-
individuels. En effet
intra inter
β̂ M CG = F1 β̂ + F2 β̂ , (2.168)
avec
è é−1
F1 = Sintra
xx + θSinter
xx Sintra
xx (2.169)
è é−1 1 2
F2 = Sintra
xx + θSinter
xx θSinter
xx . (2.170)
L’estimateur des MCG considère la même pondération pour les variabilités in-
tragroupes et intergroupes, cf. [Link] (2008). Bien que l’estimateur des MCG
jouit de très bonnes propriétés, il ne résout en rien les problèmes des points aber-
rants et peut être affecté par une transformation monotone des données. En effet,
Sintra
xx et Sintra
xy (respectivement Sinter
xx et Sinter
xy ) restent très sensibles aux outliers.
Comme nous le savons une approche alternative pour surmonter cette difficulté
serait d’utiliser une autre mesure de dispersion comme la GMD. Reconsidérons
le modèle à erreurs composées précédent :
K
Ø
ynt = β0 + βxknt + εnt . (2.171)
k=1
123
Ce qui conduit à :
î ï−1 î ï
β̂ AG = R(Ω−1/2 x)Ω−1/2 x R(Ω−1/2 x)Ω−1/2 y . (2.173)
E(ε1 F(ε′1 )) E(ε1 F(ε′2 )) . . . E(ε1 F(ε′N ))
E(ε2 F(ε′1 )) E(ε2 F(ε′2 )) . . . E(ε2 F(ε′N ))
ΩG = E(εF(ε′ )) =
.. .. .. ..
(2.174)
. . . .
E(εN F(ε′1 )) E(εN F(ε′2 )) . . . E(εN F(ε′N ))
î ï−1 î ï
−1/2 −1/2 −1/2 −1/2
β̂ AG = R′ (ΩG x)ΩG x R′ (ΩG x)ΩG y = (Rx′ ∗ x∗ )−1 Rx′ ∗ y∗ (2.175)
124
donné par l’expression suivante :
JT
Bn = IN T − Wn = IN ⊗
T
. En utilisant ces deux opérateurs nous pouvons réécrire β̂ AG comme suit (voir
annexe 3.3.3 pour la démonstration) :
è é−1 è é
βAG = G ∗intra
xx +θ′ G∗inter
xx G ∗intra
xy +θ′ G∗inter
xy , (2.176)
√
avec θ′ = φ. Ainsi, tout comme les MCG, l’estimateur Aïtken Gini peut
être considéré comme une combinaison optimale des estimateurs intra et inter-
groupes.
2.5 Conclusion
L’objectif premier de ce chapitre était de revenir sur les généralités de la ré-
gression Gini. La variance est la mesure de dispersion la plus populaire. Toute-
fois, elle suppose l’hypothèse de symétrie des distributions marginales. Ce qui
peut apparaître restrictif dans la mesure où l’analyse économique considère sou-
vent des relations non symétriques. L’utilisation de la différence moyenne du
Gini permet de surmonter cet obstacle. Il semble qu’il existe plus d’une douzaine
de représentations alternatives du GMD (Yitzhaki, 1998). L’intérêt essentiel que
présente la multiplicité de ces définitions est de montrer l’avantage d’utiliser la
GMD. Chaque définition ouvre la voie à de nombreux développements et inter-
prétations. Par exemple, la définition basée sur la covariance permet de définir la
co-Gini, la G-corrélation, l’ANOGI, la régression Gini, etc.
La GMD partage plusieurs propriétés avec la variance et la principale diffé-
rence entre ces deux mesures est la norme utilisée : la variance se base sur la
distance euclidienne tandis que la GMD utilise la "city block" distance (norme
ℓ1 ). En outre, le Gini est à la fois sensible à la distribution des revenus et à la dis-
tribution des rangs c’est-à-dire à la stratification. C’est principalement pour cette
raison qu’on dit que la décomposition du Gini est plus complète que celle de la
variance. Par conséquent, l’ANOGI serait plus appropriée que l’ANOVA lorsque
la stratification a des implications sur l’interprétation des résultats. Par ailleurs,
comme nous l’avons vu, la co-Gini n’est pas symétrique. C’est cela qui explique
125
d’ailleurs le fait qu’il existe deux types de régression Gini. La première est ba-
sée sur la minimisation du GMD des erreurs. Comme la régression par quantile,
l’estimateur obtenu n’a pas d’expression explicite et il ne peut être obtenu que nu-
mériquement. La seconde approche consiste à construire l’estimateur en question
de sorte qu’il soit moins sensible aux outliers. Les estimateurs obtenus dans ces
deux approches sont généralement différents et ils sont équivalents uniquement
lorsque le modèle est linéaire. Ainsi, nous pouvons tester l’hypothèse de linéarité
en comparant les estimateurs de ces deux approches de la régression Gini. En
outre, cette dernière est moins sensible que les MCO aux transformations mono-
tones des données et aux points aberrants. Ainsi, elle est plus robuste et peut être
vue comme une méthode par variable instrumentale (Ka and Mussard, 2015).
Par ailleurs, contrairement aux MCO qui imposent trois conditions (conditions
de Grenander) pour garantir le bon comportant de la matrice des moments, la
régression Gini n’impose que deux conditions. Ces dernières que nous avons in-
troduit dans Ka and Mussard (2016) sont moins restrictives.
Le second objectif de ce chapitre, qui est le principal d’ailleurs, était d’étendre
cette réflexion sur la régression Gini à l’économétrie des données de panels. La
principale difficulté de cette tâche était de décomposer la variabilité totale au sens
de Gini en variabilité intragroupe et en intergroupe sans l’indice de chevauche-
ment. Nous avons montré qu’il était possible de réaliser une telle décomposition.
Ainsi, nous avons pu définir les estimateurs intragroupes et intergroupes dans
le cadre du Gini. Comme tout estimateur basé sur le Gini, nos estimateurs sont
des U-statistiques et donc convergent vers la loi normale. Nous avons également
proposé un test de l’existence des effets individuels et plusieurs autres dévelop-
pements théoriques.
Pour terminer, notons que ces dernières décennies, plusieurs travaux ont tenté
de proposer des estimateurs du modèle à effets fixe moins sensible que les MCO
aux points aberrants. Nous pouvons citer entre autres la M-estimation, la S-
estimation (Verardi and Wagner, 2011). La particularité de notre estimateur est
qu’il est en plus d’être moins sensible que les MCO aux points extrêmes, il n’im-
pose pas de forme fonctionnelle particulière. Cette propriété est particulièrement
importante dans le domaine de la croissance pro-pauvre où plusieurs travaux
ont montré la sensibilité des résultats d’estimations aux formes fonctionnelles re-
tenues.
126
Chapitre 3
Estimation de la croissance
pro-pauvre
127
que la dimension temporelle des données est extrêmement limitée. Ce qui fait que
la variance inter-individuelle est très supérieure à la variance inter-temporelle
(Cogneau et al., 2002; White and Anderson, 2001; Ghura et al., 2002, entre autres).
Par ailleurs, il serait nécessaire de tester la robustesse des conclusions en ana-
lysant les canaux de transmission et de voir aussi si les résultats restent valables
dans d’autres échantillons et également avec des combinaisons différentes de va-
riables explicatives. C’est pourquoi, nous avons construit deux échantillons en
données de panel. L’avantage des données de panels est qu’elles permettent de
tenir compte de l’hétérogénéité entre les pays. Mais également, la double dimen-
sion des données de panel et leurs grands nombres permettent d’obtenir plus de
variabilité, plus de degré de liberté et moins de colinéarité.
La première section revient sur les limites de l’approche par les indices. Elle
propose une étude comparative des mesures de la croissance pro-pauvre. Plus
précisément, nous allons étudier le caractère inclusif de la croissance Thaïlan-
daise en utilisant plusieurs indices : CIC, CPP, IPCC et TECP. Le cas de la Thaï-
lande est particulièrement intéressant. Ce pays a connu une croissance écono-
mique régulière durant les années 80, ce qui a conduit à réduire très sensiblement
l’incidence de la pauvreté. Mais, en même temps les inégalités de revenu ont été
très fortes. D’ailleurs, elle a été longtemps considérée comme l’un des pays les
plus inégalitaires en terme de distribution de revenu. Malheureusement, ces in-
égalités de revenu pourraient limiter l’impact de la croissance sur la réduction de
la pauvreté. En effet, la théorie de la croissance pro-pauvre soutient que la lutte
contre les inégalités de revenu est un vecteur important de lutte contre la pau-
vreté. Ainsi, nous pourrons légitimement nous demander en présence d’inégalité
de revenu aussi importante dans quelle mesure la croissance Thaïlandaise est-elle
pro-pauvre ? Plusieurs études se sont intéressées à cette question. La particularité
de celle-ci est qu’elle utilise un ensemble d’indices de croissance pro-pauvre.
La seconde section s’intéresse aux conséquences de la limitation des données,
aux choix de spécification et de la méthode d’estimation. La sensibilité des es-
timateurs par effets fixes standards aux outliers, aux erreurs de mesures et aux
formes fonctionnelles fait que nous privilégierons l’utilisation de notre estimateur
intragroupe de la régression Gini. Ce dernier est plus robuste que l’estimateur in-
tra basé sur les MCO Ka and Mussard (2016). Par ailleurs, pour tenir compte du
biais de sélection, nous avons construit deux échantillons en données de panels.
128
Un premier échantillon qui couvre la période 2003-2007 et comportant 69 pays
dont 37 sont des pays développés ou en transition et 32 sont des pays en voie de
développement. Et un deuxième échantillon à partir du premier en considérant
uniquement les pays en voie de développement et en transition. Ce traitement
nous permet d’avoir un second échantillon constitué de données homogènes.
129
effet, cette dernière est passée de 27% au début des années 90 à environ 16% en
1999 (Table 3.1).
130
Grosse et al. (2008) l’utilise dans la dimension non monétaire de la pauvreté. Elle
ne nécessite pas non plus de définir un seuil de pauvreté, ce qui constitue un
avantage considérable. Selon cette méthode la croissance est pro-pauvre si, pour
tout centile p, la courbe se situe au-dessus de l’axe des abscisses. On dit alors qu’il
y a dominance stochastique de premier ordre de la distribution à la période t sur
la distribution à la période t − 1. Toutefois, si la CIC change de signe ou plus pré-
cisément s’il n’y a pas de dominance stochastique de premier ordre on ne pourra
pas conclure avec cet indice.
Pour construire la courbe d’incidence de la croissance (CIC) pro-pauvre, nous
avons calculé les taux de croissance des centiles des dépenses de consommation
sur la période 1990-2000.
La croissance est pro-pauvre lorsque la courbe est au-dessus de l’axe des abs-
cisses. Ainsi, globalement nous pouvons conclure que la croissance a été favo-
rable aux pauvres sur la période 1990-2000. Cela signifie que la croissance a été
favorable à toutes les couches de la population, notamment aux deuxième et der-
nier déciles, sur cette période.
131
3.1.2 Croissance pro-pauvre en Thaïlande avec la CPP.
Une approche alternative pour étudier la croissance pro-pauvre en Thaïlande
est possible en utilisant la CPP (courbe de croissance de la pauvreté) de Son
(2004). Et contrairement à la CIC, la courbe de Son (2004) est issue à partir des
conditions de dominance stochastique de deuxième ordre 1 . D’après cette courbe
la croissance est pro-pauvre au sens absolu lorsque cette courbe se situe au-dessus
de l’axe des abscisses. Ainsi, nous pouvons conclure que la pauvreté a décliné du-
rant la période 1998-2000 en Thaïlande avec la même conclusion que l’approche
par la CIC à savoir une amélioration des conditions de vie des premiers et der-
niers déciles.
1. Rappelons que l’ordre 1 de la dominance stochastique est relatif au critère de Pareto donc
non compatible avec les principes redistributifs. L’ordre 2 permet en revanche des transferts de
type Pigou-Dalton.
132
3.1.3 Croissance pro-pauvre en Thaïlande avec le TCEP.
Une autre mesure de la croissance pro-pauvre est le TCEP (Taux de croissance
équivalent à la pauvreté). Ce dernier tel que défini par Kakwani and Son (2002)
correspond au taux de croissance qui engendre une baisse de la pauvreté dans la
même proportion que celle obtenue avec le taux de croissance du revenu moyen
(TCRM), lorsque l’on suppose les inégalités de revenu inchangées, c’est-à-dire
lorsque chaque individu reçoit la même proportion des bénéfices de la croissance.
Selon cette mesure la croissance sera considérée comme étant pro-pauvre (pro-
riche) au sens relatif lorsque le TCEP est supérieur (inférieur) au taux de crois-
sance du revenu ou des dépenses de consommation moyennes et pro-pauvre au
sens absolu si le TCEP est positif sur toute la période.
Dans le tableau ci-dessus, nous pouvons constater que (comme chez Kak-
wani et al. (2004)) durant la période 1990-92 le taux de croissance par tête est de
7,49 ; alors que le TCEP est de 4,27. Cela signifie que 3,22% du taux de croissance
est perdu parce que les pauvres n’ont pas pleinement bénéficié de la croissance.
Ainsi, la croissance n’a pas été pro-pauvre sur cette période et sur la période 1992-
1993 ; la croissance a été favorable aux plus pauvres. Cela s’explique par l’effet
combiné de la croissance économique et de la baisse des inégalités de revenu. Et
très globalement, sur toute la période, la croissance économique thaïlandaise n’a
pas été pro-pauvre. Elle a entraîné une hausse des dépenses des ménages riches
plus que proportionnelle à celles des ménages pauvres de 1990 à 2000 2 .
2. Sur la période 1988-2000, Kakwani et al. (2004) concluent que la croissance économique
Thaïlandaise n’a pas été pro-pauvre.
133
3.1.4 Croissance pro-pauvre au Thaïlande avec l’ICPP.
Une dernière mesure utilisée pour évaluer le caractère pro-pauvre de la crois-
sance Thaïlande est l’ICPP (Indice de croissance pro-pauvre). Ce dernier introduit
par (Kakwani et al., 2000) correspond au rapport entre la réduction totale de la
pauvreté et la réduction de la pauvreté obtenue en supposant les inégalités de re-
venu inchangées. Ainsi, avec cette mesure, la croissance sera pro-pauvre au sens
relatif lorsque l’indice est supérieur à l’unité et pro-pauvre au sens absolu lorsque
qu’il est positif. Signalons toutefois, que cet indice ne respecte pas l’axiome de
monotonie. Cela signifie que l’indice n’augmente pas de valeur lorsque le taux
de réduction de la pauvreté est plus élevé.
134
responsable de cette explosion des inégalités de revenu durant cette période de
forte croissance économique. D’ailleurs, cette faible mobilité de la main d’œuvre
a expliqué pourquoi la crise économique de 1997 n’a pas eu d’impact significatif
sur la distribution des revenus en Thaïlande (voir Table 3.4). Le premier quantile
a faiblement évolué durant la crise de 1996 (4.3 en 1996, 4.3 en 1998 et 4.2 en 2000)
et les écarts entre les différents quantiles sont restés stables.
3. La forte croissance chinoise, des années 2000, a été la principale cause du rapide baisse
de la pauvreté. En effet, en 2001 l’indice de croissance pro-pauvre chinoise était environ de 17%
contre 64% au début des années 80 Ravallion (2009). Pourtant d’après Kakwani cette croissance
n’a pas été favorable aux pauvres mais, au contraire, elle leur a été défavorable puisqu’elle s’est
accompagnée d’une augmentation des inégalités.
135
3.2 Analyses économétriques de la croissance pro-
pauvre
Cette section s’intéresse respectivement à l’impact de la croissance, des inéga-
lités de revenu et des mécanismes de redistribution sur la réduction de la pau-
vreté. Son originalité est de tenter de mesurer l’impact de ces différents éléments
sur les quantiles inférieurs. Ainsi, elle permet de faire des recommandations plus
ciblées. En effet, pour élaborer une politique de croissance pro-pauvre, il serait
indispensable d’identifier les mécanismes permettant d’accroître le revenu des
quantiles inférieurs. En outre, cette technique présente plusieurs avantages : elle
permet d’évaluer plus facilement le caractère pro-pauvre de la croissance et les es-
timations obtenues sont insensibles au seuil de pauvreté choisi. Ce dernier point
est particulièrement important. Comme nous l’avons souligné précédemment es-
timer une ligne de pauvreté pour l’ensemble des pays de notre échantillon est un
exercice assez délicat.
Nous nous intéresserons également aux conséquences des choix de spécifi-
cation et de la méthode d’estimation. Par ailleurs, au-delà de la technique d’es-
timation utilisée, il est important de ne pas perdre de vue les problèmes liés à
la sélection de l’échantillon. La littérature empirique récente est largement re-
venue sur les conséquences d’un tel problème. Par exemple, Ghura et al. (2002)
montrent la fragilité des résultats de Dollar and Kraay (2002). Bien que leurs tra-
vaux ne soient pas facilement comparables à ceux de Dollar and Kraay (2002) du
fait que les échantillons sont différents, ils montrent tout de même leurs limites
et la nécessité d’utiliser des méthodes d’estimation plus robustes. Sur ce point la
régression Gini semble être une méthode d’estimation particulièrement adaptée
aux travaux sur la croissance pro-pauvre. Comme nous l’avons vu dans le précé-
dent chapitre, ce type de régression présente plusieurs avantages : une moindre
sensibilité que les méthodes traditionnelles aux erreurs de mesures et aux points
aberrants. Mais aussi, elle est plus robuste car les estimateurs obtenus par cette
approche sont moins sensibles à la sélection de l’échantillon et plus généralement
aux erreurs de spécification.
Cette section conclut aux limites des mécanismes de redistribution et à la né-
cessité de prendre en compte les inégalités de revenu dans toutes politiques pro-
pauvres. Et elle est organisée en quatre sous-sections. La première présente notre
136
modèle. La seconde et la troisième présentent respectivement les données et les
méthodes d’estimation et enfin la dernière nos différents résultats.
137
d’abord, nous allons estimer ce modèle par les approches traditionnelles (l’esti-
mateur par effet fixe et aléatoire). Cependant, la sensibilité des estimateurs par
MCO aux outliers, aux erreurs de mesures et aux formes fonctionnelles fait que
cette technique reste peu adaptée à ce type de données. Le traitement qui consiste
à supprimer les observations aberrantes bien qu’intéressant n’est pas pleinement
satisfaisant car il conduit à supprimer beaucoup d’observations et donc à perdre
de l’information ce qui n’est pas sans conséquence sur les résultats. Pour toutes
ces raisons, nous avons préféré la régression Gini. L’un des intérêts que présente
cette dernière méthode réside dans la possibilité de corriger à la fois ces trois li-
mites : points aberrants, erreurs de mesure et moins de sensibilité aux formes
fonctionnelles.
138
Les variables éducation secondaire et primaire proviennent de la base de don-
nées de Barro and Lee (2013). Les trois autres variables d’analyse proviennent
des bases de données de la Banque Mondiale : le taux d’inflation, les dépenses
publiques de santé et la part des dépenses publiques.
Sur un plan purement économétrique, nous devons admettre que les résultats
empiriques obtenus ne sont pas réellement satisfaisants. En effet, il serait néces-
saire de tester la robustesse des conclusions en analysant si elles restent valables
dans d’autres échantillons et également avec des combinaisons différentes de va-
riables explicatives. C’est pourquoi, nous avons construit deux échantillons en
données panels dont les statistiques descriptives sont présentées dans la table 3.5
ci-dessous.
Echantillon 1 Echantillon 2
B. Nombre de pays 69 32
D. Moyennes
Indice de Gini 38.08 34.53
Q1 6.53 7.248
Q2 11.126 12.120
Q3 15.327 16.238
Q4 21.423 22.00
Q5 45.436 42.18
Eduprim 84.112 99.33
Edusecon 102.563 101.683
Taux d’inflation 6.00 4.51
DP de santé 7.01 7.78
taux de croissance (Txc) 5.506 5.14
log(PIBagr) 4.51 4.58
DP du Gov 5.88 4.22
[1-Gini]*Txc -208.59 -179.301
139
Rappelons que la double dimension des données de panel et leurs grands
nombres permettent d’obtenir plus de variabilité, plus de degré de liberté, moins
de colinéarité et permettent également de contrôler l’hétérogénéité des compor-
tements. Mais surtout cette double dimension permet de tenir compte de l’in-
fluence de caractéristiques non observables des individus sur leur comportement,
cf. Baltagi (2008). 5 Par ailleurs, comme nous l’avons souligné dans l’introduction
de ce document, modéliser la croissance pro-pauvre ne consiste pas simplement
à régresser le taux de croissance et les inégalités sur les quantiles inférieurs ou sur
l’incidence de la croissance. En effet, la logique requiert que l’on considère uni-
quement les épisodes de croissance (donc taux de croissance positif). Ainsi, dans
nos échantillons nous avons considéré les pays qui ont des taux de croissance
positifs.
Un premier échantillon qui couvre la période 2003 − 2007 et comportant 69
pays dont 37 sont des pays développés ou en transition et 32 sont des pays en
voie de développement a été construit. Pour ces cinq périodes d’analyse, ce panel
est cylindré et comporte 345 observations. Toutefois, au-delà des tests de robus-
tesse que l’on peut effectuer, il est très probable que les résultats obtenus avec ce
premier échantillon soient sujets au biais de sélection. Cette question de sélection
de l’échantillon constitue selon notre point de vue un problème crucial. En effet,
ce premier échantillon regroupe des pays très hétérogènes en terme d’organisa-
tion économique et sociale. Ainsi, afin de tenir compte de ce biais de sélection,
nous avons construit un deuxième échantillon à partir du premier en considérant
uniquement les pays en voie de développement et en transition. Ce traitement
nous permet d’avoir un second échantillon constitué de données homogènes. Ce
deuxième échantillon couvre la même période et est non cylindré et il comporte
170 observations.
5. En outre, un avantage décisif des données de panel par rapport aux autres types de données
tient au fait qu’elles sont souvent extrêmement nombreuses ce qui conduit à des estimations dont
les propriétés peuvent être assimilées aux propriétés asymptotiques des méthodes utilisées.
140
3.2.3 Analyse et interprétation des résultats
Concernant l’impact de la croissance sur les quantiles inférieurs, le lien appa-
raît positif dans le cas de l’estimateur par effets fixes basé sur les MCO (Table3.7).
Selon cette première procédure d’estimation une hausse d’un point supplémen-
taire du taux de croissance favoriserait une augmentation de 0,14% (20%) du re-
venu des 0,20% (des 40%) les plus pauvres de notre de notre échantillon. En outre,
les inégalités de revenu seraient particulièrement défavorables aux plus démunis.
En effet, plus les inégalités de revenu sont importantes moins la croissance profite
aux pauvres. Cependant, nous devons être extrêmement prudents sur ce premier
résultat obtenu. En réalité, même si la plupart des paramètres sont significatifs,
l’estimation reste de très mauvaise qualité et peu robuste. C’est principalement
pour ces raisons que nous considérons que l’estimation par MCO est imprécise
et de faible qualité également. Cette instabilité de l’estimateur par les MCO pro-
vient de la présence de points aberrants dans notre échantillon 1. Pour s’en rendre
compte nous allons tester très brièvement la présence de points aberrants.
Il existe une multitude de manière de déceler la présence de points aberrants.
Les tests les plus connus sont : le Test de Dixon et le Test de Grubbs et à côté,
il existe plusieurs grandeurs permettant de détecter la présence de points aber-
rants dans l’échantillon : la distance de Cook, Résidu studentisé, Dffits, Dfbetas,
Covratio etc.
e2 − e1 en − en−1
Si3 ≤ n ≤ 7 Q1 = et Q1 = (3.2)
en − R1 en − e1
e2 − e 1 en − en−1
Si8 ≤ n ≤ 12 Q1 = et Q1 = (3.3)
en − e1 en − e2
141
e3 − R1 en − en−2
Sin ≻ 12 Q1 = et Q1 = (3.4)
en−2 − e1 en − e3
Si la valeur de ces rapports est inférieure à la valeur critique (lue dans la table
de Dixon), on conclut qu’il y’a des points aberrants dans notre échantillon. L’in-
convénient majeur de ce test est sa faible puissance lorsque le nombre d’observa-
tion est peu élevé. Dans ce dernier cas, on privilégie le test de Grubbs.
• Le levier : il correspond à la iéme valeur de la matrice H définit (qu’on
appelle habituellement la Hat matrice) ci-dessous.
Lorsque
K +1
hi > 2
n
alors on conclut que l’observation i est aberrante.
• Le Press (Predicted Residuals Sum of Squares) : plus elle s’éloigne de la
somme des carrés des résidus, plus on suspecte l’existence de points extrêmes.
n
Ø 2
Press = (Ŷi − Ŷi ) (3.6)
i=1
βˆj − β iˆ, j
Dfbetasij = ñ (3.8)
σ̂i (X′ X)−1 jj
142
En appliquant ces différents tests, nous trouvons une vingtaine de points aber-
rants dans notre échantillon (Table3.6). Bien que ces points représentent 5% seule-
ment de notre échantillon 1, ils peuvent compromettre la validité de nos conclu-
sions basées sur les MCO.
C’est pour cela que nous allons estimer à nouveau notre modèle en utilisant
notre estimateur par effet fixe au sens de Gini. Ce qui nous amène à la Table3.8.
Les estimateurs par effets fixes MCO et Gini conduisent à des évaluations de
l’impact des variations des taux de croissance et des inégalités assez sensible-
ment différentes. On note même une opposition de signe pour les paramètres
estimés du coefficient de Gini (en couleur grise). Ces divergences ainsi observées
s’expliquent principalement par la sensibilité de l’estimateur habituelle au spéci-
fication du modèle, mais également aux importantes erreurs de mesures et à la
présence de points aberrants.
Ces deux résultats d’estimation qui viennent d’être présentés constituent une
bonne illustration de l’avantage que présente l’utilisation de la régression Gini.
Toutefois, au-delà des tests de robustesse que l’on peut effectuer, il est très pro-
bable que les résultats obtenus soient sensibles à la sélection de l’échantillon et
aux outliers (Table 3.6). Ces questions concernant les outliers et la sélection de
l’échantillon constituent de notre point de vue un problème à ne pas négliger. En
143
effet, ce premier échantillon regroupe des pays très différents en terme d’organi-
sation économique et sociale. Et nous pouvons très légitimement nous interroger
sur la pertinence d’un tel regroupement. Bien évidemment, nous pouvons utiliser
des méthodes robustes à la présence d’effets fixes. Toutefois, bien que certaines
différences organisationnelles et sociales peuvent être fixes sur une période don-
née, elles ont souvent des effets non négligeables sur la constitution du revenu
des plus pauvres dans le moyen et le long terme. Par exemple, dans les pays
riches, il existe souvent un ensemble de systèmes de protection sociale qui aident
assez efficacement les plus démunis à se protéger contre les effets des chocs ma-
croéconomiques. C’est pour cela que nous avons construit un second échantillon
à partir du premier en considérant uniquement les pays en voie de développe-
ment. Ce traitement nous permet d’avoir un échantillon constitué de données
homogènes dont les résultats sont présentés dans la sous-section suivante.
144
TABLE 3.7 – Estimation de notre modèle par les MCO
145
TABLE 3.8 – Estimation de notre modèle par le Gini
146
3.2.4 Estimations de notre modèle sur notre second échantillon
Les tables 3.9 et 3.10 ci-dessous présentent respectivement les résultats de nos
estimations avec les MCO et le Gini sur notre second échantillon. Comparer aux
résultats précédents l’amélioration de la qualité de l’estimation est particulière-
ment frappante. Une simple observation de ces tableaux nous permet de consta-
ter l’évolution de certains paramètres estimés et l’importance de tenir compte
des spécificités des pays. Globalement, la croissance s’accompagne d’une réduc-
tion de la pauvreté. En outre, on voit bien, en comparant les résultats obtenus
par la régression Gini dans les deux échantillons que l’impact de la croissance
agricole sur la réduction de la pauvreté serait supérieur dans les pays à faibles
revenus. Selon les estimations sur notre premier échantillon le PIB agricole n’a
pas une influence significative sur le caractère pro-pauvre de la croissance. Pour
rappel, dans le chapitre 1 de ce document, nous avons vu que l’agriculture joue
un rôle important dans la réduction de la pauvreté. D’ailleurs, plusieurs travaux
ont montré qu’à dépense égale c’est la recherche agricole qui a le plus permis de
réduire la pauvreté dans les pays en voie de développement. D’après nos esti-
mations, ce type de résultats reste vrai dans les pays pauvres caractérisés par des
économies fondées généralement sur l’agriculture. C’est pour cette raison, que
le PIB agricole n’a pas une incidence significative sur la réduction les quantiles
inférieurs de notre premier échantillon 7 . Par ailleurs, comme le souligne à juste
titre Wiggins and Higgins (2008), il est important de réduire les distorsions des
marchés agricoles afin de pouvoir favoriser l’impact de la croissance agricole sur
la réduction de la pauvreté.
Par ailleurs, durant ces dernières décennies, une abondante littérature est re-
venue sur l’importance de l’accès à l’éducation dans la lutte contre la pauvreté. En
effet, l’éducation joue un rôle essentiel pour trouver un emploi et atteindre l’au-
tonomie personnelle. Toutefois, bien que le taux de scolarisation secondaire joue
favorablement à la réduction de la pauvreté, l’analyse révèle que le taux de sco-
larisation primaire n’a pas une influence significative sur les quantiles inférieurs.
La principale explication de ce résultat est que stimuler l’accès à l’éducation pri-
maire n’est efficace pour réduire la pauvreté qu’à condition que les populations
7. La grande majorité des pays de notre premier échantillon sont des pays industrialisé ou en
transition et leurs économies ne reposent pas sur l’agriculture. Ce qui fait que la réduction de la
pauvreté n’est pas clairement due à la croissance agricole
147
concernées puissent poursuivre leurs formations afin de bénéficier pleinement
des rendements marginaux élevés associés à la formation longue.
Sans surprise l’inflation a un impact négatif sur les quantiles inférieurs. Elle
érode le pouvoir d’achat des pauvres. Une hausse de dix pourcent du taux d’in-
flation réduit la croissance du premier quantile d’environ six points. En réalité,
l’inflation peut être considérée comme une taxe régressive qui affecte davantage
les plus pauvres. En effet, ces derniers sont souvent moins outillés que les autres
pour se protéger contre l’inflation. Ils n’ont pas souvent accès aux produits finan-
ciers qui permettent de protéger la valeur de leur patrimoine.
Globalement, même si la croissance s’accompagne d’une amélioration du re-
venu des plus pauvres, ces derniers ont moins bénéficié des résultats de la crois-
sance que les riches. En outre, ces résultats mettent en évidence l’importance de
ne pas négliger la lutte contre les inégalités. L’analyse montre que ces dernières
agissent négativement sur le taux de croissance des quantiles inférieurs. Malheu-
reusement, les politiques de lutte contre les inégalités sont souvent négligées dans
la lutte contre la pauvreté. D’ailleurs, les estimations ci-dessus montrent que c’est
la croissance corrigée des inégalités qui a le plus d’influence sur la réduction de
la pauvreté. Ce paramètre est plus important chez les quantiles inférieurs.
148
TABLE 3.9 – Estimation de notre modèle par les MCO
149
TABLE 3.10 – Estimation de notre modèle par le Gini
150
3.2.5 D’autres méthodes d’estimations
Afin de mieux illustrer l’avantage de la régression Gini nous allons nous
concentrer sur notre second échantillon. L’objectif est de comparer les résultats
obtenus avec cet échantillon à partir des deux méthodes d’estimation. Plus préci-
sément, nous allons tout d’abord présenté dans la table3.11, outre les estimations
usuelles (MCO, inter, intra), l’estimateur MCQG et l’estimateur MCO du modèle
en différence première (DP). Ce dernier représente une solution alternative à l’es-
timateur intra, lorsque l’on est confronté à un problème de corrélation des effets
individuels. Ensuite, nous présenterons dans la table3.12, l’équivalent de ces es-
timateurs dans le cadre de la régression Gini, il s’agit notamment de l’estimateur
de la régression Gini, de l’inter Gini, l’intra Gini, l’Aïtken Gini et enfin l’estima-
teur Gini du modèle en différence première (DP). Toutefois, pour une question de
présentation, nous ne présentons ici que les résultats relatifs au premier quantile.
Les résultats complets sont disponibles en annexe (p173 à p175).
151
TABLE 3.11 – Estimation de notre modèle sur le premier quintile MCO
152
TABLE 3.12 – Estimation de notre modèle sur le premier quintile Gini
Dans un premier temps, nous observons une relative similarité entre l’esti-
mateur total et l’estimateur inter. Ce type de résultat est très connu en écono-
métrie. En effet, comme nous l’avions souligné dans le chapitre 2, en panel la
variabilité inter-individuelle représente l’essentiel de la variabilité totale. A l’op-
posé, les estimations intra, MCQG et en différence première sont sensiblement
différentes des précédentes. L’impact de la croissance sur le premier quantile est
153
nettement plus faible que celui obtenu précédemment. Pourtant, logiquement,
ces estimateurs devraient être convergents et relativement proches. Bien évidem-
ment, sous l’hypothèse que le modèle soit correctement spécifié et que toutes les
hypothèses standards soient remplies. Par conséquent, nous pouvons en conclure
qu’au moins le modèle n’est pas correctement spécifié. Au passage nous pouvons
souligner que le R2 du modèle intra est plus faible que les autres. L’explication
principale de ce résultat est que ce modèle ne comporte pas de constante 8 et donc
l’analyse de la variance n’est plus vérifiée.
Les problèmes d’autoccorélation (ou d’hétéroscédasticité) des erreurs ne
conduisent pas à des estimateurs biaisés. Nous pouvons dire que les divergences
précédemment obtenues dans le cadre des MCO ne sont pas dues à la non vali-
dité de ces deux hypothèses. Elles sont probablement dues à une éventuelle en-
dogeneité des variables explicatives ou plus généralement à une mauvaise spé-
cification de la forme fonctionnelle retenue. Comme nous le savons un problème
d’endogénéité induit la non convergence de l’estimateur MCQG alors que l’esti-
mateur intra reste lui convergent. Ainsi, il est tout à fait possible d’envisager un
test d’endogéneité à la Hausman en comparant l’estimateur MCQG et l’estima-
teur intra-individuelle.
Test de Hausman
Q1 Q2 Q3 Q4 Q5
H 72 56 81 69 78
Sans effectuer ce test, une simple observation de la table 3.11 pouvez nous
8. Si il n’y a pas de constante dans le modèle, le R2 peut devenir négatif.
154
permettre de conclure à une éventuelle endogéneité des regresseurs. Toutefois,
il faudra noter que l’écriture du modèle en intra ou en inter interdit l’estima-
tion des coefficients des variables constantes dans la dimension temporelle. En
outre, la divergence entre les estimateurs intra et MCQG peut provenir plus gé-
néralement d’une erreur de spécification. C’est pourquoi, il est important de re-
courir à des techniques d’estimation alternatives moins sensible aux erreurs de
spécifications. L’endogéneité est un problème classique en économétrie et la mé-
thode des variables instrumentales demeure une solution efficace. Le problème
se ramène alors à trouver des variables qui soient de bons instruments. Sur ce
point, plusieurs pistes de recherche ont été envisagées dans la littérature : par
exemple, Hausman and Taylor (1981) ont proposé d’utiliser les variables expri-
mées en écarts aux moyennes individuelles. Nous utilisons ici la proposition de
Durbin (1954) qui consiste à utiliser le rang des variables explicatives comme
instruments ce qui correspond à la régression Gini. L’utilisation de cette dernière
permet de surmonter les problèmes d’endogénéité. C’est pour cela que nous nous
intéressons à présent aux estimations obtenues dans les différentes dimensions
de la variabilité en utilisant cette régression. Ceci nous amène au tableau3.12 ci-
dessus.
Contrairement aux MCO les résultats obtenus dans les différentes dimensions
de la variabilité au sens de Gini nous conduisent à des estimations relativement
proches. En effet, les estimations Gini, inter et intra conduisent à des évaluations
de l’impact de la croissance et des inégalités sur les quantiles assez identiques,
ce qui constitue un argument supplémentaire en faveur de la régression Gini.
En réalité, la relative proximité des estimateurs découlant des différentes mé-
thodes de centrage constitue en généralement une validation de la spécification
du modèle. Ainsi, il ne faudrait pas réduire la régression Gini à une simple tech-
nique de traitement des points aberrants. Comme nous l’avons vu précédemment
cette technique de régression jouit de plusieurs autres avantages : estimateur sans
biais, convergent, moins sensible à la spécification du modèle et aux erreurs de
mesures 9 .
9. D’ailleurs, l’insensibilité des estimations de la régression Gini aux points aberrants n’est
qu’une propriété de la régression Gini. Et cette dernière découle du fait que la GMD est plus
adaptée lorsque l’hypothèse de normalité n’est pas remplie et plus généralement lorsque la dis-
tribution sous-jacente des données a une queue épaisse.
155
3.3 Conclusion
L’objectif premier de ce chapitre était de revenir sur les limites des mesures
traditionnelles de la croissance pro-pauvre. Comme nous l’avons bien vu, dans
la première section de ce chapitre, l’approche par les indices présente des limites
qu’on devrait prendre plus au sérieux. En effet, en plus de leur caractère par-
tiel, ces méthodes conduisent souvent à des résultats contradictoires. En outre,
dans certaines situations, elles ne nous permettent pas conclure. Au vu de cela,
l’approche économétrique représente une belle alternative mais cette dernière est
sujette à deux types de biais : le biais de sélection et le biais d’endogéneité. Paral-
lèlement, elle souffre aussi de la sensibilité des résultats d’estimations à la forme
fonctionnelle choisie voir Alesina and Rodrik (1994). Par ailleurs, les erreurs de
mesures sur certaines variables explicatives comme l’indice de Gini constituent
une autre préoccupation qu’on devrait prendre plus au sérieux. Malgré, les efforts
visant à améliorer (ou élargir) les données existantes, elles restent insatisfaisantes.
Les données sur la croissance pro-pauvre diffèrent entre les pays en termes de
couverture géographique (couverture nationale, urbaine ou rurale), d’unités sta-
tistiques (familles, ménages ou individus) et de définition du revenu (dépenses
de consommation, revenu disponible ou revenu brut). Et très globalement, ces
erreurs de mesure engendrent une sous-estimation, en valeur absolue, de la vraie
valeur du paramètre de la variable sujette à cette erreur de mesure. Cette sous-
estimation est d’autant plus importante que la part de la variance de l’erreur de
mesure dans la variance totale de la variable observée est élevée et/ou que le
coefficient estimé est lui même élevé. Ainsi, il y’a une très bonne raison de privi-
légier la régression Gini. D’ailleurs, comme nous l’avons vu dans ce chapitre, les
estimateurs qui découlent du Gini sont en général plus robustes.
Une autre conclusion importante de ce chapitre est que globalement le proces-
sus de croissance favorise la réduction de la pauvreté à condition que les inégali-
tés de revenu soient maîtrisées. L’analyse nous conduit à affirmer également que
les mécanismes de redistribution jouent un rôle assez mineur (à quelques excep-
tions près). Par ailleurs, d’après nos résultats, l’impact de la croissance agricole
sur la réduction de la pauvreté varie en fonction du niveau de développement
du pays. Dans les pays à faible revenu l’incidence de la pauvreté a tendance à
être extrêmement sensible à la croissance du secteur agricole. Pour terminer, une
politique de croissance favorable aux pauvres doit s’appuyer sur un ensemble de
156
mesures de nature à générer une croissance économique forte et soutenue. Cela
passe nécessairement par une stabilité macro-économique, une faible inflation,
des progrès massifs en scolarisation surtout dans le secondaire.
157
Conclusion Générale
Le propos de notre thèse était de modéliser la croissance pro-pauvre. Elle
présente des apports théoriques et empiriques. Dans un premier temps, nous
nous sommes attachés à évaluer la pertinence des arguments théoriques et empi-
riques avancés par la littérature sur la croissance pro-pauvre. Depuis les travaux
fondateurs de Kuznets dans les années 50, la littérature économique a pendant
longtemps soutenu que seule la promotion de la croissance économique suffit,
à terme, pour favoriser la réduction de la pauvreté (grâce au trickle down no-
tamment). Plus récemment, les théoriciens de la croissance pro-pauvre ont remis
en cause cette vision. L’efficacité de la croissance comme vecteur de réduction
de la pauvreté dépend en partie des inégalités de revenu. C’est pour cette raison
que deux grandes approches se sont développées pour définir la croissance pro-
pauvre : l’approche relative et l’approche absolue. Selon notre avis, la distinction
entre ces deux approches est beaucoup moins claire qu’il n’y paraît. Dans la réa-
lité, l’ampleur de la réduction de la pauvreté sous l’impulsion de la croissance
dépend du niveau de départ de la distribution du revenu. De plus, l’objectif prin-
cipal n’est pas tant celui d’une réduction du taux de pauvreté que celui de la
promotion d’une distribution plus égalitaire. La préoccupation majeure est celle
qui consiste à accroître l’influence de la croissance sur la réduction de la pauvreté.
Modéliser la croissance pro-pauvre nécessite de développer des méthodes
d’estimations robustes au biais d’endogénéité et au biais de sélection. Ainsi, dans
un second temps, cette thèse propose d’étendre la réflexion sur la régression Gini
à l’économétrie des données de panels. Nous sommes d’abord revenus sur les
fondamentaux de la régression Gini : la différence moyenne du Gini, la cova-
riance au sens de Gini (co-Gini), la corrélation au sens de Gini (G-corrélation),
le Gini généralisé et l’analyse au sens de Gini (l’ANOGini). Ensuite, nous avons
montré qu’il était possible de décomposer la variabilité totale au sens de Gini en
variabilité intragroupe et en intergroupe sans l’indice de chevauchement. Ainsi,
nous avons pu définir les estimateurs intragroupes et intergroupes dans le cadre
du Gini. Comme tout estimateur basé sur le Gini, nos estimateurs sont des U-
statistiques et donc convergents vers la loi normale. Les Tables 2.3, 2.4 et 2.5 illus-
trent de façon concrète la pertinence de nos estimateurs intragroupes et inter-
groupes au sens de Gini en présence de points aberrants. En outre, nos nouveaux
estimateurs sont moins sensibles que les méthodes standards aux erreurs de me-
158
sure et aux formes fonctionnelles choisies. Cette dernière propriété est particu-
lièrement importante dans l’étude de la croissance pro-pauvre. D’ailleurs, plu-
sieurs travaux sont revenus sur les conséquences des choix de spécification et de
la méthode d’estimation. Nous avons également proposé un test de l’existence
des effets individuels.
Une autre contribution théorique de cette thèse réside dans l’introduction de
nouvelles conditions afin de garantir "bon comportement" de la matrice des mo-
ments. Dans la littérature sur la régression Gini aucune hypothèse particulière n’a
été posée sur cette matrice alors que nous savons, qu’à l’évidence, certaines condi-
tions sont nécessaires. En effet, nous avons montré que lorsque les régresseurs
sont comonotones il devient impossible d’appliquer la régression Gini puisque
la matrice des moments n’est plus inversible. Nous avons également montré que
l’absence de comonotonie implique l’hypothèse de rang plein et que la seconde
condition de Grenander n’était pas indispensable dans le cas de la régression
Gini. Ainsi, contrairement aux MCO qui imposent trois conditions (conditions
de Grenander) pour garantir le bon comportant de la matrice des moments, la
régression Gini n’impose que deux conditions.
Par ailleurs, d’après les travaux de Shelef (2014), le test de Dickey et Fuller
fournit de faible puissance lorsque les données sont contaminées par des valeurs
aberrantes. Afin de surmonter cette limite, elle propose un test basé sur le GMD.
Nous avons montré que ce dernier test donne des estimateurs robustes et va-
lides pour une large gamme de distributions. Toutefois, nos simulations montrent
aussi que ce test Shelef (2014) a une faible puissance lorsque l’hypothèse d’ab-
sence d’autocorrélation des erreurs n’est plus satisfaite. En effet, nos résultats
indiquent une diminution de la puissance de ce test au fur et à mesure que le
coefficient de corrélation augmente. Afin de tenir de cette limite, nous avons in-
troduit une extension Aïtken Gini. L’estimateur qui découlent de cette dernière
méthode nous permet d’appliquer le test de Shelef (2014) avec processus autocor-
rélé sans perte de puissance.
Une autre application de l’estimateur Aïtken Gini au modèle à effets aléatoires
a été envisagée. Pour ce dernier, un certain nombre d’extensions pourraient être
nécessaires. Il existe plusieurs possibilités pour estimer la matrice de variance co-
variance de l’erreur. Yithzaki nous suggère d’utiliser la matrice de Gini−Cog pour
l’estimer. Dans cette thèse, nous avons privilégié cette dernière méthode. Toute-
159
fois, nous reconnaissons que d’autres options (Swamy and Arora, 1972; Ame-
miya, 1971, par exemple) pourraient être envisagées. IL serait ainsi important
d’analyser, par des simulations par exemple, l’impact du choix d’une méthode
particulière sur les estimations obtenues.
Enfin, cette thèse présente des applications empiriques qui illustrent les li-
mites des indices de croissance pro-pauvre et l’avantage de nos estimateurs ba-
sés sur le Gini. A l’issue d’une étude comparative des indices de croissance pro-
pauvre, nous avons montré que les mesures traditionnelles de croissance pro-
pauvre peuvent conduire à des résultats contradictoires. Ensuite, il montre que le
processus de croissance favorise la réduction de la pauvreté à condition que les
inégalités de revenu soient maîtrisées. L’analyse nous conduit à affirmer égale-
ment que l’impact de la croissance agricole sur la réduction de la pauvreté varie
en fonction du niveau de développement du pays. Dans les pays à faible revenu
l’incidence de la pauvreté a tendance à être extrêmement sensible à la croissance
du secteur agricole. Pour terminer, les pouvoir publics qui cherchent à accroître
la croissance du revenu des plus pauvres doivent s’appuyer sur un ensemble de
mesures de nature à générer une croissance économique forte et soutenue. Cela
passe nécessairement par une stabilité macro-économique, une faible inflation,
des progrès massifs en scolarisation surtout dans le secondaire.
160
Bibliographie
Adelman, I. and Morris, C. T. (1973). Economic growth and social equity in developing
countries. Stanford University Press.
Adelman, I., Robinson, S., et al. (1989). Income distribution and development.
Handbook of development economics, 2(949) :1003.
Aghion, P., Caroli, E., and Garcia-Penalosa, C. (1999). Inequality and economic
growth : The perspective of the new growth theories. Journal of Economic litera-
ture, 37(4) :1615–1660.
Alesina, A. and Rodrik, D. (1994). Distributive politics and economic growth. The
Quaterly Journal of Economics, 104(4) :465–490.
Anand, S. and Kanbur, S. R. (1993b). The kuznets process and the inequality-
development relationship. Journal of development economics, 40(1) :25–52.
Arellano, M. and Bond, S. (1991). Some tests of specification for panel data :
Monte carlo evidence and an application to employment equations. The review
of economic studies, 58(2) :277–297.
161
Arvesen, J. N. (1969). Jackknifing u-statistics. The Annals of Mathematical Statistics,
40(6) :2076–2100.
Atkinson, A. and Brandolini, A. (1999). Promise and pitfalls in the use of secon-
dary data-sets : A case study of oecd income inequality. Ronéo, Nuffield College.
Baltagi, B. (2008). Econometric analysis of panel data. John Wiley & Sons.
Banerjee, A. V. and Duflo, E. (2003). Inequality and growth : What can the data
say ? Journal of economic growth, 8(3) :267–299.
Barro, R. J. and Lee, J. W. (2013). A new data set of educational attainment in the
world, 1950–2010. Journal of development economics, 104 :184–198.
Becker, G., Murphy, K., and Tamura, R. (1990). Economic growth, human capital
and population growth. Journal of Political Economy, 98(5) :S12–S137.
Bhalla, S. S. (2002). Imagine there’s no country : Poverty, inequality, and growth in the
era of globalization. Peterson Institute.
162
Carcea, M. and Serfling, R. (2014). A gini autocovariance function for heavy tailed
time series modeling. Technical report, Citeseer.
Carcea, M. and Serfling, R. (2015). A gini autocovariance function for time series
modelling. Journal of Time Series Analysis, 36(6) :817–838.
Cogneau, D., Guénard, C., et al. (2002). Les inégalités et la croissance : une relation
introuvable. Document de travail DT, 3.
Deininger, K. and Squire, L. (1996). A new data set measuring income inequality.
The World Bank Economic Review, 10(3) :565–591.
Deininger, K. and Squire, L. (1998). New ways of looking at old issues : inequality
and growth. Journal of development economics, 57(2) :259–287.
163
Dollar, D. and Kraay, A. (2002). Growth is good for the poor. Journal of economic
growth, 7(3) :195–225.
Duclos, J.-Y. (2009). What is "pro-poor" ? Social choice and welfare, 32(1) :37–58.
Duclos, J.-Y. and Araar, A. (2006). Poverty and equity. Measurement, Policy and
Estimation with DAD», New York et Ottawa, Springer-IDRC-CRDI.
Duclos, J.-Y., Makdissi, P., and Araar, A. (2014). Pro-poor indirect tax reforms,
with an application to mexico. International Tax and Public Finance, 21(1) :87–
118.
Easterly, W. and Rebelo, S. (1993). Fiscal policy and economic growth. Journal of
monetary economics, 32(3) :417–458.
Fan, S., Huong, P. L., and Long, T. Q. (2004a). Government spending and poverty
reduction in vietnam.
Fan, S., Zhang, X., Rao, N., et al. (2004b). Public expenditure, growth, and poverty
reduction in rural uganda. Technical report, International Food Policy Research
Institute (IFPRI).
Foster, J., Greer, J., and Thorbecke, E. (1984). A class of decomposable poverty
measures. Econometrica : Journal of the Econometric Society, pages 761–766.
Frick, J. R., Goebel, J., Schechtman, E., Wagner, G. G., and Yitzhaki, S. (2006).
Using analysis of gini (anogi) for detecting whether two subsamples represent
the same universe the german socio-economic panel study (soep) experience.
Sociological Methods & Research, 34(4) :427–468.
164
Galbraith, J. K. (2009). Inequality, unemployment and growth : New measures
for old controversies. The Journal of Economic Inequality, 7(2) :189–206.
Ghura, D., Leite, C., and Tsangarides, C. G. (2002). Is growth enough ? Macroecono-
mic policy and poverty reduction, volume 2. International Monetary Fund.
Grosse, M., Harttgen, K., and Klasen, S. (2008). Measuring pro-poor growth in
non-income dimensions. World Development, 36(6) :1021–1047.
Günther, I., Marouani, M. A., Raffinot, M., et al. (2006). La croissance est-elle
propauvres au mali. Notes et documents.
Hsiao, C. (2003). Analysis of panel data (vol. 34). Econometric Society Monographs.
Jha, S. and Srinivasan, P. (2001). Taking the pds to the poor : Directions for further
reform. Economic and Political Weekly, pages 3779–3786.
165
Ka, N. and Mussard, S. (2015). Book review of the gini methodology : A primer
on a statistical methodology. The Journal of Economic Inequality, 13(2) :321–324.
Ka, N. and Mussard, S. (2016). l1 regressions : Gini estimators for fixed effects
panel data. Journal of Applied Statistics, 43(8) :1436–1446.
Kakwani, N., Khandker, S., and Son, H. (2002). Poverty equivalent growth rate :
with applications to korea and thailand. economic commission for africa. Tech-
nical report, mimeo.
Kakwani, N., Khandker, S., and Son, H. (2003). Poverty equivalent growth rate :
with applications to korea and thailand. economic commission for africa. Tech-
nical report, mimeo.
Kakwani, N., Khandker, S., and Son, H. (2004). Pro-poor growth : concepts and
measurement with country case studies. brasília : International poverty centre.
Technical report, PNUD, 2004 (Working Paper, n. 1).
Kakwani, N., Pernia, E. M., et al. (2000). What is pro-poor growth ? Asian develop-
ment review, 18(1) :1–16.
Kakwani, N. and Son, H. (2002). Pro-poor growth and poverty reduction : the
asian experience. The Poverty Center, Office of Executive Secretary, ESCAP, Bang-
kok.
Klasen, S. (2004). In search of the holy grail : how to achieve pro-poor growth ?
Toward pro poor policies-aid, institutions, and globalization, pages 63–94.
166
Klasen, S. (2005). Economic growth and poverty reduction : measurement and
policy issues.
Kuznets, S. (1955). Economic growth and income inequality. The American econo-
mic review, 45(1) :1–28.
Lecaillon, J., Paukert, F., Morrisson, C., and Germidis, D. (1984). Income distribu-
tion and economic development ; an analytical survey.
Li, H., Squire, L., and Zou, H.-f. (1998). Explaining international and intertempo-
ral variations in income inequality. The Economic Journal, 108(446) :26–43.
167
Mazumdar, D. and Son, H. H. (2002). Vulnerable groups and the labor market in
thailand : impact of the asian financial crisis in the light of thailand’s growth
process. Toronto : University of Toronto, April.
Mellor, J. W. (2000). Faster more equitable growth : The relation between growth in agri-
culture and poverty reduction. Harvard Institute for International Development.
Mussard, S. and Richard, P. (2012). Linking yitzhaki’s and dagum’s gini decom-
positions. Applied Economics, 44(23) :2997–3010.
Perotti, R. (1992). Income distribution, politics, and growth. The American Econo-
mic Review, 82(2) :311–316.
168
Perotti, R. (1993). Political equilibrium, income distribution, and growth. The
Review of Economic Studies, 60(4) :755–776.
Perotti, R. (1996). Growth, income distribution, and democracy : what the data
say. Journal of Economic growth, 1(2) :149–187.
Persson, T. and Tabellini, G. (1994). Is inequality harmful for growth ? The Ameri-
can Economic Review, pages 600–621.
Ravallion, M. (2004). Pro-poor growth : A primer. World Bank policy research wor-
king paper, (3242).
Ravallion, M. and Datt, G. (1996). How important to india’s poor is the sectoral
composition of economic growth ? The World Bank Economic Review, 10(1) :1–25.
169
Schechtman, E. and Schechtman, G. (2002). On characterization of two-sample
u-statistics. Statistics & probability letters, 58(1) :53–59.
Shalit, H. and Yitzhaki, S. (1984). Mean-gini, portfolio theory, and the pricing of
risky assets. The journal of Finance, 39(5) :1449–1468.
Shelef, A. (2014). A gini-based unit root test. Computational Statistics & Data Ana-
lysis.
Stark, O., Taylor, J. E., and Yitzhaki, S. (1988). Migration, remittances and inequa-
lity : A sensitivity analysis using the extended gini index. Journal of Development
Economics, 28(3) :309–322.
Swamy, P. and Arora, S. S. (1972). The exact finite sample properties of the estima-
tors of coefficients in the error components regression models. Econometrica :
Journal of the Econometric Society, pages 261–275.
170
Tibiletti, L. and Subramanian, S. (2015). Inequality aversion and the extended gini
in the light of a two-person cake-sharing problem. Journal of Human Develop-
ment and Capabilities, 16(2) :237–244.
Verardi, V. and Wagner, J. (2011). Robust estimation of linear fixed effects panel
data models with an application to the exporter productivity premium. Jahrbü-
cher für Nationalökonomie und Statistik, 231(4) :546–557.
White, H. and Anderson, E. (2001). Growth versus distribution : does the pattern
of growth matter ? Development Policy Review, 19(3) :267–289.
Windmeijer, F. (2005). A finite sample correction for the variance of linear efficient
two-step gmm estimators. Journal of econometrics, 126(1) :25–51.
Wodon, Q., Yitzhaki, S., et al. (2003). Inequality and the accounting period. Eco-
nomics Bulletin, 4(36) :1–8.
Yitzhaki, S. (1998). More than a dozen alternative ways of spelling gini. Research
in economic inequality, 8.
171
Yitzhaki, S. and Lerman, R. I. (1991). Income stratification and income inequality.
Review of income and wealth, 37(3) :313–329.
172
Annexes
q q
L’Espérance E(X) m=1 U1 = (n1 )−1 xi = 1
n
xi
q
GMD E |xi − xj | m=2 U3 = 2
n(n−1) i<j |xi − xj |
qn
Variance 1
2
E(xi − xj )2 m=2 U2 = 1
(n−1)
( i=1 xi2 − nU21 )
qn
Cog Cov(x, F(y)) m = 2 U4 = 4(n1 ) i=1 (2i − 1 − n)xy(i)
Cov(x,Fy (y))
G-corrélation Gx,y = Cov(x,Fx (x))
m=2 U5 = U4
U3
L’indice de Gini GM D
2E(X)
m=2 U6 = U3
2U1
173
Ainsi, l’estimateur de la régression Gini peut être réécrit :
Cov(y, F(x)) 1 1 Ø M Ønm
β̂ sp = = (ymj − y.. ) (F(x) − F.. (x))
Cov(x, F(x)) Cov(x, F(x)) N m=1 j=1
1 1 Ø M Ønm
= (ymj − ym. + ym. − y.. ) (F(x))
Cov(x, F(x)) N m=1 j=1
(3.10)
En posant, pm = nm
N
, l’expression précédente devient :
I M J
1 Ø
sp
β̂ = pm Covm (y, F(x)) + CovB (ym. , Fm. (x))
Cov(x, F(x)) m=1
I M
1 Ø Covm (y, F(x)) Covm (x, F(x))
= pm Covm (x, Fm (x))
Cov(x, F(x)) m=1 Covm (x, F(x)) Covm (x, Fm (x))
+CovB (ym. , Fm. (x))} . (3.11)
Soient :
sp Covm (y, F(x))
β̂m = (3.12)
Covm (x, F(x))
l’estimateur sémi-paramétrique dans le groupe m. Et
174
M
Ø
β̂ sp = sp
Vn βm + Vb βbsp (3.14)
m=1
pm Om GM Dm (x)
Avec Vn = GM D(x)
est la part du groupe m dans la distribution totale.
La première partie 3.14 peut être interprétée comme l’intra et la seconde partie
l’inter.
La décomposition de l’estimateur des MCO est :
M
Ø
β= Wn βm + Wb βb . (3.15)
m=1
JT
Bn = IN T − Wn = IN ⊗
T
En utilisant ces deux opérateurs nous pouvons réécrire les variabilités intra et
inter :
N Ø
Ø T
Gintra
xx = (xnt − xn. )[ Rnt (x) − Rn. (x)]′ = R(x)Wn x
n=1 t=1
175
et
N Ø
Ø T
Ginter
xx = (xn. − x.. )[ Rnt (x) − R.. (x)]′ = R(x)Bn x
n=1 t=1
D’où :
C D
g 2 + T ∗ gu2
′
E(εε ) = Wn + ( w 2
gw2 )Bn (3.19)
gw
C D
2 1
= gw Wn + Bn (3.20)
φ
= gw2 Ω, (3.21)
2
gw
avec φ = 2 2
gw +T ∗gu
et gw2 + T ∗ gu2 et gw2 les valeurs propres de la matrice ΩG .
−1/2 1 1 2
ΩG =ñ Wn + φ−1/2 Bn . (3.22)
gw2
176
Par conséquent,
î ï−1 î ï
−1/2 −1/2 −1/2 −1/2
β̂ AG = R(ΩG X)ΩG X R(ΩG X)ΩG y (3.23)
; ñ <−1 ; ñ <
−1/2 −1/2
= R(ΩG X)(Wn + φBn )X R(ΩG X)(Wn + φBn )y
; ñ <−1 ; ñ <
−1/2 −1/2 −1/2 −1/2
= R(ΩG X)Wn X + φR(ΩG X)Bn X R(ΩG X)Wn y + φR(ΩG X)Bn y .
; ñ <−1 ; ñ <
β̂ AG = R(X)Wn X + φR(X)Bn X R(X)Wn y + φR(X)Bn y (3.24)
Ainsi, tout comme les MCG, l’estimateur Aïtken-Gini peut être considéré
comme une combinaison optimale des estimateurs intra et intergroupes :
è é−1 è é
βAG = Gintra
xx + θ′ Ginter
xx Gintra
xy + θ′ Ginter
xy , (3.25)
√
avec θ′ = φ.
177
3.3.4 Estimation de notre modèle sur les différents quintiles
MCO
TABLE 3.15 – Estimation de notre modèle sur les différents quintiles MCO
178
TABLE 3.16 – Estimation de notre modèle sur les différents quintiles MCO
179
TABLE 3.17 – Estimation de notre modèle sur les différents quintiles Gini
180
TABLE 3.18 – Estimation de notre modèle sur les différents quintiles Gini
181
Université de Montpellier
Faculté d’Économie
Résumé : Cette thèse contribue à l’approche économétrique de la croissance pro-pauvre. Elle présente des apports théo-
riques et empiriques. En premier lieu, elle présente les différentes définitions, indices et politiques de croissance pro-
pauvre proposées dans la littérature théorique. Elle examine également les modèles théoriques et empiriques portant sur
les interactions entre distribution du revenu et croissance. Elle montre que les mesures traditionnelles, en plus de leurs
caractères partiels, peuvent conduire à des résultats contradictoires. Pour contourner ces limites, cette thèse privilégie
l’approche alternative qui consiste à utiliser des modèles économétriques. Cette dernière approche, bien qu’elle présente
l’avantage d’inclure l’ensemble des dimensions de la pauvreté, souffre de deux types de biais : le biais de sélection et
le biais d’endogénéité. Ces derniers s’expliquent par les limitations inhérentes aux données : erreurs de mesures, points
aberrants. En outre, les résultats obtenus avec cette approche sont sensibles aux formes fonctionnelles choisies. Ainsi, il y a
de bonnes raisons d’utiliser la régression Gini. Cependant, les régressions de type Gini n’existaient qu’en coupe instanta-
née et en séries temporelles. Ainsi, dans un second temps, cette thèse propose d’étendre la réflexion sur la régression Gini
en panel. Elle introduit les estimateurs intragroupes, intergroupes, le test d’existence de l’effet individuel et l’estimateur
Aitken Gini. Enfin, cette thèse présente des applications empiriques qui illustrent de façon concrète la robustesse de nos
estimateurs. Elle s’intéresse particulièrement aux conséquences de la méthode d’estimation et à la section de l’échantillon.
Elle conclut que le processus de croissance favorise la réduction de la pauvreté à condition que les inégalités de revenu
soient maîtrisées. Mais aussi, que l’impact de la croissance agricole sur la réduction de la pauvreté varie en fonction du
Abstract : This thesis contributes to the econometric approach of pro-poor growth. It presents theoretical and em-
pirical contributions. First, it brings out the different definitions, indices and the policies of pro-poor growth proposed
in the theoretical literature. It also examines the theoretical and empirical interactions between income distribution and
growth. It shows that the traditional measures, in addition to their partial characteristics, can lead to contradictory results.
To avoid these limits this thesis lays the amphasis on the alternative approach by using econometric models. The latter
approach, although it has the advantage of including all the dimensions of poverty, suffers from two types of bias : selec-
tion bias and bias of endogeneity. These are due to the limitations of the data : measurement errors, outliers. In addition,
the results obtained with this approach are sensitive to the selected functional forms. So, there are good reasons to use
the Gini regression. However, the Gini regressions existed only for cross sectional data and time series. Thus, in a second
time, this thesis proposes to extend the Gini regression for panel data. It introduces within and between-group estimators,
the individual effect test and the Gini Aitken estimator. Finally, this thesis presents empirical applications that illustrate
the robustness of our estimators. It is particularly interested in the consequences of the estimation method and the sample
section. It concludes that the growth process promotes poverty reduction when income inequalities are overcome. But
also, the impact of agricultural growth on poverty reduction varies depending on the country’s level of development.