Cours Double Différence
Cours Double Différence
différence
Introduction aux méthodes d’évaluation d’impact
des politiques publiques
Philippe De Vreyer
1
Quand va-t-on employer cette
méthode ?
2
Conditions d’emploi de la méthode
• Quand on suspecte la présence de caractères inobservés des individus
qui expliquent à la fois la participation au programme et la valeur prise
par la variable d’intérêt (indépendamment de la participation). On
parle d’hétérogénéité inobservée.
3
Exemple: traitement destiné à favoriser la
croissance des enfants
1ère méthode: comparaison après le traitement entre enfants
traités et enfants non traités Traité Non traité
4
Exemple: traitement destiné à favoriser la
croissance des enfants
2ème méthode: comparaison des enfants traités
avant et après le traitement Après traitement
Avant traitement
5
Exemple: traitement destiné à favoriser la
croissance des enfants
• Les deux méthodes conduisent à des conclusions opposées:
• La comparaison des enfants traités avec les enfants non traités après le
traitement néglige la possibilité que des différences existent entre enfants en
l’absence du traitement
• La bonne solution est de marier les deux méthodes: c’est ce que fait la double
différence.
6
Exemple: traitement destiné à favoriser la
croissance des enfants
Non traité
Traité
7
Exemple: traitement destiné à favoriser la
croissance des enfants
Non traité
Traité
Effet du
traitement
8
Théorie
9
Hypothèse principale
10
Formalisation
• Deux dates d’observation: 0 et 1.
• En t=0 le programme n'existe pas.
• En t=1 le programme est en place et a produit ses effets.
• On note 𝑌𝑖𝑡 (0) la valeur de la variable d'intérêt pour l’individu i s’il
n’est pas traité à la date t et 𝑌𝑖𝑡 (1) la valeur si cet individu est traité.
• L'estimateur de la double différence s'écrit:
11
E(Yi1(0)|Ti=0)
E(Yi1(0)|Ti=1)
Traités
E(Yi0(0)|Ti=0)
0 1 Temps
Mise en place du programme
13
Traités à la date 0 : E(Yi0(1)|Ti=1), non traités à la date 0:E(Yi0(0)|Ti=0)
Traités à la date 1 : E(Yi1(1)|Ti=1), non traités à la date 1:E(Y1(0)|Ti=0)
Traités à la date 1, s'ils n'avaient pas été traités : E(Yi1(0)|Ti=1)
Impact du programme : E(Yi1(1)|Ti=1) – E(Yi1(0)|Ti=1)
Estimateur de l’impact: DD = E(Yi1(1)|Ti=1) – E(Yi1(0)|Ti=0) – (E(Yi1(0)|Ti=1) – E(Yi1(0)|Ti=0))
Sous l'hypothèse de trends parallèles ceci s'écrit :
DD = E(Yi1(1)|Ti=1 )– E(Yi1(0)|Ti=0) – (E(Yi0(1)|Ti=1) – E(Yi0(0)|Ti=0)) 14
Mise en œuvre pratique
15
Méthode 1: Emploi des moyennes calculées sur les échantillons
des individus traités et non traités aux deux dates d’observation.
Méthode 2: Emploi d’une régression linéaire. Le modèle à estimer
est alors de la forme:
𝑌𝑖𝑡 = 𝛼 + 𝛽. 𝑇𝑖 . 𝑡 + 𝛾. 𝑡 + 𝜌. 𝑇𝑖 + 𝜀𝑖𝑡
16
Y Non traités
Traités
𝝆 = 𝝁𝑻 − 𝝁𝑪
μC
μT
0 1 Temps
Mise en place du
programme
Traités (en l’absence du programme)
𝒀𝒊𝒕 = 𝜶 + 𝜷. 𝑻𝒊 . 𝒕 + 𝜸. 𝒕 + 𝝆. 𝑻𝒊 + 𝜺𝒊𝒕 17
Il est facile de montrer que les estimations des coefficients de cette
régression conduisent au résultat attendu:
𝑌𝑖𝑡 = 𝛼 + 𝛽. 𝑇𝑖 . 𝑡 + 𝛾. 𝑡 + 𝜌. 𝑇𝑖 + 𝜀𝑖𝑡
= [𝛼 + 𝛽 ∗ 1 ∗ 1 + 𝛾 ∗ 1 + 𝜌 ∗ 1 − 𝛼 − 𝛽 ∗ 1 ∗ 0 − 𝛾 ∗ 0 − 𝜌 ∗ 1]
− 𝛼+𝛽∗0∗1+𝛾∗1+𝜌∗0−𝛼−𝛽∗0∗0−𝛾∗0−𝜌∗0
= [𝛼 + 𝛽 + 𝛾 + 𝜌 − 𝛼 − 𝜌] − 𝛼 + 𝛾 − 𝛼
= [𝛽 + 𝛾] − 𝛾
=β
18
𝑌𝑖𝑡 = 𝛼 + 𝛽. 𝑇𝑖 . 𝑡 + 𝛾. 𝑡 + 𝜌. 𝑇𝑖 + 𝜀𝑖𝑡
𝜌 = biais = différence fixe entre les valeurs moyennes de Y pour les groupes
traités et non traités en l’absence de tout traitement.
19
𝑌𝑖𝑡 = 𝛼 + 𝛽. 𝑇𝑖 . 𝑡 + 𝛾. 𝑡 + 𝜌. 𝑇𝑖 + 𝜀𝑖𝑡
20
Limites
21
Validité de l’hypothèse des trends parallèles ?
22
Evaluation d'un programme ciblé sur certaines régions dont
l’objectif est de favoriser la croissance des revenus de leurs
habitants.
23
Ces régions, comparées à d'autres n'ayant pas connu le choc,
peuvent alors connaître un processus de rattrapage, qui va entraîner
une hausse de leurs revenus plus importante et indépendante de
leur participation au programme.
24
Y
Non traités
Traités
Biais si le processus de
rattrapage est ignoré
Véritable évolution
des traités en
l'absence du
programme
0 1 Temps
Mise en place du
programme 25
Ici l’effet du programme est surestimé
Ainsi, l'emploi de l'estimateur DD ne dispense pas de s'assurer que
les échantillons test et de contrôle présentent des caractéristiques
identiques avant l'application du traitement.
26
Comment faire mieux ?
27
Combiner Matching et Double Différence
pour réduire les sources de biais
• L’idée est d’employer la méthode du score de propension pour
renforcer la comparabilité des échantillons test et de contrôle avant
d’appliquer la double différence.
• On dispose d’au moins deux années d’observation.
• Sur l’année de base, on emploie la méthode du score de propension
pour apparier les traités avec les non traités qui ont un score de
propension proche.
• Ensuite on applique la méthode DD en calculant la différence de
variation moyenne de la variable d'intérêt entre l'échantillon des
traités et celui des individus qui leurs sont appariés.
28
L’estimateur de l’impact du programme a alors pour expression:
Traité Non traité
𝑁𝑇
1
𝐷𝐷𝑃𝑆𝑀 = 𝑌𝑖1 1 − 𝑌𝑖0 1 − 𝜔𝑗 . 𝑌𝑖1 0 − 𝑌𝑖0 0
𝑁𝑇
𝑖=1 𝑗∈𝑀(𝑖)
29
L'estimateur de la triple différence
Supposons que l’on dispose de plus d'un groupe de contrôle.
Deux possibilités:
On peut les utiliser successivement pour vérifier que l'on obtient le même
résultat quelque soit le groupe de contrôle utilisé.
30
Exemple
Evaluation d'un programme destiné à réinsérer les chômeurs âgés de plus de 50
ans
31
Des estimations porteuses de biais spécifiques:
33
𝑉,𝑇 𝑉,𝑇 𝐽,𝑇 𝐽,𝑇
𝐷𝐷𝐷 = 𝐸 𝑌𝑖1 1 − 𝑌𝑖0 1 −𝐸 𝑌𝑖1 0 − 𝑌𝑖0 0
𝑉,𝐶 𝑉,𝐶 𝐽,𝐶 𝐽,𝐶
− 𝐸 𝑌𝑖1 0 − 𝑌𝑖0 0 −𝐸 𝑌𝑖1 0 − 𝑌𝑖0 0
35
𝑉,𝑇 𝑉,𝑇 𝑉,𝐶 𝑉,𝐶
𝐷𝐷𝐷 = 𝐸 𝑌𝑖1 1 − 𝑌𝑖0 1 −𝐸 𝑌𝑖1 0 − 𝑌𝑖0 0
𝐽,𝑇 𝐽,𝑇 𝐽,𝐶 𝐽,𝐶
− 𝐸 𝑌𝑖1 0 − 𝑌𝑖0 0 −𝐸 𝑌𝑖1 0 − 𝑌𝑖0
0
Dans cette écriture, les deux premiers termes correspondent
maintenant à l'estimateur de la double différence lorsque le
groupe de chômeurs de plus de 50 ans habitant l'autre
région est pris comme groupe de contrôle.
Il est possible que cette région groupe connaisse une
dynamique différente de celle de la région traitée. Sous
l'hypothèse que cette différence de dynamique est identique
pour les jeunes chômeurs, on peut utiliser les données
observées sur le groupe des moins de 50 ans pour évaluer
cette différence et la retirer : c'est le rôle des deux derniers
termes de l'équation.
36