La méthode
d’appariement/ Matching
Réalisé par :
Encadré par :
FILALI Aya
Pr. Baguare Abdelilah
EL OTHEMANI
Wiam
Introduction
Les essais contrôlés randomisés (ECR) sont souvent la
référence pour évaluer les interventions, mais leur mise en
œuvre peut être limitée par des contraintes éthiques,
financières et pratiques. Les méthodes quasi-
expérimentales, comme le matching, émergent alors comme
des alternatives.
Le matching consiste à apparier des participants traités et non
traités sur des caractéristiques similaires pour réduire les
biais de sélection.
Problématique : De quelle manière le matching peut-il
servir à mesurer l'impact des programmes
d'intervention ?
Plan
Concepts clés du
01 Matching 02 Méthodologie d’estimation
03 Techniques d'Appariement 04 Application Pratique
Définition du Matching
● Construire un groupe de comparaison qui ressemble le plus possible au groupe de
traitement
● Associer chaque participant au programme à un ou plusieurs non-participants, en
fonction de caractéristiques observables
RCT VS Matching
● RCT: estime un contrefactuelle moyenne pour tous le groupe de traitement au
complet aléatoirement.
● Matching: l’estimation de contrefactuelle se fait individu par individu
Le problème de dimensionnalité
Si la liste des caractéristiques observées pertinentes est très longue, ou si chaque caractéristique prend de
nombreuses valeurs, il peut être difficile d'identifier une correspondance pour chacune des unités du groupe de
traitement.
vous pouvez tomber dans le problème de la « dimensionnalité »
Rosenbaum et Rubin (1983) proposent une stratégie d’estimation équivalente et réalisable basée sur le
concept de score de propension
Score de propension
Le PSM construit un groupe de comparaison statistique basé sur un modèle de probabilité de participation au
traitement T conditionné aux caractéristiques observées X, ou le score de propension :
P(X) = Pr(T = 1|X).
Ce score est une valeur comprise entre 0 et 1 qui synthétise l'ensemble des caractéristiques observées
influençant la participation d'une unité au programme.
Assumptions
Le score de propension s’appuie sur deux hypothèses
fondamentales :
(1) l’hypothèse d’indépendance
conditionnelle (conditional independance assumption –
CIA):stipule que, étant donné un ensemble de covariables
observables X qui ne sont pas affectées par le traitement, les
résultats potentiels Y sont indépendants de l'assignation au
traitement T
(2) l’hypothèse de la condition de support
commun (overlap): Le support commun est la zone de
superposition des deux groupes sur l’ensemble des valeurs du
score de propension (Heckman, LaLonde, & Smith, 1999)
L’estimation du score de propension
Identification des variables influençant Estimation du score via régression logistique:
01 02
Un bon score de propension est un outil
l’affectation au traitement: il est nécessaire
d’équilibrage : il doit permettre d’équilibrer la
d’introduire toutes les variables qui ont un
distribution des variables choisies dans les deux
impact significatif à la fois sur les groupes
probabilités d’appartenir au groupe traité et
sur les variables de résultat
03 Détermination de la zone de support
Evaluation de la qualité du score: 04
commun: la zone de superposition des deux
Utilisation des tests statistiques ou bien les
groupes sur l’ensemble des valeurs du score de
différences standardisées pour mesurer
propension
l'équilibrage
Les méthodes d’appariement sur score de
propension
Une fois les scores de propension calculés, les individus du groupe de traitement sont appariés
avec ceux du groupe de contrôle ayant des scores similaires. Cela peut se faire par différentes
méthodes, telles que :
Appariement par stratification: les scores de propension sont classés par intervalles, et les
individus traités et non traités sont ensuite appariés au sein de strates.
Nearest neighbour matching : ou bien le voisinage le plus proche pour associer les individus.
Caliper matching: Elle fixe un seuil de tolérance pour les différences de scores de
propension, permettant de jumeler uniquement les individus dont les scores sont proches. Si
un individu traité ne trouve pas de correspondance dans cette plage, il est exclu de l'analyse
Évaluation des effets d’un traitement par
la méthode de matching
Différence de moyennes (Effet Moyen du Traitement sur les Traités - ATT)
est calculé en comparant les résultats moyens (comme le revenu, la santé,
l'éducation) des individus traités et non traités appariés. Formellement, cela se
traduit par :
Avantages Limites
•Réduction des biais de sélection
•Besoin de grandes bases de données
• Flexibilité
•Hypothèse audacieuse
•Estimation robuste
•Problèmes avec les données a posteriori
•Sélection ciblée des participants
•Utilité limitée sans données de base
•Évitement des dilemmes éthiques
Exemple de Matching par Score de Propension
•Contexte
•Variables observées : Âge, Niveau d'éducation, Expérience professionnelle.
•Étape 1 : Estimation des Scores de Propension
Le score de propension est la probabilité qu’un individu participe au programme en fonction de ses
caractéristiques.
Exemple des scores de propension estimés
ID Âge Niveau Expérience Salaire Score de
d’éducation pro propension
1 25 Bac+2 2 7500 MAD 0,70
2 30 Bac+5 5 8500 MAD 0,80
3 22 Bac 1 7000 MAD 0,60
101 24 Bac+1 2 7200 MAD 0,68
102 31 Bac+4 6 8000 MAD 0,78
103 23 Bac 1 6800 MAD 0,62
Étape 2 : Apparier les Individus
Appariement des individus du groupe traité avec ceux du groupe de contrôle ayant des scores de propension similaires.
•Individu 1 (traité) : Score 0.70 → Individu 101 (contrôle) : Score 0.68
•Individu 2 (traité) : Score 0.80 → Individu 102 (contrôle) : Score 0.78
•Individu 3 (traité) : Score 0.60 → Individu 103 (contrôle) : Score 0.62
Étape 3 : Calcul des Différences de Résultats
Comparaison des salaires après la formation :
ID Salaire traité Salaire contrôle Différence
1 7500 MAD 7200 MAD 300
2 8500 MAD 8000 MAD 500
3 7000 MAD 6800 MAD 200
Étape 4 :Calcul de l’ATT
L'ATT est la moyenne des différences de salaire des individus traités par rapport à leurs contreparties
appariées dans le groupe de contrôle :
Conclusio
n
Le matching par score de propension permet d’estimer efficacement les effets
d’un traitement en créant des groupes comparables à partir de caractéristiques
observables. Il offre une alternative précieuse aux essais contrôlés randomisés,
bien qu'il dépende de la qualité des données et du respect de certaines
hypothèses. Par ailleurs, d'autres méthodes quasi-expérimentales, comme la
régression autour d'une discontinuité, peuvent également être utilisées pour
évaluer les impacts des programmes tout en répondant à des problématiques
spécifiques liées à la structure des données ou aux critères d'éligibilité.
Bibliographical references
• Handbook on Impact Evaluation , R. Khandker, B. Koolwal, A.
Samad . (2010/ The World Bank.
• Le score de propension : un guide méthodologique pour les
recherches expérimentales et quasi expérimentales en
éducation, A. Lecocq, M. Ammi, E. Bellarbre. (2014).
Mesure et évaluation en éducation
• L’évaluation d’impact en pratique, Paul J. Gertler, Sebastian
Martinez, Patrick Premand, Laura B. Rawlings, Christel M. J.
Vermeersch. (2011). The World Bank
• Some Practical Guidance for the Implementation of Propensity
Score Matching, [Link], [Link]. (2005). IZA Discussion
Paper