0% ont trouvé ce document utile (0 vote)
61 vues105 pages

T Manuel de Sondage

Le projet MEASURE DHS, financé par l'USAID et mis en œuvre par ICF, vise à améliorer la collecte et l'analyse de données démographiques et de santé à l'échelle internationale. Le manuel d'échantillonnage présente des lignes directrices pour assurer la qualité et la comparabilité des enquêtes, en insistant sur l'utilisation d'une base de sondage existante, une couverture complète et une méthodologie d'échantillonnage probabiliste. Les objectifs incluent également le renforcement des capacités institutionnelles et l'amélioration de la diffusion des données.

Transféré par

ghizlane
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
61 vues105 pages

T Manuel de Sondage

Le projet MEASURE DHS, financé par l'USAID et mis en œuvre par ICF, vise à améliorer la collecte et l'analyse de données démographiques et de santé à l'échelle internationale. Le manuel d'échantillonnage présente des lignes directrices pour assurer la qualité et la comparabilité des enquêtes, en insistant sur l'utilisation d'une base de sondage existante, une couverture complète et une méthodologie d'échantillonnage probabiliste. Les objectifs incluent également le renforcement des capacités institutionnelles et l'amélioration de la diffusion des données.

Transféré par

ghizlane
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Enquêtes Démographiques et de Santés

__________________________________

Manuel d’Echantillonnage et de
Dénombrement de Ménages

__________________________________

ICF
Rockville, Maryland USA
Le projet MEASURE DHS est un projet quinquennal visant à aider les institutions à collecter et à
analyser les données nécessaires à la planification, au suivi et à l'évaluation de programmes relatifs
à la population, à la santé et à la nutrition. Le projet MEASURE DHS est financé par l'Agence
Américaine pour le Développement International (USAID). Le projet est mis en œuvre par ICF à
Rockville (Maryland) en partenariat avec l’École Bloomberg de Santé Publique/Centre pour les
Programmes de Communication, le Programme pour une Technologie Appropriée en Santé (PATH),
l’Institute Futures, le Camris International et le Blue Raster.

Les principaux objectifs du programme MEASURE DHS sont: 1) Fournir des informations améliorées
par des méthodes appropriées dans la collecte, l'analyse et l'évaluation de données; 2) améliorer la
coordination et les partenariats en matière de collecte de données aux niveaux internationaux et
nationaux; 3) renforcer la capacités institutionnelle a sur la collecte de données dans les pays
participant du projet ; 4) améliorer les outils et les méthodologies de collecte et analyse des données;
et 5) améliorer la diffusion et l'utilisation des données EDS.

Pour plus d'informations sur le programme de l’Enquêtes Démographiques et de Santé (EDS), écrivez
à EDS, ICF International, 11785 Beltsville Drive, Suite 300, Calverton, MD 20705, USA (téléphone:
301-572-0200; fax: 301-572-0999; e-mail: info@[Link]; Internet:
[Link]

Citation recommendée
ICF International. 2012. Demographic and Health Survey Sampling and Household Listing Manual.
MEASURE EDS, Calverton, Maryland, U.S.A.: ICF International
CONTENU
TABLEAUX DE MATIERES ..................................................................................................... vi

1 POLITIQUE D’ÉCHANTILLONNAGE DE l’EDS ............................................................... 1

1.1 Principes généraux ............................................................................................. 1

1.1.1 Base de sondage existante....................................................................... 1

1.1.2 Couverture complète ............................................................................... 1

1.1.3 Échantillonnage probabiliste .................................................................... 1

1.1.4 Taille aproprièe de l’échantillon ................................................................ 2

1.1.5 Conception simple ................................................................................. 2

1.1.6 Dénombrement de ménages et présélection de ménages ............................. 2

1.1.7 Bonne documentation ............................................................................. 2


1.1.8 Confidentialité ........................................................................................ 3

1.1.9 Mis en œuvre exact de l’enquête ............................................................. 3

1.2 Objectif de l’enquête et la population cible ............................................................ 3

1.3 Domain d’étude ................................................................................................ 4

1.4 Base de sondage ............................................................................................... 4

1.4.1 Base de sondage tarditionnelle ................................................................ 5

1.4.2 Base de sondage alternative ................................................................... 5

1.4.3 Evaluation de la base de sondage ............................................................ 6

1.5 Stratification ..................................................................................................... 7

1.6 Taille de l’échantillon .......................................................................................... 7

1.6.1 Taille de l’échantillon et les erreurs d’échantillannage .................................. 7

1.6.2 Détermination de la taille de l’échantillon ..................................................10

1.7 Allocation de l’échantillon...................................................................................12

1.8 Tirage de l’échantillon par grappe et à plusieurs degrés ............ Error! Bookmark not
defined.

1.9 Taille de l’échantillon secondaire par grappe ............. Error! Bookmark not defined.

1.9.1 Taille optimale de l’échantillon secondaire ...... Error! Bookmark not defined.

1.9.2 Taille variante de l’échantillon secondaire pour auto-ponédéré ............. Error!


Bookmark not defined.

1.10 Dénombrement de ménages ................................... Error! Bookmark not defined.

1.11 Tirage de ménages au bureau central ....................... Error! Bookmark not defined.

1.12 Enquête auprès des ménages ................................. Error! Bookmark not defined.

1.13 Calcul du poids de sondage ................................. .. Error! Bookmark not defined.


1.13.1 Pourquoi devons-nous pondérer les données issues d’une enquête par sondage
................................................................ Error! Bookmark not defined.

iii
1.13.2 Poids de conception et poids de sondage .... .. Error! Bookmark not defined.

1.13.3 Comment calculer les poids de conception ..... Error! Bookmark not defined.

1.13.4 Correction de nonréponse et calcul du poids de sondage ..... Error! Bookmark


not defined.

1.13.5 Normalisation des poids de sondage ............. Error! Bookmark not defined.

1.13.6 Poids standards pour le test du VIH .............. Error! Bookmark not defined.

1.13.7 Dé-normalisation des poids standards pour des données fusionnées ....... Error!
Bookmark not defined.

1.14 Calage sur marges .................................................. Error! Bookmark not defined.


1.15 Rapport sur la qualité des données et les erreurs de sondage ... Error! Bookmark not
defined.

1.16 Documentation de l’échantillon ............................... Error! Bookmark not defined.


1.17 Confidentialité ...................................................... Error! Bookmark not defined.
2 DÉNOMBREMENT DE MÉNAGES .......................................... Error! Bookmark not defined.

2.1 Introduction .......................................................... Error! Bookmark not defined.

2.2 Définition de termes ............................................... Error! Bookmark not defined.

2.3 Responsabilités du personnel de dénombrement ...... Error! Bookmark not defined.


2.4 Localisation de la grappe ....................................... Error! Bookmark not defined.
2.5 Préparer un plan de situation et un croquis détaillé pour chaque grappe ............ Error!
Bookmark not defined.

2.6 Relever les coordonnées GPS d’un point central pour chaque grappe Error! Bookmark
not defined.

2.7 Dénombrer les ménages ....................................... Error! Bookmark not defined.

2.8 Segmentation de grandes grappes .....................................................................39


2.9 Contrôle de qualité............................................................................................40
2.10 Préparer les feuilles de tirage de ménages ...........................................................40
Annexe 2.1 Exemples fichies de cartographie ...............................................................41

Annexe 2.2 Consignes standards utilisés dans les dénombrements ....................................46


Annexe 2.3 Exemples fichies remplies ....................................................................................... 48

3 PROCEDURE DE TIRAGE SÉLECTIONNÉES .............................................................. 52

3.1 Tirage aléatoire simple ......................................................................................52


3.2 Tirage systématique avec probabilité égale ..........................................................53
3.2.1 Théorie de tirage ..................................................................................53
3.2.2 Description opérationnelle et des exemples .............................................56

3.3 Tirage à probabilité proportionnelle à la taille ......................................................62

3.3.1 Théorie de tirage ...................................................................................62


3.3.2 Description opérationnelle et exemples ....................................................63

iv
3.4 Tirage complexes .............................................................................................68
4 ERREURS DANS UNE ENQUÊTE PAR SONDAGE ......................................................... 71

4.1 Erreurs de couverture et de nonréponse ..............................................................71


4.1.1 Erreurs de couverture ................................. Error! Bookmark not defined.

4.1.2 Non couverture selective ........................................................................72


4.1.3 Nonrésponse .........................................................................................73

4.1.4 Taux de réponses ..................................................................................74


4.2 Erreurs du à l'échantillonnage ............................................................................76
5 DOCUMENTATION DE l’ÉCHANTILLON ..................................................................... 78

5.1 Introduction .....................................................................................................78

5.2 Plan de sondage ..............................................................................................79

5.2.1 Introduction ..........................................................................................79

5.2.2 Base de sondage ..................................................................................79

5.2.3 Structure de l’échantillon et procédure de tirage ........................................81


5.2.4 Probabilité d’ inclusion et poids de sondage ............................................83
5.3 Fichier de l’échantillon .......................................................................................85
5.4 Résultats de mis en œuvre..................................................................................86
5.5 Erreurs du à l’échantillonnage ............................................................................88
5.6 Paramètres de sondage dans les fichiers de données EDS ......................................90
Glossaire ........................................................................................ Error! Bookmark not defined.

Références .......................................................................................................................... 97

v
TABLEAUX ET CHIFFRES
Tableau 1.1 Détermination de la taille de l’échantillon pour estimer l’utilisation fréquente d’une
méthode contraceptive chez les femmes mariées .......................................................10
Tableau 1.2Détermination de la taille de l'échantillon pour estimer la fréquence de la couverture totale
de vaccination chez les enfants âgés de 12 à 23 mois……………………………….. 11

Tableau 1.3 Sample allocation: Proportional allocation..................................................................14

Tableau 1.4 Sample allocation: Power allocation ..........................................................................14

Tableau 1.5 Optimal sample prit for currently married women 15-49 currently using any
contraceptive method based on intragrappe correlation  and survey cost ratio c1 / c 2
from past surveys ..................................................................................................17

Tableau 5.1 Distribution of EAs and average siZD of EA by region and by type of residence ..............80

Tableau 5.2 Distribution of households by region and by type of residence......................................81

Tableau 5.3 Sample allocation of grappes and households by region and by type of residence ...........83

Tableau 5.4 Expected number of interviews by region and by type of residence ...............................83

Tableau 5.5 An example sample file ...........................................................................................85

Tableau 5.6 Example table for the results of survey implementation ..............................................86

Tableau 5.7 Example appendix table for the results of the women’s survey implementation ..............87

Tableau 5.8 Example appendix table for the results of the men’s survey implementation ..................88
Tableau 5.9 Example table for sampling errors ............................................................................89

Figureau 3.1 Simple household selection with a sub-sample .........................................................57

Figureau 3.2 Sélection of runs with a sub-sample........................................................................57

Figureau 3.3 Simple self-weighting selection without sample siZD control ......................................58

Figureau 3.4 Self-weighting selection with runs and without sample siZD control ............................58

Figureau 3.5 Self-weighting selection with sample siZD control .....................................................59

Figureau 3.6 Self-weighting selection with runs and with sample siZD control.................................60

Figureau 3.7 Manual household selection in the field ...................................................................61


Figureau 3.8Part of an Excel template for stratified sampling ........................................................65

Figureau 3.9 Part of an example for a province crossed urban-rural stratified PPS sampling .............67

vi
Figureau 3.10 Part of an example sample file from a stratified PPS sampling ..................................68

vii
1 POLITIQUE D’ÉCHANTILLONAGE DE L’EDS
1.1 Principes Généraux
Les enquêtes scientifiques par sondage sont des moyens rentables et fiables pour recueillir des
informations auprès de population de grande échelle telles que les données sociales, démographiques
et de santé. Le projet MEASURE DHS est un projet international implanté dans plusieurs pays et en
multiples reprises au même pays. Afin d'assurer la comparabilité, la cohérence et la meilleure
qualité dans les résultats d'enquête, les activités de l’Enquête Démographique et de santé (EDS)
devraient être guidés par un certain nombre de principes généraux. Ce manuel présente des lignes
directrices générales de l’échantillonnage pour les enquêtes démographiques et de santé ; certaines
modifications peuvent être nécessaires dans des situations spécifiques à chaque pays. Les principes clés
de l’échantillonnage de l’EDS comprennent:

• Base de sondage existante


• Couverture complète
• Échantillon probabiliste
• Taille de l’échantillon appropriée
• Une conception simple
• Dénombrement de ménages et présélection des ménages à enquêter
• Bonne documentation
• Confidentialité sur des informations d’identification personnelle
• Mise en œuvre exacte

1.1.1 Base de sondage existante


On ne peut tirer un échantillon probabiliste qu’à partir d’une base de sondage existante : une
base de sondage est une liste complète des unités statistiques qui couvrent la population cible. Comme
la création d’une nouvelle base peut s’avérer trop cher, les enquêtes EDS devraient utiliser une base de
sondage adéquate, préexistant et officiellement reconnue. Ceci est possible pour la plupart des pays où
un recensement général de la population a été fait récemment. Une base issue d’un recensement récent
est en général la meilleure base pour des enquêtes auprès des ménages en termes de couverture, accès,
les matériels cartographiques et l’organisation. Cependant, une évaluation de la qualité et de
l'accessibilité de la base doit être considérée lors de la conception de l'enquête, et une étude détaillée
de la base est nécessaire avant de tirer l'échantillonnage. Au cas où le base de recensement n’existait
pas, l’enquête EDS peut utiliser une base alternative comme par exemple une liste complète de villages
ou de communautés dans le pays avec toute l’information d’identification nécessaire et une mesure de
taille, soit le nombre de population ou de ménages, ou un échantillonnage maître avec une taille assez
importante qui peut supporter la conception d’EDS.

1.1.2 Couverture complète


Une enquête EDS devrait couvrir 100 pour cent de la population cible dans le pays. La population
cible des enquêtes EDS sont les femmes de 15 à 49 ans et les enfants de moins de cinq ans qui vivent
dans des ménages résidentiels. La plupart des enquêtes incluent aussi les hommes de 15 à 59 ans1. La
population cible peut varier d’un pays à l’autre ou d’enquête à enquête, mais les principes
d’échantillonnage généraux sont les mêmes. Dans certains cas, certaines zones doivent être exclues
suite à l’inaccessibilité, à la violence ou à l’instabilité ; ces points doivent se considérer tout au début de
la conception de l’enquête, avant que l’échantillon soit tiré.

1.1.3 Échantillon probabiliste


Dans les enquêtes EDS, on doit utiliser une méthodologie d’échantillonnage probabiliste. Un
échantillon probabiliste est défini comme celui dans lequel les unités sont choisies au hasard avec des
probabilités connues et non nulles. C’est le seul moyen pour obtenir des estimations sans biais et pour

1
L’âge éligible varie d’enquête à enquête et peut aller de 15 à 49, 15 à 54, 15 à 59 ou 15 à 64.
1
pouvoir mesurer les erreurs d’échantillonnage ainsi que la précision de l’enquête. Le terme échantillon
probabiliste exclut l’échantillonnage raisonné, l'échantillonnage par quotas, et d'autres méthodes non
probabilistes et incontrôlées parce qu'ils ne peuvent pas fournir une évaluation de la précision et / ou
de la confiance dans les résultats de l'enquête.

1.1.4 Taille d’échantillon appropriée


La taille de l’échantillon est un paramètre clé pour les enquêtes EDS puisqu’elle est en relation
directe avec le budget, la qualité des données et la précision de l’enquête. Théoriquement, plus grande
la taille de l’échantillon, meilleure sera la précision de l’enquête. Mais en pratique, ce n’est pas toujours
vrai. Le budget n’est pas le seul facteur important pour déterminer la taille de l’échantillon. La précision
souhaitée, le nombre de domaines d’étude, la capacité de mis en œuvre, la qualité des données
concernées et l’efficacité économique sont des contraintes essentielles pour déterminer la taille totale
de l’échantillon. Par conséquent, une taille appropriée de l’échantillon est un paramètre clé pour garantir
la qualité de données, la précision souhaitable et l’efficacité économique de l’enquête. Une taille de
l’échantillon très importante qui dépasse la capacité de mis en œuvre de l’agence peut effectivement
mettre la qualité de données en risque et rend l’enquête économiquement non efficace.

1.1.5 Une conception simple


Dans les enquêtes à grande échelle, les erreurs non dues à l'échantillonnage (les erreurs de
couverture, les erreurs commises lors de la mise en œuvre de l'enquête et le traitement de données,
etc.) sont généralement les plus importantes sources d'erreur, coûtent cher à contrôler et sont difficiles
à évaluer quantitativement. Il est donc important de les minimiser lors de la mise en œuvre de l'enquête.
Afin de faciliter la mise en œuvre précise de l'enquête, la conception de l'enquête EDS doit être aussi
simple et directe que possible. L'expérience de 35 ans de l'enquête EDS montre que une enquête auprès
des ménages par grappe et à deux degrés est relativement facile à mettre en œuvre et que la qualité
de données peut être maintenue.

1.1.6 Dénombrement de ménages et présélection des ménages


La procédure standard d’EDS recommande que les ménages à enquêter soient présélectionnés
au bureau central avant de commencer les travaux sur le terrain. Les tirages de ménages par les
enquêteurs sur le terrain peuvent introduire des biais de tirage dans des situations non favorable. On
demande que les agents enquêtent seulement les ménages présélectionnés. Aucun changement ni
remplacement n’est autorisé sur le champ afin d’éviter des biais. Pour effectuer la présélection des
ménages, il faut une liste complète de tous les ménages résidés dans les grappes sélectionnés. Cette
liste s’obtient, généralement, par un dénombrement de ménages réalisé avant l'enquête principale.

Dans certaines enquêtes, l'opération de dénombrement de ménages peut être combinée avec
l’enquête principale pour former une seule opération sur le terrain. Les ménages peuvent être
sélectionnés sur le champ à partir d’une liste complète de ménages nouvellement dénombrés. Combiner
le dénombrement de ménages et la collecte principale dans une seule opération peut réduire le coût de
l’enquête. Le dénombrement et la collecte principale peuvent se faire par deux équipes différentes, ou
par une seule équipe. Cependant il faut renforcer la supervision sur le terrain pour assurer que le
dénombrement soit fait correctement car il n’est plus possible de vérifier la qualité de dénombrement
avant la collecte principale, comme dans le processus standard le control de qualité est fait au bureau
central. Les enquêteurs peuvent délibérément de ne pas couvrir l’ensemble de la grappe lors de
dénombrement pour réduire leur charge de travail, réduisant ainsi la représentativité des résultats de
l’enquête. Pour cette raison, EDS préfère un dénombrement indépendant et avant la collecte principale.
Les enquêtes d’EDS n’acceptent pas que les enquêteurs sélectionnent/décident les ménages à enquêter
sans avoir une liste complète de ménages.

1.1.7 Bonne documentation


Les enquêtes EDS sont des projets réalisés au long de l’année par différentes personnes
spécialisées dans des différents domaines de l’enquête, alors, une bonne documentation de
l’échantillonnage est nécessaire pour garantir une mise en œuvre exacte du projet. La documentation
2
doit inclure un plan de sondage, la liste des unités primaires ou grappes tirées, et an manuel de
dénombrement. Le plan de sondage doit expliquer en détail l’objectif principal de l’enquête, la population
cible, la base de sondage retenue, la méthodologie de l’enquête, la taille de l'échantillon, la répartition
de l'échantillon, les domaines d’études, la procédure de tirage et la stratification. Cela devrait également
constituer la base de l’Annexe A dans le rapport final d’EDS. La liste des unités primaires tirées devrait
inclure toutes les informations d'identification plus les paramètres de sondage y compris leur probabilité
d’inclusion. Le manuel de dénombrement doit présenter les détails du processus standard de
dénombrent, voir les détails dans le chapitre 2 de ce manuel.

1.1.8 Confidentialité
La confidentialité est une préoccupation majeure pour EDS, surtout quand des biomarqueurs
humains sont collectés tels que des échantillons de sang pour le dépistage du VIH. Les enquêtes d’EDS
sont anonymes; ils ne permettent pas de l'identification potentielle d’aucun ménage ou individu dans le
fichier des données. La confidentialité est aussi un facteur clé qui influe sur le taux de réponses aux
questions sensibles comme l’activité sexuelle et les partenaires.

En particulier, dans les enquêtes qui incluent le dépistage du VIH, la politique d’EDS exige que
les codes des ménages et celle de la grappe soient brouillés dans les données finales pour rendre encore
plus anonyme les données et les fichiers intermédiaires, y compris la liste de l'échantillon grappe
original, soient détruits après l’enquête.

1.1.9 Mise en œuvre exacte


Le dernier élément pour obtenir une bonne précision de l’enquête est l’exactitude de mise en
œuvre de l’enquête. Peu importe le soin avec lequel une enquête est conçue et la complétude du matériel
nécessaire pour mener des activités de l’enquête, si les personnels de l’enquête mettent en œuvre les
activités (personnel chargé de tirage de l’échantillonnage, agents de terrain chargés de la cartographie
et du dénombrement de ménages, et enquêteurs pour la collecte de données) qui ne conforment pas à
la conception et les processus, il peut en résulter des biais graves et des résultats trompeurs. Une mise
en œuvre exacte de l’enquête est la dernière garantie pour qu’une enquête soit une réussite.

Dans les sections suivantes, on décrit les politiques d’EDS en relation avec la conception et
la mise en œuvre de l’enquête EDS.

1.2 Objectifs de l’enquête et la population cible


L'objectif principal d’EDS est de recueillir des informations actualisées sur les indicateurs
démographiques et de santé des femmes de 15 à 49 ans et ceux de leurs jeunes enfants de moins de 5
ans, y compris la fécondité, les mortalités des enfants, la connaissance et l'utilisation des contraceptions,
la santé maternelle et infantile, l'état nutritionnel des mères et des enfants, la connaissance, attitude
et comportement vis-à-vis au VIH / SIDA et d’autres infections sexuellement transmissibles (IST). La
population cible d’EDS est définie comme toutes les femmes en âge de reproduction (15 à 49 ans) et
de leurs jeunes enfants de moins de cinq ans vivant dans des ménages ordinaires. Toutefois, dans
certains pays, la couverture peut être limitée aux femmes mariées.

Les indicateurs principaux incluent:

• Taux synthétique de fécondité et taux de fécondité par group d’âge


• L’âge au premier rapport sexuel, première naissance et premier mariage
• Connaissance et utilisation de contraception
• Les besoins non satisfaits de la planification familiale
• Soins prénatals
• Lieu de l’accouchement
• Accouchement assisté par des personnels qualifiés
• Connaissance du VIH/SIDA et autre IST
• Comportements sexuels de haut risque
• Couverture de la vaccination des enfants

3
• Traitement médical contre la diarrhée, la fièvre et la toux
• Taux de mortalité infantile et de moins de cinq ans
• Statut de nutrition et anthropométrie de moins de cinq ans

Puisque la population cible peut être facilement trouvée dans les ménages résidentiels, les
enquêtes d’EDS sont basés auprès des ménages.

1.3 Domaine d’étude


Dans les enquêtes d’EDS, un objectif important est de créer un profil des indicateurs clés selon
différentes caractéristiques de base telles que la type de résidence (milieu urbain et rural), les régions
administratives ou géographiques, ou les différents niveaux d'éducation des répondants. Un domaine
d'étude est une sous-population pour qui des estimations séparées des principaux indicateurs sont
demandés. Il y a deux sortes de domaines d’étude: les domaines de la conception et les domaines de
l'analyse. Un domaine de la conception consiste d'une sous-population qui peut être identifiée dans le
base de sondage et peut donc être traitée de manière indépendante dans le calcul et l’allocation de
l'échantillon et dans le tirage de l'échantillonnage, généralement constituée de zones géographiques ou
des unités administratives. Par exemple, le milieu urbain et le milieu rural sont très fréquemment des
domaines d’étude dans des EDS et ils sont des domaines de la conception car la base de sondage
distingue le milieu de résidence. Un domaine d'analyse est une sous-population qui ne peut pas être
identifiée dans le base de sondage, tels que les domaines spécifiés par les caractéristiques individuelles.
Ceux-ci peuvent inclure les femmes ayant suivi un enseignement secondaire ou supérieur, les femmes
enceintes, les enfants de 12 à 23 mois, et les enfants ayant de la diarrhée dans les deux semaines
précédant l’enquête.

Pour que les estimations soient fiables au niveau de domaine, il est nécessaire de contrôler la
taille de l’échantillon pour chaque domaine d’étude, en particulier lorsque le niveau de précision
souhaitable est déterminé pour des domaines particuliers. Pour des domaines de la conception, on peut
décider la taille de l’échantillon par domaine en prenant compte la précision souhaitable lors de la
conception de l’enquête. D'autre part, pour des domaines d'analyse, il est difficile de garantir une
précision spécifiée parce qu'il est difficile de contrôler la taille de l'échantillon pour un domaine d’analyse.
Cependant, si le nombre moyen d’unité cible par ménage est disponible, il est possible de contrôler la
précision de l’enquête pour un domaine d'analyse. Par exemple, pour estimer l'état nutritionnel des
enfants de moins de 5 ans, si le nombre moyen d’enfants de moins de 5 ans par ménage est disponible,
il est alors possible de calculer la taille d'échantillon nécessaire pour atteindre une précision souhaitée.

Les enquêtes d’EDS produisent également des indicateurs de domaines de deuxième niveau tels
que la couverture de vaccins chez les enfants de 12 à 23 mois dans une région, où la région est un
domaine de premier niveau, et les enfants de 12 à 23 mois de la région font un domaine de second
niveau. On doit accorder de l’attention spécifique à la précision requise pour un domaine de second
niveau parce qu’il correspond généralement une très petite sous-population.

Si des estimations au niveau de domaine sont demandées, il est préférable d'éviter d’avoir un
grand nombre de domaines, autrement il sera nécessaire une taille de l’échantillon totale très grande et
cela pourrait avoir une influence négative de la qualité de données. Le nombre de domaines et le niveau
de précision pour chacun doivent être pris en compte dans le calcul du budget et de l'évaluation de la
capacité de mise en œuvre. La taille totale de l'échantillon d’une enquête est la somme des tailles de
l'échantillon de tous les domaines du premier niveau.

1.4 Base de sondage


Une base de sondage est une liste complète de toutes les unités d’échantillonnage qui couvre
entièrement la population cible. Par exemple, la base d’un Recensement Général de la Population et de
l’Habitat (RGPH), une liste complète de Zones de Dénombrement (ZD) créées pour les besoins de
recensement, est une bonne base pour les enquêtes auprès des ménages. L’existence d’une base de
sondage est une nécessité pour pouvoir tirer un échantillon probabiliste. Pour une enquête à multiples
degrés, une base de sondage doit exister pour chaque degré de tirage. L'unité d'échantillonnage du
premier degré est appelée l'Unité Primaire de Sondage (UPS); l'unité d'échantillonnage pour le deuxième
4
degré est appelée l'Unité Secondaire de Sondage (USS), et ainsi de suite. Dans la plupart des cas, les
enquêtes d’EDS sont des enquêtes à deux degrés. Dans le premier degré, on tire des UPS qui sont des
ZD de recensement. Au deuxième degré, on tire des USS qui sont les ménages ordinaires. Notez que
chaque degré de tirage de l'échantillon introduira des erreurs d'échantillonnage, il est donc préférable
d'éviter une enquête plus que deux degrés si les degrés supplémentaires de tirage ne sont pas
nécessaires.

La disponibilité d'une base de sondage appropriée est un déterminant majeur dans la conception
des enquêtes d’EDS. Cette question devrait être abordée dans les premiers temps de la planification
d'une enquête. La meilleure base de sondage pour une enquête EDS est la base de recensement qui est
relativement nouveau. Ça peut aussi être un échantillon-maître existant, issue d’un recensement
relativement nouveau, ou un échantillon d'une enquête préalable avec une taille suffisamment grande
ce qui permet de la sélection des sous-échantillons des tailles désirées pour les enquêtes d’EDS.

1.4.1 Base de sondage conventionnelle


La meilleure base de sondage pour EDS est la base du dernier recensement général de la
population et de l’habitat, qui est une liste complète de Zones de Dénombrement (ZD) couvert le pays
entièrement. Une ZD est en général un village, ou une partie d’un grand village, ou un groupe de petits
villages dans le milieu rural. Dans le milieu urbain, une ZD est un bloc ou un quartier de la ville.

Pour la plupart des EDS menées à ce jour, une base de recensement est disponible, c’est aussi
considéré comme la base conventionnelle. Néanmoins, cette base doit être minutieusement évaluée
avant son utilisation. Le base de sondage pour le EDS doit être à jour ; il doit couvrir complètement la
population cible sans omission et ni de doublons. Pour chaque ZD, pour le moins, devrait avoir des
matériaux cartographiques avec ces limites clairement définies et avec une définition de type de
résidence. Chaque ZD devrait avoir un code d’identification unique ou bien une série de codes qu’une
fois combinées, servent comme code d’identification unique. Chaque unité devrait avoir, pour le moins,
une mesure de taille, en population et/ou en nombre de ménages. S’ils existent d’autres caractéristiques
- niveau socioéconomique ou caractéristiques géographiques, par exemple, elles doivent être évaluées
et retenues pour être utilisées pour la stratification.

Un échantillon maître ou un échantillon préexistant d’UPS issu de la base du recensement peut


être accepté comme base de sondage pour une EDS si on a confiance dans ça conception, et s’il a une
taille de l’échantillon assez grande, soit au moins quatre fois plus grande que la taille de l’échantillon de
l’EDS, et s’il comprit tous les paramètres d'échantillonnage détaillés tels que la méthode
d'échantillonnage, la stratification, et la probabilité d'inclusion pour chaque unité échantillonnée. Alors,
la tâche des enquêtes EDS reste à concevoir une procédure de sous-échantillonnage, qui peut produire
un échantillon conforme aux exigences d’EDS. Ceci ne sera pas toujours possible. Cependant, plus la
taille de l'échantillon-maître en relation avec l’échantillon d’EDS souhaité, plus il y aura des flexibilités
pour concevoir le sous-échantillonnage. Une question clé avec un échantillon préexistant comme base
de sondage est de savoir s’il y a une liste des ménages qui est encore valable pour chaque UPS ou elle
doit être mise à jour. Si une mise à jour est nécessaire, l'utilisation d'un échantillon préexistant ne peut
pas être économique. Les avantages potentiels de l'utilisation d'un échantillon préexistant comme base
de sondage sont: 1) l'économie, et 2) l'augmentation de la puissance analytique comparative concernant
de deux ou plusieurs enquêtes tirées de la même base. Mais il y a aussi des inconvénients: 1) le
problème de la conception de l'échantillon conformément aux exigences d’EDS et 2) le problème de
l’enquête répété sur les mêmes ménages ou individus dans des différentes enquêtes, pouvant résulter
la fatigue ou la contamination de répondants.

1.4.2 Base de sondage alternative


En cas d’absence d'un recensement récent ni d’un échantillon maitre, il faut considérer des bases
alternatives. Quelques exemples sont :

• Une liste des zones électorales avec le nombre d’électeurs inscrit pour chaque zone
• Une carte satellite à haute résolution quadrillée avec nombre de structures estimés pour
chaque grille
5
• Une liste des unités administratives telles que les villages avec sa population estimée pour
chaque unité

Une préoccupation principale lors de l'utilisation des bases alternatives est le problème de
couverture : est-ce que le base couvre entièrement la population cible? Le contrôle de qualité sur une
base alternative est plus difficile en raison de manque d'information, soit à partir de la base elle-même
ou de sources administratives. Un autre problème c’est la taille de l'unité d'échantillonnage primaire.
Puisque la base alternative n’a pas été spécifiquement créée pour un recensement de population ou
pour une enquête auprès des ménages, la taille des UPS de ces bases peut être trop grande ou trop
petite pour une enquête EDS. Un troisième problème est d'identifier les limites des unités
d'échantillonnage en raison de l'absence de documents cartographiques.

Dans les deux premiers exemples de base alternative, on peut appliquer la procédure de tirage
standard d’EDS, c’est-à-dire, un tirage à deux degrés, en traitant les zones électorales ou les grilles
des cartes satellite comme des UPS. Dans le troisième cas, si les unités administratives sont plus grandes
que les villages, par exemple, des sous-districts, des quartiers ou des communes, il faut utiliser une
procédure de tirage plus que deux degrés. Dans le premier degré, on tire un échantillon de communes ;
dans chacune de ces communes tirées, élaborer une liste complète de tous les villages compris dans la
commune ; on tire au deuxième degré un village par commune tiré comme une grappe EDS, et on
procéde le dénombrement de ménages dans les villages tirés, et on tire les ménages au troisième degré.
Cette procédure fonctionne mieux quand le nombre de communes est grand et la taille des communes
est petite. Une liste d’unités administratives plus petite en nombre mais grande en taille n’est pas
souhaitable pour une base de sondage d’EDS car il peut résulter de grandes erreurs d’échantillonnage
comme expliqué dans la Section 1.9.

1.4.3 Evaluation de la base de sondage


Peu importe quelle base de sondage on utilise, il faut toujours vérifier la qualité de la base avant
de choisir un échantillon. Il y a un certain nombre de choses qu’il faut vérifier quand on utilise une base
de sondage conventionnelle:

• Couverture
• Distribution
• Identification et codage
• Mesure de taille
• Cohérence

Il y a plusieurs manières faciles mais utiles pour vérifier la qualité d’une base de sondage. Par
exemple, pour une base de recensement, vérifier la population totale de la base de sondage et la
distribution de la population entre les zones rurales et urbaines et les différentes régions/unités
administratives obtenues avec la base, en référence du rapport de recensement. Une différence
importante peut indiquer qu’il y a un problème de couverture. Si la base donne le nombre d’habitants
et le nombre de ménages pour chaque ZD, alors on peut calculer la taille moyenne de ménages et
identifier les valeurs extrêmes qui peuvent indiquer les mesures incorrectes de la taille des UPS. Si on
dispose le nombre d’habitants par sexe pour chaque ZD, alors on peut calculer un ratio de sexe pour
chaque ZD, et une vérification des valeurs extrêmes peut aider à identifier les ZD non résidentielles. Si
la ZD est associée à un code d’identification (ID), alors vérifier les codes pour identifier des ZDs mal
codées et mal placées. Le premier élément pour une enquête EDS est d’avoir une base de sondage avec
une couverture complète et une bonne qualité; en conséquence, on doit mettre des grands efforts pour
garantir un bon début pour le projet.

Pour une enquête nationale, la couverture géographique doit inclure le territoire national à moins
qu’il existe de très fortes raisons pour exclure certaines zones. Si certaines zones doivent être exclues,
elles doivent exclure dans le tirage de l’échantillon. Si ces zones sont inclues dans l’échantillonnage mais
à la fin un grand nombre de UPS échantillonnées ne peut pas être enquêtées, ça va rendre les résultats
de l’enquête difficile à interpréter et à utiliser.

6
1.5 Stratification
La stratification est le processus par lequel la population cible est divisée en sous-groupes ou
strates aussi homogènes que possible en utilisant certains critères. Une stratification explicite est le tri
et la séparation réelle des unités en strates spécifiées avant le tirage de l’échantillon, et l'échantillon est
conçu et tiré de façon indépendante par strate. Il est également possible de tirer un échantillon
systématique (avec un intervalle de tirage fixé entre les unités échantillonnées) à partir d’une liste
ordonnée pour obtenir l'effet de la stratification. Par exemple, dans l’enquête EDS, il est une habitude
de trier les UPS selon des unités administratives et géographiquement dans les strates explicites avant
le tirage. Ceci va introduire un effet de stratification pour toutes les unités administratives à l’intérieur
de strates explicites. Cet effet de stratification est appelé stratification implicite.

Le principal objectif de la stratification est de réduire les erreurs d’échantillonnage pour un


échantillon de taille fixe. Dans un échantillon stratifié, les erreurs d'échantillonnage dépendent de la
variation de la caractéristique à mesurer à l’intérieur de strate, mais pas entre les strates. Pour cette
raison, il vaut mieux de créer des strates homogènes. Une autre bonne raison pour la stratification est
que, lorsque des différences existent entre les sous-groupes de population (par exemple, les zones
urbaines et les zones rurales), la stratification permet d’une conception de l'échantillon avec flexibilité
et de résulter un échantillon avec une meilleure précision.

Une stratification peut être à un seul niveau ou à plusieurs niveaux. Dans la stratification à un
seul niveau, la population cible est divisée en strates selon certains critères. Dans la stratification à
plusieurs niveaux, la population cible est divisée en strate de premier niveau selon certains critères,
puis les strates de premier niveau sont subdivisées en strates de deuxième niveau, et ainsi de suite.
Une stratification typique à deux niveaux implique d'abord stratifier la population par région au premier
niveau, puis par zones urbaines et rurales dans chaque région, c’est la stratification habituelle d’une
enquête EDS typique.

On ne doit pas confondre les strates avec les domaines d’étude. Un domaine d’étude est une
sous-population pour laquelle des estimations des indicateurs clés sont demandés, ainsi que la taille de
l’échantillon est contrôlée, par exemple, le milieu urbain et le milieu rural font deux domaines d’étude
pour toutes les EDS. Une strate d’échantillonnage est un sous-groupe d'unités homogènes (par exemple,
les subdivisions d'une région administrative) dans laquelle l'échantillon est conçu et est sélectionné
indépendamment. Les domaines d’étude et les strates pourraient être les mêmes, mais ils ne doivent
pas l’être. Par exemple, les domaines d’étude peuvent être le premier niveau de la strate dans une
stratification à plusieurs niveaux. D'autre part, un domaine d’étude peut consister en une ou plusieurs
strates d’échantillonnage.

Les enquêtes EDS utilisent généralement la stratification explicite en séparant le milieu urbain
et le milieu rural au sein de chaque région. Lorsque les données sont disponibles, la stratification
explicite pourrait également être faite sur la base des zones socio-économiques ou plus directement les
caractéristiques individuelles, telles que le niveau de l'alphabétisation des femmes, ayant accès d’un
service de santé spécifique. Mais dans la réalité, ces types d’informations sont rarement disponibles
dans la base de recensement. On peut parfois en obtenir à partir de sources administratives. Dans
chaque strate explicite, les unités peuvent être ordonnées en fonction de caractéristiques plus fines,
offrant ainsi une stratification implicite plus détaille.

1.6 Taille de l’échantillon


1.6.1 Taille de l’échantillon et erreurs d’échantillonnage
Les estimations à partir d'une enquête par sondage sont affectées par deux types d'erreurs: les
erreurs d'échantillonnage et les erreurs non dues à l'échantillonnage. Les erreurs d'échantillonnage sont
les erreurs représentatives dues à l'échantillonnage d'un petit nombre des unités de la population cible
au lieu d'inclure toutes les unités éligibles. Les erreurs d’échantillonnage sont liées à la taille de
l’échantillon et à la variété entre les unités d’échantillonnage. Les erreurs d’échantillonnage peuvent
être statistiquement évaluées après l’enquête. Les erreurs non dues à l’échantillonnage sont dues aux
problèmes advenus pendant la recollection de données telles que l’impossibilité de localiser et enquêter
7
le ménage tiré, l’incompréhension des questions de la part d’enquêteur ou d’enquêté, et d’autre comme
l’erreur de saisis des données. Les erreurs non dues à l’échantillonnage sont reliées à la capacité de
l’organisation de mise en œuvre ; l’expérience montre que (1) Les erreurs non dues à l’échantillonnage
sont toujours la source d’erreur la plus importante d’une enquête et (2) il est difficile d’évaluer ou
corriger des erreurs non dues à l’échantillonnage une fois que l’enquête est finie. Théoriquement, avec
la même méthodologie et sous les mêmes conditions, plus grande est la taille de l’échantillon, plus
grande sera la précision. Cependant, cette relation ne s’est toujours pas vraie dans la pratique, parce
que des erreurs non dues à l'échantillonnage ont tendance à augmenter avec l'échelle de l’enquête et
la taille de l'échantillon. Le défi pour décider de la taille de l'échantillon pour une enquête est de concilier
les exigences d'analyse et de précision avec la capacité de l'organisation de mise en œuvre et les
contraintes de financement.

Une mesure courante de précision pour estimer un indicateur est l’écart-type relatif (ETR) qui
est définie comme l’écart-type (ET) divisée par la valeur estimée de l'indicateur. L'écart-type d'un
estimateur est l'erreur due à l'échantillonnage. L'écart-type relative décrit la quantité d'erreurs
d'échantillonnage par rapport au niveau de l'indicateur à estimer et qui est ainsi indépendant de l'échelle
de l'indicateur à estimer. Par conséquent, une ETR unique peut être appliqué à tous les indicateurs et
pour tous les domaines. Si on souhaite une ETR unique pour tous les domaines, la taille de l'échantillon
de domaine dépend de la variété et de la taille du domaine. La taille totale de l’échantillon est l’addition
de la taille de l’échantillon sous tous les domaines dont on requiert la précision. Les concepts suivants
sont en relation avec le calcul de la taille de l’échantillon.

1. L’écart-type d'un estimateur pour estimer une proportion avec un échantillonnage aléatoire
simple sans remise2 est donnée par:

 1- f N 
SE = SQRT    P (1 − P) 
 n N − 1 

où n est la taille de l’échantillon (nombre d’interviews accomplies),


P est la proportion,
N est la taille de la population cible et
f=n/N est la fraction de l’échantillon ou taux de l’échantillonnage.

Quand N est plus grand et que n est relativement petit, la quantité ci-dessus peut être
approximée par:

 P(1 − P ) 
SE  SQRT  
 n 

Par conséquent, l’ETR de l'estimateur est donnée par:

 P(1 − P )  1 / P − 1
RSE (P )  SQRT   / P = SQRT  
 n   n 

2. Pour une précision requise avec un écart-type relatif  , la taille de l'échantillon nette (nombre
d'entrevues complétées) nécessaire pour un échantillonnage aléatoire simple est donnée par:
(1 / P − 1)
n=
2

3. Puisqu’un échantillon aléatoire simple n’est pas possible pour un EDS, la taille de l'échantillon
pour une enquête complexe par grappes tel que l’EDS peut être calculée en gonflant la taille de

2
Un échantillon aléatoire simple serait une sélection aléatoire des individus ou des ménages à partir, directement,
de la population ciblée. Ce n’est pas possible pour les sondages EDS, car une liste de tous les individus ou des
ménages éligibles n’est pas disponible.
8
l'échantillon calculée ci-dessus en utilisant un effet de sondage (Deft). Deft est une mesure de
l'efficacité de l'échantillonnage complexe par rapport à un échantillonnage aléatoire simple, défini
comme le ratio entre l'écart-type en utilisant le plan d'échantillonnage donné et l'écart-type qui
résulterait si un échantillon aléatoire simple avait été utilisé. Une valeur de Deft 1,0 indique que la
conception de l'échantillon est aussi efficace qu’un échantillon aléatoire simple, alors qu'une valeur
supérieure à 1,0 indique l'augmentation de l'erreur d'échantillonnage en raison de l'utilisation d'une
conception plus complexe et statistiquement moins efficace. La taille de l'échantillon net nécessaire
pour un échantillonnage complexe avec la même écart-type relative est donnée par :
1
(𝑃 − 1)
2
𝑛 = 𝐷𝑒𝑓𝑡 ×
𝛼2
4. La formule pour calculer la taille de l'échantillon final en termes de nombre de ménages sans
prendre la non-réponse (la formule utilisée dans les programmes de calcul de la taille de
l'échantillon, comme indiqué dans le tableau 1.1) est donnée par:

1
( −1)
2 𝑃
𝑛 = 𝐷𝑒𝑓𝑡 × 𝛼2
/(𝑅𝑖 × 𝑅ℎ × 𝑑)

Où n est la taille d’échantillon dans le Ménage;


Deft est l’effet de sondage (une valeur de 1.5 est utilisée pour Deft à default de
spécification);
P est la proportion estimée;
 est l’écart-type relatif souhaité;
Ri est le taux de réponse individuelle;
Rh est le taux de réponse brut du ménage; et
d est le nombre d’individus éligibles par ménage.

Le taux de réponse brut des ménages est le nombre de ménages interrogés sur le nombre
sélectionné. L’EDS rapporte généralement le taux de réponse des ménages net qui est le nombre
de ménages interrogés sur le nombre de ménages trouvés dans le champ (hors logements
vacants et détruits.)

5. Si la population cible est petite (comme dans une enquête sous-nationale), on devrait appliquer
une correction de la population finie de la taille de l'échantillon calculée ci-dessus. La taille finale
de l'échantillon n est calculée :

n0
n=
1 + n0 / N

où n0 est la taille initiale de l'échantillon calculée au point numéro 4, et N est la taille de la


population cible.

6. La relation entre l’ETR et la taille de l'échantillon montre que, si l'on réduit une ETR souhaité de
moitié, ou doublé la précision, alors la taille de l'échantillon nécessaire augmentera 4 fois. Par
exemple, la taille de l'échantillon pour une ETR de 5% est quatre fois plus grande que la taille
de l'échantillon pour une ETR de 10% (voir les tableaux 1.1 et 1.2 dans la section suivante).
Cela signifie qu'il est très coûteux de réduire l’ETR par l’augmentation de la taille de l'échantillon.
Par conséquent, lors de la conception de la taille de l'échantillon, l'efficacité de l’enquête
conception doit être considérée, c'est-à-dire, l'équilibre entre le gain de précision et
l'augmentation de la taille de l'échantillon (ou le coût de l'étude).

9
7. La longueur de l'intervalle de confiance est déterminée par l’ETR. Avec un niveau de confiance
de 95%, 2*P*ETR est la demi-longueur de l'intervalle de confiance pour P. Par exemple, pour
ETR=0,10 et P=0,20, la demi-longueur de l'intervalle de confiance est de 0,04, ce qui signifie
que l'intervalle de confiance pour P est (0,16, 0,24). (EDS utilise ±2*ET au lieu de ±1,96*ET
comme 95% d’intervalle de confiance à des fins conservatrices).

1.6.2 Détermination de la taille de l'échantillon


La taille totale de l'échantillon pour une enquête EDS avec un certain nombre de domaines
d’études (domaine de la conception) est la somme des tailles d'échantillon sur tous les domaines. Un
échantillon de taille appropriée pour un domaine d’étude est le nombre minimum d’individus (par
exemple, les femmes de 15 à 49 ans, les femmes mariées de 15 à 49 ans, les enfants de moins de cinq
ans) à enquêter pour atteindre la précision souhaitée des indicateurs de base au niveau de domaine. Si
le financement est serré et fixe, la taille de l'échantillon est égale au nombre maximal de personnes que
le financement peut couvrir. La précision au niveau national n’est généralement pas un problème.
Dans presque tous les cas, la taille de l'échantillon est décidée pour garantir la précision au niveau de
domaine avec la répartition appropriée de l'échantillon. Donc, en dehors des coûts d’enquête, la taille
totale de l'échantillon dépend de la précision souhaitée au niveau du domaine et le nombre de domaines.
Si une précision raisonnable est nécessaire au niveau du domaine, l'expérience du programme MESURE
EDS montre qu'un nombre minimum de 800 femmes enquêtées avec sucés est nécessaire pour une
estimation fiable comme pour le taux de fécondité et le taux de mortalité infantile, - pour les pays ayant
un taux fécondité élevés. Pour les pays de faible fécondité, la taille de l'échantillon minimum du domaine
peut atteindre 1 000 femmes enquêtées avec sucés ou plus. Le tableau 1.1 ci-dessous illustre le calcul
de la taille de l'échantillon pour un domaine en fonction de différents niveaux d’ETR souhaitée pour
estimer l'indicateur «la proportion de femmes mariées qui utilisent une méthode contraceptive
moderne».

Tableau 1.1 Détermination de la taille de l’échantillon pour estimer l’utilisation


fréquente d’une méthode contraceptive chez les femmes mariées

Proportion estimée p 0.20 Population cible totale

Effet de sondage estimé # d’individus


1.40 1.05
(Deft) ciblés/ménage

Taux de réponses bruts


Taux de réponses individuels 0.96 0.92
de ménages

Taille de
Échantillon Limite de confiance
Souhaitée l’échantillo
net 95%
n

Taille Inférieu
ETR Ménage ET attendue Supérieure
individuelle re

0.20 196 212 0.040 0.120 0.280

0.19 217 234 0.038 0.124 0.276

0.18 242 261 0.036 0.128 0.272

0.17 271 293 0.034 0.132 0.268

0.16 306 330 0.032 0.136 0.264

0.15 348 376 0.030 0.140 0.260

0.14 400 432 0.028 0.144 0.256

0.13 464 501 0.026 0.148 0.252

10
0.12 544 587 0.024 0.152 0.248

0.11 648 699 0.022 0.156 0.244

0.10 784 846 0.020 0.160 0.240

0.05 3136 3382 0.010 0.180 0.220

Note: Les limites de confiance sont calculées : P±2*ET.

En supposant que la taille du domaine soit suffisamment grande pour que la correction de la
population finie soit négligeable, le tableau 1.1 donne la taille de l'échantillon brut requis en termes de
nombre de ménages avec des paramètres estimés à partir d'une enquête d’EDS. La population cible
sont les femmes mariées de 15 à 49 ans; les paramètres estimés sont:

• la proportion des femmes mariées qui utilisent des méthodes de contraception moderne,
• l’effet de sondage (Deft),
• le nombre d’individus ciblés (nombre de femmes mariées de 15 à 49) par Ménage,
• les taux de réponses individuelles et des ménages .

Par exemple, avec une proportion estimée de 20%, si nous avons besoin d'une ETR de 10%,
nous devrions sélectionner 846 ménages dans ce domaine particulier. Avec un taux de réponse brut des
ménages (le nombre de ménages enquêtés sur le nombre total sélectionné) de 92% et un taux de
réponses individuelles de 96%, nous nous attendons à obtenir 784 entrevues réalisées sur des femmes
mariées de 15 à 49 ans.

Les quantités estimées en haut du tableau utilisées comme entrée pour le calcul, peuvent
généralement être obtenues par des enquêtes précédentes ou des dossiers administratifs. La taille totale
de l'échantillon pour une enquête avec plusieurs domaines est la somme de la taille des échantillons
obtenus dans le tableau ci-dessus pour chaque domaine. Si la même précision est requise et le même
niveau de l'indicateur s’appliquent à tous les domaines, la taille totale de l'échantillon est la taille de
l'échantillon calculée pour un domaine multiplié par le nombre de domaines. Avec cet exemple, la taille
totale de l'échantillon pour une enquête ayant six domaines avec approximativement le même niveau
d'utilisation des contraceptifs modernes chez les femmes mariées et la même demande de précision
pour chaque domaine, serait de 5076 ménages . Le modèle «Détermination de la taille de l’échantillon »
situé dans l'annexe peut être utilisé pour déterminer la taille de l'échantillon nécessaire.

Tableau 1.2 Détermination de la taille de l’échantillon pour estimer la fréquence de la


couverture totale de vaccination chez les enfants âgés de 12 à 23 mois

Proportion estimée p 0.29 Population cible totale

Effet de conception estimé (Deft) 1.22 # d’individus ciblés/ménage 0.11

Taux de réponses bruts de


Taux de réponses individuels 0.96 0.92
ménages

Échantillon Taille de
Souhaité ET Attendue Limite de confiance 95%
net l’échantillon

Taille
ETR Ménage Inférieure Supérieure
individuelle
0.20 91 937 0.058 0.174 0.406
0.19 101 1040 0.055 0.180 0.400
0.18 112 1153 0.052 0.185 0.395
0.17 126 1297 0.049 0.191 0.389
0.16 142 1462 0.046 0.197 0.383
0.15 162 1668 0.043 0.203 0.377
0.14 186 1915 0.041 0.209 0.371
0.13 216 2224 0.038 0.215 0.365

11
0.12 253 2605 0.035 0.220 0.360
0.11 301 3099 0.032 0.226 0.354
0.10 364 3747 0.029 0.232 0.348
0.05 1458 15008 0.014 0.261 0.319
Note: La valeur par default du Deft est établie à 1.5. Spécifier si
différente.
Les limites de confidence sont calculées comme P±2*SE.
Si le taux de réponses n’est pas donné, le calcul de la taille de l’échantillon donne une taille
d’échantillon net.

Le tableau 1.2 montre un exemple similaire pour l'indicateur "proportion d'enfants âgés de 12 à
23 mois qui sont complètement vaccinés". Dans ce cas, la population cible est les enfants âgés de 12 à
23 mois. Le nombre estimé de personnes ciblées par Ménage est beaucoup plus petit que le nombre de
femmes mariées par Ménage indiqué dans le tableau 1.1. Ainsi, pour la même taille d'échantillon calculée
dans le tableau 1.1, nous ne pouvons obtenir une ETR de plus de 20% au niveau du domaine. Avec une
ETR de 10%, nous devons sélectionner 3746 ménages dans ce domaine particulier qui ne semble pas
réaliste si nous avons plusieurs domaines pour l'enquête.

Cet exemple montre que pour une enquête à indicateurs multiples, la taille de l'échantillon
requise peut être très différente d’un indicateur à l’autre. Ainsi, le choix de l'indicateur de référence sur
laquelle la taille de l'échantillon est calculée est une question importante. L'indicateur de référence qui
est utilisé pour la détermination de la taille de l'échantillon devrait avoir une importance démographique,
une valeur moyenne et une couverture moyenne de la population, c'est-à-dire, appliqué à une proportion
assez considérable de la population. Avec la même taille d'échantillon calculée dans le tableau 1.1 pour
une enquête à six domaines, l’ETR se situe entre 8% et 9% pour l'ensemble de l'échantillon pour estimer
la vaccination complète des enfants de 12 à 23 mois.

La taille des échantillons de domaine ont souvent besoin d'être équilibrées entre elles en raison
de contraintes budgétaires. En pratique, il arrive souvent que la taille totale de l'échantillon est fixée en
fonction de budget disponible et la capacité de mise en œuvre, puis l'échantillon est alloué à chaque
domaine et pour chaque strate dans le domaine. Dans le cas de contraintes budgétaires très serrées,
nous pouvons aussi allouer l'échantillon aux domaines avec une allocation égale. Dans certains cas,
nous pouvons sur-échantillonner un domaine spécifique pour effectuer une analyse approfondie d’un
certain phénomène rare. La méthode (et les tableaux) présentées dans la section suivante peuvent être
utilisés pour allouer l'échantillon au niveau du domaine parce que les domaines sont généralement des
strates de premier niveau. Quelle que soit la méthode utilisée pour l’allocation, le calcul de la taille de
l'échantillon du domaine peut nous donner une idée de la précision que nous pouvons atteindre dans
chaque domaine avec une taille de l'échantillon donnée.

1.7 Allocation de l’échantillon


Dans les cas où la taille totale de l'échantillon ou la taille de l'échantillon du domaine a été fixée,
nous devons allouer l'échantillon, de manière appropriée, aux différents domaines ou de différentes
strates dans un domaine. Cette Allocation vise à renforcer l'efficacité de l'échantillonnage au niveau
national ou au niveau du domaine et de réduire les erreurs d'échantillonnage. En supposant un coût
constant entre domaines et strates, l’allocation optimale de l'échantillon dépend de la taille du
domaine/strate 𝑁ℎ et la variabilité de l'indicateur à estimer S xh

nh  N h S xh

Pour une taille totale de l'échantillon donnée n, l’allocation optimale pour la variable x est donnée
par:
N h S xh
nh = n H

 N h S xh
h =1

12
L’allocation optimale n’est optimale que pour l'indicateur sur lequel se fonde ladite allocation;
cette allocation peut ne pas convenir à d'autres indicateurs. Pour une enquête à multi variables, si les
domaines/strates ne sont pas de tailles trop différentes, une allocation qui est bonne pour tous les
indicateurs est l’allocation proportionnelle, avec la taille de l'échantillon proportionnelle à la taille de
domaine/strate.

Nh Nh
nh = n =n
H
N
 Nh
h =1

Cette allocation introduit un taux de sondage constant entre les domaines/strates avec:

nh n
fh = =
Nh N

Puisque les enquêtes EDS sont multi variables on conseille une allocation de l’échantillon
proportionnelle si la taille des domaines/strates n’est pas trop différente. Dans le cas de domaines
d’étude, si les tailles des domaines sont très différentes, les domaines les plus petits peuvent recevoir
un échantillon de très petite taille, par conséquent la précision de l’enquête dans les petits domaines ne
sera pas comparable avec les grand domaines.

Si l’on contrôle la précision au niveau du domaine, en supposant que les variations relatives
sont égales entre les domaines, une allocation de puissance (Bankier, 1988) avec une puissance valeur
appropriée  , 0    1 peut être utilisée pour garantir une taille d’échantillon suffisante dans les petits
domaines :

M h
nh = n H

M 
h =1
h

Où Mh est une mesure de taille quelconque pour le domaine h, par exemple, le nombre total de ménages
ou de la population dans le domaine h.

Une allocation de puissance est une allocation proportionnelle à la puissance de la mesure de


taille M. Une valeur de puissance de 1 donne l’allocation proportionnelle; une valeur de puissance de 0
donne une allocation identique ou égale; une valeur de puissance entre 0 et 1 donne une allocation
entre l’allocation proportionnelle et celle de taille identique. L’allocation proportionnelle est bonne pour
les indicateurs au niveau national, mais peuvent ne pas répondre à la demande de précision au niveau
du domaine; alors qu’une allocation de taille égale sera bien pour la comparaison entre les domaines
mais peut réduire la précision au niveau national avec une taille de l’échantillon total fixé. Une allocation
de puissance avec des valeurs une puissance entre 0 et 1 est un compromis entre la précision au niveau
national et la précision au niveau du domaine. Comme la taille de l'échantillon est généralement grande
au niveau national, la précision au niveau national n’est souvent pas un souci.

Dans le tableau 1.3 ci-dessous, nous donnons un exemple d’une allocation proportionnel de 15
000 personnes à 11 domaines et ensuite à ces zones urbaines-rurales. La taille d’échantillon minimale
pour le domaine 2 est de 384 ce qui est trop petit pour calculer les taux synthétique de fertilité (TFR)
et les taux mortalité des enfants de moins de cinq ans. La plus grande taille de l’échantillon c’est pour
le domaine 11 qui est un nécessairement grande. La taille totale de l'échantillon donné dans la ligne
‘total’ peut être légèrement différente de la taille de l'échantillon souhaitée en raison des arrondis.

13
Tableau 1.3 Allocation de l’Échantillon: Allocation proportionnel

Sample Size Individual => 15000


Power Value for Domain =>
Power Value for Urban =>
Serial Domain / Stratum Measure Proportion Individual Allocation
Specific
Numb Name / ID of % Size % Urban Urban Rural Domain Allocation
1 Domaine 1 0.072 0.352 380 700 1080
2 Domaine 2 0.026 0.317 124 266 390
3 Domaine 3 0.070 0.568 596 454 1050
4 Domaine 4 0.142 0.275 586 1544 2130
5 Domaine 5 0.060 0.323 291 609 900
6 Domaine 6 0.046 0.135 93 597 690
7 Domaine 7 0.048 0.194 140 580 720
8 Domaine 8 0.094 0.251 354 1056 1410
9 Domaine 9 0.164 0.288 708 1752 2460
10 Domaine 10 0.091 0.191 261 1104 1365
11 Domaine 11 0.187 1.000 2805 2805
Total 1.000 0.423 6338 8662 15000

Si on impose la condition que la taille de l'échantillon ne doit pas être inférieure à 1000 dans
chaque domaine, après avoir essayé différentes valeurs de puissance, on constate que la valeur de
puissance appropriée est de 0,25 comme indiqué dans le Tableau 1.4 ci-dessous. Dans ce cas, nous
aurions une taille minimale de l'échantillon de 1026 pour le domaine 2. Puisque le domaine 11 a
seulement des zones urbaines, la répartition par la puissance entre les domaines peut résulter une sous-
représentation du milieu urbain dans l'échantillon. Pour que les zones urbaines soient convenablement
représentées, on applique un sur-échantillonnage dans les zones urbaines des autres domaines par une
allocation par puissance. Avec une valeur de puissance de 0,65, la proportion urbaine dans l'échantillon
est proche de la proportion de la population cible.

Tableau 1.4 Allocation de l’Échantillon: Allocation de puissance

Sample Size Individual => 15000


Power Value for Domain => 0.250
Power Value for Urban => 0.650
Serial Domain / Stratum Measure Proportion Individual Allocation
Specific
Numb Name / ID of % Size % Urban Urban Rural Domain Allocate
1 Domaine 1 0.072 0.352 532 792 1324
2 Domaine 2 0.026 0.317 388 638 1026
3 Domaine 3 0.070 0.568 715 599 1314
4 Domaine 4 0.142 0.275 545 1023 1568
5 Domaine 5 0.060 0.323 483 782 1265
6 Domaine 6 0.046 0.135 272 911 1183
7 Domaine 7 0.048 0.194 339 857 1196
8 Domaine 8 0.094 0.251 466 949 1415
9 Domaine 9 0.164 0.288 581 1045 1626
10 Domaine 10 0.091 0.191 395 1008 1403
11 Domaine 11 0.187 1.000 1680 1680

14
Total 1.000 0.423 6396 8604 15000

Dans le Tableau 1.4, les petits domaines sont sur-échantillonnés par rapport à une allocation
proportionnelle. Le sur-échantillonnage des petits domaines se pratique souvent si la précision au niveau
du domaine le requiert. Cependant, trop sur-échantillonner un petit domaine peut réduire la précision
au niveau national. Pour éviter cela, il est recommandé de regrouper les petits domaines pour former
des domaines de taille moyenne, surtout quand il y a une distribution de la population très inégale parmi
les domaines; toutefois, ceci n’est parfois pas possible en raison de considérations politiques.

La discussion ci-dessus s’applique également à l’allocation de taille de l’échantillon aux strates


dans un domaine où la taille de l'échantillon du domaine est fixée. Mais une répartition proportionnelle
à la taille de la strate est bonne pour tous les indicateurs et fournit la meilleure précision pour le domaine
dans son ensemble.

1.8 Procédure d’échantillonnage par grappe et à deux degrés


Le programme EDS utilise une procédure de tirage de l’échantillon pratique et convenable pour
les enquêtes auprès des ménages basés sur les expériences des enquêtes antérieures – une procédure
d’échantillonnage par grappes à deux degrés. Une grappe est un group des ménages voisiné qui sert
comme UPS pour l’efficacité du travail sur le champ. Le fait d’enquêter un certain nombre de ménages
dans la même grappe peut réduire considérable les voyages ainsi que le temps requis pour collecter les
données. Généralement, une grappe est une ZD avec une taille égale au nombre des ménages ou de la
population dans la ZD fourni par le recensement.

Dans le premier degré, un échantillon stratifié de ZD est tiré avec une procédure de tirage à
probabilité proportionnelle à la taille (PPS): dans chaque strate, un échantillon d'un nombre
prédéterminé de ZDs est sélectionné indépendamment avec une probabilité proportionnelle à la mesure
de la taille de ZD. Dans les ZD sélectionnées et avant l’enquête principale, un dénombrement de
ménages et une mise à jour de la carte seront effectués de telle sorte que tous les logements/ménages
résidés dans la ZD tirée seront enregistrés sur une fiche de dénombrement, et la carte de ZD mise à
jour. Cette procédure est importante pour corriger les erreurs existantes dans la base de sondage et
elle fournit aussi une base de sondage pour les tirages de ménages à la seconde degré.

Dans la deuxième degré, après établi une liste complète des ménages dénombrés dans chacune
des ZDs sélectionnés, un nombre fixe des ménages est sélectionné par une procédure d’échantillonnage
systématique à probabilité égale. Au moment de l’enquête principale, dans chaque ménage sélectionné,
un questionnaire ménages sera appliqué pour identifier les femmes éligibles de 15 à 49 ans, les hommes
éligibles de 15 à 59 ans (15 à 54 ans ou 15 à 49 ans dans certaines enquêtes) et les enfants de moins
de cinq ans. Chaque femme éligible sera enquêtée avec un questionnaire individuel et chaque homme
éligible sera enquêté avec un questionnaire homme.

L’avantage de cette procédure d’échantillonnages à deux-degrés peut se résumer comme il suit:

1) Elle garantit un échantillon représentatif de la population cible quand une liste des individus
ciblés n’est pas disponible ce qui empêche un échantillonnage direct des individus ciblés;

2) Une procédure de dénombrement de ménages après la sélection de le premier degré et


avant l’enquête principal fournit un base de sondage pour le tirage de ménages au bureau
central - présélection de ménages à enquêter;

3) L’utilisation des ménages résidentiels dans l’unité d’échantillonnage de la deuxième degré


garantit la meilleure couverture de la population cible;

4) Elle réduit les erreurs inutiles en évitant plus de deux degrés de tirage dans laquelle utilise
un petit nombre d’UPS dans le tirage de le premier degré, ainsi va réduire la représentativité
de l’échantillon.

15
Voir plus de détails dans les sections 1.10 et 1.11 sur les dénombre de ménages et le tirage de
ménages, la procédure détaillée de dénombrement dans le chapitre 2, et les sections 3.2 et 3.3 sur les
procédures d'échantillonnage systématique.

1.9 Échantillon “prit” par grappe


Une fois que la taille totale de l'échantillon est déterminée et alloué aux différents
domaines/strates, il faut décider combien de ménages (échantillon prit) devraient être enquêtés par
grappe, puis convertir la taille de l'échantillon domaine/strate au nombre de grappes. Comme le coût
d’enquête peut être très différent entre les domaines/strates, l'échantillon « prit » peut avoir une grande
influence sur le budget total de l’enquête. Avec une taille d'échantillon total fixée, un petit échantillon
« prit » par grappe est bien pour la précision de l’enquête en raison de la réduction de l'effet de la
grappe, mais il peut être très cher parce qu’un grand nombre de grappes seront nécessaires. Le nombre
de grappes affecte le budget de l’enquête plus que la taille totale de l'échantillon en raison des fréquents
déplacements entre les grappes lors de la collecte de données, et que un temps minimal demandé pour
que les enquêteurs doivent rester dans la grappe pour les rappels de non-réponse, ce qui représente
une part importante des coûts de terrain dans les zones rurales. Le programme EDS propose un
échantillon « prit » entre 25 et 30 ménages par grappe dans le milieu rurale. Dans le milieu urbain, le
coût de l’enquête est souvent moins cher car les meilleures infrastructures et le petit entendu de grappe,
un petit échantillon « prit » est plus convenable, on recommande un “prit” entre 20 à 25 ménages par
grappe urbaine. Puisque dans la plupart des ménages, le nombre de femmes éligibles de 15 à 49 ans
est très proche d’une par ménage, par conséquent, l'échantillon “prit” en nombre de ménages est
équivalent à l'échantillon “prit” en nombre de femmes. Dans les sections suivantes nous nous référons
à l'échantillon “prit” (ou prit de grappe) comme le nombre de ménages tirés par grappe.

1.9.1 Échantillon “prit” optimal


Le nombre optimal de ménages à enquêter par grappe dépend de la variable à étudier, de la
corrélation intra-grappe  et le ratio des coûts de l’enquête c1 / c 2 , où c1 représente le coût par
grappe incluant principalement le coût associés aux déplacements inter et entre les grappes au moment
des travaux sur le terrain, y compris le dénombrement de ménages et la collecte principale ; tandis que
c 2 représente le coût par entretien individuel (le coût de l'enquête individuel) et d'autres coûts pour
exercer des travaux sur le terrain au sein d'une grappe. Un échantillon prit plus large par grappe et
moins de grappes réduisent les coûts de l’enquête si le ratio de coût est élevé, mais il pourrait aussi
réduire la précision de l’enquête si la corrélation intra-grappe est forte.

Le programme EDS a accumulé des informations sur les erreurs d’échantillonnage pour des
variables sélectionnées pour beaucoup d’enquêtes dans le monde. Avec cette information, Aliaga et Ren
(2006) ont réalisé une étude de recherché pour déterminer le meilleur échantillon prit par grappe. Les
résultats des études ont informé la pratique courante dans les enquêtes EDS. Si la taille moyenne des
grappes est de 250 ménages, un échantillon prit de 20 à 30 ménages par grappe est dans le taux
acceptable de la plupart des enquêtes. La recherche prend également en charge la pratique d’un
échantillon prit plus large dans les grappes rurales que dans les grappes urbains. Habituellement, la
proportion de coût dans les zones urbaines est plus faible que celle dans les zones rurales. Cela
conduirait à un échantillon prit plus petit dans une grappe urbain que dans une grappe rural. En somme,
cette recherche indique que pour les indicateurs d’enquête les plus importants, un échantillon prit entre
20 à 25 ménages est approprié pour des grappes urbaines et un échantillon prit entre 25 à 30 ménages
est approprié dans les grappes rurales.

Basé sur les valeurs c1 / c 2 et  obtenus des huit enquêtes, le tableau 1.5 ci-dessous montre
que l’échantillon optimal prit pour l’indicateur “proportion des femmes mariées de 15 à 49 utilisant
actuellement n’importe quel méthode de contraception.” Cet indicateur a une corrélation intra-grappe
modérée par rapport aux autres indicateurs d’enquête importants.

16
Tableau 1.5 Échantillon optimal prit pour des femmes mariées de 15 à 49 utilisant
actuellement n’importe quelle méthode de contraception basé dans la corrélation intra-
grappe  et la proportion du coût d’enquête c1 / c 2 à partir des enquêtes antérieures

Proportion Corrélation
du coût Intra- Échantillon
d’enquête grappe optimal
Pays c1 / c 2  prit
Pays 1 10 0.025 20
Pays 2 10 0.037 16
Pays 3 12 0.067 13
Pays 4 12 0.052 15
Pays 5 15 0.084 13
Pays 6 27 0.031 29
Pays 7 48 0.058 28
Pays 8 52 0.023 47

Moyenne 23 0.047 23

1.9.2 Échantillon prit variable pour l'auto-pondération


Un échantillon prit fixe par grappe est facile pour la gestion et la mise en œuvre de l’enquête,
mais il résulte des poids de sondage qui varient dans une strate. Les différences entre les poids
contribuent aux erreurs d’échantillonnage en comparaison avec un échantillon similaire de poids
constant dans une strate d'échantillonnage, c’est à dire, un échantillon auto-pondéré. Un échantillon
auto-pondéré consiste d’un échantillon des individus dans lequel chaque individu a la même probabilité
d'être inclut, et donc résulter un poids constant. Dans certains cas, un échantillon auto-pondéré est
préférable pour des raisons diverses:

• Il est également représentative pour chaque individu de la population cible;


• Il réduit les erreurs d’échantillonnage.

Comme l'échantillon pour enquêtes EDS est généralement le résultat d'une conception de
l’enquête par grappes et à deux degrés, il est nécessaire de coordonner l'échantillon prit pour chacune
des grappes sélectionnées pour arriver à un échantillon auto-pondéré. Dans un échantillon auto-pondéré
global, chaque individu dans la population cible a une probabilité d’inclusion égale, ce qui entraîne une
allocation de l’échantillon proportionnelle. Cependant, une allocation proportionnelle peut être
inappropriée lorsque les domaines d'étude sont de tailles très différentes. En revanche, l’auto-
pondération au niveau de domaine/strate échantillonnage est facile à réaliser.

Soient n le nombre total de grappes à sélectionner pour une enquête EDS, nh le nombre de
grappes alloués à la strate hth; X h le nombre total de ménages dans la strate h, x hk le nombre de
ménages dans la grappe k de la strate h donné par le base de sondage; alors la probabilité d’inclusion
de la grappe k dans la strate h par une procédure de tirage PPS est donné par:

nh x hk
 hk =
Xh

Soit x hk
*
le nombre de ménages dénombrés dans la grappe lors de l’opération de
dénombrement de ménages, mh le nombre de ménages à sélectionner par grappe pour un échantillon
prit fixe, alors la probabilité globale de sélectionner un ménage dans la grappe est donnée par:

17
mh n x m
f hk =  hk  = h hk  *h
*
x hk Xh x hk

Si x hk = x hk exactement pour tous les k dans la strate h, alors il est facile à voir que l’auto-
*

pondération est achevée dans la strate h par un échantillon prit constant mh dans tous les grappes
nh mh
puisque f h = est une constante dans la strate h.
Xh

Dans la pratique il n’est pas possible que x hk = x hk pour tous les h et k, surtout lorsque le
*

dernier recensement n’est plus neuf. En conséquence, on a besoin d’une coordination des échantillons
pour réaliser l’auto-pondération. Soient f h et m h le taux de sondage calculé et la moyenne de
fh X h
l’échantillon prit par grappe dans la strate h selon l’allocation de l’échantillon avec mh = ; le nombre
nh
de ménages à tirer dans la grappe k du strate h pour arriver à un échantillon auto-pondéré est donné
par

f h X h x hk
*
x*
mhk =  = mh  hk
nh x hk x hk

qui est une fonction du ratio du nombre de ménages dénombrés sur le nombre de ménages donnés
dans le base de sondage pour chaque grappe. La formule ci-dessus montre qu’il faut prendre plus de
ménages que la moyenne s’il on dénombre plus ou prendre moins de ménages que la moyenne s’il on
dénombre moins. La formule montre également que le taux de sondage n’est pas un paramètre
nécessaire pour le calcul de l'échantillon prit. Utiliser la moyenne de l'échantillon prit par grappe est une
méthode plus directe car le taux de sondage est un nombre abstrait. Cette formule est utilisée dans les
programmes de tirage de ménages auto-pondérés présentés au chapitre 3, section 3.2. La relation entre
l'échantillon prit et la probabilité de tirage de la grappe est donnée par

f h x hk
*

mhk =
 hk

Pour des raisons pratiques, l'échantillon prit calculée ci-dessus doit être ajusté s’il est trop petit
ou trop grand. Habituellement nous appliquons un seuil de troncature pour contrôler l'échantillon prit
dans une gamme d'un minimum de 10 ménages et un maximum de 50 par grappe. Quand on appliqué
la troncature dans une grappe, l'échantillon n’est plus d’auto-pondéré.

Les avantages et les inconvénients d’un échantillon auto-pondéré peut se résumer comme:

Avantage:

1) Egalité dans la représentation pour tout le monde dans la strate d’échantillonnage.

2) Réduction des erreurs d’échantillonnage.

Inconvénient:

1) Difficulté pour gérer l’enquête (par exemple, la distribution de la charge de travail) à cause
des échantillons prit variant par grappe.

2) Difficulté de contrôler la taille de l’échantillon attendue suite à des possibles troncatures,


surtout quand on utilise la limite supérieure de troncature.

3) L’auto-pondération n’est pas exacte en raison de l'arrondi de l'échantillon prit et cela


apportera des biais dans les estimations de paramètres.

4) L'auto-pondération au niveau national cassera l’allocation de l'échantillon spécifique conçu


pour des domaines et forcera l’allocation de l'échantillon à une allocation proportionnelle.

18
Il est possible de surmonter le deuxième et le troisième inconvénient grâce à un calcul récurent
de l'échantillon prit en redistribuer les résidus de troncature au reste des grappes dans la strate ou de
la zone de contrôle, ou en utilisant un échantillon prit aléatoire qui permet de prendre les nombres
décimaux comme taille de l'échantillon. Les programmes en Excel pour la procédure traditionnelle et la
procédure modifiée sont disponibles.

1.10 Dénombrement des Ménages et la mise à jour de la carte


L'opération de dénombrement des ménages et la mise à jour des cartes sont des opérations
fondamentales dans les enquêtes EDS. Une fois que les ZDs ont été sélectionnées pour l’enquête, on
effectue un dénombrement complet des unités d'habitation/ménages et une mise à jour des cartes dans
les ZD sélectionnées avant le tirage de ménages à enquêter. L'opération de dénombrement consiste à
visiter chacune des grappes sélectionnés, recueillir les coordonnées géographiques de la grappe,
designer une carte de l'emplacement de la grappe (ou un plan de situation) ainsi que d'un croquis
détaillé de toutes structures vues dans la grappe, et enregistrer sur la fiche de ménage une description
de toutes les ménages trouvés avec l’adresse, le nom du chef de ménage, l’état d’occupation (habité ou
vacant), et d'autres caractéristiques qui aidera les enquêteur de relocaliser un ménages tiré précisément
et facilement. LE dénombrement de ménages et la mise à jour de la carte représente un coût important
dans l’enquête, mais il est essentiel de garantir un mis en œuvre exacte de l’enquête et la bonne qualité
de donnée.

L'opération de dénombrement est une procédure importante pour réduire les erreurs non dues
à l’échantillonnage, en particulier lorsque la base de sondage est obsolète. L'opération de
dénombrement fournit une liste complète des ménages résidentiels occupés dans la ZD. Cette
information est nécessaire pour un tirage aléatoire de ménages dans la deuxième degré. Avec le
dénombrement des ménages avant le enquête principale, il est possible de présélectionner l'échantillon
ménages à l'avance, ainsi, les enquêteurs sont demandés d’enquêteur que les ménages présélectionnés
et non autorisation de remplacer les ménages non-répondants pour évider des biais. Avec le croquis et
le dénombrement de ménages, les ménages échantillonnés peuvent être facilement et précisément
relocalisés par les enquêteurs plus au moment de l’enquête principale. La procédure de travail sur le
terrain pour les enquêtes EDS est conçue pour qu’elle soit répétable et permet donc une surveillance
facile; tous ces éléments sont conçus pour réduire les erreurs non dues à l’échantillonnage, qui sont
souvent les erreurs les plus importantes et difficiles à analyser après l’enquête.

Quelques fois, on propose que le dénombrement puisse être évité en faisant des segments si
petits qu’il soit taille égale à l’échantillon “prit” (segment compact) par grappe, et un seul segment sera
tiré pour inclure dans l’enquête. On pourrait alors, utiliser l’échantillon “prit-tout” dans le segment tiré.
Cependant, des segments aussi petits seront difficiles à délimiter. Dans des zones urbaines on peut
réduire cette difficulté en adoptant des blocs ou des bâtiments individuels comme des segments, mais
les unités urbaines de ce type sont souvent homogènes et, par conséquent, il n’est pas idéal du tout de
créer des segments compacts.

Il n’est pas acceptable, non plus, d’essayer d'éviter le dénombrement en procédant des
interviews au fur et à mesure avec des ménages à enquêter décidé par les enquêteurs sans en avoir
une liste complète de ménages, ou en sélectionnant l'échantillon des ménages à intervalles fixes au
cours d'une marche aléatoire jusqu'à un quota prédéterminé. Ces méthodes ne sont pas acceptables
parce que premièrement, ils ne garantissent pas une probabilité égale et non nulle à chaque répondant
potentiel; deuxièmement, la procédure n’est pas répétable, ce qui complique la supervision de travaille
sur le terrain; et troisièmement, on peut se retrouver avec un échantillon consiste des unités faciles à
accéder en raison de manque de l'effort pour faire des appels aux ménages ou individus qui ne soient
pas disponibles ou refusent lors du premier contact.

Les coûts de dénombrement peuvent être réduits en utilisant la segmentation pour réduire la
charge de travail dans des grappes avec une taille très importante. Toutefois, la segmentation génère
ses propres coûts aussi, et nécessite des techniques et compétences dans la création et l’interprétation
des cartes. La segmentation devient progressivement plus difficile à mesure que les segments
deviennent plus petits, car il n'y a pas suffisamment de limites naturelles pour délimiter des très petits
segments. En outre, la concentration de l'échantillon ménages en petits segments augmente l'erreur
19
d'échantillonnage. Puisque les caractéristiques des voisins sont souvent très cohérents, un petit segment
capture moins de la variété existante dans la population, ce qui conduit à un échantillonnage moins
efficace. Il existe un point au-delà duquel il n'est pas utile de tenter une segmentation plus fine. En
générale, la taille moyenne du segment ne doit pas être inférieure à 500 en population (environ 100
ménages) dans les zones urbaines et rurales. Toutefois, la segmentation a un effet moins économique
dans les zones urbaines parce que les ZD urbains ont en générale un petit étendu géographique.

Il est fort probable que certains outils traditionnels dans le processus de dénombrement de
ménages soient modifiés à l'avenir en utilisant des technologies plus sophistiquées comme l’ordinateur
portable et le système de positionnement géographique (GPS) afin de recueillir des informations
numérisées et plus précises pour les ZD sélectionnées. Avec ces nouveaux outils, nous pouvons produire
une liste des ménages avec tous ses identifiants plus leurs coordonnées GPS pour chaque
structure/ménage. Ce fichier peut être utilisé directement pour le tirage de ménages par le programme
CAPI et que les ménages tirés pour l’enquête peuvent être relocalisés précisément au moment de la
collecte principale. Les technologies avancées peuvent simplifier le travail et résulter des travails à haut
qualité, mais les principes de la procédure de dénombrement restent les mêmes. Voir Chapitre 2 pour
plus de détails sur la procédure de dénombrement des ménages.

1.11 Tirage de ménages au bureau central


Après l'opération de dénombrement des ménages, une fois que le bureau central reçoit les
matériaux de dénombrement complets pour une grappe, ils doivent, avant tout, créer un numéro
séquentiel de ménages en commençant par 1 et en continuant à la fin, en parcourant tous les ménages
occupés dénombrés dans la grappe. On entend par « ménage résidentiel occupé » les ménages qui sont
occupés au moment du dénombrement, même si le ménage a refusé de coopérer, ou s’ils étaient absents
lors du dénombrement mais les voisins ont confirmé qu’ils seraient au retour lors de l’enquête principale.
Seulement les ménages résidentiels occupés devraient être numérotés. Ce numéro séquentiel servira
comme l’identifiant (ID) pour les ménages. La procédure de tirage de ménages sera réalisée en base de
ce numéro séquentiel. Qu’un ménage soit habité ou non au moment du dénombrement est très
important car le fait sera en relation à la proportion des ménages vacants dans l’enquête principale.

Le programme MEASURE EDS utilise des procédures différentes pour tirer les ménages à
enquêter à partir du fichier de dénombrement, entre lesquels:

1) Tirage systématique à probabilité égale: à partir d'un point de départ tiré aléatoirement, tire
un ménage à un pas constant (pour plus de détails voir chapitre 3, section 3.2)

2) Tirage systématique à probabilité égale et par lot: à partir d'un point de départ tiré
aléatoirement, tire un lot de ménages voisinés, par exemple 5 ménages. Plusieurs lots
peuvent être tirés dans une grappe. En fait, cette procédure tire des lots avec le tirage
systématique à probabilité égale. Tirage des ménages par lot peut réduire considérablement
les voyages dans les grappes lors de la collecte de données, en particulier dans les grappes
rurales où les ménages peuvent être très dispersés. Mais il peut réduire la représentativité
de l’échantillon car les ménages voisinés peuvent être cohérents.

Les avantages du tirage des ménages dans le bureau central peuvent se résumer comme:

1) Il permet un contrôle de la qualité et la couverture des résultats du dénombrement avant


l’enquête principale et pour l'examen et éventuellement re-dénombrement de grappes
problématiques

2) Les ménages échantillonnés sont prédéterminés ce qui évite les biais potentiels en
permettant aux enquêteurs de sélectionner sur le champ les ménages à enquêter

3) La procédure de travail sur le terrain est parfaitement reproductible, ce qui permet de


superviser facilement et étroitement le travail sur le terrain

4) Il est plus facile de contrôler la charge de travail pour chaque équipe

20
Cependant, dans les cas où voyager entre les grappes représente un coût important, il est
possible de renoncer le tirage de ménages au bureau central. Dans de tels cas, l'opération de
dénombrement des ménages et l’enquête principal peuvent être combinées dans une seule opération
de terraine. Les principes de la procédure de dénombrement restent les même, mais un croquis détaillé
peut être optionnel car le même équipe qui fait le dénombrement va faire le tirage de ménages et
l’enquête principale immédiatement après le dénombrement, alors, relocalisation de ménages tirés n’est
plus un problème par rapport à une opération de dénombrement séparée. Le tirage de ménages peut
être fait manuellement sur le terrain ou par un ordinateur portable s’il est disponible. Certaines
procédures de tirage manuel ont été élaborées à cet effet. Le dénombrement des ménages et la collecte
principale sont deux emplois très différents, donc lors des enquêtes où le dénombrement, le tirage de
ménages et l'enquête principale seront lieu dans la même visite et par les mêmes personnels, il peut
être nécessaire de procéder à une formation plus poussée sur les taches différentes avant le début du
travail de terrain et de superviser le travail de plus près et plus attentif. Voir chapitre 3, section 3.2.2
pour plus de détails pour le tirage manuel de ménages sur le terrain.

1.12 Enquête auprès des ménages


Les procédures des entretiens de ménages et des individus n’entrent pas dans le cadre de ce
manuel car ils sont expliqués en détail dans le manuel des enquêteurs. Cette section examinera
brièvement les principaux points statistiques concernant les enquêtes auprès des ménages. Après les
tirages de l’échantillon grappe et de l’échantillon ménage, les enquêteurs seront recrutés et formés pour
les entretiens auprès des ménages et les entretiens auprès des individus. La formation principale des
enquêteurs est une formation intensive pour une durée d'au moins quatre semaines pour les enquêtes
EDS standards, et plus si l’enquête comprend de nombreux biomarqueurs ou des modules spécifiques.
Avant la formation, on fera un pré-test du questionnaire dans un petit nombre de grappes non
sélectionnés pour l'enquête principale pour tester les questionnaires et la compréhension des traductions
par les enquêteurs et les répondants. Les problèmes et erreurs potentielles observées dans le pré-test
seront abordés et résolus avant la formation principale. Finalement, les équipes des enquêteurs seront
envoyés aux grappes sélectionnées avec une certaine charge de travail par équipe.

Une fois la formation principale complète, on assignera une liste de grappes à chaque équipe et
leur envoyé sur le terrain. Après leur arrivée à une grappe, l’équipe doivent, avant tout, contacter les
autorités locales afin qu’ils les aident à identifier la grappe correctement et pour solliciter leur
coopération pendant le travail sur le terrain. On désignera aussi un chef d’équipe pour chaque équipe.
Le chef d’équipe est responsable sur l’identification de la grappe et doit garantir que le travail soit de
bonne qualité. Après vérification des matériaux de dénombrement et avec les autorités locales, le chef
d’équipe distribuera les ménages à enquêter prédéterminés entre les enquêteurs.

Après localiser un ménage sélectionné l’enquêteur commencera avec un bref entretien à l’aide
d’un questionnaire ménage, auprès d’un répondant de ménage, un membre de ménages qui est
compétant pour répondre aux questions sur le ménages et ses autres membres. Tous les membres de
ménages aussi que tous les visiteurs du ménage seront dénombrés et tous les femmes et hommes
éligibles pour l’enquête individuelle seront identifiés.

L’omission consciente des individus éligibles de la part d'un enquêteur par fausse déclaration de
leur âge en dehors du groupe d'âge éligible est une préoccupation réelle. Des mesures visant à éliminer
ce genre de problème doivent être prise au départ. Par exemple, l'éditeur de terrain doit vérifier la
cohérence de chaque questionnaire rempli et, si on identifie des choses suspectes, il devrait revenir au
ménage pour une vérification plus profonde les éléments clés tels que le nombre de membres du
ménage, nombre des individus éligibles et le nombre d'enfants de moins cinq ans.

En cas de non-réponse ou de non contact pour un ménage ou une personne éligible dans la
première visite, l'enquêteur doit faire au moins deux visites répétées, ou des rappels, à des jours
différents et à heures différentes de la journée avant que l'entretien soit abandonné. Le processus de
rappels nécessite que les équipes restent dans une grappe pendant au moins deux à trois jours. Certains
pays proposent de nombreuses équipes d'enquêteurs afin d'essayer de compléter une grappe en une
seule journée. Ce processus n’est pas acceptable pour une enquête EDS, même lorsque la taille de
l'échantillon conçue peut supporter un taux de non-réponse relativement élevé, parce que les non-
21
réponses nuent les résultats de l’enquête. Une enquête rapide se termine généralement par une
mauvaise qualité de données. La théorie et la pratique prouvent que les rappels et les efforts pour
enquêter les unités difficiles sont la meilleure façon d'éliminer les biais et de réduire les erreurs non
dues à l’échantillonnage à un minimum. Pour plus de détails, reportez-vous au manuel des enquêteurs
de l’EDS.

1.13 Calcul du poids de sondage


1.13.1 Pourquoi devons-nous pondérer les données des enquêtes
Un échantillon EDS est un échantillon représentatif sélectionné au hasard de la population cible.
Chaque unité enquêtée (ménages et individus) représente un certain nombre d'unités similaires dans la
population cible. Pour que les inférences statistiques tirées des données de l’enquête soit valide, on doit
prendre cette représentativité de l'échantillon en compte. En termes généraux, les poids de sondage
sont utilisés pour rendre l'échantillon plus semblable à la population cible, en échelle de grandeur et en
distribution. Toutes les analyses devraient utiliser les poids de sondage calculés pour chaque ménage
et pour chaque individu enquêté, respectivement.

Les poids de sondage sont des facteurs d'inflation qui extrapole l’échelle de l'échantillon à
l’échelle de la population cible. Par exemple, si un échantillon à probabilité égale (ou un échantillon
auto-pondéré) est tiré dans une population cible avec un taux de sondage 1/500, cela signifie que
chaque individu échantillonnée représente 500 individus semblables dans la population cible. Par
conséquent, si nous avons observé qu’un individu en particulier possède une éducation secondaire, nous
pouvons conclure qu'il y a 500 individus dans la population cible qui ont une éducation secondaire,
correspondant à cette personne en particulier. Le nombre total d'individus avec une éducation
secondaire dans la population cible serait 500 fois le nombre total des individus interrogés qui ont une
éducation secondaire. Cette explication s’applique également à l'échantillonnage avec probabilités
inégales. Il est très important que les poids de sondage sont correctement calculés et appliqués dans
l'analyse des données; autrement des biais sérieux peuvent être introduits, menant à des conclusions
statistiques erronées.

Bien que tous les indicateurs EDS sont des indicateurs relatifs comme des moyens, des
proportions, ou des taux démographiques, car un échantillon auto-pondéré au niveau nationale n’est
généralement pas possible en raison des nombreuses domaines d’étude comme expliqué dans la section
1.9, les poids de sondage sont toujours nécessaires pour que les statistiques calculées à partir des
données d’enquête soient valides. Même un enquête est conçu pour être auto-pondéré à l'échelle
nationale, il est nécessaire de corriger les différents profils de réponse à travers des domaines/strates
(voir Section 1.13.4 pour plus de détails). Par conséquent, même les enquêtes avec une conception
d’enquête d’auto-pondération nécessitent l'utilisation de poids de sondage

Bien que l'effet des poids de sondage dans les enquêtes EDS soit faible sur les indicateurs
relatifs, il est nécessaire d'utiliser les poids de sondage pour les raisons suivantes :

1) Pour une inférence statistique valable.

2) Pour corriger ou réduire des biais; utilise les poids de sondage peut réduire les biais
représentatifs introduits par les allocations non proportionnelles de l’échantillon et les non-
réponses.

3) Pour garder la répartition de l'échantillon proche de la répartition de la population cible,


surtout quand le sur/sous échantillonnage est appliquée dans certains domaines/strates.

1.13.2 Poids de conception et poids de sondage


Le programme MEASURE EDS calcule tant les poids de conception que les poids de sondage (ou
poids de l’enquête) pour les ménages autant que pour les individus. Le poids de conception d'une unité
d'échantillonnage (ménage ou individu) est l'inverse de la probabilité globale dont l'unité ait été
sélectionnée dans l'échantillon. Le poids de sondage d'une unité d'échantillonnage est le poids de

22
conception corrigés pour la non-réponse ou d'autres calages nécessaires comme exemple la post
stratification.

Comme le protocole d’EDS implique la non-sélection des individus éligibles à l’intérieur d’un
ménage échantillonné (sauf pour le module de la violence domestique, dans lequel une seul femme
éligible par ménage est choisie par hazâra), toutes les femmes éligibles du même ménage partagent le
même poids, qui est le poids de conception de ménage. De plus, comme le tirage de ménage au
deuxième degré est un tirage systématique à probabilité égale, tous les ménages d’une même grappe
ainsi que ses individus partagent le même poids de conception. Le poids de conception est le poids de
base pour les enquêtes EDS. Tous les autres poids se calculent en base du poids de conception. Le poids
de sondage est calculé en corrigeant la non-réponse complète (une unité d’échantillonnage n’est pas
enquêtée) et C. La politique du programme MEASURE EDS est de corriger seulement la non-réponse
complète au niveau de strate d’échantillonnage (voir Section 1.13.4) et laisser la correction de non-
réponse partielle aux utilisateurs des données parce qu’elle est variable spécifique. La correction de non-
réponse au niveau de grappe augmentera la variation des poids de sondage et, en conséquence,
augmentera les erreurs de sondage. Cela veut dire que le poids EDS (les poids de conception et les
poids de sondage) sont des poids de grappe-tous les unités de sondage dans la même grappe partagent
le même poids sauf en cas de module spécifique où une degré de tirage supplémentaire est appliqué
pour atteindre à l’unité enquêté.

1.13.3 Comment calculer les poids de conception


En supposant qu'un échantillon de l’enquête EDS est tiré par grappe, stratifié à deux degrés, les
poids de conception seront calculés sur la base des probabilités de tirage pour chaque degré et pour
chaque grappe. Nous utilisons les notations suivantes:

P1hi: probabilités de tirage du premier degré pour le iéme grappe dans la strate h
P2hi: probabilités de tirage du deuxième degré pour le ième grappe (tirage de ménage) dans
la strate h

Soient nh équivaut le nombre de grappes sélectionnés dans le strate h; Mhi la mesure de la taille
de la grappe utilisé dans la sélection de le premier degré donnée dans la base de sondage, normalement
la mesure de la taille est le nombre de ménages résident dans la grappe ;  Mhi la mesure totale de la
taille du strate h. La probabilité d’inclusionner la ième grappe dans l’échantillon se calcule comme suit:

nh M hi
P1hi =
 M hi
Soit bhi la proportion de ménages dans le segment tiré par rapport au nombre total de ménages
dans la ZD i dans la strate h si la ZD est segmentée, autrement bhi = 1 . Alors, la probabilité
d’inclusionner la grappe i dans l’échantillon est:

nh M hi
P1hi =  bhi
 M hi
Soient Lhi le nombre de ménages dénombrés dans l’opération de dénombrement des ménages

dans la grappe i de la strate h; thi le nombre de ménages sélectionnés dans la grappe. La probabilité
d’inclusion de deuxième degré pour chaque ménage dans la grappe se calcule comme suit:

t hi
P2 hi =
Lhi
La probabilité globale de tirage de chaque ménage dans la grappe i de la strate h est le produit
des probabilités de tirage pour les deux degrés

23
Phi = P1hi  P2hi

Le poids de conception pour chaque ménage dans la grappe i du strate h est l’inverse de sa
probabilité globale de tirage:

d hi = 1 / Phi

Le calcul du poids de conception n’est pas compliqué; néanmoins, les difficultés sont souvent le
manque des paramètres de conception inclus dans le calcul parce qu’ils ne sont pas disponibles ou ne
sont pas bien documentés, spécialement quand le base de sondage est un échantillon maître. Voir
Chapitre 5 pour plus de détails sur la documentation de l’échantillon.

1.13.4 Correction de non-réponse complète et le calcul de poids de sondage


Les poids de conception calculés ci-dessus sont basés sur les paramètres de conception de
l'échantillon. S’il n'y a pas de non-réponse au niveau de grappe, au niveau des ménages et au niveau
individuel, les poids de conception sont suffisants pour toutes les analyses, pour les indicateurs de
ménages et ceux des individuels. Cependant, la non-réponse est inévitable dans toutes les enquêtes de
grande échelle et les différentes unités ont des comportements de réponse différents. L'expérience du
programme MESURE EDS montre que les ménages urbains répondent moins à l'enquête que leurs
homologues dans les zones rurales ; les ménages dans les régions développées répondent moins à
l'enquête que leurs homologues dans les régions moins développées ; les ménages riches répondent
moins à l'enquête que les pauvres ; les personnes ayant des niveaux de l’éducation élevées répondent
moins à l'enquête que ceux ayant des niveaux de l'éducation plus bas ; les hommes répondent moins à
l'enquête que les femmes, et ainsi de suite.

L'idée de corriger la non-réponse complète est de calculer les taux de réponse pour des groupes
homogènes en comportement de réponse à l’enquête, puis gonfler les poids de conception en le divisant
par le taux de réponses pour chaque groupe de répondants. La construction des groups homogène
dépend de la connaissance du comportement de réponse de l’unité d'échantillonnage. L’enquête EDS
utilise toujours la strate d'échantillonnage en tant que groupe de répondants parce que la stratification
est habituellement obtenue en regroupant des unités d'échantillonnage homogènes en une strate. Il est
possible d'utiliser une grappe en tant que groupe de répondants, mais l'inconvénient est que les taux
de réponses peuvent être trop variant au niveau de grappe, ce qui augmentera la variabilité du poids
de sondage, qui à son tour augmentera la variance des estimateurs. En outre, la correction de non-
réponse au niveau de grappe détruira l’auto-pondération si un échantillon auto-pondéré a été conçu.

En supposant que les groups de répondants coïncident avec les strates d'échantillonnage, les
degrés suivants expliquent comment calculer les poids de sondage en calculant d'abord les différents
taux de réponse. Veuillez noter que les taux de réponse calculés ici sont différents aux taux de réponse
calculés dans l'Annexe A du rapport final de l'enquête EDS. Dans l'annexe A, les taux de réponse des
ménages ou des individuelles sont calculées comme des ratios du nombre d'unités enquêtées sur le
nombre d'unités éligibles parce que le but est juste pour montrer les résultats de mise en œuvre de
l'enquête. Ici, nous utilisons des ratios pondérés parce que le but est de corriger le poids de conception
pour récompenser la non-réponse, donc le poids de conception devrait être impliqué. Un taux de réponse
pondéré pour la correction de la non-réponse est mieux que un taux de réponse non pondéré parce
qu'une unité non répondant avec un grand poids de conception aura un plus grand impact sur les
estimations qu’une unité non répondant avec un petit poids de conception.

1. Taux de réponse au niveau de grappe

Supposons que nh le nombre de grappes sélectionnées dans la strate h; nh* le nombre de grappes
enquêtées. La non-réponse au niveau de grappe se produit au cas d’une grappe entière n’a pas pu être
enquêtée à cause des raisons diverses, par exemple, à cause de raisons de sécurité ou de catastrophique
naturelle. Le taux de réponse au niveau de grappe dans la strate est calculé comme suit :

Rch = nh* / nh

2. Taux de réponse au niveau de ménage


24
Supposons que m hi le nombre de ménages trouvé (voir chapitre 2, Section 2.10 pour la
définition) dans la grappe i de la strate h; m hi* le nombre de ménages enquêtés dans la strate. Le taux
de réponse des ménages dans la strate h se calcule comme :

Rhh =  d hi mhi* /  d hi mhi


où d hi est le poids de conception de la grappe i dans la strate h, avec la somme sur toutes les grappes
enquêtées dans la strate h.

3. Taux de réponse individuelle

Supposons que k hi le nombre d’individus éligibles trouvés dans la grappe i de la strate h; k hi* le
nombre d’individus enquêtés. Le taux de réponse des individus dans la strate h se calcule :

Rph =  d hi khi* /  d hi khi


où d hi est le poids de conception de la grappe i dans la strate h, avec la somme sur toutes les grappes
et ménages enquêtés dans la strate h.

Pour chaque strate d’échantillonnage, les poids de sondage pour tous les ménages de la grappe
i dans la strate h se calcule en divisant le poids de conception de ménages par le produit du taux de
réponse de grappe et le taux de réponse de ménages :

Dhi = d hi /(Rch  Rhh ), pour la grappe i de la strate h.

Pour chaque strate d’échantillonnage, les poids de sondage individuel pour tous individus de la
grappe i dans la strate h se calcule en divisant les poids de sondage de ménages par le taux de réponses
individuels, ce qu’est équivalent de divisant le poids de conception de ménages par le produit des taux
de réponse : le taux de réponse de grappe, le taux de réponses de ménages et le taux de réponse
d’individus:

Whi = Dhi / Rph = d hi /( Rch  Rhh  Rph ), pour la grappe i de la strate h.

Il est facile de voir que la différence entre le poids de sondage des ménages et le poids de
sondage des individus est introduit par la non-réponse individuelle.

Les poids de sondage pour les ménages sélectionnés pour l'enquête auprès des hommes et les
poids de sondage pour les hommes peuvent être calculés de façon similaire. Nous avons besoin d'un
poids de sondage de ménages pour les ménages sélectionnés pour l'enquête auprès des hommes dans
le cas où l'enquête auprès des hommes soit menée dans un sous-échantillon de ménages sélectionnés
pour l'enquête auprès des femmes. L’expérience montre que les ménages répondent moins à l’enquête
s’il y a une enquête auprès des hommes par rapport aux ménages où il n’y a pas de l’enquête auprès
des hommes.

Si aucune normalisation n’est demandée, nous pouvons nous arrêter ici. Le poids de sondage
des ménages et le poids de sondage individuelle calculés ci-dessus peuvent être utilisés pour produire
des indicateurs au niveau des ménages et individuel, respectivement. Comme nous l'avons mentionné
plus tôt dans la section 1.13.1, un poids de sondage est un facteur d'inflation ou extrapolation. La
somme pondérée des ménages enquêtés

T =   Dhi mhi*
est une estimation du nombre total de ménages résidentiels ordinaires du pays; où m hi* est le nombre
de ménages enquêtés dans la grappe ith de la strate h, et la somme est sur toutes les grappes et les
strates d’échantillonnage, aussi que la somme pondérée de toutes les femmes enquêtées

W =   Whi k hi*

25
est une estimation du nombre total de femmes dans la population cible (femmes âgées de 15 à 49 ans)
du pays; où k hi* est le nombre de femmes enquêtées dans la grappe ith de la strate h, et la somme est
sur toutes les grappes et strates.

1.13.5 Normalisation des poids de sondage


La normalisation des poids de sondage n’est pas nécessaire pour l'analyse des données issues
d'une enquête par sondage. Afin d'éviter un grand nombre de cas pondérés dans les tableaux dans les
rapports finaux de l'enquête EDS, avec la tradition MEASURE EDS on calcule les poids standards
normalisés pour les ménages comme pour les individus. Avec le poids standard normalisé, le nombre
de cas non pondérés coïncide avec le nombre de cas pondérés au niveau national tant pour le total des
ménages comme pour le total des individus. Le poids standard normalisé d'une unité d'échantillonnage
est calculée en fonction de son poids de sondage, en multipliant le poids de sondage par une constante
unique au niveau national. La constante ou le facteur de normalisation est le nombre total de cas
enquêtés divisé par le nombre total de cas enquêtés pondérés par le poids de sondage.

Ce nombre est égal au taux sondage total estimé parce que le nombre total de cas enquêtés
pondérés par le poids de sondage est une estimation de la population totale ciblée. Par conséquent, les
poids standard normalisé dans les fichiers de données d’EDS sont des poids relatifs. Les poids relatifs
peuvent être utilisés pour estimer les moyennes, les proportions, les taux et les ratios parce que le
facteur de normalisation s’annule lorsqu'il s’utilise à la fois dans le numérateur et le dénominateur ;
alors, il n'a aucun effet sur les valeurs des indicateurs calculés. Ce point explique aussi pourquoi la
normalisation doit être faite au niveau national et non au niveau régional: au niveau régional, le facteur
de normalisation ne peut pas être annulé, et on introduira des biais dans les indicateurs calculés au
niveau national. Puisque les poids standard normalisés n’ont pas d'unité, ils ne sont pas valides pour
l'estimation des totaux. De plus, les poids normalisés ne sont pas valides pour des données fusionnées,
même pour les données fusionnées pour l’enquête de femmes et celle des hommes dans la même
enquête EDS, parce que les facteurs de normalisation sont spécifiques pour des enquêtes différentes
comme pour le sexe.

1. Poids standard normalisés des ménages3

Le facteur de normalisation pour calculer le poids standard des ménages est calculé comme

FH =   mhi* /   Dhi mhi*


Le poids standard des ménages pour la grappe i dans la strate h se calcule :

HV 005 hi = Dhi  FH = Dhi    mhi* /   Dhi mhi*

où HV005 est le poids standard des ménages, une variable dans les archives des données EDS
recodées.

Il est facile de voir que la somme pondérée des ménages enquêtés en utilisant le poids standard
est égale à la somme non pondérée des ménages enquêtés pour l'échantillon total. Cette condition ne
sera pas atteint au niveau de domaine ou pour les sous-populations. Au niveau du domaine, la somme
pondérée des ménages enquêtés peut être supérieure ou inférieure à la somme non pondérée des
ménages enquêtés, selon que le domaine soit sous-échantillonné ou sur-échantillonné.

2. Poids standard normalisés des femmes

Le facteur de normalisation pour calculer le poids standard des femmes est calculé comme

3
Le programme MEASURE DHS a développé des modèles Excel pour faciliter les calculs de poids standard. Si tous
les paramètres de conception et les résultats de l'enquête (nombre de ménages trouvés et enquêtés, nombre de
femmes éligibles trouvées et enquêtées, nombre d'hommes éligibles trouvés et enquêtés, par grappe) sont fournis
dans la page d'entrée, les poids standard seront calculés automatiquement dans différentes pages.
26
FW =   k hi* /   Whi k hi*
Les poids standard normalisés des femmes pour la grappe i dans la strate h se calculent :

V 005 hi = Whi  FW = Whi    k hi* /   Whi k hi*

où V005 est le poids standard des femmes, une variable dans les archives des données EDS
recodées.

Le poids standard normalisés pour les ménages et pour les hommes dans le sous échantillon
sélectionné pour l’enquête auprès des hommes peut être calculé de manière similaire.

1.13.6 Poids standard pour le test du VIH


Les poids de sondage pour le test du VIH sont calculés pour les femmes et pour les homes
séparément en utilisant la même méthodologie. La seule différence se trouve dans le calcul des facteurs
de normalisation, si un poids normalisé est demandé. Afin de calculer la prévalence du VIH pondérée
pour les femmes et les hommes ensembles, les poids standard normalisés pour le test du VIH doivent
être normalisés pour les femmes et les hommes ensembles. Dans la plupart des enquêtes EDS, le test
du VIH s’effectue dans le même sous-échantillon de ménages sélectionnés pour l'enquête des hommes,
et chaque femme et homme dans le ménage qui est éligible pour l’enquête individuel est éligible pour
le test du VIH. Une fois les poids de sondage des ménages pour l'enquête auprès des hommes sont
calculés en utilisant les procédures décriés dans la section 1.13.5, les poids de sondage pour le test du
VIH pour les femmes et les hommes peuvent être calculés séparément en corrigeant le poids de sondage
des ménages pour les non-réponses des femmes et ceux des hommes pour les test du VIH,
respectivement. Un individu est dit répondant pour le test du VIH s’il est éligible pour l’enquête
individuelle et enquêté et avec un code de résultat valable pour le test du VIH. Pour plus de simplicité,
soit MDhi le poids de sondage de ménages dans la grappe i de la strate h pour le sous-échantillon de
l'enquête des hommes, les taux de réponses au test du VIH pour les femmes et les hommes sont calculés
respectivement par

WR hi =  MDhi WHIV hi* /  MDhi WHIV hi


MRhi =  MDhi MHIV hi* /  MDhi MHIV hi

où WHIV hi est le nombre de femmes éligibles pour le test du VIH, et WHIV hi* est le nombre de femmes
enquêtées avec un code de résultat valable du test, dans la grappe i du strate h; MHIV hi et MHIV hi*
sont, respectivement, le nombre d’hommes éligibles pour le test et le nombre d’hommes enquêtés avec
un code de résultat valable du test, dans la grappe i du strate h.

Les poids sondage pour le test du VIH pour les femmes et les homes respectivement se calcul
comme

HIV hiW = MDhi / WR hi , HIV hiM = MDhi / MRhi

Dans la grappe i du strate h, les poids standard normalisés pour le test du VIH pour femmes et homes
respectivement sont calculés comme

HIV 05Whi = HIV hi 


W
(  WHIV *
hi )(
+   MHIV hi* /   HIV hiW WHIV hi* +   HIV hiM  MHIV hi* )
HIV 05 hi = HIV hiM 
M
(  WHIV *
hi )(
+   MHIV hi* /   HIV hiW WHIV hi* +   HIV hiM  MHIV hi* )
Où la double addition sont sur toutes les grappes et les strates dans l’échantillon total.

1.13.7 Dé-normalisation des poids standards pour des données fusionnées


Pour l'ensemble des données EDS, les variables de poids HV005 (poids de sondage standard
normalisé des ménages), V005 ((poids de sondage standard normalisé des femmes) et MV005 (poids
(poids de sondage standard normalisé des hommes) sont des poids relatifs normalisés pour que le
nombre total de cas pondérés soit égal au nombre total de cas non pondérés au niveau national, pour

27
les trois types d'unités respectivement. Dans certaines situations, telles que les analyses des données
fusionnées de plusieurs enquêtes, les utilisateurs de données peuvent avoir besoin les poids de sondage
non normalisés, comme mentionné dans la section 1.13.5, puisque la normalisation est spécifique aux
enquêtes et au sexe, alors, il est nécessaire de dé-normaliser les poids standard fournis dans les fichiers
de données EDS recodées.

La procédure de normalisation pour l'échantillon total consiste à multiplier le poids de sondage


par un facteur de normalisation. Le facteur de normalisation pour chaque type d'unité d'échantillonnage
est le taux de sondage total estimé: le nombre des cas enquêtés divisé par le nombre de cas enquêtés
pondérés en utilisant le poids de sondage. Le nombre de cas pondérés avec le poids de sondage est une
estimation du total de la population cible. Par conséquent, afin de dé-normaliser un poids normalisé, il
suffit de diviser le poids normalisé par le taux de sondage. Le taux de sondage total estimé n’est
généralement pas fourni dans le fichier de données EDS ou dans le rapport final. Pour calculer le taux
de sondage, il est nécessaire de connaître le total de la population cible au moment de l'enquête. Le
total de la population cible au moment de l'enquête est facile à obtenir par des divers sources. Les trois
sources qui peuvent être faciles d'accès sont le bureau de statistique du pays, la perspective de
population mondiale du PNUD (United Nations Population Division) et le Fonds des Nations Unies pour
la population (FNUAP)

Comme mentionné ci-dessus, si l'analyse des données fusionnées est nécessaire, les variables
de poids standard dans les données d’EDS, HV005, V005 et MV005 doivent être dé-normalisés. La
procédure de dé-normalisation est l'inverse de la procédure de normalisation pour chaque enquête: c’est
à dire, multiplier le poids standard par la population cible et diviser par le nombre de cas complétés. Les
poids dé-normalisés pour les ménages, les femmes et les hommes (HV005 *,V005* et MV005 *,
respectivement) peuvent être calculées en utilisant les formules suivantes:

HV005* = HV005 × (nombre total des ménages résidentielles dans le pays)/


(nombre total de ménages enquêtés dans l’enquête)

V005* = V005 × (population total féminine 15 à 49 ans dans le pays)/


(nombre total de femmes 15 à 49 ans enquêtées dans l’enquête)

MV005* = MV005 × (population total masculine 15 à 49 (15 à 59) ans dans le pays)/
(nombre total d’hommes 15 à 49 (15 à 59) ans enquêtés dans l’enquête)

Si on préfère des poids normalisés, les poids dé-normalisés ci-dessus peuvent être ré-
normalisées en multipliant par le nombre total de cas enquêtés dans les données fusionnées, en divisant
par le nombre total de cas enquêtés pondérés en utilisant les poids dé-normalisés.

Notez que la normalisation des poids de sondage se fait pour l'échantillon total pour les
ménages, pour les femmes et les hommes séparément. Si l'objectif est de calculer des indicateurs pour
un certain sous-population à partir des données fusionnées, par exemple, la couverture de vaccination
pour les enfants de 12 à 23 mois, la dé-normalisation n'a rien à voir avec la population totale des enfants
de 12 à 23 mois car il n’y a pas de poids standard normalisé pour les enfants de 12 à 23 mois dans les
enquêtes EDS. Si l'indicateur est calculé au niveau de ménages utilisant le poids des ménages, les poids
standard des ménages doivent être dé-normalisés pour toutes les enquêtes incluses dans l'analyse,
comme expliqué ci-dessus; de même, si l'indicateur est tabulé au niveau individuel en utilisant le poids
des femmes (ou de la mère de l'enfant), le poids standard des femmes doivent être dé-normalisé pour
chacune des enquêtes.

1.14 Calage sur marges


Le calage généralisé (Deville et Särndal, 1992; Deville et al, 1993) est maintenant devenu une
base populaire et puissant dans l'analyse des données issues des enquêtes par sondage pour les bureaux
statistiques dans de nombreux pays. Il permet l'utilisation de différentes sources d'information auxiliaire
pour améliorer les estimations tirées des enquêtes par sondage. Le calage peut réduire les erreurs dues

28
à l'échantillonnage, peut corriger la distorsion causé par la non-réponse et d'autres erreurs non dues à
l'échantillonnage, et peut réduire l'influence des valeurs extrêmes. Le calage est une procédure
“d’ajustement de poids" de telle sorte que le poids de sondage réglé peut produire des estimations sans
erreur pour des caractéristiques connues de la population totale. La précision d'un estimateur qui utilise
un poids calibré équivaut à un estimateur en régression mais il est beaucoup plus facile à calculer à
l'aide de logiciel de calage sur marge tel que le CALMAR, une procédure Macro SAS développée par
l'Institut National de la Statistique et des Études Économiques (INSEE) Français, et la procédure SPSS
développé par la Statistique Belgique. Les enquêtes EDS utilise le calage du poids de sondage
uniquement dans des cas où on observe une distorsion importante dans les données recueillies, et qu’il
y a des informations auxiliaires fiables qui sont disponibles.

Soit X à une variable auxiliaire multivariée avec p composants de tel manière qu’on connais à
l’avance les totaux de la population totale de chaque variable composant du recensement le plus récent,
c’est à dire, t x =  X i = (t x , t x , ..., t x ) est connu. Soient xi les observations des variables auxiliaires

1 2 P
iU

de l’enquête, x i = (x1i , x2i , ... , x pi ) , pour l'unité d'échantillonnage répondant i, Di le poids de sondage

de l’unité i. La procédure de calage consiste à modifier légèrement le poids de sondage Di à Wi de


telle sorte qu'une mesure de la distance donnée entre les poids de sondage Di et les poids calés Wi

 g(Wi ,Di )
is

soit minimisée sous les contraintes

Wi xi = tx
is

où g est une fonction de distance qui mesure la distance entre Di et Wi . Les contraintes imposées sont
que les totaux des variables auxiliaires connues sont estimés sans erreur avec les poids calés. Si la
variable d'intérêt est en bonne corrélation avec les variables auxiliaires, alors nous attendons que la
précision peut être largement améliorée pour estimer le total de la variable d'intérêt. La théorie du
calage précise que les poids calés sont donnés par la formule suivante

(
Wi = Di F qi x i (s) )
où F (•) est appelée fonction de calage qui est l'inverse de la dérivée de la fonction de distance g; qi est
un poids de calage qui est habituellement mis à 1 dans le manque de connaissance préalable; (s) est
( )
un constant dépendant de l'échantillon particulier s qui doit être résolu. Quand F x i (s) = (1 + qi x i (s))

, ce qui correspond à l'un des cinq fonctions de calage proposés dans Deville et al, 1993, il est facile de
résoudre, (s) est donné par

(s) = Ts−1 (t x − tˆx )

avec

Ts =  Di qi xi x i
is

Pour une variable d'intérêt y, l'estimateur calé du total de la population est équivalent à l'estimateur
par la régression généralisée

tˆy =  Wi y i ˆ (t − tˆ )
= tˆy + B s x x
is

ˆ = T −1  q D x y est l’estimation du coefficient de régression; tˆy et t


où B ˆx sont des estimateurs de
s s i i i i
is

totaux en utilisant le poids de sondage

tˆy =  Di y i , tˆx =  Di x i
is is

Une estimation de la moyenne pour la variable d'intérêt y peut être calculée par

29
 Wi y i
Yˆ = is

 Wi
is

L'estimateur calé sur des proportions connues peut être formulé de manière similaire avec des
proportions connues d'un ou plusieurs variables auxiliaires. Le calage peut être effectué au niveau
individuel, qui se traduira par un poids spécifique individuel, ou il peut être effectué au niveau de la
grappe avec des données agrégées, qui se traduira par un poids de grappe. Pour plus de détails, voir
les références donnés à la fin de ce document.

1.15 Rapport sur la qualité de données et les erreurs de sondage


La qualité des données est toujours une préoccupation majeure pour tous les projets MEASURE
EDS. Bien qu’on fasse de nombreux efforts pour mettre en œuvre les enquêtes EDS pour maximiser la
qualité des données recueillies, les erreurs non dues à l'échantillonnage sont toujours les principales
préoccupations de la qualité des données. La qualité des données d'une enquête affecte directement la
fiabilité des statistiques produites. De nombreux pays ont des lois qui exigent dans les rapports de
résultats de l'enquête d’inclure une évaluation de la qualité des données et la fiabilité des conclusions
statistiques. La qualité des données peut être mesurée par la totalité des erreurs inclues dans les
données collectées, y compris les biais introduits par diverses erreurs dues ou non dues à
l’échantillonnage.

Les rapports finaux de l’EDS comprennent généralement des tableaux dans une annexe à des
fins d'évaluer de la qualité des données y compris: la répartition de la population des ménages par âge
selon le sexe; répartition des femmes et des hommes éligibles et interrogés par âge; rapports complets
des date de naissance, l'âge au décès, l'âge/la date à la première union, l'éducation et les mesures
anthropométriques, etc. Le programme MEASURE EDS mène également des études approfondies sur la
qualité des données pour des sujets spécifiques, qui sont fournis dans des rapports publiés.

Outre les tableaux de la qualité des données, les rapports finaux EDS fournissent les erreurs de
sondage pour une liste des indicateurs sélectionnés dans l’Annexe B. Les erreurs de sondage sont des
mesures de fiabilité importantes qui signalent à l'utilisateur le degré d'erreur associée à une estimation
ponctuelle pour indicateur particulier, le nombre de cas impliqués dans le calcul de l'indicateur, les effets
de grappe en utilisant un échantillon complexe par rapport à un échantillonnage aléatoire simple et
l’entendu de la valeur vrais d'un indicateur à un certain niveau de confiance. Se référer au chapitre 4,
section 4.2 pour plus de détails sur les erreurs de sondage et leur calcul.

Les rapports finaux d’EDS fournissent également une annexe sur la conception d'échantillon de
l’enquête. Le document de conception de l'échantillon indique la méthodologie d'enquête utilisée pour
collecter les données, y compris le but de l'enquête, la base de sondage, la population cible, la taille de
l'échantillon, les domaines d’étude, la stratification et l’allocation de l'échantillon, la procédure de tirage
de l'unité primaire et de l’unité secondaire échantillon, la correction pour la non-réponse, le calcul du
poids de sondage, le calage sur marge et les résultats de mise en œuvre de l'enquête. Voir le chapitre
5, section 5.2 pour plus de détails sur la conception de l'échantillon.

1.16 Documentation de l’échantillon


La tâche d'un statisticien d'enquête ne s’arrête pas après la sélection de l'échantillon. La
documentation de l'échantillonnage est un point essentiel pour le calcul du poids de sondage, l’analyse
des données, le calcul des erreurs de sondage, pour l'évaluation de la qualité des données, pour établir
des liens avec d'autres sources de données et pour divers types de contrôles et des études
complémentaires. Si la tâche de la documentation de l'échantillon doit être effectuée efficacement, des
efforts particuliers sont nécessaires au moment de la conception de l'échantillon, à la fin du travail sur
le terrain et au moment de finaliser le fichier de données. Si la documentation n’est pas faite au moment
approprié, il faudra des efforts considérables pour reconstituer les informations manquantes lorsque
cela est nécessaire.

La documentation de l'échantillon doit être conforme aux exigences de confidentialité de


l’enquête. Lorsqu’on effectue un dépistage VIH dans une EDS ou AIS (Enquête sur les indicateurs du

30
sida), les protocoles de l’enquête exigent la destruction complète de tous les documents intermédiaires
qui peuvent potentiellement être utilisées pour identifier un ménage ou un individu spécifique ayant
participé à l'enquête. Cette exigence renforce l'importance de la documentation de l'échantillon en temps
opportun. Voir le chapitre 5 pour les exigences détaillées dans la documentation de l'échantillon.

1.17 La confidentialité
Les fichiers de données finales des enquêtes EDS sont mis à la disposition des chercheurs
intéressés. Par conséquent, la confidentialité des informations privées recueillies auprès des répondants
individuels est une préoccupation majeure, en particulier lorsque des informations sensibles telles que
l'activité sexuelle et le statut du VIH sont collectées. Protéger la confidentialité des individus répondants
n’est pas seulement une obligation éthique, mais il favorise également des données de bonne qualité
parce que les répondants sont plus susceptibles de fournir des réponses véridiques s’ils sentent la
confiance que leurs informations seront maintenu privées.

Les enquêtes EDS suivent des règles strictes imposées à divers degrés au cours de mise en
œuvre de l'enquête pour empêcher la divulgation, directe ou indirecte, de l'identité des répondants. Les
principaux éléments d'information qui peuvent aider d'identifier indirectement un répondant sont le
numéro original de la grappe, le numéro de ménage, et la probabilité d’inclusion de la grappe. Le numéro
original de la grappe est un identifiant important pour la gestion de l’enquête, pour les calculs de poids
de sondage des erreurs de sondage; le numéro de ménage est un identifiant important pour la gestion
et la tabulation des données au niveau des ménages et individuel; la probabilité d’inclusion de la grappe
est utile pour la modélisation au niveau de la grappe, et les poids de sondage est nécessaire pour toutes
les analyses de données. Donc, ces variables doivent être présents dans le fichier de données final. Le
numéro de ménage dans le fichier final de données EDS n’est pas informative ni le poids de sondage
après la correction de non-réponse et de la normalisation. La probabilité d’inclusion de la grappe est
potentiellement informative uniquement si les informations d'identification au niveau inférieur de la
région, tel que le district et la localité, sont présents dans les fichiers de données finales. Ainsi, la seule
préoccupation est la divulgation du numéro originale de la grappe. Pour les enquêtes EDS ou AIS avec
le dépistage du VIH, les fichiers de données finales fournissent les numéros brouillés pour les grappes
et les ménages pour plus d'assurance contre la divulgation, et ils ne fournissent pas d’information
géographique en dessous du niveau de la région ou du domaine d'enquête.

31
2 DÉNOMBREMENT DE MÉNAGES ET LA MISE A JOUR DE CARTES
2.1 Introduction
Les enquêtes EDS utilisent des échantillons nationaux représentatifs pour fournir des
informations sur les niveaux de fécondité, de la mortalité infantile, l'utilisation de la planification
familiale, les connaissances et attitudes vis à vis du VIH/SIDA et d'autres infections sexuellement
transmissibles (IST), et sur d'autres indicateurs de bien-être de la famille et de la santé. Les enquêtes
interrogent généralement les femmes de 15 à 49 ans et les hommes 15 à 59 ans (15 à 49 ans ou 15 à
54 ans dans certaines enquêtes) résidants dans des ménages ordinaires. Les femmes et les hommes à
enquêter vivent dans des ménages résidentiels ordinaires, choisis au hasard à partir d'un ensemble de
points d'échantillonnage ou grappes qui comprennent des ménages ordinaires. Avant l'enquête, tous les
ménages situés dans les grappes sélectionnées seront dénombrés. Les ménages dénombrés de chaque
grappe sera utilisé comme base de sondage pour sélectionner l'échantillon de ménages à inclure dans
l'enquête EDS.

L'opération de dénombrement et de mise à jour de la carte consiste à visiter chaque grappe


sélectionnée, à identifier les limites de la grappe, à établir un plan de situation et un croquis détaillé de
la grappe, et à enregistrer sur la fiche des ménages une description de chaque ménage avec le nom du
chef de ménages et l’adresse du ménage résidé dans la grappe. Ces matériaux guideront aux enquêteurs
à retrouver les ménages sélectionnés facilement et permettront que les superviseurs de travail sur le
terrain effectuent un contrôle de la qualité lors de la collecte de données.

Les sections suivantes présentent les directives générales pour mener une opération de
dénombrement de ménages et la mise à jour de la carte. Des modifications peuvent être nécessaires
pour s’adapter aux situations spécifiques à chaque pays.

2.2 Définition de termes


Voici de brèves définitions des termes utilisés dans ce manuel de dénombrement.

Une Zone de Dénombrement (ZD) est une unité statistique géographique qui contient un certain
nombre de ménages, créé pour le besoins d’un recensement général de la population de l’habitat. Une
ZD s’agit, généralement, un pâté de maisons dans les zones urbaines et un village, ou une partie d'un
grand village ou un groupe de petits villages dans les zones rurales avec son emplacement et ses limites
bien définies et enregistrées sur des cartes de recensement.

Une carte de base est une carte de référence d’une ZD produit pour le besoin de recensement.
Elle montre les limites de la ZD avec ses principales caractéristiques physiques telles que des routes et
des points de repère.

Une grappe est une unité d’échantillonnage statistique qui est la plus petite unité géographique
pour les enquêtes EDS. Il se compose d'un certain nombre de ménages voisinés dans une zone
géographique. Pour les enquêtes EDS, une grappe correspond soit à une ZD entière ou un segment
d'une grande ZD.

Une structure est un bâtiment à usage d'habitation ou commercial. Elle contient une ou plusieurs
pièces et peut être composée d'une ou de plusieurs unités d'habitation, par exemple : villa moderne,
maison isolée, immeuble à appartements, parcelle ou carré clôturé (milieu urbain), concession (milieu
rural). Dans le cas où un seul ménage habite plusieurs cases, comme dans le milieu rural, l'ensemble
des cases, clôturé ou non, constitue une structure.

Une unité d'habitation est l'ensemble des locaux désignés pour loger un ménage, par exemple :
une maison, un appartement, un groupe de pièces dans un carré ou une concession. Mais une unité
d’habitation peut loger plusieurs ménages dans la réalité.

32
Un ménage (ordinaire) est un ensemble de personnes apparentées ou non reconnaissant
l'autorité d'un même individu, un homme ou une femme adulte de 15 ans ou plus, appelé "Chef de
ménage". Elles habitent le plus souvent dans la même unité d’habitation. Elles prennent le plus souvent
leurs repas ensemble et partagent les dépenses courantes du ménage. Des exemples de ménage sont:

• Un homme avec son épouse ou ses épouses, avec ou sans enfant.


• Un homme avec son épouse ou ses épouses avec leurs enfants non mariés et ses parents.
• Un homme avec son épouse ou ses épouses vivant avec leurs enfants mariés pour des raisons
sociales ou économiques (le groupe reconnaît l'autorité d'une seule personne comme chef de
ménage).
• Un homme ou une femme célibataire avec ou sans enfants
• Un homme ou une femme veuf(ve) ou divorcé(e) avec ou sans enfants.
• Une personne qui loue une pièce et qui ne prend pas son repas avec le ménage sera considéré
comme constituant un ménage ordinaire indépendant.
• Un groupe de célibataires partageant un même logement constitue un ménage ordinaire s'ils
reconnaissent l'autorité d'une même personne qui est le chef de ménage, et qui partagent les
repas et les entretiens de ménage. Dans le cas contraire, ce sont des ménages séparés.

Les trois conditions suivantes sont des tests pour déterminer si un groupe de personnes se compose
d'un seul ménage ou de plusieurs ménages: si toutes les trois conditions ci-dessous attentent, il se
rapporte à un seul ménage; si l'une des conditions ci-dessous ne tient pas, il se rapporte à plusieurs
ménages.

1. Les personnes se trouvent dans la même unité d’habitation pour la plupart du temps
2. Les personnes reconnaissent le même chef de ménage
3. Les personnes partagent les repas et les entretiens de ménage

Un chef de ménage est la personne reconnu comme tel par les membres du ménage et qui est
responsable pour l'entretien et la maintenance du ménage.

Un ménage occupé est un ménage dont des membres de ménages sont présents au moment de
dénombrement, ou aucun membre n’est présent au moment de dénombrement, mais il est confirmé
par des voisins que le ménage sera retourné au moment de l’enquête principale.

Un ménage vacant désigne un logement non habité ou vide, ou les membres sont absents pour
longue durée, confirmé par des voisins que le ménage ne sera pas au retour au moment de l’enquête
principale.

Un plan de situation est une carte produite dans l'opération de dénombrement des ménages qui
indique les accès principaux à une grappe, y compris les routes et les points de repère dans la grappe
ou à côté de la grappe. Parfois, il peut même être utile d’inclure certains monuments importants de la
grappe avoisinée.

Un croquis détaillé est une carte produit pendant l’opération de dénombrement qui montre
toutes les structures recensées dans une grappe sélectionnée, numéroté de façon systématique qui peut
aider les enquêteurs de retrouver les ménages sélectionnés facilement pendant la collecte principale.
Un croquis détaillé contient aussi les informations sur l’identification de la grappe et les points de repères
principaux comme les vois d’accès, les montagnes et les collines, les ruisseaux et les rivières, et les
poteau électrique.

2.3 Responsabilités des agents de dénombrement


Les personnes recrutées pour participer à l'opération de dénombrement des ménages travaillent
en équipes composées de deux agents, un est désigné comme cartographe, l’autre énumérateur. Un
coordinateur contrôle l'ensemble de l'opération.

33
Les responsabilités du coordinateur sont:

1) Obtenir les cartes de base pour toutes les grappes sélectionnées ;

2) Prendre des dispositions pour la reproduction de tous les matériaux du dénombrement (les
carte de recensement des ZD tirées, le manuel et les Fiches de dénombrement); on doit
préparer les Fiches d'enregistrements de ménages en nombre suffisant pour couvrir toutes
les grappes tirées ;

3) Affecter les grappes aux équipes de dénombrement ;

4) Surveiller la réception des fiches de dénombrement remplis au bureau central; et

5) Vérifier que la qualité du travail est acceptable ;

Si les coordonnés GPS sont aussi recueillis pendant l’opération de dénombrement, le coordinateur doit
aussi:
6) Obtenir un Dongle de GPS par équipe, avec au moins deux Dongles de réserve et étiqueter
chaque Dongle avec un numéro ;

7) Veiller à ce que tous les récepteurs GPS aient les paramètres corrects (voir la section 2.6
ci-dessous) et distribuer un récepteur à chaque équipe sur le terrain;

8) Obtenir et copier l’instruction d’utilisation de GPS et les matériels de formation pour le


personnel du dénombrement; et

9) Former les personnels du dénombrement pour enregistrer les coordonnés GPS dans les
unités GPS ainsi que sur la fiche d’enregistrement EDS/1.

Les responsabilités des agents de dénombrement sont:

1) identifier les limites de la grappe;

2) dessiner un plan de situation de la grappe, une carte montrant l'emplacement de la grappe


et les accès principaux;

3) dessiner un croquis détaillé de la grappe en montrant les emplacements de toutes les


structures qui résident dans la grappe y compris les points de repère dans la grappe ou dans
les grappes voisinées;

4) dénombrer tous les ménages résidés dans la grappe de manière systématique;

5) communiquer au coordinateur les problèmes rencontrés sur le terrain et suivre ses


instructions.

6) transférer les fiches de dénombrement remplis au coordinateur ou au bureau central;

Si les coordonnés GPS sont aussi recueillis pendant l’opération de dénombrement, le recenseur
doit aussi:

7) capturer un point central de GPS et enregistrer les coordonnées sur la fiche EDS/1 pour
chaque grappe; et

8) compléter la partie des Fiches EDS/1 conçue pour les informations GPS pour chaque grappe.

Les deux agents de chaque équipe doivent travailler ensemble, se déplacent ensemble en même
temps dans la même grappe. D'abord ils doivent identifier les limites de la grappe ensemble. Puis, le

34
cartographe prépare le plan de situation et le croquis tandis que l'énumérateur fait le dénombrement
de ménages. Les matériaux nécessaires pour l'opération de dénombrement des ménages sont:

• le Manuel de Dénombrement de Ménages et la Mise à Jour de la Carte


• Les Cartes de Base pour toutes ZD sélectionnés et affectées au équipe
• Fiche du plan de situation et de croquis détaillé (fiche EDS/1)
• Fiche d’enregistrement des ménages (Fiche EDS/2)
• Fiche de segmentation (Fiche EDS/3)

Si les coordonnées GPS doivent être enregistrées lors de l'opération de dénombrement, les
documents supplémentaires suivants sont nécessaires:

• Dongle de GPS, batteries et câbles


• Manuel de l’utilisation de GPS et les documents de formation

2.4 Localisation de la grappe


Le coordinateur donnera une carte de base contenant la grappe affectée à l'équipe de
dénombrement. À leur arrivée dans une grappe, l'équipe doit d'abord contacter les autorités locales
pour les aider à identifier les limites et obtenir des informations générales sur la grappe, par exemple,
le nombre approximatif de ménages résidentiels dans la grappe. L'équipe de dénombrement fera deux
tours de la grappe: le premier pour identifier les limites de la grappe et créer la carte « le plan de
situation », et le second pour créer le croquis détaillé et dénombrer tous les ménages. Dans la plupart
des cas, les limites de la grappe suivent des caractéristiques naturelles facilement reconnaissables telles
que les ruisseaux ou rivières, et les caractéristiques de construction comme les routes ou les chemins
de fer. Dans certains cas, les limites ne peuvent pas être marqués avec des caractéristiques visibles (en
particulier dans les zones rurales), on doit faire attention à localiser les limites de la grappe aussi
précisément que possible en fonction de la description détaillée de la grappe et sa carte base.

Avant de faire le dénombrement, l'équipe devrait vérifier la grappe afin de déterminer un


chemin de déplacement efficace pour dénombrer toutes les structures. La grappe doit être divisée en
parties si possible. Une partie peut être un bloc de structures. L'équipe de dénombrement fera un plan
de situation de la grappe en indiquant les limites des parties, ainsi que la position relative des points de
repère, des structures publiques (par exemple, les écoles, les structures religieuses, les bureaux
publiques et les marchés) et les routes principales. Cette carte servira de guide pour les équipes
d'enquêteur quand ils commencent à recueillir les données.

2.5 Préparer le plan de situation et le croquis détaillé


L’un des deux agents de dénombrement de chaque équipe est désigné comme cartographe,
l’autre est désigné comme énumérateur. Bien que les deux aient des tâches différentes à accomplir, ils
doivent se déplacer ensemble et travailler en étroite collaboration. Le cartographe prépare les cartes,
et l’énumérateur recueille des renseignements sur les structures indiqués dans le croquis et sur les
ménages y habitent.

La cartographie de la grappe et le dénombrement des ménages doit se faire d'une manière


systématique afin qu'il n'y ait pas d'omissions ni des duplications. Si la grappe se compose d'un certain
nombre de blocs, l'équipe doit terminer chaque bloc avant d'aller à l'autre bloc adjacent. Dans chaque
bloc, commencer dans un coin du bloc et se déplacer dans le sens des aiguilles de montre. Dans les
zones rurales où les structures sont souvent trouvées en petits groupes, l'équipe doit travailler dans un
groupe de structures à la fois et dans chaque groupe, ils peuvent commencer au centre (en choisissant
n’importe quel repère, par exemple une école, comme le centre) et se déplacer dans le sens des aiguilles
de montre.

Dans le premier tour de la grappe, le cartographe préparera le plan de situation de la grappe


sur la Fiche de Dénombrement numéro 1 (Fiche EDS/1). Tout d'abord, remplir la case d'identification

35
pour la grappe dans la première page. Toutes les informations nécessaires pour remplir la case
d'identification sont fournies par le coordinateur ou par le fichier de l’échantillon. Dans l'espace prévu
dans la deuxième page, dessiner un plan de situation montrant la localisation de la grappe et inclure
des instructions sur comment se rendre à la grappe. Inclure toutes les informations utiles pour retrouver
la grappe et ses limites directement sur la carte et dans l'espace réservé aux observations, si nécessaire.

Dans le deuxième tour de la grappe, en utilisant la troisième page de la Fiche de Dénombrement


numéro 1, le cartographe va dessiner un croquis détaillé montrant toutes les structures présentes dans
la grappe, y compris les structures vacants et structures en cours de construction, et les points de
repère. Il est important que le cartographe et l’énumérateur travaillent ensemble et coordonnent leurs
activités, car le numéro de la structure que le cartographe indique sur le croquis doit correspondre au
numéro séquentiel de la structure attribué par l’énumérateur sur la fiche d’enregistrement de ménages
pour la même structure.

Sur le croquis, marquer le point de départ avec un grand X. Placez un petit carré à l'endroit où
se trouve chaque structure dans la grappe. Pour toute construction non résidentielle, identifier son
utilisation (par exemple, un magasin ou une usine). Numéroter toutes les structures dans l'ordre
séquentiel commençant par "1". Chaque fois qu'il y a une coupure des structures (par exemple, lors du
passage d'un bloc à l'autre), utiliser une flèche pour indiquer comment le dénombrement se déplace
d'un ensemble de structures à l'autre. Bien qu'il puisse être difficile de déterminer l'emplacement exact
de la structure sur la carte, un emplacement approximatif est utile pour retrouver la structure facilement
à l'avenir. Ajouter au croquis tous les points de repère (comme un parc), structures publiques (comme
une école ou une église), et les rues ou les routes.

Parfois, il est utile d'ajouter des repères qui se trouvent en dehors des limites de la grappe, s’ils
sont utiles pour identifier ou le repérage des autres structures à l'intérieur de la grappe.

Utiliser un marqueur ou une craie pour écrire sur l'entrée de la structure le numéro qui lui a été
attribué. Rappelez-vous que c’est le numéro séquentiel de la structure à l’intérieur de la grappe, qui est
le même que le numéro indiqué sur le croquis. Afin de distinguer le numéro de structure d'avec autres
numéros qui peuvent déjà exister sur la porte d’entrée de la structure, écrire "EDS" devant le numéro,
par exemple, pour a structure numéro 5, écrire "EDS/5," de la même manière sur la porte de la structure
numéro 44 écrire "EDS/44."

Une structure est appelée une structure de ménages multiples si elle contient plusieurs ménages
dans la structure. Sinon, elle est appelée une structure unitaire. Tous les ménages trouvés dans une
structure ou dans une structure de ménages multiples doivent être numérotées de 1 à m, à l'intérieur
de la structure 4 . Le numéro de la structure ainsi que le numéro de ménages forment un numéro
d'identification unique pour un ménage, et pour tous les ménages de la grappe. Par exemple, le ménage
numéro 3 dans la structure numéro 44 serait identifié de manière unique avec le numéro d'identification
EDS/44-3. Il est très utile d'écrire le numéro d'identification du ménage sur sa porte d’entrée pour aider
à l'enquêteur, plus tard, à identifier le ménage facilement et précisément au moment de l’enquête
principale.

2.6 Relever un point central GPS pour chaque grappe


Un point GPS est une lecture de latitude et longitude qui représente une localisation
géographique. Pour certaines enquêtes, les données GPS d’un point central pour chaque ZD sont
disponibles à partir du recensement. Cependant, si les données ne sont pas disponibles ou sont de
qualité douteuse, un point central GPS doit être relevé pour chaque grappe pendant l’opération de
dénombrement. Ces points centraux sont enregistrés en utilisant une unité GPS (une unité Garmin
ETREX est utilisé dans ce guide) et les fiche de dénombrement. Si une unité GPS autre que Garmin
ETREX est utilisée, ce guide sera toujours utile. Toutefois, certaines instructions ne s’appliqueront pas

4
Ce numéro est différent à celui du foyer donné plus tard à tous les foyers listés dans le cluster juste avant la
sélectionne du foyer.

36
en raison de différences de conception et de menus. Le manuel du propriétaire Garmin ETREX peut être
utile pour consulter les bases de l'unité de GPS.

Prenez une lecture pour chaque grappe. Le cartographe prendra le point central GPS alors
qu'il cartographie les grappes. On doit prendre un point central GPS pour chaque grappe ; dans le cas
de grandes grappes qui ont été segmentées, un point doit être pris pour chaque segment sélectionné
pour l’inclure dans l’enquête et le dénombrement. Dans les enquêtes EDS, les grappes sont
généralement des ZD de recensement, parfois des villages dans les zones rurales ou pâtés de maisons
dans les zones urbaines. Recueillir un seule point central pour la grappe réduit considérablement le
risque de compromettre la confidentialité des répondants et, en même temps, est suffisant pour
permettre l'intégration de multiples données pour une analyse ultérieure. Le point central de la grappe
EDS doit toujours être pris au centre géographique de la grappe. Si la grappe est segmentée, le point
doit être pris au centre géographique du segment choisi.

Sauvegarder le point central et enregistrer la latitude, la longitude et l'altitude. La


latitude, longitude, et l’altitude sont stockés dans deux endroits: dans la mémoire de l'unité de GPS et
sur le fiche de dénombrement Fiche EDS/1. Les unités GPS peuvent être cassées ou perdues et
l'expérience a montré que d'une sauvegarde en papier est essentiel. En outre, la fiche fournit une
sauvegarde des données si l'unité GPS devrait être modifié, supprimé ou mal identifié (par exemple si
l’opérateur nomme la grappe de manière incorrecte dans l'unité). Chaque position enregistrée dans
l'unité GPS est appelé un point central, et chaque point central a un nom unique. l'ID du point central
doit être le même que le numéro de grappe EDS. Si ce n’est pas possible, l'ID du point central doit être
unique par grappe et enregistré sur la fiche EDS/1 (ne pas enregistrer le même ID de point central pour
deux grappes différents). Quand un point central est enregistré, l'unité de GPS lui attribue un nom par
défaut. Le cartographe doit modifier le nom par défaut et le changer pour le numéro ID de la grappe
EDS à 6 chiffres. Par exemple, le point central pour la grappe EDS 101 serait nommé "000101". La
grappe EDS 112 serait nommée "000112". Après avoir enregistré le point central, le cartographe va
utiliser les cases désignées dans la fiche (Fiche EDS/1) pour enregistrer la latitude, la longitude et
l'altitude de la grappe. Tout d'abord, le cartographe inscrira les coordonnées de latitude et longitude en
degrés avec cinq décimaux et l'altitude en mètres. Deuxièmement, le cartographe va dessiner un cercle,
au milieu de la grappe/segment à l'endroit où il/elle a pris le point central.

Après que le dénombrement est complet, le Coordinateur du Dénombrement doit ré-collecter,


dès que possible, les unités de GPS au bureau central et téléchargera et examinera les point centraux
pour des problèmes. Le coordonnateur de l'échantillonnage devrait désigner un membre de l'Équipe de
Traitement de Données pour recevoir et traiter le fichier de point central de GPS et de donner ensuite
le fichier au directeur des enquêtes.

Dans la plupart des situations, le Coordinateur du Dénombrement sera chargé de fournir à


l’équipe de dénombrement avec un appareil GPS avant le dénombrement. Avant que ces unités soient
distribuées, ils devraient être formatés et configurés par les chargés du dénombrement. La seule
configuration acceptable par les enquêtes EDS est Degré Décimale, indépendamment des autres normes
géographiques utilisées à d'autres fins. Pour définir la configuration, entrer dans le menu SETUP et dans
le sous-menu UNITÉS, sélectionnez POSITION FRMT Et appuyez sur le bouton ENTRER. Sélectionnez
"[Link]" Degrés Décimaux, ce qui est le premier élément. Une fois "[Link]" est en
surbrillance, appuyez sur la touche ENTRER. Il est important que toutes les unités de GPS soient
configurées de la même façon de sorte que les points centraux retournés à la fin de l'enquête soient
tous dans le même format. Pour plus de détails sur la façon de bien configurer les unités de GPS pour
la collecte de point central, se référer au Manuel EDS de Collecte de Données GPS.

2.7 Dénombrement des ménages


L’énumérateur va utiliser la fiche d’enregistrement de ménages, la fiche numéro 2 (Fiche EDS/2)
pour enregistrer tous les ménages trouvés dans la grappe. Commencez par entrer les informations

37
d'identification pour la grappe. Les deux premières colonnes sont réservées à l'usage exclusif au bureau
central, les laisser en blanc.

Compléter le reste de la Fiche comme il suit:

Colonne (1) [Numéro séquentiel de structure]: Pour chaque structure, enregistrer le même
numéro séquentiel de structure que le cartographe a mis sur le croquis. Toutes les structures
enregistrées sur le croquis (à l'exception des points de repère) doivent être enregistrées sur la
fiche d’enregistrement de ménages.

Colonne (2) [Adresse/description de la structure]: Enregistrez l’adresse de la structure. Lorsque


les structures n’ont pas d’adressier (en particulier dans les zones rurales), donner une
description de la structure et tous les détails qui aident à relocaliser (par exemple, en face de
l'école, à côté du magasin, etc.) la structure au moment de l’enquête principale.

Colonne (3) [Résidence O/N]: Indiquez si la structure est utilisée à des fins résidentielles
(manger et dormir) en écrivant O pour "Oui". Dans les cas où une structure soit utilisée à des
fins commerciales ou autres, écrire N pour "Non". Les structures utilisées à la fois à des fins
résidentielles et commerciales (par exemple, une combinaison de magasin et de maison)
devraient être classées comme résidentielles (marquer O dans la colonne 3). Assurez-vous
d'enregistrer tous les ménages trouvés dans une structure non résidentielle (par exemple, un
gardien vivant à l'intérieur d'une usine ou dans une église). Aussi, ne oubliez pas de dénombrer
les structures vacantes et/ou en cours de construction ; et dans la colonne (6) donner quelques
explications (par exemple: vacants, en cours de construction, etc.) Toutes les structures
observées dans la grappe doivent être enregistrés sur le croquis de la grappe et dans la liste
d’enregistrement.

Colonne (4) [Numéro séquentiel de Ménage dans la Structure]: C’est le numéro séquentiel
attribué à chaque ménage trouvé dans la structure; il peut y avoir plus d'un ménage dans une
structure. Le premier ménage dans la structure aura toujours le numéro "1". S’il y a un second
ménage dans la structure, alors ce ménage devrait être enregistré sur la ligne suivante, un "2"
est enregistré dans la colonne (4), et dans les colonnes (1) à (3) répéter le numéro et l'adresse
de la structure ou les laissée en blanc.

Colonne (5) [Nom du chef de ménage]: Ecrire le nom du chef de ménage. Il ne peut y avoir
qu’un chef par ménage. Si personne n’est à la maison ou le ménage refuse de coopérer,
demander aux voisins pour le nom du chef de ménage. Si on ne peut pas déterminer un nom,
laissez cette colonne vide. Notez que ce n’est pas le nom du propriétaire ou du propriétaire de
la structure qui est nécessaire, mais le nom du chef de ménage qui y habite.

Colonne (6) [Observations/occupé ou non]: Cet espace est prévu pour toutes les remarques
spéciales qui pourraient aider le coordonnateur décider d'inclure un Ménage dans la sélection ou
non des ménages , et pourrait également aider l'équipe d'enquêteurs à localiser la structure ou
identifier le Ménage pendant l'enquête principale sur le terrain.

Si la structure est un immeuble ou d'un bloc d'appartements, attribuer un numéro séquentiel à


l'ensemble de la structure (un seul carré avec un numéro apparaît sur le croquis), mais compléter les
colonnes (2) à (6) individuellement pour chaque appartement dans la structure. Chaque appartement
doit avoir sa propre adresse, qui est le numéro d'appartement dans la structure

L'équipe de dénombrement doit être prudent pour localiser des structures cachées. Dans
certaines régions, les structures peuvent être construites tellement à hasard qu'on peut facilement les
manquer. Dans les zones rurales, les structures peuvent être cachées par les hautes herbes et les
arbres. S’il y a un sentier qui conduit de la structure dénombrée, vérifie si le sentier conduit à une autre
structure. Parler avec des personnes qui vivent aux alentours peut aider à identifier les structures
cachées.

38
2.8 Segmentation de grands grappes
Certains ZD sélectionnés peuvent comprendre un grand nombre de ménages. Un dénombrement
complet des ZD trop grands n’est pas pratique pour une enquête par sondage ; en conséquence chaque
ZD qui dépasse le seuil de segmentation peuvent être subdivisée en plusieurs segments, dès quels
seulement un seul sera inclus dans l’enquête. Dans ce cas, la grappe EDS correspond à un segment
d’une ZD. Quand l’équipe arrive dans une ZD trop grande qui a besoin de segmentation, elle devra faire
le tour de la ZD et faire une estimation rapide de la quantité de ménages qui habitent la ZD. Il n’existe
pas de seuil standard pour la taille d’une ZD qui aurai besoin d’être segmenté ni pour la taille de
segment, mais pour des questions d’efficacité et de précision, les recommandations d’EDS est que dans
le cas des ZD ayant plus de 300 ménages, l’équipe peut contacter le coordinateur, lui communiquer le
numéro de grappe, le nombre estimé de ménages et le nombre de segments à créer ; uniquement le
coordinateur peut prendre la décision final pour segmenter une ZD ainsi que le nombre de segments à
créer. L’idéal est de diviser une ZD en 2 segments avec une quantité de 150 à 200 ménages dans
chacun. Afin de minimiser des erreurs, on doit éviter de segmenter une ZD en plus de 3 segments, au
moins que ce soit vraiment nécessaire.

Au moment de segmenter une ZD en segments, l’idéal serait d’avoir la même taille dans chaque
segment, mais il est aussi important d’adopter les limites des segments qui sont facilement identifiables.
Lors du premier tour de la grappe, dessiner un plan de situation de la grappe complet en utilisant des
limites naturelles telles que des chemins, des ruisseaux et des poteaux électriques, deviser la ZD en
segments de taille après près égale, montrer clairement les limites des segments crées dans le plan de
situation de la ZD ; numéroter les segments et noter la taille approximative de chaque segment de la
manière suivante : compter rapidement le nombre de logements de chaque segment, additionner le
nombre total des logements de la ZD et calculer la proportion des logements dans chaque segment.

Exemple 2.1: Une grappe de 620 logements a été divisée en 3 segments, le résultat est:
Segment 1: 220 logements, ou 220/620 = 35 pour cent
Segment 2: 190 logements, ou 190/620 = 31 pour cent
Segment 3: 210 logements, ou 210/620 = 34 pour cent

Total: 620 logements, ou 620/620 = 100 pour cent

Dans la Fiche EDS/3 (Fiche de Segmentation) écrire la taille des segments dans la colonne
appropriée (nombre et pour cent) et calculer la taille cumulative, en termes de pour centage, de tous
les segments. La taille cumulative du dernier segment doit être égale à 100.

Numéro Nombre de Pour Pour centage


de logements cent cumulative
segment
1 220 35 35
2 190 31 66
3 210 34 100

Le bureau central sélectionnera un numéro aléatoire entre 0 et 100 pour chaque grande ZD à
segmenter et sera inclus dans son fichier. Comparer ce nombre aléatoire avec la taille cumulative,
sélectionner le premier segment ton sa taille cumulative est supérieure ou égale au nombre aléatoire.

Numéro aléatoire: 67
Segment sélectionné: Segment numéro 3

39
Continuer avec l'opération de dénombrement des ménages dans le segment 3 comme décrit
dans les sections ci-dessus (voir l'annexe 2.3 comme exemple de remplissage du Fiche de
segmentation.) Dessinez un croquis détaillé du segment sélectionné et dénombrer tous les ménages
trouvés dans le segment sélectionné.

2.9 Contrôle de qualité


Pour s’assurer que le travail de dénombrement effectué par chaque équipe est acceptable, des
contrôles de qualité doivent être effectuées. Le coordinateur ou des superviseurs doivent visiter les
régions au cours de l'opération de dénombrement de ménages et évaluer la qualité de travail des
grappes finis, il doit choisir une grappe fini et faire une liste indépendante de 10 pour cent de la grappe ;
s’il trouve des erreurs importantes on devrait refaire le dénombrement de la grappe, si le problème est
lié à des erreurs systématiques et qu’il n’est pas possible de faire des corrections sur les fiches, alors
tous les grappes devraient être refaites, ou une rappelle de la formation pour toutes les équipes peut
être nécessaire éventuellement.

2.10 Préparer les Fiches de dénombrement pour le tirage de ménages


sélectionnés
Une fois que le bureau reçoit les matériels du dénombrement complet pour une grappe, d’abord
il doit assigner un numéro séquentiel à tous les ménages de la grappe dans la deuxième colonne de la
Fiche EDS/2. Doivent être numérotés seulement les ménages résidentiels occupés (inclure les ménages
qui ont refusé de coopérer et les ménages dont les membres étaient absents au moment du
dénombrement mais seront de retour et seront présents pendant l’enquête principale); le numéro est
continu de 1 au numéro total de ménages résidentiels occupés dénombrés dans la grappe. Laisser la
cellule de la deuxième colonne en blanc si le ménage n’est pas occupé ou si la structure n’est pas
résidentielle, remplissez-la seulement si la structure dans cette ligne est un ménage occupé. Vérifier
que la numérotation des ménages occupés soit séquentielle, sans répétition ni interruption. Voir
l’exemple d’une Fiche de dénombrement remplies dans l’annexe 2.3.

Une fois assignés les numéros à chaque ménage dénombré dans la grappe, copier le nombre
total des ménages dénombrés dans la colonne “Nombre de ménages dénombrés” dans le file Excel
préparé pour la sélectionne des ménages. Vérifier que ce numéro est bien enregistré dans la ligne
correcte correspond au numéro de la grappe. Dans la colonne “information de la Segmentation”
enregistrer le pour centage du segment choisi si la ZD est segmentée. L’information de la segmentation
est importante pour calculer correctement les poids de sondage. Une fois le nombre total de ménages
dénombrés dans la grappe a été entré dans le fichier Excel, le tableur génère automatiquement les
numéros de ménages sélectionnés pour être enquêtés. Copier les numéros des ménages sélectionnés
dans la première colonne du Fiche EDS/2, qui correspond au numéro séquentiel des ménages dans la
Fiche de ménages dénombrés : ce sont les ménages qui doivent être enquêtés. Il est conseillé d’utiliser
un marqueur en couleur pour souligner la ligne où se trouve un ménage sélectionné pour indiquer quels
sont les ménages sélectionnés pour l’enquête, ainsi qu’utiliser des couleurs dans le croquis pour marquer
les structures de dans des ménages sont sélectionnés pour l’enquête.

Dans beaucoup d’enquêtes EDS, une enquête auprès des hommes est menée au même temps
mais dans un sous échantillon de ménages sélectionnés pour l’enquête femmes. Mettre une marque
dans la première colonne de la Fiche EDS/2 à côté du numéro du ménage sélectionné pour indiquer les
ménages sélectionnés pour l’enquête auprès des hommes, ou utiliser des couleurs différents pour
souligner les ménages sélectionnés pour enquête femmes et enquête hommes, respectivement. Il est
aussi conseillé de faire une copie de tous les fichiers (croquis et fiches de dénombrements avec la
sélectionne des ménages), donner l’original à l’équipe d’enquêteurs et garder une copie au bureau
central.

40
Annexe 2.1 Exemple de Fiche de dénombrement

Fiche EDS/1 PAGE 1 de 3


Fiche de Plan de situation et de Croquis
Identifications Code

Localité ___________________________________________

Numéro de Grappe EDS ......................................................

Urbain/Rural (Urbain=1/Rural=2) ........................................

Numéro ZD ......................................................................

District ___________________________________________

Région ___________________________________________

Non du Cartographe _________________________________

Non de l’Enumérateur _______________________________

Numéro d’Unité GPS ...........................................................

Nom de point central (noté dans l’unité GPS) ........................

Latitude (Nord/Sud) .................................................. N / S .

Longitude (Est/Ouest) ................................................ E / O .

Altitude / Elévation (Mètres) ...............................................

Observations:
Accès à la route __________________________________________________________

_______________________________________________________________________

Autre information utile ____________________________________________________

_______________________________________________________________________

41
Fiche EDS/1 Fiche de Plan de situation et de Croquis PAGE 2 de 3

Plan de Situation Grappe EDS:

42
Fiche EDS/1 Fiche de Plan de situation et de Croquis PAGE 3 de 3

Croquis de la grappe Grappe EDS:

43
Fiche EDS/2 Fiche d’Enregistrement de ménages

44
Fiche EDS/3 Fiche de Segmentation PAGE 3 de 3

Croquis de la grappe Grappe EDS:

Identfications Code

Localité __________________________________________

Numéro de la grappe EDS ...................................................

Urbain/Rural (Urbain=1/Rural=2) ........................................

Numéro ZD .......................................................................

District ___________________________________________

Région ___________________________________________

Non du Cartographe ________________________________

Nom de l’Enumératuer _______________________________

Nombre de segments:

Pour centage
Numéro de Segment Nombre de ménages Pour cent
Cumulative

Numéro aléatoire: ____________________

Segment sélectionné: ___________________

45
Annexe 2.2 Symboles et légendes proposés pour le croquis

Orientation au Nord

Limites de la grappe

Route pavée

Route non pave (en terre)

Sentier

Rivière, ruisseau, etc.

Pont

Lac, étang, etc.

Montagnes, collines

Point d’eau (puit, fontaine, etc.)

Marché

École

Structure administrative

Église, temple

Mosquée

Cimetière

Structure résidentielle

Structure non résidentielle

46
Structure vacante

Hôpital, clinique, etc.

Poteau électrique

Arbre ou buisson

47
Annexe 2.3 Exemples des Fiches de croquis et de dénombrement remplis

48
49
50
51
3 TECHNIQUES D'ÉCHANTILLONNAGE SÉLECTIONNÉS
Dans cette section on présente quelques procédure d’échantillonnage les plus populaire. La
présentation se concentrera plus sur les aspects pratiques que sur la théorie; néanmoins, ce chapitre
touchera quelques propriétés théoriques des procédures d’échantillonnage utilisées dans les enquêtes
EDS.

Nous nous concentrons sur des procédures d’échantillonnages sans remise plutôt que
d'échantillonnages avec remise puisque ces dernières représentent une réduction de l’efficacité car des
unités d’échantillonnage peuvent être tirées plusieurs fois. Quand cela arrive, l’information apportée
dans un échantillon de taille fixe se réduit puisque la même unité d’échantillonnage est sélectionnée
plusieurs fois. Pour ce qui s’intéresse aux aspects théoriques, veuillez-vous référer aux livres qui traitent
de la théorie de sondage notés dans les références.

3.1 Tirage aléatoire simple


On commence avec le tirage aléatoire simple sans remise (SRSWOR) puisque celle-ci est une
procédure d’échantillonnage fondamentale utilisée comme un modèle standard comparée aux autres
procédures de tirage. Le triage aléatoire simple sans remise est une procédure de tirage où toutes les
unités ont une chance égale d’être sélectionnée. La sélection peut être réalisée par tirages successifs
sans remise dans un récipient, bien mélangé contenant toutes les unités d’échantillonnage, ou en
utilisant certains algorithmes informatiques pour sélectionner parmi une liste de toutes les unités
d’échantillonnage.

Soient N le nombre total d’unités d’échantillonnage, n le nombre de unité à échantillonner, ou


la taille de l’échantillon, n<N. La probabilité d’inclusion pour chaque unité i se trouve par:

n
Pi =
N

Le poids de conception (en supposant l'absence de non-réponse) est donnée par:

N
Di = 1 / Pi =
n

La probabilité pour n unités particulières et différentes choisies dans un échantillon s est donnée par:

N
Ps = 1/  
n 

N
où   est la combinaison totale des n éléments de N sans répétition. Soient y 1 , y 2 , ... y n les
n 
observations sur les unités sélectionnées sur une caractéristique d’intérêt, la moyenne pondérée de
l'échantillon, qui est équivalent à la moyenne simple de l'échantillon,

1 n
1 Di y i / 1 Di  yi
n n
y = =
n 1 ,
1
1 y i
N
est un estimateur sans biais de la moyenne de la population, Y = , avec sa variance
N
d'échantillonnage donnée par
1− f 2
Vsrs (y ) = Sy
n

52

1
 ( )
N 2
S y2 = yi − Y
N −1 1

est la variance de la population finie sur la variable y, et f=n/N est le taux de sondage. Une estimation
sans biais de la variance est donnée par

1− f 2
 srs (y ) = sy
n

1
 ( )
n 2
avec s y2 = yi − y la variance d’échantillonnage. Lorsque n et N sont grands, la variable
n −1 1

standardisée

y −Y
SE (y )

suit une répartition Student-t avec un degré de liberté n-1, et SE (y ) est la racine carrée de  srs (y ) .
Par conséquent, les limites de confiance pour la moyenne de la population peuvent être construites à
partir des observations de l'échantillon avec une confiance de 95% que la vraie valeur Y se situe dans
la plage de y − 1.96 * SE (y ) et y + 1.96 * SE (y ) . Les rapports finaux d’EDS utilisent y  2 * SE (y )
comme intervalle de confiance de 95% pour être conservatrice.

En base d’une liste complète de toutes les unités d'échantillonnage dans un fichier électronique,
la façon le plus simple de tirer un échantillon aléatoire simple sans remise de taille n est d'abord de
générer un nombre aléatoire uniformément distribué entre 0 et 1 pour chacune des unités
d'échantillonnage. Ensuite, trier le fichier en base des nombres aléatoires générés dans l'ordre croissant,
et les premières n unités associées aux plus petits nombres aléatoires seront les unités sélectionnées.
Cette procédure fournit un échantillon SRSWOR de taille n. Cette procédure est facile à réaliser, mais
nécessite un tri de la base de sondage. Puisque le tri peut prendre du temps lorsque le fichier est grand,
l'algorithme suivant (Tillé, 2001) peut être utilisé avec la base de sondages sans tri:

Définition des termes et le premier degré


k: l’unité K du fichier de base; j: jeme unité tiré
k=0
j=0
générer un nombre aléatoire uniformément distribuée entre [0,1)
n− j
si u < alors
Répéter si N−k
j<n unité k + 1 est sélectionnée; j = j + 1
autrement unité k + 1 n’est pas sélectionnée ; j=j ;
k=k+1

3.2 Tirage systématique à probabilité égale


3.2.1 Théorie d’échantillonnage
Le tirage systématique à probabilité égale (SYS) est une procédure de tirage qui tire des unités
à un pas fixé, avec un point de départ aléatoire. La procédure est systématique parce que la sélection
de la première unité d'échantillonnage détermine la sélection des unités d'échantillonnage restantes.
Par rapport à SRSWOR, le tirage systématique présente les avantages suivants :

53
1) Il est plus facile à réaliser;

2) Il permet un contrôle facile de la sélection;

3) Si la base de sondage est dans un certain ordre, il offre un effet de stratification par rapport
aux variables sur lesquelles le base est triée et avec une répartition proportionnelle. Cette stratification
est appelée stratification implicite.

4) la stratification implicite empêche des concentrations indésirables des unités échantillonnées


dans certaines zones, comme le SRSWOR peut le produire.

En raison de ces avantages, en particulier (3) et (4), le triage systématique est plus souvent
utilisée que le tirage aléatoire simple.

Le tirage systématique s’effectue, normalement, comme suit: en supposant qu’un intervalle de


tirage en nombre entier I=N/n, où N est le nombre d'unités dans la base et n est le nombre d'unités à
échantillonner. La procédure commence par un nombre entier aléatoire S qui est inférieure ou égale à
I. Les unités à sélectionner sont S, S+I, S+2*I, ..., S+(n-1)*I. Quand I n’est pas un nombre entier il
peut y avoir des erreurs importantes en l’arrondissant au nombre entier immédiat, on suggère d’utiliser
la méthode intervalle décimal. Le tirage avec un intervalle décimal s’effectuent comme suit:

1) Calculer l’intervalle I arrondie à deux décimales.

2) Générer un nombre aléatoire R entre 0 et 1 avec deux décimales.

3) Calculer la séquence de nombres d'échantillonnage: R*I, R*I + I, R*I + 2*I, ..., R*I + (n -
1)*I

4) Arrondir au niveau supérieur les nombres d'échantillonnage calculés ci-dessus au prochain


numéro entier; ce sont les numéros des unités échantillonnées.

Exemple 3.2.1:

Supposons que N=100, n=14, donc l’intervalle de tirage égale à I=7.14; supposons que le
nombre aléatoire généré est R=0.96. Les nombres d'échantillonnage et les numéros d'unités
sélectionnées correspondantes sont les suivantes:

6.85 13.99 21.13 28.27 35.41 42.55 49.69 56.83 63.97 71.11 78.25 85.39 92.53 99.67
7 14 22 29 36 43 50 57 64 72 79 86 93 100

Dans cet exemple, le tirage avec un intervalle décimal donne un pas de tirage qui est parfois 7 ou parfois
8. Les programmes de tirage de ménages dans EDS sont tous programmés en permettant d’utilisation
des intervalles d'échantillonnage décimaux.

Quelques fois le plan d'échantillonnage nécessite de nombreux tirages systématiques comme


dans le cas d’EDS où on a besoin d’un échantillon systématique de ménages dans chaque grappe
sélectionnée. Dans cette situation, un nombre aléatoire R doit être déterminé indépendamment pour
chaque grappe.

Avec SYS, la probabilité d’inclusion de l’unité i est donnée par

1 n
Pi = =
I N
Le poids de la conception (en supposant l'absence de non-réponse) est donnée par

54
N
Di = 1 / Pi =
n
Supposons que y 1 , y 2 , ... y n soient les observations sur unités sélectionnées sur une caractéristique
d’intérêt, alors la moyenne pondérée de l'échantillon, qui est équivalent à la moyenne simple de
l'échantillon,

1 n
1 Di y i / 1 Di  yi
n n
y = =
n 1
1 N
est un estimateur sans biais de la moyenne de la population Y =  y i . Pour simplifier, dans
N 1
l'hypothèse d'un intervalle entier d'échantillonnage I, la variance d'échantillonnage de la moyenne est
donnée par

(1 − 1 / N) 2
Vsys (y ) = Sy 1 + (n − 1) w 
n

où Sy2 =
1
N −1 1
( 2
)
 y k − Y est la variance de la population;  w est le coefficient de corrélation entre
N

paires d'unités dans le même échantillon systématique. Quand  w est négatif, SYS est plus précis que
SRSWOR; quand  w est positive, SYS et moins précis que SRSWOR. Contrairement au cas de SRSWOR,
l'estimation de la variance
1−f 2
 sys (y ) = sy
n
1
(y i − y ) est la
2

n
n’est pas une estimation sans biais de la variance d'échantillonnage; où sy2 =
n −1 1

variance d'échantillon. Par contre,  sys (y ) est le cas particulier de l’estimateur recommandé par Hartley-
Rao (1962) dans le cas de tirage systématique à probabilité inégale. En effet,  sys (y ) est équivalant à
traiter l'échantillon systématique comme s’il aurait été tiré par SRSWOR, en conséquence, on l’appelle
un « estimateur avec approximation par SRSWOR ».

Théoriquement, avec SYS il n'y a pas d’estimateur sans biais de la variance de la moyenne de
l'échantillon puisque l’échantillonnage systématique équivaut à sélectionner au hasard un échantillon
parmi les I échantillons possibles. C’est un inconvénient majeur en théorie pour SYS. Toutefois, lorsque
les unités d'échantillonnage dans le fichier de base ne présentent pas de tendance linéaire dans la
variable d'intérêt, ni des changements périodiques, ou que les unités sont ordonnées aléatoirement,
 sys (y ) est une bonne approximation de la variance Vsys (y ) . Quand il y a une tendance linéaire dans la
variable d'intérêt, en supposant la sélection de l'échantillon systématique k, où la somme est au-dessus
des unités successives sans chevauchement, l'estimateur suivant (Wolter, 1984; Wolter 1985) est une
meilleure approximation de Vsys (y ) :

1 − f 1 n / 2
(y ) =  (y k +( j −1)*I − y k + j*I )
2
 sys
*

n n 1

Cependant, lorsqu’il faut des limites de confiance, on préfère  sys (y ) en raison de ses taux élevés
de couverture de la vraie moyenne de la population. Il faut noter que les propriétés de sys *
(y ) sont
différentes de l'estimateur par strates groupées pour l'échantillonnage stratifié avec une seule unité par
strate parce que les observations successives dans un échantillon SYS ont une corrélation probabilité-
une, tandis que l'estimateur par strates groupées pour un échantillonnage stratifié a un ensemble de
observations complètement indépendantes.

55
Lorsque n et N sont grands, la moyenne de l'échantillon a les mêmes propriétés asymptotiques
que celle d’un échantillon aléatoire simple; donc les intervalles de confiance peuvent être construits
d'une manière similaire à ceux d'un échantillon aléatoire simple.

3.2.2 Programme Excel pour le tirage de ménage systématique


Le programme MEASURE EDS a développé des programmes en Excel qui peuvent être utilisés
pour faire des tirages systématiques de ménages. Les programmes peuvent être utilisés pour effectuer
un tirage simple, tirage par lot, tirage auto-pondéré sans contrôle de la taille de l'échantillon et tirage
auto-pondéré avec contrôle de la taille de l'échantillon. La Figure 3.1 ci-dessous montre une partie de
la procédure de tirage simple avec un échantillon pris de 20 ménages par grappe. Les numéros des
ménages sélectionnés sont affichés à droite de la colonne intitulée "Aléa (0-1)". Le Figure 3.2 montre
une partie de la procédure de tirage par lot de quatre ménages. Le figure 3.3 montre une partie de la
procédure de triage auto-pondéré simple avec une moyenne d’échantillon prit de 20 ménages, sans
contrôle de la taille de l'échantillon, mais avec le nombre minimum et maximum d'échantillons pris de
10 et 30 ménages respectivement.

La Figure 3.4 montre une partie de tirage auto-pondéré par lot de 5 ménages, avec une moyenne
d’échantillon prit de 20 ménages par grappe, sans contrôle de la taille d'échantillon, mais avec un
minimum et un maximum d’échantillon prit de 10 et 30 ménages respectivement; le tirage intègre un
sous-échantillon de 10 ménages par grappe. Notez que la procédure de tirage par lot est un tirage
circulaire, ce qui signifie que lorsque l'intervalle de sélection n’est pas un nombre entier, et quand le lot
n’est pas un diviseur du nombre total de ménages dénombrés, alors le dernier lot peut avoir des numéros
de ménage inférieurs aux numéros de ménages du premier lot.

Les Figures 3.5 et 3.6 montrent des tirages auto-pondérés avec contrôle de la taille
d’échantillon; la zone de contrôle est la strate d'échantillonnage. L'inconvénient du tirage auto-pondéré
avec contrôle de la taille de l'échantillon est que la procédure de tirage fera le tirage de ménages
qu’après les résultats de dénombrement sont enregistrés pour l'ensemble de la zone de contrôle. Cette
condition peut représenter une contrainte dans certaines situations.

Le Figure 3.7 montre une procédure de tirage manuelle réalisée sur le terrain où on peut faire
le tirage facilement en utilisant une simple calculatrice. Si le tirage de ménages ne peut pas être fait au
bureau central, l'enquêteur peut effectuer le tirage de ménages sur le terrain. Les numéros en couleur
rouge représentent informations saisies et les termes calculés. Cette procédure nécessite une opération
de dénombrement de ménages traditionnelle où les ménages sont numérotés et répertoriés sur le Fiche
de dénombrement de ménages. En utilisant le nombre total de ménages dénombrés et le nombre de
ménages à tirer, l'enquêteur peut d'abord calculer l'intervalle de tirage puis utilisez le nombre aléatoire,
R, fourni pour chacune de grappe sélectionnée pour calculer le premier terme d’échantillonnage t1 , ou
nombre d’échantillonnage, et entrez le premier terme à la cellule pour t1. Pour les numéros ou termes
d'échantillonnage ultérieur, l'enquêteur ajoute l'intervalle de tirage au nombre ou terme
d'échantillonnage précédent. Après le calcul des numéros d'échantillonnage, l'enquêteur devrait arrondir
au niveau supérieur les numéros d'échantillonnage en entiers dans la colonne suivante; ceux-ci sont les
numéros de ménages tirés. L'enquêteur doit copier l'adresse et le nom du chef de ménage des ménages
sélectionnés à partir de la Fiche de dénombrement. La fiche de tirage de ménages est sujette à révision
par le superviseur du travail sur le terrain.

56
Figure 3.1 Tirage simple de ménages avec un sous-échantillonnage

SELECTION DES MÉNAGES

Sous échantillonnage prit par grappe 10 1 2 3 4 5 6 7 8 9 10

Grappe Ménage Ménages à Intervalle de Aléa


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N°. Dénombrés tirer triage (0-1)

1 138 20 6.90 0.03800 1 8 15 21 28 35 42 49 56 63 70 77 84 90 97 104 111 118 125 132

2 151 20 7.55 0.65268 5 13 21 28 36 43 51 58 66 73 81 88 96 104 111 119 126 134 141 149

3 182 20 9.10 0.97489 9 18 28 37 46 55 64 73 82 91 100 109 119 128 137 146 155 164 173 182

4 129 20 6.45 0.41931 3 10 16 23 29 35 42 48 55 61 68 74 81 87 94 100 106 113 119 126

5 180 20 9.00 0.53756 5 14 23 32 41 50 59 68 77 86 95 104 113 122 131 140 149 158 167 176

6 173 20 8.65 0.70405 7 15 24 33 41 50 58 67 76 84 93 102 110 119 128 136 145 154 162 171

7 140 20 7.00 0.51868 4 11 18 25 32 39 46 53 60 67 74 81 88 95 102 109 116 123 130 137

8 69 20 3.45 0.25579 1 5 8 12 15 19 22 26 29 32 36 39 43 46 50 53 57 60 63 67

9 176 20 8.80 0.96775 9 18 27 35 44 53 62 71 79 88 97 106 115 123 132 141 150 159 167 176

10 90 20 4.50 0.40192 2 7 11 16 20 25 29 34 38 43 47 52 56 61 65 70 74 79 83 88

11 131 20 6.55 0.32702 3 9 16 22 29 35 42 48 55 62 68 75 81 88 94 101 107 114 121 127

12 92 20 4.60 0.76363 4 9 13 18 22 27 32 36 41 45 50 55 59 64 68 73 78 82 87 91

13 126 20 6.30 0.41681 3 9 16 22 28 35 41 47 54 60 66 72 79 85 91 98 104 110 117 123

14 199 20 9.95 0.84599 9 19 29 39 49 59 69 79 89 98 108 118 128 138 148 158 168 178 188 198

15 225 20 11.25 0.91906 11 22 33 45 56 67 78 90 101 112 123 135 146 157 168 180 191 202 213 225

16 205 20 10.25 0.12089 2 12 22 32 43 53 63 73 84 94 104 114 125 135 145 155 166 176 186 196

17 148 20 7.40 0.88941 7 14 22 29 37 44 51 59 66 74 81 88 96 103 111 118 125 133 140 148

18 146 20 7.30 0.25095 2 10 17 24 32 39 46 53 61 68 75 83 90 97 105 112 119 126 134 141

19 139 20 6.95 0.14534 2 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134

20 201 20 10.05 0.84172 9 19 29 39 49 59 69 79 89 99 109 120 130 140 150 160 170 180 190 200

Tableau 3.2 Tirage par lot de quatre ménages avec un sous-échantillon


SELECTION DES MÉNAGES

Taille de lot 4

Sous échantillonnage prit par grappe 10 1 2 3 4 5 6 7 8 9 10

Ménages Ménages à Intervalle de Aléa


Grappe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dénombrés tirer tirage (0-1)

1 138 20 6.90 0.77576 21 22 23 24 49 50 51 52 77 78 79 80 105 106 107 108 129 130 131 132

2 151 20 7.55 0.05693 1 2 3 4 29 30 31 32 61 62 63 64 93 94 95 96 121 122 123 124

3 182 20 9.10 0.10590 1 2 3 4 41 42 43 44 77 78 79 80 113 114 115 116 149 150 151 152

4 129 20 6.45 0.64741 17 18 19 20 41 42 43 44 69 70 71 72 93 94 95 96 117 118 119 120

5 180 20 9.00 0.60810 21 22 23 24 57 58 59 60 93 94 95 96 129 130 131 132 165 166 167 168

6 173 20 8.65 0.96364 33 34 35 36 65 66 67 68 101 102 103 104 137 138 139 140 169 170 171 172

7 140 20 7.00 0.11160 1 2 3 4 29 30 31 32 57 58 59 60 85 86 87 88 113 114 115 116

8 69 20 3.45 0.15540 1 2 3 4 13 14 15 16 29 30 31 32 41 42 43 44 57 58 59 60

9 176 20 8.80 0.00870 1 2 3 4 33 34 35 36 69 70 71 72 105 106 107 108 141 142 143 144

10 90 20 4.50 0.32205 5 6 7 8 21 22 23 24 41 42 43 44 57 58 59 60 77 78 79 80

11 131 20 6.55 0.69849 17 18 19 20 45 46 47 48 69 70 71 72 97 98 99 100 121 122 123 124

12 92 20 4.60 0.51119 9 10 11 12 25 26 27 28 45 46 47 48 65 66 67 68 81 82 83 84

13 126 20 6.30 0.31826 9 10 11 12 33 34 35 36 57 58 59 60 81 82 83 84 109 110 111 112

14 199 20 9.95 0.69129 25 26 27 28 65 66 67 68 105 106 107 108 145 146 147 148 185 186 187 188

15 225 20 11.25 0.67523 29 30 31 32 73 74 75 76 121 122 123 124 165 166 167 168 209 210 211 212

16 205 20 10.25 0.30267 13 14 15 16 53 54 55 56 93 94 95 96 133 134 135 136 177 178 179 180

57
17 D 148 20 7.40 0.53373 13 14 15 16 45 46 47 48 73 74 75 76 105 106 107 108 133 134 135 136

18 146 20 7.30 0.32483 9 10 11 12 37 38 39 40 65 66 67 68 97 98 99 100 125 126 127 128

19 139 20 6.95 0.69275 17 18 19 20 45 46 47 48 73 74 75 76 101 102 103 104 129 130 131 132

20 201 20 10.05 0.34629 13 14 15 16 53 54 55 56 93 94 95 96 133 134 135 136 173 174 175 176

Tableau 3.3 Tirage auto-pondéré simple sans contrôle

Moyenne d’échantillon prit 20 Moyenne prit pour sous--échantillon 10

Nom colonne pour Proba de ZD b Minimum d’échantillon prit 10

Nom colonne #Mén/ base c Maximum échantillon prit 30

Taille de Lot 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

HH
Grappe Ménages Intervalle de Aléatoire
ZD Proba dans Proba globale Info segment Ménages tirés 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
n°. dénombrés tirage (0-1)
base

1 0.089851 456 0.003941 345 15 23.00 0.13710 4 27 50 73 96 119 142 165 188 211 234 257 280 303 326

2 0.037832 192 0.003941 103 11 9.36 0.94140 9 19 28 37 47 56 65 75 84 94 103

3 0.026009 132 0.003941 127 19 6.68 0.74823 6 12 19 26 32 39 46 52 59 66 72 79 86 92 99 106 112 119 126

4 0.029753 151 0.003941 127 17 7.47 0.47966 4 12 19 26 34 41 49 56 64 71 79 86 94 101 109 116 124

5 0.019507 99 0.003941 98 20 4.90 0.35329 2 7 12 17 22 27 32 37 41 46 51 56 61 66 71 76 81 86 90 95

6 0.026601 135 0.003941 132 20 6.60 0.35072 3 9 16 23 29 36 42 49 56 62 69 75 82 89 95 102 108 115 122 128

7 0.034679 176 0.003941 218 25 8.72 0.14457 2 10 19 28 37 45 54 63 72 80 89 98 106 115 124 133 141 150 159 167 176 185 194 202 211

8 0.033103 168 0.003941 92 11 8.36 0.74902 7 15 23 32 40 49 57 65 74 82 90

9 0.088471 449 0.003941 0.46 247 24 10.29 0.65592 7 18 28 38 48 59 69 79 90 100 110 120 131 141 151 162 172 182 193 203 213 223 234 244

10 0.101279 514 0.003941 0.55 245 17 14.41 0.15798 3 17 32 46 60 75 89 104 118 132 147 161 176 190 205 219 233

11 0.019507 99 0.003941 122 25 4.88 0.85734 5 10 14 19 24 29 34 39 44 49 53 58 63 68 73 78 83 88 93 97 102 107 112 117 122

12 0.009939 76 0.002615 40 11 3.64 0.18437 1 5 8 12 16 19 23 27 30 34 38

13 0.012424 95 0.002615 160 30 5.33 0.66882 4 9 15 20 25 31 36 41 47 52 57 63 68 73 79 84 89 95 100 105 111 116 121 127 132 137 143 148 153 159

14 0.008893 68 0.002615 69 20 3.45 0.26100 1 5 8 12 15 19 22 26 29 32 36 39 43 46 50 53 57 60 64 67

15 0.018439 141 0.002615 133 19 7.00 0.69656 5 12 19 26 33 40 47 54 61 68 75 82 89 96 103 110 117 124 131

16 0.013731 105 0.002615 120 23 5.22 0.51406 3 8 14 19 24 29 34 40 45 50 55 61 66 71 76 81 87 92 97 102 108 113 118

17 0.018178 139 0.002615 165 24 6.88 0.00231 1 7 14 21 28 35 42 49 56 62 69 76 83 90 97 104 111 117 124 131 138 145 152 159

18 0.008239 63 0.002615 90 29 3.10 0.87493 3 6 9 13 16 19 22 25 28 31 34 37 40 44 47 50 53 56 59 62 65 68 71 75 78 81 84 87 90

19 0.016608 127 0.002615 98 15 6.53 0.87072 6 13 19 26 32 39 45 52 58 65 72 78 85 91 98

20 0.009416 72 0.002615 75 21 3.57 0.29377 2 5 9 12 16 19 23 27 30 34 37 41 44 48 52 55 59 62 66 69 73

Figure 3.4 Tirage auto-pondéré par lot de 5 et sans contrôle

Household selectI on

Moyenne d’échantillon prit 20 Moyenne prit pour sous--échantillon 10

Nom colonne pour Proba de ZD b Minimum d’échantillon prit 10

Nom colonne #Mén/ base c Maximum échantillon prit 30

Taille de Lot 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Mén Mén Aléa


Grappe ZD Proba Proba globale Segment info Échantillon prit Intervalle tirage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
base Dénom (0-1)

1 0.089851 456 0.003941 345 15 23.00 0.06005 6 7 8 9 10 121 122 123 124 125 236 237 238 239 240

2 0.037832 192 0.003941 103 11 9.36 0.51677 21 22 23 24 25 71 72 73 74 75 13

3 0.026009 132 0.003941 127 19 6.68 0.83579 26 27 28 29 30 61 62 63 64 65 91 92 93 94 95 126 127 1 2

4 0.029753 151 0.003941 127 17 7.47 0.85753 31 32 33 34 35 66 67 68 69 70 106 107 108 109 110 14 15

5 0.019507 99 0.003941 98 20 4.90 0.55776 11 12 13 14 15 36 37 38 39 40 61 62 63 64 65 86 87 88 89 90

58
6 0.026601 135 0.003941 132 20 6.60 0.29854 6 7 8 9 10 41 42 43 44 45 76 77 78 79 80 106 107 108 109 110

7 0.034679 176 0.003941 218 25 8.72 0.82987 36 37 38 39 40 76 77 78 79 80 121 122 123 124 125 166 167 168 169 170 211 212 213 214 215

8 0.033103 168 0.003941 92 11 8.36 0.77278 31 32 33 34 35 71 72 73 74 75 24

9 0.088471 449 0.003941 0.46 247 24 10.29 0.85756 41 42 43 44 45 96 97 98 99 100 146 147 148 149 150 196 197 198 199 200 246 247 1 2

10 0.101279 514 0.003941 0.55 245 17 14.41 0.99471 71 72 73 74 75 141 142 143 144 145 216 217 218 219 220 41 42

11 0.019507 99 0.003941 122 25 4.88 0.14094 1 2 3 4 5 26 27 28 29 30 51 52 53 54 55 76 77 78 79 80 101 102 103 104 105

12 0.009939 76 0.002615 40 11 3.64 0.11903 1 2 3 4 5 21 22 23 24 25 36

13 0.012424 95 0.002615 160 30 5.33 0.03859 1 2 3 4 5 26 27 28 29 30 51 52 53 54 55 81 82 83 84 85 106 107 108 109 110 131 132 133 134 135

14 0.008893 68 0.002615 69 20 3.45 0.28596 1 2 3 4 5 21 22 23 24 25 36 37 38 39 40 56 57 58 59 60

15 0.018439 141 0.002615 133 19 7.00 0.05647 1 2 3 4 5 36 37 38 39 40 71 72 73 74 75 106 107 108 109

16 0.013731 105 0.002615 120 23 5.22 0.26691 6 7 8 9 10 31 32 33 34 35 56 57 58 59 60 86 87 88 89 90 111 112 113

17 0.018178 139 0.002615 165 24 6.88 0.00029 1 2 3 4 5 31 32 33 34 35 66 67 68 69 70 101 102 103 104 105 136 137 138 139

18 0.008239 63 0.002615 90 29 3.10 0.57751 6 7 8 9 10 21 22 23 24 25 36 37 38 39 40 56 57 58 59 60 71 72 73 74 75 86 87 88 89

19 0.016608 127 0.002615 98 15 6.53 0.89801 26 27 28 29 30 61 62 63 64 65 91 92 93 94 95

20 0.009416 72 0.002615 75 21 3.57 0.71086 11 12 13 14 15 31 32 33 34 35 46 47 48 49 50 66 67 68 69 70 6

Figure 3.5 Tirage auto-pondéré avec contrôle de la taille d’échantillonnage

Nom. ménage attendu Nombre ménage tiré

Echant. total 620 Échant. total 619 31 31 31 31 31 29 26 25 22 16 12 8 6 2 1

Sous-échant 310 Sous-échant 302 31 31 31 31 31 31 31 31 31 31 30 29 27 26 26 25 22 22 21 16 14 12 10 8 7 6 4 2 1 1

Proba Aléa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Mén
Grappe ZD Proba Strate Segment info Mén Dénom Échantillon prit globale
base (0, 1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

1 0.089851 456 1 345 16 0.004276 0.99090 22 43 65 87 108 130 151 173 194 216 237 259 281 302 324 345

2 0.037832 192 1 103 11 0.004275 0.75239 8 17 26 36 45 54 64 73 82 92 101

3 0.026009 132 1 127 21 0.004274 0.86458 6 12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 103 109 115 121 127

4 0.029753 151 1 127 18 0.004276 0.99072 7 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 1

5 0.019507 99 1 98 22 0.004276 0.04095 1 5 10 14 18 23 27 32 36 41 45 50 54 59 63 67 72 76 81 85 90 94

6 0.026601 135 1 132 21 0.004274 0.85131 6 12 18 25 31 37 44 50 56 62 69 75 81 88 94 100 106 113 119 125 132

7 0.034679 176 1 218 27 0.004274 0.04537 1 9 17 25 33 41 49 57 65 73 82 90 98 106 114 122 130 138 146 154 162 170 178 186 195 203 211

8 0.033103 168 1 92 12 0.004275 0.60119 5 13 20 28 36 43 51 59 66 74 82 89

9 0.088471 449 1 0.46 247 26 0.004274 0.60089 6 16 25 35 44 54 63 73 82 92 101 111 120 130 139 149 158 168 177 187 196 206 215 225 234 244

10 0.101279 514 1 0.55 245 19 0.004274 0.15320 2 15 28 41 54 67 80 93 106 118 131 144 157 170 183 196 209 222 234

11 0.019507 99 1 122 26 0.004276 0.83106 4 9 14 18 23 28 33 37 42 47 51 56 61 65 70 75 79 84 89 94 98 103 108 112 117 122

12 0.009939 76 2 40 10 0.002572 0.47381 2 6 10 14 18 22 26 30 34 38

13 0.012424 95 2 160 30 0.002329 0.92044 5 11 16 21 27 32 37 43 48 53 59 64 69 75 80 85 91 96 101 107 112 117 123 128 133 139 144 149 155 160

14 0.008893 68 2 69 20 0.002573 0.88266 4 7 10 14 17 21 24 28 31 35 38 41 45 48 52 55 59 62 66 69

15 0.018439 141 2 133 19 0.002572 0.02506 1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127

16 0.013731 105 2 120 23 0.002573 0.19580 2 7 12 17 22 28 33 38 43 49 54 59 64 69 75 80 85 90 95 101 106 111 116

17 0.018178 139 2 165 23 0.002573 0.84644 7 14 21 28 35 42 50 57 64 71 78 85 93 100 107 114 121 128 136 143 150 157 164

18 0.008239 63 2 90 28 0.002573 0.53018 2 5 9 12 15 18 21 25 28 31 34 38 41 44 47 50 54 57 60 63 66 70 73 76 79 82 86 89

19 0.016608 127 2 98 15 0.002572 0.54311 4 11 17 24 30 37 43 50 56 63 69 76 82 89 95

20 0.009416 72 2 75 20 0.002574 0.52813 2 6 10 14 17 21 25 29 32 36 40 44 47 51 55 59 62 66 70 74

59
Tableau 3.6 Tirage auto-pondéré par lot de 5 et avec contrôle
Nombre de ménage Nombre de ménages
attendus tirés

Échantillon Échantillon

total 620 total 624 31 31 31 31 31 31 27 26 23 20 15 9 7 5 1

Sous- Sous-

échantillon 310 échantillon 319 31 31 31 31 31 31 31 31 31 31 31 30 27 27 26 25 23 22 20 16 15 13 9 8 7 6 5 2 1 1

Info segment Proba Aléa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

ZD Mén/b Mén Échantillon


Grappe Strate globale
Probabilité ase Dénom prit (0, 1) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

1 0.089851 456 1 345 17 0.004276 0.37154 36 37 38 39 40 136 137 138 139 140 241 242 243 244 245 341 342

2 0.037832 192 1 103 12 0.004275 0.17906 6 7 8 9 10 51 52 53 54 55 91 92

3 0.026009 132 1 127 21 0.004274 0.37346 11 12 13 14 15 41 42 43 44 45 71 72 73 74 75 101 102 103 104 105 4

4 0.029753 151 1 127 18 0.004276 0.97771 31 32 33 34 35 66 67 68 69 70 106 107 108 109 110 14 15 16

5 0.019507 99 1 98 22 0.004276 0.25939 6 7 8 9 10 26 27 28 29 30 51 52 53 54 55 71 72 73 74 75 91 92

6 0.026601 135 1 132 22 0.004274 0.17919 6 7 8 9 10 36 37 38 39 40 66 67 68 69 70 96 97 98 99 100 126 127

7 0.034679 176 1 218 27 0.004274 0.85089 31 32 33 34 35 71 72 73 74 75 116 117 118 119 120 156 157 158 159 160 196 197 198 199 200 18 19

8 0.033103 168 1 92 12 0.004275 0.50068 16 17 18 19 20 56 57 58 59 60 4 5

9 0.088471 449 1 0.46 247 26 0.004274 0.31150 11 12 13 14 15 61 62 63 64 65 106 107 108 109 110 156 157 158 159 160 201 202 203 204 205 4

10 0.101279 514 1 0.55 245 19 0.004274 0.58240 36 37 38 39 40 101 102 103 104 105 166 167 168 169 170 231 232 233 234

11 0.019507 99 1 122 27 0.004276 0.58464 11 12 13 14 15 36 37 38 39 40 56 57 58 59 60 81 82 83 84 85 101 102 103 104 105 4 5

12 0.009939 76 2 40 11 0.002572 0.00559 1 2 3 4 5 16 17 18 19 20 36

13 0.012424 95 2 160 30 0.002329 0.28430 6 7 8 9 10 31 32 33 34 35 61 62 63 64 65 86 87 88 89 90 111 112 113 114 115 141 142 143 144 145

14 0.008893 68 2 69 20 0.002573 0.16263 1 2 3 4 5 21 22 23 24 25 36 37 38 39 40 51 52 53 54 55

15 0.018439 141 2 133 18 0.002572 0.83721 31 32 33 34 35 66 67 68 69 70 101 102 103 104 105 8 9 10

16 0.013731 105 2 120 22 0.002573 0.78642 21 22 23 24 25 46 47 48 49 50 76 77 78 79 80 101 102 103 104 105 11 12

17 0.018178 139 2 165 23 0.002573 0.44707 16 17 18 19 20 51 52 53 54 55 86 87 88 89 90 121 122 123 124 125 156 157 158

18 0.008239 63 2 90 28 0.002573 0.80425 11 12 13 14 15 26 27 28 29 30 46 47 48 49 50 61 62 63 64 65 76 77 78 79 80 1 2 3

19 0.016608 127 2 98 15 0.002572 0.18038 6 7 8 9 10 36 37 38 39 40 71 72 73 74 75

20 0.009416 72 2 75 21 0.002574 0.01884 1 2 3 4 5 16 17 18 19 20 36 37 38 39 40 51 52 53 54 55 71

60
Tableau 3.7 Tirage manuelle de ménages sur le terrain

61
3.3 Tirage à probabilité proportionnelle à la taille
3.3.1 Théorie d’échantillonnage
Afin d'accroître l'efficacité de l'échantillonnage, une procédure d'échantillonnage peut attribuer
différentes probabilités d’inclusion aux différentes unités d'échantillonnage. En général, une unité
d'échantillonnage "grande" contribue davantage à la variance de la population ainsi qu’à la variance de
l’estimateur si on utilise un tirage à probabilité égale. Si on attribue une plus grande chance d’être tiré
pour grandes unités d'échantillonnage, la variance de l’estimateur peut être réduite considérablement.
À l'extrême, une bonne stratégie consiste à sélectionner de très grandes unités d'échantillonnage avec
certitude ou avec une probabilité une. En supposant que chaque unité d'échantillonnage a une sorte de
mesure de taille connue qui est positivement corrélée avec la variable d'intérêt, un tirage à Probabilité
Proportionnelle à la Taille (PPT) attribue à chaque unité d'échantillonnage la chance d’être tirée qui est
proportionnelle à sa taille. Un tirage PPT peut être réalisé par un tirage systématique à bas égal avec le
bas défini comme le cumul de la taille, avec un point de départ aléatoire. Donc il a les mêmes avantages
qu’un échantillonnage SYS plus un effet de stratification implicite.

Supposons que M i soit la mesure de la taille de l’unité i; 1 Mi soit la mesure totale de la taille.
N

Supposons que n soit la taille d’échantillon désirée. Une procédure d’échantillonnage PPT tira l’unité i
avec une probabilité d’inclusion  i de sorte que

nM i
i = ∝ 𝑀𝑖
 Mi
Le poids de la conception (en supposant l'absence de non-réponse) est donnée par

Di = 1 /  i =
 Mi
nM i

Supposons que y 1 , y 2 , ... y n soient les observations faites sur les unités tirées sur une
caractéristique d’intérêt, alors la somme pondérés des observations
y
1 Di y i 1  i
n n
yˆPPS = =
i

1 y i
N
est un estimateur sans biais du total de la population Y = . La variance de cet estimateur est donnée
par
2
y yj 
( ) 1 N
 (  −  ij ) i −
N
V yˆPPS =   (Yates-Grundy, 1953)
2 i =1
i j
i  j 
j  i , j =1
 

où  ij est la probabilité jointe de tirer unités i et j dans un même échantillon. Si toute les probabilités
jointes sont positives,  ij  0 , alors la variance ci-dessus peut être estimée sans biais par

2
  i  j −  ij  y i y j 
( )
1 n n
Vˆ yˆPPS =      −  (Yates-Grundy, 1953)
2 i =1   i  j 
j  i , j =1
 ij  

Cependant, l'estimateur ci-dessus n’est pas calculable parce que les probabilités jointes  ij sont
généralement inconnues. Hartley et Rao (1962) ont fourni une approximation de l'estimateur ci-dessus
qui implique que les probabilités d’inclusion d’ordre une  i :
2
 y yj 
( )
1 1 n 
1 − ( i +  j ) +
1
n
VˆHR y
ˆPPS    1  k2   i
N
−  (Hartley-Rao, 1962)
2 n − 1 i =1 j  i , j =1  n  i  j 

62
Mais l'estimateur de Hartley-Rao nécessite la connaissance de la probabilité d’inclusion de toutes les
unités d'échantillonnage de la population ( 1  k2 ) qui n’est généralement pas calculé pendant le tirage
N

de l'échantillon. La documentation en général ne maintient que la probabilité d’inclusion des unités


 i2
1  k2
N
par son estimation à partir de l’échantillon 1 1  i
n n
tirées. En remplaçant = , l'estimateur de
i
Hartley-Rao peut être encore simplifié (Ren, 2003).
2
y yˆ 
(
VˆR yˆPPS = ) n
 (1 −  i )  i − nPPS 
n

n −1 1  i 

Dans le cas de tirage à probabilité égale, VˆHR y


ˆPPS ( ) et Vˆ (yˆ ) se réduisent deux les deux
R PPS à
l'estimateur de variance avec approximation par SRSWOR. Supposons que  i  1 pour tous les i, les
estimateurs Yates-Grundy et Hartley-Rao peuvent produire des estimations de variance négatives dans
certains cas, tant dit que Vˆ yˆ
R ( )
produit toujours des estimations positives.
PPS

Wolter (1984; 1985) a mené une étude approfondie sur l'estimation de la variance en cas
d’échantillonnage systématique, y compris l'estimateur par la différence successive similaire à  sys
*
(y ) . Il
conseil l'utilisation de l'estimateur de Hartley-Rao si la population ne présente pas de tendances dans la
mesure de taille et la variable d'intérêt, surtout quand un intervalle de confiance est nécessaire.

L’estimateur du total ci-dessus peut être adapté pour estimer la moyenne:

y 1
1 Di y i / 1 Di = 1  i / 1 
n n n n
y PPS =
i i

y PPS est un estimateur approximativement sans biais pour la moyenne de la population avec une

variance approximative donnée par:

1 y −Y  y j − Y 
  ( i  j −  ij ) i
N N
V (y PPS ) =  
N2  i   j 
i =1 j =1
  

Si les unités ne sont pas spécialement ordonnées en fonction de la variable d'intérêt dans le base de
sondage, la variance approximative de l'estimateur peut être estimée par

2
1 n y ˆ 
y
VˆR (y PPS ) =  (1 −  i )  i − nPPS 
n

( D ) n
1 i
2
n −1 1  i 

L'estimateur ci-dessus sera réduit à l’estimateur par approximation par SRSWOR  sys (y ) en cas
d’échantillonnage systématique à probabilité égale.

3.3.2 Description opérationnelle et exemples


Il y a beaucoup de façons de tirer un échantillon PPT, mais le plus simple est l'échantillonnage
systématique PPT résumé comme il suit:

1) Préparer une liste des unités d’échantillonnage avec leurs mesures de taille M i

63
1 Mi pour
k
2) Calculer la mesure de taille cumulative C k = chaque unité k et vérifier que la

1 Mi
N
dernière entrée C N est égale à la mesure de taille totale

1 Mi
N

3) Soit n est le nombre d’unités à échantillonner. Calculer l'intervalle de triage I =


n
4) Générer un nombre aléatoire R entre 0 et 1

5) Calculer les nombres d’échantillonnage R*I, R*I+I, R*I+2*I, ..., R*I+(n-1)*I

6) Pour chaque nombre d’échantillonnage R*I+(j-1)*I, le jth unité échantillonnée est l’unité k
si C k est la première taille cumulée qui est supérieur que le nombre d'échantillonnage
R*I+(j-1)*I, c’est-à-dire, C k >=R*I+(j-1)*I et 𝐶𝑘−1 <R*I+(j-1)*I

n * Mj
7) Calculer la probabilité d’inclusion pour chaque unité tirée :
1 M i
N

L’exemple suivant montre comment faire une sélection manuelle.

Exemple 3.3.1:

Si N=20, n=5, 1 Mi = 4004 ; par conséquent, l'intervalle d'échantillonnage I = 801 ; si le


20

numéro aléatoire généré est R=0,3808, R*I =305. Les nombres d'échantillonnage et les
numéros d'unités choisies sont les suivantes:
Taille de
ID du mesure Cumulative Nombre jth unité Probabilité
numéro Mi Ck d’échantillonnage tirée d’inclusion
1 139 139
2 101 240
3 184 424 305 1 0.22977
4 184 608
5 104 712
6 259 971
7 219 1190 1106 2 0.273477
8 192 1382
9 224 1606
10 197 1803
11 150 1953 1907 3 0.187313
12 257 2210
13 270 2480
14 195 2675
15 296 2971 2707 4 0.36963
16 178 3149
17 256 3405
18 227 3632 3508 5 0.283467
19 247 3879
20 125 4004

L'échantillonnage PPT présente les mêmes avantages que l’échantillonnage systématique à


probabilité égale, mais avec cette procédure une unité peut être choisie plus qu'une fois si l'unité a une
mesure de taille supérieure que l'intervalle de tirage, ou sa probabilité d’inclusion est supérieur à un. Si
une unité est tirée plus d'une fois, elle devrait être segmentée en petits segments, correspondant au
nombre de fois que l'unité a été sélectionnée. Chaque segment est traité comme une grappe. Les
probabilités d’inclusion devraient être recalculées en traitant chaque segment comme une unité

64
d’échantillonnage, avec la taille de segment comme la mesure de taille. Avec cette stratégie, la taille
totale de l'échantillon reste la même que conçue et les probabilités d’inclusion des autres unités n’ont
pas besoin d'être ajustées.

Une autre façon de traiter les grosses unités consiste à examiner la base de sondage avant le
tirage de l'échantillonnage. Calculer les probabilités d’inclusion de chaque unité, puis identifier les unités
qui ont une probabilité d’inclusion supérieur à un, ses unités seront tirée d’office. Recalculer la
probabilité d’inclusion des unités restantes avec la taille de l’échantillon modifiée, la taille initiale
soustrait le nombre des unités déjà tirées, puis identifier les unités qui ont une probabilité d’inclusion
supérieur à un, ses unités seront tirée d’office. Répéter la procédure jusqu’il n’y a plus de unité ayant
une probabilité d’inclusion supérieur à un, puis effectuer le tirage systématique à probabilité
proportionnelle à la taille. La solution la plus simple pour éviter la répétition lors de l'échantillonnage
pourrait être de diviser chacune de ces grosses unités en deux ou plusieurs segments avant le tirage de
l’échantillon et traiter chaque segment comme une unité d’échantillonnage. Le seul problème peut-on
confronter est de comment faire une segmentation appropriée sans n’aller sur le terrain. Alors la
segmentation au bureau serait faite sur le papier ou basé sur la carte de recensement de l’unité
concernée, avec des approximations. Plus tard, la segmentation sera «matérialisée» sur le terrain si un
des segments d’une unité segmentée est tiré.

Si un nombre important d’unités choisies pour servir d’UPS sont plus grandes que l’intervalle de
tirage I, le choix de ces unités comme servant d’UPS uniques était clairement inapproprié. Une solution
à ce problème consiste à regrouper toutes les UPS ayant une mesure de taille supérieure à un seuil (pas
nécessairement supérieur ou égal à I) avant l'échantillonnage, de les appeler des unités auto-
représentatives. Ils seront inclus dans l'enquête avec la probabilité 1 et forment une strate
d'échantillonnage spéciale. Il est recommandé de subdiviser ces UPS en de petits segments et de ne
sélectionner qu’un segment au hasard à inclure dans l’enquête. Si plusieurs segments d'une même unité
d'UPS sont inclus dans l'enquête, à des fins de calcul d'erreur d'échantillonnage, il est important de
noter que ces segments ne sont pas des UPS, les segments de la même UPS ensembles doivent être
déclarés comme une UPS.

Un programme Excel pour effectuer des tirages PPT et stratifié a été développé, il marche aussi
pour des tirages systématiques à probabilité égale. La Figure 3.8 ci-dessous montre une partie d'un du
programme vierge. La Figure tableau 3.9 montre un exemple de tirage PPT et stratifié avec les strates
représentant les zones urbaines et rurales de chaque province.

Figure 3.8 Partie d’un modèle Excel pour l'échantillonnage stratifié

Échantillonnage systématique stratifié avec une probabilité proportionnelle à la taille

Aléatoire (0, 1)

Strate n°.

Taille Strate

Taille échantillon St

Strate n°.

Taille Strate

Taille échantillon St

Strate n°.

Taille Strate

Taille échantillon St

Strate n°.

Taille Strate

Taille échantillon St

Nom Col de Dom/Région Nom Col urbain/rural Nom Col de taille UPS

Numéro total de strate Taille d’échantillon Total # de Diff UPS sélectionné

65
Taille Taille de
N°. Dom/Région Urbain/ Taille Numéro Probabilité # de fois Taille Collez le fichier de base ci-dessous
d’échantillon Mesure
Série nom/code rural UPS Strate d’inclusion tiré Strate
de Strate strate

10

66
Figure 3.9 Une partie du programme pour un tirage PPT stratifié

Dans la figure 3.9 ci-dessus, le nombre de fois qu’une ZD a été tirée est indiqué dans la colonne
"# de fois tirés". Utilisez le filtre pour localiser les unités tirées et les copier dans un nouveau fichier. La
figure 3.10 ci-dessous donne un exemple d'une partie d'un fichier d’échantillon préparé. Ceci est un
exemple; il ne représente une partie des grappes pour une EDS. La première colonne donne le numéro
de grappe attribué par le statisticien. Les grappes sont triées dans l'ordre original comme dans la base
de sondage. Les six dernières colonnes sont les paramètres d'échantillonnage calculé par le programme
comprenant:

• probabilité d’inclusion ZD “Prob. Sélection”,


• nombre de ZD par strate “taille Strate”,
• nombre de ZD sélectionnée par strate “taille-sam Strate”,
• mesure total de la taille par strate (nombre total de ménages) “Mesure taille-strate”,
• numéro de strate et
• nombre de fois que l’unité a été tirée.

Ces paramètres d'échantillonnage sont importants et doivent être présents dans un fichier de
l'échantillon.

67
Tableau 3.10 Partie d'un exemple de fichier de l'échantillon tiré par PPT stratifié

3.4 Procédures de tirage complexes


Les procédures de tirage de l'échantillonnage utilisées dans les enquêtes EDS sont généralement
des procédures complexes et incluent le tirage à plusieurs degrés, par grappe et avec stratification, une
combinaison de tirage PPT dans le premier degré et de tirage systématique à probabilité égale dans le
deuxième degré. On utilise un tirage à plusieurs degrés en raison de l'absence d'une base de sondage
au niveau individuel; tirage par grappe est utilisé pour l'efficacité de mise en œuvre la stratification
pour la réduction des erreurs d'échantillonnage. On a traité la procédure d'échantillonnage EDS dans la
section 1.8. Nous donnons ici les propriétés théoriques de base de l'estimateur, la variance et
l’estimation de la variance pour un échantillonnage tiré par grappe à deux degrés.

Considérons un échantillon tiré par grappe et stratifié à deux degrés, avec nh UPS sélectionnées
dans la strate h dans le premier degré avec tirage PPT et, pour chacune des UPS sélectionnées, un
échantillon systématique à probabilité égale de m USS est tiré. Supposons que y hj 1 , y hj 2 ,..., y hjm soient
les observations du jth UPS dans la strate h. Un estimateur sans biais du total de la population est donnée
par

68
Yˆhj M hj
YˆPPS =  , with Yˆhj =  y hji
h j Phj m i

où  Phj est la probabilité d’inclusion du jth UPS dans la strate h; Mhj et le nombre de SSUs dans le jth
UPS dans la strate h. La variance de cet estimateur est donne par

( )
2
Y  1 1 − 1 / M hi 2
V YˆPPS =  ( Phk Phj −  Phkj ) hk − hj
Y
Sh (1 + (m − 1)  hw )
1
 + 
2 h k j   Phk  Phl  h j  Phj m

(VP ) (Vs )
La première partie (VP ) représente la variance due à l'échantillonnage des UPS, la somme est sur toutes
les strates pour différentes UPS j et k dans la même strate; la deuxième partie (VS ) représente la
variance due à l'échantillonnage des USS, la somme est sur toutes les strates et toutes les UPS. Les
estimateurs pour la première et la deuxième partie sont obtenus à partir des résultats des sections
précédents
2
1  Phk  Phj −  Phkj  Yˆhk Yˆhj  1 − f hj 2
VˆP =    −  , ˆ =  1
V sh
2 h k j  Phkj   Phl  S
h j  Phj m
 Phk 

Puisque la V̂P n’est pas une estimation sans biais de VP et généralement sur estime VP , et que VS est
généralement plus petit par rapport à VP , donc la seconde partie peut être laissé tomber dans
l'estimation de la variance, ce qui donne une estimation de la variance approximative donnée par
2

( ) 1
Vˆ YˆPPS =   
2 h k j
 Phk  Phj −  Phkj  Yˆhk
 Phkj  

Yˆhj
 Phl



 Phk 

L’estimateur ci-dessus peut se simplifier comme VˆR y


ˆPPS ( ) dans la Section 3.3.1
2

( ) nh  Yˆ Yˆ 
VˆR YˆPPS =  
nh − 1 j
(
1 −  Phj )

hj
− h
nh 
h
 Phj 

qui se réduit à l’estimateur Woodruff (1971) si  Phj  f h pour tout h:


2
nh (1 − f h )  Yˆhj Yˆh 
( )
VˆW YˆPPS = 
h

nh − 1 j   Phj nh 

 

Yˆhj
où Yˆh =  est une estimation du total de la strate h.
j Phj

L'estimateur ci-dessus peut être étendue pour estimer la variance d’un estimateur de la
ˆ = Yˆ / X
moyenne ou de ratio en utilisant la méthode de linéarisation de Woodruff (1971): si R ˆ , où
PPS PPS

YˆPPS représente la valeur totale de l'échantillon pondéré pour la variable y, et X̂ PPS représente la valeur
totale de l'échantillon pondéré pour la variable x, ou le nombre total de cas pondérés dans le groupe ou
sous-groupe à l'étude. La variance approximative de R̂ peut être calculée en utilisant la formule de
Woodruff:
2
1 nh (1 − f h ) n  z 
VˆW (R
ˆ) =
h

ˆ2
   z hi − nh 
nh − 1 i =1 
X PPs
h h 

69
(
z hi = Yˆhj − R
ˆX)
ˆ /  , and z h = Yˆh − R
hj Phj
ˆXˆ
h

L'estimateur ci-dessus est largement utilisé dans des logiciels statistiques commerciales tels que
le SAS, le SPSS et le Stata. Des méthodes de répliques répétées telles que le Bootstrap et le Jackknife
(Efron, 1982; Efron 1993) peuvent également être utilisés pour estimer la variance de R̂ , comme
expliqué dans la section 4.2 pour l’estimation des erreurs de sondage pour les taux démographiques
complexes. Il convient de noter que la procédure de calcul de l’erreur de sondage dans l’EDS a,
traditionnellement, utilisé la méthode de linéarisation de Taylor (Woodruff, 1971) pour calculer la
variance des estimateurs pour les moyens et les ratios parce que la méthode de linéarisation est plus
rapide que les méthodes de répliques répétées.

70
4 ERREURS DE SONDAGE
Les estimations de paramètres à partir d’une enquête par sondage sont sujettes à deux types
d’erreurs : les erreurs de mesure, ou les erreurs non dues à l’échantillonnage, et les erreurs
d’échantillonnage, ou les erreurs dues à l’échantillonnage. Les erreurs de mesure sont celles associées
à la mise en œuvre de la collecte et de l’exploitation des données, telles que l’omission des ménages
sélectionnés, la mauvaise interprétation des questions de la part soit de l’enquêteur, soit de l’enquêté
et les erreurs de saisie des données. Bien que de nombreux efforts soient faits au cours de mise en
œuvre d'un EDS pour minimiser ce type d'erreur, les erreurs non dues à l'échantillonnage sont
impossibles à éviter et difficile à évaluer statistiquement.

Par contre, les erreurs d'échantillonnage peuvent être évaluées statistiquement. L’échantillon
sélectionné pour une EDS n’est qu’un parmi un grand nombre d’échantillons qui peuvent être
sélectionnés, à partir de la même population, en utilisant le même plan de sondage. Chacun de ces
échantillons peut produire des résultats peu différents de ceux obtenus avec l’échantillon actuellement
sélectionné. L’erreur d’échantillonnage est une mesure de la variabilité parmi tous les échantillons
possibles. Bien que le niveau de variabilité ne puisse pas être connu exactement, il peut être estimé à
partir des données collectées. Les erreurs d'échantillonnage sont abordées en détail dans la section 1.6.
Les sections suivantes de ce chapitre se concentrent sur les erreurs non dues à l'échantillonnage, y
compris la nature et les sources d'erreurs et les stratégies pour les contrôler.

Comme mentionné dans la section 1.6, les erreurs non dues à l'échantillonnage sont
généralement la source principale d'erreurs dans une enquête par sondage, et ils sont difficiles à évaluer
statistiquement une fois que l'enquête est terminée. Par conséquent, il est préférable de minimiser ce
type d'erreur tout au long du processus de la mise en œuvre de l'enquête

4.1 Erreurs de couverture et de non-réponse


Une erreur de couverture se produit lorsqu’une unité d'échantillonnage est exclue de l’enquête
ou inclus dans l'enquête par erreur au cours de mise en œuvre de l'enquête. La sur-couverture se produit
quand une unité d'échantillonnage non-éligible ou non-échantillonnée est incluse délibérément ou par
erreur dans la collecte; la sous-couverture se produit quand une unité d'échantillonnage éligible
échantillonné est exclue, délibérément ou par erreur, de la collecte. La non-réponse, d'autre part, se
rapporte à une tentative ratée d'enquêter une unité échantillonnée. Cette section concerne la définition
et l'estimation de ces taux d'erreur.

Pour la sous- couverture, plusieurs sources d'erreur peuvent être identifiées. La première source
d'erreur de sous-couverture survient à l'étape du dénombrement de ménages lorsque les personnels en
charge n’ont pas dénombré une grappe entièrement : une partie de la grappe est exclue de l’enquête
soit par erreur ou délibérément. Une deuxième source d’erreur de sous-couverture se produit lorsqu’une
limite d’âge est utilisée pour déterminer l’éligibilité de l’individu, les personnels sur le terrain peuvent
déclarer un faux âge d’un individu pour le pousser à l’extérieure du groupe d’âge éligible. Une troisième
source provient du fait que les enquêtes ne collectent des informations que sur des individus de facto
(c’est-à-dire ceux qui ont dormi dans le ménage la nuit précédant l’enquête). Il peut y avoir des
omissions délibérées d’individus éligibles en faisant intentionnellement que leur statut est non de facto,
donc exclu un individu d’être éligible pour l’enquête. Une quatrième source vient du fait qu’une série de
questions du questionnaire ne sont posées qu’à un certain groupe. Par exemple, les questions liées à la
grossesse, à l'accouchement et à la santé de l'enfant ne concernent que les enfants nés après une date
donnée, il peut y avoir des omissions d'enfants dues à des enregistrements incorrects sur les dates de
naissance comme avant la date limite, ou des questions concernant les connaissances, les attitudes et
les pratiques liées au VIH ne sont demandées que pour les individus répondant avec une connaissance
du VIH/SIDA, il peut exister des omissions des répondants en raison d'une mauvaise interprétation sur

71
leur connaissance du VIH/SIDA. Les quatre types d'erreurs de couverture peuvent introduire des biais
dans les données collectées par les enquêteurs délibérément qui cherchent à réduire leur charge de
travail.

Les erreurs non dues à l’échantillonnage peuvent être contrôlées par une formation intensive et
une supervision étroite pendant la collecte. Les erreurs dues à une base de sondage obsolète peuvent
être réduites par une opération de dénombrement des ménages avant l'enquête principale. Les erreurs
dues à la fausses de l'âge peuvent être réduites par à une surveillance étroite et à un contrôle de qualité
régulier. Les erreurs dues à la fausse déclaration au statut de résident peuvent être réduites en modifiant
la stratégie de collecte de données pour interroger tous les individus de la tranche d'âge, quel que soit
leur statut de facto. Par exemple, dans les enquêtes EDS, les enquêteurs sont demandés d'interroger
toutes les femmes âgées de 15 à 49 ans trouvées dans les ménages sélectionnés, qu'elles aient dormi
ou non dans les ménages la nuit précédant l'enquête. En exigeant d’enquêter de toutes les femmes 15
à 49 ans, la motivation de déclarer faussement le statut de résident peut être éliminée. Cependant, le
caractère de facto des enquêtes est maintenu pendant l'analyse des données. Utilise des enquêteurs
différents pour le questionnaire ménage et pour l’enquête individuelle aidera également à éliminer les
fausses déclarations de l’âge, les fausses déclarations du statut de résidence et les erreurs
d’enregistrement des dates de naissance et d’autres informations clés. Une supervision active sur le
terrain et l’utilisation à l’avance des tableaux de contrôle de qualité des données collectées peuvent
également limiter le degré et l’ampleur de la sous-couverture.

Les erreurs de couverture peuvent être analysées après la collecte par diverses méthodes.
L'échantillon peut être extrapolé à la population totale et les données du dernier recensement peuvent
être extrapolées à la date de l'enquête pour comparaison. Cette vérification doit être effectuée
séparément pour les ménages et les individus. Les fausses déclarations de l’âge peuvent être étudiées
par comparaison de la répartition de l’échantillon entre les limites d’âge de l’éligibilité, par exemple en
examinant le rapport de femmes âgées de 14 ans à 15 ans et âgées de 49 ans à celles âgées de 50 ans.
Bien qu'il soit tentant d'introduire des comparaisons avec les hommes comme contrôle, il convient de
noter que dans la plupart des sociétés, les hommes sont plus étudiés que les femmes, de sorte qu'une
connaissance plus précise de leur âge peut réduire les tas entre 15 et 50 ans chez les hommes par
rapport aux femmes.

4.1.2 Exclusion sélective


Dans de nombreuses enquêtes, que ce soit dans les pays développés ou en voie de
développement, certaines parties du territoire national sont délibérément exclus de l'enquête pour des
raisons de difficultés d'accès. Deux cas distincts se posent:

• Exclusion des unités administratives ou géographiques clairement identifiés à partir de la


base de sondage, dans ce cas, il faut indiquer clairement la couverture de l'enquête dans le
rapport final. Ces exclusions ne sont pas considérées comme des erreurs de couverture ou
de non réponse, c’est tout simplement la définition du domaine de l'enquête.

• Exclusions ad hoc décidés pendant le travail sur le terrain, dans beaucoup d’enquêtes, il ne
est pas rare que l'agence de mis en œuvre de l'enquête abandonne la tentative de mener le
travail de terrain dans certaines grappes échantillonnées, qu'elles soient dues à des
catastrophiques naturelles, des troubles civils, ou d'autres contraintes pratiques. Ici les
exclusions se produisent généralement après la sélection de l'échantillon. Si ces zones
exclues forment un domaine bien connu, on peut accepter de traiter le problème en
redéfinissant le domaine de l'enquête. Cependant, généralement, les zones exclues ne
forment pas un domaine bien connu et devront être accepté comme d’erreur de couverture
ou de non-réponse. Si le nombre de grappes exclues est important, alors il est difficile

72
d’interpréter le résultat de l’enquête car la représentativité de l’échantillon sera mise en
cause.

4.1.3 La non-réponse
Le taux de réponse d’une enquête par sondage est un paramètre important car il reflète des
problèmes de couverture de l'enquête. A première vue, le concept de non-réponse semble simple et
clair: il se produit quand une unité échantillonnée, ménage ou individu, refuse d'être enquêté; le taux
de non-réponse est la proportion du nombre d'unités non-répondant sur le nombre d'unités
sélectionnées. Tenant compte de la distinction entre l'erreur de couverture et la non-réponse indiqué
précédemment, cela peut être modifié en disant que l'information désirée est le pour centage de
tentatives d’entretiens échouées.

Dans la pratique, surtout quand il s’agit de processus de tirage complexe et par plusieurs degrés,
cette simple question peut devenir compliquée car le nombre d’unités sélectionnées peut être inconnu.
Dans les enquêtes complexes où les unités finales de l’enquête, l’unité dont leurs caractéristiques seront
mesurées ou interrogées, seront identifiées par un processus de filtration progressive, si une erreur se
produit à l'une des étapes précédentes, l'information qui nous permettrait de calculer le taux de réponse
nous manque. Par exemple, dans une enquête EDS typique, les personnels de dénombrement font le
dénombrement de ménages et le tirage des ménages à enquêter, puis quelque temps après, les
enquêteurs font les entretiens du ménage actuellement occupé le logement et les entretiens des femmes
de 15 à 49 ans vivant de façon permanente ou en visite du ménage et y passé la nuit précédant
l’enquête. Si l'enquêteur ne peut pas trouver le logement sélectionné ou le ménage a refusé, on ne sait
pas s’il y a des femmes éligibles pour l'enquête ou non; si les ménages ont des femmes éligibles, alors
on ne connait pas le nombre de femmes sélectionnées.

Pour faire face à ce problème, prenez l'enquête auprès des femmes comme un exemple et
supposez qu'il n'y a que deux degrés dans le processus de filtration, à savoir les ménages et les femmes.
La tradition des enquêtes EDS est de calculer les taux de réponse pour l'enquête des ménages et pour
celle des femmes séparément en raison de pouvoir calculer les poids de sondage pour les ménages pour
les données au niveau de ménages. Il y a six quantités d’intérêt potentiel dans les calculs de taux de
réponse:

A. Ménages sélectionnés

B. Ménages trouvés ou éligibles (exclus les vacants, détruits, etc.)

C. Ménages enquêtés

D. Femmes sélectionnées

E. Femmes trouvées ou éligibles (toutes les femmes de facto de 15 à 49 trouvées)

F. Femmes enquêtées

Puisque l'enquête d’EDS concerne principalement les femmes de 15 à 49 ans, le taux de réponse
pertinent est F / D (c’est à dire, le nombre de femmes enquêtées divisés par le nombre de femmes
sélectionnées). Cependant, la quantité D est inconnue en raison des ménages non-répondants. Il est
important de connaître le nombre total de femmes éligibles dans tous les ménages sélectionnés, mais
on connait seulement le nombre de femmes présentes dans les ménages enquêtés (E). Par conséquent,
on peut estimer D en prenant en compte la non-réponse du ménage. En supposant que le nombre de
femmes éligibles par ménage est le même chez les ménages non-répondants que chez les ménages
enquêtés, le nombre de femmes sélectionnées peut être estimée comme suit:

73
C
D=E
B
où C / B est le taux net de réponse des ménages. La raison d'utiliser le taux net de réponse des ménages
est que les ménages non éligibles A-B (vacants, détruit ou autres) sont considérés comme sur-
couverture, en supposant que la même sur-couverture existe dans tous les ménages dénombrés. Ces
hypothèses peuvent ne pas être très convaincantes, mais l’effet de tout départ de leur part sur
l'estimation de D est susceptible d'être très faible. Sur cette base, le taux de réponse global pour
l'enquête auprès des femmes, R=F/D, devient:

F F C
R= = 
D E B

Ce taux de réponse est le produit des taux net de réponse à chaque degré : taux net de réponse
de ménages C / B et ce de femmes 𝐹/ 𝐸. Ce principe de base fournit une solution pour le problème de
ne pas savoir le nombre total des femmes échantillonnées. Lorsqu’on implique deux ou plusieurs degrés
de filtration, le taux de réponse global peut être estimé en multipliant les taux net de réponse à chaque
degré. Ce faisant, on fait l'hypothèse que les réponse/non-réponse aux différents degrés se produisent
indépendamment.

Les enquêtes EDS ne permettent pas le remplacement des ménages non-répondants en raison
de biais potentiels qui peuvent résulter du remplacement des ménages qui sont plus faciles à accéder.
Cependant, quand un ménage échantillonné dans un logement sélectionné déménage après le
dénombrement, le programme MEASURE EDS enquête le nouvel occupant (si seulement) au moment
de l'enquête principale. Ceci n’est pas considéré comme un remplacement; en fait, il traduit le fait que
l'unité d'échantillonnage est définie comme la structure de logement, plutôt que de ses occupants. La
conception prévoit le dénombrement, la sélection de ménages et ensuite l'entretien de ménages trouvés
dans le logement tiré au moment de l'enquête. Etant donné que dans de nombreuses situations, il
n’existe aucun système d'adresse, l'opération initiale de dénombrement doit identifier les logements en
fonction des noms des ménages occupant, mais ceux-ci ne font que servir adresses. Le fait que, dans
certains cas, un nouveau ménage déménage entre le moment du dénombrement et l'enquête principale
ne signifie pas un remplacement d'unité d'échantillonnage. Ainsi, ceux cas ne nécessitent pas de
traitement spécial. En outre, tout comme un nouveau déménagement ne constitue pas un
remplacement, le cas d'un ménage qui part après le dénombrement, sans un autre ménage occupe le
logement, crée un ménage vacant et ne constitue pas un non-répondant. L'échantillon de ménage
éligible est défini comme l'ensemble des ménages occupés au moment de l'enquête dans les logements
sélectionnés de ménages dénombrés.

4.1.4 Taux de réponses


Comme on le voit dans la section précédente, le taux de réponse global des femmes est le
produit de taux net de réponse des ménages et les taux de réponse des femmes ; il faut, donc, calculer
ces deux taux de réponse séparément. Comme nous l'avons mentionné dans la section 1.13, les non-
réponses introduisent des biais dans les données collectées. En conséquence, les différents taux de
réponse reflètent la qualité des données. Les taux de réponse différents sont utiles dans la détermination
de la taille de l'échantillon et l'amélioration du travail de terrain. Afin de catégoriser en détail les
ménages et les individus, le programme MEASURE EDS standardise les codes de réponse à enregistrer
dans les questionnaires lors de la collecte et représente la formule de taux de réponse en fonction de
ces codes. Dans les enquêtes EDS, les catégories de réponses suivantes sont utilisées au niveau des
ménages :

1H Complété

74
2H Pas de membres de ménage à la maison ou pas de répondant compétent

3H Absence total de ménage pour une longue période

4H Reporté

5H Refusé

6H Logement vacant ou adresse ne correspond pas un logement

7H Logement détruit

8H Logement non trouvé

9H Autre

Notez que ménage au-dessus indique les ménages trouvés dans les logements tirés au moment
de l'enquête principale, pas nécessairement les mêmes ménages nommés au moment de
dénombrement. Les rapports finaux de l'enquête EDS fournissent le taux de réponse des ménages
calculé par :

1H
RH =
1H + 2H + 4H + 5H + 8H

La raison d'inclure 8H dans le dénominateur est qu'un ménage qui n’est pas trouvé au moment
du travail de terrain peut être un ménage éligible. Il se peut que le ménage n’ait pas été trouvé en
raison d'une erreur produite au cours de la mise en œuvre de l'enquête. Notez également que ce taux
de réponse est différent du taux de réponse pondéré calculé à la section 1.13. Dans la Section 1.13 le
but est de calculer le poids de sondage, tandis qu'ici le taux de réponse est utilisé comme un indicateur
de qualité de données. Il est également intéressant de noter que le taux de réponse calculé ci-dessus
est un taux net de réponse. Aux fins de déterminer de la taille de l'échantillon, il faut utiliser le taux de
réponse brut qui correspond au nombre de ménages interrogés sur le nombre de ménages sélectionnés:

1H
RHG =
1H + 2H + 3H + 4H + 5H + 6H + 7H + 8H + 9H

Si le taux net de réponse est utilisé pour calculer la taille de l'échantillon, l'enquête ne peut pas
obtenir le nombre d’interviews conçu parce que certains ménages échantillonnés peuvent être non-
éligibles su moment de l’enquête, surtout quand il y a un grand décalage entre le dénombrement des
ménages et l’enquête principale.

Au niveau individuel les catégories de réponses suivantes sont utilisées:

1I Complété

2I Absent

3I Reporté

4I Refusé

5I Partiellement complète

6I Handicapé

7I Autre

75
Le taux de réponses individuels est:

1I
RI =
1I + 2I + 3I + 4I + 5I + 6I + 7I

Les codes ci-dessus sont appliqués qu’aux femmes éligibles, c’est-à-dire, les femmes de facto
15 à 49 ans. Même si les femmes non-de facto qui vivent dans les ménage tirées sont interrogées pour
réduire les erreurs de sous-couverture comme mentionné dans la section 4.1.1, ces interviews ne sont
pas comptés dans le numérateur ni dans le dénominateur du taux des réponses parce que les femmes
non-de facto ne sont pas éligibles selon la définition de l'éligibilité.

Le code «Autre» est laissé ouvert dans le questionnaire ménages et le questionnaire individuel
également. Chaque fois que le code «Autre» est utilisé, les enquêteurs doivent préciser le motif de la
non-réponse. Au niveau du ménage, tour les records «Autre» seront analysés avant la finalisation du
fichier de données, ils seront recodés autant que possible dans les autres catégories existantes. De
même, tous les records «Autre» au niveau individuel doivent être analysés et recordés autant que
possible dans les autres catégories existantes examinés et enregistrés. Tous les questionnaires dans
lesquels des ménages ou des femmes ont étés recordés non éligibles doit être clairement marqué comme
non éligibles et leur retirés du fichier de données finales. Un ménage non éligible peut être un dans un
logement non tiré pour l’enquête ou un ménage voisin enquêté à la place d’un ménage sélectionné par
erreur. Une femme inéligible peut être celle qui a été rapporté avoir 16 ans dans le questionnaire
ménage, mais plus tard avéré avoir 14 ans (dans ce cas, il faut corriger son âge dans le questionnaire
de ménage).

Le taux de réponse global pour l’enquête femme est obtenu en multipliant le taux de réponse
de ménages et ce de femmes :

R = Rh  RI
Cependant, s’il y a des non-réponses au niveau de grappes (certaines grappes tirées ne sont
pas enquêtées par des raisons diverse, voir la section 1.13), le taux de réponse global doit aussi prendre
en compte le taux de réponse de grappe. En résumé, le taux final de réponses globales pour l’enquête
femmes est obtenu à partir de la formule suivante:

R = Rh  RI  RC

où Rc = n * / n est le taux de réponse au niveau de grappes, nombre de grappes enquêtés sur le nombre
grappes sélectionnées.

Ces taux de réponse doivent être calculés et publiés séparément pour les principaux domaines
géographiques ou administratifs ainsi que l'ensemble de l’échantillon. Si l'échantillon est auto-pondéré
au sein des domaines, mais a des poids différents à travers les domaines, les taux de réponse doivent
être calculés et publiés pour chaque domaine de pondération différemment.

4.2 Erreurs d'échantillonnage


Nous avons introduit le concept des erreurs d'échantillonnage dans la section 1.6 pour la
détermination de la taille de l'échantillon. Dans cette section, nous nous concentrons sur le calcul des
erreurs d'échantillonnage. Les erreurs d'échantillonnage sont habituellement publiées pour des
indicateurs sélectionnés dans l'annexe B du rapport final d’EDS.

Une erreur d'échantillonnage est généralement mesurée en termes de l'écart-type pour une
statistique particulière (moyenne, pour centage, etc.), qui est la racine carrée de la variance de
l’estimateur. L'écart-type peut être utilisé pour calculer l’intervalle de confiance à l'intérieur duquel

76
inclure la valeur réelle de la statistique avec une confiance spécifiée. Par exemple, pour une statistique
donnée calculée à partir des données d'enquête, la vraie valeur de cette statistique va tomber dans une
fourchette de plus ou moins deux fois de son écart-type (l’EDS utilise ±2*ET au lieu de ±1,96*ET comme
intervalle de confiance de 95%, comme expliqué dans la section 1.6.1) de cette statistique dans 95 pour
cent de tous les échantillons possibles de taille et de conception identique.

Si l'échantillon de répondants ait été sélectionné par un tirage aléatoire simple, il aurait été
possible d'utiliser des formules simples pour calculer les erreurs d'échantillonnage. Cependant, les
échantillons de l'enquête EDS sont le résultat d'un tirage par grappe stratifié et à plusieurs degrés, il
est donc nécessaire d'utiliser des formules plus complexes. Il y a une variété de logiciels qui peuvent
être utilisés pour calculer les erreurs d'échantillonnage, tels que le Système Intégré d’Analyse
d’Enquêtes (ISSA), le Macro progiciel SAS développé par ICF Macro ainsi que les logiciels tels que
WESVAR, CENVAT et Sudaan. Ces logiciels utilisent la Méthode de Linéarisation de Taylor (Woodruff,
1971) pour estimer la variance d’échantillonnage des estimateurs comme des moyennes, des
proportions ou de ratios. Cette même méthode est largement utilisée dans les logiciels statistiques
commercialisés tels que le SAS, le SPSS et le STATA. La méthode de réplication de Jackknife (Efron,
1982, 1993) est utilisés pour estimer la variance des statistiques plus complexes telles que les taux de
fécondité et de mortalité.

La méthode de linéarisation de Taylor traite chaque proportion ou moyenne comme étant une
estimation de ratio r = y/x, avec y la somme pondérée de la variable y et celle de la variable x, ou le
nombre total de cas pondérés, calculés basé sur les mêmes unités enquêtées. La variance de r est
calculée en utilisant la formule ci-dessous, avec l’écart-type qui est la racine carré de la variance :
2
1 H
nh(1 − fh )  z 
SE 2(r ) = var(r ) =
x2
   zhj − nh 
nh − 1 j 
h =1 h 

dans laquelle
z hi = y hi − rxhi , and z h = y h − rxh

où h représente la strate d'échantillonnage qui varie de 1 à H,


nh est le nombre total de grappes enquêtées dans la strate hth,
yhj est la somme des valeurs pondérées de la variable y dans la grappe jth dans la strate hth,
xhj est la somme des valeurs pondérées de la variable x dans la grappe jth dans la strate hth,
fh est le taux de sondage dans la strate h, il peut être ignoré quand il est petit
x est la somme des valeurs pondérées de la variable x sur l'échantillon total

La méthode de Jackknife calcule une série des estimations du taux complexe à partir des
réplications de l’échantillon total et calcule l’écart-type de ces estimations avec des formules simples.
Chaque réplication de l’échantillon total exclut une grappe dans le calcul des estimations. Ainsi, des
estimations pseudo-indépendantes ont été créées. La variance d'un taux r est calculée comme suit:

2
1 k
SE 2 (r ) = Var (r ) =  (ri − r )
k (k − 1) i =1
dans lequel
ri = kr − (k − 1)r(i )

r est l'estimation calculée à partir de l'échantillon complet de k grappes,

77
r(i) l'estimation calculée à partir de l'échantillon réduit de K-1 grappes (avec la grappe ith
exclue), et
k est le nombre total de grappes enquêtées

En plus de l'écart-type, la procédure calcule l'effet de sondage (DEFT) pour des estimations qui
sont des moyens, proportions ou des rapports. Pour les taux démographiques complexes, la procédure
calcule une approximation de DEFT. DEFT est défini comme un ratio entre l'écart-type en utilisant le
plan d'échantillonnage donné et l'écart-type qui résulterait si un échantillon aléatoire simple avait été
utilisé. Une valeur DEFT de 1,0 indique que le processus de l'échantillonnage complexe est aussi efficace
que d'un échantillon aléatoire simple, alors qu'une valeur supérieure à 1,0 indique l'augmentation de
l'erreur d'échantillonnage en raison de l'utilisation du processus de l'échantillonnage plus complexe et
statistiquement moins efficace. La procédure calcule également l’intervalle de confiance et les erreurs
relatives pour chaque des indicateurs sélectionnés.

Les erreurs d'échantillonnage sont habituellement rapportées pour l'échantillon complet, pour
les zones urbaines et rurales, et pour chacun des domaines d'enquête.

5 DOCUMENTATION DE L’ÉCHANTILLON
5.1 Introduction
La documentation de l’échantillon est une partie importante d'une enquête EDS. La
documentation doit inclure toutes les informations utiles pour l'analyse de données, pour l'évaluation de
la qualité des données, pour la conception des enquêtes ultérieures et pour les utilisateurs de données.
La documentation de base devrait inclure dans les rapports finaux de l'enquête EDS. Une bonne
documentation de l'échantillon doit inclure les aspects suivants aux différents degrés de la mise en
œuvre de l'enquête:

1) Population cible
2) Taille de l'échantillon prévue
3) Principaux indicateurs
4) Domaines d’étude
5) Base de sondage
6) Unités d'échantillonnage primaires et secondaires
7) Stratification
8) Répartition de l'échantillon
9) Procédure d'échantillonnage
10) Probabilité d’inclusion
11) Résultats de dénombrements des ménages
12) Poids de sondage
13) Résultats de la mise en œuvre de l'enquête
14) Erreurs d'échantillonnage

Les points 1 à 10 et le point 12 sont généralement traités dans un document de conception de


l'échantillonnage dès le début de l'enquête. Pour le point 11, on doit fournir : le dénombrement des
ménages, le nombre de ménages sélectionnés et l’information de segmentation pour chacune des
grappes sélectionnées. Une description complète de conception de l'échantillon doit être inclue à
l'annexe A des rapports finaux d’EDS. Pour le point 13, on doit présenter : le nombre d'unités
d'échantillonnage éligibles sélectionné, le nombre enquêté et le taux de réponses individuels et de

78
ménages. Les erreurs d'échantillonnage (point 14) sont présentées dans l'annexe B du rapports finaux
EDS pour des indicateurs sélectionnés.

5.2 Document de conception de l’échantillon


Un document de conception de l'échantillon, ou plan de sondage, est un document important
qui présente l'objectif de l'enquête, la population cible, la source de la base de sondage, la méthodologie
de l’enquête, la taille de l'échantillon et de la répartition de l'échantillon, la précision souhaitable pour
des indicateurs spécifiques, ainsi que d'autres sujets. Cette section donne un exemple d'un plan de
sondage qui montre les détails qui devraient être inclus dans un document de conception de l'échantillon

5.2.1 Introduction
L’enquête démographique et de santé 2012 (XEDS 2012) sera le quatrième EDS après celles de
1995, 2000 et 2005. L’enquête XEDS 2012 utilise un échantillon national représentatif de 18 450
ménages. Toutes les femmes de 15 à 49 ans qui sont des résidents habituels d'un ménage sélectionné
ou qui ont dormi dans un ménage sélectionné la nuit précédant l'enquête sont éligibles pour l'enquête.
L'enquête résultera en environ 17 900 interviews de femmes de 15 à 49 ans. Comme avec les enquêtes
précédentes, les principaux objectifs de l'enquête XEDS 2012 sont de fournir des informations à jour
sur les niveaux de fécondité et de mortalité infantile; les préférences de fécondité; la sensibilisation,
l'approbation et l'utilisation des méthodes de planification familiale; la santé maternelle et infantile; les
connaissances et attitudes à l'égard du VIH/sida et d'autres infections sexuellement transmissibles.

En dehors de l'enquête auprès des femmes, une enquête auprès des hommes sera également
menée en même temps dans un sous-échantillon comprenant un ménage sur trois sélectionnés pour
l'enquête auprès des femmes. Tous les hommes de 15 à 59 ans qui sont des résidents habituels d'un
ménage sélectionné ou qui ont dormi dans un ménage sélectionné la nuit précédant l'enquête sont
éligibles pour l'enquête auprès des hommes. L'enquête permettra de recueillir des informations sur leur
base démographique et le statut social, sur leur connaissance et l'utilisation des méthodes de
planification familiale et sur leurs connaissances et leurs attitudes à l'égard du VIH/sida et d'autres
infections sexuellement transmissibles. L'enquête résultera d’environ 5 000 interviews d'hommes de 15
à 59 ans. Dans ce sous-échantillon, toutes les femmes de 15 à 49 ans éligibles, et tous les enfants de
moins de 5 ans seront pesés, mesurés et testés contre l'anémie afin d'étudier leur état nutritionnel.

L'enquête est conçue pour produire des estimations représentatives de la plupart des indicateurs
pour le pays dans son ensemble, pour les zones urbaines et les zones rurales séparément, pour la
capitale du pays, et pour chacune des dix régions géographiques.

5.2.2 Base de sondage


La base de sondage utilisée pour XEDS 2010 est le Recensement Général de la Population et de
l’Habitat effectué en 2006 (XRGPH 2006), fournis par le Bureau Central de Statistique (CSO). Le CSO a
mis à disposition un fichier électronique constitué de 81,654 Zones de Dénombrement (ZD) crée pour
le recensement de 9 de ses 10 régions en 2006. Une ZD est une zone géographique constituée d'un
nombre approprié de logement qui ont servi d’unité de comptage pour le recensement. Le fichier de
base contient des informations sur l'emplacement, le type de résidence et le nombre de ménages
résidentiels pour chacune des 81,654 ZD. Des croquis sont également disponibles pour chaque ZD qui
délimite la location les limites géographiques de la ZD. Il convient de souligner que ce fichier ne
comprend pas la région 10 parce que le recensement effectué dans la région 10 a utilisé une
méthodologie différente en raison de la difficulté d'accès. Par conséquent, la base de sondage pour la
région 10 est dans un fichier différent et utilise un format différent. Il est également intéressant de noter

79
que la base de sondage exclu certaines ZD spéciales qui représentent des conflits sur leurs limites ; ce
genre de ZD ne représente que 0,1% de la population totale.

Le travail cartographique de recensement pour la région 10 a été réalisé en utilisant deux


méthodes différentes. Dans deux de ses six districts, à savoir, les districts 2 et 4, le travail traditionnel
cartographique similaire aux autres régions du pays a été réalisée, tandis que dans les quatre autres
districts, le travail cartographique a été réalisé en utilisant des photos satellites sans visites physiques
de la zone. Les données du recensement ne pouvaient pas être utilisées pour mettre à jour le travail
cartographique dans la région 10 en raison de problèmes de codage. Donc, dans la région 10, une base
de sondage avec un format similaire à celui des autres régions n’est disponible que pour les deux districts
où un travail cartographique traditionnel avait été effectué. Cependant, le nombre de ménages dans le
base de sondage pour ces trois districts est basé sur le nombre de ménages estimés pendant le travail
cartographique précédant le recensement et non pas le nombre réel de ménages dénombrés dans le
recensement. En raison de problèmes de sécurité, comme dans le XEDS 2000 et 2005, il a été décidé
que le XEDS 2012 sera effectuée uniquement dans ces deux districts. Ces deux districts, ensembles,
ont 1246 ZD, et ils représentent 53% de la population totale de la région. Tenant compte des ZD exclues
de la base de recensement, la base de sondage utilisée pour l'XEDS 2012 couvre 98,4% de la population
totale du pays.

Le pays X est divisé en 10 régions géographiques; chaque région est subdivisée en districts, et
chaque district en quartiers. Le tableau 5.1 ci-dessous présente la répartition de ZDs par région et selon
leur type de résidence. La base de sondage comprend 82 900 ZD parmi lesquelles 17 346 sont dans des
zones urbaines et 65 554 dans des zones rurales. La taille moyenne d'une ZD en termes de ménages
est de 170 dans une ZD urbaine et 182 en milieu rural, pour une taille moyenne globale de 180 ménages
par ZD. Le tableau 5.2 suivant montre la répartition de ménages par région et par type de résidence.
La répartition est une répartition très inégale puisque 83,4% des ménages du pays sont concentrés dans
trois régions, à savoir, les régions 3, 4 et 6; tandis que les cinq petites régions, Région 2, Région 5,
Région 7, Région 8 et Région 9 ne représentent ensemble que 3,8% des ménages du pays.

Tableau 5.1 Répartition des ZDs et taille moyenne de ZD par région et par type de
résidence

Nombre de ZD Taille moyenne de la ZD


Région
Urbain Rural Total Urbain Rural Total
Région 1 1,541 4,139 5,680 153 177 171
Région 2 260 828 1,088 177 233 219
Région 3 3,391 18,016 21,407 183 182 182
Région 4 5,030 25,800 30,830 172 179 178
Région 5 188 786 974 140 152 150
Région 6 2,124 14,490 16,614 166 184 182
Région 7 133 347 480 145 129 134
Région 8 172 98 270 163 180 169
Capitale 3,865 3,865 167 167
Région 9 318 128 446 163 169 165
Région 10* 324 922 1,246 154 267 237

Pays 17,346 65,554 82,900 170 182 180

Source: XPHC 2006; la Région 10 a seulement deux districts inclus.

80
Table 5.2 Distribution de ménages par région et par type de résidence

Nombre de ménages % % of
Région
Urbain Rural Total Urbain Pays
Région 1 235,530 734,357 969,887 0.243 0.065
Région 2 45,910 192,554 238,464 0.193 0.016
Région 3 619,796 3,284,512 3,904,308 0.159 0.262
Région 4 864,303 4,630,702 5,495,005 0.157 0.369
Région 5 26,314 119,446 145,760 0.181 0.010
Région 6 353,554 2,667,787 3,021,341 0.117 0.203
Région 7 19,275 44,879 64,154 0.300 0.004
Région 8 27,975 17,651 45,626 0.613 0.003
Capitale 646,216 0 646,216 1.000 0.043
Région 9 51,991 21,643 73,634 0.706 0.005
Région 10* 49,844 245,922 295,766 0.169 0.020

Pays Ensemble 2,940,708 11,959,453 14,900,161 0.197 1.000

Source: RGPH 2006; la Région 10 a seulement deux districts inclus.

5.2.3 Structure de l’échantillon et procédure d’échantillonnage


L'échantillon de l'XEDS 2012 est un échantillon stratifié sélectionné en deux degrés de la base
du recensement 2006. La stratification a été réalisée en séparant chaque région par zones urbaines et
rurales. Au total, 19 strates d'échantillonnage ont été créées puisque la région de la capitale n’a de zone
urbaine. Les échantillons sont choisis de façon indépendante dans chaque strate d'échantillonnage en
deux degrés. A l’intérieur de chaque strate explicite, une stratification implicite plus approfondie avec
une allocation proportionnelle de l’échantillon aux niveaux d’administratifs inférieurs est arrivée par la
procédure de triage : en triant la base de sondage en fonction des unités administratives aux différents
niveaux et en utilisant une procédure de tirage à probabilité proportionnelle à la taille au premier degré
de tirage.

Dans le premier degré, 615 ZD ont été sélectionnés avec un tirage à probabilité proportionnelle
à la taille de ZD et une sélection indépendante dans chaque strate d'échantillonnage avec une allocation
donnée dans le tableau 5.3 ci-dessous. En prenant compte le temps écoulé depuis le dernier
recensement de la population, une opération de dénombrement des ménages et une mise à jour de la
carte est effectuée dans toutes les ZD sélectionnées avant l'enquête principale. L'opération de
dénombrement des ménages consiste à visiter chacune des 615 ZD choisis; dessiner un plan de situation
et un croquis détaillé, et enregistrer sur le fiche de ménages tous les ménages résidentiels trouvés dans
la ZD avec l'adresse et le nom du chef du ménage. La liste de ménages est servie de base de sondage
pour le tirage de ménages dans le deuxième degré. Certains ZD sélectionnées ont des grandes tailles,
afin de contrôler la tâche du dénombrement, les ZDs choisis contenant un nombre estimatif de ménages
plus de 300 ont été segmentées. Un seul segment est sélectionné pour l'enquête avec probabilité
proportionnelle à la taille du segment. La méthodologie et la procédure de dénombrement de ménages
détaillées sont abordées dans le manuel de dénombrement de ménage (voir chapitre 2).

Au deuxième degré, un nombre fixe de 30 ménages sont sélectionnés dans chaque ZD. Le
tableau 5.3 montre la répartition de l'échantillon grappe et celle de ménage par région et selon type de
résidence. Parmi les 615 ZD sélectionnées, 185 sont dans les zones urbaines et 430 sont dans les zones
rurales. Le nombre total de ménages à sélectionner est de 18 450; parmi eux, 5 550 sont dans les
zones urbaines et 12 900 sont dans les zones rurales.

81
Dans la base de sondage, la répartition des ménages par région varie de 0,3 pour cent pour la
région 8, à 36,9 pour cent pour la région 4 (voir le tableau 5.2). Pour repartir les quelques 17 900
femmes enquêtées avec succès aux différentes régions, une répartition proportionnelle fournira la
meilleure précision pour les indicateurs au niveau national, mais il ne peut pas garantir une précision
acceptable pour les indicateurs au niveau régional. Les petites régions comme la Région 7, la Région 8
et la Région 9 devaient recevoir une taille d'échantillon trop petite pour atteindre le degré de précision
souhaitée. Pour que la précision soit acceptable dans toutes les régions, l'expérience montre qu'un
minimum de 800 femmes enquêtées avec succès est nécessaire afin d’obtenir des estimations fiables
pour la plupart des indicateurs EDS. L’allocation d'échantillonnage retenue pour l'XEDS 2012 est une
allocation par la puissance qui est une allocation entre l’allocation proportionnelle et l’allocation de taille
égale. Pour que la précision de l'enquête dans les zones urbaines soit comparable à celle aux zones
rurales, les zones urbaines sont légèrement sur-échantillonnées

Les répartirions de grappes et les ménages, par région et par type de résidence sont des
fonctions de la moyenne estimative de femmes de 15 à 49 ans par ménage et les taux de réponse
individuels et de ménages. Les estimations de ces paramètres sont obtenues de l'enquête XEDS 2005.
Selon les résultats de XEDS 2005, le nombre moyen de femmes de 15 à 49 ans par ménage est de 1,20
dans les zones urbaines et de 1,00 dans les zones rurales. Le nombre des hommes de 15 à 59 ans par
ménage est de 1,05 dans les zones urbaines et 0,95 dans les zones rurales. Le taux de réponse de
ménage est 92 pour cent dans les zones urbaines et 94 pour cent dans les zones rurales; le taux de
réponse des femmes est 94 pour cent et 96 pour cent dans les zones urbaines et rurales,
respectivement; le taux de réponse des hommes est 85 pour cent et 90 pour cent dans les zones
urbaines et rurales, respectivement.

82
Tableau 5.3 Allocation de l'échantillon grappe et de ménage par région
et selon le milieu de résidence

Répartition de grappes Répartition de ménages


Région
Urbain Rural Région Urbain Rural Région
Région 1 13 47 60 390 1,410 1,800
Région 2 10 38 48 300 1,140 1,440
Région 3 10 62 72 300 1,860 2,160
Région 4 13 62 75 390 1,860 2,250
Région 5 6 42 48 180 1,260 1,440
Région 6 7 65 72 210 1,950 2,160
Région 7 9 37 46 270 1,110 1,380
Région 8 25 17 42 750 510 1,260
Capitale 54 na 54 1,620 Na 1,620
Région 9 27 15 42 810 450 1,260
Région 10 11 45 56 330 1,350 1,680

Pays 185 430 615 5,550 12,900 18,450

Table 5.4 Nombre attendu de femmes et hommes enquêtés avec succès


Par région et selon le milieu de résidence

Femmes 15-49 enquêtées Homes 15-59 enquêtés


Région Statistique
Urbain Rural Région Urbain Rural Région
Région 1 434 1,280 1,714 98 358 456
Région 2 333 1,035 1,368 76 290 366
Région 3 333 1,689 2,022 76 472 548
Région 4 434 1,689 2,123 98 472 570
Région 5 200 1,144 1,344 45 320 365
Région 6 233 1,771 2,004 53 495 548
Région 7 299 1,008 1,307 69 282 351
Région 8 834 463 1,297 189 130 319
Capitale 1,800 na 1,800 408 na 408
Région 9 901 409 1,310 205 114 319
Région 10 367 1,226 1,593 83 342 426

Pays 6,168 11,714 17,882 1,400 3,275 4,676


L'enquête auprès des hommes est effectuée dans un sous-échantillon d’un ménage sur trois

5.2.4 Probabilité d’inclusion et poids de sondage


En raison de l’allocation non proportionnelle de l'échantillon dans les différentes régions et de
leurs zones urbaines et rurales, les poids de sondage seront nécessaires pour toutes les analyses en
utilisant les données XEDS 2012 pour s’assurer que les résultats de l'enquête sont représentatifs au
niveau national et régional. Puisque l’échantillon XEDS 2012 est un échantillon stratifié et par grappe et

83
tiré à deux degrés, les poids de sondage sont calculés sur la base des probabilités de tirage à chaque
degré et pour chaque grappe. Nous utilisons les notations suivantes:

P1hi: probabilité d’inclusion de premier degré pour la grappe ith en strate h

P2hi: probabilité d’inclusion de deuxième degré pour la grappe ith (tirage de ménage)

Si nh est le nombre de grappes sélectionnés dans la strate h, Mhi le nombre de ménages par
rapport à la base de sondage dans la grappe ith et  Mhi le nombre total de ménages dans la strate h,
la probabilité d’inclusion de la grappe ith dans l’échantillon XEDS 2012 est calculée comme ceci:

nh M hi
P1hi =
 M hi

Pour prendre la segmentation en compte, soit bhi la proportion de ménages dans le segment
tiré par rapport au nombre total de ménages dans la ZD i dans la strate h, bhi = 1 si la grappe n’est pas
segmentée. La probabilité d’inclusion de la grappe i dans l'échantillon est :

nh M hi
P1hi =  bhi
 M hi

Soient Lhi le nombre de ménages dénombrés dans la grappe i dans la strate h, t hi le nombre
de ménages tirés. La probabilité d’inclusion pour un ménage au deuxième degré dans la grappe est
calculée comme ceci:

t hi
P2 hi =
Lhi

La probabilité globale de sélection de chaque ménage dans la grappe i de la strate h est donc la
production des deux probabilités d’inclusion :

Phi = P1hi  P2hi

Le poids de conception pour chaque ménage dans la grappe i de la strate h est l'inverse de sa
probabilité d’inclusion globale:

Whi = 1 / Phi

Une feuille Excel de calcul contenant tous les paramètres d'échantillonnage et les probabilités
d’inclusion est préparée pour faciliter le calcul du poids de sondage. Les poids de conception sont ajustés
pour tenir compte des non réponses au niveau du ménage et au niveau individuel pour les ménages
ainsi que pour les femmes et les hommes. Toutes les corrections de non réponses sont réalisées au
niveau de la strate d’échantillonnage. Les poids de sondage pour les ménages sont obtenus par les poids
de conception multiplié par l’inverse du taux de réponse du ménage, par strate. Les poids de sondage
pour les femmes sont obtenus par les poids de sondage de ménages multiplié par l’inverse du taux de
réponse individuel de femmes, par strate. Les poids de sondage pour les hommes sont obtenus par le
poids sondage des ménages pour le sous-échantillon hommes multiplié par l’inverse du taux de réponse
individuel des hommes, par strate. Après ajustement pour les non réponses, les poids sont normalisés
pour obtenir les poids standard qui apparaissent dans les fichiers de données. La procédure de
normalisation a pour objectif d’obtenir le nombre total de cas non pondérés égal au nombre total de cas
pondérés en utilisant les poids normalisés au niveau national, pour le nombre total de ménages, de

84
femmes et d’hommes, séparément. La normalisation est faite en multipliant les poids par le taux de
sondage total estimé par l’enquête, pour les poids des ménages, celles des femmes, et celles des
hommes, respectivement. Les poids normalisés sont des poids relatifs qui sont valides pour estimer des
moyennes, des proportions, des ratios et des taux, mais qui ne sont pas valides pour estimer des totaux
ou les tailles de populations cibles, ou pour des données fusionnées des enquêtes différentes.

5.3 Fichier de l’échantillon


Un fichier de l’échantillon, y compris tous les paramètres d'échantillonnage, est très important
pour la gestion de l'enquête et pour calculer les poids de sondage. Une fois les UPS, ou les grappes,
sont sélectionnés, on doit préparer un fichier Excel qui doit inclure le numéro de grappe, les informations
d’identification (ID) de la grappe ainsi que tous les paramètres d'échantillonnage tels que le domaine,
la strate d’échantillonnage et la probabilité d’inclusion de la ZD. Le numéro de grappe est un numéro
séquentiel unique de 1 au nombre total de grappes sélectionnés ; il est important pour la gestion de
travail, y compris la communication et la supervision des travaux sur le terrain. Le numéro de grappe
est l’ID officielle de la grappe, il est unique et fixé une fois attribué. Il est également utile d'inclure dans
le fichier de l'échantillon de la taille de ZD, la taille totale de la strate, le nombre de ZDs dans la strate
et le nombre de ZDs choisis dans la strate. Ces informations permettent à la reconstruction de la
probabilité d’inclusion, si nécessaire; par exemple, pour le contrôle de travail et de remplacement des
grappes problématiques.

Si une grappe sélectionné ne est pas accessible en raison de problèmes de sécurité et une
grappe de remplacement est sélectionné, alors, il est facile de calculer la probabilité d’inclusion pour la
grappe de remplacement à partir des paramètres d'échantillonnage. Le tableau 5.5 ci-dessous montre
une partie d'un exemple fichier de l'échantillon. Les colonnes avec les libellés en couleur bleu claire
représentent les informations d'identification de la ZD provenant de la base de sondage. Les colonnes
avec les libellés en couleur jaune représentent les paramètres de sondage donnés par le statisticien
d'enquête. Ce fichier doit être mis à jour après l'opération de dénombrement de ménages en ajoutant
le nombre de ménages dénombrés, l’information de segmentation, et le nombre de ménages tirés. Ces
trois éléments sont nécessaires pour développer les poids de sondage.

Tableau 5.5 Un exemple fichier de l’échantillon

85
5.4 Résultats de l’Enquête
Une fois le travail de terrain est terminé et le saisi de données est complété, on devrait produire
quelques tableaux des résultats de mise en œuvre de l'enquête pour évaluer la couverture de l'enquête
et les départs de la conception de l'enquête. Ces tableaux comprennent généralement un tableau
récapitulatif et des tableaux individuels pour les enquêtes de ménages, de femmes et des hommes,
respectivement. Un tableau récapitulatif est généralement présenté dans le chapitre 1 du rapport final
EDS qui comprend le nombre de grappes sélectionnées et enquêtées, le nombre de ménages
sélectionnés, trouvés et enquêtés ; le nombre de femmes trouvées et enquêtées et le nombre des
hommes trouvés et enquêtés. Les tableaux détaillés pour les enquêtes de ménages et de femmes, et
celle d’hommes sont habituellement présentés dans l'annexe A du rapport final EDS avec le plan de
sondage. Les deux tableaux reflètent la couverture de l'enquête et la qualité des données, et fourni
plusieurs taux de réponse et le nombre de personnes éligibles par ménage ; ceci sont des informations
utiles pour la conception des échantillons pour les enquêtes ultérieures. Les tableaux suivants sont des
exemples qui devraient être inclus dans le rapport final.

Tableau 5.6 Exemple de tableau pour les résultats de la mise en œuvre de l'enquête

86
Table 5.7 Exemple de tableau annexe pour les résultats de l'enquête femmes

87
Table 5.8 Exemple de tableau annexe pour les résultats de l’enquête hommes

5.5 Erreurs d’échantillonnage


Les erreurs d'échantillonnage sont des paramètres importants de l’enquête de la qualité de
données qui donnent une mesure de la précision des estimations et l’efficacité de l'enquête. Les rapports
finaux d'enquête EDS présentent des erreurs d'échantillonnage dans l'annexe B pour des indicateurs
clés sélectionnés. Les tableaux des erreurs d'échantillonnage présentent la valeur de l'indicateur
estimée, l'écart-type, le nombre de cas non pondérés et pondérés, l'effet de sondage, l'écart-type
relative et les limites de l’intervalle de confiance. L'effet de sondage peut être utilisé dans le calcul de
taille de l'échantillon pour des enquêtes ultérieures. Section 4.2 traite des détails du calcul des erreurs
d'échantillonnage. Nous donnons ici un exemple de tableaux de l'erreur d'échantillonnage au niveau
national, avec la liste des indicateurs sélectionnés et de leur type et sa population cible.

88
Table 5.9 Exemple tableau pour les erreurs d'échantillonnage

89
5.6 Paramètres d'échantillonnage dans le fichier de données EDS
Certains paramètres d'échantillonnage importants devraient être inclus dans le fichier de
données EDS, telles que les variables qui identifient le domaine d’étude, la strate d’échantillonnage, la
probabilité d’inclusion, et le poids de sondage. Les fichiers de données EDS finals présentent, en général,
un identifiant géographique au niveau de domaine d’étude ou de la région; les identifiants au niveau du

90
district, ou en de sous du domaine d’étude ou de la région, ne sont généralement pas présentés en
raison de contraintes de confidentialité. Quant à l’identifiant de la state d'échantillonnage, les fichiers
de données EDS finales devraient fournir la véritable qui définit la strate d'échantillonnage, il est
importante pour beaucoup d’analyses statistiques tels que le calcul de l'erreur d'échantillonnage.
Cependant, en cas de petites strates ne contenant que quelques grappes sélectionnés, des contraintes
de confidentialité ne permettent pas aux fichiers de données EDS de présenter le vrai identifiant de la
strate d’échantillonnage. Dans ces cas, on inclut une identification de la stratification de haut niveau qui
devrait être proche de la véritable stratification et n’introduira pas des biais importants.

Les paramètres d’échantillonnages standards inclus dans les fichiers de données EDS
comprennent:

1) Variable d’indicateur de grappe

2) Variable de stratification

3) Des variables de poids de sondage

4) Variable du domaine d’étude

5) Variable de l’unité géographique/administrative du premier niveau (région, province ou


département, etc.)

91
Glossaire
Domain d’analyse Une sous-population qui ne peut pas être identifiée dans le base
de sondage, tels que les domaines spécifiés par les caractéristiques
individuelles. Voir aussi Domaine de Conception

Carte de base Une carte de référence qui décrit l'emplacement et les limites
géographiques de la ZD.

Grappe L'unité d’enquête géographique statistique plus petite pour EDS.


Elle se compose d'un certain nombre de ménages adjacents dans
une zone géographique. Pour les enquêtes EDS, une grappe
correspond soit à une ZD ou un segment d'une grande ZD

Quartiers d'habitation collectifs Quartiers d’habitation comme les camps militaires, les pensions ou
les prisons où des personnes vivent individuellement. Les quartiers
d'habitation collectifs ne sont pas considérés comme des ménages
ordinaires et sont exclus de l’échantillon EDS.

Intervalle de confiance Une fourchette dans laquelle inclure la valeur réelle de la statistique
avec une confiance spécifiée. Par exemple, pour une statistique
donnée calculée à partir des données d'enquête, la vraie valeur de
cette statistique va tomber dans une fourchette de plus ou moins
deux fois de son écart-type (l’EDS utilise ±2*ET au lieu de ±1,96*ET
avec une confiance de 95%
Degrés de liberté Le nombre d'unités d'information indépendantes dans un
échantillon adéquat à l'estimation d'un paramètre ou un calcul
d'une statistique.

Domaine de conception Une sous-population qui peut être identifiés dans le base de
sondage et peut donc être traité indépendamment dans les
différentes procédures de l’enquête, généralement constitué de
zones géographiques ou des unités administratives comme la
région. Voir aussi Domaine d’Analyse.

Effet de Sondage (Deft) Une mesure de l'efficacité de l'échantillonnage complexe par


rapport à l’échantillonnage aléatoire simple, défini comme le ratio
entre l'écart-type en utilisant le plan d'échantillonnage donné et
l'écart-type qui résulterait si un échantillon aléatoire simple avait
été utilisé.

Poids de Conception Le poids de conception est le facteur d’extrapolation défini comme


l'inverse de la probabilité d’inclusion globale avec laquelle une
unité d'échantillonnage (ménage ou individu) a été sélectionnée
dans l'échantillon. Voir aussi Poids de Sondage.

Précision souhaitée Le niveau de précision des résultats souhaités, souvent nommé


comme l’écart-type relatif ou coefficient de variation.

92
Unité d’habitation Une chambre ou groupe de chambres normalement destinée
comme résidence d’un ménage (par exemple: une maison
individuelle, un appartement, un groupe de chambres dans une
maison); une unité d’habitation peut avoir plus d’un ménage.

Zone de Dénombrement(ZD) Une unité géographique statistique crée comme unité de comptage
pour le recensement générale de la population et inclut un certain
nombre de ménages.

Stratification explicite La division réelle des unités d'échantillonnage en parties


spécifiées connus comme des strates, avant le tirage de
l’échantillon. Voir également la stratification implicite.

Taux de réponse brut Le nombre de ménages ou individus enqu6etés sur le nombre


sélectionné.

Chef de Ménage Une personne qui est reconnu comme tel par les membres de la
famille et qui est habituellement responsable de l'entretien et la
maintenance du ménage.

Ménage Ordinaire Une personne ou un groupe de personnes apparentées ou non, qui


vivent ensemble dans la même unité d’habitation, qui
reconnaissent à un adulte de 15 ans ou plus comme chef de
ménage, qui partagent les dépenses courantes du ménage.

Dénombrement du Ménage Une opération consiste à visiter chaque grappe sélectionnée avant
l’enquête principale, à enregistrer sur la fiche des ménages une
description de chaque ménage avec le nom du chef de ménages et
l’adresse du ménage résidé dans la grappe. La liste complète de
ménages servit comme base de sondage pour le tirage de
ménages.

Tirage de Ménage Tirage aléatoire des ménages à partir des ménages dénombrés,
généralement par tirage systématique.

Stratification implicite L'effet de stratification engendrée par un tirage systématique à


probabilité proportionnelle à la taille à partir d'une base triée
correctement. Voir également la Stratification Explicit.

Non-réponse partielle Une unité d'échantillonnage ne fournit pas une réponse à une
question spécifique. Voir aussi Non-réponse complète.

Carte de localisation Une carte produite dans l'opération de dénombrement de ménages


qui indique l'accès principal à une grappe, y compris les principales
routes et des principaux monuments de la grappe.

Échantillon Maître Un échantillon aléatoire de grande taille provenant de la base de


recensement et préparés pour être utilisés dans un certain nombre
d'enquêtes à partir duquel des sous-échantillons peuvent être
sélectionnés pour des enquêtes spécifiques.

93
Mesure de la taille Une mesure qui reflète la taille de l'unité d'échantillonnage,
généralement le nombre de ménages ou de la population,
disponible pour chaque unité d'échantillonnage primaire dans le
pays.

Les erreurs non dues à Les erreurs non dues à l'échantillonnage, oules erreurs de mesure,
l'échantillonnage sont celles associées à la mise en œuvre de la collecte et de
l’exploitation des données, telles que l’omission des ménages
sélectionnés, la mauvaise interprétation des questions de la part
soit de l’enquêteur ou de l’enquêté et les erreurs de saisie des
données.
Poids standard normalisé Le poids de sondage normalisée par un facteur constant de sorte
que le nombre de cas non pondéré est le même que le nombre de
cas pondéré au niveau national. Le poids standard normalisé se
calcule pour l'ensemble des ménages, la totalité d’hommes et des
femmes séparément.

Unité Primaire de Sondage Une unité primaire de sondage est l’unité de tirage du premier
(UPS) degré dans une procédure d'échantillonnage multi-degrés; dans
EDS, généralement une ZD ou un segment de la ZD.

Échantillon Probabiliste Un échantillon dans lequel les unités sont tirée au hasard avec des
probabilités non nulles et connues avant le tirage.

Ecart-Type Relatif (ETR) La quantité de l'erreur d'échantillonnage par rapport au niveau de


l'indicateur, indépendant à l'échelle de l'indicateur, calculé en
divisant l'écart-type par la valeur de l'indicateur.

Échantillon prit Le nombre de ménages ou d'individus à enquêteur par grappe dans


des enquêtes complexes, à plusieurs degrés et par grappe.

Erreurs d'échantillonnage Les erreurs d'échantillonnage sont les erreurs représentatives dues
à l'échantillonnage d'un petit nombre d'unités éligibles de la
population cible au lieu d'inclure toutes les unités éligibles dans
l’enquête.

Base de sondage Une liste complète de toutes les unités d'échantillonnage qui
couvrent la population cible.

Unité de Sondage L'unité de tirage à chaque degré de la procédure d'échantillonnage.


Dans une EDS typique avec échantillonnage en grappes et à deux
degrés, l'unité de sondage au premier degré (UPS) serait la ZD, et
l'unité d'échantillonnage au deuxième degré (Unité Secondaire)
serait le ménage.

Poids de sondage Le poids de conception corrigé pour la non-réponse ou d'autres


calages.

Unité de Sondage Secondaire L'unité de tirage pour le deuxième degré de la sélection; dans un
(USS) échantillon typique EDS à deux degrés ceci est un le ménage.

94
Échantillon auto pondéré Un échantillon dans lequel chaque individu ou unité a la même
probabilité d'être inclus dans l’échantillon, donc résulter un poids
de sondage constant.

Tirage Aléatoire Simple Une procédure de tirage où toutes les unités ont une chance égale
d’être tirée, directement de la base de sondage
Croquis Une carte détaillée produite dans l'opération de dénombrement des
ménages, avec l'emplacement de toutes les structures trouvées
dans la grappe, qui aide l'enquêteur à relocaliser les ménages
sélectionnés pendant la collecte principale.

SRSWOR Triage aléatoire simple sans remise


Écart-type (ET) L’écart-type est une mesure de la dispersion des valeurs
d'une statistique basé sur des données enquêtées. Il est défini
comme la racine carrée de la variance d’échantillonnage de la
statistique.

Stratification Le processus par lequel la population cible est divisée en sous-


groupes ou strates aussi homogènes que possible en fonction de
certains critères. Le principal objectif de la stratification est de
réduire les erreurs d'échantillonnage.

Structure Un bâtiment isolé ou autre construction qui peut avoir une ou


plusieurs unités à usage résidentiel ou commercial. Les structures
résidentielles peuvent avoir une ou plusieurs unités de logement
(par exemple: maison individuelle, la structure de l'appartement).

La répartition t des étudiants Une famille de répartition probabiliste continue qui se surgie lors
de l'estimation de la moyenne d'une répartition normale dans les
situations où la taille de l'échantillon est petit et on ne connait pas
l’écart-type de la répartition.

Domaine d’étude Une sous-population dont une estimation séparée des indicateurs
principaux est demandée.

Tirage systématique Tirage des unités à partir d'un point aléatoire avec un pas constant

Population cible La population d'intérêt pour l'enquête. En EDS, habituellement, des


femmes de 15 à 49 ans et les enfants de moins de cinq ans vivant
dans des ménages résidentiels. La plupart des enquêtes
comprennent aussi des hommes de 15 à 59 ans.

Tirage par grappe à deux Au premier degré, un échantillon stratifié de la ZD est sélectionné
degrés dans chaque strate, typiquement dans EDS avec probabilité
proportionnelle à la taille (PPT). Au deuxième degré, un nombre
fixe ou variable de ménages est choisi, dans les EDS par un tirage
systématique à probabilité égale.

95
Nombre aléatoire Un nombre aléatoire qui provient d'une distribution uniforme, c’est
uniformément répartie à dire, toutes les valeurs possibles dans l'intervalle dans lequel le
nombre aléatoire est sélectionné, ont une probabilité égale d’être
choisis

Non-réponse complète Une unité d'échantillonnage (grappe, ménage, individu) n’est pas
enquêtée du tout. Voir aussi non-réponse partielle.

Variance Une mesure pour savoir jusqu'où un ensemble de nombres est


étalé autour de leur moyenne.

Poids Un facteur d'extrapolation qui extrapole la répartition de


l'échantillon à celle de la population cible. Voir également le poids
de conception et le poids de sondage.

96
Références

Aliaga, A. & Ren, R (2006). Optimal sample size for two-stage cluster sampling in
Demographic and Health Surveys. EDS working papers No. 30.

Bankier, M. D. (1998). Power allocations: determining sample size for sub-national areas. The
American Statistician, Vol. 42, PP. 174-177.

Cochran, W. G. (1977). Sampling techniques. John Wiley & Sons, New York

Deville, J.-C. & Särndal, C.-E. (1992). Calage Estimators in Survey Sampling, JASA, Vol. 87,
No. 418, pp. 376-382.

Deville, J.-C., Särndal, C.-E. & Sautory, O. (1993). Generalized Raking Procedures in Survey
Sampling, JASA, Vol. 88, No. 423, pp. 1013-1020.

Dupont, F. (1994). Calage Used as a Nonresponse Adjustment, IN: Diday, E. (ed.) New
Approaches in Classification and Data Analysis, Springer Verlag, pp. 539-548.

Efron, B. & Tibshirani, R. J. (1993). An introduction to the Bootstrap. Chapman & Hall.

Hartley, H. O. & Rao, J. N. K. (1962). Sampling with unequal probabilities and without
replacement. Annals of Mathematical Statistics, Vol. 33, pp. 350-374.

Kish, L. (1965). Survey Sampling. John Wiley & Sons, New York.

Lundström, S. & Särndal, C.-E. (1999). Calage as a Standard Method for Treatment of non-
response, JOS, Vol. 15, No. 2, pp.305-327.

Macro International Inc. (1996). Sampling Manual. EDS-III Basic Documentation No. 6.
Calverton, Maryland.

Nieuwenbroek, N., Renssen R., Slootbeek, G. & Veugen, T. (1997). A General Weighting
Package Including Estimates for Population Totals and Corresponding Variances:
Extended Version, CBS Research Paper, No. 9745.

Platek, R. & Särndal, C.-E. (2001). Can a Statistician Deliver? JOS, Vol. 17, pp. 1-20.

Ren. R (2003). Théories des sondages. Lecture notes, ENSAI, France

Sautory, O. (1993). La macro SAS CALMAR: Redressement d’un Echantillon par Calage sur
Marges, Document de travail de la Direction des Statistiques Démographiques et
Sociales, no. F9310, INSEE.

Skinner, C. (1999). Calage Weighting and Non-Sampling Errors, Research in Official Statistics,
No. 1, pp.33-43.

Smith, T.M.F. (1990). Comment on Rao and Bellhouse: Foundations of survey based
estimation and analysis. Survey Methodology, vol. 20, pp. 3-22.

Tillé, Y. (2001). Théories des sondages. Dunod, Paris.

97
Wolter, K. M. (1984). An investigation of some estimators of variance for systematic sampling.
JASA, Vol. 79, pp. 781-790

Wolter, K. M. (1985). Introduction to variance estimation. Springer-Verlag, New York

Woodruff, R. S. (1971). A simple method for approximating the variance of a complicated


estimate. JASA, Vol. 66, pp. 411-414.

Yates, F. & Grundy, P. M. (1953). Selection Without Replacement from Within Strata with
Probability Proportional to size. Journal of the Royal Statistical Society. Series B
(Methodological) Vol. 15, No. 2 (1953), pp. 253-261. Blackwell Publishing.

98

Vous aimerez peut-être aussi