Manuel de Sondage : Théorie et Pratique
Manuel de Sondage : Théorie et Pratique
INTRODUCTION
OBJECTIFS DU COURS
CHAPITRE I. GENERALITES
Les enquêtes par sondage ont souvent pour but de fournir des
données complémentaires à celles de recensement.
1.3.4. Echantillon
1.3.5. Variables
Les études statistiques portent sur les valeurs prises par certaines
variables (caractères) ou chacune des unités statistiques. Ces variables peuvent
être quantitatives ou qualitatives.
2
1 N
V (Y ) Y Y
N 1
N
Où Y est la moyenne de Y sur l’univers Y = 1 Y
N 1
Y est la valeur de pour l’unité statistique . Et N le nombre total des unités
Y
statistiques de l’univers.
1.4.4. Biais
2.1. INTRODUCTION
Bien qu’encore peu utilisée dans le pays en développement, cette méthode est
présentée en raison de son caractère spécifique ; elle pourrait trouver des
champs d’application dans ces pays.
Exemple 1:
Supposons qu’un chercheur veut installer divers point de vente dans une
province donnée. Notre chercheur a la répartition de personnes de cette
province selon le sexe, l’âge, le milieu d’habitation et la catégorie sociale. C’est
le résultat d’un dernier recensement dont la population s’élève à 4080000
personnes.
- Cordonnier 383
- Blanchisseur 239
Total 7176
On décide de tirer 375 activités proportionnellement au nombre d’entreprises
de chaque sous-ensemble. Quelle sera la taille de l’échantillon de chaque sous-
ensemble.
2.4. LA METHODE DES ITINERAIRES
3.1. Introduction
i 1 n
𝑌̅ = estimation
𝑦̅ = estimateur ou 𝑌̅̂
𝑦̅ n n
Rapport pour la population R 𝑅̂ = = yi x
𝑥̅ i 1 i 1
i
3.3. NOTATIONS
a. Sur l’univers
Unités statistiques 𝛼 = 1 … … … … … … . . , 𝑁
1 N
Moyenne de la variable Y :𝑌̅ = Y
𝑁 1
où 𝑌𝛼 est la valeur de Y pour l’unité 𝛼
1 N
Variance de Y : 𝑉(𝑌) =
𝑁
1
(𝑌𝛼 − 𝑌̅)2
1
Par ailleurs, on définit aussi : 𝑆 2 = (𝑌𝛼 − 𝑌̅)2
𝑁−1
Cov (Y,Z) =
1 N
Y
N i 1 Y
Z
Z
Cov (Y, Z)
V Y V Z
b. Sur l’échantillon
Unités statistiques i= 1……………, n
1 n
𝑛y
𝑦̅= moyenne de la variable y calculée sur l’échantillon : 𝑦̅est une variable
i
i 1
aléatoire.
E(y) espérance mathématique de la variable aléatoire 𝑦̅
𝑉(𝑦̅)Variance de la variable aléatoire 𝑦̅ (qui, rappelons-le, est la variance de
l’estimateur 𝑌̅et non, la variance de la variable y calculée sur les unités de
l’échantillon). V y E y Y ² S
N n S 1 f
2 2
n N n
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 17 sur 84
𝑛
𝑓=
𝑁
d. L’utilisation de la notation ^
On utilisera parfois la notation ^ pour les estimateurs produits à
partir de l’échantillon. Par exemple, pour estimer un total T(Y), on utilisera un
estimateur qu’on notera : 𝑇̂(𝑌)
En résumé nous avons la situation suivante :
Population Echantillon
Indice 𝛼 = 1,2, … … … … … … … , 𝑁 i= 1,2,…………….. , n
Unité statistique 𝑈𝛼 i
𝑁 𝑛
Sommation ∑ 𝑌𝛼 ∑ 𝑦𝑖
Variable à étudier 𝛼=1 𝛼=1
𝑌𝛼 𝑦𝑖 (aléatoire)
𝑁 𝑛
Moyenne 1 1
𝑌̅ = ∑ 𝑌𝛼 𝑦̅ = ∑ 𝑦𝑖
𝑁 𝑛
𝛼=1 𝑖=1
Variance 𝑁
1
𝑉(𝑌) = 𝜎 = ∑(𝑌𝛼 − 𝑌̅)2
2
𝑆 2 (𝑁 − 𝑛) 𝑆 2 𝑛
𝑁 𝑉𝑎𝑟(𝑦̅) = 𝐸(𝑦̅ − 𝑌̅)2 = = (1 − )
𝛼=1 𝑛 𝑁 𝑛 𝑁
Ou à estimer par
𝑛
1 N 2 1
𝑆 2 = 𝑁−1 Y Y 2
𝑠 = ∑(𝑦𝑖 − 𝑦̅)2
1 𝑛−1
𝑖=1
𝑁 𝑆2
𝑆2 = 𝜎2 𝐸(𝑠 2 ) = [𝑛(𝑁 − 1) − (𝑁 − 𝑛)] = 𝑆 2
𝑁−1 (𝑛 − 1)𝑁
1 n
𝑦̅ =
𝑛 y
i 1
i
moyenne calculée sur les unités de l’échantillon.
𝑁−𝑛 𝜎 2
=( )
𝑁−1 𝑛
𝑆2 𝑛
On peut aussi écrire V (𝑦̅) = (1-f) où f =
𝑛 𝑁
𝑆2
V ( 𝑇̅ (𝑦)) = V (N𝑌̅) = 𝑁 2 (1- f)
𝑛
Si f est trop petit on a :
𝑠2
V (𝑦̅) ≈ ceci explique que la précision du sondage ne dépend que de n. Et
𝑛
que la variance de l’estimateur sera d’autant plus faible que la taille de
l’échantillon sera importante.
2 𝑁 2 𝑆²(𝑁−𝑛) 𝑁2 𝑆 2 𝑛
V (𝑌̂) = E(𝑌̂ − 𝑌̅) = = (1 − 𝑁)
𝑛 𝑁 𝑛
𝑁𝑆 𝑁𝑆 𝑛
L’erreur standard 𝑦̂ égal 𝜎𝑌 = √(𝑁 − 𝑛)⁄𝑁 = √1 − 𝑁
√𝑛 √ 𝑛
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 19 sur 84
𝑦̅− 𝑌̅
𝑦̅ N (𝑦̅, 𝜎(𝑦̅) ) N(0,1)
𝜎(𝑦
̅)
1−𝛼
�/2
𝛼/2
𝛼 = 𝜇𝜎(𝑦) 𝑦̅ 𝛼 = 𝜇𝜎(𝑦)
3.6. Estimation des valeurs des moyennes pour les sous populations
njy
la population servant la jèmedomaine y, est estimée par la formule 𝑦̅𝑗 = jk
n
k 1 j
𝑆𝑗 𝑛𝑗 Nj y jk Y j 2
𝑠𝑗 𝑛𝑗
L’erreur standard 𝑦̅𝑗 est √1 − ( ) où
√ 𝑛𝑗 𝑁 𝑗
2
y y
nj jk j
𝑠𝑗2 = 1
k 1 n j
Y
1 𝑁∝
Si P est la proportion recherchée, P = = où 𝑁∝ est le nombre d’unités
𝑁 1
𝑁
Démonstration
1 N
Y Y
2
𝑌̅ = P et V(Y) =
𝑁 1
1
= [𝑁∝ (1 − 𝑃)2 + (𝑁 − 𝑁∝ )𝑃 2 ]
𝑁
V Y
V(Y) = P(1 − 𝑃) V y
n
- 𝑦̅ poids moyen « cumulé » par ménage des enfants de moins de cinq ans
y vivant ;
- 𝑥̅ nombre moyen d’enfants de moins de cinq ans par ménage.
L’estimateur final est𝑦̅⁄𝑥̅ , l’estimateur du poids moyen des
enfants de moins de cinq ans.
Cet estimateur n’est plus, contrairement aux estimateurs
proposés précédemment, sans biais, car, en général, E(𝑦̅⁄𝑥̅ ) n’est pas égal à
E(𝑦̅)/𝐸(𝑥̅ ).
On peut considérer, quand l’échantillon est de taille
suffisamment importante, que ce biais est « négligeable » par rapport à l’erreur
aléatoire.
Pour estimer un ratio, on passe en général par l’estimation de
deux masses.
𝜎
C.V.= au niveau de la moyenne
x
𝑝𝑞
√𝑣̂𝑝 √𝑛 1 𝑞
C.V.= ≈ = √ au niveau de la population
𝑝 𝑝 √𝑛 𝑝
On remarque que le coefficient de variation est étroitement lié à
la valeur de q et inversement lié à la racine carré de la taille de l’échantillon.
Cet indice (C.V) est très commode mais son interprétation a une portée très
limitée s’il ne s’accompagne pas de l’information continue dans les données
𝜎
originales de et de p ou de s et de𝑦̅.
𝑝
𝑄 4𝑃𝑄
Par conséquent, nous pouvons supposer 2√𝑃 = 5 où n =
𝑛 25
P(𝑝 − 𝑃/≥ 𝑑) = ∝
𝑁−𝑛 𝑃𝑄
d=t√ √
𝑁−1 𝑛
𝑠2=
n
yi y
i 1
estimateur sans biais de la variance
2
n 1
𝑛 1 𝑛 𝑝𝑞
Lorsqu’il s’agit p, 𝑉̂ (𝑝̂ )=(1 − ) pq ou 𝑉̂ (𝑝̂ )=(1 − ) estimateur sans
𝑁 𝑛−1 𝑁 𝑛−1
biais de la variance de p.
N
Y Y
𝑆 2 = 1
= Y
2 N
1
2
NY
2
=
1
(𝑁𝑃 − 𝑁𝑃2 )=
𝑁
PQ
N 1 N 1 𝑁−1 𝑁−1
Erreur quadratique de 𝑦̅ =
f yi y i
2
nn 1
𝑁−𝑛 𝑃𝑄 N n S
d= t √ √ ou t
𝑁 𝑛 N n
tS
2
2
ou
𝑡 𝑃𝑄
2
n = 1 𝑡𝑑2𝑃𝑄
d
1 tS
2
1+ ( 2 −1)
𝑁 𝑑
1
N d
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 25 sur 84
tS NtS NS
2 2 2
2
𝑡 2 𝑝𝑞 𝑑2
ou S
𝑝𝑞
𝑛0 = = V = 2 n
𝑑2
d V
𝑉 𝑡 o
V
d
𝑛0 𝑛0
n= ≈ 𝑛
1+(𝑛0 −1)/𝑁 1+( 𝑁0 )
Exemple :
d = 0,05 ; p= 0,5 ; ∝ = 0, 05 ; t = 2
𝑡 2 𝑝𝑞
𝑛0 =
𝑑2
4∗0,5∗0,5
𝑛0 = = 400
0,0025
Si N = 3200
𝑛0
n=
1+(𝑛0 −1)/𝑁
400
n= 399 = 356
1+
3200
𝑁−𝑛 𝑆
Par conséquent d= t√ ce qui donne
𝑁 √𝑛
𝑡𝑆 2
( )
𝑑
n= 1 𝑡𝑆 2
1+ ( )
𝑁 𝑑
𝑡𝑆 2 𝑆2 𝑛0
𝑛0 = ( ) = si très petit, dans le cas contraire ;
𝑑 𝑉 𝑁
𝑡 2𝑠2 4∗85,6
1ère approximative 𝑛0 = = = 95
𝑑2 (1,9)2
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 26 sur 84
95
n= 95 = 78
1+
490
𝑛0 𝑛0 𝑛0
Dans le cas contraire n = = ≈
1+𝑛0 /𝑁 1+(𝑛0 −1)/𝑁 1+(𝑛0 /𝑁)
Dans le cas de la valeur sommée
𝑁𝑠 2 (𝑁𝑠)2
n=( ) =
𝑑 𝑉
𝜎 2 (1−2𝑝)
𝑃̂= p+
𝑝𝑞
avec les deux tirages(avec remise et sans remise) au point 3.2 de ce même
chapitre.
a. Méthode simple
N°3 : Un échantillon de 315 ménages est choisi dans une zone urbaine
comprenant 15762 ménages. Chacun des ménages choisis doit indiquer s’il est
propriétaire ou locataire de son logement et s’il dispose de l’eau courante. Les
réponses se répartissent comme suit :
Approvisionnement en eau Propriétaire Locataire
Logements avec eau courante 153 121
Logements sans eau courante 10 31
30 44
31 39
32 34
33 50
34 90
35 80
36 35
37 90
38 92
39 123
40 36
41 31
42 141
43 126
44 111
45 32
46 48
47 43
48 38
49 66
50 98
51 44
52 39
53 68
54 50
55 45
56 120
57 35
58 30
59 92
60 123
61 36
62 93
63 94
64 42
65 37
66 64
67 48
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 31 sur 84
68 86
69 38
70 99
71 98
72 44
73 78
74 68
75 50
76 45
77 40
78 105
79 60
80 138
81 123
82 108
83 31
84 94
85 42
86 37
87 32
88 96
89 86
90 76
91 33
92 88
93 39
94 34
95 45
96 35
97 46
98 123
99 36
Total 6763
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 32 sur 84
Total 100
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 33 sur 84
Question
1. Combien des villages ont été retenus dans ce tirage ?
2. Trouver un estimateur sans biais de nombre de champs par exploitation.
En déduire un estimateur du total de champs de la population agricole.
3. Calculer la variance de chacun des estimateurs ;
4. Déterminer des intervalles de confiance à 95% et 99% pour la moyenne
et le total ;
N°2. On veut estimer la surface moyenne cultivée dans les fermes d’un canton
rural. Sur 2010 fermes que comprend ce canton, on en tire 100 par sondage
aléatoire simple. On mesure k Y la surface cultivée par la ferme k en hectares et
on trouve :
N°6. 145 ménages de touristes séjournant en France dans une région donnée
ont dépensé 830 € en moyenne par jour. L’écart type estimé de leurs dépenses
s’élève à 210 €. Sachant que 50 000 ménages de touristes ont visité la région
où a été effectuée l’enquête, que peut-on dire de la dépense totale journalière
de l’ensemble de ces ménages ? On supposera pour cela que l’échantillon est
issu d’un plan aléatoire simple à probabilités égales.
IV.1. Généralités
Echantillon
VI.2. Objectifs
IV.4. NOTATIONS
Population Echantillon
Numéros des strates 1,2,…….h,…k
Nombre d’unités par 𝑁1 𝑁2 , … … … . 𝑁ℎ , … … . . 𝑁𝑘 𝑛1 𝑛2 , … … … . 𝑛ℎ , … … . . 𝑛𝑘
strate
Fraction de sondage 𝑛ℎ
𝑓ℎ =
𝑁ℎ
Total k
k
𝑁 = Nh 𝑛= n
h1
h1 h
Variable à étudier 𝑌ℎ𝛼 𝑦ℎ𝑖
Moyenne par strate 1 k 1 k
𝑌̅ℎ = Yh 𝑦̅ℎ = y
𝑁ℎ h1 𝑛ℎ h1 hi
Total par strate Nh k
𝑌ℎ = 𝑁ℎ 𝑌̅ℎ = Yh 𝑦ℎ = y
h 1
hi
= 𝑛ℎ 𝑦̅𝑛
h )1
(Y Y )
2
dans une strate S = 2
𝑁ℎ h 1
h
1 k
𝑛ℎ−1
𝑠̂ℎ 2 = ( y y) 2
1 k
hi
𝑁ℎ−1
h 1
𝑆ℎ 2 = (Y Y ) 2
𝑺𝟐𝒉estimateur sans biais h 1
h
(beaucoup utilisé)
= N NN
k k
𝜎 2 h
𝜎ℎ2 + h
(𝑌̅ℎ − 𝑌̅)2
h 1 N h
IV.5.1. Notations
- On a k states (h= 1, 2, …, k)
k
- Pour la strate h, l’effectif total est 𝑁ℎ (N = N
h 1
h
)
la moyenne de Y est 𝑌̅ℎ
𝑆ℎ2 =
𝑁ℎ −1 Y h Y h
1 Nh
h
2
Le nombre d’unités tirées est𝑛ℎ , l’indice des unités de l’échantillon est 𝑖ℎ (𝑖ℎ =
1, …, 𝑛ℎ )
1 nh
𝑛ℎ y
𝑦̅ℎ = ih
ih1
yih y h
1 nh 2
𝑠ℎ2 =
𝑛ℎ −1 ih1
Puisque
𝑇̂(𝑌)
𝑌̅̂ =
𝑁
L’estimation d’une proportion (proportion de femmes par
exemple) se fera comme présenté au chapitre 2, par l’estimation de la
moyenne d’une variable qui vaut 1 si l’unité a la caractéristique étudiée et 0
sinon.
𝑛ℎ 1 2
Avec 𝑉(𝑦̅ℎ )= (1 − )𝑆
𝑁 ℎ 𝑛ℎ ℎ
k 𝑁ℎ2 𝑛ℎ 1 2
Et 𝑉(𝑌̅̂) = (1− ) 𝑆
h 1
𝑁2 𝑁 ℎ 𝑛ℎ ℎ
k 𝑛ℎ 1
𝑉̂ (𝑇̂(𝑌)) =
h 1
𝑁ℎ2 (1− )𝑠2
𝑁 ℎ 𝑛ℎ ℎ
k 𝑁ℎ2 𝑛ℎ 1
𝑉̂ (𝑌̅̂) = (1− )𝑠2
h 1
𝑁2 𝑁 ℎ 𝑛ℎ ℎ
IV.5.7. Cas particulier : le taux de sondage est le même pour toutes les strates
𝑛 𝑛ℎ
𝑓= 𝑒𝑡 𝑓ℎ =
𝑁 𝑁ℎ
C’est-à-dire :
𝑛 𝑛ℎ
= → 𝑛𝑁ℎ = 𝑁𝑛ℎ
𝑁 𝑁ℎ
Divisions partout par 𝒏𝑵
𝑛𝑁ℎ 𝑁𝑛ℎ 𝑁ℎ 𝑛ℎ
→ = = =
𝑛𝑁 𝑛𝑁 𝑁 𝑛
𝑁ℎ
𝑛ℎ = ∙𝑛
𝑁
IV.6.2. Répartition optimale au sens de Neyman
n h
cons tan te k
n
NS h h
N S
h 1
h h
Ici il faut faire une répartition de manière que dans chaque strate
on minimise la variance.
min var( y )
S / C nh n
𝑁ℎ2 𝑁ℎ − 𝑛ℎ 2
𝑉(𝑦̅) = 2 ( )𝑆
𝑁 𝑁ℎ − 1 ℎ
En résolvant par la méthode de Lagrange, on aura :
𝑛ℎ 𝑁ℎ 𝑆ℎ 𝑁ℎ 𝑆ℎ
= → 𝑛ℎ = ∙𝑛
𝑛 ∑ 𝑁ℎ 𝑆ℎ 𝑁ℎ 𝑆ℎ
𝑁ℎ 𝑁 ℎ 𝑆ℎ
𝑛= 𝑛 la simplification des termes semblables donne :
𝑁 ∑𝑁ℎ 𝑆ℎ
𝑆ℎ 1
= → 𝑆ℎ 1
∑𝑁ℎ 𝑆ℎ 𝑁 =
∑𝑁ℎ 𝑆ℎ 𝑁
∑𝑁ℎ = 𝑁
Exemple : une entité est divisée en deux régions présentant les caractéristiques
retenues dans le tableau ci-après, on veut estimer la population totale à partir
1
d’un sondage sur deux villages pour . L’univers est donc l’ensemble de
50è𝑚𝑒
villages.
Régions Nombre de Pop. 𝑆ℎ 𝑌ℎ
villages 𝑁ℎ Totale
1 3000 956000 100 319
2 1000 605000 200 605
Total 4000 1561800
𝑁ℎ 1
𝑛ℎ = 𝑛ouƒ= =0,02→ 𝑛 = ƒ. 𝑁
𝑁 50
=0,02x400
=80
3000
𝑛1 = 𝑥80 = 60
4000
1000
𝑛2 = 𝑥80 = 20
4000
Pour faire la preuve il faut que 𝑛1 + 𝑛2 𝑠𝑜𝑖𝑒𝑛𝑡 é𝑔𝑎𝑙𝑒 à 𝑛, d’où :
60+20=80
𝑁ℎ 𝑆ℎ
𝑛ℎ = 𝑛
∑𝑁ℎ 𝑆ℎ
Régions 𝑁ℎ 𝑆ℎ y 𝑁ℎ 𝑆ℎ
ℎ
1 3000 100 319 300000
2 1000 200 605 200000
300000
𝑛1 = 𝑥80 = 48
500000
200000
𝑛2 = 𝑥80 = 32
500000
Preuve : 48+32=80
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 46 sur 84
EXERCICES D’APPLICATION
N°1A. Une population agricole est divisée en trois strates comme l’identique le
tableau suivant :
STRATE A STRATE B STRATE C
N° Nbre
N° village Nbre d'exploit N° village Nbre d'exploit village d'exploit
0 47 30 44 70 99
1 84 31 39 71 98
2 37 32 34 72 44
3 64 33 50 73 78
4 96 34 90 74 68
5 43 35 80 75 50
6 76 36 35 76 45
7 99 37 90 77 40
8 98 38 92 78 105
9 44 39 123 79 60
10 117 40 36 80 138
11 102 41 31 81 123
µ12 100 42 141 82 108
13 45 43 126 83 31
14 80 44 111 84 94
15 70 45 32 85 42
16 60 46 48 86 37
17 92 47 43 87 32
18 41 48 38 88 96
19 108 49 66 89 86
20 31 50 98 90 76
21 47 51 44 91 33
22 42 52 39 92 88
23 37 53 68 93 39
24 96 54 50 94 34
25 48 55 45 95 45
26 43 56 120 96 35
27 76 57 35 97 46
28 33 58 30 98 123
29 107 59 92 99 36
60 123
61 36
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 47 sur 84
62 93
63 94
64 42
65 37
66 64
67 48
68 86
69 38
TOTAL 2103 2631 2029
52 24 02
32 57 06
69 12 01
Total 43
STRATE C 98 09 05
73 68 02
70 16 01
85 21 01
98 97 04
78 73 03
97 29 01
71 94 03
90 51 01
Total 21
100
On demande :
1. Déterminez la taille de l’échantillon ;
2. Faites la répartition proportionnelle ;
3. Faites la répartition optimale au sens de Neyman ;
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 49 sur 84
T.P. N°2.
N°3. Dans une population de taille N partitionnée en h strates, on sélectionne
un échantillon de taille n suivant un plan stratifié. Dans chaque strate h, on tire
𝑛ℎ individus parmi 𝑁ℎ selon un sondage aléatoire simple sans remise de taille
fixe.
Préalable : montrer la formule de décomposition de la variance :
1. Pour une variable d’intérêt Y, donner les estimateurs du total 𝑇(𝑌) et de
la moyenne.
2. Montrer que ces deux estimateurs sont sans biais et calculer leur
variance.
3. On considère l’allocation proportionnelle de l’échantillon : on décide de
𝑛 𝑛
tirer dans chaque strate h un nombre d’individus 𝑛ℎ tel que : ℎ =
𝑁ℎ 𝑁
2
𝜎𝑖𝑦 est la variance des valeurs individuelles à l’intérieur de la
𝑛𝑖 𝑛𝑁𝑖 1−𝑓 𝑁𝑖 1−𝑓
strate i. = 𝑓 on a 𝑛𝑖 = c’est ainsi que 𝜎 2 = ∑ 2
𝜎𝑖𝑦 = 𝜎𝑤2 en
𝑁𝑖 𝑁 𝑖 y' 𝑛 𝑁 𝑛
𝑁𝑖 1−𝑓
posant 𝜎𝑤2 = ∑ 𝜎𝑦2 et 𝜎𝑦2 = ∑ 𝜎𝑦2 , autrement dit 𝜎𝑤2 est la variance à
𝑁 𝑛
𝑁𝑖
l’intérieur des strates, variance obtenue en pondérant par la variance de la
𝑁
𝑁𝑖 𝑁𝑖
strate i. Etant donné que 𝜎𝑦2 =∑ 2
𝜎𝑖𝑦 +∑ (𝑌̅𝑖 − 𝑦̅)2 → 𝑌𝑖𝑗 − 𝑦̅ = 𝑌𝑖𝑗 − 𝑌̅𝑖 −
𝑁 𝑁
𝑦̅
2 2 2
(𝑌𝑖𝑗 − 𝑦̅) = (𝑌𝑖𝑗 − 𝑌̅𝑖 ) +(𝑌̅𝑖 − 𝑦̅)2 +2(𝑌𝑖𝑗 − 𝑦̅) (𝑌𝑖𝑗 − 𝑦̅𝑖 )en sommant pour la
strate i on a :
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 51 sur 84
ij
2
∑𝑗 (𝑌𝑖𝑗 − 𝑌̅𝑖 ) = 0par définition, ∑𝑖 ∑𝑗 (𝑌𝑖𝑗 − 𝑦̅) =N𝜎𝑥2 par définition ∑𝑖 ∑𝑗 (𝑌𝑖𝑗 −
2
𝑌̅𝑖 ) + ∑𝑁𝑖 (𝑌̅𝑖 − 𝑌)2 N𝜎𝑦2 = ∑𝑁𝑖 (𝑌̅𝑖 − 𝑦̅)2
𝑁 𝑁𝑖
𝜎𝑦2 = 𝑖 𝜎𝑖2 +∑ (𝑌̅𝑖 − 𝑦̅)2 donc, au prix de l’approximation faite :
𝑁 𝑁
1−𝑓 𝑁𝑖 1−𝑓 2
𝜎𝑦̅2′ = [𝜎𝑦2 − ∑ (𝑌̅𝑖 − 𝑌̅)2 ]et comme 𝜎𝑦 = 𝜎𝑦̅2
𝑛 𝑁 𝑛
𝑁𝑖
∑ (𝑌̅𝑖 − 𝑦̅)2
𝑁
𝜎𝑦̅2′ = 𝜎𝑦̅2 [1 − ]
𝜎𝑦2
𝜎𝑦̅2′ est donc inferieur à 𝜎𝑦̅2 à moins que es moyennes par strate 𝑌̅𝑖
ne soient égales. Autrement dit : l’échantillon stratifié sera toujours plus
efficace que l’échantillon de même effectif non stratifié, l’efficacité est d’autant
plus grande que les moyennes par strate sont plus différentes entre elles.
𝑁
Posons 𝜎𝑦2̅ ′ = ∑ 𝑖 (𝑌̅𝑖 − 𝑌̅)2 . Cette quantité est la variance vraie des moyennes
𝑁
2 2 2
𝜎𝑦
̅ −𝜎̅ ′ 𝜎𝑦
𝑦 ̅
de strates = 2. En d’autres termes, la diminution relative de la variance
𝜎𝑦2 𝜎𝑦
2
𝜎𝑦
̅
due à la stratification est mesurée par .
𝜎𝑦2
En fait, on ne connait pas 𝜎𝑦2 et 𝜎𝑦̅2′ mais il est possible de les estimer à l’aide de
l’échantillon stratifié lui-même, en remplaçant :
𝑁
𝜎𝑦̅2 =∑𝑖 𝑖 (𝑌̅𝑖
𝑁
− 𝑌̅)2 par ∑ 𝑖 (𝑦̅𝑖 − 𝑦̅)2 et 𝜎𝑦2 = Y ij Y par
𝑛
𝑛
1
𝑁
i j
2
1
y y
𝑛−1 ij
i j
2
s . Mais ce procédé n’est correct que pour les grands
2
échantillons.
𝑛−1
On démontre en effet que : 𝜎𝑦̅2 est estimée par (𝑠 2 − 𝑠𝑤2 ) avec
𝑛
1
𝑠𝑤2 = ∑(𝑦𝑖𝑗 − 𝑦̅𝑖 ) qui estime correctement𝜎𝑤2 . La diminution relative de la
𝑛−𝑘
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 52 sur 84
𝑠 2 −𝑠𝑤
2
variance due à la stratification est donc plus correctement estimée par 𝑠 2
𝑠2 + 𝑤
n
i 2
i
n i
expression qui se réduit à 2
s
Application numérique
calculer : 𝑠𝑤2 et 𝑠 2
i j
y y = y y + ∑𝑛 (𝑦̅ − 𝑦̅)
ij
2 i j
ij
2
𝑖 𝑖
2
(𝑛 − 1)𝑠 2 = (𝑛 − 𝑘)𝑠𝑤2 + ∑𝑛𝑖 (𝑦̅𝑖 − 𝑦̅)2 (𝑛 − 𝑘)𝑠𝑤2 sera calculé par différence.
𝑛−1 1−𝑓 2 9
La variance de l’échantillon stratifié : 𝑆𝑤2 est estimée par 𝑠 = 𝑋
𝑛 𝑛 𝑤 10
12
0,181= 0,0136.
La variance n’est que de 16,5% de celle d’une estimation sans stratification.
Donc l’efficacité est considérable. Le coefficient de variation.
0,0136 100
√ = 0,036 𝑜𝑢 3,6%. Sans stratification, le coefficient de aurait été √
3,25 3,25
fois plus grand, soit 1,5 fois plus grands environ.
Fraction de sondage variable
𝑛𝑖 𝑛
= Dans le cas du tirage avec remise. Pour le tirage sans remise, il faut
𝑁𝑖 𝜎𝑖 ∑𝑁𝑖 𝜎𝑖
prendre.
𝑁𝑖 𝑁𝑖
𝜎𝑖 = √ au lieu de 𝜎𝑖 . Les résultats de strate doivent être pondérés par qui
𝑁𝑖 −1 𝑛𝑖
n’est plus constant, et que d’autre part, pour le calcul d’erreurs, il n’est plus
possible d’utiliser le tableau d’analyse de variance.
Il faut avoir des idées préalables sur la variance des 𝜎𝑤2 peuvent se traduire par
une baisse d’efficacité par rapport à l’échantillon auto-pondéré.
Valeur vraie de la variance
𝑛
1 𝑁𝑖2 𝜎𝑖2 (1− 𝑖 ) 𝑛𝑁𝑖 𝜎𝑖
𝑁𝑖
Cas de tirage sans remise 𝜎𝑦̅2 = ∑ et en remplaçant 𝑛𝑖 par , on
𝑁2 𝑛 ∑𝑁𝑖 𝜎𝑖
a
1 𝑁𝑖 𝜎𝑖∑𝑁𝑖 𝜎𝑖 𝑛𝑁 𝜎
𝜎𝑦̅2 = 2
∑ (1 − ∑𝑁𝑖 𝜎𝑖 ).
𝑁 𝑛𝑖 𝑖 𝑖
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 54 sur 84
1 [∑𝑁𝐼 𝜎𝐼 ]2 1 𝑁 2 1 𝑁
Exemple : 𝜎𝑦̅2 = 2
[ − ∑𝑁𝑖 𝜎𝑖2 ]= (∑ 𝑖 𝜎𝑖 ) − ∑ 𝑖 𝜎𝑖2 soit un domaine
𝑁 𝑛 𝑛 𝑁 𝑁 𝑁
d’étude de 1000 unités au total, décomposé en 4 strates. On se propose
d’extraire un échantillon de n=52 unités.
Ni ̅𝒊
𝒚 𝝈𝒊 𝝈𝟐𝒊 𝑵𝒊 𝝈 𝒊 𝑵𝒊 𝝈𝟐𝒊 Echantillon
Optimal Proportionnel
1 2 3 4 5 6 7 8 9
1 100 12 3 9 300 900 3 5
2 150 15 4 16 600 2400 6 8
3 200 20 5 25 1000 5000 10 10
4 550 50 6 36 3300 19800 33 29
Total 1000 28100 52 52
Dans les strates importantes, l’optimum exige une fraction de sondage plus
élevée au détriment des strates les moins nombreuses.
2. On considère une population de 10 stations-services et on s’intéresse au
prix du litre de supercarburant que chacune d’entre elles affiche. Plus
exactement, sur deux mois consécutifs, mai et juin, les données de prix
figurent dans le tableau ci-dessous :
On veut estimer l’évolution du prix moyen du litre entre mai et juin. On choisit,
comme indicateur de cette évolution la différence des prix moyens On propose
deux méthodes concurrentes:
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 55 sur 84
IV.8.1. Principe
NN Y
k
𝑁ℎ des strates, alors : 𝑌̅𝑠𝑝 = h
h
est l’estimateur stratifié a postériori de
h 1
Or les villages du sud ont en moyenne une taille plus faible. Comment prendre
en compte une information ? On utilise l’estimateur de la moyenne stratifié a
𝑁1 𝑁2
postériori : 𝑦̅𝑠𝑝 = 𝑦̅1 + 𝑦̅2 et l’estimateur de du total de la population
𝑁 𝑁
vaut donc : N𝑦̅𝑠𝑝 = 𝑁1 𝑦̅1 + 𝑁2 𝑦̅2 = (1 421x402, 8) + (1 115x350, 4) = 963 100
habitants. Soit une estimation légèrement supérieure à l’estimation brute.
c. La pratique
Le critère choisi pour stratifier a postériori doit être corréler avec la variable
d’intérêt (ou les variables d’intérêt) pour que la technique soit efficace.
Par ailleurs, il est essentiel que les effectifs des strates (les 𝑁ℎ ) soient connus
de manière précise et surtout récente : une stratification a postériori ajustant
un échantillon sur une distribution ancienne (et susceptible d’être déformée)
sera déconseiller.
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 57 sur 84
IV.8.2.1. Principe
-1ha 10
1 à 2ha 19
2 à 3ha 25
3 à 4ha 17
4 à 5ha 10
5 ha et plus 19
Total 100
-1ha 21 16,8
1 à 2ha 30 43,2
2 à 3ha 34 74,0
3 à 4ha 28 89,0
4 à 5ha 18 75,6
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 60 sur 84
5 ha et plus 26 166,1
Total 156
Pour calculer la taille moyenne de l’exploitation, on effectue très simplement le
calcul suivant :
16,8 10 43,2 19
𝑥 𝑥 𝑥 + 𝑒𝑡 …
21 100 30 100
- Qu’en revanche des calculs sont plus lourds. Dans le cas de petites
strates où d’erreurs de stratification dans l’ignorance de la
variabilité interne des strates rées, on peut perdre en précision par
rapport à l’échantillon auto-pondéré ;
- De plus, qu’une stratification peut être efficace pour un sujet
d’étude donné et au contraire très mauvaise pour un autre sujet,
qu’en conséquence dans une étude à objectifs multiples, on aura
généralement intérêt à adopter l’échantillon auto-pondéré.
- Enfin, en raison de la variabilité du milieu en Afrique, il ne faudra
jamais craindre de sonder avec une fraction de sondage trop
importante, les grosses unités, au risque de sonder avec une
fraction de sondage trop faible, les petites unités (pour éviter ces
modalités, on a intérêt à constituer des unités de sondage de taille
sensiblement égales, soit par le groupement des petites unités,
soit par découpages des grosses unités).
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 62 sur 84
V.1.1. Principes
Villages
X X
ménages des villages sélectionnés (soit une « grappe » des ménages) qui serait
enquêté. C’est dans ce sens que sera utilisée l’expression sondage en grappe ».
V.1.3. Notations
M
𝑇(𝑌) total de Y sur l’univers : 𝑇(𝑌) =
T (Y )
1
V.2. Tirage des unités primaires à probabilités égales (tirage à deux degrés)
𝑀 m
Formule : 𝑇̂(𝑌) = 𝑇̂𝑖 (𝑌)
𝑚 i 1
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 65 sur 84
𝑇̂𝑖 (𝑌) = N y i
ni
ij
n i j 1
2
M m 2 M M
𝑉̂ (𝑇̂(𝑌)) = 1
m
s
M 1
m 1Z
Où 𝑍𝛼 est la variance de l’estimateur 𝑇̂𝛼 (𝑌) du total 𝑇𝛼 (𝑌) dans l’unité primaire
𝛼 consécutive au plan de sondage choisi au deuxième degré.
Par exemple, si au deuxième degré, on a tiré, dans chaque unité
primaire𝛼, 𝑛𝛼 unités à probabilités égales sans remise, 𝑍𝛼 est calculé par :
Y Y
𝑁𝛼2 𝑛 1 N
𝑍𝛼 =
𝑛𝛼
(1 − 𝑁𝛼 ) 𝑁
𝛼 𝛼 −1 1
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 66 sur 84
N
Où
Y N
1
Y
1
1 m ̂
𝑇 (𝑌) 2
𝑚−1
Où 𝑠12 = (𝑇̂𝑖 (𝑌) − )
i 1
𝑚
𝑁𝑖2 𝑛𝑖 1
y y
n 2
𝑁𝑖 𝑛𝑖 − 1
i
𝑧̂𝑖 = (1 − ) i
𝑛𝑖 j 1
ij
1 ni
Où 𝑦̅𝑖 =
𝑛𝑖 y j 1
ij
Remarque :
Dans la formule de variance de l’estimateur du total de Y ci-
dessus, le premier terme est en général le plus important. Les deux termes de
cette formule sont d’ailleurs relatifs aux deux degrés de tirage et permettent
de décomposer la variance pour observer la part de chacun de cas de deux
degrés.
Si on augmente m dans cette formule, on voit que les deux
termes diminuent ; si on augmente les nombres 𝑛𝛼 d’unités enquêtées au
second degré, seul le deuxième terme diminue (par l’intermédiaire des𝑍𝛼 ). On
a donc intérêt à avoir plutôt un grand nombre d’unités primaires tirées.
Dans la formule de l’estimateur de la variance de l’estimateur du
total (𝑉̂ (𝑇̂(𝑌))), on a également deux termes qui semblent correspondre à la
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 67 sur 84
décomposition selon les deux degrés de tirage : en fait ce n’est pas le cas,
contrairement à ce qui a pu être dit précédemment pour𝑉 (𝑇̂(𝑌)). Dans le cas
de sondage aléatoire simple au deuxième degré, par exemple le premier terme
2
M m 2 M M
de la formule 𝑉 (𝑇̂(𝑌)) = 1
m
s
M 1
serait estimé par :
m 1Z
𝑀2 𝑚 1 m 𝑀2 m
𝑚
(1 − 𝑀 ) [𝑠12 + 𝑚 i 1
𝑧̂𝑖 ] et le second terme par
𝑚2
i 1
𝑧̂𝑖
V.3. Tirage des unités primaires à probabilités inégales (tirage à deux degrés)
1 m 𝑇̂𝑖 (𝑌)
𝑇̂(𝑌) =
𝑚
i 1 𝐴𝑖
i 1 A i
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 68 sur 84
2
1 𝑇𝛼 (𝑌) 1 M
Z
M
𝑉 (𝑇̂(𝑌)) =
𝑚 𝐴𝛼 (
𝐴𝛼
− 𝑇(𝑌)) +
𝑚
1 A
1
𝑁𝛼 M
𝐴𝛼 = (𝑜ù 𝑁 = N )
𝑁 1
m
N N i n0 N m n0
y avec∀𝑖
1
𝑇̂(𝑌) = y
𝑚 i 1
N i n0 j 1 ij m n0 i1 j 1 ij
𝑛𝑖 = 𝑛0
Chaque unité enquêtée a le même coefficient d’extrapolation, on
a un sondage dit « autopondéré ».
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 69 sur 84
V.4.1. Principe
V.4.2. Estimation d’un total dans le cas d’un tirage des grappes à probabilités
égales
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 70 sur 84
𝑀 m
𝑇̂(𝑌) =
𝑚
i 1
𝑇̂𝑖 (𝑌)est l’estimateur du total de Y sur l’univers.
𝑚 1 1 m 2
𝑉̂ (𝑇̂(𝑌)) = 𝑀2 (1 − )
𝑀 𝑚 𝑚 − 1 i 1
(𝑇𝑖 (𝑌) − 𝑇̅(𝑌))
1 m
𝑚
Où 𝑇̅(𝑌) = 𝑇𝑖 (𝑌)
i 1
V.4.3. Estimation d’une moyenne (par unité secondaire) dans le cas d’un tirage
des grappes à probabilités égales
𝑇̂ (𝑌)
L’estimateur de la moyenne est ̂ . Sa variance, plus complexe à
𝑁
calculer, et celle d’un ratio par la formule de sondage aléatoire simple.
V.4.4. Estimation d’un total dans le cas d’un tirage des grappes à probabilités
inégales
𝑁−𝑛 1
Var (𝑦̅𝐺 ) = Var (𝑦̅𝑖 )
𝑁 𝑛
Pour l’ensemble du domaine d’études
𝑁−𝑛 1 𝑁
𝜎𝑦̅2𝐺 = 𝜎𝑦̅2
𝑁 𝑛 𝑁−1
1
𝑛−1 y i y
i 1
n
2
estime
1 N
𝑁−1 Y i Y
j 1
c’est-à-dire
2 𝑁
𝜎 2.
𝑁−1 𝑦̅
1
𝑛−1
n
yi y
i 1
=𝑆 , la variance de la moyenne des grappes sera estimée par
2
2
𝑏
𝑁−𝑛 1 2
𝑠 plus les grappes se ressemblent c’est-à-dire les 𝑦̅𝑖 voisines de𝑦̅, plus la
𝑁 𝑛 𝑏
précision de𝑦̅ est satisfaite.
𝑛 1 2288 𝑁−𝑛 1 2
f= = , on a 𝑆𝑏2 = = 163,4 et Var (𝑦̅𝐺 ) = 𝑠 = 9,80 (Variance estimée)
𝑁 10 15−1 𝑁 𝑛 𝑏
Le problème réside dans la précision d’un estimateur basé sur n tirage aléatoire
de n fois et celle résultant d’une estimation basée sur un tirage en grappes
comptant chacun.
𝑁𝜆−𝑛𝜆 1
Dans le premier cas, Var (𝑦̅) = Var (y).
y y à
𝑁𝜆 𝑛𝜆
i j 2
1
Dans le deuxième cas, on serait tenté d’estimer Var (y) par ij
𝑛𝜆−1
i j
yij y = y Y + 𝜆 Y Y
2 i j
ij i
2 i
i
2
y Y
i j 2
ij
Si l’on pose 𝜎𝑦2 =
N
Manuel de Théorie et pratique de sondage
Exercices avec résolutions
Page 72 sur 84
2
yij Y
i j
2
𝜆𝑁
𝑆 = =
N 1 𝜆𝑁−1
2
yij yi
i j
2
En posant
2
i j
yij y
2
2
y
i j
ij
y²
, on démontre que les valeurs
s n 1 s W
1n
de s
2
W
et 𝑠𝑏2 calculées tendent biens vers S
2
W
et 𝑆𝑏2 .
𝑁−1 1 2
La variance de la moyenne de grappes est estimée par S et celle de la
𝑁 𝑛 B
1
var y
2 N n 1 G =
moyenne d’un échantillon aléatoire par s et l’efficacité
N n 1
var y
2
S cette efficacité peut être estimée par :
S
2
B
important.
1
Si N est très important, N-1, N peuvent être confondus et l’estimation de
N
1 2
sb
2
sW
2
1 1 sW 1 2
2 2 et on a s s
2 2
l’efficacité devient :
sb
2
2 sb b
sW
Exemple :
2
Ensemble. W
606 s
2
n
N 150 n 15 f
N
3 660 sb 490
2 2
sW
2
1 1 sW 1 2 660
Formule approchée : 1,23
2 s 2 2 3 3490
y i i
Si i
est le nombre de consommateurs par ménage i et y la
i
moyenne
1 j
générale par ménage et par les n ménages : yt n yi . Cette estimation est
sans biais et elle est généralement caractérisée par une bonne précision, cette
méthode de tirage se révèle efficace.
y ik
aussi constitué un échantillon systématique de moyenne y
k
V.9.1. Principe
Y Y Y Y
M N N
1 1 1 1
Y Y ²
M N
N 1
1 1
une grandeur, que certains auteurs appellent ROH (par analogie à ROH) qui est
définie par l’équation : DEFF=1+ROH n 1
C’est le calcul effectif de la variance du sondage pratiqué et de
celui du sondage aléatoire simple qui permet d’obtenir des valeurs de DEFF et
par la suite de ROH pour certains paramètres (dans ce cas, ROH ne plus le
coefficient de corrélation intra-grappes puisqu’il prend en compte, par
exemple, la stratification des unités primaires s’il y en a une). Les valeurs de
DEFF et de ROH sont donc alors obtenues par une démarche « expérimentale »
plus que théorique.
V.9.4. Utilisation des valeurs 𝜹
n
100 300 500
0,002 1,2 1,6 2,0
0,003 1,3 1,9 2,5
0,05 6,0 16,0 26,0
formule utilisant les valeurs de n et qui s’applique bien quand les tailles des
unités primaires Ni sont voisines
80
Notes du cours de la Théorie
et Pratique de sondage
Supposons qu'on tire des communes, puis des districts, puis des ménages.
Le principe d'extrapolation d'un total est simple : on estime le
total pour l’unité à l'intérieur de laquelle on a procédé au troisième degré de
tirage, puis on tient compte du mode de tirage au deuxième degré pour
estimer le total au niveau de la commune tirée, et on extrapole ensuite à
l'univers.
Cette succession d'estimations doit bien sûr être adaptée aux
différentes options qu'on a choisies pour les trois degrés de sondage.
Pour l'estimation d'une moyenne par ménage, la méthode est différente selon
que l'on connait le nombre total de ménages (c'est alors direct à partir du total
estiméI ‘échantillon sur l'univers) ou non (on doit alors estimer le nombre total
de ménages à partir del’échantillon).
81
Notes du cours de la Théorie
et Pratique de sondage
BIBLIOGRAPHIE
INTRODUCTION ....................................................................................................................................... 1
OBJECTIFS DU COURS ............................................................................................................................. 2
CHAPITRE I. GENERALITES ...................................................................................................................... 4
1.1. Définitions et but ......................................................................................................................... 4
1.2. Historique et exemples des sondages......................................................................................... 4
1.3. Concepts de base ......................................................................................................................... 5
1.3.1. Recensement et sondage ..................................................................................................... 5
1.3.2. Population ou Univers statistique ....................................................................................... 5
1.3.3. Unités statistiques ................................................................................................................ 5
1.3.4. Echantillon ............................................................................................................................ 6
1.3.5. Variables ............................................................................................................................... 6
1.4. Estimateur, variable aléatoire, variance, moyenne et biais ...................................................... 6
1.4.1. Estimateur ............................................................................................................................. 6
1.4.2. Variable aléatoire ................................................................................................................. 7
1.4.3. Moyenne, variance ............................................................................................................... 7
1.4.4. Biais ....................................................................................................................................... 7
1.5. Base de sondage ......................................................................................................................... 7
CHAPITRE II. METHODES EMPIRIQUES................................................................................................... 8
2.1. INTRODUCTION................................................................................................................................ 8
2.2. Méthodes des quotas .................................................................................................................. 8
2.3. Méthodes des UNITES-TYPES ...................................................................................................... 9
2.5. LES AUTRES METHODES........................................................................................................ 11
2.5.1. METHODE DE « BOULE DE NEIGE » .............................................................................. 11
CHAPITRE III. LE SONDAGE ALEATOIRE SIMPLE ................................................................................... 13
3.1. Introduction ............................................................................................................................... 13
3.2. Procédé du choix aléatoire simple ............................................................................................ 13
3.3. NOTATIONS ........................................................................................................................... 16
3.4. Estimation d’une Moyenne .................................................................................................. 17
3.4.1. Pour un échantillon suffisamment grand, 𝒚 suit la loi normale ................................. 19
3.4.2. Estimation par intervalle de confiance ........................................................................ 19
3.5. Estimation d’un total ............................................................................................................ 20
3.6. Estimation des valeurs des moyennes pour les sous populations ...................................... 20
3.7. Estimation d’une proportion ................................................................................................ 21
3.8. Estimation d’un ratio ............................................................................................................ 22
83
Notes du cours de la Théorie
et Pratique de sondage
3.9. Coefficient de variation sur l’échantillon ............................................................................. 23
3.10. Détermination de la taille de l’échantillon ...................................................................... 23
3.10.1. Formule pour n de l’échantillon pour estimer les proportions ................................... 24
3.10.2. Dans le cas des variables continues ............................................................................. 25
3.10.3. Dans le cas de variables discontinue ............................................................................ 26
3.11. Méthode de tirage ............................................................................................................ 27
CHAPITRE IV. SONDAGES STRATIFIES (STRACTIFICATION A PRIORI) .................................................. 35
IV.1. Généralité ................................................................................................................................. 35
VI.2. Objectifs.................................................................................................................................... 35
IV.3. Choix des strates ...................................................................................................................... 36
IV.4. NOTATIONS .............................................................................................................................. 38
IV.5. FORMULES D’ESTIMATION ...................................................................................................... 39
IV.5.1. Notations ........................................................................................................................... 39
IV.5.2. Estimation du total de Y sur l’univers à partir du sondage stratifié ................................ 39
IV.5.3. Estimation de la moyenne de Y sur l’univers à partir du sondage stratifié .................... 40
IV.5.4. les estimateurs 𝑻(𝒀) et 𝒀 sont des estimateurs sans biais du total et de la moyenne de
Y ..................................................................................................................................................... 40
IV.5.5. variance de l’estimateur du total et de l’estimateur de la moyenne .............................. 40
IV.5.6. Estimation de ces variances d’estimation à partir de l’échantillon ................................ 41
IV.5.7. Cas particulier : le taux de sondage est le même pour toutes les strates....................... 41
IV.6. Répartition de l’échantillon entre les strates.......................................................................... 42
IV.6.1. La répartition proportionnelle .......................................................................................... 42
IV.6.2. Répartition optimale au sens de Neyman ........................................................................ 43
IV.7. Efficacité de la stratification .................................................................................................... 49
IV.7.1. Echantillon stratifié ........................................................................................................... 50
IV.8. Stratification a posteriori ......................................................................................................... 55
IV.8.1. Principe .............................................................................................................................. 55
IV.8.2. Estimation par le quotient ................................................................................................ 57
IV.8.2.1. Principe ........................................................................................................................... 57
IV.8.2.3. L’estimateur par la régression ....................................................................................... 58
CHAPITRE 5. SONDAGES A PLUSIEURS DEGRES ................................................................................... 62
V.1. Principes et notations ............................................................................................................... 62
V.1.1. Principes ............................................................................................................................. 62
V.1.2. Justification et Caractéristiques......................................................................................... 63
V.1.3. Notations ............................................................................................................................ 64
V.2. Tirage des unités primaires à probabilités égales (tirage à deux degrés) ............................... 64
84
Notes du cours de la Théorie
et Pratique de sondage
V.2.1. estimation du total de Y ..................................................................................................... 64
V.2.2. Variance de l’estimateur du total de Y .............................................................................. 65
V.2.3. Estimation de la variance de l’estimateur du total de Y ................................................... 66
V.2.4. Estimation d’une moyenne et d’un ratio .......................................................................... 67
V.3. Tirage des unités primaires à probabilités inégales (tirage à deux degrés) ............................ 67
V.3.2. Variance de l’estimateur du total, estimateur de cette variance..................................... 68
V.3.3. cas particulier important.................................................................................................... 68
V.3.4. Estimation d’une moyenne et d’un ratio .......................................................................... 69
V.4. Sondage en grappes .................................................................................................................. 69
V.4.1. Principe ............................................................................................................................... 69
V.4.2. Estimation d’un total dans le cas d’un tirage des grappes à probabilités égales ........... 69
V.4.3. Estimation d’une moyenne (par unité secondaire) dans le cas d’un tirage des grappes à
probabilités égales ........................................................................................................................ 70
V.4.4. Estimation d’un total dans le cas d’un tirage des grappes à probabilités inégales ......... 70
V.5. Précision de l’estimation ........................................................................................................... 71
V.6. Efficacité d’un échantillon en grappes (grappes égales) .......................................................... 71
V.7. grappes de taille inégale ........................................................................................................... 74
V.8. Sondage systématique .............................................................................................................. 75
V.9. L’effet de grappes ...................................................................................................................... 75
V.9.1. Principe ............................................................................................................................... 75
V.9.2.Coefficient de corrélation intra grappe .............................................................................. 75
V.9.3. Conséquences sur la précision du sondage ....................................................................... 76
V.9.4. Utilisation des valeurs 𝜹..................................................................................................... 77
Utilisation pratique du coefficient ....................................................................................................... 77
Aperçu sur le sondage à trois degrés ................................................................................................... 80
BIBLIOGRAPHIE ..................................................................................................................................... 81