0% ont trouvé ce document utile (0 vote)
400 vues13 pages

Solution Exercice S

Transféré par

ivarkouadjeu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
400 vues13 pages

Solution Exercice S

Transféré par

ivarkouadjeu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TD 1 : Se familiariser avec les bases/notations

Exercice 1. Soient une population U = {1, 2, 3} et le plan p(·) suivant


1 1 1
p({1, 2}) = , p({1, 3}) = , p({2, 3}) = .
2 4 4
1. Donnez les probabilités d’inclusion d’ordre un.
2. Pourquoi la somme de ces probabilités d’inclusion vaut nécessairement 2 ?
3. Donnez la matrice de variance–covariance des variables indicatrices 1{kœS} , k œ U.

Solution 1. 1. On a
ÿ 3
fi1 = p(s) = p({1, 2}) + p({1, 3}) = ,
sœS : 1œs
4
ÿ 3
fi2 = p(s) = p({1, 2}) + p({2, 3}) = ,
sœS : 2œs
4
ÿ 1
fi3 = p(s) = p({1, 3}) + p({2, 3}) = .
sœS : 3œs
2

2. Car c’est un plan de taille fixe et la taille est 2 justement.


3. Il s’agit donc de calculer (avec les notations du cours)
Y
]fi
k¸ ≠ fik fi¸ , k ”= ¸,
=[
fik (1 ≠ fik ), k = ¸.

On a
3 4
3 3 3 1 3 3 1 1 3 1 1
11 = 1≠ = , 12 = ≠ ◊ =≠ , 13 = ≠ ◊ =≠ ,
43 44 16 2 4 4 16 43 4 4 2 8
3 3 3 1 3 1 1 1 1 1
22 = 1≠ = , 23 = ≠ ◊ =≠ , 33 = 1≠ = ,
4 4 16 4 4 2 8 2 2 4
et donc la matrice de variance–covariance est
S T
3 ≠1 ≠2
1 W X
= U≠1 3 ≠2V
16
≠2 ≠2 4

Exercice 2. Soient une population U = {1, 2, 3} et le plan p(·) suivant


1 1 1
p({1, 2}) = , p({1, 3}) = , p({2, 3}) = .
2 4 4
1. Donnez la distribution de probabilité du fi–estimateur de la moyenne µy pour un
caractère d’intérêt y.
2. En déduire le biais de cet estimateur.

48
Solution 2. 1. Puisqu’à l’exercice 1 nous avons calculé les probabilités d’inclusions
d’ordre 1, nous avons
Y Y 4(y +y )
_
_
y1
+ y2
, s = {1, 2} _ 1 2
, s = {1, 2}
1 y1] 3/4
_ 3/4 _
] 9
4y1 +6y3
µ̂y,fi = _ 3/4 + y3
, s = {1, 3} = , s = {1, 3}
3_
_
1/2 _
_ 9
[ 4y2 +6y3
[ y
3/4
2
+ y3
1/2
, s = {2, 3} 9
, s = {2, 3}

2. Ainsi
1 4(y1 + y2 ) 1 4y1 + 6y3 1 4y2 + 6y3
E(µ̂y,fi ) = ◊ + ◊ + ◊
2 9 4 9 4 9
2y1 + 2y2 + y1 + 1.5y3 + y2 + 1.5y3
=
9
3y1 + 3y2 + 3y3
=
9
y1 + y2 + y3
= = µy .
3
Ce qui est logique puisque nous avons vu que le fi–estimateur était un estimateur
sans biais !

Exercice 3. Soit la matrice de variance–covariance =( k¸ )k,¸ des indicatrices 1{kœS}


pour un plan p(·) donné. On sait que
S T
1 1 1 ≠1 ≠1
W X
W 1 1 1 ≠1 ≠1X
6 WW 1
X
= 1 1 ≠1 ≠1X
X.
25 W
W
U≠1 ≠1 ≠1 1 1XV
≠1 ≠1 ≠1 1 1

1. Le plan p(·) est-il de taille fixe ?


2. Satisfait il aux conditions de Sen–Yates–Grundy ?
3. Sachant que fi1 = fi2 = fi3 > fi4 = fi5 , calculer les probabilités d’inclusions d’ordre
1.
4. Donnez la matrice des probabilités d’inclusions d’ordre deux.
5. Donnez les probabilités associées à tous les échantillons possibles.
q
Solution 3. 1. Ce plan n’est pas de taille fixe puisque kœU k¸ ”= 0.
2. Ces conditions ne sont pas vérifiées puisque (par exemple) 12 = 1 > 0.
3. D’après la matrice , on a pour tout k œ U
; <
6 2 3
fik (1 ≠ fik ) = ≈∆ fik œ , .
25 5 5
D’après les indications supplémentaires, on a donc

2 3
fi1 = fi2 = fi3 = , fi4 = fi5 = .
5 5

49
4. Puisque k¸ = fik¸ ≠ fik fi¸ , k ”= ¸ et que nous connaissons déjà les fik , nous pouvons
en déduire que

6 4 2
fi12 = 12 + fi1 fi2 = + =
25 25 5
6 6
fi14 = 14 + fi1 fi4 = ≠ + =0
25 25
6 9 3
fi45 = 45 + fi4 fi5 = + =
25 25 5
Avec des calculs similaires, la matrice des probabilités d’inclusion d’ordre deux est
S T
— 2 2 0 0
W X
W2 — 2 0 0X
1W
W2
X
2 — 0 0X
5W
W X
U 0 0 0 — 3 X
V
0 0 0 3 —

5. Du fait de la présence de nombreux zéro au sein de la matrice des probabilités


d’inclusion d’ordre 2, on sait que les échantillons possibles sont (éventuellement)

{1}, {2}, {3}, {4}, {5}, {1, 2}, {1, 3}, {2, 3}, {4, 5}, {1, 2, 3}.

Du coup on a déjà
3
Pr(S = {4, 5}) = fi45 = .
5
D’un côté puisque fi1 = fi12 , on a

2
Pr(S = {1}) = Pr(S = {1, 3}) = 0, Pr(S = {1, 2}) + Pr(S = {1, 2, 3}) = .
¸ ˚˙ ˝ ¸ ˚˙ ˝ 5
échantillons contenant 1 mais pas 2 échantillons contenant 1 et 2

De l’autre puisque fi1 = fi13 , on a également

2
Pr(S = {1}) = Pr(S = {1, 2}) = 0, Pr(S = {1, 3}) + Pr(S = {1, 2, 3}) = .
5
On en déduit donc que Pr(S = {1, 2, 3}) = 2/5. Le même raisonnement conduit à
Pr(S = {2}) = Pr(S = {3}) = Pr(S = {2, 3}) = 0.
Enfin on a
3 3
Pr(S = {4}) = fi4 ≠ fi45 = ≠ =0
5 5
3 3
Pr(S = {5}) = fi5 ≠ fi45 = ≠ = 0.
5 5

Pour résumer on a donc


3 2
p({4, 5}) = , p({1, 2, 3}) = ,
5 5
et le plan n’est effectivement pas à taille fixe.

50
Exercice 4. On considère un plan sans remise effectué sur une population de taille N .
On suppose que les probabilités d’inclusions d’ordre 1 et 2 fik et fik¸ sont strictement
positives. A partir d’un échantillon aléatoire S, on s’intéresse à l’estimateur suivant
1 ÿ yk 1 ÿ y¸
◊ˆ = 2 + 2 .
N kœS fik N k,¸œS fik¸
k”=¸

1. Pour quelle fonction d’intérêt cet estimateur est il sans biais ?


Solution 4. On a
ˆ = 1 ÿ yk 1 ÿ y¸
E(◊) 2
E(1{kœS} ) + 2 E(1{k,¸œS} )
N kœU fik N k,¸œU fik¸
k”=¸
1 ÿ 1 ÿ
= yk + y¸
N2 kœU N2 k,¸œU
k”=¸
1 1
= 2
ty + 2 (N ty ≠ ty )
N N
1
= ty = µy .
N
La fonction d’intérêt est la moyenne !

Exercice 5. 1. Montrez que


1 ÿ 1 ÿ
(yk ≠ µy )2 = (yk ≠ y¸ )2 .
N kœU 2N 2 k,¸œU
k”=¸

2. Pour un plan sans remise quelconque mais dont les probabilités d’inclusion d’ordre
1 et 2 sont strictement positives, construisez un estimateur sans biais de ‡y2 .
Solution 5. 1. On a
1 ÿ 1 ÿ
(yk ≠ y¸ )2 = (yk ≠ y¸ )2
2N k,¸œU
2 2N 2 k,¸œU
k”=¸
1 ÿ 2 1 ÿ
= y ≠ yk y¸
N 2 k,¸œU k N 2 k,¸œU
Q RQ R
1 ÿ 2 a 1 ÿ ba 1 ÿ b
= y ≠ yk y¸
N kœU k N kœU N ¸œU
= y2 ≠ y2
= ‡y2

2. On utilise donc le résultat précédent et on utilise le fi–estimateur, i.e.,


1 ÿ (yk ≠ y¸ )2
,
2N 2 k,¸œS fik¸
k”=¸

qui est un estimateur sans biais dès lors que les fik¸ sont tous positifs.

51
TD 2 : Plans simples

Exercice 6. On souhaite estimer la surface moyenne cultivée dans les fermes d’un canton
rural donné. Sur les N = 2010 fermes de ce canton, on en tire 100 par sondage aléatoire
simple. On mesure yk la surface cultivée dans la ferme k en hectares, et l’on trouve
ÿ ÿ
yk = 2907ha, yk2 = 154593ha2 .
kœS kœS

1. Donnez l’estimateur sans biais classique de la moyenne


1 ÿ
µy = yk .
N kœU

2. Donnez un intervalle de confiance à 95% pour µy .

Solution 6. 1. Dans un plan simple, l’estimateur sans biais classique est


1ÿ 2907
µ̂y = yk = = 29.07ha.
n kœS 100

2. La taille de l’échantillon n = 100 étant suffisamment grande, on peut supposer sans


trop de risque µ̂y suit approximativement une loi normale. L’intervalle de confiance
en découle et s’écrit
S ı̂ T S Û T
W
ıN
Ù ≠n Ŝy2 X 2010 ≠ 100 707.94 V
Uµ̂y ± 1.96 V = U29.07 ± 1.96 ◊ = [23.99, 34.15],
N n 2010 100

où nous avons utilisé le fait que


Q R
n a1 ÿ 2 100 1 2
Ŝy2 = yk ≠ µ̂2y b = 1545.93 ≠ 29.072 = 707.94
n ≠ 1 n kœS 99

Exercice 7. On s’intéresse à la proportion d’hommes atteints par une maladie profession-


nelle dans une entreprise de 1500 travailleurs. On sait par ailleurs que trois travailleurs
sur dix sont ordinairement touchés par cette maladie dans des entreprises du même type.
On se propose de sélectionner un échantillon au moyen d’un sondage aléatoire simple.
Quelle taille d’échantillon faut–il sélectionner pour que la longueur totale d’un inter-
valle de confiance avec un niveau de confiance 0.95 soit inférieure à 0.02 pour les plans
simples avec et sans remise ?

Solution 7. Le paramètre d’intérêt est donné par


1 ÿ
p= yk ,
N kœU

où les yk sont des indicatrices codant la présence ou non de la maladie. On estimera ce


paramètre par
1ÿ
p̂ = yk ,
n kœS

52
et la variance de cet estimateur est donnée par
Y 2
] ‡y , avec remise,
Var(p̂) = n
2
[ N ≠n Sy ,
N n
sans remise,

mais puisque yk2 = yk , la variance et la variance corrigée sur la population sont égales à
Q R2
1 ÿ 1 ÿ N
‡y2 = yk ≠ a yk b = p ≠ p2 = p(1 ≠ p), Sy2 = p(1 ≠ p).
N kœU N kœU N ≠1

Ainsi on a donc Y
] p(1≠p) , avec remise,
Var(p̂) = [ N ≠n
n
p(1≠p)
N ≠1 n
, sans remise.
Si l’on suppose que la taille de l’échantillon est suffisamment grande pour que l’ap-
proximation selon la loi normale soit acceptable, on a donc un intervalle de confiance à
95% de la forme Ò
p̂ ± 1.96 ◊ Var(p̂).
Ainsi on cherche donc la taille de l’échantillon n telle que
Ò
2 ◊ 1.96 ◊ Var(p̂) Æ 0.02 ≈∆ Var(p̂) Æ 196≠2
Y
Æ 196≠2 ,
] p(1≠p)
n
avec remise
≈∆ [ N ≠n
N ≠1
p(1≠p)
n
Æ 196 , avec remise
≠2
Y
Ø 1962 p(1 ≠ p)
]n avec remise
≈∆ [
n Ø 196 N p(1 ≠ p)/{N ≠ 1 + 196 p(1 ≠ p)} sans remise.
2 2

En prenant p = 3/10 et N = 1500 on trouve alors que


Y
]8067, avec remise
n>
[1264, sans remise.

Notons qu’avec remise la taille d’échantillon requise est supérieure à la taille de la popu-
lation :-(

Exercice 8. Un échantillon de 100 étudiants est constitué au moyen d’un plan aléatoire
simple sans remise dans une population de 1000 étudiants. Le résultat obtenu est présenté
au sein du Tableau 2.
Table 2: Nombre de succès/échec selon le sexe pour un échantillon de 100 étudiants pris parmi
1000.
Hommes Femmes Total
Réussite n11 = 35 n12 = 25 n1· = 60
Échec n21 = 20 n22 = 20 n2· = 40
Total n·1 = 55 n·2 = 45 n = 100

— Estimez le taux de réussite des hommes et des femmes.


— Calculez le biais (approché) des taux de réussite.

53
— Estimez l’erreur quadratique moyenne de ces taux de réussite.
Solution 8. 1. Bon bah là on réfléchit pas plus de 2 secondes et l’on écrit bêtement
25 35
R̂F = ¥ 55.6%, R̂H = ¥ 63.6%.
45 55
2. On a vu que la moyenne empirique était un estimateur sans biais—que ce soit sans
remise ou avec. Alors pourquoi parlons nous ici de biais approché ? ? ? Le problème
vient du fait que l’on pioche (sans remise) 100 étudiants parmi 1000. En conséquence
le nombre de filles/garçons présents dans l’échantillon est aléatoire ! ! ! Cela nous
introduit un biais. . .
Rappel de cours (je l’espère inutile) : Le biais approché d’un ratio R = µy /µx est
1 N ≠n1 1 2 2
Biais(R) ¥ RS ≠ S .
µ2x N n x xy

Revenons à notre exercice et commençons par les filles galanterie oblige. On a donc
µ̂y
R̂F = ,
µ̂x
où les y sont des variables binaires valant 1 lors de la réussite d’une femme, 0 sinon,
et x sont des variables binaires valant 1 s’il s’agit d’une femme, 0 sinon.
On a donc (puisque x2k = xk et xk yk = yk )
Q R
1 aÿ 2 1 N
Sx2 = xk ≠ N µ2x b = (N µx ≠ N µ2x ) = µx (1 ≠ µx )
N ≠ 1 kœU N ≠1 N ≠1
Q R
1 aÿ 1 N
Sxy = x k y k ≠ N µ x µy b = (N µy ≠ N µx µy ) = µy (1 ≠ µx ).
N ≠ 1 kœU N ≠1 N ≠1
Ainsi le biais approché vaut donc
1 N ≠n1
Biais(R̂F ) ¥ 2 {RF µx (1 ≠ µx ) ≠ µy (1 ≠ µx )}
µx N ≠ 1 n
1 N ≠n1
= 2 {µy (1 ≠ µx ) ≠ µy (1 ≠ µx )} , µ y = R F µx
µx N ≠ 1 n
= 0.
On trouvera le même résultat pour les garçons, i.e., un biais approché nul. D’ailleurs
c’est nul comme question car pour ce cas particulier le biais approché est toujours
égal à 0 ;-)
3. Cours : La formule de l’erreur quadratique approchée d’un ratio R = µy /µx est
1 N ≠n1 1 2 2 2
2
EQM(R̂) ¥ S ≠ 2RS + R S x .
µ2x N n y
xy

Pour notre cas particulier et toujours pour les femmes on a donc


; <
1 N ≠n1 N N N
EQM(R̂F ) ¥ 2 µy (1 ≠ µy ) ≠ 2RF µy (1 ≠ µx ) + RF2 µx (1 ≠ µx )
µx N n N ≠ 1 N ≠1 N ≠1
1 N ≠n1
= 2 {µy (1 ≠ µy ) ≠ 2RF µy (1 ≠ µx ) + RF µy (1 ≠ µx )}
µx N ≠ 1 n
1 N ≠n1
= 2 µy {1 ≠ µy ≠ RF (1 ≠ µx )}
µx N ≠ 1 n
1 N ≠n1
= 2 µy (1 ≠ RF ).
µx N ≠ 1 n

54
On estime cette erreur quadratique moyenne par

[ R̂F ) ¥ 1 N ≠ n 1 µ̂y (1 ≠ R̂F )


EQM(
µ̂2x N ≠ 1 n
3 4
1 1000 ≠ 100 1 25 25
= 1≠
(45/100)2 1000 ≠ 1 100 100 45
= 4.9 ◊ 10 .
≠3

De même pour les hommes on trouve

[ R̂H ) ¥ 3.8 ◊ 10≠3 .


EQM(

55
TD 3 : Plans à probablités inégales

Exercice 9. Une population est composée de 6 ménages de tailles respectives 2, 4, 3, 9,


1 et 2 (la taille xk d’un ménage k est le nombre de personnes physiques qu’il comprend).
On tire 3 ménages sans remise, avec une probabilité proportionnelle à leur taille.
1. Donnez les probabilités d’inclusion des 6 ménages de la base de sondage—soyez
prudent. . .
2. Réalisez effectivement le tirage par une méthode systématique.
3. A partir de l’échantillon obtenu en 2, donnez une estimation de la taille moyenne x̄
des ménages ; le résultat était-il prévisible ?

Solution 9. 1. Pour tout k œ U on a


xk 3xk xk
fik = n = = .
x̄ 21 7

On remarque que fi4 = 9/7 > 1. On corrige le problème en posant fi4 = 1 et en


réajustant les autres probabilités d’inclusions, i.e., pour k œ U \ {4}

xk 2xk xk
fik = 2 = = .
x̄ ≠ x4 12 6

On a donc
1 2 1 1 1
fi1 = , fi2 = , fi3 = , fi4 = 1, fi5 = , fi6 = .
3 3 2 6 3
q6
Notons que nous avons bien comme attendu k=1 fik = 3.
2. Puisque fi4 = 1, le ménage 4 est forcément pris ; reste donc à tirer deux ménages à
l’aide d’une réalisation d’une U (0, 1) et d’un pas de tirage de 1.
3. L’échantillon S peut s’écrire S = (k1 , k2 , k3 ) avec k1 = 4. Ainsi
A B
1 ÿ xk 1 9 x k2 x k3
x̄ˆ = = + + = 3.5.
N kœS fik 6 1 xk2 /6 xk3 /6

Remarquons que x̄ˆ = x̄. Ce résultat est évident puisque les xk et fik sont parfaitement
proportionnels et donc un estimateur de variance nulle !

Exercice 10. On a répertorié dans une petite municipalité 6 entreprises dont les chiffres
d’affaires (variable xk ) sont respectivement de 40, 10, 8, 1, 0.5 et 0.5 millions d’euros.
Dans le but d’estimer l’emploi salarié total, sélectionnez trois entreprises au hasard et
sans remise, à probabilités inégales selon le chiffre d’affaires, par la méthode du tirage
systématique (en justifiant votre démarche). Pour ce faire, on utilise la réalisation suivante
d’une variable aléatoire U (0, 1) : 0.83021. Que se passe-t-il si on modifie l’ordre du fichier ?

56
Solution 10. Commençons par dire que le tirage à probabilités inégales semble justifié
puisqu’à priori il devrait avoir une relation plus ou moins proportionnelle entre le le chiffre
d’affaire et le nombre de salariés.
q
Commençons nos calculs pour ce tirage systématique. On a kœU xk = 60 et puisque
40
fi1 = 3 = 2 > 1,
60
l’unité 1 est sélectionnée d’office et retirée de la population. De manière analogue, puisque
10
fi2 = 2 = 1,
60 ≠ 40
l’unité 2 est également sélectionnée d’office et retirée de la population. Il reste donc à
sélectionner une dernière unité parmi celles restantes. On trouve facilement
8 1 1 1
fi3 = , fi4 = , fi5 = , fi6 = .
10 10 20 20
q6
Notons que l’on a bien comme attendu k=3 fik = 1. Les probabilités d’inclusions cumulées
sont

fi3 = 0.8, fi3 + fi4 = 0.9, fi3 + fi4 + fi5 = 0.95, fi3 + fi4 + fi5 + fi6 = 1.

Puisque la réalisation d’une U (0, 1) est 0.83021, l’échantillon obtenu est {1, 2, 4}.
Si l’on modifie l’ordre du fichier en gardant cette réalisation d’une U (0, 1), les unités
1 et 2 sont toujours sélectionnées d’office. Si l’unité x = 8 est en position 2, 3 ou 4 elle
est toujours retenue ; sinon tout est possible. . .
Morale de l’histoire l’ordre du fichier influe sur l’échantillon sélectionné.

Exercice 11. Soit une population de 5 unités. On veut sélectionner par un tirage systéma-
tique à probabilités inégales un échantillon de deux unités avec des probabilités d’inclusion
proportionnelles aux valeurs xi suivantes

1, 1, 6, 6, 6.

1. Calculez les probabilités d’inclusion d’ordre un.


2. Considérant les deux unités dont la valeur xi vaut 1, calculez leurs probabilités
d’inclusion d’ordre deux pour chacune des permutations possibles du fichier. Consé-
quence ?
q
Solution 11. 1. Le total vaut kœU xk = 20 et donc
1 1 6 3
fi1 = fi2 = 2 ◊ = , fi3 = fi4 = fi5 = 2 ◊ = .
20 10 20 5
1 2
2. Remarquons qu’il y a 52 = 10 permutations possibles du fichiers, i.e., le nombre
de manières de placer les valeurs « 1 » parmi 5 cases. Le tableau 3 liste toutes les
permutations possibles.
Ici il s’agit d’être astucieux afin de ne pas faire tous les calculs. En effet pour le tirage
systématique seule la position relative des unités importe. Ainsi les permutations
du fichier 1, 4, 5, 8 et 10 correspondent à la même situation et les permutations 2,

57
Table 3: Toutes les permutations possibles du fichier de l’exercice .
Permutation x1 x2 x3 x4 x5
1 1 1 6 6 6
2 1 6 1 6 6
3 1 6 6 1 6
4 1 6 6 6 1
5 6 1 1 6 6
6 6 1 6 1 6
7 6 1 6 6 1
8 6 6 1 1 6
9 6 6 1 6 1
10 6 6 6 1 1

fi3 fi2
fi3
fi2
fi1 fi1
u+1 u+1
fi4 fi4

fi5 fi5
Figure 1: Représentation graphique des probabilités d’inclusion d’ordre 1 cumulées de l’exercice.
Gauche : cas A ; Droite : Cas B.

3, 6, 7 et 9 à une autre unique situation. Il suffit donc de considérer que ces deux
cas particuliers au lieu des 10 possibles, c’est à dire

Cas A : {1, 1, 6, 6, 6}, Cas B : {1, 6, 1, 6, 6},

dont les probabilités d’inclusion d’ordre 1 sont respectivement

Cas A : (1/10, 1/10, 3/5, 3/5, 3/5), Cas B : (1/10, 3/5, 1/10, 3/5, 3/5).

Graphiquement les probabilités cumulées peuvent se représenter comme sur la Fi-


gure 1. On voit notamment qu’il est impossible d’obtenir un échantillon contenant
les deux unités « 1 » puisque le pas de tirage vaut 1. Ainsi on a donc une probabilité
d’inclusion d’ordre 2 nulle et l’estimation de la variance du fi–estimateur est biaisée.

Exercice 12. Soit une population U composée de 6 unités. On connaît les valeurs prises
par un caractère auxiliaire x sur toutes les unités de la population :

x1 = 200, x2 = 80, x3 = 50, x4 = 50, x5 = 10, x6 = 10.

1. Calculez les probabilités d’inclusion d’ordre un proportionnelles aux xk pour une


taille d’échantillon n = 4. Soit 0.48444 une réalisation d’une U (0, 1). Sélectionnez
un échantillon à probabilités inégales sans remise de taille 4 au moyen d’un tirage
systématique, en gardant l’ordre initial du fichier.
2. Donnez la matrice des probabilités d’inclusions d’ordre deux (ordre initial du fichier
fixé).

58
3. On suppose qu’une variable d’intérêt y prend les valeurs suivantes :

y1 = 80, y2 = 50, y3 = 30, y4 = 25, y5 = 10, y6 = 5.

Constituez un tableau avec, en ligne chaque échantillon s possible, et en colonne


les probabilités de tirage p(s), les estimateurs respectifs du total Ŷ (s) et de la
variance Var[
‰ Ŷ ]. Calculez, sur la base de ce tableau, les espérances E[Ŷ ] et E[Var[
‰ Ŷ ]].
Commentez.
q
Solution 12. 1. Puisque kœU xk = 400 et
200
fi1 = 4 = 2 > 1,
400
l’unité 1 est sélectionnée d’office et retirée de la population. On a de manière ana-
logue
80
fi2 = 3 = 1.2 > 1,
400 ≠ 200
l’unité 2 est sélectionnée d’office et retirée de la population. Enfin on trouve facile-
ment que
50 5 10 1
fi3 = fi4 = 2 = , fi5 = fi6 = 2 = .
120 6 120 6
q6
On vérifie que l’on a bien k=3 fik = 2.
Les probabilités d’inclusion cumulées sont

fi3 = 5/6, fi4 = 10/6, fi5 = 11/6, fi6 = 2.

0/6 u 5/6 u + 1 10/6 11/6 12/6


Figure 2: Probabilité d’inclusion cumulées de l’exercice.

Puisque 0.48444 < 5/6 et 5/6 < 1 + 0.48444 < 10/6, l’échantillon obtenu est
{1, 2, 3, 4}.
2. La matrice des probabilités d’inclusion d’ordre deux est donnée par
S T
— 1 5/6 5/6 1/6 1/6
W 1 — 5/6 5/6 1/6 1/6X
W
X
W X
W5/6 5/6 — 4/6 1/6 0 X
W X
W5/6 5/6 4/6 — 0 1/6X
W X
W X
U1/6 1/6 1/6 0 — 0 V
1/6 1/6 0 1/6 0 —

Les deux premières lignes et colonnes de cette matrice découlent de la propriété

Pour tout k, pour tout ¸ : fik = 1 =∆ fik¸ = fi¸ .

Pour les autres valeurs c’est un peu plus fastidieux puisqu’il faut considérer tous les
cas possibles. A ordre fixé, si on note u la valeur tirée au hasard entre 0 et 1, on
voit d’après la Figure 2 que
— Si 0 < u Æ 4/6, alors on tombe dans les intervalles numéro 1 et 2 ;
— Si 4/6 < u Æ 5/6, alors on tombe dans les intervalles numéro 1 et 3 ;
— Si 5/6 < u Æ 1, alors on tombe dans les intervalles numéro 2 et 4.

59
D’où
4 1 1
fi34 = , fi35 = , fi46 = ,
6 6 6
et les autres probabilités sont nulles.
3. D’après la matrice précédente, il n’y a que 3 échantillons possibles (de taille fixe).
Le fi–estimateur s’écrit ÿ yk
ŷ = ,
kœS fi k

et sa variance est estimée par


3 42
1 ÿ k¸ yk y¸
Var[ŷ]
‰ =≠ ≠ .
2 k,¸œS fik¸ fik fi¸
k”=¸

Notons que le vrai total vaut y = 200. Les estimations et variances estimées pour
chaque échantillons sont

Table 4: Probabilités de tirage, estimations et variances estimées pour chaque échantillon pos-
sible.
Échantillon s Pr(S = s) ŷ Var[ŷ]

{1, 2, 3, 4} 4/6 196 0.75
{1, 2, 3, 5} 1/6 226 -48
{1, 2, 4, 6} 1/6 190 0
Total 1 E[ŷ] = 200 E[Var[ŷ]] = ≠7.5

Comme attendu on voit que le fi–estimateur est sans biais. En revanche l’estima-
teur de sa variance est biaisé puisque des probabilités d’inclusion d’ordre deux sont
nulles ! ! !

60

Vous aimerez peut-être aussi