0% ont trouvé ce document utile (0 vote)
31 vues2 pages

Fiche TD-TP Chap3

Transféré par

Yakoub Ishagh
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
31 vues2 pages

Fiche TD-TP Chap3

Transféré par

Yakoub Ishagh
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Fiche de TP -TD 3 : Redressement et Ré-échantillonnage

Exercice N°1 : Echantillonnage et ré échantillonnage avec la commande « sample » de R


Que fait la commande « sample » de R ?
1- Explorez le code de la commande « sample » et expliquez clairement ce que cette commande réalise.
Expliquez chacun de ses arguments et comment ils fonctionnent.
2- Proposez une combinaison de ses arguments qui réalise un échantillonnage aléatoire simple. On simulera
une population de taille 10 et on fera un SAS de taille 4.
3- Montrez dans un exemple en simulant qu’effectivement c’est un tirage aléatoire simple qui est réalisé à la
question précédente. On utilisera une boucle pour répéter la question 2) et calculer empiriquement les
probabilités d’inclusions de chaque élément de la population.
Applications au tirage stratifié
4- Simulez une base de données contenant trois variables : « Id » pour l’identifiant de 1 à 100, « Str » pour la
strate dichotomique et « y » pour la variable d’intérêt le revenu mensuel en milliers de MRU qui suit une
loi normale de paramètre 24 et 8.
5- Effectuez un sondage aléatoire simple de taille 40 sur cette base et donnez une estimation du revenu total
et du revenu moyen.
6- Effectuez un sondage aléatoire stratifié de taille 40 dans cette base en considérant « Str » comme variable
de stratification. Donnez une estimation du revenu total et du revenu moyen.
Exercice N°2 : Application des méthodes d’échantillonnage
On se propose d’appliquer les méthodes d’échantillonnage de base (Sondage de Bernoulli, Sondage aléatoire
simple, Sondage systématique à probabilité égales, Sondage de poisson et sondage systématique à probabilités
inégales) et comparer les résultats notamment les propriétés des estimateurs et les estimations obtenues pour voir
laquelle donne des résultats les plus proches de la vraie valeur dans la population. Pour cela on va simuler une
population de taille 1000 avec une variable d’intérêt y et tirer un échantillon de taille 100.

1- Simuler une base de données contenant trois variables : « Id » pour l’identifiant de 1 à 1000 et « y » pour
la variable d’intérêt l’âge en années suit une loi normale de moyenne 21 et d’écart type 18. Vérifiez que la
moyenne et l’écart type dans cette population sont sensiblement égale à 21 et 18.
2- Prélevez un échantillon de 100 unités dans la population en utilisant les différentes méthodes ci-dessous
(les paramètres des sondages seront choisis conformément à la taille de l’échantillon) et donner une
estimation de la moyenne et de l’écart type de la population pour chacune des méthodes :
a. Sondage de Bernoulli ;
b. Sondage aléatoire simple ;
c. Sondage systématique à probabilité égales ;
d. Sondage de poisson ;
e. Sondage systématique à probabilités inégales.
3- On se propose d’étudier les propriétés des estimateurs utilisés dans chaque méthode. Appliquer un
bootstrap à la question 2 et vérifier sur les estimateurs sont sans biais et convergents en moyenne
quadratique.
4- Comparez les résultats !!! laquelle des méthodes donne des résultats qui se rapprochent le plus de la
population ?
Exercice N° 3 : Sondage dans une population réelle
On considère la base de données « demo.csv », on suppose que les 6400 individus de cette base constituent une
population (c’est notre base de sondage). On considère comme variables d’intérêt l’âge (age) et le revenu (income)
dont on veut estimer le total et la moyenne de ces paramètres. On se propose de faire des tirages dans cette base
suivant différentes méthodes et donner des estimations des paramètres de ces variables.

5
1- Calculez le vrai revenu total et le vrai revenu moyen dans la population, ainsi que l’âge moyen de la
population.
2- Utiliser les méthodes de sondage de base (les 5 méthodes de l’exercice précédent) pour donner une
estimation du revenu total, du revenu moyen et de l’âge moyen. Dans cette question on fixera la taille de
l’échantillon à 800 unités statistiques.
3- Appliquer un sondage stratifié (à allocation proportionnelle puis à allocation optimale) sur la population
pour donner une estimation du revenu total, du revenu moyen et de l’âge moyen. On utilisera le sexe
(gender) comme variable de stratification dans un premier temps, puis toute autre variable pertinente de
votre choix. Le choix-vous est donné sur la taille de l’échantillon, justifier votre choix !!!
4- Expliquez comment on peut utiliser le nombre d’année chez l’employé (employ) pour obtenir une
meilleure estimation du revenu total et tu revenu moyen en utilisant le sondage à plusieurs degrés.
Appliquer votre idée.
5- Comparez tous les résultats obtenus aux questions 2), 3) et 4). Quel est le meilleur résultat, en comparaison
avec les vraies valeurs des paramètres dans la population ?
6- Pour chacune des méthodes, étudiez les propriétés de l’estimateur en utilisant un bootstrap.

Vous aimerez peut-être aussi