DISTRIBUTION
D’ÉCHANTILLONNAGE
Dr Ivlabèhirè Bertrand MEDA
https://orcid.org/0000-0002-9717-3770
Qu’est-ce qu’une distribution
d’échantillonnage
• Lorsqu'on tire plusieurs échantillons d’une même population, les
statistiques varient
• Une distribution d’échantillonnage est la distribution de ces
statistiques
• Exemple : distribution des moyennes d’échantillons
• Elle permet d’estimer l’incertitude autour de la statistique
• Prenons une population fictive de 5 enfants et supposons que l’on
s’intéresse à leur âge.
• Le tableau 1 représente la distribution de la variable âge dans cette
population.
• Le tableau 2 montre tous les échantillons possibles de taille n=2 tirés
de cette population N=5. le tirage étant fait avec remplacement, on a
un total de 25 échantillons = 5!
• Le tableau 3 est la représentation d’échantillonnage de 𝑋"
Tableau 1: Distribution des âges dans une population fictive d’enfants.
Tableau 2: Tous les échantillons possibles de taille n=2 dans une
population N=5. moyenne échantillonnale entre parenthèses
Tableau 3: Distribution d’échantillonnage de la moyenne des âges
Figure 1: Distribution des âges dans la population
(uniforme ou rectangulaire)
Figure 2: Distribution d’échantillonnage de 𝑋" (symétrique, unimodale)
" on peut calculer la
• Connaissant la distribution d’échantillonnage de 𝑋,
probabilité que la moyenne échantillonnale se situe à ± 1 an de μ.
13
𝑃 9 ≤ 𝑋" ≤ 11 = = 0,52
25
• Calculons la moyenne et la variance de la distribution
d’échantillonnage.
∑' "
$%& 𝑋$ 6 + 7 + 7 + 8 … + 14
𝜇#" = = = 10
𝑁#" 25
# ∑ '
(𝑋
$%& $
% − 𝜇)#
(6 − 10)#
+(7 − 10)#
+ ⋯ + (14 − 10)#
𝜎"! = = =4
𝑁"! 25
• On remarque que:
𝜇"! = 𝜇
𝜎 # 𝜎
#
𝜎"! = ⇒ 𝜎"! =
𝑛 𝑛
• On dit que la moyenne échantillonnale est un estimateur non biaisé de la
moyenne paramétrique.
• Un estimateur non biaisé est un estimateur qui, en moyenne, égale le
paramètre qu’il tente d’estimer.
• L’écart-type de la distribution d’échantillonnage de la moyenne se
nomme l’erreur-type de la moyenne.
• 𝑋" est un estimateur (ponctuel) de μ et la valeur observée de 𝑋"
(estimé) dépend de l’échantillon obtenu.
• En général, l’estimé sera meilleur (c’est-à-dire plus proche de μ) si:
- La taille de l’échantillon n est grande
- La variabilité des observations (c’est-à-dire de X), dans la population
𝜎 # , est petite.
Théorème central limite
!
! "
𝑠𝑖 𝑋~Ν 𝜇, 𝜎 , 𝑎𝑙𝑜𝑟𝑠 𝑋~Ν 𝜎
𝜇, @𝑛
!
! "
𝑋~𝐷 𝜇, 𝜎 , 𝑒𝑡 𝑛 "sufIisamment" 𝑔𝑟𝑎𝑛𝑑, 𝑎𝑙𝑜𝑟𝑠 𝑋~Ν 𝜇, ⁄)
(
(théorème central limite)
• La principale raison du calcul de la moyenne échantillonnale est
l’estimation de la moyenne paramétrique et les moyennes
échantillonnales deviennent plus précises à mesure que la taille de
l’échantillon augmente.
Figure 3: Illustration du théorème central limite
Figure 4: Effet de la taille sur l’erreur-type de la distribution
d’échantillonnage
• Exercice: Dans une population masculine de 17 ans , l’épaisseur d’un
des plis cutanés a une moyenne de 9,7 millimètres et un écart-type
de ± 6 millimètres. Pour un échantillon aléatoire simple de 40
individus, quelle est la probabilité que la moyenne échantillonnale
soit entre 7 et 10,5 millimètres.