0% ont trouvé ce document utile (0 vote)
66 vues88 pages

Échantillonnage en Statistique Inférentielle

Transféré par

mazilrentcar
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
66 vues88 pages

Échantillonnage en Statistique Inférentielle

Transféré par

mazilrentcar
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 3

Éléments de Statistique Inférentielle:


Échantillonnage

Dr Khalil AMINE
[email protected]

. . . . . . . . . . . . . . . . . . . .
EHTP 2024/2025 . . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 1 / 88
Introduction

1. Introduction

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 2 / 88
Introduction

Introduction

On appelle échantillon tout sous-ensemble


représentatif d’une population donnée, dite
population mère.
La théorie de l’échantillonnage a pour objet l’étude
des liaisons entres les paramètres d’une population et
les paramètres des échantillons issues de cette
population.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 3 / 88
Introduction

Introduction

La statistique inférentielle permet:


évaluer les paramètres des échantillons d’une
population dont les paramètres sont connus
extrapoler des résultats issus d’échantillons en
vue de caractériser une population mère dont les
paramètres sont inconnus.

On parle ainsi de deux techniques importantes de la


statistique inférentielle, à savoir l’échantillonnage et
l’estimation.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 4 / 88
Introduction

Introduction

L’échantillonnage est le processus du choix des


individus à observer (étudier) à partir d’une
population mère.

Éviter de faire des observations sur tous les


individus de la population
=⇒ Réduire le coût de la collection des informations
en termes de temps et d’argent

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 5 / 88
Introduction

Introduction

Remarque
Dans certaines situations, l’enquête partielle est la
seule solution possible, c’est le cas lorsque
l’observation exhaustive présente un caractère
destructif ou lorsque l’état de la population (en
rapport avec le caractère étudié) change
rapidement.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 6 / 88
Introduction

Introduction

Définition: Population, Individu


Une population est un ensemble d’éléments soumis
à une étude statistique, appelés individus ou unités
statistiques ou encore élément de base.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 7 / 88
Introduction

Introduction

Définition: Échantillon
On appelle échantillon tout sous-ensemble
représentatif d’une population mère.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 8 / 88
Introduction

Introduction

Définition: Échantillonnage
On appelle échantillonnage le processus du choix
organisé des éléments de l’échantillon.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 9 / 88
Introduction

Introduction

Définition: Recensement
On appelle recensement toute enquête exhaustive
qui collecte des observations sur tous les individus de
la population.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 10 / 88
Introduction

Introduction

Définition: Sondage
On appelle sondage toute enquête non-exhaustive au
cours de laquelle seulement une partie des individus
de la population sont observés.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 11 / 88
Introduction

Introduction

Définition: Base de sondage


On appelle base de sondage la liste qui répertorie
tous les individus d’une population à étudier.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 12 / 88
Introduction

Introduction

Définition: Erreur d’échantillonnage


On appelle erreur d’échantillonnage l’écart entre
les résultats obtenus auprès d’un échantillon et ce que
nous apprendrait un recensement comparable de la
population.

Remarque
Plus la taille de l’échantillon est grande plus l’erreur
d’échantillonnage diminue.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 13 / 88
Introduction

Introduction

Définition: Fraction de sondage


On appelle fraction de sondage ou taux de
sondage la proportion des individus de la population
qui font partie de l’échantillon.

C’est le rapport en pourcentage entre la taille de


l’échantillon n, et la taille de la population N :
n
f =
N
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 14 / 88
Méthodes d’échantillonnages

2. Méthodes d’échantillonnages

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 15 / 88
Méthodes d’échantillonnages

Méthodes d’échantillonnages

Les méthodes d’échantillonnage correspondent aux


différentes manières de constituer un échantillon de la
population étudiée.

Ces méthodes doivent aboutir à un échantillon


représentatif de la population étudiée, sinon il n’aura
pas les mêmes caractéristiques que la population mère.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 16 / 88
Méthodes d’échantillonnages

Méthodes d’échantillonnages

Deux types de méthodes d’échantillonnage:

Méthodes d’échantillonnage non-probabilistes /


empiriques

Méthodes d’échantillonnage aléatoires /


probabilistes

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 17 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Appelées aussi méthodes empiriques ou par choix


raisonné. Elles consistent à choisir des individus qui
n’obéit pas au hasard, selon des critères de faisabilité,
de ressemblance à la population-cible et de critères
subjectifs dépendant du choix des enquêteurs.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 18 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Échantillonnage de convenance : Le choix


des individus repose sur leurs disponibilité et le
coût d’accès. L’échantillon dans ce cas est obtenu
sans méthode particulière. L’étude sera
certainement biaisée (subjective) : l’échantillon
de convenance ne sera pas forcément un
échantillon représentatif, des facteurs tels que le
lieu et le temps peuvent introduire un biais de
sélection dans l’étude.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 19 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Exemple:
Chaque jour, un contrôleur de qualité dans une usine
sélectionne les 100 premières pièces qu’il voit pour
vérifier leur conformité.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 20 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les avantages de la méthode de convenance sont :


facile à utiliser ;
absence d’influence de l’investigateur.

Les inconvénients de la méthode de convenance sont :


biaisées : le choix des individus est régi à
l’accessibilité;
non-représentativité : les individus interrogés ne
présentent pas forcement un caractère de la
population.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 21 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Échantillonnage à participation volontaire :


Cette technique consiste à faire appel à des
volontaires pour constituer l’échantillon.

Exemple:
Pour évaluer le niveau de satisfaction de ses clients,
un restaurant laisse à disposition sur les tables un bref
questionnaire. Les clients qui le souhaitent
remplissent le questionnaire.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 22 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les avantages de l’échantillonnage à participation


volontaire sont :
attractif du point de vue de l’éthique : seuls les
individus qui sont intéressés à servir sont
interrogés;
utile pour les phases exploratoires.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 23 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les inconvénients de l’échantillonnage à participation


volontaire sont :
biaisées : le choix des individus est régi à leurs
volontés et non pas aux caractères de la
population;
non-représentativité : les individus interrogés ne
présentent pas forcement un caractère de la
population.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 24 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Méthodes des quotas ou proportionnelles:


Il s’agit de construire un échantillon qui soit un
modèle réduit de la population étudiée.

C’est-à-dire de reproduire le plus fidèlement


possible les caractéristiques de la population
mère, à partir d’informations statistiques sur la
structure de cette population.

Cela permet de réduire le risque d’avoir un


échantillon aberrant (c’est-à-dire qui présente des
caractères exceptionnels de la population).
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 25 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les méthodes des quotas repose sur l’utilisation de


variables contrôlées ou variables de contrôle
(genre, âge, profession, etc.) ou les proportions de ces
variables dans la population mère soient
approximativement les mêmes dans l’échantillon.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 26 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Exemple:
Pour une population contenant 48% d’hommes et 52%
de femmes, 25% de jeunes de 25 à 30 ans, le chercheur
chargé d’enquêter auprès de 100 personnes, par
exemple, devra interroger 48 hommes, 52 femmes et
25 personnes de 25 à 30 ans.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 27 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les avantages des méthodes de quotas sont :


faciles à utiliser ;
coût réduit : Aucune obligation à interroger un
individu précis ;
base de sondage non-nécessaire : seulement la
connaissance de la répartition de la population
mère est nécessaire.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 28 / 88
Méthodes d’échantillonnages Méthodes non-probabilistes

Méthodes non-probabilistes

Les inconvénients des méthodes de quotas sont :


biaisées : le choix des individus ne peut pas être
de manière objective ;
non-représentativité : le choix des variables de
contrôle ne peut pas être de manière exhaustive ;
non-connaissance des taux de réponse : aucune
instruction particulière sur la taille de
l’échantillon et par conséquent sur le taux de
sondage.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 29 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Les méthodes d’échantillonnage aléatoires ou


probabilistes sont des méthodes de construction
d’échantillon en se basant sur des règles liées au
hasard.

Les individus de la population ont une probabilité


connue et non nulle d’être sélectionnés pour faire
partie de l’échantillon. Ainsi, seul le hasard régit
l’inclusion ou non d’un individu dans l’échantillon
sans l’intervention du chercheur.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 30 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires
Échantillonnage aléatoire simple : Tous les
éléments de la population ont la même
probabilité de faire partie de l’échantillon.

Un générateur de nombres aléatoires ou des


méthodes telles que le tirage en aveuglette
peuvent être utilisés pour avoir un nombre donné
d’individus.

Cette méthode permet d’obtenir un échantillon


représentatif de la population car elle donne la
même probabilité à chaque individu de faire
partie de l’échantillon. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 31 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Exemple:
Un enseignant utilise un logiciel de génération de
nombres aléatoires pour choisir les numéros d’ordres
des élèves qui vont participer à une séance de colle.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 32 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Échantillon aléatoire stratifié : Il s’agit de


subdiviser la population en des sous-groupes
homogène dits strates, définis selon un ou
plusieurs critères (appelés variables d’intérêt).

De chaque strate, des individus sont prélevés


aléatoirement pour obtenir des sous-échantillons
aléatoires simples.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 33 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Cette méthode permet d’obtenir un échantillon


représentatif car tous les individus d’un groupe ont la
même probabilité de faire partie du sous-échantillon et
l’échantillon obtenu est représentatif de la population
en ce qui concerne la variable d’intérêt.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 34 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Exemple:
Une enquête sur la formation à l’EHTP a été menée
auprès de 90 étudiants de la première année.
L’échantillon a été obtenu en choisissant aléatoirement
10 étudiants de chacune des 9 filières.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 35 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Échantillon aléatoire par grappes : Il s’agit


de subdiviser la population en des sous-groupes,
dits grappes, et de choisir aléatoirement des
grappes et prendre leurs éléments pour construire
l’échantillon.

Cette méthode permet d’obtenir un échantillon


représentatif de la population si les grappes sont
semblables entre elles et si dans une grappe, les
individus sont hétérogènes.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 36 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Exemple:
Choisir deux classes de première année de l’EHTP
pour étudier l’intégration des jeunes étudiants à
l’école.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 37 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Échantillon aléatoire systématique : Cette


méthode consiste à dresser la liste de tous les
éléments de la population (la base de sondage) et
de choisir au hasard chaque n e élément pour
constituer l’échantillon.

L’échantillonnage systématique est donc une


variante de la méthode aléatoire simple, dans
laquelle on sélectionne un échantillon à intervalles
prédéterminés.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 38 / 88
Méthodes d’échantillonnages Méthodes aléatoires

Méthodes aléatoires

Exemple:
À partir de la liste des noms de tous les élèves d’un
collège, un conseiller pédagogique choisit au hasard un
premier nom puis, à partir de ce nom, il choisit
chaque 20e nom qui suit pour constituer l’échantillon.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 39 / 88
Étude de la taille d’échantillon

3. Étude de la taille
d’échantillon

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 40 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

L’étude de la taille d’échantillon consiste à trouver un


compromis entre la précision de représentativité de
l’échantillon et la minimisation de coût du sondage.

Autrement dit, la taille de l’échantillon doit être celle


qui permet d’atteindre le meilleur équilibre entre les
erreurs d’échantillonnage, et le coût de
l’échantillonnage lui-même.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 41 / 88
Étude de la taille d’échantillon

L’inégalité de Bienaymé-Tchebycheff est un résultat


qui permet de montrer qu’une variable aléatoire
prendra avec une grande probabilité une valeur
relativement proche de son espérance.

Cette inégalité n’est utilisée que si la loi de la variable


aléatoire considérée est complètement inconnue. Elle
aboutit à des échantillons de taille élevée.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 42 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Proposition: Inégalité de Bienaymé-Tchebycheff


Étant donnée une variable aléatoire X d’espérance
E[X ] = µ et de variance finie var(X ) = σ 2 , pour tout
réel strictement positif ε :

σ2
P (|X − µ| < ε) ≥ 1 − 2
ε

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 43 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Cette inégalité signifie que pour une variable dont on


ne connaît pas le comportement, dont on connaît (ou
on peut estimer) la moyenne (l’espérance) et la
dispersion (la variance), on peut trouver un
encadrement, dit intervalle de fluctuation, tel
qu’on ait une chance mesurée que la valeur vraie de la
variable soit dans cet intervalle :
σ2
µ−ε < X < µ+ε avec une probabilité d’au moins 1− 2
ε

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 44 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Dans le cas où les paramètre de la population ne sont


pas connus, cette inégalité peut servir (dans le cadre
de la théorie de l’estimation et non pas dans le cadre
d’échantillonnage cette fois-ci) de déterminer un
encadrement, dit intervalle de confiance, de ces
paramètres :

σ2
X −ε < µ < X +ε avec une probabilité d’au moins 1− 2
ε

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 45 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

En guise de terminologie, ε est dite marge d’erreur


σ2
tolérée et 1 − 2 noté 1 − α est dit seuil de
ε
confiance où α est dit seuil de risque ou risque
d’erreur.

En pratique, on prend des seuils de confiance de 95%


à 99%, soit avec un risque d’erreur de 5% à 1%.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 46 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Remarque
Pour retenir d’une manière simple la différence entre
un intervalle de fluctuation et un intervalle de
confiance :
Lorsque la proportion théorique d’une population
est connue et on veut décider sur la fréquence
réelle (par exemple dans le but de juger si un dé
est régulier ou pas), alors on se sert de l’intervalle
de fluctuation pour évaluer (par encadrement) la
fréquence observée par rapport à la proportion
théorique.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 47 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Remarque
Lorsque la proportion théorique d’une population
est inconnue mais on dispose d’une fréquence
observée, alors on se sert de l’intervalle de
confiance pour estimer (par encadrement) la
proportion théorique à l’aide de la fréquence
observée.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 48 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Exemple:
La probabilité de la réalisation d’un événement est
supposée être égale à p. On considère les échantillons
de taille n extraits, avec remise, d’une population de
taille N supposée infinie ou très grande. À chaque
échantillon extrait correspond une variable aléatoire
de fréquence Fn de réalisation de l’événement
considéré tels que :
E[Fn ] = p
p(1 − p)
var(Fn ) =
n
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 49 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Le seuil de confiance s’écrit dans ce cas :


σ2 p(1 − p)
1−α=1− 2 =1−
ε nε2

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 50 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

ainsi, une caractérisation de la taille de l’échantillon


est donnée par :
p(1 − p)
n=
αε2
Ainsi, pour une proportion théorique connue de 0.5 et
pour un risque d’erreur α = 5% et une marge d’erreur
tolérée à 3%, la taille d’échantillon requise pour que
l’échantillonnage soit représentatif est de
0.25
n = 0.09×0.05 = 55.56, soit n = 56.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 51 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Remarque
Un traitement plus avancé, utilisant un coefficient dit
score Z, peut être effectué lorsque la loi de probabilité
de la variable Fn est connue.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 52 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon


Définition: Convergence en probabilité
On dit qu’une suite (Xn )n≥1 de variables aléatoires à
valeurs dans R converge en probabilité vers la
variable aléatoire X à valeurs dans R, si :

∀ε > 0 , lim P (|Xn − X | ≥ ε) = 0


n→+∞

P
On note ainsi : Xn −−−−−→ X
n→+∞

Ceci est équivalent à dire que :


∀ε > 0 , lim P (|Xn − X | < ε) = 1
n→+∞ . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 53 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon


Théorème: Loi faible des grands nombres
Soit une suite (Xn )n≥1 de variables aléatoires à valeurs
dans R indépendantes et de même loi, admettant une
2 1∑n
espérance µ et une variance σ . Soit X n = Xi ,
n i=1
alors X n converge en probabilité vers µ, c’est-à-dire :
( )
∀ε > 0 , lim P |X n − µ| < ε = 1
n→+∞

Concrètement, ce théorème signifie que plus n est


grand plus la variable aléatoire X n se rapproche de
l’espérance mathématique µ. .
.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

Dr Khalil Amine (EHTP, Casablanca) [email protected] 54 / 88


Étude de la taille d’échantillon

Étude de la taille d’échantillon

Exemple:
On lance un dé. Si on obtient 6, c’est gagné et on
marque 1 point. Sinon, c’est perdu et on marque 0
point.
Soit Xi la variable aléatoire correspondant au nombre
de points obtenu lors du ième lancer.
5 1
On a donc : P(X = 0) = , P(X = 1) = et
6 6
1
E[X ] = .
6

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 55 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Exemple: (suite)
On répète n fois cette même expérience, les n
variables aléatoires X1 , X2 , . . . , Xn ont la même loi de
probabilité.
Pour connaître le nombre de succès, on étudie la
variable aléatoire X n : “Fréquence des succès”
Nombre de succès
avec X n = =
Nombre d’expériences aléatoiress
1
(X1 + X2 + · · · + Xn ).
n
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 56 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon


1
Normalement, on devrait trouver X n = .
6
Pour n = 3 par exemple, il y a peu de chance
1
pour que l’on trouve S3 = .
6
1
Pour n = 30, la probabilité de trouver S30 =
6
augmente sans être très forte.
Pour n = 1000, on se rapproche de cette valeur
1
de .
6
Le théorème dit que plus n est grand, plus X n se
1
rapproche de la valeur théorique .
6 .
.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

Dr Khalil Amine (EHTP, Casablanca) [email protected] 57 / 88


Étude de la taille d’échantillon

Étude de la taille d’échantillon

Théorème: Loi forte des grands nombres


Soit une suite (Xn )n≥1 de variables aléatoires à valeurs
dans R indépendantes et de même loi, admettant une
1∑n
espérance µ et une variance σ 2 . Soit X n = Xi ,
n i=1
alors X n converge presque sûrement vers µ,
c’est-à-dire il existe un événement A de probabilité 1
tel que :

∀ω ∈ A , lim X n (ω) = µ
n→+∞

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 58 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Interprétation:
Si on répète une même expérience un grand nombre
de fois de manière identique et que l’on regarde le
nombre de fois où un résultat r apparaît, la loi forte
des grands nombres montre que la fréquence
empirique d’apparition de r tend vers la probabilité
de r quand le nombre d’expériences tend vers l’infini.

Par exemple, si on lance une pièce équilibrée un grand


nombre de fois, la suite des fréquences relatives des
piles que l’on obtient tend avec probabilité 1 vers 50%.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 59 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Théorème: Théorème central limite


Soit X1 , X2 , . . . , Xn n variables aléatoires
indépendantes ayant même espérance µ et même
2 1∑ n
variance σ et soit X n = Xi , alors pour n
n i=1
suffisamment ( grand, ) X n suit approximativement la loi
2
σ
normale N µ, .
n

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 60 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Remarque
Dans la plupart des cas, on considère que n est
“suffisamment grand” lorsque n atteint quelques
dizaines, par exemple lorsque n ≥ 30, mais cela
dépend de la nature, de la population et du contexte
de l’étude.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 61 / 88
Étude de la taille d’échantillon

Étude de la taille d’échantillon

Remarque
Le théorème central limite repose sur la notion de
convergence en loi. En effet, dire que (X n suit)
σ2
approximativement la loi normale N µ, est
n
équivalent à dire que la variable aléatoire Xn converge
en loi vers une variable aléatoire qui suit la loi
normale.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 62 / 88
Distributions d’échantillonnage

4. Distributions
d’échantillonnage

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 63 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage

On se situe dans le cas d’un échantillonnage aléatoire


simple. Étant donné une population de taille N et une
variable aléatoire X d’espérance E[X ] = µ et de
variance var(X ) = σ 2 . On considère n variables
aléatoires X1 , X2 , . . . , Xn indépendantes et de même
loi que X telle qu’une ième observation xi peut être
considérée comme une observation de la variable
aléatoire Xi .

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 64 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage

On dit que les variables aléatoires (X1 , X2 , . . . , Xn )


constituent un échantillon ej et toute application
définie sur l’échantillon est dite statistique.
La variable aléatoire espérance (moyenne) de
1∑ n
l’échantillon ej : X nj = Xi
n i=1
La variable aléatoire variance de l’échantillon ej :
1∑ n ( )2
Σ2nj = Xi − X n
n i=1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 65 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage

La variable√aléatoire écart-type de l’échantillon


1∑ n ( )2
ej : Σnj = Xi − X n
n i=1
La variable aléatoire fréquence de l’échantillon
1∑ n
ej : Fnj = fi
n i=1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 66 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage

Si, d’une population, on prélève tous les échantillons


possibles de taille n : e1 , e2 , . . . , on peut définir des
nouvelles variables aléatoires qui présentent des séries
statistiques des variables aléatoires (moyenne,
variance, écart-type, fréquence, . . . ) pour chaque
échantillon ei : X ni , Σ2ni , Σni et Fni .

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 67 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage
On dit alors qu’on est en présence d’une distribution
d’échantillonnage, ou d’une loi
d’échantillonnage, concernant la caractéristique
étudiée. Ainsi on définit :
distribution
( d’échantillonnage
) de la moyenne :
X n = X n1 , X n2 , . . .
distribution
( 2 d’échantillonnage
) de la variance :
2 2
Σn = Σn1 , Σn,2 , . . .
distribution d’échantillonnage de l’écart-type :
Σn = (Σn1 , Σn2 , . . . )
distribution d’échantillonnage de la fréquence :
Fn = (Fn1 , Fn2 , . . . ) . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 68 / 88
Distributions d’échantillonnage

Distributions d’échantillonnage

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 69 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Proposition: Distribution de moyennes


Étant donnés une population et une variable aléatoire
X d’espérance E[X ] = µ et de variance var(X ) = σ 2 .
Pour toute distribution de moyennes X n issue
d’échantillonnage de taille n, on a :
1. Si on considère une population infinie ou finie
avec remise, alors :
E[X n ] = µ
σ2
var(X n ) =
n

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 70 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Proposition: Distribution de moyennes


2. Si on considère une population finie sans remise,
alors :
E[X n ] = µ √
σ N −n
σ(X n ) = √
n N −1
N −n
La valeur est appelée coefficient
N −1
d’exhaustivité ou coefficient de correction.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 71 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Remarque
N −n
Le premier cas dérive du fait que lim =1
N →+∞ N − 1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 72 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Proposition: Convergence en loi de probabilité


Si on est en présence de l’un des deux cas :
1 La variable aléatoire X suit une loi de probabilité
quelconque sur la population avec E[X ] = µ et
var(X ) = σ 2 et on y prélève des échantillons de
taille n tel que n ≥ 30.
2 La variable aléatoire X suit une loi normale de
paramètres E[X ] = µ et var(X ) = σ 2 , c’est-à-dire
que X ∼ N (µ, σ 2 ) sur la population et on y
prélève des échantillons de taille n quelconque.
( ) ( )
Alors : X n ∼ N (E X n , var X n ) .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 73 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Autrement dit : ) (
σ2
Cas infini : X n ∼ N µ,
n
( )
σ2 N − n
Cas fini : X n ∼ N µ, ×
n N −1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 74 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Exemple:
Une machine fabrique des pièces en grande série. À
chaque pièce tirée au hasard, on associe sa longueur
exprimée en millimètres ; on définit ainsi une variable
aléatoire X .
On suppose que X suit la loi normale
N (28.20, 0.0272 ).
Soit X n la variable aléatoire qui à tout échantillon
aléatoire de taille n associe la moyenne des longueurs
des n pièces de l’échantillon.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 75 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes

Exemple (suite):
La propriété nous dit ( alors que) pour n(assez grand, 2X)n
2
σ 0.027
suit la loi normale N µ, soit N 28.20, .
n n
Supposons que les échantillons soient de taille 100,
alors X 100 suit la loi N (28.20, 0.00272 ).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 76 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des moyennes

Distribution d’échantillonnage des moyennes


Exercice:
Une machine fabrique des pièces dont la longueur X
suit une loi normale de moyenne 60 mm et
d’écart-type 4 mm. Dans le but de contrôler la
production, on tire des échantillons de 25 pièces.

Soit X 25 la variable aléatoire qui à chaque échantillon


de taille 25 associe la moyenne de la longueur de cet
échantillon.
1. Quelle est la loi de probabilité que la variable
aléatoire X 25 peut suivre?
2. Calculer la probabilité pour que la longueur
moyenne dans l’échantillon soit supérieure ou .
.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

Dr Khalil Amine (EHTP, Casablanca) [email protected] 77 / 88


Distributions d’échantillonnage Distribution d’échantillonnage des variances

Distribution d’échantillonnage des


variances

Proposition: Distribution de variances


Étant donnés une population et une variable aléatoire
X d’espérance E[X ] = µ et de variance var(X ) = σ 2 .
Pour toute distribution de variances Σ2n issue
d’échantillonnage de taille n, on a :
n−1 2
E[Σ2n ] = σ
n
n−1
var(Σ2n ) = ((n − 1)µ4 − (n − 3)σ 4 )
n3
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 78 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des variances

Distribution d’échantillonnage des


variances

Remarque
var(Σ2n ) −→ 0 lorsque n → +∞

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 79 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Proposition
Étant donnés une population et une variable aléatoire
X d’espérance E[X ] = µ et de variance var(X ) = σ 2 .
Pour toute distribution de fréquences Fn issue
d’échantillonnage de taille n, on a :
1. Si on considère une population infinie ou finie
avec remise alors :
E[Fn ] = p
p(1 − p)
var(Fn ) =
n

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 80 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Proposition
2. Si on considère une population finie sans remise
alors :
E[Fn ] = p
p(1 − p) N − n
var(Fn ) = ×
n N −1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 81 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Proposition: Convergence en loi de probabilité


Si on est en présence de l’un des deux cas :
1 La variable aléatoire X suit une loi de probabilité
quelconque sur la population avec E[X ] = µ,
var(X ) = σ 2 et de fréquence p. On y prélève des
échantillons de taille n tel que n ≥ 30.
2 La variable aléatoire X suit une loi normale de
paramètres E[X ] = µ et var(X ) = σ 2 , c’est-à-dire
que X ∼ N (µ, σ 2 ), sur la population et on y
prélève des échantillons de taille n quelconque.
Alors : Fn ∼ N (E[Fn ], var(Fn ))
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 82 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Autrement dit : ) (
p(1 − p)
Cas infini : Fn ∼ N p,
n
( )
p(1 − p) N − n
Cas fini : Fn ∼ N p, ×
n N −1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 83 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Exemple:
Une urne contient 100 boules numérotées de 1 à 100,
indiscernables au toucher. Lors d’un tirage aléatoire
d’une boule, la probabilité d’obtenir un nombre
inférieur ou égal à 37 est p = 0.37. On appelle succès
l’événement qui consiste à tirer une des boules
numérotées de 1 à 37.

Un échantillon de taille 50 est obtenu par un tirage


aléatoire, avec remise, de 50 boules. On s’intéresse à
la fréquence d’apparition d’un succès lors du tirage de
ces 50 boules.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 84 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Exemple (suite):
Soit F50 la variable aléatoire qui à chaque échantillon
de taille 50 associe sa fréquence de succès.

Xi est la variable aléatoire qui à chaque échantillon


associe 1 si la ième boule apporte un succès, 0 sinon.

Les Xi sont des variables aléatoires indépendantes et


suivent la même loi de Bernoulli de paramètre
p = 0.37 d’espérance E(Xi ) = 0.37 et de variance
var(X ) = p(1 − p) = 0.23.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 85 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Exemple (suite):
X1 + X2 + · · · + X50
On a F50 = qui a pour espérance
50
mathématique p = 0.37 et pour variance
0.37 × 0.63
= 0.004.
50
Remarquer qu’ici, les fréquences fn ont été mesurées
par le biais de variables aléatoires Xi qui suivent la loi
de Bernouilli.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 86 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distribution d’échantillonnage des fréquences

Exercice:
Une machine produit des pièces. D’une façon
générale, elle produit 3% de pièces mauvaises. Un
client reçoit une caisse de 500 pièces, en provenance
directe de la machine.
1. Quelle est la probabilité pour qu’il trouve moins
de 1% des pièces mauvaises à l’intérieur de la
caisse
2. Quelle est la probabilité pour qu’il trouve plus de
5% des pièces mauvaises à l’intérieur de la caisse
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Dr Khalil Amine (EHTP, Casablanca) [email protected] 87 / 88
Distributions d’échantillonnage Distribution d’échantillonnage des fréquences

Distributions d’échantillonnage
Exercice:
On considère une population composée d’un grand nombre
d’individus susceptibles de posséder un caractère A. Dans le but
de faire une étude sur cette population, on prélève des
échantillons de n = 2500 personnes.
Soit X le nombre d’individus ayant le caractère A dans cet
échantillon. La variable aléatoire X suit une loi de moyenne 5 et
de variance 1502 .
Soit X n la variable aléatoire qui à chaque échantillon associe la
moyenne de X de cet échantillon.
1. Quelle est la loi de probabilité que la variable aléatoire X n
peut suivre?
2. Calculer la probabilité pour que le nombre moyen
d’individus X n dans l’échantillon soit inférieur à 8
. . . . . . . . . . . . . . . . . . . .

3. Calculer la probabilité pour que le nombre moyen


Dr Khalil Amine (EHTP, Casablanca) [email protected]
. . . . . . . . . . . . . . . . . .
88 / 88
. .

Vous aimerez peut-être aussi