POPULATION ET ECHANTILLON
Quels critères retenir pour mener à bien une enquête ou une étude
sur des bases statistiques solides
POPULATION DE REFERENCE
La population de référence est l’ensemble exhaustif des
« individus statistiques » permettant de répondre aux
objectifs qui ont motivé la mise en place de l’étude
POPULATION DE TRAVAIL
La « population de travail » est l’ensemble des
individus statistiques qui va permettre de réaliser
dans les meilleures conditions scientifiques possibles
4 grands critères de choix :
1. objectif de l’étude
2. hypothèses de travail
3. type d’échantillonnage
4. contraintes externes
1 objectif de l’étude
Exemple : Enquête auprès des femmes sur des produits cosmétiques
Enquête auprès d’agriculteurs sur le prix des céréales
Enquête auprès des usagers de la RATP
2 hypothèses de travail
Exemple : relation entre lieu d’habitation et réussite scolaire
relation type d’établissement sanitaire et performance économique
3 type d’échantillonnage
La nature des documents disponibles peuvent restreindre la population à étudier
Exemple : on a besoin de l’adresse des interviewés, on devra donc utiliser
par exemple les listes électorales
uniquement population des plus de 18 ans
4 contraintes externes
Exemple : délais d’exécution de l’étude
raisons budgétaires
confidentialité de l’étude
CONSTRUCTION D’UN ECHANTILLON
Pourquoi ?
Rendre possible la réalisation de l’étude
Simplicité
Réduction des coûts
Conditions :
•L’échantillon doit être une partie représentative
de la population
•Il doit permettre de répondre aux objectifs de
l’étude de la même façon que si l’on travaillait
avec la population de référence
population
échantillon
Les méthodes d’échantillonnage
empiriques
probabilistes
Les méthodes empiriques
Les méthodes empiriques
Méthodes des quotas
on considère un nombre restreint de caractéristiques de la population
Population Échantillon
55% féminin 110 femmes
45% masculin 90 hommes
Les méthodes empiriques
Méthodes des unités-types
elle se base sur une segmentation de la population en groupes
homogènes et différents les uns des autres, puis sur le choix de
l’individus moyen de chaque groupe
G2 G3 G4
G1
G5 G6 G7 G8
Échantillon de 16 individus G9 G10 G11 G12
représentant le mieux les caractéristiques
moyennes de chaque groupe.
G13 G15 G16
G14
Les méthodes empiriques
Échantillon de convenance, boules de neige, volontaires...
Forces et faiblesses des méthodes
d’échantillonnage empiriques
Méthode Forces Faiblesses
Selon le jugement Coûts et rapidité. Subjectif. Pas de
généralisation.
De commodité Coûts et rapidité. Arbitraire. Pas de
généralisation.
Par quotas Lorsqu’on cherche Subjectif.
des profils Généralisation
spécifiques. artificielle.
Boule de neige Rareté des unités Biaisé. Long à
d’échantillonnage. administrer.
Les méthodes probabilistes
Les méthodes probabilistes
Toutes ces méthodes ont comme caractéristique que tous les individus
de la population de référence ont une chance identique de faire partie
de l’échantillon
Elles supposent l’utilisation d’un tirage au sort
1. connaissance complète de la population
2. identification des individus
3. tirage possible sur tous les individus
Quelques méthodes de tirage au sort
Tirage au sort simple
urne + boules identiques
système avec remise
Utilisation de tables de nombres aléatoires
numérotation des individus + détermination du point de départ
utilisation de la table
Utilisation de l’informatique
sur la base de la présentation du fichier et de l’utilisation d’une table
Méthode d’échantillonnage au hasard simple
On tire au sort dans la population de référence, suivant une des
méthodes exposées précédemment.
Méthode utilisée quand la population de référence est petite.
ou
Quant la stratification n’est pas possible
Méthode d’échantillonnage par stratification
Une strate est un regroupement homogène d’individus reliés par un caractère
commun lié à l’enquête
1. La population est découpée en sous-ensembles homogènes
2. Ces sous-ensembles sont exclusifs et exhaustifs
3. Chaque sous-ensemble est sondé par méthodes aléatoires
Il faut que chaque strate corresponde à un élément important compte tenu du
sujet de l’étude
Méthode d’échantillonnage par stratification
Exemple
Population Echantillon
Strate 1 2000 300
Strate 2 500 75
Total 2500 375
Méthode d’échantillonnage par grappes
On ne considère plus la population comme un ensemble d’individus
mais comme un ensemble de groupes d’individus
On tire au sort des groupes d’individus ou grappes
On interroge tous les individus appartenant à ces grappes
Échantillonnage par strates ou par grappes
Population
Strates Grappes
QUELLE METHODE ?
Détermination de la taille de l’échantillon
1. Déterminer la taille de l’échantillon implique des considérations
managériales et financières.
2. Il n’y a pas de relation entre la taille de la population et celle de
l’échantillon.
3. Plus la taille de l’échantillon est grande, plus la marge d’erreur
sera faible.
4. Il est possible, à partir d’un échantillon bien sélectionné,
d’atteindre un niveau de précision optimal.
5. Un questionnaire de haute qualité ne peut pas atténuer les effets
d’une mauvaise méthode d’échantillonnage.
Méthodes de détermination de la taille de l’échantillon
1. Par devinette. Méthode arbitraire qui ne repose sur aucun
fondement scientifique.
Méthodes de détermination de la taille de l’échantillon
2. Selon les normes de l’industrie. Technique utilisée lorsque
certains standards d’industrie existent (ex. n=300). Elle ne
repose sur aucun fondement scientifique.
Méthodes de détermination de la taille de l’échantillon
3. Selon le budget. Une entreprise peut sélectionner le nombre
de répondants selon le budget de recherche dont elle
dispose. Méthode courante en recherche marketing.
Méthodes de détermination de la taille de l’échantillon
4. Méthode statistique. La meilleure façon de déterminer la
taille de l ’échantillon. Repose sur des bases scientifiques.
LA TAILLE DE L’ECHANTILLON
La taille de l’échantillon dépend :
1. degré de précision
2. homogénéité de la population
3. nombre de croisement
4. du coût de l’enquête
1. degré de précision
Intervalle de confiance : marge d’erreur que la personne chargée de l’étude
accepte sur la proportion mesurée.
Exemple : si IE = 4% ce veut dire que l’on accepte que le résultat
sur la population soit égal au pourcentage de l’échantillon ± 2%
Seuil de probabilité : degré de confiance que le chargé d’études peut accorder
à la mesure souhaitée. En règle générale le seuil généralement admis est
de 95%
2. homogénéité de la population
Moins la population sera homogène, plus la taille de l’échantillon sera
importante
Exemple : si par rapport à une étude donnée on connait :
la proportion d’individus qui réalise un acte (30% = p)
la proportion de ceux qui ne le font pas (70% = 1-p)
différent si on ne connait rien de cette population
on devra alors se placer dans la situation la plus
défavorable (50% vs 50%)
3. nombre de croisement
Ne pas oublier que ces données peuvent être traitées statistiquement
Le nombre de croissement devient alors fondamental avec par exemple un
nombre minimum d’individus dans chacun des sous-groupes (Chi-deux,
effectifs théoriques > 5…)
Plus les croissements seront nombreux plus la taille de l’échantillon sera
importante.
4. du coût de l’enquête
Exemple : délais d’exécution de l’étude
raisons budgétaires
confidentialité de l’étude
Le calcul de la taille de l’échantillon
Échantillon aléatoire simple
(avec un intervalle de confiance de 95%)
(1,96) ( p ) (1 p )
2
n 2
( e)
n = taille de l’échantillon
p = proportion de réponses attendues
e = erreur maximale acceptable
LE CALCUL DE LA TAILLE DE L’ECHANTILLON
Échantillon aléatoire stratifié
n = taille de l’échantillon
pi = proportion de réponses attendues dans la strates i
wi = poids de la strate i
Ni = taille de la population de la strate i
N = taille de la population
D = (erreur max acceptable)2
(intervalle de confiance)2
LE CALCUL DE LA TAILLE DE L’ECHANTILLON
Échantillon aléatoire stratifié
effectif des strates
Forces et faiblesses des différentes
méthodes d’échantillonnage probabilistes
Méthode Forces Faiblesses
Aléatoire simple Généralisation. Nécessité d’un
cadre d’échantillonnage.
Aléatoire stratifié Généralisation. Identification de
strates
pertinentes.
Par grappes Généralisation. Pas d’avantages réels
par rapport à
l’aléatoire simple .
EXEMPLES DE CALCUL
DE LA TAILLE DE L’ECHANTILLON