100% ont trouvé ce document utile (2 votes)
1K vues129 pages

Cours de TPS

Transféré par

rodriguekambale046
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (2 votes)
1K vues129 pages

Cours de TPS

Transféré par

rodriguekambale046
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Cours des théories et pratique de sondage

Pr John Ndala,PhD
PLAN DU COURS

INTRODUCTION GENERALE
CHAP 1 : L’ANALYSE ET LA DESCRIPTION DES
DONNEES
CHAP 2 : LES METHODES DE SONDAGE
CHAP 3 : INTERPRETATION DES SONDAGES
ALEATOIRES
CHAP 4 : PRATIQUE DES SONDAGES
John Ndala
OBJECTIFS DU COURS
Objectifs généraux
• Être capable de concevoir et d'interpréter de façon critique une
enquête descriptive et explicative.
• Décrire les différentes méthodes d’échantillonnage
• Préciser l’intérêt et les limites de chacune d’entre elles
• Être capable de choisir un échantillon de manière judicieuse avant
de réaliser le plan de sondage
• Savoir présenter les résultats d’un sondage, donner par exemple des
marges d’erreurs (ou un niveau de confiance)
• Être capable de réaliser un questionnaire
John Ndala
OBJECTIFS DU COURS
Objectifs spécifiques
À la fin du cours, l’étudiant devra être à même
• Connaitre les principes des méthodes de sondage et savoir estimer la
précision d'un sondage,
• Savoir discuter la représentativité d'un échantillon,
• Savoir rédiger le protocole d'une investigation en Sciences de
Gestion,
• Savoir calculer un nombre de sujets nécessaire dans une étude
descriptive et explicative,
• Utiliser les méthodes et techniques de base du recueil des données.
John Ndala
Pré requis
Les différents thèmes de la statistique
abordés en première et deuxième année de
licence sont nécessaires à la compréhension
de ce cours.
Plus précisément les notions de variables
aléatoires, biais et variance d’un estimateur
ainsi que d’intervalle de confiance doivent
être maitrisées
John Ndala
Introduction Générale

Nous savons déjà qu’il est difficile d’observer


les unités constituant une population statistique,
et le cas est fréquent lorsque la population en
question est d’effectif élevé.
L’étude complète peut demander beaucoup de
temps, ou coûter très cher ; elle peut détruire les
unités observées tout comme être impossible à
réaliser.
JOHN NDALA
Introduction Générale

Partir d’une population mère (N) l’échantillon(n) :

Paramètres
Estimations

JOHN NDALA
Introduction

Le statisticien est donc contraint de procéder à un


sondage.
Il extrait de la population complète un certain
nombre d’unités, nombre qu’il souhaite le plus élevé
possible, unités sur lesquelles portera son étude.
C’est une fraction de la population totale, fraction
que l’on nomme échantillon que le statisticien
calculera les caractéristiques qui l’intéressent :
Moyenne arithmétique, médiane, écart-type,
coefficient de corrélation et de détermination…
JOHN NDALA
La statistique descriptive, le calcul des probabilités, la statistique
mathématiques et d'autres cours connexes donnent aux chercheurs
que nous sommes, une démarche, une technique pour résoudre le
problème de gestion quel que soit le domaine.

La plupart des décisions de l’entreprise reposent sur des données


collectées sur le marché, les clients, la concurrence …Mais le plus
souvent, ces analyses sont simplistes, limitées, voire biaisées :
D’une part, parce qu’elles se limitent à des analyses
descriptives et non pas explicatives des phénomènes
observées,
D’autre part, parce qu’elles ne s’assurent pas toujours des
conditions de validité et de fiabilité des résultats.
John Ndala
Le problème consiste à déterminer à partir des
informations fournies par un échantillon certaines
caractéristiques de la population d'où est extrait cet
échantillon. En d'autres termes, les résultats obtenus auprès de
l'échantillon représentatif choisi seront extrapolés à l'ensemble
de cette population qu'elle représente.

En règle générale, il est intéressant d'avoir les données


les plus exhaustives possibles sur une population c'est
un moyen d'avoir une représentation, un portrait de
plus fiable possible de cette population que l'on
étudie. John Ndala
avantages et inconvénients de l’étude par sondage

L’étude d’une population complète : son principal intérêt


est l'exhaustivité et donc la précision l'information, son
principal défaut c'est son coût et sa lourdeur dans sa
gestion administrative, délais très longs.
L’étude à travers un échantillon a pour principal avantage
d'être moins coûteux et de donner une image assez fiable
grâce aux techniques statistiques de l'ensemble de la
population, son inconvénient majeur c'est que l'erreur
d'échantillonnage remet en question la fiabilité de l'image.

JOHN NDALA
Les questions auxquelles nous tenterons de répondre dans ce cours :

Comment transposer un problème managérial en modèle


d’analyse ?
Comment construire un échantillon partant d’une population
mère ?
Comment améliorer la validité et la fiabilité des données ?
Quelle approche mobiliser pour décrire les résultats d’une
enquête ?
Comment synthétiser les données collectées ?
Comment communiquer les résultats ?
JOHN NDALA
CHAP II : ANALYSE DES DONNEES

Une bonne décision consiste à choisir la plus optimale des


solutions parmi une série d’alternatives. Mais les bonnes
décisions n’arrivent pas par hasard : elles doivent être
fondées sur des informations fiables et valides.
Les pratiques de sondage ont pour but d’aider les responsables à
résoudre un problème spécifique, à contrôler ses performances, à
planifier les décisions.
Leur objectif est de lier l’entreprise à son environnement en
développant des instruments de mesure, en collectant et en analysant
des données, et en communiquant les résultats et leur interprétation.
JOHN NDALA
Parmi les techniques les plus largement utilisées, on peut retenir :

L’étude ad hoc: étude quantitative ou qualitative réalisée pour le compte d’un seul client,
L’étude omnibus: étude quantitative réalisée à date régulière. Le questionnaire regroupe
l’ensemble des questions de différents souscripteurs,
Le baromètre: étude réalisée à date fixe comme l’omnibus, mais avec le même questionnaire
d’une étude à l’autre, pour le compte d’un ou de plusieurs clients,
Le panel: investigation approfondie réalisée périodiquement pour plusieurs clients. Les
interviewés sont identiques d’une vague à l’autre. Il s’appuie sur des échantillons importants,
Le marché-test: étude quantitative visant à prévoir les ventes et parts de marché d’un nouveau
produit; on parle également de marché-test pour des observations de type expérimental en
magasin
L’entretien individuel: étude qualitative dont l’objectif est de recueillir le discours individuel.
On distingue l’entretien non directif (libre propos), semi-directif (intervention et thèmes),
directif (guide d’entretien strict, questions ouvertes), associatif ou projectif (analogie,
associations de mots, compléments de phrases, jeux de rôle, etc.)
JOHN NDALA
Ces techniques peuvent s’orienter en deux approches :

Approche Objectifs Limites


Qualitative Répertorier Généralisation des résultats
Explorer
Générer
Comprendre

Quantitative Dénombrer Biais déclaratifs


Hiérarchiser Mémorisation des répondants
Pondérer
Résumer
JOHN NDALA
Ce qu’il faudra retenir sur le deux approches :

Les études qualitatives sont utilisées dans une dimension


principalement exploratoire, afin de comprendre en profondeur. Elles
permettent d’accéder à une étude approfondie grâce notamment aux
entretiens et aux réunions de consommateurs, et d’accéder plus
profondément à l’explication de ces comportements, en levant le voile
sur des facteurs inconscients (le non-verbal, le « non-dit »).
Une étude quantitative vise avant tout de mesurer, de quantifier et de
permettre de généraliser les résultats à partir de l’échantillon de la
population concernée. Ce type d’étude repose généralement sur un
grand nombre d’observations et sur des informations structurées
(valeurs numériques, échelles ou valeurs nominales) par opposition aux
informations non structurées (discours, texte libre/questions ouvertes,
etc.). JOHN NDALA
Trois types d’études quantitatives peuvent être distingués, en fonction du
contexte de découverte de l’information : décrire, expliquer, prédire.
Les études descriptives sont fondées sur des mesures dont le but est de collecter
des données brutes afin de créer des structures décrivant les caractéristiques
d’une population cible ou d’un marché.

Les études explicatives ont pour objet de transformer des données


brutes en structures expliquant des relations de causalité entre deux
ou plusieurs variables.
Les études prédictives, quant à elles, ont pour objet de transformer
les données brutes collectées sur les caractéristiques
comportementales des consommateurs ou des entreprises/ marchés
pour créer des modèles prédictifs à des fins d’optimisation
John Ndala
DES DONNEES AUX VARIABLES

La plupart des entreprises sont aujourd’hui noyées


sous l’information mais elles ont soif de connaissance.
C’est la capacité de l’analyste à mettre en œuvre une
démarche analytique qui permet de créer, de gérer et
de diffuser cette connaissance dans l’organisation.
Ce processus repose sur trois concepts que nous
allons maintenant définir : les données, l’échantillon
et les variables.
JOHN NDALA
1. Types des données
Les types de données en gestion sont en général identifiés en fonction de leur source. Ainsi, on distingue les données
secondaires et les données primaires.

A. Les données secondaires sont des données qui ont été collectées préalablement à l’étude,
pour répondre à d’autres problèmes, ce qui peut fortement en limiter la pertinence et la
précision. Elles sont cependant d’un accès facile et leur coût est relativement faible.

On distingue les données secondaires internes, issues de l’entreprise (reportings, intranet,


données comptables, informations émanant des salariés…) et les données secondaires
externes, issues de l’environnement de l’entreprise.

Les panels ont considérablement évolué ces dernières années : gains de restitution de l’information,
amélioration de la couverture des circuits de distribution (données de panels et données issues du scanning en
sortie de caisse), offre enrichie (information accessible en ligne, analyses spécifiques des variables du mix et
de leur performance).
les panels de consommation, les access panels (ou panels de consommateurs), les access
panels on-line, les panels de distributeurs (ou panels de détaillants) et les panels
d’audience. John Ndala
B.Les données primaires
Les données primaires sont spécialement collectées
pour répondre à une étude statistique précise.
Elles s'opposent aux données secondaires. Ces dernières
sont des données qui existent déjà au moment de votre
étude et qui ont été collectées pour des raisons qui peuvent
être différentes de celles de votre étude.
Il s’agit de données brutes, qui doivent être préparées,
analysées puis interprétées.
John Ndala
2. L’échantillon
Afin de bien illustrer les étapes d’un plan de sondage, un petit détour historique peut s’avérer intéressant. Tout commence
aux États-Unis, lorsque Franklin D. Roosevelt se représente contre Alf Landon aux élections de 1936

Derrière les candidats, deux hommes s’affrontent pour pronostiquer le résultat de ces élections. D’une part Codely,
rédacteur en chef du Literary Digest, utilise la technique du vote de paille (straw vote) : quelques jours avant les élections, il
fait paraître des bulletins de vote dans son journal et demande à ses lecteurs de mentionner leur choix. Il reçoit 2,4 millions
de réponses et donne Landon gagnant. D’autre part, Gallup, créateur de l’institut éponyme, n’interroge que 4 000 personnes
et joue Roosevelt gagnant.

La victoire de ce dernier marque la naissance des instituts de sondage. Gallup est le père de
l’échantillon représentatif, le premier à avoir eu l’idée de reconstituer une population en
miniature
 Un échantillon est une fraction représentative d’une population d’une population,
l’échantillon est censé représenter l’ensemble de la population étudiée. Il représente une
estimation de la population totale.
 La théorie de l’échantillonnage consiste à considérer qu’une partie de la population peut
parfaitement représenter l’opinion de l’ensemble de la population
 Cette procédure comporte trois éléments :la définition de l’unité de sondage, la taille de
l’échantillon et le choix des individus qui feront partie de l’échantillon
John Ndala
L’échantillon peut se présenter sous trois formes essentielles à savoir :

Un échantillon exhaustif :si sa taille est égale à celle de la


population de base

Un échantillon représentatif :tout échantillon obtenu par une


méthode probabiliste(démarche logique, préalable qui permet de ne
pas biaiser l’échantillon(c’est-à-dire introduire un risque d’erreur)

Un échantillon systématique :dans ce cas, le choix des unités de


sondage est réalisé à partir d’une procédure systématique. Elle
consiste à prendre dans la base de sondage organisée en liste, une
unité de sondage John Ndala
Deux méthodes principales sont utilisées, dont l’objectif est de
sélectionner un échantillon assurant la meilleure précision possible
des résultats au moindre coût.

Les méthodes probabilistes, dans laquelle chaque individu de la


population concernée a une probabilité connue d’appartenir à
l’échantillon, permet d’obtenir des échantillons représentatifs.
Généralement utilisée sur de grands échantillons, elle s’avère très
coûteuse (l’Insee, par exemple, la pratique en France)

Les méthodes non probabilistes(ou méthodes empiriques)


permettent de constituer un échantillon résultant d’un choix raisonné
qui vise à le faire ressembler à la population dont il est issu.
John Ndala
Les méthodes de sondage :

Tirage au hasard

Échantillons probabilistes
Échantillon stratifié
Échantillon en grappe et l’échantillon
à plusieurs degrés

Méthodes des itinéraires


Échantillons non probabilistes JOHN NDALA
Échantillon de convenance
Tirage au hasard : l’échantillon aléatoire consiste à tirer au hasard un
individu de la population avec une probabilité connue et différente
de zéro d’appartenir à l’échantillon.

John Ndala
Échantillonnage stratifié : dans le cas où les variables étudiées sont fortement
dispersées, c’est-à-dire dans ceux où des classes seraient sous- ou
surreprésentées en raison du tirage au hasard, il peut s’avérer utile d’utiliser
des variables dites de stratification, qui permettent de réaliser une répartition
de la population en classes appelées « strates ».

Échantillonnage par grappe


Des sondages réalisés sur des groupes complets d'individus
La population source est subdivisée naturellement en groupes (La
composition des grappes est antérieure au plan de sondage)
Un certain nombre de ces groupes va être sélectionné
aléatoirement pour composer l'échantillon.
Intérêt: lorsque l’accès à la liste des individus
composant la population d’étude n’est pas possible
John Ndala
Echantillonnage à plusieurs degrés -

Un sondage pour lequel plusieurs sélections aléatoires emboîtées sont


réalisées.
Intérêt: lorsque l’accès à la liste des individus composant la population d’étude
n’est pas possible John Ndala
Échantillonnage par quota :Cette méthode présente l’avantage de la simplicité
: on choisit quelques caractéristiques dont on connaît la distribution statistique
dans la population étudiée (par exemple, sexe, âge, catégorie
socioprofessionnelle [CSP] du chef de famille), puis on donne à chaque
enquêteur un plan de travail qui lui impose le respect de certaines proportions
au sein des interviewés.
John Ndala
Méthode des itinéraires (ou random route) : dans une commune, par exemple, on impose à
l’enquêteur un point de départ et un itinéraire à suivre, avec tirage systématique des
logements dans lesquels il doit effectuer des interviews (par exemple, interroger les foyers
toutes les trois portes dans un immeuble).
Échantillonnage de convenance : il est conçu par l’enquêteur pour des raisons
de praticité.
Il fait généralement appel à des personnes interceptées dans la rue, à la sortie
des caisses en magasin, etc.

Échantillonnage « boule de neige » : on choisit un premier groupe


de répondants, au hasard généralement, puis on leur demande
d’indiquer d’autres répondants potentiels appartenant à la
population ciblée. Cette méthode peut être utile pour des enquêtes
sur les leaders d’opinion par exemple.
John Ndala
Synthèse sur les deux approches

John Ndala
La détermination de la taille de l’échantillon

Un échantillon trop petit peut induire une perte d’informations importante ou empêcher
la réalisation de nombreux tests soumis à des contraintes en termes de nombre
d’observations.
À l’inverse, un échantillon trop important constitue une perte de temps et de budget
dommageable pour la réussite de l’étude.
Il est important de noter que la précision de l’information recueillie dépend
principalement de la taille de l’échantillon et non du taux de sondage (défini par le
rapport n/N, où n est la taille de l’échantillon et N celle de la population).
Pour trouver la taille adéquate de l’échantillon n une règle empirique facile à appliquer
– même si elle est contestable d’un point de vue purement statistique – consiste à partir
de l’erreur, exprimée en pourcentage, que l’on est prêt à tolérer :
n = 1/erreur2
Par exemple, si l’on accepte une erreur de +/–5 % au niveau de la précision des résultats,
on obtient une taille d’échantillon de 1/0,05 , soit 400 répondants.
2 NDALA
JOHN
La succession des étapes dans une enquête

JOHN NDALA
La détermination de la taille de l’échantillon: Préalables

Soit les variables ci-après :


• N : Taille de la population mère
• n : Taille de l'échantillon pour une population mère
• n2 : Taille de l'échantillon corrigée
• t : Coefficient de message déduit du taux ou Seuil de confiance que l'on
souhaite garantir sur la mesure
• e : Marge d'erreur que l'on se donne pour la longueur que l'on veut estimer
• p : proportion (connue ou supposée, estimée à 0,5 si elle n’est pas donnée)
• q : degré de non homogénéité de la population donc q=1-p

JOHN NDALA
Les causes des erreurs ou incertitudes dans les enquêtes de sondage

Toutes les données recueillies, aussi bien à partir d’un échantillon que de la base complète,
sont affectées de types variés d’incertitude pouvant provenir du questionnaire, des
enquêteurs, des mesures physiques ou de données extraites de documents existants. Les
différences essentielles entre un sondage et un recensement sont les suivantes :

a) le sondage peut être réalisé avec plus de soin et fournir des informations auxquelles on
peut accorder une plus grande confiance,

b) les résultats du sondage peuvent être affectés par des erreurs aléatoires
d’échantillonnage mais celles-ci peuvent être estimées à partir des observations.
John Ndala
Classification des causes d’erreurs dans les enquêtes
Causes d’erreurs dues à l’organisation du plan d’enquête et aux méthodes de
réalisation

• - L’information utile à recueillir n’a pas été suffisamment précisée. Le


questionnaire est mal présenté (questions mal rédigées, ordre des questions),

• - Les unités d’échantillonnage ne sont pas définies de manière assez précise.

• - La base ne contient pas certaines classes importantes de la population.


• - La date de l’enquête est mal choisie.
John Ndala
Classification des causes d’erreurs dans les enquêtes
Erreurs dues aux imperfections et maladresses dans la réalisation de l’enquête sur le terrain

• - Couverture incomplète de l’échantillon.

• - Mauvaise interprétation de l’unité d’échantillonnage (oubli de certains éléments


d’unités complexes ou au contraire, extension à des éléments étrangers à l’enquête,
remplacement d’unités pré- vues par d’autres).

• - Questionnaire non scrupuleusement respecté.

• - Erreurs matérielles diverses (comptages, calculs, transcription… )

• - Non-réponses et refus. John Ndala


Classification des causes d’erreurs dans les enquêtes
• Erreurs aléatoires d’échantillonnage : il s’agit des variations aléatoires dues :

• - aux différences entre les unités de la base dont l’échantillon a été

tiré,

• - aux variations accidentelles au cours du temps de tous ceux qui


participent à l’enquête et aux différences qui existent entre eux.

John Ndala
Formules de calcul pour déterminer la taille de l’échantillon :

I. Population mère infinie :Cas de l'échantillon indépendant (non exhaustif)


n=
II. Population mère finie: Cas de l'échantillon exhaustif
Lorsque le taux d'échantillon est supérieur à 1/7 de la population mère, n taille de
l'échantillon déterminée précédemment qui doit être corrigée à n 2
n2 = n.
n2 = .
e= t
n= où p = 0,5 et q =1-p=0,5

JOHN NDALA
Formules de calcul pour déterminer la taille de l’échantillon :

Pour un Niveau (ou Taux) de confiance s = 95% (niveau très souvent utilisé),
donc t = 1.96 :

JOHN NDALA
Formules de calcul pour déterminer la taille de l’échantillon :

Formules approximatives :
n≥
e≥t
III. BIAIS D'ECHANTILLONAGE - PLAN D'ECHANTILLONNAGE
Problème : comment calculer l'échantillon de départ et le rendement du plan
échantillonnal :
ndép = ntheo x

JOHN NDALA
L'éligibilité des unités sélectionnées ou la qualité des personnes
En fonction de la définition de la population et de la base échantillonnale
choisie, certaines unités peuvent être considérées comme non-éligibles.
les personnes malades ou confuses (Age, maladie) seront considérées comme étant des
unités valides mais non-éligibles.

Le taux de réponse
Parmi les personnes éligibles, certaines ne pourront pas être rejointes pour
diverses raisons: Dans le cas des sondages auprès des ménages, on classe
habituellement les non-réponses de la façon suivante: refus du ménage, refus
de la personne, pas de réponse, absence prolongée…

Le taux de validité: il s’agit de savoir si les différents


indicateurs offrent une bonne représentation du phénomène
étudié John Ndala
Taux de réponse =n répondant effectif/n éligible
Taux d’éligibilité = n unités éligibles /n unités
valides
Taux de validité = n unités valides /n de départ
Rendement du plan d’échantillonnage = Taux de
réponse x Taux d’éligibilité x Taux de validité

John Ndala
Exemple :Si le taux de réponse prévu est de 60% (0,6), le taux d'éligibilité est
de 95% (0,95), et le taux de validité de 80% (0,80)
et si je désire avoir un échantillon théorique de 384 répondants (marge d'erreur
de 5% pour une proportion de 0,50 avec un seuil de confiance de 95%), Je
ferai le calcul suivant :
On peux donc évaluer que je dois tirer 842 unités de la base échantillonnale
pour obtenir un échantillon théorique de 384 répondants dans les conditions
citées plus haut

John Ndala
Exemple d’application :

Pour calculer une proportion avec un niveau de confiance de 95% et


une marge d’erreur à 5% :
n = (1.96)² x (0,5)(1-0,5) / (0.05)² = 384.16
Pour calculer une proportion avec un niveau de confiance de 95% et
une marge d’erreur à 7% :
n = (1.96)² x (0,5)(1-0,5) / (0.07)² = 196
Pour calculer une proportion avec un niveau de confiance de 99% et
une marge d’erreur à 2% :
n = (2.575)² x (0,5)(1-0,5) / (0.02)² = 3218.75
JOHN NDALA
L’intervalle de confiance :

La précision statistique d’un test (proportion ou


moyenne) s’exprime en calculant l’intervalle de
confiance, qui indique la marge d’erreur
lorsqu’on généralise une estimation obtenue sur
un échantillon à l’ensemble de la population
représentée
La longueur de l’intervalle diminue lorsque la
taille de l’échantillon augmente.
JOHN NDALA
Rappel sur les paramètres statistiques

John Ndala
Détermination de l’intervalle de confiance :

John Ndala
L’intervalle de confiance :

On retient la formule suivante pour calculer l’intervalle de confiance d’une proportion :


P {( | p – t ≤ ≤ p + t }
Où :
• p = pourcentage observé dans l’échantillon ;
• q=1–p;
• t= valeur dérivée de la loi normale centrée réduite, égale à 1,96 si α = 0,05 (degré de
confiance) ; et si α = 0,01 (le seuil de confiance devient 99% t=2,58)
• fn= pourcentage réel dans la population mère ;
• n = taille de l’échantillon.
L’intervalle de confiance d’une moyenne m sur n individus avec un écart type se
calcule de la manière suivante :
m-t≤ ≤ m + t

JOHN NDALA
Application sur l’intervalle de confiance

Travail demander : Déterminer le montant moyen dépenser par ces abonnés


et l’audience moyenne des abonnés de moins de 35 ans au seuil de
confiance de 95 %?
John Ndala
SOLUTION

John Ndala
Notion des variables La modélisation est entendue ici
Grandeur susceptible de varier dans un comme la réalisation d’une
ensemble donné, et telle qu'à chaque représentation simplifiée d’un
valeur prise par cette grandeur puisse
correspondre, au moins théoriquement, phénomène, la variable étant
un effectif de personnes ou une l’expression du caractère observé
fréquence en pourcentage dans la population.

La formulation la plus simple d’un modèle vise à définir une relation


de cause à effet entre deux natures de variables : les variables
indépendantes (ou variables explicatives) et les variables dépendantes
(ou expliquées). Dans ce modèle simple, la variable indépendante
représente la cause, dont l’effet se mesure sur la variable dépendante.
John Ndala
Notion des variables(suite) Dans le premier cas, l’effet de la
D’autres variables peuvent intervenir variable indépendante X sur la
dans cette relation directe entre la (ou variable dépendante Y se mesure par
les) variable (s) indépendante(s) et la l’intermédiaire d’une troisième
(ou les) variable(s) dépendante(s). variable dite « médiatrice ».
L’association ou la causalité observée
entre X et Y résulte du fait que X
influence Z qui à son tour influence Y.

Dans le second cas, la présence de la variable modératrice modifie


l’intensité (c’est-à-dire l’amplifie ou la diminue) et/ou le signe de la
relation entre la variable indépendante et la variable dépendante. On
pourra mesurer l’effet de cette variable modératrice par exemple en
décomposant la population en sous-populations (classes d’âge,
segments de clients, etc.) et en testant la relation dans les sous-
groupes pour y vérifier le type d’effet John Ndala
Le trois types des relations entre variables !

John Ndala
Notion des variables(suite):Types des variables
Les variables sont de En statistique, une variable qualitative,
une variable catégorielle, ou bien un
deux types : facteur qui prend pour valeur des
modalités, des catégories ou bien des
Qualitative et quantitative niveaux, par opposition
aux variables quantitatives

Variables Quantitatives : leurs modalités sont mesurables et


les tests envisageables sont nombreux.
La gestion et plus largement les sciences sociales s’intéressent
également à la mesure de phénomènes mentaux, telles les
opinions, les attitudes ou encore les préférences, au travers
d’indicateurs : les échelles de mesure.
John Ndala
Comment savoir faire la distinction entre le deux :

Une variable est dite quantitative


si elle est représentée par un nombre. Un âge, une
distance, une durée, une note sont des variables
quantitatives.
Une variable qui n'est pas quantitative est qualitative.
Une couleur, un diplôme, un prénom sont des variables
qualitatives.
John Ndala
Comment savoir faire la distinction entre le deux :

John Ndala
Comment savoir faire la distinction entre le deux :
Une variable quantitative peut être discrète ou continue. Une variable
discrète a une valeur finie. Il est possible de les énumérer (” 1, 2, 3,
…”).
Une variable continue peut prendre, en théorie, une infinité des
valeurs, formant un ensemble continu.
En statistique, on qualifie d'ordinale une variable qualitative pour
laquelle la valeur mesurée sur chaque individu est numérique. On peut
alors classer les individus par valeurs croissantes ou décroissantes.
 variable nominale :Ce sont des variables qui sont représentatives de
catégories diverses et qui sont traduites par un nom. Cela peut être par
exemple le signe astrologique, le nom d'un individu ou encore une
couleur. John Ndala
L’échelle nominale a pour principe d’utiliser les nombres comme des étiquettes afin
de classer chacune des modalités. Êtes-vous ? 1. _ Un homme 2. _ Une femme
L’échelle ordinale est une échelle de classement comme l’échelle nominale, dans laquelle les
nombres attribués à chaque modalité ont une relation d’ordre avec un continuum sous-jacent.
Notez de 1 à 5 la qualité gustative du produit X(1 étant la note la plus faible, 5 la note la plus
élevée)

L’échelle métrique possède les propriétés des échelles nominale et ordinale, mais elle
permet également de comparer les distances entre les objets, les modalités étant séparées
par des espaces équidistants. L’exemple le plus courant est celui du thermomètre, la
différence entre 0 °C et 1 °C étant la même qu’entre 1 °C et 2 °C, etc.

L’échelle de différentiel sémantique d’Osgood ou l’échelle de


Stapel, qui ont pour but de conduire à l’élaboration de profils de
répondants, l’échelle d’intensité de Likert ou échelle d’accord, les
échelles d’intention. John Ndala
Exemple :de l’échelle ordinale

John Ndala
Exemple :de l’échelle d’osgood

John Ndala
Exemple :de l’échelle stapel

John Ndala
Exemple :des échelles de Likert et d’intention

John Ndala
Travail dirigé :Préciser de quel type d’échelle dont il est question :

John Ndala
Travail dirigé :réponses

John Ndala
Mesurer à l’aide d’un questionnaire
Le questionnaire présente une série de
Le questionnaire est un outil de collecte questions formalisées destinées à obtenir
d’information qui permet de quantifier et des informations auprès de répondants. Le
comparer l’information. Cette information questionnaire est un élément du processus
est collectée auprès d’un échantillon de collecte de données, lequel comprend
représentatif de la population visée par la également des instructions pour
recherche. sélectionner, approcher et interroger les
répondants

Les questionnaires combinent souvent deux formes de


questions : fermées et ouvertes, avec une dominante de
questions fermées et quelques questions ouvertes, plus
riches mais aussi plus difficiles à traiter statistiquement.
John Ndala
John Ndala
trois Objectifs d’un questionnaire :
Traduire les informations requises en Etre motivant et encourageant, afin que le
une série de questions spécifiques aux répondant se sente impliqué dans l’entretien,
quelles les participants peuvent et coopère et poursuive l’entretien jusque bout.
doivent répondre. Elaborer de telles Un entretien incomplet n’a au mieux qu’une
questions n’est pas aisé, ainsi deux utilité limitée. Lorsqu’un chargé d’études
manières de poser une question, si conçoit un questionnaire, il doit faire au
mieux pour que le questionnaire engendre le
elles sont en apparence semblables, minimum de fatigue, d’ennui, de réponses
peuvent déboucher sur des incomplètes ou des non-réponses de la part
informations différentes de répondants.

Minimiser les erreurs de réponses. L’erreur de réponse survient


lorsque les participants donnent des réponses imprécises ou que leurs
réponses sont mal enregistrées ou mal analysées.
John Ndala
Les étapes de la conception d’un questionnaire

John Ndala
Les étapes de la conception d’un questionnaire(suite)

John Ndala
Structure d’un questionnaire

John Ndala
Types des questions :

John Ndala
Types des questions :

John Ndala
Mesurer à l’aide d’un questionnaire
L’objectif d’une échelle est d’éviter
La construction d’un questionnaire d’avoir à représenter un phénomène
amène à s’interroger sur la mesure abstrait – un construit – par le biais
des concepts. Comment mesurer, par d’une seule et unique variable, en
exemple, la qualité du service ? privilégiant l’utilisation d’indicateurs
qui permettent de représenter les
différentes facettes de ce construit.

Ainsi, il est généralement recommandé d’utiliser plusieurs


items pour mesurer un concept et donc de commencer par
chercher s’il existe un outil de mesure du concept que l’on
souhaite évaluer. S’il n’existe pas d’échelle (parce que le
concept est nouveau ou qu’il s’applique à un domaine
particulier), il faut en créer une. John Ndala
Pré-test d’un questionnaire
Un questionnaire doit Pour être efficace, ces tests
doivent être effectués dans les
obligatoirement être testé conditions réelles
auprès d’un mini-échantillon d’administration du
de la base de sondage afin questionnaire afin de se rendre
d’éliminer toutes les sources compte des erreurs réalisées
de biais (question mal formulée et
ambiguë, questionnaire trop long
…).
La rédaction définitive du questionnaire vient conclure les pré-tests,
juste avant l’administration réelle auprès des membres de
l’échantillon.
John Ndala
Le coefficient alpha de Cronbach
est une statistique utilisée pour mesurer la Il permet donc l’estimation de la fidélité du
cohérence interne (ou la fiabilité) des score à un test. Présenté par Lee Cronbach en
questions posées lors d'un test (les réponses 1951, le coefficient alpha peut être conçu
aux questions portant sur le même sujet comme une généralisation au cas de variables
devant être corrélées). Sa valeur est continues de la formule de Kuder-
inférieure ou égale à 1, étant généralement Richardson pour items dichotomiques.
considérée comme "acceptable" à partir de Formules de calcul :
0,7

John Ndala
Interprétation
Bien que plusieurs ouvrages fassent état d'une absence
de consensus sur le sujet, de nombreux auteurs estiment
qu'une valeur alpha supérieure à 0,7 est satisfaisante.
Un résultat supérieur à 0,9 est parfois considéré
comme souhaitable mais il peut être aussi le signe
d'énoncés trop similaires, diminuant paradoxalement la
fiabilité réelle de l'échelle
Exploration des valeurs possibles du coefficient α de
Cronbach Georges Martineau(1982):cinq cas à illustrer
John Ndala
John Ndala
Les principaux concepts de l’échantillonnage
Population Base de sondage
La population est l’ensemble des individus La base de sondage disponible pour réaliser l’enquête
auxquels on s’intéresse, autrement dit c’est ne correspond pas toujours exactement à la population.
le groupe entier tel que défini dans les Par exemple, une liste extraite d’un annuaire
d’entreprises peut ne pas être exhaustive, ne pas être à
objectifs de l’enquête jour, contenir des entreprises qui ont fait faillite, etc.

Erreur de couverture
L’écart d’adéquation entre la base de sondage et la population entière correspond à l’erreur de
couverture.
Échantillon
L’échantillon est le sous-ensemble de la population sélectionné pour représenter le groupe entier.
Erreur d’échantillonnage
On appelle erreur d’échantillonnage tout type d’erreur lié à la méthode d’échantillonnage. Dans le
schéma ci-dessus, on voit qu’un partie de l’échantillon se trouve à l’extérieur de la population.
Unité d’échantillonnage
On appelle unité d’échantillonnage l’unité de base de l’enquête.
John Ndala
Chapitre III: Les pratiques des enquêtes par
sondage aléatoire

John Ndala
John Ndala
Définition de sondage(suite)
On peut également dire que le sondage en
sciences humaines est un instrument de Les échantillons doivent avoir les
recherche de mesure, de structuration et de caractéristiques de la population de
présentateur de l'information fondée sur référence
l'observation de réponses à un ensemble de
question posés à un échantillon d'une De ces définitions, on retiendra 2
population. choses :

Le choix de l'échantillon dicté avec l’importance des


objectifs est fondamental dans le cas d'un sondage d’opinion,
Le principal objet de sondage est donc d'obtenir des
informations permettant de répondre à des questions et de
vérifier les hypothèses d'une recherche.
John Ndala
John Ndala
John Ndala
Les principaux avantages de sondage
Coût et rapidité Souplesse dans le choix des concepts
Soit la réalisation d'enquête L'enquête par sondage permet de définir
un ensemble de règles (définitions,
exhaustive ad hoc lourdes et nomenclatures, procédures
coûteuses d'enregistrement ou de contrôle...)
susceptibles de varier grandement dans le
temps ou dans l'espace, d'une entreprise
ou d'un pays à l'autre

Précision des observations


Grâce à sa taille, l'enquête par sondage permet l'intervention d'un
certain nombre des métiers (enquête socio- économique, enquête de
marché) ou de personnel qualifié (contrôle de fabrication) et rend
possible l'observation précise et simultanée de nombreux caractères
John Ndala
Les limites de sondage
Avant de prélever un Il ne faut pas qu'il soit douteux de
échantillon, il faut que la l'appartenance ou non d'un
population ainsi que ses individu à la population de
caractéristiques soient bien référence ce là n'est pas toujours
définies. aussi fiable

Bref, les limites des enquêtes par


sondage tiennent essentiellement aux
erreurs d'échantillonnage et aux difficultés de
désignation de l'échantillon John Ndala
L’erreur d’échantillonnage
Les enquêtes par sondage sont fondées sur la loi des grands nombres : les
extrapolations à la population de référence des grandeurs mesurées sur
l'échantillon ne peuvent être réalisées, avec une précision acceptable qu'à partir
d'échantillons de taille suffisamment importante.

La méthode de sondage ne pourra donc s'appliquer à des populations


de faible ville (effectifs) : celles-ci devront être observées
exhaustivement.

Des précautions devront également être prises lorsque la


population est constituée d'unités de tailles très inégales par
exemple d'établissement industriel d’impulsion très
différentes. John Ndala
Les difficultés de désignation de l’échantillonnage
Ces difficultés de désignation seront souvenait rencontrées dans le
domaine des enquêtes de marché aggravées parfois par l'imprécision
de la population de référence.

Pour étudier le marché d'une matière plastique nouvelle, il faudra commencer


par définir l'ensemble des acheteurs potentiels, par exemple les entreprises
susceptible de l'utiliser dans leur fabrication une enquête préliminaire pourra
être nécessaire pour délimiter ce domaine d'étude.

Pour la réalisation d'un sondage aléatoire, les difficultés seront


encore plus grandes : on devra disposer d'une base de sondage, c'est-
à-dire liste ou d'un fichier permettant de repérer sans omission ni
répétition tous les individus appartenant à 1a population de
référence John Ndala
Les méthodes d’échantillonnage

John Ndala
Les méthodes d’échantillonnage

John Ndala
Principes de sondage aléatoire

Définition : Cette méthode est caractérisée par le fait que


l'échantillon est désigné de façon à ce que chaque unité de
population ait une probabilité différente de zéro d'être retenue.
Très souvent, en pratique on affecte à chaque unité de la
population, la même probabilité d'appartenir à l'échantillon.
La désignation de celui-ci peut être alors assimilé au tirage de
boules dans un usine le tirage peut être effectuée de 2 façons
différentes :sans remise et avec remise
Méthodes de sondage aléatoire(suite)
Un plan de sondage est dit avec remise si un même individu peut apparaitre plusieurs fois dans un échantillon et si l’ordre dans lequel apparaissent les individus compte.
Méthodes de sondage aléatoire(suite)

Ceci reviens à dire en termes de conséquence :


Méthodes de sondage aléatoire(suite)
Méthodes de sondage aléatoire(suite)
Méthodes de sondage aléatoire(suite)
Méthodes de sondage aléatoire(suite)
Méthodes de sondage aléatoire(suite):Propriétés

1)Tirage avec remise :obéit à la loi binomiale à pour caractéristiques principales


E= (x)= n.p V(x)= n.p.q
2) Tirage sans remise : obéit à la loi hypergéométrique intervient chaque fois que
l'on considère deux alternatives dont les probabilités ne restent pas constante au
cours d'une seule d'épreuve ou des tirages.
Cette loi a pour caractéristiques principales
L'espérance mathématique E(x)= n.p
La variance V (x) = n.p.q
Méthodes de sondage aléatoire(suite):Propriétés

Fondement de la méthode : La loi des grands nombres


En mathématiques, la loi des grands nombres permet d'interpréter la
probabilité comme une fréquence de réalisation, justifiant ainsi le principe
des sondages, et présente l'espérance comme une moyenne.
Plusieurs théorèmes expriment cette loi, pour différents types de
convergence en théorie des probabilité

Cette loi exprime le fait que les caractéristiques d’un échantillon aléatoire
se rapprochent des caractéristiques statistiques de la population (ensemble
d’individus ou d’éléments) lorsque la taille de l’échantillon augmente à
l’infini.
Méthodes de sondage aléatoire(suite):Propriétés

Fondement de la méthode : La loi des grands nombres


II existe une relation entre les concepts statistiques et les concepts probabilités.
A la notion de fréquences pour une distribution statistique observée correspond
la notion de probabilité pour une loi de probabilité.
A la notion de moyenne arithmétique pour une variable statistique correspond la
notion d'espérance mathématique d'une variable aléatoire.
La probabilité associée à un événement est un nombre satisfaisant à certaines
conditions ou axiomes:
• La probabilité associée à un événement est un nombre positif ou nul
• La probabilité associée à l'ensemble fondamental est égale à l'unité
• Pour tout couple d'événements incompatibles A et B, la probabilité de la réunion
de ces événement est égale à la somme des probabilités de A et B
Méthodes de sondage aléatoire(suite):Propriétés

INEGALITE DE BIENAYME-TCHEBICHEEF (Comment arriver à déterminer la


taille de l’échantillon)
Soit une variable aléatoire X quelconque d'espérance math m et d'écart-type δ.
Nous- nous appartienne à un intervalle] m-t δ, m+t δ [symétrique par rapport à la
moyenne.
Cette probabilité P est donnée par :
P = P (|x-m| ≤ t δ)= |x-m| ≤ t δ = |x-m| =-x+m(si x-m <0) et x-m et (si x-m >0)

Avec P = P (inégalité de B.C)


(P est la probabilité pour que X E (m- tδ, m+tδ)
Méthodes de sondage aléatoire(suite):Propriétés

Si le tirage de l'échantillon est effectif avec remise, la fréquence des individus A


Observés sur l'échantillon a pour espérance mathématique p et pour écart-type δ =
C'est-à-dire : E () = E ( =
V) = V ( = V (x) = .n.p.q =

Appliquons l'inégalité de Bienaymé - Tchebicheff à ce cas :


P
P (|X- n - P| < t : δ ≥ .
Méthodes de sondage aléatoire(suite):illustration

Exemple : Une population contient une proportion de 40% favorable au candidat


A. On désire que la fréquence fn des éléments A observés sur l'échantillon se
trouve avec une probabilité d'au moins 99% dans l'intervalle p ± 0 ,01 c'est-à-dire
(p - 0,01 ; p + 0,01)
Nous avons P {( | fn - P ≤ 0.01} ≥ 0,99
Rapprochons cette expression de l'inégalité de Bienaymé - Tchebicheff :
P=
II faut choisir t=10 pour que 1 = 0,99
Ainsi t étant fixe, pour avoir :
t , 10
Il suffit de prendre : n ≥ 240.000
Méthodes de sondage aléatoire(suite):Propriétés

Convergence de la moyenne d'une variable aléatoire vers son espérance mathématique


Soit, n variables indépendantes suivant une loi de probabilité quelconque d'espérance
mathématique ni et d'écart-type δ.
Leur moyenne et elle-même une variable aléatoire d'espérance mathématique d'écart-
type
Appliquons l'inégalité de Bienaymé- Tchebicheff à cette variable :
P
II suffit donc de tirer un échantillon de taille, suffisamment grande dans la population
de référence pour que la moyenne de la variable observée sur l'échantillon soit
presque sûrement(Avec une probabilité au moins égale à très proche de son espérance
mathématique c'est-à-dire de la variable moyenne de la population.
Méthodes de sondage aléatoire(suite):illustration

Dans l'exemple précédent, un échantillon de 240.000 unités est un luxe inutile


pour obtenir, avec une probabilité de 99% une estimation de p ou 1/100 près c'est-
à-dire
P {(|- p| ≤ 0,01} ≥ 0,99
En effet, dans ce cas, non connaissons la distribution de probabilité de la
fréquence fn c'est une loi binomiale de paramètres m = p et δ =
Par suite, On peut déterminer la valeur de la variable normale centrée réduite t telle qu'il y ait
99 chances sur 100 pour que fn se trouve dans l'ensemble

P±t:
P {( | p – t ≤ ≤ p + t } 0,99
La consultation de la table P(t), nous indique t=2,58
Méthodes de sondage aléatoire(suite):illustration
CHAPITRE IV : INTERPRETATION DES SONDAGES
ALEATOIRES
Problèmes d'estimation et de Le problème se pose donc, à partir des
comparaison observations effectuées sur
On ne peut avoir une certitude l'échantillon, d'estimer avec le
absolue quant à la précision d'une maximum d'efficacité la valeur de telle
information recueillie pour sondage ou telle caractéristique de la population
et d'apprécier la précision de cette
estimation.

Deux séries de problèmes se posent :


 Le choix de l'estimateur; en effet, il convient d'abord, de rechercher la grandeur, mesurer
l'échantillon, susceptible de donner de façon correcte et efficace une estimation, de la
caractéristique visée.
 Il faut ensuite déterminer la précision de l'estimation ou délimitant au tour de chiffre ainsi
obtenu une plage de valeurs et en indiquant d'importance de risque que la norme valeur se
trouve à l'extérieur de cette plage John Ndala
LES ESTIMATEURS VISUELS
La moyenne de l'échantillon est (Avec remise)
avant la désignation de celui-ci,  (Sans remise)
une variable aléatoire espérance
E (S) ҂
mathématique m et (en cas de
tirage indépendants) d'écart-type
 E () = m et V () =

En vertu de la loi des grands


nombres, converge en probabilité
vers la vraie valeur m
La valeur observée est l'estimation
En mathématiques, un estimateur est une de m obtenue à partir de cet
statistique permettant d'évaluer un paramètre
inconnu relatif à une loi de probabilité (comme échantillon particulier.
son espérance ou sa variance). John Ndala
Estimateurs et loi de probabilité

En probabilité, on cherche parfois à valider une loi de probabilité


théorique à l'aide d'une expérience statistique.
Dans le cas d'une variable discrète finie, on prend comme estimateur
de chaque probabilité pk, la fréquence fk dans l'échantillon. Les
valeurs fk étant des variables aléatoires, il est normal que ces
estimateurs ne coïncident pas complètement avec les valeurs pk.

Soit une population composée' de N individus U t repérés, par leur numéro t : t


= 1, 2,...N
Dans cette population, on tire un échantillon d'effectif n les individus
échantillon Ui sont identifiés par le rang i de leur tirage : i= 1, 2, .....n
John Ndala
Estimateurs et loi de probabilité

Considérons une variable X


Dans la population, nous désignerons par :
Xt la valeur de la variable X pour l'individu Ut , m, la moyenne de X :

Dans l'échantillon, les grandeurs analogues sont désignées par :


Xi, la valeur de la variable aléatoire X pour l'industrie échantillon U i,
, la moyenne de X

 S2 la variance de X :
 S2 =

John Ndala
Espérance mathématique et variance d'une moyenne d'échantillon
L'espérance mathématique de la moyenne d'un échantillon est égale à
la moyenne m dans la population dans laquelle est tiré cet échantillon,
quel que soit le mode de tirage
E= (

Estimateur sans biais.

John Ndala
Estimateur d'une proportion
Soit une population comportant deux catégories d’individus
Les individus A en proportion p
Les individus B en proportion q= 1-p
Rappelons que la proportion p peut être considérée comme moyenne
m d'une variable de Bernoulli X prenant la valeur 1 pour les
individus A et 0 pour les individus B :

P=

John Ndala
Intervalle de confiance d’une estimation
Connaissant la loi de probabilité de l'estimation θ, nous pouvons
déterminer autour de la vraie valeur un intervalle ( -h i, +h2) tel que la
grandeur θ observée sur l'échantillon ait une probabilité l - ∞
d'appartenir à cet intervalle :

P (θ -h1 ≤ θ ≤ θ+h2) = 1-α


I.C. = θ – h1 ≤ θ ≤ θ+h2
p - tα ≤ m≤ p + tα I.C.

John Ndala
Estimation d’une moyenne
La moyenne d'un échantillon, provenant d'une population normale
est elle-même distribuée normalement θ une façon plus générale la
distribution de la moyenne d'un échantillon tiré dans une population
quelconque de moyenne m et d'écart-type δ, peut être assimilée, dès
que l'effectif de l'échantillon dépasse une trentaine d'unités, à une loi
normale de moyenne m et d'écart-type δ : = N (m, δ)
Dans le cas d'un échantillon tiré avec remise : δ =
Dans le cas d'un échantillon exhaustif :
δ=≠

John Ndala
DISTRIBUTION D’ECHANTILLONNAGE DE

La distribution d'échantillonnage de correspond à la distribution


de probabilité de toutes les valeurs possibles de la moyenne
d'échantillon .

A) Population finie =
B) Population infinie

John Ndala
DISTRIBUTION D’ECHANTILLONNAGE DE
Population finie :
Population infinie :
L'intérêt pratique de la distribution de est qu'elle peut fournir des
informations probabilistes concernant l'écart entre proportion
d'échantillon et la proportion de la population.

John Ndala
Estimation d’une moyenne :Application
On a tiré un échantillon exhaustif de 10.000 ménages dans la ville de
Lubumbashi comportant au total environ 700.000 ménages. Sur cet
échantillon, on a observé pour un mois déterminé une consommation
moyenne des ménages de 950Fc, avec un écart-type égal à 700 000Fc
Calculer l'intervalle de confiance se rapportant à l'estimation de la
consommation moyenne des- ménages dans la ville de Lubumbashi.
Données
N = 700.000 n= 10.000
= 950 S = 700

John Ndala
Estimation d’une moyenne :Application

 Suivre une loi normale de moyenne m et d'écart-type δ =


δ est inconnu et est estimé à partir de l'échantillon :
S =
 = 6,95

John Ndala
Estimation d’une moyenne :Application

Prenons les risques de 5% ou le seuil de probabilité de 1 - ∞


= 0,95
P(- tS' ≤ m ≤ + t. S') = 0,95
On lit dans la table l’intervalle de confiance :
950 - 1,96 X 6,95 ≤ m ≤ 950 + 1,96 X 6,95
950 - 13,622 ≤ m ≤ 950+13,622
937 ≤ m ≤ 964

John Ndala
LES ASPECTS PRATIQUE DES SONDAGES ALEATOIRES
La mise en œuvre de la méthode des sondages aléatoires comporte
l’emploi d'un certain nombre de procédés dont les uns concernent
l'organisation du tirage de l'échantillon (simplification du tirage,
diminution du coût de collecte de l'information. etc.) et les autres,
l'amélioration de l'efficacité de la méthode.
La désignation de l’échantillon :La méthode des sondages aléatoires
suppose que chaque individu de la population a une probabilité non
nulle d'appartenir à l'échantillon et que l’on connaît cette probabilité

John Ndala
La base de sondage
Une base de sondage est constituée par une liste ou un fichier
énumérant les individus de la population-sans omission (puisque
chacun d'entre eux doit avoir une probabilité non nulle d'être désigné)
et sans répétition (pour assurer l'égalité des probabilités de sortie).
Procédés de tirage de l'échantillon
Le tirage d'un échantillon est une opération complexe. Aussi emploie-
t-on en pratique, certains procédés (utilisation de tables de nombres
aléatoires, tirages systématiques, tirages par grappes) pour le
simplifier.

John Ndala
Le sondage élémentaire et l’utilisation de la table des nombres aléatoires
La méthode élémentaire consiste à tirer l'échantillon en donnant à
chaque individu de la population la même probabilité d'être désigné.
Il faut .pour cela :
Se procurer ou établir la base de sondage ;
Numéroter les individus de 1 à N ;
Se donner la taille n de l'échantillon ;
Tirer n nombres compris entre 1 et N, en donnant à chacun des N
numéros la même probabilité d’être désignés.

John Ndala
Description d'une table de nombres aléatoires
Les statisticiens Maurice Kendall et B. Babington
Smith, vers la fin des années 1930, mettent au point les
premiers tests servant à valider que des nombres sont
statistiquement aléatoires.
Ces tests sont appliqués sur des suites de nombres et
servent à vérifier les caractéristiques souhaitées. Le
plus simple exige de compter le nombre de fois
qu'apparaissent les nombres 1, 2, 3... ; il est réussi si
ces nombres de fois sont à peu près égales.
John Ndala
Utilisation d'une table de nombre aléatoires
1.Décidez de la grandeur du nombre dont vous avez besoin. Par exemple, si
votre base de sondage est de dix unités, vous devez choisir un nombre entre 1 et
10 (10 compris). Vous devez utiliser deux chiffres pour être sûr que 10 a une
chance égale d’être inclus.
2. Décidez avant de commencer si vous allez parcourir la page vers la droite,
vers le bas, en travers, vers la gauche ou vers le haut.
3. Sans regarder la table, pointez un nombre en utilisant un stylo, un crayon, un
bâton ou même votre doigt.
4. Si ce nombre fait partie de la gamme dont vous avez besoin, prenez-le. Si ce
n’est pas le cas, continuez jusqu’au nombre suivant dans la direction que vous
avez choisie précédemment (en haut, en bas ou au travers de la page) jusqu’à ce
que vous trouviez un nombre qui soit dans la gamme dont vous avez besoin.

John Ndala
Il y a en gros deux “façons” de tirer un échantillon probabiliste :

le tirage aléatoire simple C'est le hasard pur, l'équivalent de tirer des noms
d'un chapeau ou du tirage au hasard à la loterie. Pour le réaliser, concrètement,
il faut avoir une liste de la population – la base d’échantillonnage-- et
numéroter chaque unité de la liste; ensuite, il faut soit utiliser une table de
nombres aléatoires qui déterminera quelles unités sont choisies ou, si on a une
liste sur fichier informatique, utiliser une procédure informatique (BASIC,
PASCAL, SPSS, etc.).
le tirage aléatoire systématique : Il s'agit ici de tirer seulement la première
unité de la liste au hasard, et de prendre ensuite les unités à un intervalle
prédéterminé (une unité à toutes les X unités). Il faut faire ou avoir une liste -
au moins conceptuelle - de la population et donc savoir combien d'unités elle
comprend. Il faut ensuite déterminer l’intervalle en fonction du nombre
d'unités requises dans l'échantillon et déterminer au hasard la première unité.
John Ndala
La probabilité de sélection peut être égale ou inégale; elle peut dépendre de divers facteurs.

Si l’échantillon est à probabilité égale, chaque unité a exactement la


même probabilité d’être choisie. Par contre, dans l’échantillon à
probabilité inégale, la probabilité de sélection pourrait dépendre, par
exemple, de la fréquence d’occupation d’un lieu, du chiffre d’affaires
de l’entreprise, du nombre d’élèves dans l’établissement .
Concrètement, je peux faire un échantillon des institutions scolaires à Lubumbashi où
chacune d’elles, quelque soit sa taille, a la même probabilité d’être choisie. Une institution
scolaire du centre aurait donc la même probabilité d’être dans l’échantillon que celle de la
rwashi... Par contre, dans un échantillon à probabilité inégale, la probabilité d’être dans
l’échantillon étant fonction du nombre d’élèves, celle du centre ville aurait nettement plus de
chance d’être dans l’échantillon que toute autre établissement dans la ville de Lubumbashi.

John Ndala
AUTRES METHODES D’ECHANTILLONNAGE
échantillon stratifié On parle d'échantillon stratifié lorsque la fraction
de sélection diffère en fonction de certaines caractéristiques de la
population (sexe, région, statut, âge, etc.). On stratifie pour permettre
que toutes les catégories de la population qui nous intéressent soient
représentées en nombre suffisant

échantillon par grappes - aréolaire Il s’agit ici de sélectionner des ensembles


(unités collectives du type unités de recensement, pâtés de maison, écoles,
classes). Dans l'échantillonnage par grappes, on sélectionnera un certain
nombre d'unités puis les unités contiguës (grappes). Dans l'échantillonnage
aréolaire, on sélectionne directement les ensembles. La base
d’échantillonnage aréolaire est constituée de la liste des unités collectives à
partir desquelles la sélection se fera. John Ndala
AUTRES METHODES D’ECHANTILLONNAGE
échantillon apparié : Il s'agit de sélectionner des échantillons de telle
sorte qu'il y ait une relation deux à deux entre les membres des deux
échantillons au plan des caractéristiques ou de certaines relations.
Exemple : un échantillon d'étudiants, un échantillon constitué des
parents des étudiants sélectionnés et un autre constitué des
professeurs des mêmes étudiants.

L’échantillon raisonné - au jugé : Sélectionne les "unités


considérées caractéristiques" du phénomène à l'étude. Souvent
utilisé en méthodologie qualitative, ce type d'échantillon pourrait
être justifié pour une étude en sociologie au premier niveau de
sélection. Il s’agit ici de choisir des unités (quartiers, îlots,
écoles,...) en fonction de certaines caractéristiques
John Ndala
AUTRES METHODES D’ECHANTILLONNAGE
échantillon de volontaires : "Chercheur conduisant une
étude sur ... cherche volontaires pour participer à une
expérience;

En aucun cas, l'échantillonnage de volontaires ne peut être


considéré comme représentatif d'une population. On l'utilise
uniquement lorsque l'on peut prétendre que les phénomènes
étudiés sont intra-individuels et universels, lorsque l'on
étudie des processus pour eux-mêmes.

John Ndala
JE VOUS REMERCIE POUR VOTRE ATTENTION

John Ndala

Vous aimerez peut-être aussi