Cours de TPS
Cours de TPS
Pr John Ndala,PhD
PLAN DU COURS
INTRODUCTION GENERALE
CHAP 1 : L’ANALYSE ET LA DESCRIPTION DES
DONNEES
CHAP 2 : LES METHODES DE SONDAGE
CHAP 3 : INTERPRETATION DES SONDAGES
ALEATOIRES
CHAP 4 : PRATIQUE DES SONDAGES
John Ndala
OBJECTIFS DU COURS
Objectifs généraux
• Être capable de concevoir et d'interpréter de façon critique une
enquête descriptive et explicative.
• Décrire les différentes méthodes d’échantillonnage
• Préciser l’intérêt et les limites de chacune d’entre elles
• Être capable de choisir un échantillon de manière judicieuse avant
de réaliser le plan de sondage
• Savoir présenter les résultats d’un sondage, donner par exemple des
marges d’erreurs (ou un niveau de confiance)
• Être capable de réaliser un questionnaire
John Ndala
OBJECTIFS DU COURS
Objectifs spécifiques
À la fin du cours, l’étudiant devra être à même
• Connaitre les principes des méthodes de sondage et savoir estimer la
précision d'un sondage,
• Savoir discuter la représentativité d'un échantillon,
• Savoir rédiger le protocole d'une investigation en Sciences de
Gestion,
• Savoir calculer un nombre de sujets nécessaire dans une étude
descriptive et explicative,
• Utiliser les méthodes et techniques de base du recueil des données.
John Ndala
Pré requis
Les différents thèmes de la statistique
abordés en première et deuxième année de
licence sont nécessaires à la compréhension
de ce cours.
Plus précisément les notions de variables
aléatoires, biais et variance d’un estimateur
ainsi que d’intervalle de confiance doivent
être maitrisées
John Ndala
Introduction Générale
Paramètres
Estimations
JOHN NDALA
Introduction
JOHN NDALA
Les questions auxquelles nous tenterons de répondre dans ce cours :
L’étude ad hoc: étude quantitative ou qualitative réalisée pour le compte d’un seul client,
L’étude omnibus: étude quantitative réalisée à date régulière. Le questionnaire regroupe
l’ensemble des questions de différents souscripteurs,
Le baromètre: étude réalisée à date fixe comme l’omnibus, mais avec le même questionnaire
d’une étude à l’autre, pour le compte d’un ou de plusieurs clients,
Le panel: investigation approfondie réalisée périodiquement pour plusieurs clients. Les
interviewés sont identiques d’une vague à l’autre. Il s’appuie sur des échantillons importants,
Le marché-test: étude quantitative visant à prévoir les ventes et parts de marché d’un nouveau
produit; on parle également de marché-test pour des observations de type expérimental en
magasin
L’entretien individuel: étude qualitative dont l’objectif est de recueillir le discours individuel.
On distingue l’entretien non directif (libre propos), semi-directif (intervention et thèmes),
directif (guide d’entretien strict, questions ouvertes), associatif ou projectif (analogie,
associations de mots, compléments de phrases, jeux de rôle, etc.)
JOHN NDALA
Ces techniques peuvent s’orienter en deux approches :
A. Les données secondaires sont des données qui ont été collectées préalablement à l’étude,
pour répondre à d’autres problèmes, ce qui peut fortement en limiter la pertinence et la
précision. Elles sont cependant d’un accès facile et leur coût est relativement faible.
Les panels ont considérablement évolué ces dernières années : gains de restitution de l’information,
amélioration de la couverture des circuits de distribution (données de panels et données issues du scanning en
sortie de caisse), offre enrichie (information accessible en ligne, analyses spécifiques des variables du mix et
de leur performance).
les panels de consommation, les access panels (ou panels de consommateurs), les access
panels on-line, les panels de distributeurs (ou panels de détaillants) et les panels
d’audience. John Ndala
B.Les données primaires
Les données primaires sont spécialement collectées
pour répondre à une étude statistique précise.
Elles s'opposent aux données secondaires. Ces dernières
sont des données qui existent déjà au moment de votre
étude et qui ont été collectées pour des raisons qui peuvent
être différentes de celles de votre étude.
Il s’agit de données brutes, qui doivent être préparées,
analysées puis interprétées.
John Ndala
2. L’échantillon
Afin de bien illustrer les étapes d’un plan de sondage, un petit détour historique peut s’avérer intéressant. Tout commence
aux États-Unis, lorsque Franklin D. Roosevelt se représente contre Alf Landon aux élections de 1936
Derrière les candidats, deux hommes s’affrontent pour pronostiquer le résultat de ces élections. D’une part Codely,
rédacteur en chef du Literary Digest, utilise la technique du vote de paille (straw vote) : quelques jours avant les élections, il
fait paraître des bulletins de vote dans son journal et demande à ses lecteurs de mentionner leur choix. Il reçoit 2,4 millions
de réponses et donne Landon gagnant. D’autre part, Gallup, créateur de l’institut éponyme, n’interroge que 4 000 personnes
et joue Roosevelt gagnant.
La victoire de ce dernier marque la naissance des instituts de sondage. Gallup est le père de
l’échantillon représentatif, le premier à avoir eu l’idée de reconstituer une population en
miniature
Un échantillon est une fraction représentative d’une population d’une population,
l’échantillon est censé représenter l’ensemble de la population étudiée. Il représente une
estimation de la population totale.
La théorie de l’échantillonnage consiste à considérer qu’une partie de la population peut
parfaitement représenter l’opinion de l’ensemble de la population
Cette procédure comporte trois éléments :la définition de l’unité de sondage, la taille de
l’échantillon et le choix des individus qui feront partie de l’échantillon
John Ndala
L’échantillon peut se présenter sous trois formes essentielles à savoir :
Tirage au hasard
Échantillons probabilistes
Échantillon stratifié
Échantillon en grappe et l’échantillon
à plusieurs degrés
John Ndala
Échantillonnage stratifié : dans le cas où les variables étudiées sont fortement
dispersées, c’est-à-dire dans ceux où des classes seraient sous- ou
surreprésentées en raison du tirage au hasard, il peut s’avérer utile d’utiliser
des variables dites de stratification, qui permettent de réaliser une répartition
de la population en classes appelées « strates ».
John Ndala
La détermination de la taille de l’échantillon
Un échantillon trop petit peut induire une perte d’informations importante ou empêcher
la réalisation de nombreux tests soumis à des contraintes en termes de nombre
d’observations.
À l’inverse, un échantillon trop important constitue une perte de temps et de budget
dommageable pour la réussite de l’étude.
Il est important de noter que la précision de l’information recueillie dépend
principalement de la taille de l’échantillon et non du taux de sondage (défini par le
rapport n/N, où n est la taille de l’échantillon et N celle de la population).
Pour trouver la taille adéquate de l’échantillon n une règle empirique facile à appliquer
– même si elle est contestable d’un point de vue purement statistique – consiste à partir
de l’erreur, exprimée en pourcentage, que l’on est prêt à tolérer :
n = 1/erreur2
Par exemple, si l’on accepte une erreur de +/–5 % au niveau de la précision des résultats,
on obtient une taille d’échantillon de 1/0,05 , soit 400 répondants.
2 NDALA
JOHN
La succession des étapes dans une enquête
JOHN NDALA
La détermination de la taille de l’échantillon: Préalables
JOHN NDALA
Les causes des erreurs ou incertitudes dans les enquêtes de sondage
Toutes les données recueillies, aussi bien à partir d’un échantillon que de la base complète,
sont affectées de types variés d’incertitude pouvant provenir du questionnaire, des
enquêteurs, des mesures physiques ou de données extraites de documents existants. Les
différences essentielles entre un sondage et un recensement sont les suivantes :
a) le sondage peut être réalisé avec plus de soin et fournir des informations auxquelles on
peut accorder une plus grande confiance,
b) les résultats du sondage peuvent être affectés par des erreurs aléatoires
d’échantillonnage mais celles-ci peuvent être estimées à partir des observations.
John Ndala
Classification des causes d’erreurs dans les enquêtes
Causes d’erreurs dues à l’organisation du plan d’enquête et aux méthodes de
réalisation
tiré,
John Ndala
Formules de calcul pour déterminer la taille de l’échantillon :
JOHN NDALA
Formules de calcul pour déterminer la taille de l’échantillon :
Pour un Niveau (ou Taux) de confiance s = 95% (niveau très souvent utilisé),
donc t = 1.96 :
JOHN NDALA
Formules de calcul pour déterminer la taille de l’échantillon :
Formules approximatives :
n≥
e≥t
III. BIAIS D'ECHANTILLONAGE - PLAN D'ECHANTILLONNAGE
Problème : comment calculer l'échantillon de départ et le rendement du plan
échantillonnal :
ndép = ntheo x
JOHN NDALA
L'éligibilité des unités sélectionnées ou la qualité des personnes
En fonction de la définition de la population et de la base échantillonnale
choisie, certaines unités peuvent être considérées comme non-éligibles.
les personnes malades ou confuses (Age, maladie) seront considérées comme étant des
unités valides mais non-éligibles.
Le taux de réponse
Parmi les personnes éligibles, certaines ne pourront pas être rejointes pour
diverses raisons: Dans le cas des sondages auprès des ménages, on classe
habituellement les non-réponses de la façon suivante: refus du ménage, refus
de la personne, pas de réponse, absence prolongée…
John Ndala
Exemple :Si le taux de réponse prévu est de 60% (0,6), le taux d'éligibilité est
de 95% (0,95), et le taux de validité de 80% (0,80)
et si je désire avoir un échantillon théorique de 384 répondants (marge d'erreur
de 5% pour une proportion de 0,50 avec un seuil de confiance de 95%), Je
ferai le calcul suivant :
On peux donc évaluer que je dois tirer 842 unités de la base échantillonnale
pour obtenir un échantillon théorique de 384 répondants dans les conditions
citées plus haut
John Ndala
Exemple d’application :
John Ndala
Détermination de l’intervalle de confiance :
John Ndala
L’intervalle de confiance :
JOHN NDALA
Application sur l’intervalle de confiance
John Ndala
Notion des variables La modélisation est entendue ici
Grandeur susceptible de varier dans un comme la réalisation d’une
ensemble donné, et telle qu'à chaque représentation simplifiée d’un
valeur prise par cette grandeur puisse
correspondre, au moins théoriquement, phénomène, la variable étant
un effectif de personnes ou une l’expression du caractère observé
fréquence en pourcentage dans la population.
John Ndala
Notion des variables(suite):Types des variables
Les variables sont de En statistique, une variable qualitative,
une variable catégorielle, ou bien un
deux types : facteur qui prend pour valeur des
modalités, des catégories ou bien des
Qualitative et quantitative niveaux, par opposition
aux variables quantitatives
John Ndala
Comment savoir faire la distinction entre le deux :
Une variable quantitative peut être discrète ou continue. Une variable
discrète a une valeur finie. Il est possible de les énumérer (” 1, 2, 3,
…”).
Une variable continue peut prendre, en théorie, une infinité des
valeurs, formant un ensemble continu.
En statistique, on qualifie d'ordinale une variable qualitative pour
laquelle la valeur mesurée sur chaque individu est numérique. On peut
alors classer les individus par valeurs croissantes ou décroissantes.
variable nominale :Ce sont des variables qui sont représentatives de
catégories diverses et qui sont traduites par un nom. Cela peut être par
exemple le signe astrologique, le nom d'un individu ou encore une
couleur. John Ndala
L’échelle nominale a pour principe d’utiliser les nombres comme des étiquettes afin
de classer chacune des modalités. Êtes-vous ? 1. _ Un homme 2. _ Une femme
L’échelle ordinale est une échelle de classement comme l’échelle nominale, dans laquelle les
nombres attribués à chaque modalité ont une relation d’ordre avec un continuum sous-jacent.
Notez de 1 à 5 la qualité gustative du produit X(1 étant la note la plus faible, 5 la note la plus
élevée)
L’échelle métrique possède les propriétés des échelles nominale et ordinale, mais elle
permet également de comparer les distances entre les objets, les modalités étant séparées
par des espaces équidistants. L’exemple le plus courant est celui du thermomètre, la
différence entre 0 °C et 1 °C étant la même qu’entre 1 °C et 2 °C, etc.
John Ndala
Exemple :de l’échelle d’osgood
John Ndala
Exemple :de l’échelle stapel
John Ndala
Exemple :des échelles de Likert et d’intention
John Ndala
Travail dirigé :Préciser de quel type d’échelle dont il est question :
John Ndala
Travail dirigé :réponses
John Ndala
Mesurer à l’aide d’un questionnaire
Le questionnaire présente une série de
Le questionnaire est un outil de collecte questions formalisées destinées à obtenir
d’information qui permet de quantifier et des informations auprès de répondants. Le
comparer l’information. Cette information questionnaire est un élément du processus
est collectée auprès d’un échantillon de collecte de données, lequel comprend
représentatif de la population visée par la également des instructions pour
recherche. sélectionner, approcher et interroger les
répondants
John Ndala
Les étapes de la conception d’un questionnaire(suite)
John Ndala
Structure d’un questionnaire
John Ndala
Types des questions :
John Ndala
Types des questions :
John Ndala
Mesurer à l’aide d’un questionnaire
L’objectif d’une échelle est d’éviter
La construction d’un questionnaire d’avoir à représenter un phénomène
amène à s’interroger sur la mesure abstrait – un construit – par le biais
des concepts. Comment mesurer, par d’une seule et unique variable, en
exemple, la qualité du service ? privilégiant l’utilisation d’indicateurs
qui permettent de représenter les
différentes facettes de ce construit.
John Ndala
Interprétation
Bien que plusieurs ouvrages fassent état d'une absence
de consensus sur le sujet, de nombreux auteurs estiment
qu'une valeur alpha supérieure à 0,7 est satisfaisante.
Un résultat supérieur à 0,9 est parfois considéré
comme souhaitable mais il peut être aussi le signe
d'énoncés trop similaires, diminuant paradoxalement la
fiabilité réelle de l'échelle
Exploration des valeurs possibles du coefficient α de
Cronbach Georges Martineau(1982):cinq cas à illustrer
John Ndala
John Ndala
Les principaux concepts de l’échantillonnage
Population Base de sondage
La population est l’ensemble des individus La base de sondage disponible pour réaliser l’enquête
auxquels on s’intéresse, autrement dit c’est ne correspond pas toujours exactement à la population.
le groupe entier tel que défini dans les Par exemple, une liste extraite d’un annuaire
d’entreprises peut ne pas être exhaustive, ne pas être à
objectifs de l’enquête jour, contenir des entreprises qui ont fait faillite, etc.
Erreur de couverture
L’écart d’adéquation entre la base de sondage et la population entière correspond à l’erreur de
couverture.
Échantillon
L’échantillon est le sous-ensemble de la population sélectionné pour représenter le groupe entier.
Erreur d’échantillonnage
On appelle erreur d’échantillonnage tout type d’erreur lié à la méthode d’échantillonnage. Dans le
schéma ci-dessus, on voit qu’un partie de l’échantillon se trouve à l’extérieur de la population.
Unité d’échantillonnage
On appelle unité d’échantillonnage l’unité de base de l’enquête.
John Ndala
Chapitre III: Les pratiques des enquêtes par
sondage aléatoire
John Ndala
John Ndala
Définition de sondage(suite)
On peut également dire que le sondage en
sciences humaines est un instrument de Les échantillons doivent avoir les
recherche de mesure, de structuration et de caractéristiques de la population de
présentateur de l'information fondée sur référence
l'observation de réponses à un ensemble de
question posés à un échantillon d'une De ces définitions, on retiendra 2
population. choses :
John Ndala
Les méthodes d’échantillonnage
John Ndala
Principes de sondage aléatoire
Cette loi exprime le fait que les caractéristiques d’un échantillon aléatoire
se rapprochent des caractéristiques statistiques de la population (ensemble
d’individus ou d’éléments) lorsque la taille de l’échantillon augmente à
l’infini.
Méthodes de sondage aléatoire(suite):Propriétés
P±t:
P {( | p – t ≤ ≤ p + t } 0,99
La consultation de la table P(t), nous indique t=2,58
Méthodes de sondage aléatoire(suite):illustration
CHAPITRE IV : INTERPRETATION DES SONDAGES
ALEATOIRES
Problèmes d'estimation et de Le problème se pose donc, à partir des
comparaison observations effectuées sur
On ne peut avoir une certitude l'échantillon, d'estimer avec le
absolue quant à la précision d'une maximum d'efficacité la valeur de telle
information recueillie pour sondage ou telle caractéristique de la population
et d'apprécier la précision de cette
estimation.
S2 la variance de X :
S2 =
John Ndala
Espérance mathématique et variance d'une moyenne d'échantillon
L'espérance mathématique de la moyenne d'un échantillon est égale à
la moyenne m dans la population dans laquelle est tiré cet échantillon,
quel que soit le mode de tirage
E= (
John Ndala
Estimateur d'une proportion
Soit une population comportant deux catégories d’individus
Les individus A en proportion p
Les individus B en proportion q= 1-p
Rappelons que la proportion p peut être considérée comme moyenne
m d'une variable de Bernoulli X prenant la valeur 1 pour les
individus A et 0 pour les individus B :
P=
John Ndala
Intervalle de confiance d’une estimation
Connaissant la loi de probabilité de l'estimation θ, nous pouvons
déterminer autour de la vraie valeur un intervalle ( -h i, +h2) tel que la
grandeur θ observée sur l'échantillon ait une probabilité l - ∞
d'appartenir à cet intervalle :
John Ndala
Estimation d’une moyenne
La moyenne d'un échantillon, provenant d'une population normale
est elle-même distribuée normalement θ une façon plus générale la
distribution de la moyenne d'un échantillon tiré dans une population
quelconque de moyenne m et d'écart-type δ, peut être assimilée, dès
que l'effectif de l'échantillon dépasse une trentaine d'unités, à une loi
normale de moyenne m et d'écart-type δ : = N (m, δ)
Dans le cas d'un échantillon tiré avec remise : δ =
Dans le cas d'un échantillon exhaustif :
δ=≠
John Ndala
DISTRIBUTION D’ECHANTILLONNAGE DE
A) Population finie =
B) Population infinie
John Ndala
DISTRIBUTION D’ECHANTILLONNAGE DE
Population finie :
Population infinie :
L'intérêt pratique de la distribution de est qu'elle peut fournir des
informations probabilistes concernant l'écart entre proportion
d'échantillon et la proportion de la population.
John Ndala
Estimation d’une moyenne :Application
On a tiré un échantillon exhaustif de 10.000 ménages dans la ville de
Lubumbashi comportant au total environ 700.000 ménages. Sur cet
échantillon, on a observé pour un mois déterminé une consommation
moyenne des ménages de 950Fc, avec un écart-type égal à 700 000Fc
Calculer l'intervalle de confiance se rapportant à l'estimation de la
consommation moyenne des- ménages dans la ville de Lubumbashi.
Données
N = 700.000 n= 10.000
= 950 S = 700
John Ndala
Estimation d’une moyenne :Application
John Ndala
Estimation d’une moyenne :Application
John Ndala
LES ASPECTS PRATIQUE DES SONDAGES ALEATOIRES
La mise en œuvre de la méthode des sondages aléatoires comporte
l’emploi d'un certain nombre de procédés dont les uns concernent
l'organisation du tirage de l'échantillon (simplification du tirage,
diminution du coût de collecte de l'information. etc.) et les autres,
l'amélioration de l'efficacité de la méthode.
La désignation de l’échantillon :La méthode des sondages aléatoires
suppose que chaque individu de la population a une probabilité non
nulle d'appartenir à l'échantillon et que l’on connaît cette probabilité
John Ndala
La base de sondage
Une base de sondage est constituée par une liste ou un fichier
énumérant les individus de la population-sans omission (puisque
chacun d'entre eux doit avoir une probabilité non nulle d'être désigné)
et sans répétition (pour assurer l'égalité des probabilités de sortie).
Procédés de tirage de l'échantillon
Le tirage d'un échantillon est une opération complexe. Aussi emploie-
t-on en pratique, certains procédés (utilisation de tables de nombres
aléatoires, tirages systématiques, tirages par grappes) pour le
simplifier.
John Ndala
Le sondage élémentaire et l’utilisation de la table des nombres aléatoires
La méthode élémentaire consiste à tirer l'échantillon en donnant à
chaque individu de la population la même probabilité d'être désigné.
Il faut .pour cela :
Se procurer ou établir la base de sondage ;
Numéroter les individus de 1 à N ;
Se donner la taille n de l'échantillon ;
Tirer n nombres compris entre 1 et N, en donnant à chacun des N
numéros la même probabilité d’être désignés.
John Ndala
Description d'une table de nombres aléatoires
Les statisticiens Maurice Kendall et B. Babington
Smith, vers la fin des années 1930, mettent au point les
premiers tests servant à valider que des nombres sont
statistiquement aléatoires.
Ces tests sont appliqués sur des suites de nombres et
servent à vérifier les caractéristiques souhaitées. Le
plus simple exige de compter le nombre de fois
qu'apparaissent les nombres 1, 2, 3... ; il est réussi si
ces nombres de fois sont à peu près égales.
John Ndala
Utilisation d'une table de nombre aléatoires
1.Décidez de la grandeur du nombre dont vous avez besoin. Par exemple, si
votre base de sondage est de dix unités, vous devez choisir un nombre entre 1 et
10 (10 compris). Vous devez utiliser deux chiffres pour être sûr que 10 a une
chance égale d’être inclus.
2. Décidez avant de commencer si vous allez parcourir la page vers la droite,
vers le bas, en travers, vers la gauche ou vers le haut.
3. Sans regarder la table, pointez un nombre en utilisant un stylo, un crayon, un
bâton ou même votre doigt.
4. Si ce nombre fait partie de la gamme dont vous avez besoin, prenez-le. Si ce
n’est pas le cas, continuez jusqu’au nombre suivant dans la direction que vous
avez choisie précédemment (en haut, en bas ou au travers de la page) jusqu’à ce
que vous trouviez un nombre qui soit dans la gamme dont vous avez besoin.
John Ndala
Il y a en gros deux “façons” de tirer un échantillon probabiliste :
le tirage aléatoire simple C'est le hasard pur, l'équivalent de tirer des noms
d'un chapeau ou du tirage au hasard à la loterie. Pour le réaliser, concrètement,
il faut avoir une liste de la population – la base d’échantillonnage-- et
numéroter chaque unité de la liste; ensuite, il faut soit utiliser une table de
nombres aléatoires qui déterminera quelles unités sont choisies ou, si on a une
liste sur fichier informatique, utiliser une procédure informatique (BASIC,
PASCAL, SPSS, etc.).
le tirage aléatoire systématique : Il s'agit ici de tirer seulement la première
unité de la liste au hasard, et de prendre ensuite les unités à un intervalle
prédéterminé (une unité à toutes les X unités). Il faut faire ou avoir une liste -
au moins conceptuelle - de la population et donc savoir combien d'unités elle
comprend. Il faut ensuite déterminer l’intervalle en fonction du nombre
d'unités requises dans l'échantillon et déterminer au hasard la première unité.
John Ndala
La probabilité de sélection peut être égale ou inégale; elle peut dépendre de divers facteurs.
John Ndala
AUTRES METHODES D’ECHANTILLONNAGE
échantillon stratifié On parle d'échantillon stratifié lorsque la fraction
de sélection diffère en fonction de certaines caractéristiques de la
population (sexe, région, statut, âge, etc.). On stratifie pour permettre
que toutes les catégories de la population qui nous intéressent soient
représentées en nombre suffisant
John Ndala
JE VOUS REMERCIE POUR VOTRE ATTENTION
John Ndala