Etudes Quantitatives
Etudes Quantitatives
Les 3 suivantes ont un point commun : ce sont des études répétitives (les autres sont one shot)
Les baromètres
La structure de l’échantillon est toujours la même mais ce ne sont pas toujours les mêmes
personnes.
Suit une évolution générale
Méthode utilisée pour mesurer la satisfaction en politique pour mesurer la côte de popularité
Les omnibus
Tous les jours ou tous les mois on prend un échantillon de population qui nous intéresse.
Fait par une boite d’études : TNS Sofrès, CSA, …
On leur pose 3-4 questions dans un questionnaire de 30 questions sur des problématiques
différentes et pour des sociétés différentes.
Les clients de l’omnibus sont multiples = c’est une étude mutualisée autour d’une société
d’études = le coût de l’étude est très faible par rapport à l’étude ad hoc spécifique.
1
Les meilleures études sont des études non déclaratives : elles doivent saisir des faits et non
des paroles
Ex : pour connaître les ventes de coca il faut interroger des panels sur les stocks, les achats,
les ventes dans l’informatique… il suffit d’obtenir l’autorisation.
La problématique, question à résoudre : exemple : fil rouge, vous travaillez pour Danone qui
veut lancer un nouveau concept de yaourt aux légumes
Problématiques : les pratiques des Français sont-elles favorables au lancement d’un tel
concept ?
Quelle est leur perception de ce concept ?
2. L’échantillonnage
La préparation :
a. Définir la population à étudier
Les critères :
Eléments à interroger : qui dans unité choisie ?
Unité d’échantillonnage : individu, ménage, entreprise ?
Critère géographique :
Critère temporel : 9 h du matin, on ne touche que les inactifs
b. Définir la base de sondage = liste à partir de laquelle la sélection des éléments
va être faite
2
Etude sur un lancement de yaourts aux légumes ? : échantillonnage de l’étude = le ménage
(unité ), élément à interroger : la personne qui fait le plus souvent les courses.
Etude de la structure : population > qui dedans ? > en prendre un échantillon qui doit être
représentatif
2 techniques de tirage : aléatoire : garantit la représentativité = isomorphe
empirique : des techniques d’approximations, non prouvé mais en
fonction de tous les faits
Aléatoire = « un échantillon est dit aléatoire ou probabiliste lorsque n’importe lequel des
membres de la population étudiée peut appartenir à l’échantillon et ceci avec une probabilité
connue à l’avance » (et généralement la même pour tous)
3
Il faut donc stratifier : en prendre 35 de chaque signe. Le tirage reste aléatoire mais au sein de
strates.
Les strates sont proportionnelles (selon l’importance de la catégorie professionnelle) ou non
(30 cadres, 30 agriculteurs)
210 personnes = minimum pour étudier les catégories socioprofessionnelles (car 7 x 30)
Echantillon de convenance
Ou accidentel : est constitué d’individus qui se trouvaient à l’endroit et au moment où
l’information est collectée (micro trottoirs, magasins, sorties de caisse…)
Echantillon a priori
Sélectionner des individus dont on imagine qu’ils ont l’information cruciale pour l’étude
(ex : les membres d’un club de pétanque quand on fait l’étude sur la pétanque)
4
3/ La détermination de la taille d’un échantillon et ses incidences
On calcule ensuite la marge d’erreur de la réponse B. Le principe est de voir s’il est possible
que les choix s’intervertissent. B = 36,4 . Après calcul de la marge d’erreur, B serait choisi
par au moins 31, 5% de la population entière et au plus par 41,9%
Conclusion de l’ex : Si apparemment A est préféré par notre échantillon représentatif de la
population, si on interrogeait effectivement l’ensemble de la population, B pourrait être
choisi. Il y a une intersection sévère entre la marque A et B = échantillon est trop petit car on
ne peut pas conclure avec une réponse sure du choix qui serait fait par l’ensemble de la
population.
Pour doubler la précision d’une étude = x4 pour la taille de l’échantillon car on compte sa
précision à partir de sa racine !
n = Z2 . Sx2 /e2
5
Ex : un parc veut estimer à 10 ct près le montant des achats effectués par chaque visiteur dans
un lieu donné. Calculer n en sachant que la conclusion doit être formulée avec un seuil de
confiance de 95 %.
Etude pilote (50 personnes) : achats de 0 à 6 €
Problème posé : quel est l’écart type ?
Approximation admise = (valeur la plus haute – valeur la plus basse)/6
soit ici (600-0)/100 = 6
n = 1,96 X 1,96 X 100 X 100 / 10X10
n = 384
n = Z2 . Ps (1-Ps)/e2
Où e est la précision souhaitée
Où Z est la valeur de la loi normale correspondant aux hypothèses choisies (en général : 1,96)
Où n est la taille de l’échantillon
Où Ps est la proportion observée dans l’échantillon
6
3. Le questionnaire
Définir les thèmes à aborder
Façon de les aborder
Forme et structure du questionnaire
Formulation
Le fond
La forme
La structure
Forme normale en entonnoir :
Général en haut = forme de l’entonnoir
Plus précis = resserré
Fin = réouverture
1/ Présentation de l’enquêteur et de l’enquête
2/ Questions d’introduction : qui mettent les gens à l’aise et auxquelles ils vont sûrement
répondre oui.
Ex : pour les YAL : vous arrive t-il de consommer des produits laitiers ? parfois une seule
question d’introduction suffit
3/ Questions qualifiantes (filtres éventuels) questions sur la consommation de yaourts, de
légumes…
4/ questions de mise en route (début de l’entonnoir)
Avez-vous déjà eu l’initiative de mélanger yaourt et légume ? Idée de créer un yaourt aux
légumes vous paraît t-elle appétissante ? Est-ce une bonne appellation ?
5/ Questions spécifiques : questions sur le yaourt lui-même : Avec quels légumes l’aimeriez
vous ? Avec des morceaux ou non ? Salé, sucré, aigre doux, épicé… ?
Packaging : vertical, plat, horizontal ?
Quel lait ?
6/ Fiche signalétique : pour faire des tris croisés : entre 5 et 12 questions sur le profil
Sexe
Age (par tranche pour ne pas gêner)
Activité professionnelle (et après c’est à nous de reclasser pas CSP, car
souvent ils ne le savent pas )
7
…
La mise en page
Soignez le questionnaire : aérer les questions, utiliser des symboles…
Fermées
Avec elles on impose à l’interviewé une forme précise de réponse et un nombre limité de
choix de réponses…
1- les dichotomiques oui / non ; j’aime / j’aime pas
deux choix de réponse, réponse unique.
2- les choix multiples à réponse unique.
3- les choix multiples à réponses multiples.
Ex : parmi les réponses suivantes entourez celles que vous aimez : on traite autant de variable
que de modalités
Ex : classez les de 1 à 10 : attention souvent ils répondent n’importe quoi
Ou choisissez en 3 : pareil
Attention c’est de la fausse sophistication
8
Les échelles d’évaluation = échelles spécifiques
Sert à évaluer des prises de position spécifiques (échelle d’évaluation) Quanti sert à mesurer
par des systèmes d’échelles
-Likert :
Une échelle de Likert est un questionnaire psychologique permettant de quantifier les
attitudes. Elle est composée d'une série d'affirmations auxquelles le sujet doit indiquer
son degré d'accord. Les items d'un tel questionnaire sont auparavant sélectionnés en
fonction de leurs qualités psychométriques.
Echelle verbale de nul à excellent ou comme la marguerite : un peu, beaucoup…
De « Tout à fait d’accord »… à « Pas du tout d’accord » (5 ou 7 modalités)
On affecte un chiffre de 1 à 5 (ou 7) ou de -2 à + 2 (-3 à +3) aux réponses. (c’est le coefficient
multiplicateur dans les calculs par la suite)
-Opposition
Différentiel sémantique (Osgood)
verbale avec rien au milieu avec un support papier / internet
« situez-vous sur l’échelle suivante »
Froid ______________chaud
Bien _____________ pas bien
Cher____________ pas cher
Principe : l’interviewé se situe quelque part entre deux adjectifs de sens parfaitement opposé.
5 à 7 échelons le plus souvent.
-Principe
Echelles d’intention (en %)
: recueillir une intention déclarée de comportement.
Par ex : de aucune chance à tout à fait certain… (d’acheter) avec des échelons numériques (de
10 % en 10 %, de 0% à
100 %)
-Visuelles
Autres échelles
: avec des smileys
Echelle à somme constante :
Ex : répartir 100 euros en fonction de la valeur d’utilité attribuée à chaque partie de l’objet :
donne le prix psychologique
9
4. Les modes de passation
3 phases
Conditions :
au foyer : si étude est complexe : avec des visuels à montrer… si le questionnaire est
long (+ de 2h) si on doit tester des produits, des packs, des pubs…
En sortie de caisse : si l’entretien n’excède pas 10 min, si on doit utiliser des
stimulants visuels (maquette)
CAPI : évite la saisie, permet un contrôle automatique des filtres et des réponses :
respecte les passages directs d’une question à une autre = meilleure fiabilité,
présentation aléatoire des questions
Le téléphone
Ses avantages :
Rapidité
Envergure géographique (récent car avant la couverture du tel était faible)
Coût inférieur au face à face (pas de déplacement)
Atouts du CATI (T : téléphone)
Problèmes :
Fichiers d’utilisateurs
10
L’auto-administré traditionnel
Le QAA traditionnel :
Ses avantages :
Envergure géographique (internet planétaire, tous les réseaux)
Information sensible
Anonymat
Coût
L’auto-administré intéractif
11
5. Les techniques de traitement
L’analyse de résultat : 4 types de variables conditionnent les résultats
1/ La variable nominale
Oui 480
Non 320
Oui 60 %
Non 40 %
C’est forcément une variable verbale et non hiérarchisées les unes par rapport aux autres. Ici il
s’agit d’un variable dichotomique.
Conclusion : le produit est intéressant pour au moins 56,5 % et au plus 63,5 % des interrogés.
Analyses descriptives :
1// Une description graphique
Graphe de la distribution des résultats en % (camemberts ou « tuyaux d’orgue » ou
« rateaux »)
Règle du graphe adéquat : camembert pour quand on a peu de modalités
Histogramme quand on a quelques modalités
Rateau : quand on a beaucoup de modalités
12
2// Une description numérique
Détermination de la modalité modale, qui correspond à l’effectif le plus élevé : ici c’est le
« oui »
1 : comment se répartissent les réponses par sexe = on s’intéresse au point de vue des femmes
= grand majorité de femmes intéressées
F H
Oui : 60% 80% 40%
Non : 40% 20% 60%
50 % femmes interrogées 50 % hommes interrogés
= 400 sur les 800 = 400 sur les 800
2 : Comment les sexes se répartissent par réponse : ici on s’intéresse à qui a dit oui : 2 fois
plus de femmes que d’hommes ont dit oui.
F H
Oui : 60% = 480 oui 66% 33%
Non : 40% = 320 non 25% 75%
= 800 réponses
13
2/ La variable ordinale
Ce produit vous semble t-il intéressant ?
pas du tout intéressant 120
N 800
N 100%
Il s’agit d’une variable hiérarchisée pour des variables de modalités verbales : échelle de
Lickerts
Le cumul au plus :
-- : 15% (plus celui d’après : 22,5)
- : 15 + 22,5 = 37,5 % (plus celui d’après : 40)
+ : 37,5 + 40 = 77,5% (plus celui d’après : 22,5)
++ : 77,5 + 22,5 = 100%
Conclusion : il y a 37,5 % qui considèrent que le produit est au plus pas vraiment intéressant (
mais dedans il y à ceux qui n’aiment pas du tout
La cumul au moins :
-- : on part de 100 % ( - ceux qui n’aiment pas : 15)
- : 85% (-ceux qui n’aiment pas : 22,5)
+ : 62,5% (-ceux qui aiment assez : 40)
++ : 22,5% = ceux qui le trouvent très intéressant
Conclusion : Il y a 62, 5% qui considèrent que le produit est au moins plutôt intéressant avec
le cumul au moins car quand on enlève ceux qui n’aiment pas du tout et ceux qui n’aiment pas
14
trop, il reste tous ceux qui disent au moins que c’est intéressant (et au plus qu’ils aiment
carrément)
Avec les cumuls, on fait des diagrammes en escalier (il descend avec un cumul au moins).
Détermination de la modalité modale (assez intéressant) et des quartiles (avec quelle modalité
on atteint 25%, 50%, 75%).
On atteint le premier quartile avec la modalité 2 ; le 2ième, 3ième et 4ième quartile avec la
modalité 3 ; le dernier quartile avec la modalité 4
F H CSP+ CSP-
-- 50 70 40 = 10% 80 = 20%
- 60 120 40 = 10% 140 = 35%
+ 160 160 180= 45% 140 = 35%
++ 130 50 140 = 35% 40 = 10 %
3/ La variable scalée :
Modalité intermédiaire : quand il y a une donnée en plus qui est un zéro naturel :
15
Neutralité de cette 5ième case est-elle possible ou est-ce un fourre tout pour les indécis et
signifie en fait plein de réponses hétéroclites
Et 62,4% des interrogés trouvent le produit au moins assez bon marché.
Description graphique avec un histogramme, puis un palier croissant pour le cumul au moins
Une description numérique : ici on peut réintroduire des chiffres et que ça ait un sens
Détermination du mode (sur le diagramme en baton)
Détermination de la médiane (sur le diagramme en escalier) c’est la modalité qui partage pile
poil en 2 l’échantillon
Calcul de la moyenne : somme des nixi (les variables x les modalités/ n = 3,54 sur 5
modalités. La moyenne ici , c’est 3 : c’est l’équivalent du ni ni
Ecart type :
Somme des nixi : 850
Somme des ni (xi)2 = 3370 (30x1 + 10x4 + 100x16)
Variance : 3370 / 240 – 3,54x3,54 = 1,5
Ecart type : racine de la variance = 1,5 = 1,224 (sert à mesurer les déséquilibres dans les
réponses
160 réponses se concentrent au milieu
80 réponses dans les extrêmes = sert à mesurer les répartitions
4/ la variable numérique
Donner une note de 1 à 5 :
Classement Total échant : 300 Quartile
1 80 80 1er
2 40 120
3 40 160 2eme
4 80 240 3eme
5 60 300 4eme
16
Le Khi 2
Le Kolmogorov Smirnoff
17