0% ont trouvé ce document utile (0 vote)
99 vues17 pages

Etudes Quantitatives

Ce document décrit les différents types d'études quantitatives, notamment les panels, baromètres et omnibus. Il explique également les étapes de planification d'une étude quantitative, y compris l'échantillonnage, le questionnaire et l'analyse des résultats.

Transféré par

Saher Wajdi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
99 vues17 pages

Etudes Quantitatives

Ce document décrit les différents types d'études quantitatives, notamment les panels, baromètres et omnibus. Il explique également les étapes de planification d'une étude quantitative, y compris l'échantillonnage, le questionnaire et l'analyse des résultats.

Transféré par

Saher Wajdi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Etudes quantitatives

Le quantitatif commence là où le qualitatif se termine : à partir de 30 personnes (la loi des


grands nombre commence à 30 )
Il s’agit de valiser pondérer chiffrer

Mot clé : combien


Moyen : nombre important d’interviewés ( de 30 à 1000 )
Recueil rapide, questionnaire, questions souvent fermées

1. Les différentes études quantitatives

 Il existe 5 types d’études quantitatives en fonction des


moyens mis en œuvre :
Les études ad hoc
Spécialisée sur une question donnée. Donc très spécifique. Représente la majorité des études

Les 3 suivantes ont un point commun : ce sont des études répétitives (les autres sont one shot)

Les panels (très proches des baromètres)


Panels et baromètres ont la même structure d’échantillon quel que soit la date. Par contre la
nature de l’échantillon est différente.
Même structure d’échantillon et toujours les mêmes personnes sont interrogées tous les mois
pour mesurer les changements du comportement.
Suit une évolution individualisée
C’est le meilleur des 2 mais plus difficile car il faut fidéliser l’échantillon (compte des
milliers d’euros)
Grandes sociétés de panels : Nielsen, Uri Secodip, GFK

Les baromètres
La structure de l’échantillon est toujours la même mais ce ne sont pas toujours les mêmes
personnes.
Suit une évolution générale
Méthode utilisée pour mesurer la satisfaction en politique pour mesurer la côte de popularité

Les omnibus
Tous les jours ou tous les mois on prend un échantillon de population qui nous intéresse.
Fait par une boite d’études : TNS Sofrès, CSA, …
On leur pose 3-4 questions dans un questionnaire de 30 questions sur des problématiques
différentes et pour des sociétés différentes.
Les clients de l’omnibus sont multiples = c’est une étude mutualisée autour d’une société
d’études = le coût de l’étude est très faible par rapport à l’étude ad hoc spécifique.

1
Les meilleures études sont des études non déclaratives : elles doivent saisir des faits et non
des paroles

Ex : pour connaître les ventes de coca il faut interroger des panels sur les stocks, les achats,
les ventes dans l’informatique… il suffit d’obtenir l’autorisation.

 Les 4 variables de l’étude quantitative qui différencient


les 5 types d’études quanti:
 La fréquence : one shot ou répétitive
 L’échantillon : la structure peut changer (structure = comment échantillon se
décompose : selon les critères choisis en connaissance de cause : 50% f, 50% h,
25%jeunes…)
 Le questionnaire
 Le nombre de clients

 Les étapes d’un plan de sondage

 Problématique / question à résoudre


 L’échantillonnage
 Construction du questionnaire + choix de la méthode de passation et son test
 Administration du questionnaire + saisie éventuelle
 Traitements statistiques
 Analyse de base devant les chiffres (tri à plat / croisé)
 Les tests statistiques et les analyses d’association
 La synthèse

La problématique, question à résoudre : exemple : fil rouge, vous travaillez pour Danone qui
veut lancer un nouveau concept de yaourt aux légumes
Problématiques : les pratiques des Français sont-elles favorables au lancement d’un tel
concept ?
Quelle est leur perception de ce concept ?

2. L’échantillonnage

1/ Les étapes de l’échantillonnage : taille et structure

 La préparation :
a. Définir la population à étudier
Les critères :
Eléments à interroger : qui dans unité choisie ?
Unité d’échantillonnage : individu, ménage, entreprise ?
Critère géographique :
Critère temporel : 9 h du matin, on ne touche que les inactifs
b. Définir la base de sondage = liste à partir de laquelle la sélection des éléments
va être faite

2
Etude sur un lancement de yaourts aux légumes ? : échantillonnage de l’étude = le ménage
(unité ), élément à interroger : la personne qui fait le plus souvent les courses.

2/ Le choix d’une méthode de tirage : Les techniques


d’échantillonnage et leurs incidences : les méthodes aléatoires et
les méthodes empiriques.

Etude de la structure : population > qui dedans ? > en prendre un échantillon qui doit être
représentatif
2 techniques de tirage : aléatoire : garantit la représentativité = isomorphe
empirique : des techniques d’approximations, non prouvé mais en
fonction de tous les faits
Aléatoire = « un échantillon est dit aléatoire ou probabiliste lorsque n’importe lequel des
membres de la population étudiée peut appartenir à l’échantillon et ceci avec une probabilité
connue à l’avance » (et généralement la même pour tous)

On peut avoir une représentativité aléatoire quand on a un fichier exhaustif de la population


qu’on souhaite étudier. (le fichier FT, les grands voyageurs SNCF…)

Les 4 techniques de tirage aléatoire :

 Echantillon aléatoire simple


« baser le tirage sur le hasard pur »
Condition : Disposer d’une base exhaustive numérotées de 1 à n. (comme au loto)

 Echantillon aléatoire systématique


Quand on n’a pas de liste nominative
En 3 étapes :
1. Calcul d’un intervalle de sondage (N/n)
2. Tirage au hasard d’un nombre i entre 1 et N/n
3. Sélection systématique des individus i, i+N/n

Exemple : intervalle de sondage : N (population) = 100 000 ; n (échantillon) = 1 000


Intervalle de sondage N/n = 100 000 / 1 000 = 100
Donc i (tiré au sort entre 1 et 100) = 12
Individus interrogés : 12 ; 112 ; 212 ; 312…
Toujours chercher à prendre l’échantillon qui représente le mieux la population choisie et sa
structure.

 Echantillon aléatoire stratifié


Quand on ne veut oublier personne
On ne raisonne pas sur une population entière mais sur des sous populations
Quand par exemple il y a des signes astrologiques mal équilibrés : ça donne simplement 12
verseaux sur 400 personnes interrogées : ce n’est pas représentatif des verseaux = donc
aléatoire simple ne va pas.

3
Il faut donc stratifier : en prendre 35 de chaque signe. Le tirage reste aléatoire mais au sein de
strates.
Les strates sont proportionnelles (selon l’importance de la catégorie professionnelle) ou non
(30 cadres, 30 agriculteurs)
210 personnes = minimum pour étudier les catégories socioprofessionnelles (car 7 x 30)

 Echantillon aléatoire en grappe


Quand on n’a pas de liste fiable
Tirage au sort de ville ou région pour ne pas se taper la France entière
Ce tirage existe pour de mauvaises raisons : c’est uniquement pour faciliter l’étude
On prend une grappe : ville, quartier… (chacune est une miniature de toute la population
étudiée) tirage au sort d’un échantillon de grappes
Recensement dans chaque grappe retenue
« Jamais un coup de dé n’abolira le hasard » Mallarmé

Les 4 techniques de tirage empirique


Pour quand on n’a pas de fichier exhaustif (les mangeurs de yaourt…)

 Echantillon de convenance
Ou accidentel : est constitué d’individus qui se trouvaient à l’endroit et au moment où
l’information est collectée (micro trottoirs, magasins, sorties de caisse…)

 Echantillon a priori
Sélectionner des individus dont on imagine qu’ils ont l’information cruciale pour l’étude
(ex : les membres d’un club de pétanque quand on fait l’étude sur la pétanque)

 Echantillon boule de neige


Pour les populations spéciales
Ex : des chirurgiens, des chauffeurs routiers spécialisés dans l’international…)
Faire construire l’échantillon par les interviewés eux-mêmes : bouche à oreille

 Echantillon par quotas


Reconstituer l’échantillon à partir de critères choisis et considérés comme essentiels
A partir de critères importants pour l’étude pour réduire les quotas habituels : critères
sociodémographiques : sexe, âge, CSP, région, statut familial…ce sont les 5 critères grands
publics principaux.
Mais certains critères ne seront pas pris en compte : être rousse alors que c’est une spécificité
rare qui pourrait l’éliminer
= méthode pas très satisfaisante intellectuellement mais c’est mieux que rien

4
3/ La détermination de la taille d’un échantillon et ses incidences

Deux facteurs clés :


+ on souhaite des résultats précis, plus l’échantillon nécessaire est important
+ on augmente la taille, plus le coût à supporter est important
Choix d’échantillon en taille n’a rien à voir avec la représentativité. Il s’agit de pouvoir
donner des conclusions précises alors que la représentativité est ce qui permet de faire l’étude.

Il faut commencer par calculer la précision d’un résultat = la marge d’erreur.


E = +- 1,96  ( (p x q) / n )

E = erreur, écart possible


1,96 = valeur de la loi normale pour un taux de signification de 95% par convention
p = pourcentage ou fréquence, (mais ce n’est pas un effectif) de ceux qui ont choisi telle
réponse
q = événement contraire : tous ceux qui n’ont pas choisi la réponse
n = taille de l’échantillon

A choisi par 42 % ; B choisi par 36,4 %


On trouve alors la marge d’erreur pour une réponse donnée A : 5,6. Si on avait choisi de
demander à toute la population française, la marque A aurait été choisie par au moins 37,7 %
et au plus 48,3%.
SI on avait interrogé toute notre cible…
La vérité est quelque part entre ces bornes mais on ne sait pas où. L’échantillon est petit, d’où
un écart de 11% (2x 5,6 car c’est au plus et au moins…)

On calcule ensuite la marge d’erreur de la réponse B. Le principe est de voir s’il est possible
que les choix s’intervertissent. B = 36,4 . Après calcul de la marge d’erreur, B serait choisi
par au moins 31, 5% de la population entière et au plus par 41,9%
Conclusion de l’ex : Si apparemment A est préféré par notre échantillon représentatif de la
population, si on interrogeait effectivement l’ensemble de la population, B pourrait être
choisi. Il y a une intersection sévère entre la marque A et B = échantillon est trop petit car on
ne peut pas conclure avec une réponse sure du choix qui serait fait par l’ensemble de la
population.

Pour doubler la précision d’une étude = x4 pour la taille de l’échantillon car on compte sa
précision à partir de sa racine !

Si un mauvais choix de la taille d’échantillon peut empêcher de conclure l’étude, il y a


différentes techniques pour calculer la taille idéale de l’échantillon :

1. Calcul d’une moyenne

n = Z2 . Sx2 /e2

5
Ex : un parc veut estimer à 10 ct près le montant des achats effectués par chaque visiteur dans
un lieu donné. Calculer n en sachant que la conclusion doit être formulée avec un seuil de
confiance de 95 %.
Etude pilote (50 personnes) : achats de 0 à 6 €
Problème posé : quel est l’écart type ?
Approximation admise = (valeur la plus haute – valeur la plus basse)/6
soit ici (600-0)/100 = 6
n = 1,96 X 1,96 X 100 X 100 / 10X10
n = 384

2. Calcul d’un pourcentage

n = Z2 . Ps (1-Ps)/e2
Où e est la précision souhaitée
Où Z est la valeur de la loi normale correspondant aux hypothèses choisies (en général : 1,96)
Où n est la taille de l’échantillon
Où Ps est la proportion observée dans l’échantillon

Ex : même contexte du parc.


65 % des visiteurs pilotes ont acheté un produit.
On veut connaître le % précisément (avec une précision de 5 %)
Quel échantillon ?
n = 1,96 x 1,96 x 0,65 x (1-0,65) / 0,05 x 0,05
n = 350

6
3. Le questionnaire
Définir les thèmes à aborder
Façon de les aborder
Forme et structure du questionnaire
Formulation

Le fond

Une check list en 4 points :

1- cette question est-elle strictement nécessaire ? = que nous apporte le résultat ?


2- une seule question suffira-t-elle ? savoir faire des questions extrêmement précises, bien
formulées et sur un seul thème à la fois
3- l’interviewé pourra-t-il répondre ? S’il sait, s’il est intelligent, si c’est possible de répondre
à une telle question (genre combien d’heures avez-vous passé devant la télé en 2006 ?)
4- voudra-t-il répondre (avec exactitude)? sujets tabous : sexualité, politique, hygiène…

La forme
 La structure
Forme normale en entonnoir :
Général en haut = forme de l’entonnoir
Plus précis = resserré
Fin = réouverture
1/ Présentation de l’enquêteur et de l’enquête
2/ Questions d’introduction : qui mettent les gens à l’aise et auxquelles ils vont sûrement
répondre oui.
Ex : pour les YAL : vous arrive t-il de consommer des produits laitiers ? parfois une seule
question d’introduction suffit
3/ Questions qualifiantes (filtres éventuels) questions sur la consommation de yaourts, de
légumes…
4/ questions de mise en route (début de l’entonnoir)
Avez-vous déjà eu l’initiative de mélanger yaourt et légume ? Idée de créer un yaourt aux
légumes vous paraît t-elle appétissante ? Est-ce une bonne appellation ?
5/ Questions spécifiques : questions sur le yaourt lui-même : Avec quels légumes l’aimeriez
vous ? Avec des morceaux ou non ? Salé, sucré, aigre doux, épicé… ?
Packaging : vertical, plat, horizontal ?
Quel lait ?
6/ Fiche signalétique : pour faire des tris croisés : entre 5 et 12 questions sur le profil
 Sexe
 Age (par tranche pour ne pas gêner)
 Activité professionnelle (et après c’est à nous de reclasser pas CSP, car
souvent ils ne le savent pas )

7
 …

 Le choix des mots : rédaction des questions et des réponses


Vocabulaire : bannir tout vocabulaire ambigu (plusieurs sens, ou un adverbe de temps dont la
régularité n’est pas la même pour tous).
Utiliser des phrases courtes avec un vocabulaire précis et connu : brièveté (une ligne, une
ligne et demie)
Style rédactionnel : privilégiez le style direct
Pas de négation, encore moins de double négation

 La mise en page
Soignez le questionnaire : aérer les questions, utiliser des symboles…

 Le codage : numérotation des questions


Ne l’oubliez pas…

Les types de questions


 Ouvertes
Elles laissent l’interviewé entièrement libre du choix de sa réponse dans sa forme et dans sa
longueur…
« Quelle est votre couleur préférée ? » = Quand 5ième choix est : une autre couleur : laquelle ?
= à réponses chiffrées (assez faciles à saisir)
« quel est votre âge ? »
= à réponses de type « non chiffrées » (plus difficiles à traiter)
« Quelle est votre profession ? »

 Fermées
Avec elles on impose à l’interviewé une forme précise de réponse et un nombre limité de
choix de réponses…
1- les dichotomiques oui / non ; j’aime / j’aime pas
deux choix de réponse, réponse unique.
2- les choix multiples à réponse unique.
3- les choix multiples à réponses multiples.
Ex : parmi les réponses suivantes entourez celles que vous aimez : on traite autant de variable
que de modalités
Ex : classez les de 1 à 10 : attention souvent ils répondent n’importe quoi
Ou choisissez en 3 : pareil
Attention c’est de la fausse sophistication

8
Les échelles d’évaluation = échelles spécifiques
Sert à évaluer des prises de position spécifiques (échelle d’évaluation) Quanti sert à mesurer
par des systèmes d’échelles

-Likert :
Une échelle de Likert est un questionnaire psychologique permettant de quantifier les
attitudes. Elle est composée d'une série d'affirmations auxquelles le sujet doit indiquer
son degré d'accord. Les items d'un tel questionnaire sont auparavant sélectionnés en
fonction de leurs qualités psychométriques.
Echelle verbale de nul à excellent ou comme la marguerite : un peu, beaucoup…
De « Tout à fait d’accord »… à « Pas du tout d’accord » (5 ou 7 modalités)
On affecte un chiffre de 1 à 5 (ou 7) ou de -2 à + 2 (-3 à +3) aux réponses. (c’est le coefficient
multiplicateur dans les calculs par la suite)

-Opposition
Différentiel sémantique (Osgood)
verbale avec rien au milieu avec un support papier / internet
« situez-vous sur l’échelle suivante »
Froid ______________chaud
Bien _____________ pas bien
Cher____________ pas cher
Principe : l’interviewé se situe quelque part entre deux adjectifs de sens parfaitement opposé.
5 à 7 échelons le plus souvent.

-BâtirA supports sémantiques correspondant à des notes


une échelle dont les libellés sont à des distances psychologiquement égales les unes des
autres :
Ex : de extrêmement mauvais à extrêmement bon (avec notation de 0 à 100 en dessous).
De 1 à 100
De extra mauvais à …

-Principe
Echelles d’intention (en %)
: recueillir une intention déclarée de comportement.
Par ex : de aucune chance à tout à fait certain… (d’acheter) avec des échelons numériques (de
10 % en 10 %, de 0% à
100 %)

-Visuelles
Autres échelles
: avec des smileys
Echelle à somme constante :
Ex : répartir 100 euros en fonction de la valeur d’utilité attribuée à chaque partie de l’objet :
donne le prix psychologique

9
4. Les modes de passation
3 phases

1- pré-test du questionnaire : auprès de 15-30 personnes interrogées dans les conditions


imaginées
Nature des erreurs :
 choix du vocabulaire (alambiqué, flou, phrases longues, style pas assez direct).
Symptômes : demandes de précisions par les interrogés
 Mauvais choix des modalités. Symptômes : trop forte concentration des réponses
sur une modalité (éviter de mettre une réponse médiane ni oui ni non). Si trop de
réponses positives : 28/30 : mettre de quoi connaître le degré de positivité pour les
départager.
 Manque de clarté des instructions dans un QAA (questionnaire auto administré).
Symptôme : questionnaire incomplètement rempli ou faible taux de retour.

2- administration proprement dite


3- contrôles de validité

Les choix possibles :


Le face-à-face
Acceptation : environ ½
Au foyer de l’interviewé
En sortie de caisse ou équivalent (mall intercept interview) sur le lieu d’achat mais éviter les
lieux publics, les lieux mobiles, les espaces découverts. Il faut des lieux fermés
CAPI ( computer assisted personnal interview) : fait la différence entre les petites boites et les
grandes. Enquête assistée par ordinateur : avec des plaquettes = questionnaire
automatiquement saisi.

Conditions :
 au foyer : si étude est complexe : avec des visuels à montrer… si le questionnaire est
long (+ de 2h) si on doit tester des produits, des packs, des pubs…
 En sortie de caisse : si l’entretien n’excède pas 10 min, si on doit utiliser des
stimulants visuels (maquette)
 CAPI : évite la saisie, permet un contrôle automatique des filtres et des réponses :
respecte les passages directs d’une question à une autre = meilleure fiabilité,
présentation aléatoire des questions

Le téléphone
Ses avantages :
 Rapidité
 Envergure géographique (récent car avant la couverture du tel était faible)
 Coût inférieur au face à face (pas de déplacement)
 Atouts du CATI (T : téléphone)

Problèmes :
Fichiers d’utilisateurs

10
L’auto-administré traditionnel
Le QAA traditionnel :
Ses avantages :
 Envergure géographique (internet planétaire, tous les réseaux)
 Information sensible
 Anonymat
 Coût

Mais de nombreuses faiblesses : pas de retour, pas représentatif…

L’auto-administré intéractif

Les critères d’évaluation d’un mode de collecte :

• Flexibilité (possibilité d’intervenir en temps réel)


• Diversité des questions (échelles variées…)
• Utilisation de stimuli physiques
• Envergure géographique
• Contrôle global
• Contrôle de l’échantillon
• Contrôle de l’environnement de la collecte
• Contrôle du travail des enquêteurs
• Quantité d’informations
• Taux de réponse
 Anonymat
• Biais « sociaux »
• Biais dûs à l’enquêteur
• rapidité
• coût
Ne pas oublier les moyens de contrôle !

11
5. Les techniques de traitement
L’analyse de résultat : 4 types de variables conditionnent les résultats

1/ La variable nominale

Cette idée de produit vous semble t-elle intéressante ?

Oui 480

Non 320

Oui 60 %

Non 40 %

C’est forcément une variable verbale et non hiérarchisées les unes par rapport aux autres. Ici il
s’agit d’un variable dichotomique.

Conclusion : c’est une question fermée, variable dichotomique, variable nominale


Variable = intérêt vis à vis du produit : résultat donné en effectif sur un échantillon de 800.
Ensuite on le met en pourcentage.

Puis on calcule la marge d’erreur :


e= +- 1,96  pq / n
= 1,96 60x40 /800
= 1,96  3
= +- 3,4

Conclusion : le produit est intéressant pour au moins 56,5 % et au plus 63,5 % des interrogés.

Analyses descriptives :
1// Une description graphique
Graphe de la distribution des résultats en % (camemberts ou « tuyaux d’orgue » ou
« rateaux »)
Règle du graphe adéquat : camembert pour quand on a peu de modalités
Histogramme quand on a quelques modalités
Rateau : quand on a beaucoup de modalités

12
2// Une description numérique
Détermination de la modalité modale, qui correspond à l’effectif le plus élevé : ici c’est le
« oui »

Tout ce qui est descriptif c’est du tri à plat.

Tri croisé = analyse plus explicatives

F H 18-29 30-44 45-59 60 et +

oui 320 160 160 150 98 72

non 80 240 40 50 102 128

= on peut croiser les réponses avec le sexe et l’âge des interrogés

Si on analyse le tri croisé qui prend en compte le sexe :

1 : comment se répartissent les réponses par sexe = on s’intéresse au point de vue des femmes
= grand majorité de femmes intéressées
F H
Oui : 60% 80% 40%
Non : 40% 20% 60%
50 % femmes interrogées 50 % hommes interrogés
= 400 sur les 800 = 400 sur les 800

2 : Comment les sexes se répartissent par réponse : ici on s’intéresse à qui a dit oui : 2 fois
plus de femmes que d’hommes ont dit oui.
F H
Oui : 60% = 480 oui 66% 33%
Non : 40% = 320 non 25% 75%
= 800 réponses

Comme on fait du marketing stratégique, on cible les femmes


Puis calcul de la marge d’erreur :
e= +- 1,96  40x60 (oui x non) / 400(hommes)
= +- 4,8 %
Au max, 44,8% des hommes sont intéressés, au min 35,2%.
Les non intéressés sont au moins 55, 2% et au max 64,2%
Le maximum des hommes qui pourraient être intéressés est bien inférieur au minimum des
hommes qui ne sont pas intéressés. Donc on est sûr que les hommes sont toujours un
maximum à ne pas être intéressés. Du coup ce n’est pas la peine de vérifier pour les femmes,
car c’est écrasant.

13
2/ La variable ordinale
Ce produit vous semble t-il intéressant ?
pas du tout intéressant 120

pas vraiment intéressant 180

plutôt intéressant 320

très intéressant 180

N 800

pas du tout intéressant = 37,5% sont 15%


plutôt contre
pas vraiment intéressant 22,5%

plutôt intéressant = 62,5% sont 40%


plutôt pour
très intéressant 22,5%

N 100%

Il s’agit d’une variable hiérarchisée pour des variables de modalités verbales : échelle de
Lickerts

Représentation graphique idéale : un histogramme


Calcul de la marge d’erreur et analyse : dans tous les cas, le produit semble intéressant.

Le cumul au plus :
-- : 15% (plus celui d’après : 22,5)
- : 15 + 22,5 = 37,5 % (plus celui d’après : 40)
+ : 37,5 + 40 = 77,5% (plus celui d’après : 22,5)
++ : 77,5 + 22,5 = 100%
Conclusion : il y a 37,5 % qui considèrent que le produit est au plus pas vraiment intéressant (
mais dedans il y à ceux qui n’aiment pas du tout

La cumul au moins :
-- : on part de 100 % ( - ceux qui n’aiment pas : 15)
- : 85% (-ceux qui n’aiment pas : 22,5)
+ : 62,5% (-ceux qui aiment assez : 40)
++ : 22,5% = ceux qui le trouvent très intéressant
Conclusion : Il y a 62, 5% qui considèrent que le produit est au moins plutôt intéressant avec
le cumul au moins car quand on enlève ceux qui n’aiment pas du tout et ceux qui n’aiment pas

14
trop, il reste tous ceux qui disent au moins que c’est intéressant (et au plus qu’ils aiment
carrément)

Avec les cumuls, on fait des diagrammes en escalier (il descend avec un cumul au moins).
Détermination de la modalité modale (assez intéressant) et des quartiles (avec quelle modalité
on atteint 25%, 50%, 75%).
On atteint le premier quartile avec la modalité 2 ; le 2ième, 3ième et 4ième quartile avec la
modalité 3 ; le dernier quartile avec la modalité 4

Ce produit vous semble t-il … ?

F H CSP+ CSP-
-- 50 70 40 = 10% 80 = 20%
- 60 120 40 = 10% 140 = 35%
+ 160 160 180= 45% 140 = 35%
++ 130 50 140 = 35% 40 = 10 %

Le mode : 160 / 180 : f, H et CSP + et – ont l’air de tous aimer le produit


Mais en passant aux pourcentages, le tri croisé montre une opposition CSP + et – après
vérification avec la marge d’erreur

Tri à plat = à l’œil nu ; pas le tri croisé

3/ La variable scalée :

12,5 % très cher 30


16,8 coef 1
4,1% assez cher 10
coef 2
20,8 20,8 % ni … ni… 50
coef 3
62,4 41,6% assez bon 100
marché coef 4

20,8% très bon marché 50


coef 5

Modalité intermédiaire : quand il y a une donnée en plus qui est un zéro naturel :

Moyenne = 30 x 1 + 10x 2 + 50 x 3 + 100 x 4 + 5 x 50 = 850 / n (240) = 3,56 c’est la


moyenne sur une note sur 5.

15
Neutralité de cette 5ième case est-elle possible ou est-ce un fourre tout pour les indécis et
signifie en fait plein de réponses hétéroclites
Et 62,4% des interrogés trouvent le produit au moins assez bon marché.

Description graphique avec un histogramme, puis un palier croissant pour le cumul au moins
Une description numérique : ici on peut réintroduire des chiffres et que ça ait un sens
Détermination du mode (sur le diagramme en baton)
Détermination de la médiane (sur le diagramme en escalier) c’est la modalité qui partage pile
poil en 2 l’échantillon

Calcul de la moyenne : somme des nixi (les variables x les modalités/ n = 3,54 sur 5
modalités. La moyenne ici , c’est 3 : c’est l’équivalent du ni ni

Ecart type :
Somme des nixi : 850
Somme des ni (xi)2 = 3370 (30x1 + 10x4 + 100x16)
Variance : 3370 / 240 – 3,54x3,54 = 1,5
Ecart type : racine de la variance = 1,5 = 1,224 (sert à mesurer les déséquilibres dans les
réponses
160 réponses se concentrent au milieu
80 réponses dans les extrêmes = sert à mesurer les répartitions

4/ la variable numérique
Donner une note de 1 à 5 :
Classement Total échant : 300 Quartile
1 80 80 1er
2 40 120
3 40 160 2eme
4 80 240 3eme
5 60 300 4eme

Moyenne : somme des xini /n = 900 / 300 =3


Ecart type 2,2
C’est énorme, car on a des chiffres élevés aux extrêmes

Les tris à plat

Les tris croisés

6. Les tests de signification


Ce sont les thèses d’adéquation aux lois mathématiques : loi normale ou loi de poisson …
Intérêt : c’est prévu, prévisible, donc on peut modérer. Si notre calcul ressemble à une loi
normale alors c’est une variable qui suivra généralement cette loi.

16
Le Khi 2

Le Kolmogorov Smirnoff

17

Vous aimerez peut-être aussi