Méthodologie d’enquête et
d’analyse des données :
Sphinx
1
Composantes du logiciel
le Sphinx Primo :
il permet de concevoir un questionnaire, de saisir
et dépouiller les réponses et d'explorer les
données enregistrées.
- le Sphinx Plus² :
Il offre les mêmes fonctionnalités que "Primo"
mais intègre des techniques d'analyse
multidimensionnelle plus avancées (analyse
factorielle).
- le Sphinx Lexica :
il permet d'enrichir les possibilités d'analyse
2lexicale et de contenu existantes dans "Primo" ou
Les fonctionnalités
offertes par SPHINX
ETAPE 1 : Créer l’enquête
ETAPE 2 : Définir le contexte
ETAPE 3 : Créer le questionnaire
ETAPE 4 : Visualiser le questionnaire Le
Logiciel SPHINX:
ETAPE 5 : Imprimer le questionnaire
ETAPE 6 : Saisir les résultats
ETAPE 7 : Dépouiller les résultats : tris à
plat
ETAPE 8 : Créer des tris croisés
3
ETAPE 9 : Imprimer les résultats
METHODOLOGIE DES
ENQUETES
Rappel des principes de l’enquête par
questionnaire
Toute enquête, qu’elle soit réalisée dans le
cadre d’une étude quantitative ou qualitative,
est organisée autour de quatre stades :
- la définition des objectifs, et la détermination
de l’échantillon ;
- l’élaboration et la diffusion du questionnaire ;
- la collecte des données ;
- les traitements, analyses et diffusion des
4
résultats.
La définition des objectifs
Pour être fiable et efficace, une enquête doit
être menée avec précaution. Il est donc
nécessaire de déterminer les objectifs de
l’étude avant de définir sa mise en œuvre. La
première phase d’une étude consiste ainsi à
définir précisément le problème qui doit être
traité.
La détermination de l’échantillon
Dans le cadre d’un sondage, la réalisation de
l’étude s’effectue sur une partie de la
population appelée échantillon. Mais la
détermination de l’échantillon doit être
calculée afin de fournir des informations et
5 des résultats cohérents avec ceux qui seraient
Le questionnaire:
La phase d’élaboration du questionnaire consiste à
:
- rédiger toutes les questions du questionnaire ; -
organiser et structurer le questionnaire ;
- mettre en page et diffuser le formulaire.
Le pré-test:
La phase de conception d’un questionnaire
s’achève en général par le test d’une enquête
pilote qui permet de valider, sur un nombre
restreint de personnes, les choix effectués dans le
cadre de l’étude.
Le recueil des données
Selon le mode d’administration d’enquête qui est
choisi (papier, Internet, téléphone, etc.…),
6
différents modes de collecte des données peuvent
Le dépouillement et l’analyse des données
Une fois les données collectées, il s’agit d’analyser les
résultats. Il est d’abord conseillé de prendre connaissance des
résultats des variables considérées indépendamment les unes
des autres et de procéder ensuite à leur analyse ou à leur
mise en relation avec d’autres variables. Ainsi, plusieurs
niveaux de traitement des résultats peuvent être distingués :
- le dépouillement des résultats permet de donner rapidement
un aperçu de l’ensemble des résultats de l’enquête en
produisant des tableaux ou graphiques de résultats et des
listes de réponses ;
- la phase d’analyse permet d’effectuer des tests et des
calculs sur les résultats extraits du dépouillement. Elle offre
également la possibilité de mettre en forme les résultats dans
le but d’accéder aux résultats les plus significatifs de
l’enquête, en les présentant de façon synthétique. C’est par
cette phase d’analyse et d’interprétation que vous pourrez
prendre des décisions adaptées à l’étude
7
.
La présentation des résultats
La présentation des résultats significatifs de
l’enquête est l’objectif final de toute étude. Les
résultats retenus pour le rapport d’étude sont
ceux qui sont susceptibles de conduire aux
prises de décisions et aux actions. Il s’agit
ensuite de les présenter dans un rapport
d’étude qui, par sa mise en page, ses
commentaires, ses graphiques, etc…, mettra en
valeur les résultats significatifs. Il s’agit ainsi
s’une tâche parfois complexe et délicate : elle
nécessite de prendre connaissance des
analyses de données pour ne sélectionner que
les plus caractéristiques, les plus importantes
et les plus synthétiques.
8
Etape 1: créer
l’enquête.
9
ETAPE 2 : Définir le
contexte
10
ETAPE 3 : Créer le
questionnaire
11
ETAPE 4 : VISUALISER LE
QUESTIONNAIRE
12
ETAPE 5 : IMPRIMER LE
QUESTIONNAIRE
13
ETAPE 6 : SAISIR LES
RESULTATS
14
ETAPE 7 : DEPOUILLER LES
RESULTATS : Tris à plat
15
ETAPE 8 : CRÉER DES TRIS
CROISES
16
17
Traitement et analyses
On distingue deux types de données :
quantitatives et qualitatives.
Les analyses quantitatives permettent de
traiter les données dites « structurées
» comme les réponses aux questions
fermées, échelles ou numériques. Ces
analyses peuvent être appelées «
univariées » quand elles ne s’intéressent
qu’à une seule question de l’enquête (ou
variable), « bivariées » quand deux
variables sont prises en compte
simultanément, ou « multivariées » quand
18
le nombre de variables considéré est
Questions de vocabulaire….
Vocabulaire
Une observation
= 1 individu ayant rempli un questionnaire
Citation (Effectif)
Nombre totale de personne ayant répondu à une modalité de réponse
Par exemple 55 personnes ont répondu qu’elles étaient en manque de
reconnaissance dans leur travail
La fréquence
C’est le pourcentage des réponses données par les individus pour chaque
modalité de réponse.
Ex : 50 % des personnes estiment en être manque de reconnaissance dans le
travail (sur un total de 110 répondants)
Cette fréquence peut être calculée par rapport aux citations ou aux
observations
Tableau de Citations (par défaut)
Le calcul (%) sur fait alors sur le nombre de réponses totales données par les
individus (quand plusieurs réponses sont possibles : QCM)
Ex : Le choix de la modalité « Manque de reconnaissance » représente 27,5 %
de l’ensemble des citations données (n = 200)
19
Tableau des observations
Les analyses statistiques
Objectifs
Résumer de façon claire et structurée
l’information qui a été collectée
Vérifier les hypothèses qui ont été formulées
au départ
Deux types d’analyse complémentaire
Analyse à plat
Tris croisés
Analyse Bi & Multivariées
(test d’hypothèses recherchées)
20
Analyse à plat : 1° regard sur les
résultats de l’enquête
La présentation des résultats se fera à l’aide :
de tableaux de fréquence et/ou
de représentations graphiques adéquates
(camemberts/secteurs, diagramme, histogrammes…)
d’indicateurs de tendance centrale (moyenne…) et
de dispersion (écart-type…) pour les variables
métriques
Ces résultats seront :
ordonnés de manière logique selon un plan
(thématique) et non présentés questions par
questions
et brièvement commentés de manière à faire
21 ressortir les points importants.
Exemple de Tableau de fréquence : Questions fermées à
choix unique
Dans quel service travaillez vous ?
Serives Nb. cit. Fréq.
Production 80 26,7%
Administration 77 25,7%
Informatique 50 16,7%
RH 45 15,0%
Méthodes 34 11,3%
Recherche & 14 4,7%
Développement
TOTAL OBS. 300 100%
Les modalités de réponse proposées sont reportées avec le
nombre de citations (effectifs en valeur absolue : n) et les
fréquences associées (freq : %).
On a demandé un classement des réponses par ordre décroissant
Conseil : dans Sphinx, sélectionner Copier en texte. Cela permet
de coller le tableau sous forme de texte, transformable en tableau
(après avoir sélectionné du début à la fin du tableau – Insérer –
22 Tableau) au lieu de le coller en image simple.
Diverses représentations graphiques possibles
4,7%
GEA 26,7% 11,3% GEA
26,7% Génie Civil
Génie Civil 25,7% Informatique
Biologie
Informatique 16,7%
Chimie
Biologie 15,0% 15,0% Génie Chimique
Chimie 11,3%
Génie Chimique 4,7%
Barres
16,7% 25,7%
Camembert /
4,7%
GEA
Secteur
25,7%
26,7%
11,3% Génie Civil
Informatique
26,7% 26,7%
Biologie 25,7%
Chimie
Génie Chimique
16,7%
16,7%
15,0%
15,0%
15,0%
11,3% Anneaux 11,3%
Donuts 4,7%
4,7%
4,7%
GEA Génie Inform Biolog Chimi Génie GEA Génie Inform Biolog Chimi Génie
Civil atique ie e Chimi Civil atique ie e Chimi
que que
23 Profils 16,7% 25,7%
Histogramme
Exemple de Tableau de fréquence : Question fermées
à choix multiple sans classement ? :
Citation ou observation ?
Quelles sont les fonctionnalités que vous utilisez le plus (au moins 3 fois par semaine) ?
Plusieurs réponses sont possibles
Nb. cit. Fréq. Nb. cit. Fréq.
Fonctionnalités-internet Fonctionnalités-internet
Messsagerie 19 95,0% Messsagerie 19 19,6%
surf-navigation 17 85,0% surf-navigation 17 17,5%
chat 5 25,0% chat 5 5,2%
téléchargement 9 45,0% téléchargement 9 9,3%
résaux sociaux 10 50,0% résaux sociaux 10 10,3%
forum 8 40,0% forum 8 8,2%
blog 7 35,0% blog 7 7,2%
achats en ligne 13 65,0% achats en ligne 13 13,4%
jeux en réseaux 9 45,0% jeux en réseaux 9 9,3%
autre 0 0,0% autre 0 0,0%
TOTAL OBS. 20 TOTAL CIT. 97 100%
Obs : nombre total d’individus Citat° : nombre de réponses totales
interrogés (*) (à préférer dans ce cas)
24 données
Exemple de Tableau de fréquence : Question fermées
à choix multiple avec classement
Dans la liste suivante, quels sont pour vous les 5
principaux facteurs de stress ?
25
Exemple de Tableau de fréquence :
Question fermées échelle (1/2)
D’après vous, la qualité de l’écoute du management
est-elle ?
Qualité D’écoute Nb. cit. Fréq.
Non réponse 126 42,0%
Très satisfaisante (1) 48 16,0%
Assez satisfaisante 99 33,0%
Peu satisfaisante 20 6,7%
Pas du tout satisfaisante (4) 7 2,3%
TOTAL CIT. 300 100%
Calcul d’un score
Moyenne = 1,92 Ecart-type = 0,74
La question est à réponse unique sur une échelle.
Les paramètres sont établis sur une notation de 1 (Très satisfaisante) à
4 (Pas du tout satisfaisante).
Les calculs sont effectués sans tenir compte des non-réponses.
La moyenne est calculée automatiquement et s’interprète selon la
26 notation des extrémités de l’échelle
Exemple de Tableau de fréquence :
Question fermées échelle (avec score) (2/2)
Tableau 1 – Aperçu des scores pour les problèmes physiques (en %
et selon la moyenne décroissante)
Aucun Léger Désagré Troub Trouble Troubles
Score désagré désagré ment les s insoutena
moyen ment (1) ment (2) modéré (4) sérieux bles (6)
(3) (5)
Epaules 1.93 24 19 17 24 11 5
Nuque 1.92 24 29 19 23 8 6
Bas du 1.84 30 16 19 20 10 7
dos
Yeux 1.66 26 23 23 27 7 4
Haut du 1.31 41 20 16 14 6 2
dos
27
Tableaux de groupes de questions:
Question avec modalités de réponses communes et thématiquement proches
Quel est lieu d’usage
des TIC ?
Quel est le comportement vis-
à-vis des TIC (dépendance)
28
29
Exemple de Tableau de fréquence :
Question ouvertes numérique
Combien d'heures en moyenne passez vous par jour sur internet
(messagerie, surf, chat, jeux en réseau, téléchargement...)
heures Nb. cit. Fréq.
val = 1 4 20,0%
val = 2 4 20,0%
val = 3 4 20,0%
val = 4 3 15,0%
val = 5 2 10,0%
val = 6 3 15,0%
TOTAL CIT. 20 100%
Minimum = 0, Maximum = 15
30 Moyenne = 3,20 Ecart-type = 1,74
Exemple de Tableau de fréquence :
Question ouvertes textes
Indiquez par un mot "positif" ce que
signifie internet pour vous ?
Ouverture 5 25,0%
Relations 5 25,0%
connaissance 4 20,0%
Interactions 3 15,0%
Proximité 2 10,0%
liberté 1 5,0%
Nombre de valeurs différentes : 6
'Ouverture' est le plus cité : 5
31 observations.
Les analyses bi et multi-variées :
test d’hypothèse de recherche
Analyses plus poussées
Implique deux ou plus de deux questions dont on croisera les
réponses.
Le choix des analyses à mettre en place dépendra de
plusieurs facteurs ;
du nombre de variables mises en relation
du statut des variables testées
Nominale : « Plutôt satisfait ou Plutôt insatisfait de ses conditions
de travail »
Ordinale : « classement des réponses du plus faible au plus fort »
de l’objet de l’analyse.
32
Objectifs Analyse appropriée
Tester un lien d’association entre deux variables nominales Test du Chi-deux avec
(fermée et fermée) calcul du
Existe-t-il un lien entre le fait que l’ouvrier se déclare satisfait Coefficient de
ou insatisfait de ses conditions de travail et / contingence
le type de formation qu’il déclare avoir préalablement suivi ? –
Le fait d’être un H/F - selon son äge…
Tester un lien de causalité entre une variable cause nominale Analyse de variance
(VI) et une variable effet métrique/numérique (VD) (Anova) - Fischer
Le type de formation/l’âge/le sexe détermine t-il l’indice de
satisfaction perçue des conditions de travail?
Tester un lien d’association entre deux variables ordinales Coefficient de
Existe un lien entre l’attractivité de certaines TIC et le type corrélation de
de loisirs préférés Spearman-Kendall
(dans les deux cas , l’individu devait classer des propositions).
Tester un lien d’association entre deux variables métriques Coefficient de
(Numériques corrélation linéaire
Le score d’épanouissement professionnel (de 1 à 8) est-il de Pearson
associée à l’âge des salariés (à l’ancienneté " ? Au salaire)
Tester un lien de causalité entre une variable cause métrique Analyse de régression
(ou binaire) et une (ou plusieurs) variable(s) effet(s) linéaire
métrique(s)
Le salaire a-t-il une influence sur l’évaluation de la charge
33 cognitive perçue
ETAPE 9 : IMPRIMER LES
RESULTATS
34
Bibliographie
De Ketele JM , Roegiers X. (2009) Méthodologie du recueil
d'informations - Fondements des méthodes d'observation, de
questionnaire, d'interview et d'étude de documents De Boeck
Collection: Méthodes en sciences humaines (4° édition)
Ganassali S (2009) Les enquêtes par questionnaire avec Sphinx.
Les différentes étapes de la réalisation d'une enquête au moyen
d'un questionnaire. (PEARSON)
Blanchet A. (2005) Les techniques d'enquête en sciences
sociales. Observer, interviewer, questionner: DUNOD
DE SINGLY, F. (1992). L’enquête et ses méthodes : le
questionnaire. Paris : Nathan.
GHIGLIONE, R., MATALON, B. (1978). Les enquêtes sociologiques.
Théories et pratique. Paris : Armand Colin.
JAVEAU, C. (1982). L’enquête par questionnaires. Paris : Éditions
35 d’Organisation