Traitement informatisé des données
M1 Psychologie de la santé et Psychologie du travail
M. Muller – Département de Psychologie
Création d'une bible de codification :
- Nommer les variables étudiées (les caractères spéciaux sont à éviter - accents ou espaces par exemple)
- Déterminer des valeurs pour chaque modalité des variables dichotomiques ou ordinales
- Vous pouvez laisser une case vide pour les valeurs manquantes ou déterminer une valeur spécifique à ces
données manquantes (même valeur en général pour toutes les variables – par exemple : -9)
Saisie des données dans Excel :
En général, la première ligne permettra la saisie des noms de variables
De la même façon, la première colonne sera souvent réservée à la saisie du numéro de participant
Enregistrer fréquemment son travail dans un dossier réservé à l'étude.
SI VOUS UTILISER UNE ANCIENNE VERSION SPSS (< 11) : Quand la saisie est intégralement faite, il faut
enregistrer le fichier en tant que feuille de calcul Excel 4 pour la lecture dans SPSS.
[FICHIER → ENREGISTRER SOUS → TYPE DE FICHIER : feuille de calcul Excel 4.0]
Importation des données dans SPSS avec lecture des noms de variables :
Ouvrir le logiciel SPSS pour Windows [DEMARRER → PROGRAMMES → SPSS pour Windows]
Une fois dans SPSS, demandez à ouvrir un fichier :
[FICHIER → OUVRIR → …]
Rendez-vous dans le dossier que vous avez réservé à votre étude, et sélectionnez le type de fichier Excel :
[TYPE : Excel (*.xls)]
Le fichier Excel dans lequel vous avez saisi vos données apparaît. Il ne vous reste plus qu'à le sélectionner et à
l'ouvrir.
Une fenêtre des propriétés de l'ouverture des fichiers apparaît. Si vous avez pensé à saisir le nom des variables
sur la première ligne de votre fichier Excel pour devez alors cocher la case :
[LIRE LE NOM DES VARIABLES → OK]
Définition des variables :
SPSS possède deux onglets en bas à gauche de l'écran : le premier est réservé à l'affichage des données alors que
le second permet d'afficher les variables et de les éditer.
Une autre façon de jongler entre les deux fenêtres est de double-cliquer sur le nom de la variable dans la fenêtre
réservée à l'affichage des données ou sur le numéro de la variable en début de ligne dans la fenêtre d'affichage
des variables.
Dans la fenêtre d'affichage des variables, déterminez l'échelle de mesure de votre variable (nominale, ordinale ou
échelle). Rem. : les catégories socioprofessionnelles constituent un exemple type de variable nominale ; Une
échelle d'attitude (5 choix de réponses possibles allant de "pas du tout d'accord" à "tout à fait d'accord" par
exemple) constitue une variable ordinale ; l'âge ou la taille d'une personne constituent des variables d'intervalle
(échelle dans SPSS).
Vous pouvez également renommer votre variable le cas échéant.
Vous pouvez maintenant définir quatre paramètres liés à votre variable : le type, les valeurs manquantes, les
étiquettes, et le format de la colonne.
TYPE : le type de variable est le plus souvent numérique.
LES VALEURS MANQUANTES : elles ont déjà été rentrées lors de la saisie des données dans Excel. Cette
étape consiste simplement à définir pour le logiciel SPSS quelles valeurs devront être traitées en tant que
données manquantes. Dans la majorité des cas, on définit une(des) valeur(s) manquante(s) discrète(s). Dans
notre cas (voir Création d'une bible de codification), il suffit de rentrer la valeur -9 dans valeurs manquantes
discrètes.
LES ETIQUETTES : elles sont essentielles car elles permettent de se repérer lors des traitements des données.
L'étiquette de variable constitue une description utile de la variable. En général, on saisira dans cette case la
question ou l'item correspondant à la variable.
Les étiquettes de valeur sont à définir à partir de la bible de codification. Pour chaque valeur saisie dans Excel
faites correspondre l'étiquette définie : par exemple, pour une variable "sexe" la valeur 1 correspondra l'étiquette
"homme" et la valeur 2 correspondra à l'étiquette "femme".
LE FORMAT DE LA COLONNE : sa définition est accessoire puisqu'il ne s'agit ici que d'une question de
présentation. Il est laissé à la libre appréciation du chercheur. Il en va de même de la longueur et du nombre de
décimales qui sont à adapter en fonction de la variable et des préférences visuelles du chercheur.
Remarque :
Si plusieurs variables comportent des propriétés communes (par exemple des valeurs d'étiquettes identiques dans
le cadre des items à une échelle), il est possible de copier [sélection puis CTRL + C] les caractéristiques
identiques puis de les coller [CTRL + V] autant de fois que nécessaire dans les variables aux propriétés
redondantes.
Remarque 2 :
Toutes les variables peuvent être déplacées en sélectionnant la ligne dans la fenêtre affichage des variables ou la
colonne dans la fenêtre affichage des données puis en la glissant à l'endroit souhaité.
Quelques opérations courantes dans SPSS :
- Insérer une variable [DONNEES → INSERER UNE VARIABLE]
- Insérer une observation [DONNEES → INSERER UNE OBSERVATION]
- Afficher les étiquettes de valeurs [AFFICHAGE → ETIQUETTES DE VALEURS]
De nombreux étudiants chaque année sont perdus parce qu'ils ne connaissent pas cette possibilité.
Essayez ce menu dès que vous aurez une base de données enregistrée pour vous représenter à
quoi il sert
- Recoder une variable (par exemple, recoder les valeurs 1 et 2 en -1 et 1) [TRANSFORMER →
RECODER → CREATION DE VARIABLE]. Désignez un nom et une étiquette pour la nouvelle
variable (variable destination) puis validez par [REMPLACER], puis [ANCIENNES ET NOUVELLES
VALEURS], désignez les anciennes et nouvelles valeurs correspondantes puis cliquez [AJOUTER].
Quand cette tâche est achevée cliquez sur [POURSUIVRE] puis sur [OK].
- Calculer une nouvelle variable (par exemple, inverser une variable, calculer la racine carrée d'une
variable, créer une nouvelle variable qui correspond à la moyenne de trois anciennes variables dans le
cas d'un score factoriel par exemple) [TRANSFORMER → CALCULER] puis nommer la nouvelle
variable (variable destination) et utiliser le listing des anciennes variables et les fonctions arithmétiques
(par exemple MEAN pour calculer la moyenne) pour déterminer les valeurs de la nouvelle variable
ainsi créée. Validez par [OK] pour créer cette nouvelle variable.
- Calculer des moyennes, des écarts-types, des variances, des médianes, … [ANALYSE →
STATISTIQUES DESCRIPTIVES → FREQUENCES puis cliquez que le bouton STATISTIQUES],
cochez les indices que vous souhaitez obtenir, validez par [POURSUIVRE]. N'oubliez pas de
sélectionner les variables pour lesquelles vous souhaitez obtenir ces indices.
- Produire des moyennes pour chaque condition expérimentale séparément [ANALYSE → COMPARER
LES MOYENNES → MOYENNES]. Les variables dépendantes sont celles qui pour lesquelles vous
souhaitez obtenir des indices statistiques. Les variables explicatives sont celles qui constituent les
conditions expérimentales. Utilisez le menu [OPTIONS] pour sélectionner les indices statistiques
choisis, puis [POURSUIVRE] et [OK].
- Faire un graphique de type "bâtons" [GRAPHES → BATONS…], de types courbes [GRAPHES →
COURBES…], …
- Editer un graphique (par exemple, titre, légende, axes…) : double-cliquez sur le graphique choisi puis
éditez le graphique selon votre convenance en utilisant menu, icones ou clic droit.
- Faire une analyse de corrélation [ANALYSE → CORRELATION → BIVARIEE]. Sélectionnez les
variables que vous souhaitez corréler puis le coefficient de corrélation attendu. Validez par [OK]
- Faire un Khi-deux [ANALYSE → STATISTIQUES DESCRIPTIVES → TABLEAUX CROISES].
Sélectionnez la variable que vous souhaitez en ligne dans votre tableau et la variable que vous souhaitez
en colonne dans votre tableau. Cliquez sur [STATISTIQUES] et cochez la case [KHI-DEUX]. Si vous
souhaitez obtenir les effectifs théoriques et/ou les pourcentages en ligne ou en colonne, cliquez sur
[CELLULES] et cochez la case [THEORIQUE] et/ou [POURCENTAGES:ligne/colonne]. Pour
terminer l’opération : [POURSUIVRE], puis [OK]
- Faire un test t pour échantillon unique [ANALYSE → COMPARER LES MOYENNES → TEST T
POUR ECHANTILLON UNIQUE]. Sélectionnez la(les) variable(s) à tester et déterminer la valeur de
test. Utilisez le menu option pour choisir le seuil de significativité (par défaut : 95%)
- Faire un test t pour échantillons indépendants [ANALYSE → COMPARER LES MOYENNES →
TEST T POUR ECHANTILLONS INDEPENDANTS]. Sélectionnez la(les) variable(s) à tester et le
critère de regroupement (la variable qui va constituer les deux groupes d'observations). Définissez le
critère de regroupement [DEFINIR GROUPES] c'est-à-dire indiquez au programme les valeurs de la
variable de regroupement qui vont constituer les deux groupes. Utilisez le menu option pour choisir le
seuil de significativité (par défaut : 95%)
- Faire un test t pour échantillons appariés [ANALYSE → COMPARER LES MOYENNES → TEST T
POUR ECHANTILLONS APPARIES]. Sélectionnez les deux variables qui doivent être testées (créer
un couple de variable en les sélectionnant toutes les deux puis faites les basculer dans la fenêtre
centrale) puis validez par [OK]. Utilisez le menu option pour choisir le seuil de significativité (par
défaut : 95%)
- Faire une ANOVA à un facteur [ANALYSE → COMPARER LES MOYENNES → ANOVA 1
FACTEUR]. Sélectionner votre(vos) variable(s) dépendante(s) et votre variable qui permet de
regrouper les sujets (critère). Allez dans [OPTIONS] et cochez [CARACTÉRISTIQUES] puis
[POURSUIVRE]. Puis [OK]. Si vous souhaitez connaître les différences entre des couples de modalités
de votre variable critère [CONTRASTES]. Pour chaque couple à tester, rentrer un contraste à l’aide des
coefficients que vous associerez à vos modalités, puis [POURSUIVRE]. Dans ce cas, pour savoir
qu’elle hypothèse retenir lors des tests de Student, demander un test de Levene sur l’égalité des
variances [OPTIONS], cochez la case [TEST D’EGALITE DES VARIANCES] puis validez et [OK].
- Faire une ANOVA à mesures répétées [ANALYSE → MODELE LINEAIRE GENERAL →
MESURES REPETEES]. Déterminez un nom du critère intra-sujet et le nombre de mesures répétées
(nombre de niveaux). Cliquez sur [AJOUTEZ], puis [DEFINIR]. Sélectionnez les variables qui
constituent vos mesures répétées en les faisant basculer dans l’espace prévu à cet effet [VARIABLES
INTRA-SUJETS] et cliquez sur [OPTIONS] afin de sélectionner [STATISTIQUES DESCRIPTIVES].
Validez en cliquant sur [POURSUIVRE]. Puis [OK].
- Etudier l’interaction de deux facteurs [ANALYSE → MODELE LINEAIRE GENERAL →
UNIVARIE]. Sélectionnez votre variable dépendante puis vos variables en interaction dans
[FACTEURS FIXES]. Cliquez sur [MODELE] pour vérifier que la case [FACTORIEL COMPLET] est
cochée, puis [POURSUIVRE] et [OK].
- Faire une régression simple ou multiple [ANALYSE → REGRESSION → LINEAIRE]. Sélectionnez
votre variable dépendante et votre(vos) variable(s) explicative(s), [OK]. Si vous ne testez pas un
modèle, mais si vous cherchez à connaître les variables qui expliquent le mieux les variations de votre
VD, respectez les étapes précédentes et utilisez la méthode [ASCENDANTE].
- Faire une analyse factorielle [ANALYSE → FACTORISATION → ANALYSE FACTORIELLE].
Sélectionnez les variables dont vous voulez extraire des composantes. [EXTRACTION] demander le
[GRAPHIQUE DES VALEURS PROPRES]. Choisissez selon votre recherche une extraction par
[VALEURS PROPRES SUPERIEURES A 1] ou déterminez le [NOMBRE DE FACTEURS]. Puis,
[ROTATION → VARIMAX → POURSUIVRE → OK]. Remarque : vous pouvez demander à ne
garder que les saturations inférieures à une valeur (par exemple, 0,40) que vous choisissez dans le menu
[OPTIONS], de la même façon que vous pouvez demander dans ce même menu de trier les variables
lors de la présentation des résultats. Ceci permet une meilleure lisibilité des matrices.
- Examiner la fiabilité d'une échelle [ANALYSE → POSITIONNEMENT → ANALYSE DE
FIABILITE]. Sélectionnez les variables qui constituent le facteur à tester. Vérifier que le modèle utilisé
est celui de l’Alpha de Cronbach (par défaut dans le logiciel). Puis de préférence [STATISTIQUES], et
cochez les cases qui vous intéressent par exemple [ITEMS, ECHELLE et ECHELLE SANS L’ITEM],
puis [POURSUIVRE → OK]