0% ont trouvé ce document utile (0 vote)
129 vues50 pages

SPSS A 2021

Transféré par

Mohamed EL GHAZOUANI
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • tests non paramétriques,
  • historique des commandes,
  • Odesi,
  • corrélations,
  • données qualitatives,
  • statistiques descriptives,
  • variables,
  • formatage des tableaux,
  • importation de données,
  • recensement 2016
0% ont trouvé ce document utile (0 vote)
129 vues50 pages

SPSS A 2021

Transféré par

Mohamed EL GHAZOUANI
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • tests non paramétriques,
  • historique des commandes,
  • Odesi,
  • corrélations,
  • données qualitatives,
  • statistiques descriptives,
  • variables,
  • formatage des tableaux,
  • importation de données,
  • recensement 2016

Initiation à SPSS

à l’aide des microdonnées du


recensement 2016

Caroline Patenaude
Bibliothécaire – Données | Publications gouvernementales
Bibliothèque des lettres et sciences humaines
https://bib.umontreal.ca/guides/donnees-statistiques-geospatiales/donnees-statistiques
Objectifs généraux
• Connaitre les principales caractéristiques de l’interface.
• Se familiariser avec les composantes d’un fichier de microdonnées.
• Réviser de petites notions statistiques.
• Maitriser les fonctions de base: statistiques descriptives

• Exercices:
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes

Accent mis sur la maitrise du logiciel et des procédures descriptives et non sur les statistiques
inférentielles et l’interprétation de tests d’hypothèses.
Logiciel et fichiers de microdonnées

Où trouver SPSS ? Logithèque > Procédures d'installation SPSS


• SPSS AMOS: logiciel de modélisation par équation structurelle (analyses multivariées,
relations complexes, …)

Option PSPP – Logiciel libre

Où trouver des fichiers de microdonnées?


• Statistique Canada
• Odesi
• Nesstar
• ICPSR
• Banque Mondiale
• Baromètres
• Voir Guide Données statistiques

Pourquoi SPSS? (Stata, SAS, R,…)


SPSS et cie…

https://twitter.com/kai_arzheimer/status/974280365446717441/photo/1

Problems with using Microsoft Excel for Statistical Analysis & Graphics
Fichier de microdonnées utilisé

Recensement de la population, 2016 [Canada] Fichier de micro-données à grande diffusion


(FMGD): Fichier des particuliers

« Le fichier du recensement de 2016 fournit des données sur les caractéristiques de la


population canadienne. Il contient un échantillon de 2,7 % de réponses anonymes tirées du
questionnaire du Recensement de 2016, soit 930 421 individus ».

« Les fichiers de micro-données sont les seuls produits donnant aux utilisateurs l'accès à des
données non agrégées. L'utilisateur des FMGD peut grouper et manipuler ces variables en
fonction de ses besoins et de l'objet de ses recherches ».

Le FMGD de 2016 comporte 123 variables (pour l’atelier 20)

Télécharger le fichier du recensement via Odesi

Dictionnaire du recensement
Guide de l’utilisateur
Ouvrir et explorer un fichier de
microdonnées avec SPSS
Ouverture d’un fichier de microdonnées
Un seul fichier .sav
OU
Fichier de données brutes (.dat) + fichier de syntaxe (.sps) > changer le ‘Path’

Fichier composé de lignes de + un fichier de syntaxe


chiffres représentant les valeurs
des variables (ou modalités) pour
chaque unité d’observation (ou
cas: individu, ménage…)

Ouverture d’un fichier de données d’un autre format (excel, txt, csv, stata, sas,…):
Ficher > Ouvrir (OU Importer des données) > Données (bien suivre les indications, attention à la mise en page du
fichier original). On peut également exporter les données en différents formats.
Tour d’horizon de SPSS > Fenêtres

Éditeur de données Statistics Viewer .sps


.sav .spv

2 onglets: Sortie
Vue des données Tableaux et
Vue des variables graphiques
Éditeur de données > Vue des variables
Liste des variables et de leurs caractéristiques (Type, Valeurs, Valeurs manquantes, Mesure …).

Permet d’explorer, ajouter, éditer, supprimer, déplacer, trier


les variables et leurs valeurs.

Dictionnaire de données:
► Menu Fichier > Afficher des informations sur un fichier
de données > fichier de travail.
► Menu Analyse > Rapports > Livre de codes.
► Menu Utilitaires > Variables.
Éditeur de données > Vue des données
Colonnes > variables
Lignes > unité d’analyse: cas, observations, répondants…
Cellules > valeurs | réponses (modalités, attributs)

Remplacer les codes par les


étiquettes de valeurs
Double-clic sur l’intitulé d’une colonne :
transfert à sa ligne dans la vue des
variables

Clic droit sur l’intitulé d’une colonne :


trier les valeurs de la variable

Clic droit sur n’importe quelle cellule:


Générer automatiquement un tableau de
stats descriptives

Possibilité de scinder la fenêtre en


¨figeant ¨ une colonne ou une ligne
SPSS Viewer (résultats)
Résultats des commandes effectuées > tableaux, graphiques.
Fichier qui peut être édité et enregistré sous le nom de son choix. L’enregistrement des
résultats se fait dans un fichier distinct (fichier .spv) de la base de données (fichier .sav).
Les résultats peuvent être copiés/collés dans un document texte (clic droit).

Onglet Insérer : édition de la


feuille de résultats (seul onglet
distinct de la fenêtre de la base de
données)

Chaque résultat peut être


Document map > « table des copier/coller, supprimer,
matières »: permet de repérer, éditer…
sélectionner, copier, supprimer
des résultats

Il n’est pas recommandé de copier/coller tels quels les sorties SPSS dans vos travaux. Une mise en forme est nécessaire pour respecter les normes
scientifiques de présentation de tableaux (analyses descriptives, matrices de corrélation) > Consulter les normes de présentation de tableaux et
graphiques dans un guide méthodologique.
Éditeur de syntaxe
Fichier texte (.sps) où inscrire le code des commandes à réaliser (mise en forme, analyses, …):
Fichier > Nouveau > Syntaxe

Les commandes SPSS peuvent être faites de 2 façons:


1. Par le biais des options du menu du haut;
2. En écrivant la ligne de commande dans l’éditeur de syntaxe puis en cliquant sur Exécuter

Avantages: garder un historique des commandes, automatiser, assurer la reproductibilité, … Certaines commandes
ne sont possibles que par syntaxe.

Compromis: Option COLLER

À partir des commandes du menu du haut, il


est possible de copier le code de la
commande à exécuter dans l’Éditeur de
syntaxe en cliquant sur le bouton Coller avant
de cliquer sur OK pour lancer la commande.

Ex: commande d’un


tableau croisée

Commenter sa syntaxe en commençant une ligne par *


Configuration de l’environnement SPSS
Menu Édition > Options
• Faire apparaître les codes ET noms de valeurs dans les tableaux.
• Changer la langue de l’interface.
• Changer les formats de tableaux.
• Afficher les commandes effectuées dans les résultats
• Enregistrement automatique de la syntaxe dans journal
Impression et sauvegarde
Impression:
- Chaque fenêtre peut-être imprimée en totalité ou en partie (sélection)
- Préférable d’utiliser l’Aperçu avant impression (menu Fichier)

Sauvegarde:
- Syntaxe: Enregistrer/Enregistrer sous > .sps
- Résultats:
- Enregistrer/enregistrer sous > .spv (ou .htm)
- Exporter > pour enregistrer l’ensemble ou une sélection de résultats en différents formats dont pdf,
xls, ppt. (raccourci: clic droit sur un tableau > Exporter)
- Base de données:
- Enregistrer (ctrl + s): enregistrement .sav des modifications apportées à l’éditeur de données
- Enregistrer sous/Exporter: enregistrer la base de données en différents formats: spss, excel
(perte d’information), SAS, Stata, …

une
Création d’une base de données
Fichier > nouveau > données: saisir les informations sur les variables (Vue des variables) puis les
données brutes (Vue des données).
OU
Importer un jeu de données (xls, csv, …) et compléter les informations dans la vue des variables.

Vue des variables Vue des données


Création d’une base de données (suite)

• Nom: Donner un nom court et significatif, sans espace, éviter les caractères spéciaux et les accents. Lettre comme 1 er caractère. 64 caractères max.
• Type: privilégier un codage numérique et non alphanumérique/chaîne de caractères (string).
• Libellé (étiquette): descriptif au long de la variable.
• Valeurs: toujours attribuer des codes numériques et associer une étiquette aux valeurs ordinales, nominales et manquantes (reste vide pour les
variables échelle).
• Manquant: définir les codes de valeurs manquantes (ex: 9, 99, 999)
• Mesure: définir le type de mesure (échelle, ordinale, nominale)

La fonction Recoder automatiquement (Transformer) permet de recoder une variable texte en variable numérique. Les valeurs alphanumériques
seront recodées par ordre alphabétique par des codes à partir du chiffre 1.
Par ex: 1 = « Femme »
2 = « Homme »

Les valeurs d’une variable à réponses multiples doivent codées en variables distinctes dichotomiques (0/1). Celles-ci pourront ensuite être
agrégées avec la fonction Analyse > Réponses multiples > Définir des jeux de variables.
Quelques informations sur les variables

Échelles de mesure
Les données manquantes
Variables de pondération (weight)
Les valeurs manquantes

Valeurs utilisées pour coder des situations telles que :


97 - Refus
98 - Ne s’applique pas
99 - Ne sait pas

Pour que ces valeurs soient exclues des analyses (on pourrait aussi vouloir les conserver).
Les cellules vides sont automatiquement considérées comme des valeurs manquantes (sysmiss)

NB. Chaque logiciel gère les valeurs manquantes de façon particulière: Stata= ., .a, .b..., R= NA

88888888
Revenu : Prestations pour enfants
Revenu : Prestations du Régime de rentes du Québec (RRQ
Essentiel de faire un bilan des valeurs manquantes:
Revenu : Prestations d'assurance-emploi (AE)
• Sont-elles bien codées ? Revenu : Revenu d'emploi
• Sont elles trop nombreuses ? Revenu : Revenu total
• Problème du biais de non réponse (totale ou partielle) ?
88
Scolarité : Plus haut certificat, diplôme ou grade
Travail : Travail en 2015
Nettoyer et préparer les données
Toujours débuter par un examen approfondie de sa base de données (distributions de fréquence, graphiques).
La structure des données doit correspondre aux prérequis des analyses prévues:

• De quels niveaux de mesure sont les variables? (ordinales, nominales, échelle)


• Est-ce que les différents types de valeurs manquantes sont bien codés?
• Y a-t-il des valeurs problématiques (non prévues, erratiques/aberrantes, extrêmes?)
• La distribution des valeurs apparait-elle normale?
• Y a-t-il assez de cas pour procéder aux analyses voulues?
• Est-ce que certaines variables devraient être éliminées, recodées, transformées?

Plusieurs analyses présupposent, par exemple, la normalité des observations. Cette normalité doit être vérifiée, surtout si
l’échantillon est petit, à l’aide de statistiques descriptives, de graphiques (histogrammes, boîtes à moustaches, qq plot), ou
de tests (Kolmogorov-Smirnov, Shapiro-Wilk…).

Règle d’or: Garbage In, Garbage out!


Quelques mots sur les postulats
Pour choisir un test statistique, on tient compte: 1) des caractéristiques de ses données et de son échantillon (format,
variance, normalité, …) et de ses objectifs (analyser les relations entre les variables ou comparer des groupes?)

Les tests statistiques reposent sur différents postulats relatifs aux données qu’il faut vérifier.

Exemples: - indépendance des observations (sélection aléatoire)


- multicollinéarité (lien trop fort entre vars indépendantes)
- distribution normale (+ résidus - qualité de la prédiction des valeurs)
- hétéroscédasticité (variance de la prédiction)

Certains tests sont plus contraignants que d’autres…

Tests paramétriques (anova, corrélation, régression, test T, …): échantillon aléatoire indépendant, distribution normale,
variance égale (test de Levene), min de 30 sujets par groupe.

Tests non paramétriques [Analyse > Tests non paramétrique]: alternatives lorsque les postulats ne sont pas remplis
(échantillon trop petit, distribution asymétrique, valeurs extrêmes), qui ne reposent pas sur la moyenne et se serve du rang
des observations au lieu des valeurs brutes (ex: Wilcoxon, Krustall-Walis, Friedman, Fisher, Chi-2…)

Arbre décisionnel pour sélection de tests statistiques:


- http://pagesped.cahuntsic.ca/sc_sociales/psy/methosite/consignes/decision.htm
- http://dl.icdst.org/pdfs/files1/ce2418fcc89682f2d0905bcb6ad93d9a.pdf
Échelles de mesure

Nominale: Variable qualitative dont les valeurs/modalités représentent des catégories sans
classement, ordre ou relations hiérarchiques entre elles. Nombre limité de valeurs. Par exemple
Catégorielles

sexe, état matrimonial, province, …

Complexité croissante
Ordinale: Variable qualitative ou quantitative dont les valeurs représentent des catégories associées
à un classement. La codification de la variable respecte l’ordre des valeurs. Nombre limité de
valeurs. Par exemple: niveaux de satisfaction (0 à 5), niveau d’éducation, catégories d’âge, de
revenu, …

Intervalle/ratio : variable quantitative dont les valeurs ne sont pas regroupées en catégories.
Échelle

Permet donc de mesurer la distance exacte entre les valeurs. Ex: l'âge en années et le revenu exact
en dollars.

Revenu annuel brut en 2015 Revenu annuel brut en 2015


Ordinale

52 500 $

Échelle
• 1 - Moins de 10 000 $ •
• 2 - 10 000 $ À 19 999 $ • 31 280 $
• 3 - 20 000 $ À 29 999 $ • 12 187 $
• 4 - 30 000 $ À 39 999 $ • 86 200 $
… • …
Les poids > pondération

L'estimation des caractéristiques de la population à partir d'une enquête repose sur l'hypothèse selon laquelle
chaque unité échantillonnée représente, en plus d'elle-même, un certain nombre d'unités non échantillonnées
dans la population.

Pour les enquêtes de Statistique Canada, il faut toujours pondérer les résultats avant d'en rendre compte.
Variable(s) de poids fournies dans le fichier d’enquête.

Estimation: tirer des


conclusions sur la population
en utilisant des poids et des
données d’échantillon

Relier l’information de
l’échantillon à la population de
l’enquête

« Les utilisateurs doivent s’assurer de ne pas diffuser des estimations non pondérés ni de faire des analyses fondées sur des données non
pondérées du fichier parce que les résultats non pondérés ne sont pas représentatifs de la population, mais de l’échantillon ». FMGD du
recensement de 2016 - guide de l’utilisateur
Principales fonctions -> Menu Données
Modifications et requêtes sur le fichier de données
• Fractionner en fichiers : diviser les observations sur la base des
valeurs d’une variable en fichiers distincts.

• Scinder un fichier : diviser les résultats des analyses


subséquentes en fonction des valeurs d’une variable catégorielle
(ex: sexe, âge, …) [les données doivent d’abord être triées par la
var de groupe]. Exemple: diviser tous les résultats par sexe

• Sélectionner des observations : sélectionner un échantillon ou


sous-groupe d’observations sur lesquelles seront réalisées les
traitements statistiques (les autres cas peuvent être conservés ou
supprimés). Ex: limiter les analyses aux répondants du Québec

• Pondérer les observations : permet d’associer un poids à chaque


observation.

• Fusionner des fichiers: ajouter des observations ou variables

• Agréger: agréger l'info quantitative selon une nouvelle unité


d'observation (en fonction des valeurs d'une variable choisie)
Principales fonctions -> Menu Transformer
Manipulation et création de variables

• Transformer > Calculer la variable : permet de créer une nouvelle


variable à partir de calculs effectués sur des variables existantes. Par
exemple, variable calculant la somme ou la moyenne de plusieurs
résultats d’examens.

• Transformer > Création de variable: permet de modifier les valeurs


d’une variable – par exemple, fusionner les catégories d’âge ou de
revenu, recoder une variable continue en variable catégorielle,
variable dichotomique/binaire (dummy), valeurs manquantes et
extrêmes, transformation logarithmique, …

• Regroupement en classes visuelles: outil visuel pour recoder


variable continue en variable catégorielle.

Une fois recodée, toujours vérifier le résultat en faisant un tableau


de fréquences.

[La fonction Recoder des variables écrase la variable existante – à éviter!]


Principales fonctions -> Menu Analyse

Statistiques descriptives
Créer des tableaux statistiques et graphiques servant à décrire et analyser des variables quantitatives et
qualitatives pour explorer les données, les niveaux de mesure, les valeurs manquantes et erratiques,
observer le nombre et le pourcentage de cas pour chaque valeur de variable, s’assurer de leur qualité,
normalité, effectuer les pré-tests nécessaires aux analyses inférentielles, …

Statistiques descriptives univariées – Procédures:


12.1 Analyse > Statistiques descriptives > Fréquences (nominales et ordinales + échelle)
12.2 Analyse > Statistiques descriptives > Descriptives (échelle)
12.3 Analyse > Statistiques descriptives > Explorer (échelle)

Statistiques descriptives bivariées – Procédures:


12.4 Analyse > Statistiques descriptives > Tableau croisé (2 var. catégorielles)
12.5 Analyse > Comparaison de moyenne (1 var. catégorielle / 1 var. échelle)
12.6 Analyse > Corrélation (2 var. échelle)
Exercices

1. Tableau de fréquence (+ Pondérer


des résultats)
2. Sélectionner des sous-groupes.
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
1. Les tableaux de fréquence

• Un tableau de fréquences (ou de distribution) permet de connaître le nombre et la proportion (%) d’effectifs
(répondants) dans chaque catégorie de variables catégorielles.

• Pour les variables continues: permet d'obtenir les mesures 1) de tendance centrale, 2) de distribution (forme), 3) de
dispersion (variation) et 4) de position (bouton Statistiques).

• Permet de créer des diagrammes. Par ex: histogrammes pour données continues (option courbe normale) et pointes de
tarte pour données catégorielles.

Raccourci SPSS : il est possible d’accéder aux statistiques


descriptives via un clic droit sur n’importe quelle cellule de
données ou variables (mais moins d’options).
1. Exercice: Créer un tableau de fréquence (variable catégorielle)
et pondérer des observations
• Combien y a-t-il d’immigrants dans la base de données?

Démarche :
- Analyse > Statistiques descriptives > Fréquences;

Variable : Immigration - Statut d'immigrant [IMMSTAT].

• Activer la variable de pondération et refaire la démarche précédente.


• Combien y a-t-il d’immigrants au Canada ? Quel pourcentage de la population canadienne
représentent-ils?

Démarche :
- Données > Pondérer les observations > Facteur de pondération pour les particuliers;
- Analyse > Statistiques descriptives > Fréquences;

Variables :
- Facteur de pondération pour les particuliers [WEIGHT];
- Immigration - Statut d'immigrant [IMMSTAT].
1. Tableau de fréquence (+ Pondérer des résultats)

2. Sélectionner des sous-groupes


3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
2. Exercice: Sélectionner (filtrer) des observations

• Limiter l’échantillon à la population du Québec.


• Les immigrants représentent quel pourcentage de la population au Québec ?
• Créer un graphique circulaire des données avec les pourcentages affichés.

Démarche:
Données > Sélectionner des observations > Selon une condition logique – Si… Province = 24 ;
Analyse > Statistiques descriptives > Fréquences + Bouton Graphique > Graphiques circulaires & Pourcentages ;
Double cliquer sur le graphique > clic droit > Afficher les libellés de données.

Variables :
- Filtre: Province ou territoire de résidence actuelle (2016) [PR= 24].
- Fréquence: Immigration : Statut d'immigrant [IMMSTAT]
2. Exercice: Sélectionner (filtrer) des observations
• Limiter l’échantillon aux Québécois de 25 à 64 ans qui ont travaillé en 2015
• Quel pourcentage de cette population possède un diplôme universitaire (BACC minimum) ?
• Créer un graphique à barres (avec %) pour illustrer cette distribution.
• Quel est le niveau de scolarité le plus fréquent ?

Démarche :
Données > Sélectionner des observations > Selon une condition logique – Si…
Analyse > Statistiques descriptives > Fréquences;
Bouton Statistiques > Cocher Mode ;
Cliquer sur le bouton Graphiques > cocher Graphiques à barres et Pourcentage.;
Vérifier le résultat avec trois tables de fréquence (PR, WRKACT et Âge);
Analyse > Statistiques descriptives > Fréquences > HDEGREE.

Variables :
- Filtre:
- Province ou territoire de résidence actuelle (2016) [PR=24].
- Travail : Travail en 2015 [WRKACT > 2].
- Âge [AGEGRP > 8 & < 17].
- Fréquence: Scolarité : Plus haut certificat, diplôme ou grade [HDEGREE].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes

3. Recoder une variable catégorielle


en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
3. Le recodage de variables -> quelques exemples
Recoder une variable d’échelle en Combiner des catégories de réponses
variable catégorielle ou inverser des échelles

Créer des variables dichotomiques


à partir d’une variable catégorielle ou d’échelle
3. Exercice: Recoder une variable catégorielle en variable dichotomique

• Créer une variable dichotomique du plus haut niveau de scolarité en divisant les répondants
entre ceux qui ont un diplôme universitaire complété (BACC minimum) et les autres.

Démarche :
- Transformer > Création de variables > Scolarité - Plus haut certificat, …;
- Donner un nouveau Nom et libellé a la nouvelle variable (ex : RHDGREE–Universitaires) >
Changer ;
- Entrer les Anciennes et nouvelles valeurs : 1 à 8 = 0 & 9 à 13 = 1 + 88 et 99 (manquantes) ;
- Dans la vue des variables, ajouter les libellés de valeurs et déclarer valeurs manquantes ;
- Faire un tableau de fréquence avec l’ancienne et la nouvelle variable.

Variable :
- Scolarité - Plus haut certificat, diplôme ou grade HDEGREE.
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique

4.Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
4. Les tableaux croisés
Pour étudier les relations entre deux variables (statistiques bivariées):

Variable indépendante variable dépendante [y]


[x] (cause) (effet)

variable contrôle [z]


(intermédiaire)

Mesures d’association: déterminer s’il y a relation entre variables (signification), le sens et la force de celle-ci.

Tableaux croisés (2 var. catégorielle)


Comparaison de moyenne (1 var. catégorielle / 1 var. échelle)
Corrélation (2 var. échelle)


4. Les tableaux croisés
• Mesure d’association permettant d’examiner la relation entre 2 variables catégorielles (nominales ou ordinales)
> ventiler les valeurs d’une variable en fonction d’une autre.

• Permet également de croiser 2 variables en tenant compte d'une


3e variable catégorielle. Par ex: examiner la relation entre la
consommation de cannabis et l'âge en tenant compte du sexe
(Strate = variable contrôle [z]).

• Bouton Statistiques: Khi-deux, corrélations, Phi et V de Cramer,


Coefficient de contingence, …
• Bouton Cellules: % (côté de la variable indépendante)
4. Les tableaux croisés: Chi2 et valeur p

• Permet le test du Chi2 (var nominales ou ordinales, effectif min de 5 par cellule): test de validation d’hypothèses qui permet de
déterminer s’il existe une relation significative entre les variables, ie qui n’est pas due au hasard. Significative = généralisable à la
population totale.

• Résultat influencé par le nb d’observations (effet du nombre) et ne dit rien sur la force de la relation.

• La valeur p ou sig (signification) = si p est inférieur à 0,05 (généralement), il y a une relation significative et donc on rejette l’hypothèse
nulle (H0) selon laquelle les variables sont indépendantes, ie pas d’association.

• Calcul basé sur la différence entre fréquence attendue et observée.

• Le Sig accompagnant les tests statistiques s’interprète toujours de la même façon: évaluation (en %) du risque de se tromper (ex < 5%)
en disant que la relation observée dans l’échantillon peut être généralisée à la population entière.

• Si la relation est significative, l’option Statistiques permet de choisir les


coefficients précisant la relation entre les variables: 1) signification > 2)
sens > 3) force.

• Coefficients d’association dérivées du Chi2: Phi (élimine effet de taille, 2x2),


V Cramer (tableau + de 2x2), de contingence, mesurent la force de la
relation (entre 0 et 1).
Il existe des dizaines de coefficients d'association (C de Pearson, V de Cramer, Gamma, Phi, ...) allant généralement de 0 à 1 pour les var. catégorielles et de -1 à +1
pour les var. d'échelle. Choix dépend, entre autres, du niveau de mesure, du nombre de catégories, du nombre de cas …
4. Exercice: Tableaux croisés

• Les immigrants sont-ils proportionnellement plus nombreux que les non immigrants à
posséder un diplôme universitaire au Canada ?
• Chez les hommes et chez les femmes?

Démarche :
• Analyse > Statistiques descriptives > Tableaux croisés > Colonne : IMMSTAT / Ligne :
RHDGREE
• Couche : Sexe ;
• Bouton Cellules > Pourcentage [Colonne=position].

Variables :
- Immigration - Statut d'immigrant [IMMSTAT];
- Universitaires [RHDGREE].
- Couche: Sexe [SEX].

variable dépendante en ligne / variable indépendante en colonne (%)


1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé

5. Calculer une variable


6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
5. Exercice: Calculer une variable

• Créer une nouvelle variable faisant la somme des 3 variables de revenus de Prestations [EICBN],
[CQPPB], [CHDBN]
• Quelle est la moyenne de ces revenus?

Démarche :
- Transformer > Calculer la variable ;
- Donner un nom à la nouvelle variable cible : PRESTATIONS ;
- Créer l’expression numérique pour faire la somme des trois variables avec la commande SUM;
- Analyse > Statistiques descriptives > Descriptives

Variables :
- Revenu : Prestations d'assurance-emploi (AE) [EICBN]
- Revenu : Prestations du Régime de rentes du Québec (RRQ) [CQPPB]
- Revenu : Prestations pour enfants [CHDBN].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable

6. Tableau de variables d’échelle


7. Comparer des moyennes de groupes
6. Tableau de variables d’échelle:
procédures Explorer & Descriptives
Présentent les caractéristiques d’une variable quantitative regroupant les mesures de tendance centrale, dispersion et de
distribution (pas de fréquence): moyenne, minimum, maximum, écart-type, variance, intervalle, valeurs standardisées (*score
Z) …

Mesures de dispersion:
- Étalement des valeurs:
- Étendue (plage): distance entre le minimum et maximum.
- Variabilité des valeurs:
- Écart-type: distance de chaque valeur à la moyenne (+ est grand, plus données sont hétérogènes)
- Variance: Écart-type au carré.
- Homogénéité:
- CV: écart-type divisé par la moyenne * 100 (+ CV est petit (près de 0), + données sont homogènes, en %)
- Mesures de distribution (forme de la courbe):
- Kurtosis: coefficient d’aplatissement, mesure la concentration des résultats, ie l’aplatissement de la courbe.
- Skewness: coefficient de symétrie, donne un indice de la normalité de la forme de la courbe (droite ou gauche, symétrie parfaite: moyen ne, médiane
et mode au même endroit). Normale = 0.
- *Score z (valeurs standardisées): nombre d’écart-type séparant observation de la moyenne (score enregistré dans nouvelle variable). (Nb – moyenne) / écart
type. Pour comparer variable sur même échelle.
6. Exercice: Résumer les informations de variables quantitatives
(moyenne, médiane, …)
> Selon les modalités d’une variable catégorielle

Comparer la moyenne de revenu d’emploi des 2 groupes Universitaires et Non universitaires [scinder un fichier]

Démarche :
Données > Scinder un fichier > Comparer les groupes > Critères de regroupement > Scolarité - Plus haut certificat, diplôme ou grade ;
Analyse > Statistiques descriptives > Descriptives.

Variables :
Revenu : Revenu d'emploi [EmpIn] ;
Scolarité : Plus haut certificat, diplôme ou grade [HDGREE].

Comparer et visualiser (boites à moustache, histogramme) les caractéristiques du Revenu total chez les hommes et les femmes

Démarche :

- Analyse > Statistiques descriptives > Explorer ;

Variables :
- Revenu : Revenu total [Totinc_AT] ;
- Sexe : Sexe [SEX].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle

7.Comparer des moyennes de groupes


7. Comparer des moyennes > moyennes
Évaluer si des groupes ont des moyennes différentes : 1 variable catégorielle + 1 continue (ou ordinale)
• Permet d’obtenir des statistiques sommaires par groupe (Moyenne, écart type, tableau Anova, …)
• Les tests de différence de moyennes: test T (2 gr.), Test F (ANOVA, 3 gr. et +), Test de Levene (différence de
variances), … – est-ce que les différences sont significatives ou non (choix du test selon postulats et nombre
de groupes)
• Les graphiques à barres et boites à moustaches permettent de visualiser et comparer ces statistiques entre
groupes.
7. Exercice: Comparer les moyennes de groupe pour
une variable d'échelle

Comparer la moyenne de revenu d'emploi selon les catégories de statut d'immigrants

Démarche:
- Analyse > Comparer les moyennes > Moyennes

Variables:
- Revenu: Revenu d'emploi [Empln]
- Immigration: Statut d'immigration [IMMSTAT]
Corrélations
8. Analyse > Correlations > bivariées

Calculer l’intensité et le sens d’une relation entre deux variables continues (ou ordinale).
• Coefficient de corrélation de Pearson (variables quantitatives)

Coefficient (r): test statistique (paramétrique) pour mesurer le lien entre deux variables quantitatives. Indice
qui décrit la force de la relation linéaire entre deux variables > varie entre -1 et 1> Plus la valeur est proche
de +1 ou -1, plus les 2 variables sont associées fortement. Absence de lien si 0

R de Pearson (degré de liaison)


• Corrélation parfaite si r = 1
• très forte si r > 0,8. (louche!)
• forte si r entre 0,5 et 0,8.
• moyenne si r entre 0,2 et 0,5.
• faible si r entre 0 et 0.2.
• Nulle si r = 0 .
p < .05 = seuil de signification (test d’hypothèse) –
détermine si ce lien (r) est significatif, i.e. la corrélation NB. chaque domaine de recherche établit
observée entre X et Y dans l’échantillon existe bel et bien des seuils non officiels pour déterminer la
dans la population ou est due au hasard. force du lien
Merci de votre attention!

Pour aller plus loin…


• Capsules d'introduction à SPSS
• Guide BLSH Données statistiques
• SPSS à l’Usherbrooke
• Guide d’utilisation SPSS (cegep Ahuntsic)
• Cours Claire Durand (enregistrements)
• Capsule prof Marc Ouimet (crimino)
• Solutions Stat ($)
• Q2M Bureau de consultation en analyse de données qualitatives et quantitatives ($)
• SPSS dans le catalogue Sofia
• Sage Research Methods (SRM)

Vous aimerez peut-être aussi