0% ont trouvé ce document utile (0 vote)

129 vues50 pages

SPSS A 2021

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

tests non paramétriques,
historique des commandes,
Odesi,
corrélations,
données qualitatives,
statistiques descriptives,
variables,
formatage des tableaux,
importation de données,
recensement 2016

0% ont trouvé ce document utile (0 vote)

129 vues50 pages

SPSS A 2021

Transféré par

Mohamed EL GHAZOUANI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

tests non paramétriques,
historique des commandes,
Odesi,
corrélations,
données qualitatives,
statistiques descriptives,
variables,
formatage des tableaux,
importation de données,
recensement 2016

Initiation à SPSS

à l’aide des microdonnées du

recensement 2016

Caroline Patenaude
Bibliothécaire – Données | Publications gouvernementales
Bibliothèque des lettres et sciences humaines
https://bib.umontreal.ca/guides/donnees-statistiques-geospatiales/donnees-statistiques
Objectifs généraux
• Connaitre les principales caractéristiques de l’interface.
• Se familiariser avec les composantes d’un fichier de microdonnées.
• Réviser de petites notions statistiques.
• Maitriser les fonctions de base: statistiques descriptives

• Exercices:
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes

Accent mis sur la maitrise du logiciel et des procédures descriptives et non sur les statistiques
inférentielles et l’interprétation de tests d’hypothèses.
Logiciel et fichiers de microdonnées

Où trouver SPSS ? Logithèque > Procédures d'installation SPSS

• SPSS AMOS: logiciel de modélisation par équation structurelle (analyses multivariées,
relations complexes, …)

Option PSPP – Logiciel libre

Où trouver des fichiers de microdonnées?

• Statistique Canada
• Odesi
• Nesstar
• ICPSR
• Banque Mondiale
• Baromètres
• Voir Guide Données statistiques

Pourquoi SPSS? (Stata, SAS, R,…)

SPSS et cie…

https://twitter.com/kai_arzheimer/status/974280365446717441/photo/1

Problems with using Microsoft Excel for Statistical Analysis & Graphics
Fichier de microdonnées utilisé

Recensement de la population, 2016 [Canada] Fichier de micro-données à grande diffusion

(FMGD): Fichier des particuliers

« Le fichier du recensement de 2016 fournit des données sur les caractéristiques de la

population canadienne. Il contient un échantillon de 2,7 % de réponses anonymes tirées du
questionnaire du Recensement de 2016, soit 930 421 individus ».

« Les fichiers de micro-données sont les seuls produits donnant aux utilisateurs l'accès à des
données non agrégées. L'utilisateur des FMGD peut grouper et manipuler ces variables en
fonction de ses besoins et de l'objet de ses recherches ».

Le FMGD de 2016 comporte 123 variables (pour l’atelier 20)

Télécharger le fichier du recensement via Odesi

Dictionnaire du recensement
Guide de l’utilisateur
Ouvrir et explorer un fichier de
microdonnées avec SPSS
Ouverture d’un fichier de microdonnées
Un seul fichier .sav
OU
Fichier de données brutes (.dat) + fichier de syntaxe (.sps) > changer le ‘Path’

Fichier composé de lignes de + un fichier de syntaxe

chiffres représentant les valeurs
des variables (ou modalités) pour
chaque unité d’observation (ou
cas: individu, ménage…)

Ouverture d’un fichier de données d’un autre format (excel, txt, csv, stata, sas,…):
Ficher > Ouvrir (OU Importer des données) > Données (bien suivre les indications, attention à la mise en page du
fichier original). On peut également exporter les données en différents formats.
Tour d’horizon de SPSS > Fenêtres

Éditeur de données Statistics Viewer .sps

.sav .spv

2 onglets: Sortie
Vue des données Tableaux et
Vue des variables graphiques
Éditeur de données > Vue des variables
Liste des variables et de leurs caractéristiques (Type, Valeurs, Valeurs manquantes, Mesure …).

Permet d’explorer, ajouter, éditer, supprimer, déplacer, trier

les variables et leurs valeurs.

Dictionnaire de données:
► Menu Fichier > Afficher des informations sur un fichier
de données > fichier de travail.
► Menu Analyse > Rapports > Livre de codes.
► Menu Utilitaires > Variables.
Éditeur de données > Vue des données
Colonnes > variables
Lignes > unité d’analyse: cas, observations, répondants…
Cellules > valeurs | réponses (modalités, attributs)

Remplacer les codes par les

étiquettes de valeurs
Double-clic sur l’intitulé d’une colonne :
transfert à sa ligne dans la vue des
variables

Clic droit sur l’intitulé d’une colonne :

trier les valeurs de la variable

Clic droit sur n’importe quelle cellule:

Générer automatiquement un tableau de
stats descriptives

Possibilité de scinder la fenêtre en

¨figeant ¨ une colonne ou une ligne
SPSS Viewer (résultats)
Résultats des commandes effectuées > tableaux, graphiques.
Fichier qui peut être édité et enregistré sous le nom de son choix. L’enregistrement des
résultats se fait dans un fichier distinct (fichier .spv) de la base de données (fichier .sav).
Les résultats peuvent être copiés/collés dans un document texte (clic droit).

Onglet Insérer : édition de la

feuille de résultats (seul onglet
distinct de la fenêtre de la base de
données)

Chaque résultat peut être

Document map > « table des copier/coller, supprimer,
matières »: permet de repérer, éditer…
sélectionner, copier, supprimer
des résultats

Il n’est pas recommandé de copier/coller tels quels les sorties SPSS dans vos travaux. Une mise en forme est nécessaire pour respecter les normes
scientifiques de présentation de tableaux (analyses descriptives, matrices de corrélation) > Consulter les normes de présentation de tableaux et
graphiques dans un guide méthodologique.
Éditeur de syntaxe
Fichier texte (.sps) où inscrire le code des commandes à réaliser (mise en forme, analyses, …):
Fichier > Nouveau > Syntaxe

Les commandes SPSS peuvent être faites de 2 façons:

1. Par le biais des options du menu du haut;
2. En écrivant la ligne de commande dans l’éditeur de syntaxe puis en cliquant sur Exécuter

Avantages: garder un historique des commandes, automatiser, assurer la reproductibilité, … Certaines commandes
ne sont possibles que par syntaxe.

Compromis: Option COLLER

À partir des commandes du menu du haut, il

est possible de copier le code de la
commande à exécuter dans l’Éditeur de
syntaxe en cliquant sur le bouton Coller avant
de cliquer sur OK pour lancer la commande.

Ex: commande d’un

tableau croisée

Commenter sa syntaxe en commençant une ligne par *

Configuration de l’environnement SPSS
Menu Édition > Options
• Faire apparaître les codes ET noms de valeurs dans les tableaux.
• Changer la langue de l’interface.
• Changer les formats de tableaux.
• Afficher les commandes effectuées dans les résultats
• Enregistrement automatique de la syntaxe dans journal
Impression et sauvegarde
Impression:
- Chaque fenêtre peut-être imprimée en totalité ou en partie (sélection)
- Préférable d’utiliser l’Aperçu avant impression (menu Fichier)

Sauvegarde:
- Syntaxe: Enregistrer/Enregistrer sous > .sps
- Résultats:
- Enregistrer/enregistrer sous > .spv (ou .htm)
- Exporter > pour enregistrer l’ensemble ou une sélection de résultats en différents formats dont pdf,
xls, ppt. (raccourci: clic droit sur un tableau > Exporter)
- Base de données:
- Enregistrer (ctrl + s): enregistrement .sav des modifications apportées à l’éditeur de données
- Enregistrer sous/Exporter: enregistrer la base de données en différents formats: spss, excel
(perte d’information), SAS, Stata, …

une
Création d’une base de données
Fichier > nouveau > données: saisir les informations sur les variables (Vue des variables) puis les
données brutes (Vue des données).
OU
Importer un jeu de données (xls, csv, …) et compléter les informations dans la vue des variables.

Vue des variables Vue des données

Création d’une base de données (suite)

• Nom: Donner un nom court et significatif, sans espace, éviter les caractères spéciaux et les accents. Lettre comme 1 er caractère. 64 caractères max.
• Type: privilégier un codage numérique et non alphanumérique/chaîne de caractères (string).
• Libellé (étiquette): descriptif au long de la variable.
• Valeurs: toujours attribuer des codes numériques et associer une étiquette aux valeurs ordinales, nominales et manquantes (reste vide pour les
variables échelle).
• Manquant: définir les codes de valeurs manquantes (ex: 9, 99, 999)
• Mesure: définir le type de mesure (échelle, ordinale, nominale)

La fonction Recoder automatiquement (Transformer) permet de recoder une variable texte en variable numérique. Les valeurs alphanumériques
seront recodées par ordre alphabétique par des codes à partir du chiffre 1.
Par ex: 1 = « Femme »
2 = « Homme »

Les valeurs d’une variable à réponses multiples doivent codées en variables distinctes dichotomiques (0/1). Celles-ci pourront ensuite être
agrégées avec la fonction Analyse > Réponses multiples > Définir des jeux de variables.
Quelques informations sur les variables

Échelles de mesure
Les données manquantes
Variables de pondération (weight)
Les valeurs manquantes

Valeurs utilisées pour coder des situations telles que :

97 - Refus
98 - Ne s’applique pas
99 - Ne sait pas

Pour que ces valeurs soient exclues des analyses (on pourrait aussi vouloir les conserver).
Les cellules vides sont automatiquement considérées comme des valeurs manquantes (sysmiss)

NB. Chaque logiciel gère les valeurs manquantes de façon particulière: Stata= ., .a, .b..., R= NA

88888888
Revenu : Prestations pour enfants
Revenu : Prestations du Régime de rentes du Québec (RRQ
Essentiel de faire un bilan des valeurs manquantes:
Revenu : Prestations d'assurance-emploi (AE)
• Sont-elles bien codées ? Revenu : Revenu d'emploi
• Sont elles trop nombreuses ? Revenu : Revenu total
• Problème du biais de non réponse (totale ou partielle) ?
88
Scolarité : Plus haut certificat, diplôme ou grade
Travail : Travail en 2015
Nettoyer et préparer les données
Toujours débuter par un examen approfondie de sa base de données (distributions de fréquence, graphiques).
La structure des données doit correspondre aux prérequis des analyses prévues:

• De quels niveaux de mesure sont les variables? (ordinales, nominales, échelle)

• Est-ce que les différents types de valeurs manquantes sont bien codés?
• Y a-t-il des valeurs problématiques (non prévues, erratiques/aberrantes, extrêmes?)
• La distribution des valeurs apparait-elle normale?
• Y a-t-il assez de cas pour procéder aux analyses voulues?
• Est-ce que certaines variables devraient être éliminées, recodées, transformées?

Plusieurs analyses présupposent, par exemple, la normalité des observations. Cette normalité doit être vérifiée, surtout si
l’échantillon est petit, à l’aide de statistiques descriptives, de graphiques (histogrammes, boîtes à moustaches, qq plot), ou
de tests (Kolmogorov-Smirnov, Shapiro-Wilk…).

Règle d’or: Garbage In, Garbage out!

Quelques mots sur les postulats
Pour choisir un test statistique, on tient compte: 1) des caractéristiques de ses données et de son échantillon (format,
variance, normalité, …) et de ses objectifs (analyser les relations entre les variables ou comparer des groupes?)

Les tests statistiques reposent sur différents postulats relatifs aux données qu’il faut vérifier.

Exemples: - indépendance des observations (sélection aléatoire)

- multicollinéarité (lien trop fort entre vars indépendantes)
- distribution normale (+ résidus - qualité de la prédiction des valeurs)
- hétéroscédasticité (variance de la prédiction)

Certains tests sont plus contraignants que d’autres…

Tests paramétriques (anova, corrélation, régression, test T, …): échantillon aléatoire indépendant, distribution normale,
variance égale (test de Levene), min de 30 sujets par groupe.

Tests non paramétriques [Analyse > Tests non paramétrique]: alternatives lorsque les postulats ne sont pas remplis
(échantillon trop petit, distribution asymétrique, valeurs extrêmes), qui ne reposent pas sur la moyenne et se serve du rang
des observations au lieu des valeurs brutes (ex: Wilcoxon, Krustall-Walis, Friedman, Fisher, Chi-2…)

Arbre décisionnel pour sélection de tests statistiques:

- http://pagesped.cahuntsic.ca/sc_sociales/psy/methosite/consignes/decision.htm
- http://dl.icdst.org/pdfs/files1/ce2418fcc89682f2d0905bcb6ad93d9a.pdf
Échelles de mesure

Nominale: Variable qualitative dont les valeurs/modalités représentent des catégories sans
classement, ordre ou relations hiérarchiques entre elles. Nombre limité de valeurs. Par exemple
Catégorielles

sexe, état matrimonial, province, …

Complexité croissante
Ordinale: Variable qualitative ou quantitative dont les valeurs représentent des catégories associées
à un classement. La codification de la variable respecte l’ordre des valeurs. Nombre limité de
valeurs. Par exemple: niveaux de satisfaction (0 à 5), niveau d’éducation, catégories d’âge, de
revenu, …

Intervalle/ratio : variable quantitative dont les valeurs ne sont pas regroupées en catégories.
Échelle

Permet donc de mesurer la distance exacte entre les valeurs. Ex: l'âge en années et le revenu exact
en dollars.

Revenu annuel brut en 2015 Revenu annuel brut en 2015

Ordinale

52 500 $

Échelle
• 1 - Moins de 10 000 $ •
• 2 - 10 000 $ À 19 999 $ • 31 280 $
• 3 - 20 000 $ À 29 999 $ • 12 187 $
• 4 - 30 000 $ À 39 999 $ • 86 200 $
… • …
Les poids > pondération

L'estimation des caractéristiques de la population à partir d'une enquête repose sur l'hypothèse selon laquelle
chaque unité échantillonnée représente, en plus d'elle-même, un certain nombre d'unités non échantillonnées
dans la population.

Pour les enquêtes de Statistique Canada, il faut toujours pondérer les résultats avant d'en rendre compte.
Variable(s) de poids fournies dans le fichier d’enquête.

Estimation: tirer des

conclusions sur la population
en utilisant des poids et des
données d’échantillon

Relier l’information de
l’échantillon à la population de
l’enquête

« Les utilisateurs doivent s’assurer de ne pas diffuser des estimations non pondérés ni de faire des analyses fondées sur des données non
pondérées du fichier parce que les résultats non pondérés ne sont pas représentatifs de la population, mais de l’échantillon ». FMGD du
recensement de 2016 - guide de l’utilisateur
Principales fonctions -> Menu Données
Modifications et requêtes sur le fichier de données
• Fractionner en fichiers : diviser les observations sur la base des
valeurs d’une variable en fichiers distincts.

• Scinder un fichier : diviser les résultats des analyses

subséquentes en fonction des valeurs d’une variable catégorielle
(ex: sexe, âge, …) [les données doivent d’abord être triées par la
var de groupe]. Exemple: diviser tous les résultats par sexe

• Sélectionner des observations : sélectionner un échantillon ou

sous-groupe d’observations sur lesquelles seront réalisées les
traitements statistiques (les autres cas peuvent être conservés ou
supprimés). Ex: limiter les analyses aux répondants du Québec

• Pondérer les observations : permet d’associer un poids à chaque

observation.

• Fusionner des fichiers: ajouter des observations ou variables

• Agréger: agréger l'info quantitative selon une nouvelle unité

d'observation (en fonction des valeurs d'une variable choisie)
Principales fonctions -> Menu Transformer
Manipulation et création de variables

• Transformer > Calculer la variable : permet de créer une nouvelle

variable à partir de calculs effectués sur des variables existantes. Par
exemple, variable calculant la somme ou la moyenne de plusieurs
résultats d’examens.

• Transformer > Création de variable: permet de modifier les valeurs

d’une variable – par exemple, fusionner les catégories d’âge ou de
revenu, recoder une variable continue en variable catégorielle,
variable dichotomique/binaire (dummy), valeurs manquantes et
extrêmes, transformation logarithmique, …

• Regroupement en classes visuelles: outil visuel pour recoder

variable continue en variable catégorielle.

Une fois recodée, toujours vérifier le résultat en faisant un tableau

de fréquences.

[La fonction Recoder des variables écrase la variable existante – à éviter!]

Principales fonctions -> Menu Analyse

Statistiques descriptives
Créer des tableaux statistiques et graphiques servant à décrire et analyser des variables quantitatives et
qualitatives pour explorer les données, les niveaux de mesure, les valeurs manquantes et erratiques,
observer le nombre et le pourcentage de cas pour chaque valeur de variable, s’assurer de leur qualité,
normalité, effectuer les pré-tests nécessaires aux analyses inférentielles, …

Statistiques descriptives univariées – Procédures:

12.1 Analyse > Statistiques descriptives > Fréquences (nominales et ordinales + échelle)
12.2 Analyse > Statistiques descriptives > Descriptives (échelle)
12.3 Analyse > Statistiques descriptives > Explorer (échelle)

Statistiques descriptives bivariées – Procédures:

12.4 Analyse > Statistiques descriptives > Tableau croisé (2 var. catégorielles)
12.5 Analyse > Comparaison de moyenne (1 var. catégorielle / 1 var. échelle)
12.6 Analyse > Corrélation (2 var. échelle)
Exercices

1. Tableau de fréquence (+ Pondérer

des résultats)
2. Sélectionner des sous-groupes.
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
1. Les tableaux de fréquence

• Un tableau de fréquences (ou de distribution) permet de connaître le nombre et la proportion (%) d’effectifs
(répondants) dans chaque catégorie de variables catégorielles.

• Pour les variables continues: permet d'obtenir les mesures 1) de tendance centrale, 2) de distribution (forme), 3) de
dispersion (variation) et 4) de position (bouton Statistiques).

• Permet de créer des diagrammes. Par ex: histogrammes pour données continues (option courbe normale) et pointes de
tarte pour données catégorielles.

Raccourci SPSS : il est possible d’accéder aux statistiques

descriptives via un clic droit sur n’importe quelle cellule de
données ou variables (mais moins d’options).
1. Exercice: Créer un tableau de fréquence (variable catégorielle)
et pondérer des observations
• Combien y a-t-il d’immigrants dans la base de données?

Démarche :
- Analyse > Statistiques descriptives > Fréquences;

Variable : Immigration - Statut d'immigrant [IMMSTAT].

• Activer la variable de pondération et refaire la démarche précédente.

• Combien y a-t-il d’immigrants au Canada ? Quel pourcentage de la population canadienne
représentent-ils?

Démarche :
- Données > Pondérer les observations > Facteur de pondération pour les particuliers;
- Analyse > Statistiques descriptives > Fréquences;

Variables :
- Facteur de pondération pour les particuliers [WEIGHT];
- Immigration - Statut d'immigrant [IMMSTAT].
1. Tableau de fréquence (+ Pondérer des résultats)

2. Sélectionner des sous-groupes

3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
2. Exercice: Sélectionner (filtrer) des observations

• Limiter l’échantillon à la population du Québec.

• Les immigrants représentent quel pourcentage de la population au Québec ?
• Créer un graphique circulaire des données avec les pourcentages affichés.

Démarche:
Données > Sélectionner des observations > Selon une condition logique – Si… Province = 24 ;
Analyse > Statistiques descriptives > Fréquences + Bouton Graphique > Graphiques circulaires & Pourcentages ;
Double cliquer sur le graphique > clic droit > Afficher les libellés de données.

Variables :
- Filtre: Province ou territoire de résidence actuelle (2016) [PR= 24].
- Fréquence: Immigration : Statut d'immigrant [IMMSTAT]
2. Exercice: Sélectionner (filtrer) des observations
• Limiter l’échantillon aux Québécois de 25 à 64 ans qui ont travaillé en 2015
• Quel pourcentage de cette population possède un diplôme universitaire (BACC minimum) ?
• Créer un graphique à barres (avec %) pour illustrer cette distribution.
• Quel est le niveau de scolarité le plus fréquent ?

Démarche :
Données > Sélectionner des observations > Selon une condition logique – Si…
Analyse > Statistiques descriptives > Fréquences;
Bouton Statistiques > Cocher Mode ;
Cliquer sur le bouton Graphiques > cocher Graphiques à barres et Pourcentage.;
Vérifier le résultat avec trois tables de fréquence (PR, WRKACT et Âge);
Analyse > Statistiques descriptives > Fréquences > HDEGREE.

Variables :
- Filtre:
- Province ou territoire de résidence actuelle (2016) [PR=24].
- Travail : Travail en 2015 [WRKACT > 2].
- Âge [AGEGRP > 8 & < 17].
- Fréquence: Scolarité : Plus haut certificat, diplôme ou grade [HDEGREE].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes

3. Recoder une variable catégorielle

en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
3. Le recodage de variables -> quelques exemples
Recoder une variable d’échelle en Combiner des catégories de réponses
variable catégorielle ou inverser des échelles

Créer des variables dichotomiques

à partir d’une variable catégorielle ou d’échelle
3. Exercice: Recoder une variable catégorielle en variable dichotomique

• Créer une variable dichotomique du plus haut niveau de scolarité en divisant les répondants
entre ceux qui ont un diplôme universitaire complété (BACC minimum) et les autres.

Démarche :
- Transformer > Création de variables > Scolarité - Plus haut certificat, …;
- Donner un nouveau Nom et libellé a la nouvelle variable (ex : RHDGREE–Universitaires) >
Changer ;
- Entrer les Anciennes et nouvelles valeurs : 1 à 8 = 0 & 9 à 13 = 1 + 88 et 99 (manquantes) ;
- Dans la vue des variables, ajouter les libellés de valeurs et déclarer valeurs manquantes ;
- Faire un tableau de fréquence avec l’ancienne et la nouvelle variable.

Variable :
- Scolarité - Plus haut certificat, diplôme ou grade HDEGREE.
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique

4.Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
4. Les tableaux croisés
Pour étudier les relations entre deux variables (statistiques bivariées):

Variable indépendante variable dépendante [y]

[x] (cause) (effet)

variable contrôle [z]

(intermédiaire)

Mesures d’association: déterminer s’il y a relation entre variables (signification), le sens et la force de celle-ci.

Tableaux croisés (2 var. catégorielle)

Comparaison de moyenne (1 var. catégorielle / 1 var. échelle)
Corrélation (2 var. échelle)

•
4. Les tableaux croisés
• Mesure d’association permettant d’examiner la relation entre 2 variables catégorielles (nominales ou ordinales)
> ventiler les valeurs d’une variable en fonction d’une autre.

• Permet également de croiser 2 variables en tenant compte d'une

3e variable catégorielle. Par ex: examiner la relation entre la
consommation de cannabis et l'âge en tenant compte du sexe
(Strate = variable contrôle [z]).

• Bouton Statistiques: Khi-deux, corrélations, Phi et V de Cramer,

Coefficient de contingence, …
• Bouton Cellules: % (côté de la variable indépendante)
4. Les tableaux croisés: Chi2 et valeur p

• Permet le test du Chi2 (var nominales ou ordinales, effectif min de 5 par cellule): test de validation d’hypothèses qui permet de
déterminer s’il existe une relation significative entre les variables, ie qui n’est pas due au hasard. Significative = généralisable à la
population totale.

• Résultat influencé par le nb d’observations (effet du nombre) et ne dit rien sur la force de la relation.

• La valeur p ou sig (signification) = si p est inférieur à 0,05 (généralement), il y a une relation significative et donc on rejette l’hypothèse
nulle (H0) selon laquelle les variables sont indépendantes, ie pas d’association.

• Calcul basé sur la différence entre fréquence attendue et observée.

• Le Sig accompagnant les tests statistiques s’interprète toujours de la même façon: évaluation (en %) du risque de se tromper (ex < 5%)
en disant que la relation observée dans l’échantillon peut être généralisée à la population entière.

• Si la relation est significative, l’option Statistiques permet de choisir les

coefficients précisant la relation entre les variables: 1) signification > 2)
sens > 3) force.

• Coefficients d’association dérivées du Chi2: Phi (élimine effet de taille, 2x2),

V Cramer (tableau + de 2x2), de contingence, mesurent la force de la
relation (entre 0 et 1).
Il existe des dizaines de coefficients d'association (C de Pearson, V de Cramer, Gamma, Phi, ...) allant généralement de 0 à 1 pour les var. catégorielles et de -1 à +1
pour les var. d'échelle. Choix dépend, entre autres, du niveau de mesure, du nombre de catégories, du nombre de cas …
4. Exercice: Tableaux croisés

• Les immigrants sont-ils proportionnellement plus nombreux que les non immigrants à
posséder un diplôme universitaire au Canada ?
• Chez les hommes et chez les femmes?

Démarche :
• Analyse > Statistiques descriptives > Tableaux croisés > Colonne : IMMSTAT / Ligne :
RHDGREE
• Couche : Sexe ;
• Bouton Cellules > Pourcentage [Colonne=position].

Variables :
- Immigration - Statut d'immigrant [IMMSTAT];
- Universitaires [RHDGREE].
- Couche: Sexe [SEX].

variable dépendante en ligne / variable indépendante en colonne (%)

1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé

5. Calculer une variable

6. Tableau de variables d’échelle
7. Comparer des moyennes de groupes
5. Exercice: Calculer une variable

• Créer une nouvelle variable faisant la somme des 3 variables de revenus de Prestations [EICBN],
[CQPPB], [CHDBN]
• Quelle est la moyenne de ces revenus?

Démarche :
- Transformer > Calculer la variable ;
- Donner un nom à la nouvelle variable cible : PRESTATIONS ;
- Créer l’expression numérique pour faire la somme des trois variables avec la commande SUM;
- Analyse > Statistiques descriptives > Descriptives

Variables :
- Revenu : Prestations d'assurance-emploi (AE) [EICBN]
- Revenu : Prestations du Régime de rentes du Québec (RRQ) [CQPPB]
- Revenu : Prestations pour enfants [CHDBN].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable

6. Tableau de variables d’échelle

7. Comparer des moyennes de groupes
6. Tableau de variables d’échelle:
procédures Explorer & Descriptives
Présentent les caractéristiques d’une variable quantitative regroupant les mesures de tendance centrale, dispersion et de
distribution (pas de fréquence): moyenne, minimum, maximum, écart-type, variance, intervalle, valeurs standardisées (*score
Z) …

Mesures de dispersion:
- Étalement des valeurs:
- Étendue (plage): distance entre le minimum et maximum.
- Variabilité des valeurs:
- Écart-type: distance de chaque valeur à la moyenne (+ est grand, plus données sont hétérogènes)
- Variance: Écart-type au carré.
- Homogénéité:
- CV: écart-type divisé par la moyenne * 100 (+ CV est petit (près de 0), + données sont homogènes, en %)
- Mesures de distribution (forme de la courbe):
- Kurtosis: coefficient d’aplatissement, mesure la concentration des résultats, ie l’aplatissement de la courbe.
- Skewness: coefficient de symétrie, donne un indice de la normalité de la forme de la courbe (droite ou gauche, symétrie parfaite: moyen ne, médiane
et mode au même endroit). Normale = 0.
- *Score z (valeurs standardisées): nombre d’écart-type séparant observation de la moyenne (score enregistré dans nouvelle variable). (Nb – moyenne) / écart
type. Pour comparer variable sur même échelle.
6. Exercice: Résumer les informations de variables quantitatives
(moyenne, médiane, …)
> Selon les modalités d’une variable catégorielle

Comparer la moyenne de revenu d’emploi des 2 groupes Universitaires et Non universitaires [scinder un fichier]

Démarche :
Données > Scinder un fichier > Comparer les groupes > Critères de regroupement > Scolarité - Plus haut certificat, diplôme ou grade ;
Analyse > Statistiques descriptives > Descriptives.

Variables :
Revenu : Revenu d'emploi [EmpIn] ;
Scolarité : Plus haut certificat, diplôme ou grade [HDGREE].

Comparer et visualiser (boites à moustache, histogramme) les caractéristiques du Revenu total chez les hommes et les femmes

Démarche :

- Analyse > Statistiques descriptives > Explorer ;

Variables :
- Revenu : Revenu total [Totinc_AT] ;
- Sexe : Sexe [SEX].
1. Tableau de fréquence (+ Pondérer des résultats)
2. Sélectionner des sous-groupes
3. Recoder une variable catégorielle en variable dichotomique
4. Tableau croisé
5. Calculer une variable
6. Tableau de variables d’échelle

7.Comparer des moyennes de groupes

7. Comparer des moyennes > moyennes
Évaluer si des groupes ont des moyennes différentes : 1 variable catégorielle + 1 continue (ou ordinale)
• Permet d’obtenir des statistiques sommaires par groupe (Moyenne, écart type, tableau Anova, …)
• Les tests de différence de moyennes: test T (2 gr.), Test F (ANOVA, 3 gr. et +), Test de Levene (différence de
variances), … – est-ce que les différences sont significatives ou non (choix du test selon postulats et nombre
de groupes)
• Les graphiques à barres et boites à moustaches permettent de visualiser et comparer ces statistiques entre
groupes.
7. Exercice: Comparer les moyennes de groupe pour
une variable d'échelle

Comparer la moyenne de revenu d'emploi selon les catégories de statut d'immigrants

Démarche:
- Analyse > Comparer les moyennes > Moyennes

Variables:
- Revenu: Revenu d'emploi [Empln]
- Immigration: Statut d'immigration [IMMSTAT]
Corrélations
8. Analyse > Correlations > bivariées

Calculer l’intensité et le sens d’une relation entre deux variables continues (ou ordinale).
• Coefficient de corrélation de Pearson (variables quantitatives)

Coefficient (r): test statistique (paramétrique) pour mesurer le lien entre deux variables quantitatives. Indice
qui décrit la force de la relation linéaire entre deux variables > varie entre -1 et 1> Plus la valeur est proche
de +1 ou -1, plus les 2 variables sont associées fortement. Absence de lien si 0

R de Pearson (degré de liaison)

• Corrélation parfaite si r = 1
• très forte si r > 0,8. (louche!)
• forte si r entre 0,5 et 0,8.
• moyenne si r entre 0,2 et 0,5.
• faible si r entre 0 et 0.2.
• Nulle si r = 0 .
p < .05 = seuil de signification (test d’hypothèse) –
détermine si ce lien (r) est significatif, i.e. la corrélation NB. chaque domaine de recherche établit
observée entre X et Y dans l’échantillon existe bel et bien des seuils non officiels pour déterminer la
dans la population ou est due au hasard. force du lien
Merci de votre attention!

Pour aller plus loin…

• Capsules d'introduction à SPSS
• Guide BLSH Données statistiques
• SPSS à l’Usherbrooke
• Guide d’utilisation SPSS (cegep Ahuntsic)
• Cours Claire Durand (enregistrements)
• Capsule prof Marc Ouimet (crimino)
• Solutions Stat ($)
• Q2M Bureau de consultation en analyse de données qualitatives et quantitatives ($)
• SPSS dans le catalogue Sofia
• Sage Research Methods (SRM)

Vous aimerez peut-être aussi

SPSS 1
Pas encore d'évaluation
SPSS 1
11 pages
Guide SPSS Version 2010
Pas encore d'évaluation
Guide SPSS Version 2010
72 pages
Initiation Demarche de Recherche Chapitre 7 2
Pas encore d'évaluation
Initiation Demarche de Recherche Chapitre 7 2
38 pages
Cours de Biostatistique
Pas encore d'évaluation
Cours de Biostatistique
90 pages
Tests Statistiques et Outils R Excel
100% (1)
Tests Statistiques et Outils R Excel
88 pages
Paramétrique Et Non Paramétrique
100% (2)
Paramétrique Et Non Paramétrique
4 pages
Biostatistiques Médicales 101
Pas encore d'évaluation
Biostatistiques Médicales 101
2 pages
Premiers pas avec Epi Info 7
75% (4)
Premiers pas avec Epi Info 7
237 pages
Adeb I
Pas encore d'évaluation
Adeb I
14 pages
Statistique Licence 3
Pas encore d'évaluation
Statistique Licence 3
7 pages
Rstudio TD 1: Clément Rau Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan
Pas encore d'évaluation
Rstudio TD 1: Clément Rau Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan
177 pages
Cours Biostatistique Ortho
Pas encore d'évaluation
Cours Biostatistique Ortho
74 pages
Introduction à R pour débutants
Pas encore d'évaluation
Introduction à R pour débutants
16 pages
Analyses de données avec STATISTICA
Pas encore d'évaluation
Analyses de données avec STATISTICA
40 pages
Test Formatif en Soins Infirmiers
100% (1)
Test Formatif en Soins Infirmiers
5 pages
Comparaisons multiples de moyennes
100% (1)
Comparaisons multiples de moyennes
6 pages
TD 8 Tests D'hypotheses L2 2019-2020
Pas encore d'évaluation
TD 8 Tests D'hypotheses L2 2019-2020
8 pages
Stat Epidata 2009
100% (1)
Stat Epidata 2009
29 pages
Échantillonnage
Pas encore d'évaluation
Échantillonnage
17 pages
Test Khi-deux : Efficacité des traitements
100% (1)
Test Khi-deux : Efficacité des traitements
3 pages
Tableau de Bord Démographique 2022
Pas encore d'évaluation
Tableau de Bord Démographique 2022
56 pages
Analyse Statistique des Variables et Données
Pas encore d'évaluation
Analyse Statistique des Variables et Données
3 pages
Cours Complet SPSS
Pas encore d'évaluation
Cours Complet SPSS
5 pages
Traitement Statistique en Recherche
Pas encore d'évaluation
Traitement Statistique en Recherche
5 pages
Cours D'informatique - Chapitre 4
Pas encore d'évaluation
Cours D'informatique - Chapitre 4
21 pages
Guide SPSS : Création et Gestion de Données
Pas encore d'évaluation
Guide SPSS : Création et Gestion de Données
32 pages
Introduction à SPSS et analyses statistiques
Pas encore d'évaluation
Introduction à SPSS et analyses statistiques
177 pages
Anova GC
Pas encore d'évaluation
Anova GC
5 pages
Exercices Sur Les Statistiques À Deux Variables
Pas encore d'évaluation
Exercices Sur Les Statistiques À Deux Variables
3 pages
Principes et Méthodes des Sondages
Pas encore d'évaluation
Principes et Méthodes des Sondages
65 pages
Échantillon D'eau
Pas encore d'évaluation
Échantillon D'eau
4 pages
Excel Avancé : Outils d'Aide à la Décision
Pas encore d'évaluation
Excel Avancé : Outils d'Aide à la Décision
29 pages
Chapitre 5 - Tests Statistiques
Pas encore d'évaluation
Chapitre 5 - Tests Statistiques
43 pages
Cours d'Analyse Numérique ESTP
Pas encore d'évaluation
Cours d'Analyse Numérique ESTP
64 pages
Introduction À L Epidémiologie 1 - Canvas
Pas encore d'évaluation
Introduction À L Epidémiologie 1 - Canvas
52 pages
Formation sur la Surveillance en Santé
100% (1)
Formation sur la Surveillance en Santé
24 pages
Statistique Descriptive : Exercices et Analyses
Pas encore d'évaluation
Statistique Descriptive : Exercices et Analyses
5 pages
Statistiques d'Éducation et de Santé 2015
100% (1)
Statistiques d'Éducation et de Santé 2015
4 pages
Chapitre - 1 AS
Pas encore d'évaluation
Chapitre - 1 AS
43 pages
Analyse Factorielle et Classification
Pas encore d'évaluation
Analyse Factorielle et Classification
28 pages
Concepts Statistiques en Agroalimentaire
100% (1)
Concepts Statistiques en Agroalimentaire
4 pages
PLANNING - FORMATION - LOGICIELS - TDRC Sarl 2021-10-06
Pas encore d'évaluation
PLANNING - FORMATION - LOGICIELS - TDRC Sarl 2021-10-06
6 pages
Statistiques et Probabilités en Physique L2
Pas encore d'évaluation
Statistiques et Probabilités en Physique L2
26 pages
Examen ANOVA pour ISE 2
Pas encore d'évaluation
Examen ANOVA pour ISE 2
2 pages
Analyse de Données Avec SPSS 2022
Pas encore d'évaluation
Analyse de Données Avec SPSS 2022
47 pages
Guide Pratique pour Rédiger un Mémoire
Pas encore d'évaluation
Guide Pratique pour Rédiger un Mémoire
9 pages
Modélisation spatiale en géostatistique
Pas encore d'évaluation
Modélisation spatiale en géostatistique
11 pages
Introduction SPSS: Traitement Données
Pas encore d'évaluation
Introduction SPSS: Traitement Données
26 pages
ISHIKAWA
100% (1)
ISHIKAWA
11 pages
Initiation Au Logiciel Statistic SPSS - 2025
Pas encore d'évaluation
Initiation Au Logiciel Statistic SPSS - 2025
39 pages
Analyse Statistique
Pas encore d'évaluation
Analyse Statistique
7 pages
Cours 4 Equadiff 2
Pas encore d'évaluation
Cours 4 Equadiff 2
8 pages
Introduction à la Statistique Descriptive
100% (1)
Introduction à la Statistique Descriptive
196 pages
Comment Présenter Vos Données Pour Une Analyse Statistique
Pas encore d'évaluation
Comment Présenter Vos Données Pour Une Analyse Statistique
13 pages
Guide d'initiation à SPSS 2016
Pas encore d'évaluation
Guide d'initiation à SPSS 2016
58 pages
Méthodes Quantitatives en Géographie SPSS
Pas encore d'évaluation
Méthodes Quantitatives en Géographie SPSS
19 pages
01 - A La Découverte de SPSS
100% (1)
01 - A La Découverte de SPSS
22 pages
SUPPORT DE FORMATION SPSS Gloire TASIVIWE
Pas encore d'évaluation
SUPPORT DE FORMATION SPSS Gloire TASIVIWE
39 pages
Candidature
Pas encore d'évaluation
Candidature
1 page
CTE - Enseigner Un Cours Virtuel
Pas encore d'évaluation
CTE - Enseigner Un Cours Virtuel
4 pages
Emploi du temps 2024-2025 Sidi Bennour
Pas encore d'évaluation
Emploi du temps 2024-2025 Sidi Bennour
1 page
Plan Mémoire
100% (1)
Plan Mémoire
3 pages
Emploi du temps 2024-2025 Sidi Bennour
Pas encore d'évaluation
Emploi du temps 2024-2025 Sidi Bennour
1 page
Expertise IT : Cybersécurité et Réseaux
Pas encore d'évaluation
Expertise IT : Cybersécurité et Réseaux
6 pages
Épreuve écrite en sécurité informatique
Pas encore d'évaluation
Épreuve écrite en sécurité informatique
5 pages
Modules de Formation en Technologie et Compétences
Pas encore d'évaluation
Modules de Formation en Technologie et Compétences
1 page
Module Big Data Avancé - S3
Pas encore d'évaluation
Module Big Data Avancé - S3
6 pages
Appel d'offres FAO: Projet OASIL
Pas encore d'évaluation
Appel d'offres FAO: Projet OASIL
30 pages
Optimiser la gestion des objectifs employés
Pas encore d'évaluation
Optimiser la gestion des objectifs employés
12 pages
Création d'un CV HTML avec CSS
Pas encore d'évaluation
Création d'un CV HTML avec CSS
1 page
Création d'une page web en HTML
Pas encore d'évaluation
Création d'une page web en HTML
2 pages
Formation DCS Schneider Electric EVO
Pas encore d'évaluation
Formation DCS Schneider Electric EVO
3 pages
Surbrillance La Ligne Et La Colonne Ac
Pas encore d'évaluation
Surbrillance La Ligne Et La Colonne Ac
18 pages
1final Usfi
Pas encore d'évaluation
1final Usfi
123 pages
Inscription Université 2024
Pas encore d'évaluation
Inscription Université 2024
9 pages
Unmai Sonnal Nesipaya
77% (13)
Unmai Sonnal Nesipaya
104 pages
Introduction aux bases de données SGBD
Pas encore d'évaluation
Introduction aux bases de données SGBD
38 pages
Le Secretariat de Redaction
Pas encore d'évaluation
Le Secretariat de Redaction
4 pages
Tripwire 1
Pas encore d'évaluation
Tripwire 1
4 pages
Système d'Information : Concepts et Méthodes
Pas encore d'évaluation
Système d'Information : Concepts et Méthodes
2 pages
Codification des données en bases de données
100% (1)
Codification des données en bases de données
4 pages
Rapport de Stage
Pas encore d'évaluation
Rapport de Stage
41 pages
Production de ressources multimédia éducatives
Pas encore d'évaluation
Production de ressources multimédia éducatives
4 pages
Formation Pratique sur Stata
Pas encore d'évaluation
Formation Pratique sur Stata
3 pages
Guide SEO: Outils et Techniques BtoB
Pas encore d'évaluation
Guide SEO: Outils et Techniques BtoB
94 pages
Manuel
Pas encore d'évaluation
Manuel
84 pages
Réglages du Dégroupeur DE20
Pas encore d'évaluation
Réglages du Dégroupeur DE20
29 pages
Ccaf 1
Pas encore d'évaluation
Ccaf 1
55 pages
Publication 2
Pas encore d'évaluation
Publication 2
129 pages
20 Outils IA pour Coachs Sportifs
Pas encore d'évaluation
20 Outils IA pour Coachs Sportifs
32 pages
Détails de La Commande - EBay
Pas encore d'évaluation
Détails de La Commande - EBay
1 page
Iec Smart Grid A4 FR LR
Pas encore d'évaluation
Iec Smart Grid A4 FR LR
12 pages
Cours Réseaux et Routage Master 1
Pas encore d'évaluation
Cours Réseaux et Routage Master 1
151 pages
CoursPOO Python2025
Pas encore d'évaluation
CoursPOO Python2025
239 pages
Algorithmique - Structure de Données
Pas encore d'évaluation
Algorithmique - Structure de Données
236 pages
Guide Pratique du Cloud Computing
Pas encore d'évaluation
Guide Pratique du Cloud Computing
34 pages
501-415136-2-60 KFP-CF Series Operation Manual FR 0
Pas encore d'évaluation
501-415136-2-60 KFP-CF Series Operation Manual FR 0
37 pages
ESCO Fauteil Dentaire ES5C
Pas encore d'évaluation
ESCO Fauteil Dentaire ES5C
2 pages
Concepts de base des systèmes d'exploitation
Pas encore d'évaluation
Concepts de base des systèmes d'exploitation
172 pages
Iso 14698 1 2003
Pas encore d'évaluation
Iso 14698 1 2003
13 pages
Procedures Triggers SQL
Pas encore d'évaluation
Procedures Triggers SQL
3 pages