Nouveau PFE 2
Nouveau PFE 2
Projet de
Fin d’études pour l’obtention du diplôme de licence d’études
Fondamentales en économie et gestion
Sous le thème
La fonction SPSS
I. Partie 3 : Étude de cas : Analyse de la satisfaction des clients d'une entreprise de vente
en ligne (ZARA) à l'aide de SPSS
Conclusion
Bibliographie
Liste des tableaux
Liste des graphes et figures
Annexes
Tables des matières
L'analyse de données est devenue une pratique incontournable dans le monde des
affaires. Pour cette raison, plusieurs logiciels ont été développés pour aider les ana-
lystes à gérer et à traiter les données. Parmi ces logiciels, SPSS (Statistical Package for
the Social Sciences) est l'un des plus populaires. Cette étude a pour but de présenter
une analyse complète de SPSS, en explorant son histoire, son évolution, son architec-
ture, son interface utilisateur, ses fonctionnalités et sa comparaison avec d'autres lo-
giciels d'analyse de données. De plus, cette étude va présenter un cas pratique en
utilisant SPSS pour analyser la satisfaction des clients de l'entreprise de vente en ligne
ZARA. Dans la première partie, nous allons examiner l'historique et l'évolution de
SPSS, y compris ses origines, ses grandes évolutions et les défis actuels auxquels il est
confronté. Nous allons également explorer l'architecture de SPSS, son interface utili-
sateur et les options de personnalisation disponibles. Enfin, nous allons comparer
SPSS avec d'autres logiciels concurrents et discuter de la possibilité d'utiliser SPSS
avec d'autres logiciels d'analyse de données. La deuxième partie de l'étude se
concentrera sur les fonctions de SPSS, notamment la saisie des données, le traite-
ment des données et la présentation des résultats. Nous allons également explorer
les fonctions d'analyse descriptive telles que les fonctions statistiques descriptives, les
fonctions graphiques et les fonctions des tableaux croisés dynamiques. Enfin, nous al-
lons discuter des fonctions avancées de SPSS, notamment l'analyse statistique, les
fonctions de manipulation de données et la visualisation de données. La troisième
partie de l'étude est consacrée à l'application pratique de SPSS. Nous allons présen-
ter une étude de cas sur l'analyse de la satisfaction des clients de l'entreprise de
vente en ligne ZARA. Cette partie inclura une présentation de l'entreprise ZARA,
l'identification du problème à résoudre, les objectifs de l'étude, la collecte et le traite-
ment des données avec SPSS, l'analyse et l'interprétation des résultats obtenus et les
recommandations. En fin de compte, cette étude vise à offrir une compréhension
complète de SPSS, ainsi que de son utilisation pratique pour résoudre des problèmes
commerciaux réels.
I. Partie 1 : Présentation de SPSS
Dans un but de permettre au lecteur de maîtriser c’est quoi SPSS, les concepts de base, l’évolution, la
structure et est-ce que ce logiciel est valide pour mes besoins. Nous allons explorer SPSS en détail
Dans cette partie.
• chapitre 1 : fournira la description, une brève histoire et l’évolution de SPSS, qui permettra de
mieux comprendre qu’est-ce que et comment le logiciel a évolué pour devenir l'outil d'analyse
statistique qu'il est aujourd'hui.
• chapitre 2 : examinera l'architecture et l'interface utilisateur de SPSS. Nous allons faire des
recherches sur les différentes fonctionnalités du logiciel qui permettent aux utilisateurs de saisir,
manipuler et analyser les données de manière efficace.
• chapitre 3 : comparera SPSS avec d'autres logiciels d'analyse de données disponibles sur le
marché. Cela permettra aux utilisateurs de mieux comprendre les avantages et les inconvénients de
SPSS par rapport à d'autres logiciels, et de décider si SPSS est l'outil d'analyse de données le mieux
adapté à leurs besoins.
SPSS signifier Statistical Package for the Social Science. Est un logiciel de traitement de
données et d'analyse statistique largement utilisé dans les sciences sociales, les études de
marché, la santé et d'autres domaines pour aider les chercheurs et les professionnels à
traiter, à analyser et à interpréter les données. Votre objectif est d’offrir un logiciel intégré
pour réaliser la totalité des tests statistiques. Développé par IBM (International Business
Machines : est une entreprise américaine spécialisée dans les technologies de l'information
et les services informatiques. Elle a été fondée en 1911 sous le nom de CTR « Computing-
Tabulating-Recording », et a ensuite été renommée IBM en 1924), SPSS offre une interface
conviviale (facile à utiliser) pour la saisie, la manipulation et l'analyse de données, ainsi que
la création de graphiques et de tableaux. Le logiciel prend en charge une variété de
techniques statistiques, y compris les tests, les analyses factorielles, les analyses en
composantes principales les régressions, les analyses de variance et les régressions. Il offre
également une grande variété d'outils statistiques avancés, notamment des fonctions de
modélisation et de simulation, qui permettent aux utilisateurs d'effectuer des analyses plus
complexes. SPSS est commercialisé par IBM, et depuis son acquisition par IBM en 2009, il est
officiellement connu sous le nom d'IBM SPSS Statistics. Il est disponible dans différentes
versions pour répondre aux besoins des utilisateurs, allant de la version de base aux versions
plus avancées. Il s’adresse au :
Applications dans les entreprises des :
• prévisions et budgétisation des ventes et du marketing,
• bases de données et marketing direct,
• test des caractéristiques d’un produit.
Applications dans l’enseignement supérieur de :
• gestion des inscriptions,
• progression des étudiants,
• recherche.
Applications dans les académies scolaires pour faire :
• évaluation des élèves,
• évaluation des cursus,
• planification et budgétisation.
Applications dans le secteur public :
• lutte contre la criminalité et renforcement de la sécurité publique,
• promotion de la santé publique,
• lutte contre la fraude, le gaspillage et les abus,
• gestion du capital humain.
Applications en milieu médical et hospitalier :
• traitements reposant sur des faits avérés,
• analyse des résultats d’un traitement,
• recherche biomédicale et comportementale.
Il s'agit d'un logiciel dont les premières versions datent des années soixante (sans doute l'un
des plus anciens), précisément en1960, lorsqu'un groupe de chercheurs de l'Université de
Chicago, dirigé par Norman H. Nie, a commencé à travailler sur un système informatique
destiné à faciliter l'analyse de données pour les chercheurs en sciences sociales. À l'origine, il
s'agissant d'un programme "open source", c'est à dire que n'importe qui pouvait ajouter de
nouvelles commandes, et les possesseurs du logiciel recevaient un pamphlet supplémentaire
décrivant cette commande. Et était conçu pour fonctionner sur des ordinateurs IBM 7090 et
7094. En 1968, le groupe a publié la première version de SPSS, qui était un ensemble de
programmes en langage Fortran permettant de réaliser des analyses statistiques simples
telles que des tests de significativité, des analyses de variance et des régressions. Dans les
années 80, le logiciel a cessé d'être "open source" et est maintenant la propriété exclusive
de SPSS Inc. Néanmoins, les propriétaires sont très agressifs, sortant de nouvelles versions
régulièrement (en moins de 8 ans, nous sommes passé de SPSS v. 6 à SPSS v.12). À partir de
la version 7, SPSS est devenu un produit pour Windows. Le logiciel a connu un grand succès
auprès des chercheurs en sciences sociales, qui ont rapidement adopté SPSS comme l'un des
outils statistiques les plus populaires dans leur domaine. Au fil des ans, SPSS continué à
évoluer et à s'adapter aux besoins des utilisateurs. Des fonctionnalités plus avancées ont été
ajoutées, telles que des analyses factorielles, des analyses de cluster, des analyses
discriminantes, des analyses de survie, des modèles de régression logistique, etc. En 2009,
IBM a acquis SPSS Inc. et a renommé le logiciel IBM SPSS Statistics. Depuis lors, IBM a
continué à développer et à améliorer le logiciel, en offrant de nouvelles fonctionnalités et
des améliorations de l'interface utilisateur pour répondre aux besoins des utilisateurs.
Aujourd'hui, IBM SPSS Statistics est l'un des logiciels statistiques les plus populaires et les
plus largement utilisés dans le monde.
b. Les grandes évolutions de SPSS
a. Architecture de SPSS
L'architecture de SPSS est basée sur un modèle client-serveur. Le modèle client-serveur est un
modèle d'architecture informatique dans lequel les tâches sont réparties entre deux types
d'ordinateurs distincts : les clients et les serveurs. Le client peut être une application de bureau, un
navigateur web, un smartphone ou tout autre appareil qui accède aux services d'un serveur. Le
serveur est un ordinateur qui fournit des services ou des ressources aux clients. Les serveurs sont
conçus pour être puissants, fiables et sécurisés afin de répondre aux demandes des clients de
manière efficace et en temps réel. Lorsque l'utilisateur utilise SPSS, les données sont stockées sur le
disque dur de l'ordinateur client. Lorsque l'utilisateur demande une analyse statistique, le client
envoie une requête au serveur pour effectuer le calcul. Le serveur traite les données et renvoie les
résultats au client pour affichage. Il existe également une architecture en deux tiers de SPSS, qui est
une configuration où le logiciel client et le serveur sont installés sur le même ordinateur. Dans cette
configuration, l'ordinateur fonctionne à la fois en tant que client et en tant que serveur.
• Architecture client/serveur
Vous pouvez utiliser un protocole réseau et une interface de programmation réseau pour la
connexion et le transfert de données entre le client et le serveur de base de données.
- Protocole réseau
Un protocole réseau est un ensemble de règles déterminant la façon dont les données sont
transférées entre les applications et, dans notre contexte, un client et un serveur de base de
données. Les règles d’un protocole sont implémentées dans un pilote réseau. Le pilote réseau
contient le code qui formate les données lorsqu’elles sont transmises du client au serveur de base de
données et du serveur de base de données au client.
- Interface de programmation réseau
Une interface de programmation réseau est une interface de programmation d’application (API) qui
contient un ensemble de routines de communication ou d’appels système. Une application peut
appeler ces routines pour communiquer avec une autre application située sur le même ordinateur ou
sur un autre ordinateur.
- Domaine de réseau Windows
La technologie réseau Windows vous permet de créer des domaines de réseau. Un domaine est un
groupe d’ordinateurs Windows connectés qui partagent des informations de compte utilisateur et
une stratégie de sécurité.
- Connexions au serveur de base de données
Une application client établit une connexion à un serveur de base de données grâce à l'instruction
CONNECT ou DATABASE SQL.
- Prise en charge des connexions multiplexées
Une connexion multiplexée utilise une seule connexion réseau entre le serveur de base de données
et le client pour gérer plusieurs connexions à la base de données à partir du client.
• Communication client-serveur
Ces rubriques couvrent les concepts et termes que vous devez comprendre pour configurer la
communication client-serveur.
- Architecture client/serveur
Produits IBM® Informix conformes au modèle de conception logicielle client/serveur.
- Connexions prises en charge par le serveur de base de données
Le serveur de base de données prend en charge différents types de connexion avec l'applica-
tion client.
- Connexions locales
Une connexion locale est une connexion entre un client et un serveur de base de données, sur
un même ordinateur.
- Services de support des communications
Les services de support des communications incluent des services liés à la connectivité.
- Fichiers de connectivité
Les fichiers de connectivité contiennent les informations nécessaires à la communication
client-serveur et permettent aux serveurs de base de données de communiquer entre eux.
- Informations sur sqlhosts
Les informations sur sqlhosts contiennent des informations de connectivité pour chaque
serveur de base de données et des définitions pour les groupes. Le serveur de base de données
recherche les informations de connectivité lorsqu'il démarre, lorsqu'une application client se
connecte à un serveur de base de données ou lorsqu'un serveur de base de données se connecte
à un autre.
- Prise en charge Informix des adresses IPv6
Sur toutes les plateformes, IBM Informix reconnait les adresses du protocole Internet ver-
sion 6 (IPv6), de 128 bits, et les adresses du protocole Internet version 4 (IPv4), de 32 bits.
- Paramètres de configuration relatifs à la connectivité
Certains paramètres de configuration du fichier onconfig donnent des informations concer-
nant la connectivité.
- Variables d'environnement pour les connexions réseau
Les variables d’environnement INFORMIXCONTIME (temps de connexion) et INFORMIX-
CONRETRY (nouvelle tentative de connexion) affectent le comportement du client lorsque ce-
lui-ci tente de se connecter à un serveur de base de données. Utilisez ces variables d’environ-
nement pour réduire les erreurs de connexion causées par un trafic réseau chargé.
- Arrêt automatique des connexions inactives
Vous pouvez fermer automatiquement des sessions avec des clients inactifs depuis un certain
temps en activant la tâche de planification délai_utilisateur_inactif.
- Communications Distributed Relational Database Architecture (DRDA)
DRDA est un ensemble de protocoles permettant d’utiliser plusieurs systèmes de base de don-
nées et programmes d’applications ensemble.
- Exemples de configurations client-serveur
Les sections suivantes indiquent les bonnes entrées sqlhosts correspondant à plusieurs
connexions client-serveur.
- IBM Informix MaxConnect
IBM Informix MaxConnect est un produit réseau destiné aux environnements de serveur de
base de données IBM Informix sur UNIX. Informix MaxConnect gère les nombres élevés (de
plusieurs centaines à des dizaines de milliers) de connexions client/serveur.
b. Interface utilisateur de SPSS
L'interface utilisateur est la partie visible d'un logiciel ou d'un système qui
permet aux utilisateurs d'interagir avec celui-ci. Elle est constituée de tous les
éléments graphiques, tels que les boutons, les menus, les icônes, les fenêtres
et les boîtes de dialogue, qui permettent à l'utilisateur de communiquer avec le
système. Avant de passer a mise en pratique l’interface utilisateur de SPSS nous
allons expliquer comment démarrer ce logiciel.
b.1. Comment démarrer SPSS
Figure 1 : Démarrage de SPSS
Cette fenêtre apparaît après qu’une commande d’analyse a été effectuée, et contient
les résultats de cette analyse. Les résultats proprement dit apparaissent à droite
alors qu'à gauche, on voit une table des matières des résultats générée par SPSS.
Les résultats peuvent être imprimés tels quels, ou encore, on peut faire copier-coller
vers un autre logiciel (tel votre traitement de texte). Parfois, le résultat est très long et
SPSS n'en montre qu'une partie, suivi d'un triangle rouge. Pour voir la suite, double-
cliquez sur le texte, puis étendez la taille de la zone de texte vers le bas jusqu'à ce
que vous ne voyez plus de texte. Cette fenêtre s’ouvre automatiquement dès que
vous lancez une procédure qui doit afficher des résultats.
c. Personnalisation de SPSS
La personnalisation de SPSS peut être effectuée de différentes manières. Tout
d'abord, les utilisateurs peuvent personnaliser l'interface graphique en modifiant la
couleur des menus et des icônes ou en ajoutant des raccourcis pour les commandes
les plus utilisées. Cette personnalisation permet aux utilisateurs de gagner du temps
et d'augmenter leur productivité en évitant de devoir rechercher les commandes dont
ils ont besoin dans les menus.
En outre, les utilisateurs peuvent personnaliser les modèles de sortie de SPSS. Les
modèles de sortie sont des fichiers qui contiennent les résultats d'une analyse de
données. Les utilisateurs peuvent personnaliser ces modèles pour répondre à leurs
besoins spécifiques en ajoutant des informations supplémentaires, en modifiant le
format de sortie ou en supprimant des informations inutiles. Les modèles de sortie
personnalisés peuvent être enregistrés et réutilisés pour des analyses futures, ce qui
permet aux utilisateurs de gagner du temps et d'obtenir des résultats plus précis.
Enfin, les utilisateurs peuvent également personnaliser les commandes de SPSS en
écrivant des scripts. Les scripts sont des programmes informatiques qui permettent
aux utilisateurs d'automatiser des tâches complexes et répétitives. Les scripts
peuvent être utilisés pour effectuer des analyses spécifiques, pour automatiser la
création de graphiques ou pour exporter les résultats dans des formats spécifiques.
Les scripts peuvent également être partagés avec d'autres utilisateurs, ce qui permet
de collaborer plus efficacement sur des projets de recherche.
C. Chapitre 3 : Comparaison avec d'autres logiciels d'analyse de données
Dans ce chapitre, nous allons nous concentrer sur la comparaison de SPSS avec
d'autres logiciels d'analyse de données concurrents. Nous examinerons les
fonctionnalités de SPSS ainsi que celles des autres logiciels tels que R, Python,
SAS, Excel et Tableau.
Nous allons comparer les différentes fonctionnalités de ces logiciels en matière
d'analyse de données, de manipulation de données et de visualisation. Nous allons
également examiner leur facilité d'utilisation, leur coût et leur flexibilité.
En particulier, nous allons nous concentrer sur la manière dont SPSS se compare
aux autres logiciels en termes de fonctionnalités statistiques et d'analyse de
données. Nous allons examiner les avantages et les inconvénients de SPSS par
rapport aux autres logiciels et déterminer quand SPSS est le plus adapté pour
l'analyse de données.
a. Présentation des logiciels d'analyse de données concurrents
Le marché contient un grand nombre de logiciels d'analyse de données, ce qui
donne au utilisateurs une variété des programmes qui satisfaire vos besoins d’une
part, un problème pour les logiciels lui-même d’autre part. chacun de ces derniers a
des avantages et des inconvénients. Parmi les logiciels les plus concurrents de
SPSS sont : Excel, SAS, sphinx, Minitab, R, et Tableau.
٭Excel: est un tableur populaire développé par Microsoft qui est souvent utilisé pour
l'analyse de données, en particulier pour les petites et moyennes entreprises. Il
permet de créer des feuilles de calcul, de gérer et d'analyser des données, et de
réaliser des calculs automatiques à l'aide de formules et de fonctions. Excel offre
également des fonctionnalités graphiques permettant de créer des graphiques et des
tableaux croisés dynamiques pour une analyse visuelle des données. Excel est
utilisé dans de nombreux domaines tels que la finance, les sciences, la comptabilité,
la gestion de projet, la planification budgétaire, ….
٭SAS (Statistical Analysis System): est une plateforme d'analyse extrêmement fiable
et évolutive ,utilisé dans les domaines de la recherche, de l'analyse des données, de
la business intelligence, de la gestion de la relation client et du marketing. Dans le
but de manipuler, gérer et analyser des données. Il permet d'importer, de transformer
,de nettoyer et d'analyser des données de manière efficace et flexible. Il propose
également une large gamme de fonctions statistiques, de modèles prédictifs, de vi-
sualisation de données et de reporting. SAS est souvent utilisé dans les grandes en-
treprises et les organismes gouvernementaux pour analyser et interpréter de grands
ensembles de données complexes.
٭Sphinx: Sphinx est un logiciel libre de système de recherche et d'indexation de do-
cuments. Il est largement utilisé par les entreprises, les organisations gouvernemen-
tales et les sites web pour améliorer la recherche et la découverte d'informations. Et
aussi pour indexer et rechercher des textes, des fichiers, des bases de données, des
courriers électroniques et d'autres sources de données. Sphinx est souvent utilisé
pour créer des moteurs de recherche personnalisés pour des sites web, des applica-
tions et des bases de données. Il offre également des fonctionnalités avancées telles
que la recherche phonétique, la correction orthographique, la recherche sémantique
et la recherche de facette. est un logiciel rapide et efficace, capable de traiter des
millions de documents en temps réel.
٭Minitab: est un logiciel d'analyse statistique utilisé pour effectuer des analyses de
données et des tests statistiques. Il est utilisé dans les industries, les entreprises, les
universités et les organismes gouvernementaux pour aider les utilisateurs à analyser
les données, à découvrir des modèles et à prendre des décisions basées sur des
données.
Il permet de réaliser des analyses descriptives, des tests d'hypothèses, des modèles
de régression, des analyses de variance, des plans d'expérience, des analyses de
fiabilité, des analyses de séries chronologiques et des cartes de contrôle. Il offre
également des fonctionnalités de visualisation de données telles que des graphiques
en barres, des histogrammes, des diagrammes de dispersion, des diagrammes en
boîte et des graphiques de probabilité.
٭R: est un langage de programmation open-source utilisé pour l'analyse statistique et
la visualisation de données. Il est largement utilisé par les statisticiens, les scienti-
fiques des données, les économistes et les chercheurs dans différents domaines. Il
offre une grande variété de packages et de fonctions pour l'analyse statistique, la
modélisation de données, la manipulation de données, la visualisation de données et
la création de graphiques. Il peut être utilisé pour effectuer des tests statistiques tels
que des tests d'hypothèses, des modèles de régression, des analyses de variance,
des analyses de séries chronologiques et des analyses de données multidimension-
nelles. Dispose également d'une communauté active de développeurs et d'utilisa-
teurs qui contribuent à son développement et à son amélioration continue.
٭Tableau: est un logiciel de visualisation de données et de business intelligence utili-
sé pour analyser et représenter visuellement des données. Il permet aux utilisateurs
de se connecter à des sources de données, de créer des tableaux de bord interac-
tifs, des graphiques et des visualisations, et de partager des informations en temps
réel avec les parties prenantes. permet également de créer des tableaux de bord in-
teractifs qui permettent aux utilisateurs de découvrir des tendances et des insights à
partir des données. Il offre également des fonctionnalités de collaboration et de par-
tage de données, permettant aux utilisateurs de partager des visualisations de don-
nées avec des collègues et des partenaires de l'entreprise
b. Comparaison des fonctionnalités de SPSS avec les logiciels concurrents
Nous essaierons dans la mesure du possible dans ce paragraphe de citer les principales
fonctionnalités du SPSS et ses concurrents :
Nous avons faire une comparaison selon les éléments suivants :
Interface utilisateur - Types d'analyses - Qualité des résultats - Visualisation des don-
nées - Gestion de données – Programmation.
- Une interface utilisateur plus difficile à utiliser pour les analyses sta-
tistiques avancées.
En conclusion, SPSS est un logiciel d'analyse statistique avancée convivial pour les utilisa-
teurs non-programmeurs. Bien qu'il dispose de certaines fonctionnalités en commun avec les
logiciels concurrents, SPSS est spécialement conçu pour les analyses statistiques avancées
dans les domaines des sciences sociales et comportementales. Les autres logiciels offrent
des fonctionnalités différentes et peuvent être plus adaptés à d'autres domaines d'applica-
tion.
c. Utilisation de SPSS en combinaison avec d'autres logiciels d'analyse de données
Bien qu'il soit un outil puissant pour l'analyse de données, il peut être utilisé en combinaison
avec d'autres logiciels pour maximiser ses fonctionnalités et effectuer des analyses plus
complexes. Et au même temps fournir aux utilisateurs la faciliter de produire vos projets.
On a combinaison de SPSS juste avec les logiciels qu’on a présenté dans le sous-chapitre b
ci-dessus car il y a plusieurs programmes concurrents de SPSS dans le marché.
1- Excel :
L'utilisation de SPSS en combinaison avec Excel peut être bénéfique dans les cas suivants.
Voici les étapes à suivre pour utiliser SPSS en combinaison avec EXCEL :
• Importation de données : SPSS peut importer des données à partir de fichiers Excel pour
effectuer des analyses statistiques avancées. Les utilisateurs peuvent facilement importer des
données à partir d'Excel dans SPSS en utilisant l'option "Importer des données" dans le menu Fichier
de SPSS.
• Nettoyage et préparation des données : Excel peut être utilisé pour nettoyer et préparer les
données avant de les importer dans SPSS. Les utilisateurs peuvent trier, filtrer et supprimer les
données inutiles ou manquantes dans Excel avant de les importer dans SPSS pour des analyses
statistiques plus précises.
• Analyse des résultats : SPSS peut fournir des résultats détaillés pour les données importées à
partir d'Excel. Les utilisateurs peuvent importer des résultats d'analyse de SPSS dans Excel pour
effectuer des analyses visuelles plus approfondies, comme la création de graphiques et de tableaux
croisés dynamiques pour une présentation plus visuelle des données.
• Exportation de résultats : Excel peut être utilisé pour exporter les résultats d'analyse de SPSS.
Les utilisateurs peuvent exporter les résultats d'analyse de SPSS dans Excel pour une analyse plus
approfondie ou pour la présentation des résultats aux parties prenantes.
2- SAS :
Il peut être avantageux d'utiliser les deux (SPSS et SAS) en combinaison pour maximiser les
avantages de chaque logiciel. Voici les étapes à suivre pour utiliser SPSS en combinaison avec
SAS :
• Importation de données : SPSS peut être utilisé pour importer des fichiers de données dans un
format qui peut être lu par SAS. Une fois les données importées dans SAS, il est possible d'utiliser les
fonctionnalités plus avancées de SAS pour effectuer des analyses plus complexes.
• Prétraitement de données : SPSS est souvent utilisé pour le prétraitement de données, tels que
la suppression des valeurs manquantes ou la transformation de variables. Une fois que les données
ont été prétraitées dans SPSS, elles peuvent être importées dans SAS pour effectuer des analyses
plus avancées.
• Analyse descriptives : SPSS peut être utilisé pour effectuer des analyses descriptives de base
telles que des tableaux de fréquences, des moyennes et des écart-types. Une fois ces analyses
effectuées, les données peuvent être importées dans SAS pour effectuer des analyses plus avancées.
• Analyses multivariées : Une fois que les données ont été prétraitées dans SPSS, elles peuvent
être importées dans SAS pour effectuer ces analyses plus avancées.
3- Sphinx :
Il est possible d'utiliser ces deux logiciels en combinaison pour réaliser une enquête complète, de la
création du questionnaire à l'analyse statistique des données. Voici les étapes à suivre pour utiliser
SPSS en combinaison avec Sphinx :
• Création du questionnaire dans Sphinx : utilisez Sphinx pour créer votre questionnaire ou votre
enquête en ligne.
• Collecte de données : publiez votre questionnaire sur une plateforme en ligne ou distribuez-le en
personne pour collecter les réponses.
• Exportation des données : une fois que vous avez collecté les données, exportez-les dans un
format compatible avec SPSS, comme un fichier CSV.
• Importation des données dans SPSS : ouvrez SPSS et importez les données que vous avez
exportées de Sphinx.
• Analyse statistique : utilisez les fonctionnalités de SPSS pour effectuer des analyses statistiques
sur les données collectées, telles que des tests de corrélation, des tests de comparaison de
moyennes, des régressions linéaires, etc.
• Interprétation des résultats : interprétez les résultats obtenus à l'aide de SPSS et utilisez-les
pour prendre des décisions ou formuler des recommandations.
4- Minitab :
Il est possible d'utiliser SPSS et Minitab en combinaison pour réaliser des analyses statistiques plus
avancées ou pour comparer les résultats obtenus avec les deux logiciels. Voici les étapes à suivre
pour utiliser SPSS en combinaison avec Minitab :
• Importation des données dans SPSS : ouvrez SPSS et importez les données que vous
souhaitez analyser. Vous pouvez importer des fichiers de données dans différents formats, tels que
des fichiers Excel, CSV ou texte.
• Préparation des données dans SPSS : une fois que vous avez importé les données dans
SPSS, vous pouvez les nettoyer, les trier, les regrouper, les transformer ou les recoder selon vos
besoins.
• Exportation des données : une fois que vous avez préparé les données dans SPSS, exportez-
les dans un format compatible avec Minitab, tel qu'un fichier CSV.
• Importation des données dans Minitab : ouvrez Minitab et importez les données que vous avez
exportées de SPSS.
• Analyse statistique : utilisez les fonctionnalités de Minitab pour effectuer des analyses
statistiques sur les données collectées, telles que des tests de normalité, des analyses de variance,
des régressions linéaires, des analyses de fiabilité, etc.
• Interprétation des résultats : interprétez les résultats obtenus à l'aide de Minitab et utilisez-les
pour prendre des décisions ou formuler des recommandations.
5- R :
Il peut être avantageux d'utiliser les deux (SPSS et SAS) en combinaison pour maximiser les
avantages de chaque logiciel. Voici les étapes à suivre pour utiliser SPSS en combinaison avec R.
• Importation des données dans SPSS : ouvrez SPSS et importez les données que vous
souhaitez analyser. Vous pouvez importer des fichiers de données dans différents formats, tels que
des fichiers Excel, CSV ou texte.
• Préparation des données dans SPSS : une fois que vous avez importé les données dans
SPSS, vous pouvez les nettoyer, les trier, les regrouper, les transformer ou les recoder selon vos
besoins.
• Exportation des données : une fois que vous avez préparé les données dans SPSS, exportez-
les dans un format compatible avec R, tel qu'un fichier CSV.
• Importation des données dans R : ouvrez R et importez les données que vous avez exportées
de SPSS. Vous pouvez utiliser des packages R tels que "readr" ou "[Link]" pour importer les
données dans R.
• Analyse statistique : utilisez les fonctionnalités de R pour effectuer des analyses statistiques sur
les données collectées. R offre également une grande variété de packages pour des analyses
spécifiques, comme "dplyr" pour la manipulation de données, "ggplot2" pour la visualisation de
données, et "lme4" pour les modèles mixtes.
• Interprétation des résultats : interprétez les résultats obtenus à l'aide de R et utilisez-les pour
prendre des décisions ou formuler des recommandations.
6- Tableau :
SPSS et Tableau sont deux outils de visualisation de données complémentaires qui peuvent être
utilisés ensemble pour effectuer des analyses plus approfondies. Pour utiliser SPSS en combinaison
avec Tableau, vous pouvez suivre les étapes suivantes :
• Exportez les données de SPSS dans un format lisible par Tableau, comme un fichier CSV.
• Utilisez les outils de visualisation de Tableau pour créer des graphiques et des tableaux de
bord interactifs.
• Utilisez les fonctionnalités d'analyse de SPSS pour effectuer des analyses statistiques plus
avancées.
• Exportez les résultats de SPSS dans un format lisible par Tableau, puis importez-les dans
Tableau pour les intégrer dans vos visualisations.
En conclusion, SPSS peut être utilisé en combinaison avec d'autres logiciels d'analyse de données
pour maximiser ses fonctionnalités et effectuer des analyses plus complexes. Les utilisateurs peuvent
importer des données SPSS dans d'autres logiciels pour effectuer des analyses plus avancées, ou
exporter les résultats d'analyses de SPSS dans d'autres logiciels pour une analyse plus approfondie
ou une visualisation des données.
I. Partie 2 : Les fonctions de SPSS
Les fonctions de SPSS permettent aux utilisateurs d'effectuer une variété de tâches d'analyse de
données, y compris l'importation, la manipulation, la transformation et la visualisation de données,
ainsi que l'analyse statistique avancée.
Ils offrent aux chercheurs et aux analystes une plateforme puissante et flexible, ce qui en fait un outil
indispensable pour la recherche en sciences sociales et en psychologie.
Caractéristique Explication
Nom C'est le nom de la variable. Il est unique. Il a généralement Le nom est le code
de la variable.
Type Le type de la variable, il peut être Numérique, Chaine, Date, Monétaire, ou
Autres
Longueur C'est l'espace alloué à la variable par SPSS pour le stockage.
Décimales Le nombre de décimales après la " virgule "
Etiquette Un label descriptif pour la variable
Valeurs Pour affecter des étiquettes descriptives de valeur pour chaque valeur d'une
variable. (Par exemple, les codes 1 et 0 pour homme et femme)
Manquants Cette caractéristique donne sens aux valeurs manquantes.
Colonnes La largeur de la colonne pour la variable en question.
Alignement Alignement L'alignement de la valeur de la variable : Droite, Gauche ou Centre.
Mesure Cette caractéristique donne la nature de la variable : Quantitative (ou Echelle),
Nominale ou Ordinale. Echelles : pour les variables dont les valeurs sont
quantitatives continues et discrètes (exemple : nombre de livres empruntés,
prix, âge salaire, ... etc.) Nominales : pour les variables dont les valeurs sont
qualitatives (situation familiale, sexe, etc.) Ordinales pour les variables dont les
valeurs sont qualitatives mais il y'a un ordre hiérarchique entre les observations
(niveau d'études, qualité d'un travail, ...)
4-Saisir les données : Saisissez les données pour chaque variable dans les cellules de la feuille de
données. Les variables numériques doivent être entrées comme des nombres et les variables
catégorielles doivent être entrées comme des chaînes de caractères.
5-Vérifier les données : Vérifiez que les données saisies sont correctes. Assurez-vous que les variables
sont correctement nommées et que les valeurs sont entrées correctement.
6-Enregistrer les données : Une fois que vous avez terminé la saisie des données, enregistrez la
feuille de données en utilisant l'option "Enregistrer sous". Vous pouvez choisir le format de fichier
que vous souhaitez utiliser.
b.
Les
fonctions
graphiques
Spss propose plusieurs fonctions graphiques pour aider les utilisateurs à visualiser les données.
Voici quelques exemples de fonctions graphiques :
Histogramme : un graphique qui affiche la distribution d'une variable numérique en utilisant des
barres.
Diagramme en boîte : un graphique qui affiche la distribution d'une variable numérique en utilisant
des boîtes et des moustaches.
Nuage de points : un graphique qui affiche la relation entre deux variables numériques en utilisant
des points.
Il y
a
également d'autres types de graphiques disponibles dans SPSS, tels que les graphiques en surface et
les graphiques radar. Pour créer des graphiques dans SPSS, vous pouvez utiliser l'onglet "Graphiques"
dans la fenêtre de syntaxe ou en utilisant l'interface graphique de l'utilisateur.
c. Les fonctions des tableaux croisés dynamiques
Les tableaux croisés dynamiques (TCD) de SPSS sont des outils d'analyse de données qui permettent
de croiser des variables pour effectuer des analyses multidimensionnelles. Les TCD peuvent être
utilisés pour explorer les relations entre différentes variables, découvrir des tendances et des
schémas dans les données, et effectuer des analyses statistiques pour évaluer les relations entre les
variables. Voici quelques-unes des fonctions les plus courantes des tableaux croisés dynamiques de
SPSS :
Analyse descriptive des données : les TCD permettent de calculer rapidement des statistiques
descriptives telles que les moyennes, les médianes, les écarts-types et les fréquences pour chaque
cellule ou combinaison de cellules du tableau croisé dynamique. Consiste à résumer et à présenter
les caractéristiques clés d'un ensemble de données de manière concise et informative. Les (TCD) sont
un outil d'analyse couramment utilisé dans Excel et d'autres logiciels d'analyse de données pour
calculer rapidement des statistiques descriptives pour chaque cellule ou combinaison de cellules.
Visualisation des données : les TCD peuvent être utilisés pour créer des graphiques, tels que des
graphiques à barres, des graphiques à secteurs et des histogrammes, pour visualiser les données et
les tendances.
Analyse de la relation entre les variables : les TCD permettent d'analyser les relations entre
différentes variables et de déterminer si elles sont statistiquement significatives. Les TCD peuvent
être utilisés pour calculer des tests de signification, tels que le test du chi-deux et le test t de Student,
pour évaluer la corrélation entre les variables.
Filtrage et regroupement des données : les TCD peuvent être utilisés pour filtrer les données et
regrouper les valeurs de variables en catégories spécifiques pour faciliter l'analyse et la visualisation.
Exploration de données : les TCD permettent d'explorer rapidement les données en fournissant une
vue d'ensemble des différentes combinaisons de variables et des tendances dans les données.
En résumé, les tableaux croisés dynamiques de SPSS sont des outils d'analyse de données puissants
qui permettent d'explorer les relations entre différentes variables, de découvrir des tendances et des
schémas dans les données, et d'effectuer des analyses statistiques pour évaluer les relations entre les
variables.
C. Chapitre 3 : Les fonctions avancées de SPSS
Ce chapitre se concentre sur les fonctions avancées de ce logiciel de statistiques. Ce chapitre couvre
trois domaines clés : l'analyse statistique, les fonctions de manipulation de données et la visualisation
de données.
a. L'analyse statistique
L'analyse statistique est une fonctionnalité centrale de SPSS qui permet aux utilisateurs de réaliser
une grande variété d'analyses statistiques pour explorer et comprendre les données. SPSS dispose
d'un ensemble de fonctions avancées pour réaliser des analyses statistiques telles que la
modélisation de régression, l'analyse factorielle, l'analyse de survie, l'analyse de variance, l'analyse
de séries chronologiques et l'analyse de données textuelles.
La modélisation de régression : est une technique statistique qui permet de modéliser la relation
entre une variable dépendante et plusieurs variables indépendantes. La modélisation de régression
est utilisée dans de nombreux domaines, tels que l'économie, les sciences sociales, la psychologie et
les sciences médicales, pour prédire les valeurs d'une variable dépendante à partir de plusieurs
variables indépendantes. SPSS propose différentes techniques de modélisation de régression, telles
que la régression linéaire multiple, la régression logistique, la régression polynomiale et la régression
robuste.
L’analyse factorielle : est une technique statistique qui permet de réduire la complexité d'un
ensemble de variables en identifiant des facteurs latents qui sous-tendent les corrélations entre ces
variables. Cette technique est utilisée dans de nombreux domaines, tels que la psychologie, les
sciences sociales, la finance et le marketing, pour identifier les variables les plus importantes et pour
simplifier la compréhension des relations entre ces variables. SPSS propose plusieurs techniques
d'analyse factorielle, telles que l'analyse factorielle exploratoire (AFE) et l'analyse factorielle
confirmatoire (AFC).
L’analyse de survie : est une méthode statistique qui permet de modéliser et d'analyser le temps qu'il
faut pour qu'un événement se produise, tel que le décès, la guérison ou la rupture d'un objet. Elle est
souvent utilisée en recherche médicale, en sciences sociales et en finance pour étudier les taux de
survie et pour identifier les facteurs qui influencent la survie. SPSS propose une fonctionnalité
d'analyse de survie qui permet aux utilisateurs de modéliser les temps de survie et d'analyser les taux
de survie en fonction de diverses variables explicatives.
L’analyse de variance : (ANOVA) est une méthode statistique utilisée pour comparer les moyennes de
trois groupes ou plus. Elle permet de déterminer si les différences entre les moyennes sont
statistiquement significatives ou s'il s'agit simplement d'une variation aléatoire. SPSS propose une
fonctionnalité d'analyse de variance qui permet aux utilisateurs de comparer les moyennes de
plusieurs groupes et de déterminer si ces différences sont significatives.
L’analyse de séries chronologiques : est une méthode statistique utilisée pour étudier les tendances
et les modèles de données temporelles. SPSS propose une fonctionnalité d'analyse de séries
chronologiques qui permet aux utilisateurs de visualiser les données, d'identifier les tendances et les
modèles, et de faire des prévisions sur la base des données historiques.
L’analyse de données textuelles : est une méthode d'analyse statistique qui permet aux utilisateurs
d'extraire des informations à partir de données textuelles, telles que les commentaires de clients, les
avis en ligne, les transcriptions d'entrevues, les tweets, etc. SPSS propose une fonctionnalité
d'analyse de données textuelles qui permet aux utilisateurs d'explorer et d'analyser ces données de
manière approfondie.
En somme, SPSS offre une gamme complète d'outils pour réaliser des analyses statistiques sur les
données, permettant aux utilisateurs de mieux comprendre les modèles cachés dans les données et
de prendre des décisions plus éclairées en fonction des résultats de l'analyse.
b. Fonctions de manipulation de données
SPSS offre de nombreuses fonctions pour manipuler les données, ce qui permet de préparer les
données pour l'analyse statistique. Voici quelques-unes des principales manipulations de données
disponibles :
b.1. Insertion et trier :
Pour insérer une variable placez-vous dans la fenêtre affichage de variables, cliquez sur données, puis sur
insérer une variable : SPSS insère la variable juste en haut de votre sélection. C’est à vous de préciser les
bonnes caractéristiques de la variable après insertion.
Pour insérer une observation placez-vous dans affichage observation, cliquez sur données puis sur insérer une
observation.
Pour trier votre fichier selon une ou plusieurs variables, placez-vous dans affichage des données, cliquez sur
données, puis sur trier les observations ; vous verrez le menu suivant qui contient trois zones : la zone dans
laquelle vous avez les variables, la zones au-dessus de laquelle il est écrit trier par : c’est dans cette zone que
vous devez envoyer le critère du tri ; et la
zone qui permet de spécifier l’ordre du tri
(ordre croisant ou décroissant).
Vous pouvez trier selon plusieurs variables, telle variable en ordre croissant telle autre en ordre décroissant.
Pour trier le fichier procédez comme suit :
2. Sélectionner la variable selon laquelle (par ordre de tirage) vous voulez trier ;
3. Envoyer cette variable dans la zone trier par ; puis cliquez sur ok.
Si vous avez plusieurs variables critères, répétez les étapes 1 ; 2 ; 3 par ordre de priorité dans le tri (c'est-à-dire
la machine va trier d’abord selon la première variable choisie, ensuite selon la deuxième, ensuite…).
Pour agréger des variables dans SPSS, vous pouvez utiliser la fonction AGGREGATE. Voici les étapes à suivre :
2-Tapez la commande AGGREGATE suivie de la liste des variables que vous souhaitez agréger.
3-Spécifiez les variables de groupe en utilisant la commande BY. Les variables de groupe sont celles que vous
souhaitez utiliser pour regrouper les données avant de les agréger.
4-Spécifiez la fonction d'agrégation que vous souhaitez utiliser, telle que la moyenne, la somme, le minimum ou
le maximum.
Dans cet exemple, la commande AGGREGATE crée une nouvelle variable "score_mean" qui contient
la moyenne de la variable "score" pour chaque groupe de la variable "sexe". La commande
MODE=ADDVARIABLES spécifie que la variable agrégée doit être ajoutée à la base de données
existante. La commande BREAK=sexe spécifie que les données doivent être regroupées par la
variable "sexe". La fonction d'agrégation utilisée est MEAN, qui calcule la moyenne de la variable
"score".
b.3. Recodage des variables :
La fusion de fichiers dans SPSS permet de combiner deux ou plusieurs fichiers de données en un seul,
en utilisant une ou plusieurs variables communes pour fusionner les fichiers.
Voici les étapes pour fusionner des fichiers dans SPSS :
1- Ouvrir le premier fichier de données dans SPSS.
2- Aller dans le menu "Données" et sélectionner "Fusionner des fichiers".
3- Sélectionner le deuxième fichier de données que vous souhaitez fusionner avec le premier fichier.
4- Dans la fenêtre de fusion, sélectionner les variables communes entre les deux fichiers. Ces
variables serviront à associer les observations entre les deux fichiers.
5- Sélectionner le type de fusion que vous souhaitez effectuer. Vous pouvez choisir une fusion
interne, une fusion externe gauche ou une fusion externe droite en fonction de vos besoins.
6- Cliquer sur le bouton "OK" pour fusionner les fichiers.
7- Si nécessaire, répéter les étapes 3 à 6 pour fusionner des fichiers supplémentaires.
8- Enregistrer le fichier fusionné sous un nouveau nom.
Il est important de noter que les fichiers de données à fusionner doivent avoir des variables
communes avec des valeurs identiques pour les observations correspondantes. Si les variables
communes contiennent des valeurs différentes pour les mêmes observations, la fusion ne
fonctionnera pas correctement.
b.5. Nettoyage des données :
Le nettoyage des données permet d'identifier et de corriger les erreurs et les valeurs manquantes
dans les données. Par exemple, il est possible de remplacer les valeurs manquantes par la moyenne
ou la médiane des autres valeurs de la variable. est une étape importante dans la préparation des
données pour l'analyse statistique. Voici quelques-unes des principales techniques de nettoyage des
données dans SPSS :
1- Détection des valeurs manquantes : SPSS permet de détecter les valeurs manquantes dans les
données en utilisant la fonction "Analyze > Missing Values > Explore". Cette fonction fournit des
statistiques sur les valeurs manquantes pour chaque variable, ainsi que des graphiques pour
visualiser la distribution des données manquantes.
2- Remplacement des valeurs manquantes : Une fois que les valeurs manquantes ont été détectées,
il est possible de remplacer ces valeurs par des valeurs estimées en utilisant la fonction "Transform >
Replace Missing Values". SPSS permet de remplacer les valeurs manquantes par des valeurs
moyennes, médianes ou en utilisant des méthodes de régression.
3- Détection et suppression des valeurs aberrantes : SPSS permet de détecter les valeurs aberrantes
à l'aide de la fonction "Analyze > Descriptive Statistics > Explore". Cette fonction fournit des
statistiques sur les valeurs extrêmes pour chaque variable, ainsi que des graphiques pour visualiser la
distribution des données aberrantes. Si nécessaire, les valeurs aberrantes peuvent être supprimées à
l'aide de la fonction "Data > Select Cases > Exclude Cases".
4- Détection et suppression des doublons : SPSS permet de détecter les doublons à l'aide de la
fonction "Data > Sort Cases". Cette fonction permet de trier les données en fonction des variables
souhaitées, ce qui facilite la détection des doublons. Une fois les doublons détectés, il est possible de
supprimer les observations en double à l'aide de la fonction "Data > Select Cases > Exclude Duplicate
Cases".
5- Renommage et re-codage des variables : Enfin, il peut être utile de renommer ou de recoder les
variables pour faciliter l'analyse des données. Cela peut être fait à l'aide des fonctions "Transform >
Recode" et "Variables > Rename Variables".
c. Visualisation de données
Permet de visualiser les données sous forme de graphiques, de tableaux ou de diagrammes. Cela
peut aider à identifier les tendances et les schémas dans les données. SPSS propose plusieurs options
pour visualiser les données, notamment :
1- Histogrammes : Les histogrammes permettent de visualiser la distribution des données
numériques. Ils peuvent être créés en utilisant la fonction "Graphs > Legacy Dialogs > Histogram".
2- Diagrammes en boîte : Les diagrammes en boîte permettent de visualiser la répartition des
données et la présence de valeurs aberrantes. Ils peuvent être créés en utilisant la fonction "Graphs
> Legacy Dialogs > Boxplot".
3- Graphiques en barres : Les graphiques en barres permettent de visualiser les distributions de
données catégorielles. Ils peuvent être créés en utilisant la fonction "Graphs > Chart Builder > Bar".
4- Graphiques en nuages de points : Les graphiques en nuages de points permettent de visualiser la
relation entre deux variables numériques. Ils peuvent être créés en utilisant la fonction "Graphs >
Chart Builder > Scatterplot".
5- Diagrammes circulaires : Les diagrammes circulaires permettent de visualiser la répartition des
données catégorielles sous forme de pourcentages. Ils peuvent être créés en utilisant la fonction
"Graphs > Legacy Dialogs > Pie".
6- Graphiques de ligne : Les graphiques de ligne permettent de visualiser l'évolution des données
numériques dans le temps. Ils peuvent être créés en utilisant la fonction "Graphs > Chart Builder >
Line".
7- Matrices de corrélation : Les matrices de corrélation permettent de visualiser la relation entre
plusieurs variables numériques. Elles peuvent être créées en utilisant la fonction "Graphs > Chart
Builder > Matrix".
III. Partie 3 : Étude de cas : Analyse de la satisfaction des clients d'une entreprise de vente
en ligne (ZARA) à l'aide de SPSS
Dans ce chapitre, nous allons traiter le cas pratique de la société ZARA.
L’objectif de cette partie étant d’appuyer toute la partie théorique du mémoire sur la fonction spss par
un cas pratique, les diligences qui sont déroulées sont regroupées en trois sections :
La première chapitre présente présentation de l'entreprise ZARA, son historique, son activité
Publications.