LES OUTILS DE TRAITEMENT DE
L’INFORMATION
L’ANALYSE DES
DONNEES
02/12/2024 ANALYSE DES DONNEES - 1
ELABJANI
INTRODUCTION
A PROPOS DE L’ADD
1. Un domaine très vaste qui :
* renferme plusieurs méthodes.
* s’applique à plusieurs disciplines.
2. Elle vient après la collecte des
données.
3. Elle représente un outil d’aide à la
décision et un moyen de prévisions.
02/12/2024 ANALYSE DES DONNEES - ELABJANI 2
INTRODUCTION
LES OBJECTIFS
1. Comprendre la démarche de l’ADD
* partie théorique succinte.
* partie empirique.
2. Faire connaissance avec le logiciel
SPSS.
3. Exécuter des programmes sur celui-
ci.
02/12/2024 ANALYSE DES DONNEES - 3
ELABJANI
INTRODUCTION
LA SELECTION DES METHODES
Celle-ci se fait principalement via trois
critères de première importance dans
toute sorte d’études et/ou recherches:
[Link] objectifs de l’utilisateur (ou bien
de la recherche).
[Link] variables utilisées (numériques,
nominales,…)
[Link] type des études à mener.
02/12/2024 ANALYSE DES DONNEES - 4
ELABJANI
INTRODUCTION
x La Démarche dans le travail du statisticien
[Link]: définition de la population, des unités,
des caractères (variables), questionnaires
[Link] des données: exécution de l’enquête
[Link]: vérification, contrôle, redressement,
etc.
[Link]: statistique descriptive, analyse des
données multidimensionnelle, méthodes
économétriques, etc.
[Link] des résultats
02/12/2024 ANALYSE DES DONNEES - 5
ELABJANI
INTRODUCTION
x La Démarche dans le travail du statisticien
02/12/2024 ANALYSE DES DONNEES - 6
ELABJANI
LES THEMES
Rappels sur l’analyse
unidimensionnelle;
L’intérêt de l’analyse
bidimensionnelle;
L’analyse multidimensionnelle des
données.
02/12/2024 ANALYSE DES DONNEES - 7
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
L’analyse unidimensionnelle représente
la forme la plus simple de l’étude des
données et des populations observées.
Elle fait l’objet de la statistique
descriptive classique qui se base
généralement sur deux principales
étapes :
02/12/2024 ANALYSE DES DONNEES - 8
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
§ L’observation de la population (ou
des individus) en utilisant un
systéme de collecte des
informations;
§ L’utilisation d’un seul caractère
(quantitatif ou qualitatif) afin
d’étudier les unités statistiques
observées.
02/12/2024 ANALYSE DES DONNEES - 9
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
Afin de mieux réduire les données
et les populations observées,
L’analyse unidimensionnelle utilise
plusieurs formes d’analyse dont on
cite:
1. L’utilisation des tableaux et des
variables statistiques;
02/12/2024 ANALYSE DES DONNEES - 10
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
2. Le recours à des
représentations graphiques selon
le(s) caractère(s) (quantitatif ou
qualitatif) utilisés;
3. La détermination des
caractéristiques et des paramètres
de position (mode, médiane,
moyenne,…) ou de dispersion
(variance, écart type,..).
02/12/2024 ANALYSE DES DONNEES - 11
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
Exemple:
Descriptives
Erreur
RISQUE Statistique standard
NAISENTR non Moyenne ,33 ,33
Intervalle de confiance à Borne inférieure -1,10
95% pour la moyenne Borne supérieure
1,77
Moyenne tronquée à 5% ,
Médiane ,00
Variance ,333
Ecart-type ,58
Minimum 0
Maximum 1
Intervalle 1
Intervalle interquartile ,
Asymétrie 1,732 1,225
Aplatissement , ,
oui Moyenne ,13 3,90E-02
Intervalle de confiance à Borne inférieure 5,38E-02
95% pour la moyenne Borne supérieure
,21
Moyenne tronquée à 5% 9,06E-02
Médiane ,00
Variance ,116
Ecart-type ,34
Minimum 0
Maximum 1
Intervalle 1
Intervalle interquartile ,00
02/12/2024 Asymétrie ANALYSE DES DONNEES - 2,224 ,276 12
Aplatissement 3,025 ,545
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
La deuxième forme de l’analyse des données
est L’analyse bidimensionnelle qui se base sur
l’application simultannée de deux caratères
différents dans la représentation des unités
statistiques.
* Le même raisonnement d’analyse
unidimensionnelle peut être séparément
utilisé sur chacun des caractères;
* Les caractères peuvent être de même ou
de différentes
02/12/2024 natures.
ANALYSE DES DONNEES -
ELABJANI
13
2. Rappels sur l’analyse bidimensionnelle
L’intérêt de l’analyse bidimensionnelle est
essentiellement lié à l’éventuelle liaison
susceptible d’exister entre les deux variables
prises en considération.
Plusieurs cas sont possibles:
1. Lorsque les deux caractères sont
qualitatifs, on est conduit à une analyse des
tableaux de contingence croisant les deux
variables statistiques;
Exemple: TRI croisés, la matrice des corrélations,
anova, …
02/12/2024 ANALYSE DES DONNEES -
ELABJANI
14
2. Rappels sur l’analyse bidimensionnelle
Exemple des TRI croisés
Tableau croisé NAISENTR * RISQUE
RISQUE
non oui Total
NAISENTR oui Effectif 2 66 68
% dans NAISENTR 2,9% 97,1% 100,0%
% dans RISQUE 66,7% 86,8% 86,1%
% du total 2,5% 83,5% 86,1%
non Effectif 1 10 11
% dans NAISENTR 9,1% 90,9% 100,0%
% dans RISQUE 33,3% 13,2% 13,9%
% du total 1,3% 12,7% 13,9%
Total Effectif 3 76 79
% dans NAISENTR 3,8% 96,2% 100,0%
% dans RISQUE 100,0% 100,0% 100,0%
% du total 3,8% 96,2% 100,0%
02/12/2024 ANALYSE DES DONNEES - 15
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
Matrice de corrélations
Corrélations
NAISENTR RISQUE
Corrélation de Pearson NAISENTR 1,000 -,111
RISQUE -,111 1,000
Signification (unilatérale) NAISENTR , ,164
RISQUE ,164 ,
N NAISENTR 79 79
RISQUE 79 79
02/12/2024 ANALYSE DES DONNEES - 16
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
Analyse de la variance
ANOVAb
Somme
Modèle des carrés ddl Carré moyen F Signification
1 Régression ,117 1 ,117 ,967 ,328a
Résidu 9,351 77 ,121
Total 9,468 78
a. Valeurs prédites : (constantes), RISQUE
b. Variable dépendante : NAISENTR
02/12/2024 ANALYSE DES DONNEES - 17
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
2. Lorsque l’un des deux caractères est
quantitatif, on peut comparer la moyenne de
la variable quantitative aux modalités de
l’autre variable;
Salaire
courant
Sexe Femme $26,032
Homme $41,442
Salaire Date de Salaire
courant Date de naissance
courant naissance
Moyenne Moyenne Minimum
Sexe Femme $26,032 02/11/1956 Sexe Femme $26,032 02/11/56 02/10/29
Homme $41,442 04/28/1957 Homme $41,442 04/28/57 05/03/29
02/12/2024 ANALYSE DES DONNEES - 18
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
3. Lorsque les deux caractères sont quantitatifs,
l’analyse doit porter sur la corrélation entre les
deux variables statistiques.
On parle, généralement, dans ce genre d’analyse
de:
* la dépendance ou l’indépendance des deux
caractères X et Y.
* la liaison fonctionnelle appelée également la
régression linéaire.
02/12/2024 ANALYSE DES DONNEES - 19
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
En cas de régression, on peut mesurer:
- le poids de variation de l’une des variables
sur l’autre (par estimation);
- l’intensité de corrélation en calculant le
coefficient de corrélation tq. : cov(X,Y)
R=
s X .s Y
- La significativité de la corrélation en
calculant le test de Fischer.
- La significativité des paramètres en calculant
les tests de Student.
- etc.
02/12/2024 ANALYSE DES DONNEES - 20
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
Récapitulatif du modèle
Changement dans les statistiques
Erreur Modification
standard de Variation de F
Modèle R R-deux R-deux ajusté l'estimation de R-deux Variation de F ddl 1 ddl 2 signification
1 ,668a ,446 ,443 $5,871.76 ,446 189,427 2 471 ,000
a. Valeurs prédites : (constantes), Expérience passée (nombre de mois), Niveau d'éducation (nombre d'années passées à l'école)
02/12/2024 ANALYSE DES DONNEES - 21
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
Coefficientsa
Coefficie n
ts
Coefficie nts non standardi Statistiques de
standardisés sés colinéarité
Erreur
Modèle B standard Bêta t Signification Tolérance VIF
1 (constante) -9902,786 1417,474 -6,986 ,000
Niveau d'éducation
(nombre d'années 1878,211 96,717 ,688 19,420 ,000 ,936 1,068
passées à l'é cole)
Expérience passée
16,470 2,668 ,219 6,174 ,000 ,936 1,068
(nombre de mois)
a. Variable dépendante : Salaire d'embauche
02/12/2024 ANALYSE DES DONNEES - 22
ELABJANI
2. Rappels sur l’analyse bidimensionnelle
02/12/2024 ANALYSE DES DONNEES - 23
ELABJANI
3. L’analyse multidimensionnelle des données
Plusieurs méthodes d’analyse peuvent être
utilisées dans ce cadre.
Leur principal intérêt étant de travailler
sur différents caractères pris au même
temps.
Ce qui doit traduire la réalité puisque les
populations étudiées dépendent réellement
d’une multitude de variables.
02/12/2024 ANALYSE DES DONNEES - 24
ELABJANI
3. L’analyse multidimensionnelle des données
Leurs points communs tiennent à :
leur objectif visant la réduction des données afin d’en
tirer facilement les relations essentielles existantes entre
les variables (Graphiques, tableaux,…);
Dégager l’effet de tendance globale des données
utilisées;
w Créer des regroupements entre individus ou entre
variables;
x Le recours informatique qui en facilite énormément
l’application même sur des cas et des nombres irréalisables.
02/12/2024 ANALYSE DES DONNEES - 25
ELABJANI
3. L’analyse multidimensionnelle des données
Les principales méthodes d’analyse à présenter à
cet égard dont certaines font partie des méthodes
dites d’Analyses Factorielles simples, sont :
Les méthodes de régression multiple
(Econométrie).
L’Analyse en Composantes Principales (ACP).
w L’Analyse Factorielle des Correspondances
(AFC).
02/12/2024 ANALYSE DES DONNEES - 26
ELABJANI
2. Rappels sur l’analyse multidimensionnelle
1. L’Analyse de la régression multiple Corrélations
NAISENTR RISQUE PARTENAI INDEPEND TRAVENTR STRESS AVENTRIS ARGENT AGE GAIN RESPONSA
Corrélation de Pearson NAISENTR 1,000 -,114 ,278 -,338 ,080 -,164 -,127 ,265 ,089 -,054 -,181
RISQUE -,114 1,000 ,056 -,122 ,090 ,051 ,066 ,062 -,031 -,044 ,114
PARTENAI ,278 ,056 1,000 -,008 -,033 ,098 -,081 ,099 -,119 -,122 -,112
INDEPEND -,338 -,122 -,008 1,000 ,004 ,244 ,057 -,126 -,062 -,027 ,147
TRAVENTR ,080 ,090 -,033 ,004 1,000 ,110 -,130 ,057 ,010 ,292 ,354
STRESS -,164 ,051 ,098 ,244 ,110 1,000 ,048 -,230 -,034 -,066 ,066
AVENTRIS -,127 ,066 -,081 ,057 -,130 ,048 1,000 ,013 -,059 -,041 ,127
ARGENT ,265 ,062 ,099 -,126 ,057 -,230 ,013 1,000 ,319 -,097 ,064
AGE ,089 -,031 -,119 -,062 ,010 -,034 -,059 ,319 1,000 -,070 -,005
GAIN -,054 -,044 -,122 -,027 ,292 -,066 -,041 -,097 -,070 1,000 ,220
RESPONSA -,181 ,114 -,112 ,147 ,354 ,066 ,127 ,064 -,005 ,220 1,000
Signification (unilatérale) NAISENTR , ,175 ,010 ,002 ,256 ,089 ,149 ,014 ,234 ,329 ,068
RISQUE ,175 , ,325 ,159 ,232 ,338 ,296 ,307 ,399 ,361 ,175
PARTENAI ,010 ,325 , ,475 ,393 ,212 ,255 ,210 ,165 ,158 ,179
INDEPEND ,002 ,159 ,475 , ,487 ,022 ,321 ,151 ,308 ,414 ,114
TRAVENTR ,256 ,232 ,393 ,487 , ,183 ,144 ,322 ,467 ,007 ,001
STRESS ,089 ,338 ,212 ,022 ,183 , ,349 ,029 ,389 ,294 ,294
AVENTRIS ,149 ,296 ,255 ,321 ,144 ,349 , ,456 ,314 ,370 ,149
ARGENT ,014 ,307 ,210 ,151 ,322 ,029 ,456 , ,004 ,215 ,299
AGE ,234 ,399 ,165 ,308 ,467 ,389 ,314 ,004 , ,284 ,484
GAIN ,329 ,361 ,158 ,414 ,007 ,294 ,370 ,215 ,284 , ,034
RESPONSA ,068 ,175 ,179 ,114 ,001 ,294 ,149 ,299 ,484 ,034 ,
N NAISENTR 69 69 69 69 69 69 69 69 69 69 69
RISQUE 69 69 69 69 69 69 69 69 69 69 69
PARTENAI 69 69 69 69 69 69 69 69 69 69 69
INDEPEND 69 69 69 69 69 69 69 69 69 69 69
TRAVENTR 69 69 69 69 69 69 69 69 69 69 69
STRESS 69 69 69 69 69 69 69 69 69 69 69
AVENTRIS 69 69 69 69 69 69 69 69 69 69 69
ARGENT 69 69 69 69 69 69 69 69 69 69 69
AGE 69 69 69 69 69 69 69 69 69 69 69
02/12/2024 GAIN
ANALYSE DES DONNEES - 27
69 69 69 69 69 69 69 69 69 69 69
RESPONSA 69 69 69ELABJANI 69 69 69 69 69 69 69 69
2. Rappels sur l’analyse multidimensionnelle
Coefficientsa
Coefficie n
ts
Coefficie nts non standardi Intervalle de confiance à Statistiques de
standardisés sés 95% de B Corréla tions colinéarité
Erreur Borne Borne Corréla tion
Modèle B standard Bêta t Signification inférieure supérie ure simple Partielle Partie Tolérance VIF
1 (constante) ,510 ,239 2,139 ,037 ,033 ,988
RISQUE -,291 ,196 -,168 -1,485 ,143 -,682 ,101 -,114 -,191 -,163 ,942 1,062
PARTENAI ,183 ,081 ,259 2,249 ,028 ,020 ,345 ,278 ,283 ,247 ,913 1,095
INDEPEND -,239 ,095 -,292 -2,503 ,015 -,430 -,048 -,338 -,312 -,275 ,888 1,127
TRAVENTR ,147 ,116 ,159 1,270 ,209 -,085 ,380 ,080 ,165 ,140 ,775 1,291
STRESS -6,28E-02 ,100 -,075 -,629 ,532 -,263 ,137 -,164 -,082 -,069 ,845 1,184
AVENTRIS -4,87E-02 ,143 -,039 -,341 ,734 -,334 ,237 -,127 -,045 -,038 ,928 1,077
ARGENT ,129 ,087 ,184 1,486 ,143 -,045 ,304 ,265 ,192 ,163 ,791 1,264
AGE 1,990E-02 ,085 ,028 ,234 ,816 -,150 ,190 ,089 ,031 ,026 ,859 1,164
GAIN -2,85E-02 ,085 -,040 -,337 ,738 -,198 ,141 -,054 -,044 -,037 ,853 1,172
RESPONSA -,139 ,124 -,139 -1,124 ,266 -,387 ,109 -,181 -,146 -,124 ,788 1,270
a. Variable dépendante : NAISENTR
02/12/2024 ANALYSE DES DONNEES - 28
ELABJANI
2. Rappels sur l’analyse multidimensionnelle
Récapitulatif du modèleb
Changement dans les statistiques
Erreur Modification
standard de Variation de F Durbin-W
Modèle R R-deux R-deux ajusté l'e stimation de R-deux Variation de F ddl 1 ddl 2 sig nification atson
1 a
,546 ,298 ,177 ,32 ,298 2,467 10 58 ,016 2,025
a. Valeurs prédites : (constantes), RESPONSA, AGE, STRESS, RISQUE, AVENTRIS, PARTENAI, GAIN, INDEPEND, ARGENT, TRAVENTR
b. Variable dépendante : NAISENTR
02/12/2024 ANALYSE DES DONNEES - 29
ELABJANI
2. Rappels sur l’analyse multidimensionnelle
Quelques exemples pratiques:
Exemple 1 : cas Qual/Quant (Valeau 2006).
Exemple 2 : cas de l’Accompagnement Entrepreneurial
et Poursuite de la CE (Regression Logit).
02/12/2024 ANALYSE DES DONNEES - 30
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
2.1. Caractéristiques
L’ACP est une méthode de description des
tableaux de mesures, appelés aussi tableaux
«individus-caractères quantitatifs».
Elle représente la base de l’analyse des données
et permet de de décrire les relations:
- entre individus;
- entre les variables;
- entre les individus et les variables.
D’où son utilisation des nuages de points individus
et variables.
02/12/2024 ANALYSE DES DONNEES - 31
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Ä entre individus:
L’ACP cherche à analyser les distances et les écarts
séparant les unités statistiques.
Ä entre les variables:
L’ACP s’interesse plus particulèrement aux corrélations
entre les variables.
Ä entre les individus et les variables:
L’analyse doit porter sur la représentativité des individus
par les variables étudiées et dont on choisit logiquement les
principales qui restituent une grande part d’explication dans
la variation
02/12/2024 des unités observées.
ANALYSE DES DONNEES - 32
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Remarques:
1. En ACP, les données sont centrées et réduites, pour
mieux apprécier les distances entre les individus, et divisées
par Ön pour permettre le calcul des corrélations entre les
variables.
2. L’ACP se base, dans son analyse, sur la
visualisation graphique des données (les nuages de
points).
3. La dispersion des points d’un nuage par rapport
à l’origine est appelée inertie totale du nuage.
02/12/2024 ANALYSE DES DONNEES - 33
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
L’ACP passe par des «photographies» (appelées
aussi cartes factorielles) qui représentent des
projections des individus et des variables
effectuées sur les plans retenus.
Chaque plan factoriel est défini par 2 axes
orthogonaux. Le taux d’inertie d’un axe est la part
de l’inertie totale expliquée par cet axe. Il indique
le pourcentage d’informations restituées par le
même axe.
Chaque axe factoriel correspond à un facteur ou
une 02/12/2024
composante principale
ANALYSE DES(variable
DONNEES - importante).
34
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Exemple:
Individus Variable1 Variable2
1 3 500
2 9 700
3 4 1400
4 13 1900
5 8 1700
6 11 1000
48 7200
Moy. 8 1200
E.T. 3,559 509,902
02/12/2024 ANALYSE DES DONNEES - 35
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Exemple:
2000 4
1800
5
1600
3
1400 G
Variable 1
1200
1000
6
800 2
600 1
400
200
0
0 2 4 6 8 10 12 14
Variable 2
02/12/2024 ANALYSE DES DONNEES - 36
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Exemple:l’ACP suppose de prendre pour une
nouvelle origine le point G appelé centre de gravité.
Individus Variable1 Variable2
1 -0,5735 -0,5604
2 +0,1147 -0,4003
3 -0,4588 +0,1601
4 +0,5735 +0,5604
5 0 +0,4003
6 +0,3441 -0,1601
0 0
Moy. 0 0
E.T. 1/Ö6 1/Ö6
S x² 1 1
02/12/2024 ANALYSE DES DONNEES - 37
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
C’est ainsi que les nouvelles coordonnées des
individus en ACP deviennent centrées et réduites.
Pour l’individu 3 par exemple, on a :
V13 = (4-8)/(3,559Ö6) = -0,4588
V23 = (1400-1200)/(509,902Ö6) = +0,1601
Avec le carré de la distance du point-individu 3 à
G est égal à :
(-0,4588)² + (+0,1601)² = 0,2361.
Ce qui définit le carré de la distance du point-
individu 3 au centre de gravité G.
02/12/2024 ANALYSE DES DONNEES - 38
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
D’où, l’inertie totale du nuage est représentée par la
somme des carrés des distances de toutes les données
(points-individus).
Elle mesure la dispersion des points autour du centre de
gravité G.
Dans le cas d’une ACP normée, elle est égale au nombre de
variables, çàd 2 dans notre cas.
02/12/2024 ANALYSE DES DONNEES - 39
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
L’intérêt essentiel de l’ACP est de
déterminer l’axe principal du nuage dont les
distances entre les projections des points
sont maximales.
Ce dernier est ainsi appelé l’axe factoriel
n°1 lequel présente le meilleur taux
d’inertie en premier lieu.
Le second axe factoriel sera forcément
représenté par un taux d’inertie faible.
02/12/2024 ANALYSE DES DONNEES - 40
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 41
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
En conséquence, L’ACP transforme
les variables V1 et V2 initialement
corrélées entre elles en axes factoriels
appelés aussi composantes factorielles
ou facteurs principaux.
Généralement, ces derniers
restituent une part importante de
l’information recherchée.
02/12/2024 ANALYSE DES DONNEES - 42
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
1.2. Application de l’ACP sur ordinateur:
L’application se fait globalement en passant par les étapes suivantes:
1. La saisie des données observées;
2. Le traitement des informations par le logiciel;
3. Celui-ci fournit les axes factoriels dans l’ordre décroissant des taux
d’inertie ainsi les tx d’inertie cumulés;
4. La sélection des principaux facteurs retenus (2 ou 3) pour 80% de
l’inertie totale;
5. La sélection se fait aussi à partir des représentations graphiques
fournies par le logiciel;
6. Interprétation des résultats dans le sens de la corrélation entre les
variables et la représentativité des individus observés.
02/12/2024 ANALYSE DES DONNEES - 43
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 44
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 45
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
v Analyse en quatre cadrans:
Ø Nord-ouest: élèves 7 et 8, assez mauvais en général, légère dominante
EPS/physique/math;
Ø Sud-ouest: élèves 5 et 6, légèrement mauvais, légère dominante lv1/2/philo;
Ø Nord-est: élève 2, assez bon en général avec forte dominante EPS/physique/math;
ØSud-est: élèves 1, 3 et 4, de modérément bon en général (élève 4) à très bon en général
(élève 1), à dominante lv1/2/philo légère (1 et 3) à forte (4).
v Deux individus proches sur ce graphique ont des profils similaires.
02/12/2024 ANALYSE DES DONNEES - 46
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Remarques :
1. L’ACP perd de l’information: tout comme la moyenne réduit chaque
individu à 1 nombre, l’ACP le réduit à 2 nombres (sur les deux
axes).
2. Reporter les deux pourcentages présentés sur les axes: plus leur
somme est loin de 100%, plus de l’information est perdue.
3. Corrélation n’est pas causalité !!!
En effet, deux variables peuvent être corrélées, même si l’une n’est pas
conséquence de l’autre, et même si l’une et l’autre ne sont pas liées.
Une corrélation peut être aussi dûe à:
• Un trop faible échantillon (cf. exemples femmes/hommes en
régression);
• Un trop grand nombre de variables testées (spurious correlations).
02/12/2024 ANALYSE DES DONNEES - 47
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Exemple: le cas de 15 Eses observées sur la
base d’un ensemble de paramètres économiques.
X1 X2 X3 X4 X5 X6
1 -14,20 14,50 1,55 -5,10 1,85 105
2 -13,70 14,00 1,50 -5,05 1,80 95
3 -12,60 15,80 1,65 -5,30 1,75 110
4 -12,80 16,00 1,80 -4,90 1,96 115
5 -13,00 15,10 1,90 -5,10 1,98 121
6 -12,40 13,80 1,85 -4,50 1,91 93
7 -13,50 14,30 1,80 -4,60 1,93 101
8 -12,20 15,20 1,85 -4,40 1,87 85
9 -12,10 10,30 1,65 -4,30 1,70 75
10 -12,00 11,10 1,75 -4,10 1,86 84
11 -11,20 10,30 1,80 -4,20 1,82 80
12 -11,50 11,40 1,85 -4,80 1,72 78
13 -11,50 12,30 1,90 -4,90 1,78 79
14 -10,80 11,00 1,80 -4,05 1,80 76
15 -11,60 10,50 1,90 -4,00 1,85 81
02/12/2024 ANALYSE DES DONNEES - 48
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
les résultats donnés par le logiciel sont
récapitulés ainsi:
Axe Taux Taux d’inertie
factoriel d’inertie (%) cumulé (%)
1 59,3 59,3
2 25,2 84,5
3 10,0 94,5
4 2,6 97,1
…. … …
02/12/2024 ANALYSE DES DONNEES - 49
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 50
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 51
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 52
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
02/12/2024 ANALYSE DES DONNEES - 53
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Les procédures de base dans l’analyse
02/12/2024 ANALYSE DES DONNEES - 54
ELABJANI
3. L’analyse multidimensionnelle des données
Exemple 3 : cas Analy. Uni-ACP (Elabjani2016).
02/12/2024 ANALYSE DES DONNEES - 55
ELABJANI
3. L’analyse multidimensionnelle des données
L’Analyse Factorielle des Correspondances
(AFC).
02/12/2024 ANALYSE DES DONNEES - 56
ELABJANI