0% ont trouvé ce document utile (0 vote)
53 vues56 pages

Outils et Méthodes d'Analyse des Données

Le document traite de l'analyse des données, un domaine vaste qui utilise diverses méthodes pour aider à la décision et aux prévisions après la collecte des données. Il présente les objectifs de l'analyse des données, les méthodes de sélection, ainsi que les démarches du statisticien, incluant l'analyse unidimensionnelle, bidimensionnelle et multidimensionnelle. Enfin, il aborde des outils logiciels comme SPSS et des méthodes statistiques telles que la régression multiple et l'analyse en composantes principales.

Transféré par

bouchralagsir90
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
53 vues56 pages

Outils et Méthodes d'Analyse des Données

Le document traite de l'analyse des données, un domaine vaste qui utilise diverses méthodes pour aider à la décision et aux prévisions après la collecte des données. Il présente les objectifs de l'analyse des données, les méthodes de sélection, ainsi que les démarches du statisticien, incluant l'analyse unidimensionnelle, bidimensionnelle et multidimensionnelle. Enfin, il aborde des outils logiciels comme SPSS et des méthodes statistiques telles que la régression multiple et l'analyse en composantes principales.

Transféré par

bouchralagsir90
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

LES OUTILS DE TRAITEMENT DE

L’INFORMATION

L’ANALYSE DES
DONNEES

02/12/2024 ANALYSE DES DONNEES - 1


ELABJANI
INTRODUCTION
Œ A PROPOS DE L’ADD
1. Un domaine très vaste qui :
* renferme plusieurs méthodes.
* s’applique à plusieurs disciplines.
2. Elle vient après la collecte des
données.
3. Elle représente un outil d’aide à la
décision et un moyen de prévisions.
02/12/2024 ANALYSE DES DONNEES - ELABJANI 2
INTRODUCTION
 LES OBJECTIFS
1. Comprendre la démarche de l’ADD
* partie théorique succinte.
* partie empirique.
2. Faire connaissance avec le logiciel
SPSS.
3. Exécuter des programmes sur celui-
ci.
02/12/2024 ANALYSE DES DONNEES - 3
ELABJANI
INTRODUCTION
Ž LA SELECTION DES METHODES
Celle-ci se fait principalement via trois
critères de première importance dans
toute sorte d’études et/ou recherches:
[Link] objectifs de l’utilisateur (ou bien
de la recherche).
[Link] variables utilisées (numériques,
nominales,…)
[Link] type des études à mener.
02/12/2024 ANALYSE DES DONNEES - 4
ELABJANI
INTRODUCTION
x La Démarche dans le travail du statisticien
[Link]: définition de la population, des unités,
des caractères (variables), questionnaires
[Link] des données: exécution de l’enquête
[Link]: vérification, contrôle, redressement,
etc.
[Link]: statistique descriptive, analyse des
données multidimensionnelle, méthodes
économétriques, etc.
[Link] des résultats
02/12/2024 ANALYSE DES DONNEES - 5
ELABJANI
INTRODUCTION
x La Démarche dans le travail du statisticien

02/12/2024 ANALYSE DES DONNEES - 6


ELABJANI
LES THEMES
Œ Rappels sur l’analyse
unidimensionnelle;

 L’intérêt de l’analyse
bidimensionnelle;

Ž L’analyse multidimensionnelle des


données.
02/12/2024 ANALYSE DES DONNEES - 7
ELABJANI
1. Rappels sur l’analyse unidimensionnelle

L’analyse unidimensionnelle représente


la forme la plus simple de l’étude des
données et des populations observées.
Elle fait l’objet de la statistique
descriptive classique qui se base
généralement sur deux principales
étapes :

02/12/2024 ANALYSE DES DONNEES - 8


ELABJANI
1. Rappels sur l’analyse unidimensionnelle

§ L’observation de la population (ou


des individus) en utilisant un
systéme de collecte des
informations;

§ L’utilisation d’un seul caractère


(quantitatif ou qualitatif) afin
d’étudier les unités statistiques
observées.
02/12/2024 ANALYSE DES DONNEES - 9
ELABJANI
1. Rappels sur l’analyse unidimensionnelle

Afin de mieux réduire les données


et les populations observées,
L’analyse unidimensionnelle utilise
plusieurs formes d’analyse dont on
cite:
1. L’utilisation des tableaux et des
variables statistiques;

02/12/2024 ANALYSE DES DONNEES - 10


ELABJANI
1. Rappels sur l’analyse unidimensionnelle

2. Le recours à des
représentations graphiques selon
le(s) caractère(s) (quantitatif ou
qualitatif) utilisés;
3. La détermination des
caractéristiques et des paramètres
de position (mode, médiane,
moyenne,…) ou de dispersion
(variance, écart type,..).
02/12/2024 ANALYSE DES DONNEES - 11
ELABJANI
1. Rappels sur l’analyse unidimensionnelle
Exemple:
Descriptives

Erreur
RISQUE Statistique standard
NAISENTR non Moyenne ,33 ,33
Intervalle de confiance à Borne inférieure -1,10
95% pour la moyenne Borne supérieure
1,77

Moyenne tronquée à 5% ,
Médiane ,00
Variance ,333
Ecart-type ,58
Minimum 0
Maximum 1
Intervalle 1
Intervalle interquartile ,
Asymétrie 1,732 1,225
Aplatissement , ,
oui Moyenne ,13 3,90E-02
Intervalle de confiance à Borne inférieure 5,38E-02
95% pour la moyenne Borne supérieure
,21

Moyenne tronquée à 5% 9,06E-02


Médiane ,00
Variance ,116
Ecart-type ,34
Minimum 0
Maximum 1
Intervalle 1
Intervalle interquartile ,00
02/12/2024 Asymétrie ANALYSE DES DONNEES - 2,224 ,276 12
Aplatissement 3,025 ,545
ELABJANI
2. Rappels sur l’analyse bidimensionnelle

La deuxième forme de l’analyse des données


est L’analyse bidimensionnelle qui se base sur
l’application simultannée de deux caratères
différents dans la représentation des unités
statistiques.

* Le même raisonnement d’analyse


unidimensionnelle peut être séparément
utilisé sur chacun des caractères;
* Les caractères peuvent être de même ou
de différentes
02/12/2024 natures.
ANALYSE DES DONNEES -
ELABJANI
13
2. Rappels sur l’analyse bidimensionnelle

L’intérêt de l’analyse bidimensionnelle est


essentiellement lié à l’éventuelle liaison
susceptible d’exister entre les deux variables
prises en considération.
Plusieurs cas sont possibles:
1. Lorsque les deux caractères sont
qualitatifs, on est conduit à une analyse des
tableaux de contingence croisant les deux
variables statistiques;
Exemple: TRI croisés, la matrice des corrélations,
anova, …
02/12/2024 ANALYSE DES DONNEES -
ELABJANI
14
2. Rappels sur l’analyse bidimensionnelle

Exemple des TRI croisés


Tableau croisé NAISENTR * RISQUE

RISQUE
non oui Total
NAISENTR oui Effectif 2 66 68
% dans NAISENTR 2,9% 97,1% 100,0%
% dans RISQUE 66,7% 86,8% 86,1%
% du total 2,5% 83,5% 86,1%
non Effectif 1 10 11
% dans NAISENTR 9,1% 90,9% 100,0%
% dans RISQUE 33,3% 13,2% 13,9%
% du total 1,3% 12,7% 13,9%
Total Effectif 3 76 79
% dans NAISENTR 3,8% 96,2% 100,0%
% dans RISQUE 100,0% 100,0% 100,0%
% du total 3,8% 96,2% 100,0%
02/12/2024 ANALYSE DES DONNEES - 15
ELABJANI
2. Rappels sur l’analyse bidimensionnelle

Matrice de corrélations

Corrélations

NAISENTR RISQUE
Corrélation de Pearson NAISENTR 1,000 -,111
RISQUE -,111 1,000
Signification (unilatérale) NAISENTR , ,164
RISQUE ,164 ,
N NAISENTR 79 79
RISQUE 79 79

02/12/2024 ANALYSE DES DONNEES - 16


ELABJANI
2. Rappels sur l’analyse bidimensionnelle

Analyse de la variance
ANOVAb

Somme
Modèle des carrés ddl Carré moyen F Signification
1 Régression ,117 1 ,117 ,967 ,328a
Résidu 9,351 77 ,121
Total 9,468 78
a. Valeurs prédites : (constantes), RISQUE
b. Variable dépendante : NAISENTR

02/12/2024 ANALYSE DES DONNEES - 17


ELABJANI
2. Rappels sur l’analyse bidimensionnelle

2. Lorsque l’un des deux caractères est


quantitatif, on peut comparer la moyenne de
la variable quantitative aux modalités de
l’autre variable;
Salaire
courant
Sexe Femme $26,032
Homme $41,442

Salaire Date de Salaire


courant Date de naissance
courant naissance
Moyenne Moyenne Minimum
Sexe Femme $26,032 02/11/1956 Sexe Femme $26,032 02/11/56 02/10/29
Homme $41,442 04/28/1957 Homme $41,442 04/28/57 05/03/29

02/12/2024 ANALYSE DES DONNEES - 18


ELABJANI
2. Rappels sur l’analyse bidimensionnelle
3. Lorsque les deux caractères sont quantitatifs,
l’analyse doit porter sur la corrélation entre les
deux variables statistiques.

On parle, généralement, dans ce genre d’analyse


de:

* la dépendance ou l’indépendance des deux


caractères X et Y.
* la liaison fonctionnelle appelée également la
régression linéaire.

02/12/2024 ANALYSE DES DONNEES - 19


ELABJANI
2. Rappels sur l’analyse bidimensionnelle
En cas de régression, on peut mesurer:
- le poids de variation de l’une des variables
sur l’autre (par estimation);
- l’intensité de corrélation en calculant le
coefficient de corrélation tq. : cov(X,Y)
R=
s X .s Y
- La significativité de la corrélation en
calculant le test de Fischer.
- La significativité des paramètres en calculant
les tests de Student.
- etc.

02/12/2024 ANALYSE DES DONNEES - 20


ELABJANI
2. Rappels sur l’analyse bidimensionnelle

Récapitulatif du modèle

Changement dans les statistiques


Erreur Modification
standard de Variation de F
Modèle R R-deux R-deux ajusté l'estimation de R-deux Variation de F ddl 1 ddl 2 signification
1 ,668a ,446 ,443 $5,871.76 ,446 189,427 2 471 ,000
a. Valeurs prédites : (constantes), Expérience passée (nombre de mois), Niveau d'éducation (nombre d'années passées à l'école)

02/12/2024 ANALYSE DES DONNEES - 21


ELABJANI
2. Rappels sur l’analyse bidimensionnelle

Coefficientsa

Coefficie n
ts
Coefficie nts non standardi Statistiques de
standardisés sés colinéarité
Erreur
Modèle B standard Bêta t Signification Tolérance VIF
1 (constante) -9902,786 1417,474 -6,986 ,000
Niveau d'éducation
(nombre d'années 1878,211 96,717 ,688 19,420 ,000 ,936 1,068
passées à l'é cole)
Expérience passée
16,470 2,668 ,219 6,174 ,000 ,936 1,068
(nombre de mois)
a. Variable dépendante : Salaire d'embauche
02/12/2024 ANALYSE DES DONNEES - 22
ELABJANI
2. Rappels sur l’analyse bidimensionnelle

02/12/2024 ANALYSE DES DONNEES - 23


ELABJANI
3. L’analyse multidimensionnelle des données
Plusieurs méthodes d’analyse peuvent être
utilisées dans ce cadre.
Leur principal intérêt étant de travailler
sur différents caractères pris au même
temps.
Ce qui doit traduire la réalité puisque les
populations étudiées dépendent réellement
d’une multitude de variables.

02/12/2024 ANALYSE DES DONNEES - 24


ELABJANI
3. L’analyse multidimensionnelle des données

Leurs points communs tiennent à :


Œ leur objectif visant la réduction des données afin d’en
tirer facilement les relations essentielles existantes entre
les variables (Graphiques, tableaux,…);
 Dégager l’effet de tendance globale des données
utilisées;
w Créer des regroupements entre individus ou entre
variables;
x Le recours informatique qui en facilite énormément
l’application même sur des cas et des nombres irréalisables.

02/12/2024 ANALYSE DES DONNEES - 25


ELABJANI
3. L’analyse multidimensionnelle des données

Les principales méthodes d’analyse à présenter à


cet égard dont certaines font partie des méthodes
dites d’Analyses Factorielles simples, sont :

Œ Les méthodes de régression multiple


(Econométrie).
 L’Analyse en Composantes Principales (ACP).
w L’Analyse Factorielle des Correspondances
(AFC).

02/12/2024 ANALYSE DES DONNEES - 26


ELABJANI
2. Rappels sur l’analyse multidimensionnelle
1. L’Analyse de la régression multiple Corrélations

NAISENTR RISQUE PARTENAI INDEPEND TRAVENTR STRESS AVENTRIS ARGENT AGE GAIN RESPONSA
Corrélation de Pearson NAISENTR 1,000 -,114 ,278 -,338 ,080 -,164 -,127 ,265 ,089 -,054 -,181
RISQUE -,114 1,000 ,056 -,122 ,090 ,051 ,066 ,062 -,031 -,044 ,114
PARTENAI ,278 ,056 1,000 -,008 -,033 ,098 -,081 ,099 -,119 -,122 -,112
INDEPEND -,338 -,122 -,008 1,000 ,004 ,244 ,057 -,126 -,062 -,027 ,147
TRAVENTR ,080 ,090 -,033 ,004 1,000 ,110 -,130 ,057 ,010 ,292 ,354
STRESS -,164 ,051 ,098 ,244 ,110 1,000 ,048 -,230 -,034 -,066 ,066
AVENTRIS -,127 ,066 -,081 ,057 -,130 ,048 1,000 ,013 -,059 -,041 ,127
ARGENT ,265 ,062 ,099 -,126 ,057 -,230 ,013 1,000 ,319 -,097 ,064
AGE ,089 -,031 -,119 -,062 ,010 -,034 -,059 ,319 1,000 -,070 -,005
GAIN -,054 -,044 -,122 -,027 ,292 -,066 -,041 -,097 -,070 1,000 ,220
RESPONSA -,181 ,114 -,112 ,147 ,354 ,066 ,127 ,064 -,005 ,220 1,000
Signification (unilatérale) NAISENTR , ,175 ,010 ,002 ,256 ,089 ,149 ,014 ,234 ,329 ,068
RISQUE ,175 , ,325 ,159 ,232 ,338 ,296 ,307 ,399 ,361 ,175
PARTENAI ,010 ,325 , ,475 ,393 ,212 ,255 ,210 ,165 ,158 ,179
INDEPEND ,002 ,159 ,475 , ,487 ,022 ,321 ,151 ,308 ,414 ,114
TRAVENTR ,256 ,232 ,393 ,487 , ,183 ,144 ,322 ,467 ,007 ,001
STRESS ,089 ,338 ,212 ,022 ,183 , ,349 ,029 ,389 ,294 ,294
AVENTRIS ,149 ,296 ,255 ,321 ,144 ,349 , ,456 ,314 ,370 ,149
ARGENT ,014 ,307 ,210 ,151 ,322 ,029 ,456 , ,004 ,215 ,299
AGE ,234 ,399 ,165 ,308 ,467 ,389 ,314 ,004 , ,284 ,484
GAIN ,329 ,361 ,158 ,414 ,007 ,294 ,370 ,215 ,284 , ,034
RESPONSA ,068 ,175 ,179 ,114 ,001 ,294 ,149 ,299 ,484 ,034 ,
N NAISENTR 69 69 69 69 69 69 69 69 69 69 69
RISQUE 69 69 69 69 69 69 69 69 69 69 69
PARTENAI 69 69 69 69 69 69 69 69 69 69 69
INDEPEND 69 69 69 69 69 69 69 69 69 69 69
TRAVENTR 69 69 69 69 69 69 69 69 69 69 69
STRESS 69 69 69 69 69 69 69 69 69 69 69
AVENTRIS 69 69 69 69 69 69 69 69 69 69 69
ARGENT 69 69 69 69 69 69 69 69 69 69 69
AGE 69 69 69 69 69 69 69 69 69 69 69
02/12/2024 GAIN
ANALYSE DES DONNEES - 27
69 69 69 69 69 69 69 69 69 69 69
RESPONSA 69 69 69ELABJANI 69 69 69 69 69 69 69 69
2. Rappels sur l’analyse multidimensionnelle

Coefficientsa

Coefficie n
ts
Coefficie nts non standardi Intervalle de confiance à Statistiques de
standardisés sés 95% de B Corréla tions colinéarité
Erreur Borne Borne Corréla tion
Modèle B standard Bêta t Signification inférieure supérie ure simple Partielle Partie Tolérance VIF
1 (constante) ,510 ,239 2,139 ,037 ,033 ,988
RISQUE -,291 ,196 -,168 -1,485 ,143 -,682 ,101 -,114 -,191 -,163 ,942 1,062
PARTENAI ,183 ,081 ,259 2,249 ,028 ,020 ,345 ,278 ,283 ,247 ,913 1,095
INDEPEND -,239 ,095 -,292 -2,503 ,015 -,430 -,048 -,338 -,312 -,275 ,888 1,127
TRAVENTR ,147 ,116 ,159 1,270 ,209 -,085 ,380 ,080 ,165 ,140 ,775 1,291
STRESS -6,28E-02 ,100 -,075 -,629 ,532 -,263 ,137 -,164 -,082 -,069 ,845 1,184
AVENTRIS -4,87E-02 ,143 -,039 -,341 ,734 -,334 ,237 -,127 -,045 -,038 ,928 1,077
ARGENT ,129 ,087 ,184 1,486 ,143 -,045 ,304 ,265 ,192 ,163 ,791 1,264
AGE 1,990E-02 ,085 ,028 ,234 ,816 -,150 ,190 ,089 ,031 ,026 ,859 1,164
GAIN -2,85E-02 ,085 -,040 -,337 ,738 -,198 ,141 -,054 -,044 -,037 ,853 1,172
RESPONSA -,139 ,124 -,139 -1,124 ,266 -,387 ,109 -,181 -,146 -,124 ,788 1,270
a. Variable dépendante : NAISENTR

02/12/2024 ANALYSE DES DONNEES - 28


ELABJANI
2. Rappels sur l’analyse multidimensionnelle

Récapitulatif du modèleb

Changement dans les statistiques


Erreur Modification
standard de Variation de F Durbin-W
Modèle R R-deux R-deux ajusté l'e stimation de R-deux Variation de F ddl 1 ddl 2 sig nification atson
1 a
,546 ,298 ,177 ,32 ,298 2,467 10 58 ,016 2,025
a. Valeurs prédites : (constantes), RESPONSA, AGE, STRESS, RISQUE, AVENTRIS, PARTENAI, GAIN, INDEPEND, ARGENT, TRAVENTR
b. Variable dépendante : NAISENTR

02/12/2024 ANALYSE DES DONNEES - 29


ELABJANI
2. Rappels sur l’analyse multidimensionnelle
Quelques exemples pratiques:

Exemple 1 : cas Qual/Quant (Valeau 2006).

Exemple 2 : cas de l’Accompagnement Entrepreneurial


et Poursuite de la CE (Regression Logit).

02/12/2024 ANALYSE DES DONNEES - 30


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
2.1. Caractéristiques
L’ACP est une méthode de description des
tableaux de mesures, appelés aussi tableaux
«individus-caractères quantitatifs».
Elle représente la base de l’analyse des données
et permet de de décrire les relations:
- entre individus;
- entre les variables;
- entre les individus et les variables.
D’où son utilisation des nuages de points individus
et variables.
02/12/2024 ANALYSE DES DONNEES - 31
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Ä entre individus:
L’ACP cherche à analyser les distances et les écarts
séparant les unités statistiques.

Ä entre les variables:


L’ACP s’interesse plus particulèrement aux corrélations
entre les variables.

Ä entre les individus et les variables:


L’analyse doit porter sur la représentativité des individus
par les variables étudiées et dont on choisit logiquement les
principales qui restituent une grande part d’explication dans
la variation
02/12/2024 des unités observées.
ANALYSE DES DONNEES - 32
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Remarques:
1. En ACP, les données sont centrées et réduites, pour
mieux apprécier les distances entre les individus, et divisées
par Ön pour permettre le calcul des corrélations entre les
variables.

2. L’ACP se base, dans son analyse, sur la


visualisation graphique des données (les nuages de
points).

3. La dispersion des points d’un nuage par rapport


à l’origine est appelée inertie totale du nuage.
02/12/2024 ANALYSE DES DONNEES - 33
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

L’ACP passe par des «photographies» (appelées


aussi cartes factorielles) qui représentent des
projections des individus et des variables
effectuées sur les plans retenus.

Chaque plan factoriel est défini par 2 axes


orthogonaux. Le taux d’inertie d’un axe est la part
de l’inertie totale expliquée par cet axe. Il indique
le pourcentage d’informations restituées par le
même axe.

Chaque axe factoriel correspond à un facteur ou


une 02/12/2024
composante principale
ANALYSE DES(variable
DONNEES - importante).
34
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Exemple:
Individus Variable1 Variable2
1 3 500
2 9 700
3 4 1400
4 13 1900
5 8 1700
6 11 1000
48 7200
Moy. 8 1200
E.T. 3,559 509,902

02/12/2024 ANALYSE DES DONNEES - 35


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Exemple:
2000 4
1800
5
1600
3
1400 G
Variable 1

1200
1000
6
800 2
600 1
400
200
0
0 2 4 6 8 10 12 14
Variable 2

02/12/2024 ANALYSE DES DONNEES - 36


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Exemple:l’ACP suppose de prendre pour une
nouvelle origine le point G appelé centre de gravité.
Individus Variable1 Variable2
1 -0,5735 -0,5604
2 +0,1147 -0,4003
3 -0,4588 +0,1601
4 +0,5735 +0,5604
5 0 +0,4003
6 +0,3441 -0,1601

0 0
Moy. 0 0
E.T. 1/Ö6 1/Ö6
S x² 1 1
02/12/2024 ANALYSE DES DONNEES - 37
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
C’est ainsi que les nouvelles coordonnées des
individus en ACP deviennent centrées et réduites.
Pour l’individu 3 par exemple, on a :
V13 = (4-8)/(3,559Ö6) = -0,4588
V23 = (1400-1200)/(509,902Ö6) = +0,1601

Avec le carré de la distance du point-individu 3 à


G est égal à :
(-0,4588)² + (+0,1601)² = 0,2361.
Ce qui définit le carré de la distance du point-
individu 3 au centre de gravité G.
02/12/2024 ANALYSE DES DONNEES - 38
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

D’où, l’inertie totale du nuage est représentée par la


somme des carrés des distances de toutes les données
(points-individus).

Elle mesure la dispersion des points autour du centre de


gravité G.

Dans le cas d’une ACP normée, elle est égale au nombre de


variables, çàd 2 dans notre cas.

02/12/2024 ANALYSE DES DONNEES - 39


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

L’intérêt essentiel de l’ACP est de


déterminer l’axe principal du nuage dont les
distances entre les projections des points
sont maximales.

Ce dernier est ainsi appelé l’axe factoriel


n°1 lequel présente le meilleur taux
d’inertie en premier lieu.

Le second axe factoriel sera forcément


représenté par un taux d’inertie faible.

02/12/2024 ANALYSE DES DONNEES - 40


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 41


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

En conséquence, L’ACP transforme


les variables V1 et V2 initialement
corrélées entre elles en axes factoriels
appelés aussi composantes factorielles
ou facteurs principaux.

Généralement, ces derniers


restituent une part importante de
l’information recherchée.

02/12/2024 ANALYSE DES DONNEES - 42


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
1.2. Application de l’ACP sur ordinateur:
L’application se fait globalement en passant par les étapes suivantes:

1. La saisie des données observées;

2. Le traitement des informations par le logiciel;

3. Celui-ci fournit les axes factoriels dans l’ordre décroissant des taux
d’inertie ainsi les tx d’inertie cumulés;

4. La sélection des principaux facteurs retenus (2 ou 3) pour 80% de


l’inertie totale;

5. La sélection se fait aussi à partir des représentations graphiques


fournies par le logiciel;

6. Interprétation des résultats dans le sens de la corrélation entre les


variables et la représentativité des individus observés.
02/12/2024 ANALYSE DES DONNEES - 43
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 44


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 45


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

v Analyse en quatre cadrans:


Ø Nord-ouest: élèves 7 et 8, assez mauvais en général, légère dominante
EPS/physique/math;
Ø Sud-ouest: élèves 5 et 6, légèrement mauvais, légère dominante lv1/2/philo;
Ø Nord-est: élève 2, assez bon en général avec forte dominante EPS/physique/math;
ØSud-est: élèves 1, 3 et 4, de modérément bon en général (élève 4) à très bon en général
(élève 1), à dominante lv1/2/philo légère (1 et 3) à forte (4).

v Deux individus proches sur ce graphique ont des profils similaires.


02/12/2024 ANALYSE DES DONNEES - 46
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales
Remarques :
1. L’ACP perd de l’information: tout comme la moyenne réduit chaque
individu à 1 nombre, l’ACP le réduit à 2 nombres (sur les deux
axes).
2. Reporter les deux pourcentages présentés sur les axes: plus leur
somme est loin de 100%, plus de l’information est perdue.
3. Corrélation n’est pas causalité !!!
En effet, deux variables peuvent être corrélées, même si l’une n’est pas
conséquence de l’autre, et même si l’une et l’autre ne sont pas liées.
Une corrélation peut être aussi dûe à:
• Un trop faible échantillon (cf. exemples femmes/hommes en
régression);
• Un trop grand nombre de variables testées (spurious correlations).
02/12/2024 ANALYSE DES DONNEES - 47
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Exemple: le cas de 15 Eses observées sur la


base d’un ensemble de paramètres économiques.
X1 X2 X3 X4 X5 X6
1 -14,20 14,50 1,55 -5,10 1,85 105
2 -13,70 14,00 1,50 -5,05 1,80 95
3 -12,60 15,80 1,65 -5,30 1,75 110
4 -12,80 16,00 1,80 -4,90 1,96 115
5 -13,00 15,10 1,90 -5,10 1,98 121
6 -12,40 13,80 1,85 -4,50 1,91 93
7 -13,50 14,30 1,80 -4,60 1,93 101
8 -12,20 15,20 1,85 -4,40 1,87 85
9 -12,10 10,30 1,65 -4,30 1,70 75
10 -12,00 11,10 1,75 -4,10 1,86 84
11 -11,20 10,30 1,80 -4,20 1,82 80
12 -11,50 11,40 1,85 -4,80 1,72 78
13 -11,50 12,30 1,90 -4,90 1,78 79
14 -10,80 11,00 1,80 -4,05 1,80 76
15 -11,60 10,50 1,90 -4,00 1,85 81
02/12/2024 ANALYSE DES DONNEES - 48
ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

les résultats donnés par le logiciel sont


récapitulés ainsi:

Axe Taux Taux d’inertie


factoriel d’inertie (%) cumulé (%)
1 59,3 59,3
2 25,2 84,5
3 10,0 94,5
4 2,6 97,1
…. … …

02/12/2024 ANALYSE DES DONNEES - 49


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 50


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 51


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 52


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

02/12/2024 ANALYSE DES DONNEES - 53


ELABJANI
3. L’analyse multidimensionnelle des données
2. L’Analyse en Composantes Principales

Les procédures de base dans l’analyse

02/12/2024 ANALYSE DES DONNEES - 54


ELABJANI
3. L’analyse multidimensionnelle des données

Exemple 3 : cas Analy. Uni-ACP (Elabjani2016).

02/12/2024 ANALYSE DES DONNEES - 55


ELABJANI
3. L’analyse multidimensionnelle des données

 L’Analyse Factorielle des Correspondances


(AFC).

02/12/2024 ANALYSE DES DONNEES - 56


ELABJANI

Vous aimerez peut-être aussi