Analyse Factorielle
Analyse Factorielle
Janvier 2025
PLAN
➢GENERALITES
➢RAPPELS : ANALYSE BIVARIEE
➢ANALYSE EN COMPOSANTE PRINCIPALE (ACP)
➢ANALYSE FACTORIELLE DES CORRESPONDANCES (AFC)
➢ANALYSE DES CORRESPONDANCES MULTIPLES (ACM)
➢ANALYSE FACTORIELLE SUR DONNEES MIXTE (AFDM)
➢CLASSIFICATION HIERARCHIQUE ASCENDANTE (CAH)
GENERALITES
QU’EST-CE QUE L’ANALYSE DE DONNEES
VARIABLE QUALITATIVE NOMINALE : LES MODALITÉS NE PRÉSENTENT AUCUN ORDRE, AUCUNE HIÉRARCHIE ENTRE ELLES..
– EXEMPLE : SITUATION MATRIMONIALE, COULEURS DES YEUX
VARIABLE QUALITATIVE ORDINALE : LES MODALITÉS RESPECTENT UN CERTAIN ORDRE
– EXEMPLE: NIVEAU DE SATISFACTION: INSATISFAIT < MOYENNEMENT SATISFAIT < SATISFAIT < TRÈS SATISFAIT
NATURE D’UNE VARIABLE
TYPE D’ANALYSE DE DONNEES
Analyse de
données
Décrire le Décrire le
phénomène phénomène Estimer un
avec une ou avec modèle pour
deux plusieurs expliquer ou
variables variables prédire le
simultanémen simultanémen phenomen
t t
RAPPELS : ANALYSE BIVARIEE
Tableau de contingence
Tableau présentant la combinaison des catégories de deux ou de
plus de deux variables .
✓Dimension d’un tableau de contingence
La dimension d’un tableau de contingence est donnée par le
nombre de variables qui la composent, indépendamment du
nombre de catégories de ces variables.
Autres 26 3,7
Fréquences conditionnelles
C’est la distribution obtenue pour une variable lorsque se réalise une
condition définie par la catégorie d’une autre variable, ou par la
combinaison des catégories d’autres variables. Les fréquences
marginales absolues ou relatives sont des fréquences non
conditionnelles.
DEUX VARIABLES
QUALITATIVES ET UNE ANOVA DEUX FACTEURS
VARIABLES QUANTITATIVES
ANALYSE EN COMPOSANTE
PRINCIPALE
DONNÉES ET OBJECTIFS
L’Analyse en Composantes Principales (ACP) s’applique à des tableaux croisant des
individus et des variables quantitatives, appelés de façon concise tableaux
Individus×Variables quantitatives.
Selon un usage bien établi, les lignes du tableau représentent les individus et les
colonnes représentent les variables. A l’intersection de la ligne i et de la colonne k se
trouve la valeur de la variable k pour l’individu i. La figure 1.1 illustre ces notions et
complète les notations.
DONNÉES ET OBJECTIFS
À propos de deux variables, on essaie d’évaluer leur liaison. En ACP, la liaison entre deux
variables est mesurée par le coefficient de corrélation linéaire (dans de rares situations, on
utilise la covariance), noté usuellement r. Soit :
DONNÉES ET OBJECTIFS
L’ objectif général de l’ACP est une étude exploratoire. Les deux voies principales de
cette exploration sont :
Un bilan des ressemblances entre individus. On cherche alors à répondre à des
questions du type suivant : quels sont les individus qui se ressemblent ? Quels sont
ceux qui diffèrent ? Plus généralement, on souhaite décrire la variabilité des
individus. Pour cela, on cherche à mettre en évidence des groupes homogènes
d’individus dans le cadre d’une typologie des individus. Selon un autre point de vue,
on cherche les principales dimensions de variabilité des individus.
Un bilan des liaisons entre variables. Les questions sont alors : quelles variables sont
corrélées positivement entre elles ? Quelles sont celles qui s’opposent (corrélées
négativement) ? Existe-t-il des groupes de variables corrélées entre elles ? Peut-on
mettre en évidence une typologie des variables ?
DONNÉES ET OBJECTIFS
➢ Bilan des ressemblances entre individus: quels sont les individus qui se
ressemblent? Quels sont ceux qui diffèrent? Existent-ils des groupes homogènes
d’individus? Peut-on mettre en évidence une typologie des individus?
- Contribution d’un élément à l’inertie d’un axe : Un axe factoriel rend maximum (sous
contrainte d’orthogonalité avec les axes précédents) l’inertie projetée d’un nuage. Cette
inertie projetée du nuage peut être décomposée point par point.
APPLICATION SOUS SPSS
Etape 1: Choix de la méthode
APPLICATION SOUS SPSS
Etape 1: Choix de la méthode
APPLICATION SOUS SPSS
Etape 2: Choix des variables
APPLICATION SOUS SPSS
Etape 3: Choix des statistiques
APPLICATION SOUS SPSS
Etape 4: Extraction des facteurs
APPLICATION SOUS SPSS
Etape 5: Choix de type de rotation (la rotation varimax)
APPLICATION SOUS SPSS
Etape 6: Création de variables
Synthèse des étapes de construction d’un indicateur synthétique
On est souvent conduit à vouloir relier les résultats d’une ACP à des variables
qualitatives définis sur les individus.
Exemple : On étudie les notes obtenues à différentes épreuves par un ensemble
d’élèves. L’ACP de ce tableau met en évidence les principales dimensions de
variabilité des élèves, par exemple une opposition entre les élèves plutôt meilleurs
dans les matières scientifiques et ceux plutôt meilleurs dans les matières littéraires.
On dispose par ailleurs d’informations sur ces élèves sous forme de variables
qualitatives, par exemple leur genre (fille/garçon), la catégorie socio-professionnelle
des parents, etc. Il est utile de relier ces variables qualitatives aux axes factoriels,
avec en perspective des questions du type : observe-t-on, sur ces données, l’idée
souvent émise selon laquelle les filles obtiennent des résultats plutôt meilleurs dans les
matières littéraires et les garçons des résultats plutôt meilleurs dans les matières
scientifiques ?
VARIABLES QUALITATIVES ILLUSTRATIVES EN ACP
Rappelons que la première valeur propre est toujours comprise entre 1 et le nombre de variables
K . Elle vaut 1 lorsque les variables sont toutes non corrélées deux à deux.
Elle est égale à K lorsqu’il existe une liaison linéaire parfaite entre toutes les variables.
Dans le cas limite d’une première valeur propre proche de 1, on est conduit à deux attitudes
différentes selon l’objectif de l’analyse :
– considérer l’ensemble des dimensions si l’on cherche un résumé des données ;
– ne considérer aucune dimension si l’on s’intéresse aux liaisons entre variables.
Plus la valeur propre est grande, plus elle résume de variables et plus le facteur risque d’être
intéressant en terme de synthèse.
Le diagramme des valeurs propres, appelé souvent abusivement histogramme, est utilisé surtout
pour étudier l’allure de la décroissance de ces valeurs.
POURCENTAGES D’INERTIE EXTRAITS PAR LES
FACTEURS
Le pourcentage d’inertie extrait par un facteur est le rapport entre
l’inertie associée au facteur (i.e. la valeur propre) et l’inertie totale
du nuage étudié ; il mesure l’importance relative du facteur dans
le tableau. Il est souvent utilisé sous la forme cumulée qui indique
le pourcentage d’inertie extrait par les S premiers facteurs.
Il ne faut pas oublier de juger ces pourcentages en fonction de la
taille du tableau : 10 % est une valeur faible si le tableau
comporte 10 variables (elle est égale à la moyenne et correspond
à la valeur propre 1) ; c’est une valeur forte dans le cas de 100
variables.
QUEL NOMBRE DE FACTEURS RETENIR ?
Les facteurs sont appréhendés dans l’ordre décroissant de leurs valeurs propres.
Ils peuvent être étudiés séparément ou deux par deux à l’aide des plans
factoriels. Il faut constamment garder à l’esprit que le facteur d’ordre s (s > 1)
traduit les tendances « résiduelles » non prises en compte par les facteurs
précédents.
L’ordre proposé pour dépouiller les résultats correspond à une phase de
découverte.
L’approfondissement d’une interprétation donne toujours lieu à des va-et-vient
entre les différents résultats, trop liés aux données et à l’analyste pour être
formalisés. En particulier, du fait de la dualité, on est souvent conduit à consulter
alternativement les résultats concernant les individus et les variables.
CONTRIBUTIONS DES INDIVIDUS
L’intérêt d’un facteur dépend en grande partie du nombre d’individus qu’il concerne.
On réalise une première approche de ce nombre en consultant la liste des
contributions des individus aux facteurs pour repérer si un seul individu ou un très
petit nombre d’individus ont une contribution très supérieure à la moyenne. On peut
calculer aussi le nombre minimum d’individus totalisant, à eux tous, un pourcentage
d’inertie projetée fixé à l’avance (par exemple 50 %). Cet indicateur évalue le
degré de généralité d’un facteur au sens du nombre d’individus participant à ce
facteur.
Le premier stade de l’interprétation d’un facteur qui apparemment ne concerne que
très peu d’individus est en général simple : on identifie rapidement ces individus et
leur particularisme. La signification de ce particularisme est plus ou moins immédiate ;
elle peut remettre en cause le champ de l’analyse, à savoir l’ensemble des individus
étudiés.
ANALYSE FACTORIELLE DES
CORRESPONDANCES
DONNÉES, NOTATIONS, HYPOTHÈSE
D’INDÉPENDANCE
❑À l’origine, l’Analyse Factorielle des Correspondances (AFC) a été conçue pour
étudier des tableaux appelés couramment tableaux de contingence (ou tableaux
croisés).
❑Il s’agit de tableaux d’effectifs obtenus en croisant les modalités de deux variables
qualitatives définies sur une même population de n individus.
❑ Un tableau de contingence exprime la liaison entre deux variables qualitatives.
❑Classiquement, pour une mesure de probabilité, on dit qu’il y a indépendance entre
les deux variables lorsque, pour tout i et pour tout j, on a l’égalité :
DONNÉES, NOTATIONS, HYPOTHÈSE
D’INDÉPENDANCE
❑Il y a liaison entre les deux variables dès que certaines cases du tableau fi j
diffèrent du produit fi. f. j. Si fij est supérieur à ce produit, les modalités i et j
s’associent plus qu’elles ne le font dans l’hypothèse d’indépendance : on dit que i et j
s’attirent.
❑Au contraire, si fij est inférieur au produit des marges, i et j s’associent moins que
dans l’hypothèse d’indépendance : on dit qu’il y a répulsion entre ces deux
modalités.
❑L’indépendance s’exprime aussi en considérant le tableau comme un ensemble de
lignes. En effet, l’égalité ci-dessus est équivalente à l’égalité
OBJECTIFS
❑Bien que le tableau étudié soit de nature très différente de celui étudié en ACP, les objectifs
de l’AFC peuvent s’exprimer de manière analogue à ceux de l’ACP : on cherche à obtenir une
typologie des lignes, une typologie des colonnes et à relier ces deux typologies entre elles ;
mais la notion de ressemblance entre deux lignes, ou entre deux colonnes, est différente de
celle de l’ACP.
❑Dans un tableau de contingence, la ressemblance, entre deux lignes d’une part et entre deux
colonnes d’autre part, s’exprime de manière totalement symétrique. Deux lignes sont
considérées comme proches si elles s’associent de la même façon à l’ensemble des colonnes,
c’est-à-dire si elles s’associent trop (ou trop peu) aux mêmes colonnes ; les termes « trop » et «
trop peu » sont pris en référence à la situation d’indépendance. Symétriquement, deux colonnes
sont proches si elles s’associent de la même façon à l’ensemble des lignes
OBJECTIFS
Les indices d’aide à l’interprétation (qualité de représentation d’un élément par un axe ou un
plan et contribution d’un élément à l’inertie d’un axe) définis en ACP sont valables pour un nuage
quelconque. Ils s’appliquent donc en AFC.
Notons que, si en ACP les poids de tous les éléments sont en général égaux, ce n’est pas le cas en
AFC ; or ces poids interviennent dans la contribution d’un point à l’inertie d’un axe.
En AFC, comme en ACP, on utilise presque systématiquement la technique des éléments
supplémentaires, qui consiste à projeter sur les axes factoriels des profils de lignes ou de colonnes
qui n’interviennent pas dans le calcul de ces axes. Une ligne supplémentaire est reliée aux
colonnes actives par la formule barycentrique.
De même, une colonne supplémentaire est reliée aux lignes actives par la formule barycentrique.
Ces éléments servent très souvent, eux aussi, d’aides à l’interprétation ; dans les tableaux de
grande dimension, par exemple, il est très pratique de connaître la position et la qualité de
représentation du barycentre de plusieurs lignes ou de plusieurs colonnes.
CONCLUSION
Dans ce chapitre, l’AFC est introduite comme une méthode particulièrement bien adaptée à l’étude
d’un tableau de contingence. D’un point de vue historique, elle a d’ailleurs été imaginée pour traiter
ce type de tableau. Toutefois, les remarquables propriétés de cette méthode ont très tôt incité à
l’appliquer à d’autres tableaux : aujourd’hui, la pratique courante de l’AFC dépasse largement le
cadre des tableaux de contingence.
Dès l’instant que l’on étudie un tableau qui n’est pas un tableau de contingence, l’objectif de l’AFC
ne peut plus être formulé en terme de liaison entre deux variables qualitatives. En revanche, il existe
des tableaux dont l’étude nécessite une typologie des lignes d’une part et des colonnes d’autre part,
à travers leur profil.
Pour établir l’intérêt de l’AFC dans la réalisation de telles typologies, il convient de s’assurer que les
différentes notions mises en jeu par cette méthode (transformation en profils, distance du x2 , poids
des éléments) sont en accord avec le point de vue que l’on veut avoir sur les données étudiées. Les
formules barycentriques, qui relient les projections des lignes et des colonnes et qui permettent à
elles seules de caractériser les facteurs, peuvent aussi justifier l’application de l’AFC.
ANALYSE DES CORRESPONDANCES
MULTIPLES
Introduction
❑De façon analogue à l’ACP, l’un des objectifs de l’ACM est de réaliser une typologie des individus.
Cette typologie doit s’appuyer sur une notion de ressemblance telle que deux individus sont
d’autant plus proches qu’ils possèdent un grand nombre de modalités en commun.
❑En outre, dans la plupart des applications de l’ACM, les individus sont très nombreux et ne sont
connus que par leurs caractéristiques présentes dans le tableau de données. Par exemple, dans une
enquête d’opinion, on ne dispose pour chaque individu d’aucune autre connaissance que ses
réponses au questionnaire. En ce cas, les individus sont étudiés au travers des classes définies par les
variables. Ainsi, dans les enquêtes d’opinion, on s’intéresse, par exemple, aux femmes, aux jeunes,
aux retraités, etc. Une analyse des individus au travers de ces classes doit être telle que deux
classes se ressemblent d’autant plus que leurs profils de répartition sur l’ensemble des modalités sont
proches
ÉTUDE DES VARIABLES
Procédant encore de façon analogue à l’ACP, on peut adopter deux points de vue dans l’étude des
variables.
Le premier est celui du bilan des liaisons entre les variables. L’étude de la liaison entre deux variables
qualitatives nécessite de considérer le tableau de contingence croisant leurs modalités. Un bilan un tant
soit peu détaillé de ces liaisons implique donc de se situer au niveau des modalités plus qu’à celui des
variables.
Le second consiste à résumer l’ensemble des variables (qualitatives) par un petit nombre de variables
numériques. Par exemple, on peut chercher à résumer un ensemble de variables socio-professionnelles
par un indicateur de « statut social ». L’intérêt de ces variables synthétiques provient de ce qu’elles
sont liées à l’ensemble des variables étudiées. Ainsi, une variable ne pourra être considérée comme un
indicateur de « statut social » que si elle est liée à la fois à la catégorie socio-professionnelle, au type
de diplôme, etc
ETUDES DES MODALITÉS
Etudier l’ensemble des modalités revient à dresser un bilan de leurs ressemblances. Or une modalité peut être
considérée selon deux points de vue :
1. en tant que variable indicatrice définie sur l’ensemble des individus, soit une colonne du TDC
2. en tant que classe d’individus dont on connaît la répartition sur l’ensemble des modalités, soit une ligne ou
une colonne du tableau de Burt
La notion de ressemblance entre modalités diffère selon le point de vue adopté. Dans le premier cas, la
ressemblance entre deux modalités doit reposer sur leur association mutuelle : deux modalités se ressemblent
d’autant plus qu’elles sont présentes ou absentes simultanément chez un grand nombre d’individus. Les autres
modalités n’interviennent pas.
Dans le second cas, la ressemblance entre deux modalités est analogue à celle que l’on utilise dans les
tableaux de fréquence. Une ligne du tableau de Burt caractérise l’association de la modalité avec les
modalités de toutes les variables : deux modalités se ressemblent d’autant plus qu’elles s’associent beaucoup ou
peu aux mêmes modalités.
Structures des données
Pour réaliser une ACM, les données peuvent être disposées de plusieurs manières par
lesquelles on a:
1. Le codage condensé
Ces données peuvent être rassemblées dans un tableau de type Individus X Variables
comme dans le cas de l’ACP. Les lignes représentent les individus, les colonnes
représentent les variables: à l’intersection de la ligne i (individu i) et de la
colonne j (variable xj ) se trouve la valeur xij ) de l’individu i pour la variable de
rang j. Les valeurs xij sont des codifications qui ne possèdent pas de propriété
numérique et il n’est donc pas possible d’appliquer une ACP à ces données.
Structures des données
2. Le tableau disjonctif complet (TDC)
Dans ce tableau, les lignes représentent les individus et les colonnes les modalités des variables: à
l’intersection de la ligne i et de la colonne k, on trouve xik qui vaut 1 ou 0 selon que l’individu i possède la
modalité k ou non. Les colonnes de ce tableau sont des variables numériques appelées indicatrices ou
variables dichotomiques.
3. Le tableau Burt
Le tableau de Burt comporte une ligne et une colonne pour chaque modalité des variables étudiées. Chaque
cellule du tableau indique le nombre d'individus statistiques qui possèdent en même temps la modalité ligne
et la modalité colonne correspondantes. Il ne contient que des 0 sauf sur la diagonale qui contient les
effectifs totaux des modalités.
Exemple
Il s'agit d'une partie des données issues de l'enquête "Les étudiants et la ville" effectuée en 2001 par des
étudiants de
Structures des données
Question N° Réponses possibles Poids (%) Abréviation
Habitez-vous (variable 1 seul 48,30% Seul
"mode d'occupation") 2 colocataires 13,84% Coloc
3 en couple 13,05% Couple
4 avec les parents 23,50% Parents
5 non réponse 1,31% NR1
Quel type d'habitation 6 cité universitaire 10,70% Cité
occupez-vous ? (variable 7 studio 28,20% Studio
"type d'habitation") 8 appartement 30,29% Appart
9 chambre chez un particulier 5,22% Chambre
10 autre 19,84% Autre
11 non réponse 5,74% NR2
Si vous vivez en dehors du 12 moins de 1 an 20,89% < 1 an
foyer familial, depuis 13 1 à 3 ans 24,80% 1-3 ans
combien de temps ? 14 plus de 3 ans 28,72% > 3 ans
(variable "ancienneté") 15 non applicable 24,80% NA
16 non réponse 0,78% NR3
A quelle distance 17 moins de 1 km 26,89% < 1 km
approximative de la Fac 18 1 à 5 km 49,87% 1 à 5 km
vivez-vous ? (variable 19 plus de 5 km 20,89% > 5 km
"éloignement") 20 non réponse 2,35% NR4
Quelle est la superficie de 21 moins de 10 m2 9,14% < 10 m2
votre logement ? (variable 22 10 à 20 m2 17,75% 10 à 20 m2
"superficie") 23 20 à 30 m2 24,80% 20 à 30 m2
24 plus de 30 m2 39,16% > 30 m2
25 non réponse 9,14% NR5
Codage condensé
1 1 6 12 17 21
2 2 8 13 18 23
... ...
Seul Coloc Couple Parents Cité Studio Appart Chambr Autre NR2 <= 1 an 1-3 ans > 3 ans NA et - de 1à5 + 5 km - de 10 10 à 20 20 à 30 + de 30 NR5
et NR1 e NR3 1km km et NR4 m2 m2 m2 m2
i1 1 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0
i2 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0
i3 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0
i4 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1
i5 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0
Seu Col Co Par Cit Stu Ap Cha Aut NR <= 1-3 >3 NA - de 1à +5 - de 10 20 + NR
l oc upl ents é dio part mbr re 2 1 ans ans & 1k 5 km 10 à à de 5
e & e an NR m km & 2 20 30 30
m 2 2 2
NR NR m m m
Seul 185 0 0 0 34 90 40 13 3 5 61 60 59 5 70 101 14 32 61 71 21 0
Colo 0 53 0 0 5 6 32 2 3 5 13 18 21 1 13 33 7 1 4 8 40 0
Coup 0 0 50 0 2 10 34 0 3 1 5 14 28 3 15 23 12 2 2 14 32 0
Par / NR 0 0 0 95 0 2 10 5 67 11 1 3 2 89 5 34 56 0 1 2 57 35
Cité 34 5 2 0 41 0 0 0 0 0 17 13 9 2 15 23 3 27 9 1 4 0
Stud 90 6 10 2 0 108 0 0 0 0 29 33 45 1 41 61 6 1 33 57 17 0
App 40 32 34 10 0 0 116 0 0 0 23 35 47 11 37 62 17 1 10 29 74 2
Cha 13 2 0 5 0 0 0 20 0 0 6 6 3 5 6 10 4 4 7 5 4 0
Autr 3 3 3 67 0 0 0 0 76 0 2 4 4 66 2 29 45 0 1 1 50 24
NR2 5 5 1 11 0 0 0 0 0 22 3 4 2 13 2 6 14 2 8 2 1 9
- de1 61 13 5 1 17 29 23 6 2 3 80 0 0 0 30 44 6 14 26 24 16 0
1-3 60 18 14 3 13 33 35 6 4 4 0 95 0 0 25 60 10 11 22 28 32 2
+de3 59 21 28 2 9 45 47 3 4 2 0 0 110 0 43 53 14 10 14 41 45 0
NA / NR 5 1 3 89 2 1 11 5 66 13 0 0 0 98 5 34 59 0 6 2 57 33
- 1k 70 13 15 5 15 41 37 6 2 2 30 25 43 5 103 0 0 12 26 38 26 1
1à5 101 33 23 34 23 61 62 10 29 6 44 60 53 34 0 191 0 20 35 47 82 7
+ 5k/NR 14 7 12 56 3 6 17 4 45 14 6 10 14 59 0 0 89 3 7 10 42 27
- 10 32 1 2 0 27 1 1 4 0 2 14 11 10 0 12 20 3 35 0 0 0 0
10-20 61 4 2 1 9 33 10 7 1 8 26 22 14 6 26 35 7 0 68 0 0 0
20-30 71 8 14 2 1 57 29 5 1 2 24 28 41 2 38 47 10 0 0 95 0 0
30+ 21 40 32 57 4 17 74 4 50 1 16 32 45 57 26 82 42 0 0 0 150 0
NR5 0 0 0 35 0 0 2 0 24 9 0 2 0 33 1 7 27 0 0 0 0 35
Méthodologie de l’ACM
L'ACM peut être considérée comme une variante de l'AFC. Comme l'indiquent Rouanet et Le Roux :
Effectuer l'analyse des correspondances multiples, c'est effectuer l'analyse factorielle des
correspondances du tableau disjonctif complet.
Comme en AFC, on peut calculer des fréquences, des fréquences lignes, des fréquences colonnes et des
profils lignes et profils colonnes moyens.
L'élément le plus facile à interpréter est le profil colonne moyen : ce sont les fréquences des différents
patrons de réponses dans la population étudiée.
Le profil ligne moyen est obtenu en calculant, pour chaque modalité, le quotient de sa fréquence par le
nombre Q de questions. En notant respectivement nk et fk l'effectif et la fréquence de la modalité k, on a
:
nk Nombre d' individus ayant choisi la modalité k
fk = =
N Nombre total d' individus
1 1 f n + n − 2nkk'
d2Φ2 (Mk , Mk' ) = + − 2 kk' = k k'
fk fk' fk fk' nknk' /n
Par exemple, sachant que l'effectif de la modalité "Seul" est 185, celui de la modalité "Cité" est 41,
celui de la combinaison "Seul et en cité" est 34 et l'effectif total est de 383, on obtient : (185+41-
2*34)/(185*41/383)=7,978
INERTIE DU NUAGE DE POINTS. CONTRIBUTIONS
Pour le tableau disjonctif complet, ou le tableau disjonctif des patrons, considérés comme des tableaux
de contingence, le coefficient Phi-2 vaut :
K − Q Nombre de modalités − Nombre de questions
Φ2 = =
Q Nombre de questions
1− 0,483
Cta(Seul) = = 0,1034
Par exemple, pour la modalité "Seul": 5
Sa contribution relative est obtenue en divisant par l'inertie totale du nuage (3,4 dans notre exemple)
L'inertie totale peut être exprimée comme la somme des inerties de chacune des variables. Mais l'inertie
de la variable Xq est donnée par 0,1034
Ctr(Seul) = = 0,0304
3,4
INERTIE DU NUAGE DE POINTS. CONTRIBUTIONS
L'interprétation des résultats d'une ACM est souvent assez délicate, en raison de la faible décroissance des
valeurs propres, et du grand nombre de modalités, ce qui rend les graphiques assez peu lisibles.
Selon Benzécri, interpréter un axe consiste à trouver ce qui est similaire d'une part entre tous les éléments
figurant à la droite de l'origine et d'autre part, entre tout ce qui se trouve à la gauche de l'origine, puis
d'exprimer avec concision et précision le contraste entre les deux extrêmes.
L'interprétation des proximités entre les modalités devra aussi tenir compte de la remarque suivante :
- Si deux modalités d'une même variable sont proches, cela signifie que les individus qui possèdent l'une
des modalités et ceux qui possèdent l'autre sont globalement similaires du point de vue des autres variables
;
- Si deux modalités de deux variables différentes sont proches, cela peut signifier que ce sont globalement
les mêmes individus qui possèdent l'une et l'autre.
Application de l’ACM avec SPSS
Cette section présente les différentes étapes à suivre pour réaliser
une analyse des correspondances multiples avec SPSS.
Etape 1: lorsque votre base de donnée est active, déroulez au
niveau de la barre des menus, l’onglet Analyse ou analyze selon la
version du logiciel dont vous disposez. A cette étape, vous avez
plusieurs descriptions et vous devez dérouler réduction des données
ou factorisation. A ce niveau, vous devez choisir optimal scaling ou
codage optimal. Cette étape est illustrée par la figure ci-après.
Application de l’ACM avec SPSS
un clic
Dès que le niveau de mesure des variables est précisé, la méthode d’analyse qui convient
s’affiche. On peut alors cliquer sur « définir » pour passer à l’étape suivante:
Etape 3: A cette étape, il est question de choisir les variables qui doivent entrer dans l’analyse.
Procédez alors au choix des variables comme indiqué dans la fenêtre suivante.