Chapitre III: L’Analyse Factorielle de
Correspondance (AFC)
I. Définition et objectif
L’analyse factorielle des correspondances, notée AFC, est une analyse destinée au
traitement des tableaux de contingence. Ce tableau de contingence représente
simultanément deux variables qualitatives X et Y, comportant respectivement n et p
modalités. On a observé les valeurs de ces variables sur une population et on dispose
d'un tableau de contingence à n lignes et p colonnes donnant les effectifs observés pour
chaque combinaison d'une modalité i de X et d'une modalité j de Y. Les valeurs de ce
tableau seront notées nij , l'effectif total sera noté N.
L’AFC est une ACP. Les composantes principales sont toujours obtenues à partir de la
distance entre les différents points des nuages multidimensionnels, mais les points ont
des coordonnées qui ont subis une transformation préalable permettant de conserver une
métrique identique à celle de l’ACP pour calculer ces distances.
Le but principal de l’AFC reste donc le même ; lire l’information contenue dans un
espace multidimensionnel par une réduction de la dimension de cet espace tout en
conservant un maximum de l’information contenu dans l’espace de départ.
1
II. Tableau de contingence
Y 1 2 .... j .… p Total
X
1 k1•
2 k2•
.
.
.
K(n,p) =
i kij ki•
.
.
.
n kn•
Total k•1 k•2 k•j k•p N
p n
kij : effectif de la cellule (i,j), ki • kij k• j kij
ki• : effectif total de la ligne i, j 1 i 1
k• j : effectif total de la colonne j n p n p
N(k••): effectif total N kij ki • k• j
i 1 j 1 i 1 j 1
2
Exemple: au cours d’une enquête sur les vacances on a demandé à un échantillon de
100 individus d’indiquer leur Catégorie Socio professionnelle (caractère X) ainsi
que le mode d’hébergement utilisé lors de leurs dernières vacances (Caractère Y)
Le tableau de données initial est donc:
La codification disjonctive consiste à mettre 1 à la modalité que possède l’individu.
3
Le tableau de contingence croisant les caractères X et Y est alors :
K(7,4) =
Dans ce tableau on a :
K(7,4) =X’ (7,100) Y(100,4)
n=7= nombre de modalités du caractère X : CSP
p=4= nombre de modalités du caractère Y : mode d’hébergement
N=100=nombre total d’individus
Les modalités des caractères sont exclusives : un individu n’a qu’une CSP et un seul mode
d’hébergement (il s’agit du mode des dernières vacances)
Les modalités des caractères sont exhaustives (tous les individus sont renseignés).
Dans la matrice K on voit, par exemple, que 2 agriculteurs ont passé leur dernières vacances
au camping. 4
III. Tableau des fréquences relatives
kij
soit fij les fréquences relatives. F fij i 1,2,..., n
N j 1,2,..., p f1 0 0
p
f i • f ij Dn
0 f 2 0
les fréquences relatives marginales de la modalité i. 0 0
j 1
0 0 f n
n f1 0 0
f • j f ij les fréquences relatives marginales de la modalité j. D p 0 f2 0
i 1 0 0
0 0 f p
Y 1 .... j p Total
X .…
1 f1•
.
.
i fij=kij/k fi•
.
.
n fn•
Total f•1 f•j f•p 1 5
kij
fij
N
6
IV. Tableau des profils ( lignes et colonnes)
1. Tableau des profils lignes
Pour construire le tableau des profils lignes on divise chaque élément de la ligne des fréquences
relatives par le total de la même ligne.
kij
fij kij
f
i
N 1
Les profils lignes noté par: J
fi p
kij
ki Dn F
j 1
N
Y 1 .... j p Total
X .…
1 f1j/f1. 100%
.
.
i fij/fi. 100%
.
.
n fnj/fn. 100%
7
kij
fij
N
fij
f Ji
fi
on peut dire à partir de fiJ que 16,67% des agriculteurs vont au camping
8
2. Tableau des profils colonnes
Pour construire le tableau des profils colonnes on divise chaque élément de la colonne des
fréquences relatives par le total de la même colonne.
kij
fI j
fij
N
kij 1
Les profils colonnes noté par:
f j n
kij k j FD p
i 1
N
Y 1 j p
X .... .…
1
.
.
i fi1/f.1 fij/f.j fip/f.p
.
.
n
Total f•1 f•j f•p
9
kij
fij
N
f ij
fI
j
f j
6,25% des personnes allant au camping sont des agriculteurs 10
V. Construction des nuages des individus(N(I)) et nuages des variables (N(J))
1. Nuage des individus N(I)
L’espace Rp des « variables » (modalités colonnes) dans lequel on peut représenter le
nuage des n points « individus » (modalité ligne). Chaque individu a pour
fij
coordonnée f J
i
et dans cet espace on utilise le tableau des profils lignes.
fi
Dans Rp, on s’intéresse aux proximités relatives des points individus, c'est-à-dire
aux profils lignes, d’où le choix de cette matrice.
Colonne 2
p
fJn fJ2
fJ1
f ij Coordonnée du
fJ3
Colonne 1
fi
point i dans Rp
Colonne p
N I f J1 , f J2 ,..., f Jn p
11
2. Nuage des variables N(J)
L’espace Rn des « individus » (modalités lignes) dans lequel on peut représenter le
nuage des p points « variables » (modalité colonnes). Chaque variable a pour
f ij
coordonnée f I
j
et dans cet espace on utilise le tableau des profils colonne.
f j
Dans Rn, on s’intéresse aux proximités relatives des points variables, c'est-à-dire
aux profils colonnes, d’où le choix de cette matrice.
Ligne 2 p
fIp fI2
fI1
Coordonnée du
f ij
fI3
ligne1 point j dans Rn
f j
Ligne n
n
N J f I1 , f I2 ,..., f I p n
12
VI. Centre de gravité
1. Centre de gravité du nuage N(I)
Le centre de gravité ou le profil ligne moyen est la somme pondérée des profils lignes:
n
GI fi f Ji
i 1 f1 0,32
0,11
n fij f2 GI
fi GI p
0,27
i 1 fi
0,3
=f j
f p
2. Centre de gravité du nuage N(J)
Le centre de gravité ou le profil colonne moyen est la somme pondérée des profils
colonnes: 0,12
p
GJ f j f I j f1 0,12
j 1 0,1
f 2
p fij GJ n GJ 0,15
f j
f j
0,14
j 1
0,19
=fi f n 0,18
13
VII. Distance entre deux profils
1.Distance entre deux profils lignes dans Rp
Pour mesurer la "distance" entre deux individus, on utilise la métrique de 2
au lieu
de la distance habituelle (dite métrique euclidienne). La distance du entre la ligne i
2
et la ligne i' est ainsi définie par : 2
1 p fij fi ' j
d i, i '
2
j 1 f j
fi f i '
Remarque: La métrique de 2
possède la propriété d'équivalence distributionnelle : si on
regroupe deux modalités lignes, les distances entre les profils-colonnes, ou entre les autres
profils-lignes restent inchangées.
Exemple:
fij
f Ji
fi
1 1 1
d 2 agr , cad 0,16 0,33 0 0,16 ... 0,16 0,41
2 2 2
0,32 0,11 0,3
14
2. Distance entre deux profils colonnes dans Rn
La distance du 2 entre la colonne j et la colonne j' est ainsi définie par
:
2
1 n fij fij '
d 2
j, j '
f
i 1 f i f j '
j
f ij
fI
j
f j
1 1 1
d 2 camp, hotel 0,0625 0 0,125 0,1818 ... 0,1563 0,1818
2 2 2
0,12 0,12 0,18
15
VIII. Calcul de l’inertie totale des deux nuages
1. Inertie totale des Nuages des individus N(I)
n
I N I , GI f i d 2 f Ji , GI
i 1
2
n 1 fij
p
= fi f j
j 1 f j f
i 1
i
fij
On pose X ij f j
fi
12 '
1
I N I , GI =Trace D p X Dn X D p 2
=Trace V
16
2. Inertie totale des Nuage des variables N(J)
p
I N J , GJ f j d 2 f I j , GJ
j 1
2
p 1 fij
n
= f j fi
i 1 f i f
j 1
j
fij
On pose Wij fi
f j
12
1
I N J , GJ =Trace Dn W D pW ' Dn 2
=Trace Z
17
IX. Détermination des composantes principales dans R n
1. Inertie par rapport à une droite
uk
u k est le vecteur directeur de la droite
1
u
k
Fk X D p
2
uk Composante principale du nuage N(I)
2
n
I
uk
i 1
fi Fi k
F k Dn F k
1
1
X D p uk 'Dn X D p uk
2 2
1 1
uk ' D p X ' Dn XD p uk
2 2
uk Vuk
k
18
2. Détermination du premier axe factoriel:
Les valeurs propres sont toujours inférieures à 1.
La valeur propre λ1 est la plus grande valeur propre de la matriceV.
Cette valeur propre est l’inertie expliquée par le premier axe u .
1
Le choix du 1er axe factoriel renvoie à un travail de diagonalisation de
la matrice V du nuage N(I).
Une fois la matrice V est diagonalisée, on prend la plus grande valeur
propre λ1 et on cherche u1 qui vérifie:Vu1 1 u1
Le vecteur u1 de V associé à la plus grande valeur propre λ1 engendre
une 1ère droite appelée 1er axe principal.
1
F X D p u1 est appelé 1ère composante principale . Ce vecteur
1 2
donne la projection de tous les individus sur le 1er axe principal u1.
19
3. Détermination du deuxième axe factoriel:
Le second axe factoriel est déterminé en cherchant un
vecteur u2 qui soit orthogonal à u1 et qui maximise l’inertie
des projections des points du nuage. Et ainsi de suite.
1
F 2 X D p u2 2
4. Choix du nombre de composantes principales
Le pourcentage d’inertie expliquée par la j éme composante principale est:
j
Wj 1
Tr V
20
X. Détermination des composantes principales dans Rp
1. Inertie par rapport à une droite
vk
vk est le vecteur directeur de la droite
1
v
k
G k W ' D n
2
vk Composante principale du nuage N(J)
2
G
p
I
vk
j 1
f j i
k
G k DpG k
1
1
W ' Dn vk 'D p
2
W ' Dn vk
2
1 1
vk ' Dn W D pW ' Dn
2 2
vk
Z
v 'k Zvk
k
21
2. Détermination du premier axe factoriel sur N(J):
Les valeurs propres sont toujours inférieures à 1.
La valeur propre λ1 est la plus grande valeur propre de la matrice Z.
Cette valeur propre est l’inertie expliquée par le premier axe v .
1
Le choix du 1er axe factoriel renvoie à un travail de diagonalisation de
la matrice Z du nuageN(J).
Une fois la matrice Z est diagonalisée, on prend la plus grande valeur
propre λ1 et on cherche v1 qui vérifie: Zv1 1 v1
Le vecteur v1 de Z associé à la plus grande valeur propre λ1 engendre
une 1ère droite appelée 1er axe principal.
1
G1 W Dn v1 est appelé 1ère composante principale . Ce vecteur
2
donne la projection de tous les variables sur le 1er axe principal v1.
22
3. Détermination du deuxième axe factoriel:
Le second axe factoriel est déterminé en cherchant un
vecteur v2 qui soit orthogonal à v1 et qui maximise l’inertie
des projections des points du nuage. Et ainsi de suite.
1
G W Dn v2
2 2
4. Choix du nombre de composantes principales
Le pourcentage d’inertie expliquée par la i éme composante principale est:
i
Wi 1
Tr Z
23
XI. Aides à l’interprétation
Qualité de
Contribution Absolue
représentation
Individus Qi
fi Fi k 2
CTR i
F i
k 2
k d 2 i, G
Variables Qj
f j
k 2
Gj
CTR j
G k 2
j
k d 2
j, G
24
XI. Formules de transition
Le But est de chercher une relation entre les vecteurs uk et vk pour éviter de
faire deux diagonalisations de matrice. Par exemple, si n>p, on diagonalise
seulement la matrice V. 1 p f 1
1
1
vk i uk j vk
ij
Dn2 XD p 2u
k
Les axes factorielles d’un nuage en
k j 1 fi f j k
fonction des autres axes 1 n fij 1
1 1
factorielles de l’autre nuage. uk j vk i uk Dp2W ' Dn 2 vk
k i 1 f j fi k
1 p fij 1
Fi
k
G kj F k LG k
Les composantes principales k j 1 f i k
D’un nuage en fonction
des autres composantes 1 n fij 1
Principales de l’autre nuage. G kj Fi G
k k
C 'Fk
k i 1 f j k
1
1
Les composantes principales Fi k k vk i F k k Dn vk 2
D’un nuage en fonction fi
1
des axes factorielles 1
de l’autre nuage. G kj k uk j G k k D p uk 2 25
f j