0% ont trouvé ce document utile (0 vote)
114 vues7 pages

3.cours Afcm1

L'analyse factorielle des correspondances multiples (AFCM) est une méthode d'analyse de données utilisée pour étudier les relations entre plusieurs variables qualitatives à partir d'un tableau disjonctif complet. Ce document décrit la construction de ce tableau, les notations associées, et les différentes analyses qui peuvent être effectuées à partir de celui-ci, en mettant en évidence les équivalences entre les analyses de différents tableaux. Il aborde également les concepts de part d'inertie et de distance entre individus et modalités dans le cadre de l'AFCM.

Transféré par

lcflak630
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
114 vues7 pages

3.cours Afcm1

L'analyse factorielle des correspondances multiples (AFCM) est une méthode d'analyse de données utilisée pour étudier les relations entre plusieurs variables qualitatives à partir d'un tableau disjonctif complet. Ce document décrit la construction de ce tableau, les notations associées, et les différentes analyses qui peuvent être effectuées à partir de celui-ci, en mettant en évidence les équivalences entre les analyses de différents tableaux. Il aborde également les concepts de part d'inertie et de distance entre individus et modalités dans le cadre de l'AFCM.

Transféré par

lcflak630
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ESI: 2014-2015.

Cours assuré par Mme Hamdad

Chapitre3

Analyse factorielle des correspondances multiple: AFCM

L’AFCM est une méthode d’analyse de données qui consiste à appliquer


l’AFC à l’étude de tableau qu sont résultats d’oservations d’individus sur plus de
deux variables qualitatives mis sous forme d’un tableau disjonctif complet,qu’on
décrira plus tard. Elle est bien adapté à l’étude des questionnaires. Un ques-
tionnaire est la donnée de p variables qualitatves ayant chacune un nombre
de modalités et le but est d’étudier la relation entre ces variables, entre les
modalités et eventuellement entre les individus.
Exemple: si l’intitulé de la question est q1;”avez vous deux téléviseurs?” la
réponse sera à deux modalités oui ou non. q2: ”avez vous plus de 25 ans” la
réponse est oui ou non.
La données des questions mise sous forme dite disjonctive complète permet
de réaliser une partition de l’ensemble des individus enquêtés.
Notations:
♣ p= nombre de questions ou de variables qualitatives.
♣ Une P question Xj est un ensemble à mj modalités
♣J= mj est le nombre total de modalités
♣ n est le nombre d’individus ayant répondu aux questionnaires
Le tableau disjonctif complet
Le tableau Z appelé disjonctif complet est un tableau à n lignes et J colonnes
décrivant les réponses des individus par un codage binaire (o ou1).il sera de la
forme

X1 X2 Xp
 
Z= ···
où X j est un tableau à n lignes et mj modalités est tel que la jème ligne
contient mj − 1 fois la valeur ”0”et 1 fois la valeur ”1” dans la colonne corre-
spondant à la modalité choisie par l’individu. Dans ce tableau l’effectif total est
égal à N = np.
Exemple:
pour p = 2, m1 = 2 et m2 = 2, n = 4,on a

oui non oui non Zi.


1 1 0 0 1 2
2 1 0 0 1 2
Z=
3 0 1 1 0 2
4 1 0 1 0 2
Z.j 3 1 2 2 np=8

Tableau de Burt associé à Z


La matrice carrée associée à Z

1
B = Z tZ
est appelé tableau de contingence de Burt. B. il contient p2 blocs ,et il croise
les J modalités avec elle même. Il est donc de dimension JxJ et d’effectif total
égale à N = np2 .
K 0
A la case (j, j0) du tableau de fréquences associé à B on retrouve fjj0 = Njj ,
tel que kjj0 est le nombre d’individus ayant les modalités j et j0.
B est de la forme
m1 m2 ··· mp
m1 C11
..
B= m2 C21 .
..
··· .
mp Cpp

tel que les Cjj 0 représentent des matrices blocs

Cij = Zit Zj = Cji d’ordre mi xmj , i 6= j,




Cii = Zit Zi , matrice diagonale d’ordre mi .

On notera par D la matrice diagonale ayant comme éléments les eléments


diagonaux de B qui représentent les effectifs de chaque modalité.
Exemple:
 
3 0 1 2      
 0 1 1 0  3 0 1 2 2 0
B= ,C = , C12 = , C22 = ,D =
1 1 2 0  11
 
0 1 1 0 0 2
 2 0 0 2
C11 0
0 C22
Analyse factorielle de Z
1- Cas P=2
Dans ce cas Z = [Z1 /Z2 ]
Il est équivalent du point de vue de la description des associations entre
modalités d’effectuer
a- l’AFC du tableau Z
b-L’AFC du tableau B
c-L’AFC du tableau N = Z1t Z2
Equivalence entre a) et b)
Il s’agira de montrer que les deux analyses fournissent les mêmes facteurs de
normes 1.
- L’AF du nuage des profils lignes associé à Z; NL (I) = (XL (i), fi. = n1 ), i = 1, ..., n ,


conduit à la diagonalisation de la matrice ZL Dn Zl Qp , ainsi le facteur Ar =

2
Qp ur = D−1 ur issue de a) vérifie l’équation
1 −1 t
ZL Dn Zl Qp ur = λr ur ⇔ D Z ZAr = λr Ar
p

puisque F = npZ D
, Dp = np , Dn = n1 In , ZL = Dn−1 F.
t
- Soit B = Z Z, les marginales lignes et colonnes sont les éléments de la
matrice pD..Lla matrice à diagonaliser dans l’AFC de B est

BL Dn Bl Qp
h i
Bij
Or BL = Bi. = P BD−1 et Dp = D
np = Dn . d’où, en, remplaçant dans (2),
on obtient
1 −1 t −1 1
D B D BAr = λr D−1 B t Ar = λ2r Ar
p2 p
Ainsi les deux analyses mènent aux même facteurs associés à des valeurs propres
différentes λr et λ2r respectivement.
Equivalence entre a) et c)
Montrons que pour tout couple de facteur (Ar , Br ) associé à λr issu de
l’analyse de N correspond le facteur γ r issu del’analyse de
 Z ou de B.
D 1 0
Notons par: D1 = Z1t Z1 , D1 = Z2t Z2 , D =
0 D2
L’analyse de N conduit aux relations de transitions suivantes:

(  √
Ar = ± √1λ D1−1 N Br −1
r
⇔ √ λr Ar = ±D−1
1 N Br (1)
Br = ± √1λ D2−1 N t Ar λr Br = ±D2 N t Ar (2)
r

En rajoutant Ar de chaque coté de (1) et Br de chaque coté de (2), on


obtient

√ 
D1−1 (D1 Ar + N Br ) = 1 ± √λr Ar

(1)
D2−1 (D2 Br + N t Ar ) = 1 ± λr Br (2)
 −1     p   Ar 
D1 0 D1 N Ar
⇔ = 1 ± λr
0 D2 N t D2 Br Br
 p 
⇔ D−1 Z t Zγ r = 1 ± λr γ r

En multipliant les deux cotés de l’égalité par p1 ,on aura


√ 
1 −1 t 1 ± λr
D Z Zγ r = γr
p p
Ainsi l’Analyse factorielle de Z et celle de N mènent√au même facteurs associé
(1± λr )
à des valeurs propres différentes c’est à dire λr et p respectivement.
Récapitulation

3
AFC diim facteurs
  valeurs propres
Ar
Z (n, J) γr = λr
Br

(1± λr )
N (m1 , m2 ) Ar , Br p
B (J, J) γr λ2r

Remarque: :Les trois analyses reposent sur les mêmes informations mais
basée sur des valeurs propres différentes donc de taux d’inerties différents
Les relations existants entre les taux d’inerties montrent qu’ils seront tou-
jours plus élevè lors de l’analyse de N.
D’une manière générale l’analyse de Z conduit à de faible taux d’inertie ce
qui donne une fausse idée sur la part d’information extraite.
Cas p > 2
Dans ce cas l’AFC de Z est équivalente à l’AFC de B. les nuages directs et
dual de l’analyse de B se réduit en un seul NB (J) de J points de RJ . comme
pour le cas de deux variables.,on démontre que les deux analyses reposent sur
les mêmes facteurs associé au valeurs propres λr et λ2r .respectivement.
relation entre la projection des profils colonnes dans les deux anal-
yses:
La projection des profils colonnes dans le cas de l’analyse factorielle de Z est
donnée par p
VZr = λZr Ar
et celle de B est donnée par
p q p p p
VBr = λBr Ar = λ2Zr Ar = λZr λZr Ar = λZr VZr
car les deux analyses reposent sur le même facteur.Ar .
Projection des individus: L’analyse de Z conduit à l’analyse du nuage
des individus NZ (I), ce qui n’est pas le cas dans l’analyse de B ou l’on dispose
que du nuage des modalités. Donc lorsque qu’on effectue l’AF de B, et pour
calculer la projection des individus, on rajoute ces derniers comme éléments
supplémentaires dans B, c’est à dire qu’on associe à l’individu ”i” une ligne de
”0” et de ”1”. selon ses réponses aux différentes modalités. Et ainsi la projection
sera donnée par les formules barycentriques
J
1 X Bil 0
WBr (i) = √ V (l).
λBr l=1 Bi. Br
Et l’on vérifie facilement (en utilisant les relation entre projection des colonnes
dans les deux analyses et entre les valeurs propres) que les images des individus
sur les axes sont identiques qu’ils soient comme éléments supplémentaires dans
B ou comme des points dans NZ (I).
Part d’inertie du nuage des modalités
X
I= f.l d2 (gp , Yl )
l

4
Yl est le profil colonne associé à la modalité ”l”.

n
X 1 1 Zij 2
d2 (gp , Yl ) = ( − )
f n Z.j
i=1 i.
n n
n 1 X 2 X Zij
= n( + Z − 2 )
n2 Z.j2 i=1 il i=1
nZ .j
n
= 1+ −2
Z.j
n
= −1
Z.j

d’où
  X  
X n Z.j n J
I= f.l −1 = −1 = −1
Z.j np Z.j p
l l

Part d’inertie due à une variable Xj

mj 
X n
Ij = f.l−1 =
Z.j
l
mj 
X 1 Z.j 

p np
l
mj 1
= −
np p
l’influence d’une variable dépend seulement du nombre de ses modalités.
Pour éviter que certaines variables prennent une importance excessive, ou peu
présentes dans
l’analyse, il faut éviter les différences importantes entre les nombres de
modalités des variables à analyser.
Part d’inertie d’une modalité

 
n
Il = f.l −1
Z.j
1 Z.j
= −
p np
l’influence d’une modalité dépend seulement de son effectif. Pour éviter que
certaines modalités prennent une importance excessive, ou peu présentes dans
l’analyse, il faut éviter les modalités à faibles .
Contribution absolue d’une variable Xj : La contribution absolue d’une
variable est égale à la somme des contribution de ses modalités

5
mj
X
α α
Cab (j) = Cab (l)
l=1
α 2
tel que Cα
ab (l) = f.l (V λ(l))
α
.
Distance entre deux individus

J
X 1 Zij Z i0 j 2
d2 (i, i0 ) = ( − )
f Zi.
j=1 .j
Z i0 .
 
J J J
1 1 1
X X X
= Z2 + Z 20 − 2 2 Zij Zi0 j 
p2 j=1 ij p2. j=1 i j p j=1

P + P − 22/ii0
=
p2
n
X
tel que 2/ii0 = Zij Zij
i=1
Cette distance montre que deux individus sont éloignés lorsque leurs réponses
diffèrent pour un plus grand nombre de questions et pour des modalités rares.
Distance entre deux modalités.

n
X 1 Zij Zij 2
d2 (Yj , Yl ) = ( − )
f Z.j
i=1 i.
Z.j
n n n
!
1 X 2 1 X 2 1 X
= n Z + Z − 2 Zij Zil
Z.j2 i=1 ij Z.j2 i=1 il Z.j Z.l i=1
n
!
1 1 1 X
= n + −2 Zij Zil .
Z.j Z.j Z.j Z.l i=1
Z.j + Z.j − 22/lj
=
Z.j Z.l
n
X
tel que 2/lj = Zij Zil
i=1
Cette distance indique que les deux modalités sont d’autant plus proches que
leur effectifs conjoints soient proches des effectifs de chacune des deux modalités.
Règles d’interprétation des proximités:
• Deux modalités de deux variables différentes sont proches lorsqu’elles sont
associées aux mêmes individus
• Deux modalités d’une même variables sont proches lorsque les groupes
d’invidus qui les prennent se ressemblent par rapport aux autres modalités de
variables différentes

6
• La proximité de deux individus indique qu’il ont à peu prés choisi les
mêmes modalités.

Vous aimerez peut-être aussi