0% ont trouvé ce document utile (0 vote)
35 vues17 pages

Analyse Factorielle des Correspondances

Le document présente l'analyse factorielle des correspondances (AFC), une technique d'analyse adaptée aux tableaux de données qualitatives, notamment les tableaux de contingence. Il explique les concepts fondamentaux tels que les tableaux de contingence, les lois conjointe et marginale, ainsi que le test d'indépendance des variables qualitatives. L'AFC permet d'explorer et de réduire la dimension des données tout en mettant en évidence les associations entre les variables.

Transféré par

lnkouadri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
35 vues17 pages

Analyse Factorielle des Correspondances

Le document présente l'analyse factorielle des correspondances (AFC), une technique d'analyse adaptée aux tableaux de données qualitatives, notamment les tableaux de contingence. Il explique les concepts fondamentaux tels que les tableaux de contingence, les lois conjointe et marginale, ainsi que le test d'indépendance des variables qualitatives. L'AFC permet d'explorer et de réduire la dimension des données tout en mettant en évidence les associations entre les variables.

Transféré par

lnkouadri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours ANAD 2CS SIQ

N . Bessah

5 novembre 2022
Table des matières

1 Analyse factorielle des correspondances AFC 2


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Tableau de contingence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 Exemple d’un tableau de contingence en archéologie . . . . . . . . . . . 2
1.1.3 But de L’AFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Rappels : Loi conjointe, marginale, conditionnelle et test d’indépendance de deux
variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Matrices des profils lignes et profils colonnes . . . . . . . . . . . . . . . . . . . . 4
1.3.1 Choix de la distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Principe de L’AFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Analyse dans Rp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Analyse dans Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3 Coordonnées d’un point sur l’axe de rang k . . . . . . . . . . . . . . . . . 8
1.5 Relation entre les deux espaces Rn et Rp . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1 Relation entre les coordonnées des deux espaces . . . . . . . . . . . . . . 8
1.6 Reconstitution du tableau des fréquences . . . . . . . . . . . . . . . . . . . . . . 9
1.7 Aide à l’interprétation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.1 Inertie totale du nuage de points . . . . . . . . . . . . . . . . . . . . . . 10
1.7.2 Inertie expliquée par un axe . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.3 Contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.4 Qualité de représentation . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8 Positionnement d’éléments supplémentaires . . . . . . . . . . . . . . . . . . . . . 11
1.8.1 Colonne supplémentaire q . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8.2 Ligne supplémentaire q . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.9 Exemple Poterie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.9.1 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.9.2 Figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1
Chapitre 1

Analyse factorielle des correspondances


AFC

1.1 Introduction
L’analyse des correspondances est une technique d’analyse factorielle, adaptée aux tableaux
de données quantitatives assimilables à des effectifs tels que : tableaux de valeurs positives,
tableaux de notes, tableau logique ( ou disjonctif complet).
A l’origine, elle a été développée pour traiter le cas particulier du tableau de contingence
auquel l’ACP ne s’adaptait pas.

1.1.1 Tableau de contingence


C’est un tableau à n lignes et p colonnes croisant les modalités de deux variables qualitatives ;
à l’intersection de la i ème ligne et j ème colonne on trouve l’effectif kij qui désigne " le nombre
d’individus possédant à la fois le caractère i et le caractère j. "

Remarque
a) Dans ce type de tableau, on remarque que les individus ne sont présents que par leurs
effectifs ;
b) les lignes et les colonnes jouent le même rôle ;
a) On ne parlera plus d’individus et variable comme en ACP mais plutôt de caractère ligne
et colonne.

1.1.2 Exemple d’un tableau de contingence en archéologie


Le tableau ( 1.1) ci dessous contient les fréquences de 4 différents types de poteries retrouvées
dans 7 sites archéologiques ([9]). Le tableau (1.2) est celui des fréquences.

1.1.3 But de L’AFC


On suppose qu’il existe une liaison entre les variables qualitatives, l’analyse des corres-
pondances est une technique exploratoire et de réduction de la dimension, elle permet de mettre
en évidence les associations entre deux variables qualitatives.

2
Table 1.1 – Tableau de contingence

Type de poterie
Site A B C D Total des lignes
P1 30 10 10 39 89
P2 53 4 16 2 75
P3 73 1 41 1 116
P4 20 6 1 4 31
P5 46 36 37 13 132
P6 45 6 59 10 120
P7 16 28 169 5 218
Total des colonnes 283 91 333 74 781

Table 1.2 – Tableau des fréquences et des marginales

Type de poterie
Site A B C D fi.
P0 3. 841 2 × 10−2 1. 280 4 × 10−2 1. 280 4 × 10−2 4. 993 6 × 10−2 0.113 96
P1 6. 786 2 × 10−2 5. 121 6 × 10−3 2. 048 7 × 10−2 2. 560 8 × 10−3 9. 603 1 × 10−2
P2 9. 347 0 × 10−2 1. 280 4 × 10−3 5. 249 7 × 10−2 1. 280 4 × 10−3 0.148 53
P3 2. 560 8 × 10−2 7. 682 5 × 10−3 1. 280 4 × 10−3 5. 121 6 × 10−3 3. 969 3 × 10−2
P4 5. 889 9 × 10−2 4. 609 5 × 10−2 4. 737 5 × 10−2 1. 664 5 × 10−2 0.169 01
P5 5. 761 8 × 10−2 7. 682 5 × 10−3 7. 554 4 × 10−2 1. 280 4 × 10−2 0.153 65
P6 2. 048 7 × 10−2 3. 585 1 × 10−2 0.216 39 6. 402 × 10−3 0.279 13
f.j 0.362 36 0.116 52 0.426 38 0.094 75 1

1.2 Rappels : Loi conjointe, marginale, conditionnelle et


test d’indépendance de deux variables qualitatives
Notations et définitions Soit N un tableau de contingence, croisant les modalités de deux
variables qualitatives X et Y
1. N = (kij )i=1,n où kij est une fréquence absolue ;
j=1,p
p
n P
kij = 1t N 1 ;
P
2. L’ effectif total dans le tableau est K =
i j
Le vecteur 1t = (1, . . . , 1) de Rp ou Rn ne contient que des 1.
kij
3. La fréquence relative : fij = est une estimation de la probabilité conjointe de la
K
cellule (i, j), celui de l’exemple (1.2) ;
N
La matrice des fréquences F =
K
p
P n
P
4. Les fréquences marginales : fi. = fij et f.j = fij sont respectivement les estimations
j i
des probabilités marginales des modalités de X et de Y ;
les vecteur des marges lignes et colonnes sont respectivement : l = F 1 et c = 1t F
5. l’estimation des probabilités conditionnelles :
fij
→ probabilité de j connaissant i
fi.
et

3
fij
→ probabilité de i connaissant j
f.j
6. Dans le cas où les variables qualitatives X et Y sont indépendantes, alors fij = fi. f.j ou
fij fij
bien = f.j et = fi.
fi. f.j
7. Le test utilisé pour vérifier l’indépendance de deux variables aléatoires catégorielles dans
un tableau de contingence est le test de khi2 de Pearson
→ Les hypothèses du test sont :
H0 :fij = fi. f.j pour tout i, j
̸ fi. f.j pour certains i, j
H1 :fij =
→ La statistique de test :
p
n X
X (fij − fi. f.j )2
Φ=K (1.1)
i=1 j=1 f.j fi.
est distribuée selon la loi de χ2(n−1)(p−1) qui se lit : Khi-2 à (n − 1), (p − 1) degrés de
liberté, sous H0 .
→ Dans le cas où Φ est grand, alors la différence (fij − fi. f.j )2 est grande et donc
l’hypothèse d’indépendance des variables qualitatives X et Y est rejetée.
→ Décision du test : Pour α niveau de signification du test (valeur fixée. Les valeurs
usuelles :1% ,5%,10%), nous rejetons l’hypothèse H0 si Φobs (qui est la valeur observée
de Φ) est supérieur à un seuil Cα défini par P (Φ > Cα ) = α. La loi de χ2(n−1)(p−1) étant
tabulée, cette valeur sera prise de la table.
Une autre façon de procéder est de calculer la pvalue = P (Φ > Φobs ) ; si pvalue < α
l’hypothèse H0 est rejetée.

1.3 Matrices des profils lignes et profils colonnes


La matrice à analyser est :
a) Dans Rp , la matrice des profils lignes de terme général :
!
fij
. (1.2)
fi. i=1,n
j=1,p

et chaque ligne est affectée d’un poids fi. , le vecteur des poids des lignes est lt =
(f1. , f2. , . . . , fn. ). La matrice des profils lignes est :
 
f1. . . . 0
 . ..
Dl−1 F  ..

où Dl =  . 0  (1.3)
0 . . . fn.
b) Dans Rn , la matrice des profils colonnes a pour terme général
!
fij
(1.4)
f.j i=1,n
j=1,p

Chaque colonne est affectée du poids f.j , le vecteur des poids des colonnes est ct =
(f.1 , f.2 , . . . , f.p ). La matrice des profils colonnes est :
 
f.1 . . . 0
 .
Dc−1 F t où Dc =  .. . . . 0 


 (1.5)
0 . . . f.p

4
Remarque
1. On étudie le tableau des profils plutôt que le tableau des données brutes pour atténuer
la disparité entre point lignes (resp. point colonnes)
fij fij
2. Comme pj=1 = 1 et que ni=1
P P
= 1 , les p points du nuage, (resp. les n points du
fi. f.j
nuage) sont dans un sous espace de dimension p − 1, (resp. n − 1).

1.3.1 Choix de la distance


Distance de χ2
La distance correspondant à ce type de tableau est la distance de χ2 , (KHI2). Elle est définie
par : !2
p
2
X 1 fij fkj
d (i, k) = − (1.6)
j f.j fi. fk.
entre deux profils lignes (i, k) .
Et par : !2
n
2
X 1 fij fil
d (j, l) = − (1.7)
i fi. f.j f.l
entre deux profils colonnes (j, l).

Remarque La distance du χ2 accorde une même importance aux profils lignes en divisant
cette dernière par le poids de chaque colonne. Idem pour les profils colonnes.

Distance euclidienne
Afin d’appliquer les résultats de l’analyse générale, nous transformons les matrices des profils
pour retrouver la distance euclidienne usuelle.
En effet,   2
p
2
X f
 q ij
fkj 
d (i, k) = −q (1.8)
j f.j fi. f.j fk.
n
!2
f f
2
√ ij − √ il
X
d (j, l) = (1.9)
i fi. f.j fi. f.l

Propriété de l’équivalence distributionnelle


Si deux modalités d’une variable ont des profils identiques, on rassemble ces deux modalité
et on lui affecte la somme des poids ; les distances entre les modalités de l’une ou l’autre des
variables, ne changerons pas.

1.4 Principe de L’AFC


En AFC, on analyse ! deux nuages de points pondérés, le nuage des n points profils ! lignes
f ij f ij
dans Rp : , fi. et le nuage des p points profils colonnes dans Rn : , f.j . Nous
fi. f.j
rappelons : Les vecteurs des effectifs marginaux des lignes et des colonnes respectivement.

lt = (f1. , . . . , fn. ) et ct = (f.1 , . . . , f.n ) (1.10)

5
et les matrices diagonales :
   
f1. . . . 0 f.1 . . . 0
 . .  . ..
 .. .. 0   et Dc =  ..
 
Dl =   . 0  (1.11)
0 . . . fn. 0 . . . f.p

1.4.1 Analyse dans Rp


fij
Elle consiste à effectuer une ACP sur le tableau de terme général, q muni de la métrique
f.j fi.
 
f1. . . . 0
 . ..
.

Dl = 
 . . 0 

0 . . . fn.

Coordonnées du centre de gravité dans Rp

n n
X fij X fij q
gj = fi. q = q = f.j (1.12)
i f.j fi. i f.j

La matrice centrée
La matrice centrée R a pour terme général
 
f
 q ij
q
− f.j  (1.13)
f.j fi. i=1,n
j=1,p

La matrice des covariances


La matrice T des covariances a pour terme général
 
n
!
X fij q fik q
tjk = fi.  q − f.j  √ − f.k (1.14)
i f.j fi. f.k fi.

écriture que l’on peut simplifier


 
n
!
X f
 q ij
q fik q
tjk = − fi. f.j  √ − fi. f.k (1.15)
i fi. f.j fi. f.k

i.e.,
T = X t X = avec X = (xij )i=1,n
j=1,p

(fij − fi. f.j )


xij = q (1.16)
fi. f.j

En écriture matricielle
−1/2
 
X = Dl F − lct Dc−1/2 F est la matrice des fréquences (1.17)

6
Proposition
√ √ q t
a) ”0” est une valeur propre triviale de T . Le vecteur de composantes f.1 , f.2 , . . . , f.p
est le vecteur propre associé.
b) On pose
T ∗ = X ∗t X ∗ (1.18)
avec   fij
X ∗ = x∗ij i=1,n et x∗ij = q (1.19)
j=1,p fi. f.j
Les matrices T et T ∗ ont les mêmes vecteurs propres associés aux mêmes valeurs propres
λ > 0, à l’exception du vecteur centre de gravité associé à la valeur propre 1 de T ∗

Remarque Du point de vue calcul numérique, il est équivalent de diagonaliser la matrice T ∗


et de prendre les q plus grandes valeurs propres différentes de 1.

Coordonnées d’un point sur l’axe de rang k


 
p
X fij 
Fk (i) =  q ukj (1.20)
j fi. f.j
Coordonnées de l’ensemble des points sur le k ème axe est R∗ uk où
 
fij
R∗ =  q  (1.21)
fi. f.j i=1,n
j=1,p

Propriétés
E (Fk ) = 0 et V ar (Fk ) = λk

1.4.2 Analyse dans Rn


Les variables mises en correspondances dans le tableau de contingence jouent des rôles
analogues, l’analyse dans Rn peut se déduire de celle menée dans Rp par permutation des rôles
des indices i et j, comme on peut le constater dans le tableau suivant :

Rp Rn
fij fij
Matrice des profils (ligne) (colonne)
fi. f.j
fij fij
Matrice initiale utilisée q √
fi. f.j f.j fi.
q  √ 
Centre de gravité f.j fi.
j=1,p i=1,n
(fij − fi. f.j ) (fij − fi. f.j )
Matrice X centrée q q
fi. f.j fi. f.j
fij fij
Matrice X ∗ non centrée q q
fi. f.j fi. f.j
Matrice à diagonaliser T = X ∗t X ∗

W = X ∗ X ∗t

7
1.4.3 Coordonnées d’un point sur l’axe de rang k
L’équivalent dans Rn des résultats de la projection dans Rp reste valable, on a
n
!
X fij
Gk (j) = √ vki (1.22)
i f.j fi.
où vk est le vecteur propre associé à la k ème valeur propre de W ∗

1.5 Relation entre les deux espaces Rn et Rp


L’analyse générale montre que :
1. les matrices T ∗ = X ∗t X ∗ et W ∗ = X ∗ X ∗t ont les même valeurs propres ;
2. entre les vecteurs propre unitaires uk de T ∗ et vk de W ∗ , associés à la même valeur propre
λk , il existe les relations suivantes :

1 1
vk = √ X ∗ uk et uk = √ X ∗t vk (1.23)
λk λk

1.5.1 Relation entre les coordonnées des deux espaces


On cherche à exprimer les coordonnes d’un point de Rp en fonction des coordonnées des
points de Rn et vice versa. On a, d’après les relations de transition,
  
 1 P p f
 q ij  ukj
vki = √



λk j

fi. f.j




 et (1.24)

 Pp fij
(i) =



 F k q ukj
j f.j fi.


en multipliant et divisant vki par la même quantité fi. , on déduit

fi.
vki = Fk (i) √ (1.25)
λk
De même, on a   
 1 Pn f
 q ij  vki
ukj =√



λk i



 fi. f.j
 et (1.26)
 !
n fij



 P

 Gk (j) = vki
f.j fi.

i

On déduit que, q
f.j
ukj = Gk (j) √ (1.27)
λk
Par conséquent :
q
p f.j
X fij
Fk (i) = q Gk (j) √ (1.28)
j f.j fi. λk
p
1 X fij
=√ Gk (j) (1.29)
λk j fi.

8
n
!
X fij
Gk (j) = √ vki
i f.j fi.
n
! √
X fij fi.
= √ Fk (i) √
i f.j fi. λk
n
!
1 X fij
=√ Fk (i)
λk i f.j

Remarque
1. Les coordonnées des points lignes s’expriment en fonction des coordonnées des points
colonnes en utilisant la matrice des profils lignes et réciproquement ;
1
2. au coefficient √ près, la projection, notée Fk (i), de la ligne i sur l’axe de rang k est le
λk
barycentre des projections, notées Gk (j), des colonnes j sur l’axe de rang k.
fij
• Ce barycentre Fk (i) se rapproche des points colonnes Gk (j) qui ont les poids
fi.
forts. (ainsi, la modalité de la variable ligne i est associée à la modalité j de la variable
colonne )

1.6 Reconstitution du tableau des fréquences


D’après les résultats de l’analyse générale,
 
p q
fij 
λk vk utk
X
X= comme X =  q
k fi. f.j i=1,...,n
j=1,...,p

On a,
p q
fij X
q = λk vki ukj
fi. f.j k
q
p
X f.j fi.
= Fk (i) Gk (j) √ ⇒
k λk
p
X f.j fi.
fij = Fk (i) Gk (j) √
k λk

Or λ = 1 est la plus grande valeur propre de T ∗ = X ∗t X ∗ qui correspond à la valeur propre


0 de X t X p
f.j fi. X 1
fij = F1 (i) G1 (j) √ + f.j fi. Fk (i) Gk (j) √
λ1 k=2 λk

9
Comme

λ1
F1 (i) = v1i √ (1.30)
f
√ i.
λ1
G1 (j) = u1j q , (1.31)
f.j
q
v1i = fi. et (1.32)
q
u1j = f.j ⇒ (1.33)
F1 (i) = G1 (j) (1.34)
q
= λ1 = 1 (1.35)
d’où p !
X 1
fij = f.j fi. 1+ Fk (i) Gk (j) √ (1.36)
k=2 λk

1.7 Aide à l’interprétation


1.7.1 Inertie totale du nuage de points
L’ inertie totale du nuage des PL est par définition
n
fi. D2 (P Li , gl )
X
I=
i=1
!2
fij
n p − f.j
X X fi.
= fi.
i=1 j=1 f.j
n
XXp
(fij − fi. f.j )2
=
i=1 j=1 f.j fi.

Remarques
1. I = Φ/N et mesure le degré de liaison entre les variables X et Y (voir l’équation 1.1
pour l’expression de Φ ) ;
2. On montre de même que l’inertie totale du nuage des P C = I ;
3. Si r est le rang de la matrice des profils lignes, alors
il y a au plus r = min(n − 1; p − 1) valeurs propres non nulles
l’inertie I = λ1 + λ2 + · · · + λr .

1.7.2 Inertie expliquée par un axe


Le taux d’inertie expliquée par un axe k est λk /I ; il représente le pourcentage de l’inertie
totale expliquée par l’axe k et s’interprète également comme la part de la liaison entre X et Y
expliquée par cet axe.

1.7.3 Contribution
La contribution ( ou contribution absolue ) est la part prise par un élément donné dans la
variance expliquée par un facteur. Les contributions absolues indiquent les variables qui sont
responsables de la construction d’un facteur.

10
Contribution d’une ligne i à l’axe k

fi.
Cak (i) = (Fk (i))2 = (vki )2 (1.37)
λk

Contribution d’une colonne j à l’axe k

f.j
Cak (j) = (Gk (j))2 = (uki )2 (1.38)
λk

Remarque
n
X p
X
Cak (i) = Cak (j) = 1 (1.39)
1 j

1.7.4 Qualité de représentation


Le cosinus carré ou contribution relative ou encore qualité de représentation, permet d’
apprécier si un point est bien représenté sur un sous-espace factoriel. Plus le cosinus carré est
proche de 1, plus la position du point observé en projection est proche de la position réelle du
point dans l’espace.

(Fk (i))2
Crk (i) = (1.40)
d2 (i, gl )
pour un point i de Rp ; gl centre de gravité dans Rp

(Gk (i))2
Crk (j) = 2 (1.41)
d (j, gc)

pour un point j de Rn ; gc centre de gravité dans Rn


 2
p
f
 q ij
q
d2 (i, gl ) =
X
− f.j  (1.42)
j=1 f.j fi.

n
!2
f q
d2 (j, gc) = √ ij − fi.
X
(1.43)
i=1 fi. f.j

n
P p
P
Remarque Crk (i) = 1 pour tout i = 1, . . . , n et Crk (j) = 1 pour tout j = 1, . . . , p
k=1 k=1

1.8 Positionnement d’éléments supplémentaires


1.8.1 Colonne supplémentaire q
!
fiq
composante du profil colonne supplémentaire. D’après les résultat établis
f.q i=1,...,n
précédemment, les coordonnées de la colonne supplémentaire sur l’axe k est
n
!
1 X fiq
Gk (q) = √ Fk (i) (1.44)
λk i=1 f.q

11
1.8.2 Ligne supplémentaire q
!
fqj
Composante du profil ligne supplémentaire
fq. j=1,...,p
1 P p f
qj
Les coordonnées sur l’axe k est Fk (q) = √ Gk (j)
λk j=1 fq.

1.9 Exemple Poterie


Une analyse avec le logiciel " R "a donnée les résultats suivants :

1.9.1 Résultats
Pearson’s Chi-squared test

data: tableau_poterie
X-squared = 400.25, df = 18, p-value < 2.2e-16

eigenvalue variance.percent cumulative.variance.percent


Dim.1 0.28358759 55.33626 55.33626
Dim.2 0.17010675 33.19282 88.52908
Dim.3 0.05878625 11.47092 100.00000
Correspondence Analysis - Results for rows
===================================================
Name Description
1 "$coord" "Coordinates for the rows"
2 "$cos2" "Cos2 for the rows"
3 "$contrib" "contributions of the rows"
4 "$inertia" "Inertia of the rows"
res.row <- res.ca$row
> res.row$coord # Coordonnées
Dim 1 Dim 2 Dim 3
1 0.91948857 0.75219596 -0.258588993
2 0.37815399 -0.61138660 -0.002017247
3 0.13744880 -0.58588253 -0.158746746
4 0.70016098 -0.22103785 0.330555116
5 0.14805337 0.13514502 0.469001338
6 -0.07835769 -0.08654646 -0.190151987
7 -0.72470277 0.21224557 -0.035581699
> res.row$contrib # Contributions
Dim 1 Dim 2 Dim 3
1 33.9738235 37.9035082 1.296234e+01
2 4.8423969 21.1018490 6.647411e-04
3 0.9894677 29.9713629 6.367088e+00
4 6.8615029 1.1400460 7.377729e+00
5 1.3063883 1.8146856 6.324050e+01
6 0.3326644 0.6765615 9.450531e+00
7 51.6937563 7.3919868 6.011503e-01
> res.row$cos2 # Qualité de représentation
Dim 1 Dim 2 Dim 3

12
1 0.57198039 0.38278108 4.523854e-02
2 0.27670466 0.72328747 7.874032e-06
3 0.04877274 0.88616863 6.505863e-02
4 0.75611250 0.07535705 1.685304e-01
5 0.08425954 0.07020734 8.455331e-01
6 0.12332145 0.15044369 7.262349e-01
7 0.91896139 0.07882332 2.215291e-03
>

Correspondence Analysis - Results for columns


===================================================
Name Description
1 "$coord" "Coordinates for the columns"
2 "$cos2" "Cos2 for the columns"
3 "$contrib" "contributions of the columns"
4 "$inertia" "Inertia of the columns"
> # Coordonnées
> head(col$coord)
Dim 1 Dim 2 Dim 3
A 0.420374688 -0.43959523 -0.005743267
B -0.007965016 0.35844365 0.633504076
C -0.564132918 0.06743125 -0.107450888
D 0.940743806 0.93692526 -0.273545684
> # Qualité de représentation
> head(col$cos2)
Dim 1 Dim 2 Dim 3
A 0.4776183281 0.52229252 8.915094e-05
B 0.0001197297 0.24247682 7.574034e-01
C 0.9518671592 0.01359991 3.453293e-02
D 0.4815914090 0.47768972 4.071887e-02
> # Contributions
> head(col$contrib)
Dim 1 Dim 2 Dim 3
A 22.579862974 41.164210 0.02033189
B 0.002606612 8.800565 79.54509934
C 47.848559745 1.139709 8.37408682
D 29.568970669 48.895515 12.06048196

1.9.2 Figures

13
Scree plot Row points − CA
0.8

50
1

40

0.4

33.2%
Percentage of explained variances

30
7
cos2

Dim2 (33.2%)
5
0.8

0.6

0.4
0.0
0.2

20

11.5%

10

−0.4

3 2
0

1 2 3 −0.5 0.0 0.5 1.0


Dimensions Dim1 (55.3%)

(a) inertie (b) répartition individus


Contribution of rows to Dim−1 Contribution of rows to Dim−2

50

30
40

30
Contributions (%)

Contributions (%)

20

20

10

10

0 0
7

(c) Contribution axe1 (d) Contribution axe 2

Figure 1.1 – Graphes des sites et valeurs propres

14
Column points − CA Contribution of columns to Dim−1
1.0 50

40

0.5

30

B
cos2

Contributions (%)
Dim2 (33.2%)

0.8

0.6

0.4

20

0.0

10

A 0

−0.5
−0.5 0.0 0.5 1.0
Dim1 (55.3%)
C

B
(a) Variable colonne et Cos (b) Contributions axe1
Contribution of columns to Dim−2 CA − Biplot
1.0
50

40

0.5

B
30
Contributions (%)

Dim2 (33.2%)

7
5

20 0.0

10

A
−0.5

3
2
0

−0.5 0.0 0.5 1.0


Dim1 (55.3%)
D

(c) Contribution axe 2 (d) Les deux variables

Figure 1.2 – Variable colonne

15
Bibliographie

[1] Frederik Michel Dekking, Cornelis Kraaikamp, Hendrik Paul Lopuhaä, and Ludolf Erwin
Meester. A Modern Introduction to Probability and Statistics : Understanding why and how.
Springer Science & Business Media, 2005.
[2] George H Dunteman. Principal components analysis. Number 69. Sage, 1989.
[3] Brigitte Escofier and Jérôme Pagès. Analyses factorielles simples et multiples : objectifs,
méthodes et interprétation. Dunod, 2008.
[4] Brian Everitt, Graham Dunn, and Graham Dunn. Applied multivariate data analysis. 2001.
[5] Michael Greenacre and Jorg Blasius. Multiple correspondence analysis and related methods.
CRC press, 2006.
[6] Michael J Greenacre. Theory and applications of correspondence analysis. 1984.
[7] Wolfgang Härdle and Léopold Simar. Applied multivariate statistical analysis, volume 22007.
Springer, 2007.
[8] François Husson, Sébastien Lê, and Jérôme Pagès. Exploratory multivariate analysis by
example using R. CRC press, 2017.
[9] Richard Arnold Johnson, Dean W Wichern, et al. Applied multivariate statistical analysis,
volume 5. Prentice hall Upper Saddle River, NJ, 2002.
[10] Ian Jolliffe. Principal component analysis. In International encyclopedia of statistical
science, pages 1094–1096. Springer, 2011.
[11] Ludovic Lebart, Alain Morineau, and Marie Piron. Statistique exploratoire multidimension-
nelle, volume 3. Dunod Paris, 1995.
[12] Jean-Pierre Nakache and Josiane Confais. Approche pragmatique de la classification : arbres
hiérarchiques, partitionnements. Editions Technip, 2004.
[13] Gilbert Saporta. Probabilités, analyse des données et statistique. Editions Technip, 2006.
[14] Gilbert Strang. Linear algebra and its applications. 2006.
[15] Stéphane Tufféry. Data mining and statistics for decision making. John Wiley & Sons,
2011.

16

Vous aimerez peut-être aussi