0% ont trouvé ce document utile (0 vote)
61 vues2 pages

Chap 4 AFC

Transféré par

khaoulatobbal
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
61 vues2 pages

Chap 4 AFC

Transféré par

khaoulatobbal
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

CHAP 4 : Analyse factorielle des correspondances (AFC)

Introduction :
Lorsqu’on étudie la relation entre les variables numériques, on parle de « Corrélation »
Lorsqu’on étudie la relation entre les variables nominales, on parle de « Correspondance »
L’objectif de l’AFC est d’étudier des liaisons (correspondances) existantes entre deux variables nominales.
L’AFC peut être étudiée comme une ACP avec une métrique spéciale (celle du Khi-deux χ2).

L’AFC est conçue pour les tableaux de contingence (appelés aussi


tableau de dépendance ou tableau croisé), elle permet ainsi l'étude
des liaisons (dites aussi correspondances) existant entre deux
variables nominales.

kij est le nombre d'individus possédant à la fois la modalité i de la


première variable et la modalité j de la seconde variable.

Représentation des données pour l’AFC


« Tableau de contingence »

Un autre tableau important en AFC est : « tableau des fréquences relatives ».


kij
Les fréquences fij sont données par : f ij 
n
Sachant que n est le nombre total de la population étudiée
Les marges des lignes sont calculés par : fi   fij 
j J

Les marges des colonnes sont calculés par : f j  f


iI
ij

Nous avons ainsi : f i =  f j =  fij  1


iI j J iI jJ

Tableau des fréquences relatives pour l’ AFC

Spécificités de l’AFC :
 On s’intéresse aux distances χ² entre les profils.
 L’inertie totale du nuage de points (Σαλα) reflète
l’indépendance statistique entre les 2 variables
(c’est le principe du test statistique du χ²).
 Les lignes et les colonnes jouent le même rôle, donc
on peut faire une représentation simultanée des
deux nuages de points.
 On parle de probabilité « p » ou de fréquence « f »,
c’est la même chose.
 Coté graphique : du fait que la somme de chaque
profil-ligne est égale à 1, le nuage NI appartient à un
hyperplan, noté HI.
 Le barycentre GI du nuage des points NI est : la
moyenne pondérée de tous les points sur tous les
axes j.
 GI s'interprète comme un profil-moyen, la
coordonnée de GI sur l'axe j est donc donnée par :
f

iI
fi  ij  f j
fi  Le nuage NI des profils-lignes dans l’espace RJ

Exemple d’étude : utiliser la méthode d’AFC pour étudier la liaison entre la couleur des yeux et la couleur des
cheveux d’une population de 592 personnes. La fréquence d’apparition d’une couleur des yeux avec une couleur de
cheveux (pour la même personne) est représentée dans la table de contingence (première table du fichier Excel)

1/2
χ²

2/2

Vous aimerez peut-être aussi