AD : AFC
Introduction :
L'Analyse Factorielle des Correspondances (AFC) est une méthode statistique utilisée pour explorer les
relations entre des variables catégorielles (qualilatives). Elle vous aide à comprendre comment ces choix se
relient les uns aux autres.
Objectif :
- Transformer un grand nombre de modalités en un petit nombre d'axes factoriels pour simplifier l'analyse
et la représentation graphique des données.
- Mettre en évidence les relations et associations entre les modalités de deux variables qualitatives ainsi les
visualiser et interpréter les associations entre les lignes et les colonnes d'un tableau de contingence
Expliquer ou décrire le lien entre deux variables qualitatives est beaucoup plus difficile lorsque le nombre
de modalités est plus grand ou lorsque le projet est réellement exploratoire
Si on a des données permettant de faire une AFC, peut-on y appliquer une ACP ? ---------> NON
Si on a des données permettant de faire une ACP, peut-on y appliquer un AFC ? ---------> OUI
Car AFC sont généralement des données qualitatives organisées en tableaux de contingence. L'ACP nécessite des données
quantitatives, souvent sous forme de matrice de variance-covariance ou de matrice de corrélation.
Table de Confingence :
Le tableau de contingence permet de visualiser la distribution conjointe des valeurs des deux variables et de
déterminer s'il existe une association entre elles
168 correspondent le
nombre de Patron qui
travaille dans le demain de
Médecine
analyse des profils lignes :
le profil ligne en AFC est un outil pour explorer et comprendre les relations entre les catégories
des variables, ce qui peut aider à identifier des patterns ou des associations significatives dans les
données
Le Modéle d’indépendance et le test X2 :
// Lorsqu'on parle de positionner les données en fonction d'un point de départ, il s'agit généralement de déterminer s'il existe
une relation de dépendance entre ces variables ou si elles sont indépendantes l'une de l'autre
يتنافران
Distance entre profils et Colonnes (test de khi-deux):
la notion de distance entre profils est utilisée pour mesurer la similitude ou la dissimilarité entre les
profils lignes des différentes catégories des variables étudiées
Profils Ligne
Profils Colonnes
•Une petite distance indique que les profils sont similaires, c'est-à-dire que les distributions des
catégories (colonnes) pour les deux lignes comparées sont proches.
•Une grande distance indique que les profils sont dissemblables, c'est-à-dire que les distributions des
catégories pour les deux lignes comparées sont différentes.
Distance à l’origine
le but de la distance à l'origine est d'identifier les catégories les plus importantes dans l'ensemble des
données, ce qui permet une meilleure interprétation des résultats de l'AFC .
La distance à l’origine est tout simplement la distance au profil moyen
Inertie
L'inertie traduit la quantité d'information portée par une modalité .
une inertie élevée pour une dimension indique que cette dimension capture une grande partie
de la structure des données
Definie par le produit entre le poids de la modalité et sa distance à l'origine.
Le pourcentage d'inertie en AFC représente la proportion de
variabilité des données expliquée par chaque dimension extraite
comment les différentes modalités (catégories) se positionnent par rapport aux facteurs extraits, et comment elles
contribuent à la variance expliquée par ces facteurs. La coordination aide à visualiser les relations entre les modalités
et les facteurs dans les graphiques de correspondance.
En AFC, les valeurs propres représentent l'inertie expliquée par chaque facteur. Chaque valeur propre
est associée à un axe factoriel et représente une partie de l'inertie totale. La somme des valeurs propres
est égale à l'inertie totale du tableau de contingence
𝐹𝑘1 est la coordonnée de la modalité (q𝑘) sur le facteur n°1
qk : coefficient de Profils ligne
Prenons l'exemple suivant :
par exemple Les coefficients fournis pour le premier facteur sont : (0.098, 0.559, -1.056, 2.230).
On a Les coordonnées des "[Link]" sont : (0.258, 0.219, 0.480, 0.043).
Le résultat final de −0.263 représente la coordonnée du groupe "[Link]" sur le premier facteur.
Cela signifie que, selon l'axe du premier facteur, la position des "[Link]" est légèrement négative,
indiquant leur relation ou leur contribution à ce facteur particulier.
Les axes factoriels sont orthogonaux les uns aux autres
L'orthogonalité des axes factoriels en AFC assure que chaque axe capte une partie distincte de la
variabilité des données. Cette propriété est essentielle pour garantir que l'information extraite de
chaque axe est unique et non redondante, facilitant ainsi une interprétation claire et précise des
relations entre les variables dans l'espace factoriel.
Analyse de l’association lignes-colonnes à l’origine
Avant d'analyser les relations entre les modalités, il est crucial de vérifier la corrélation entre les
variables dans le tableau de contingence. Cela se fait en utilisant le test du chi carré
Le test du chi carré de Pearson compare les effectifs observés (𝑛𝑘𝑙) avec les effectifs théoriques (𝑒𝑘𝑙)
dans un tableau, sous l'hypothèse d'indépendance des variables
nous devons la comparer à une valeur critique du chi carré pour un certain niveau de signification (généralement 0.05) et un
nombre de degrés de liberté. Le nombre de degrés de liberté pour ce tableau (nombre de lignes−1)×(nombre de colonnes−1),
soit (5−1)×(4−1)=12(5−1)×(4−1)=12. À un niveau de signification de 0.05, la valeur critique de χ² pour 12 degrés de liberté est
environ 21.026. La valeur calculée de 312.8739 dépasse largement cette valeur critique, ce qui signifie que nous rejetons
l'hypothèse d'indépendance.
Determiner Les coefficient de Facteur (axe)
Autre methode