Statistique descriptive multidimensionnelle :
Cest lensemble des mthodes de la statistique descriptive (ou
exploratoire) permettant de traiter simultanment un nombre
quelconque de variables (+de 3/4). Ce sont des mthodes purement
descriptives. LACP est donc gnralement utilis pour les variables
quantitatives alors que lAFC est gnralement utilis pour les
variables qualitatives.
Lanalyse en composante principal :
LACP est utilis pour tudier un nombre important de variables
quantitatives et a pour objectif de revenir un espace de dimension
rduite en dformant le moins possible la ralit et donc obtenir le
rsum le plus pertinent possible des donnes initiales en utilisant
la matrice variances-covariances. Elle sapplique des tableaux
croisant des individus et des variables quantitatives. On essaye
donc dvaluer les ressemblances entre les individus et les liaisons
entre les variables (coef de corrlation ou covariance). Lobjectif
principal dune ACP est une tude exploratoire qui vise effectuer :
-
Un bilan des ressemblances entre individus : On cherche
dcrire la variabilit des individus en mettant en vidence
des groupes homognes dindividus dans le cadre dune
typologie dindividus , autrement dit, on cherche les
principales dimensions de variabilit des individus.
Un bilan des liaisons entre les variables : On cherche
dterminer les variables qui sont corrles positivement ou
ngativement entre elles, et sil existe des groupes de
variables corrles et ainsi mettre en vidence une typologie
des variables. Ce bilan vise galement rsumer lensemble
des variables par un petit nombre de variables synthtiques
appeles composantes principales (une CP est considre
comme le reprsentant ou la synthse dun groupe de
variables lies entre elles).
En gnral, on cherche relier entre les deux typologies (dindividus
et de variables). Pour cela, on caractrise les classes dindividus par
des
variables
lensemble
(on
des
slectionne
individus
dune
les
variables
classe
pour
possde
lesquelles
des
valeurs
particulirement grandes ou petites). De mme, on caractrise un
groupe de variables lies entre elles par des individus types (on
slectionne
ainsi
les
individus
qui
possdent
des
valeurs
particulirement grandes ou petites pour un ensemble de variables
lies positivement entre elles).
Dans
la
situation
idale,
les
deux
typologies
peuvent
tre
superposes : chaque groupe de variables caractrise un groupe
dindividus et chaque groupe dindividus rassemble les individus
types dun groupe de variables.
Lanalyse factorielle des correspondances :
Lanalyse factorielle des correspondances a t conue pour tudier
des tableaux de contingences (tableaux croiss). Des tableaux
deffectifs obtenus en croisant les modalits de deux variables
qualitatives dfinies sur une mme population de n individus. Un
tableau de contingence exprime la liaison entre deux variables
qualitatives (liaison ou indpendance).
Bien que le tableau tudi soit de nature diffrente de celui tudi
en ACP, les objectifs de lAFC peuvent sexprimer de manire
analogue ceux de lACP. On cherche donc obtenir une typologie
des lignes et des colonnes et relier ces deux typologies entre elles,
mais la notion de ressemblance entre deux lignes ou entre deux
colonnes est diffrente de celle de lACP. Cette ressemblance
sexprime de manire totalement symtrique. En effet, deux lignes
sont considres comme proches si elles sassocient de la mme
faon lensemble des colonnes, c'est--dire si elles sassocient
trop et trop peu (selon la situation dindpendance) aux
mmes colonnes. Symtriquement, deux colonnes sont proches si
elles sassocient de la mme faon lensemble des lignes.
Schmatiquement, ltude de lensemble des lignes revient mettre
en vidence une typologie dans laquelle on cherche les lignes dont
la rpartition scarte le plus de celle de lensemble de la
population, celles qui se ressemblent entre elles, et celles qui
sopposent. Pour mettre en relation la typologie des lignes avec
lensemble des colonnes, on caractrise chaque groupe de lignes
par les colonnes auxquelles ce groupe sassocie trop ou trop peu.
Cette approche, grce la notion de ressemblance utilise, permet
dtudier la liaison entre les deux variables, c'est--dire lcart du
tableau lhypothse dindpendance. Lanalyse de cette liaison est
lobjectif fondamental de lAFC.