Question 9 : En analyse en composantes prin-
cipales, on cherche à faire un bilan des ressem-
blances entre individus :
Proposition 1 : Deux individus sont proches s’ils prennent des valeurs proches
sur au moins une variable.
Proposition 2 : Deux individus sont proches s’ils prennent des valeurs
proches sur toutes les variables.
Réponse :
• Proposition 1 : Faux.
• Proposition 2 : Vrai.
Explication détaillée
Objectif de l’ACP :
• L’analyse en composantes principales (ACP) vise à représenter les indi-
vidus dans un espace réduit tout en conservant au maximum l’information
(la variance des données).
• En ACP, la proximité entre individus est mesurée en fonction de leurs
valeurs sur toutes les variables.
Analyse des propositions :
• Proposition 1 : Deux individus sont proches s’ils prennent des
valeurs proches sur au moins une variable.
– Cette proposition est FAUSSE.
– En ACP, la ressemblance entre deux individus est évaluée en con-
sidérant l’ensemble des variables. Une similarité sur une seule vari-
able ne suffit pas pour considérer que deux individus sont proches.
• Proposition 2 : Deux individus sont proches s’ils prennent des
valeurs proches sur toutes les variables.
– Cette proposition est VRAIE.
– Deux individus sont considérés proches en ACP si leurs coordonnées
dans l’espace multidimensionnel (données par leurs valeurs sur toutes
les variables) sont similaires.
1
Exemple simple :
Supposons un tableau de données avec deux variables et trois individus :
Individu Variable 1 Variable 2
1 2 4
2 3 5
3 10 12
Distances entre individus :
En ACP, la proximité entre deux individus est souvent mesurée à l’aide de la
distance euclidienne dans l’espace des variables :
v
u p
uX
d(A, B) = t (xA,j − xB,j )2
j=1
Où p est le nombre de variables.
• Distance entre Individu 1 et Individu 2 :
p √ √
d(1, 2) = (2 − 3)2 + (4 − 5)2 = 1 + 1 = 2
• Distance entre Individu 1 et Individu 3 :
p √ √
d(1, 3) = (2 − 10)2 + (4 − 12)2 = 64 + 64 = 128
• Distance entre Individu 2 et Individu 3 :
p √ √
d(2, 3) = (3 − 10)2 + (5 − 12)2 = 49 + 49 = 98
Interprétation :
• Les individus 1 et 2 sont proches, car leurs valeurs sont similaires pour les
deux variables.
• L’individu 3 est éloigné des autres, car ses valeurs diffèrent fortement pour
toutes les variables.
Implications mathématiques :
• En ACP, deux individus sont similaires s’ils prennent des valeurs proches
pour toutes les variables.
• Une ressemblance sur une seule variable ne suffit pas pour établir une
proximité globale.
Conclusion :
• Proposition 1 : FAUX, car elle ne considère qu’une seule variable.
• Proposition 2 : VRAI, car la proximité entre individus en ACP est
évaluée sur l’ensemble des variables.
2
Question 10 : En analyse en composantes princi-
pales :
• Proposition 1 : On s’intéresse aux liaisons linéaires entre variables.
• Proposition 2 : On s’intéresse aux liaisons linéaires et quadratiques entre
variables.
• Proposition 3 : On compare les moyennes des différentes variables.
Réponse :
• Proposition 1 : VRAI.
• Proposition 2 : FAUX.
• Proposition 3 : FAUX.
Explication détaillée
Proposition 1 : On s’intéresse aux liaisons linéaires entre variables.
• Cette proposition est VRAIE.
• En ACP, l’objectif principal est de résumer les relations entre les variables
sous forme de combinaisons linéaires. On étudie les corrélations en-
tre variables pour identifier les axes principaux qui capturent la variance
maximale des données.
• La matrice de corrélation ou de covariance est utilisée pour déterminer ces
liaisons linéaires.
Exemple : Si deux variables X et Y sont fortement corrélées (positivement
ou négativement), elles contribueront de manière importante à un même axe
principal.
Proposition 2 : On s’intéresse aux liaisons linéaires et quadratiques
entre variables.
• Cette proposition est FAUSSE.
• L’ACP ne s’intéresse qu’aux relations linéaires entre variables. Les rela-
tions quadratiques ou non linéaires ne sont pas prises en compte par la
méthode standard de l’ACP.
• Pour analyser des relations non linéaires, des méthodes alternatives comme
l’ACP non linéaire (Kernel PCA) doivent être utilisées.
3
Proposition 3 : On compare les moyennes des différentes variables.
• Cette proposition est FAUSSE.
• L’ACP ne compare pas les moyennes des variables. Elle se concentre sur
la variance et les corrélations entre les variables.
• Avant d’appliquer l’ACP, les variables sont souvent standardisées pour
éviter que des différences d’échelle influencent les résultats.
Résumé mathématique :
• Liaisons linéaires : Les axes principaux sont définis comme des com-
binaisons linéaires des variables d’origine. Les coefficients de ces com-
binaisons sont obtenus à partir des vecteurs propres de la matrice de co-
variance ou de corrélation.
Exemple pratique :
Supposons trois variables :
Variable 1 (X) : 1, 2, 3, 4, 5 Variable 2 (Y) : 2, 4, 6, 8, 10 Variable 3 (Z) : 1, 1, 1, 1, 1
• X et Y sont parfaitement corrélées (r = 1) : elles contribueront fortement
à un même axe principal.
• Z est constante : elle n’apporte aucune information à l’ACP.
Conclusion :
• Proposition 1 : VRAI. En ACP, on étudie les relations linéaires entre
variables.
• Proposition 2 : FAUX. L’ACP ne prend en compte que les relations
linéaires, pas les quadratiques.
• Proposition 3 : FAUX. L’ACP ne compare pas les moyennes, mais
analyse la variance et les corrélations.
4
Question 11 : Parmi les indicateurs suivants, quel(s)
est (sont) les indicateurs de liaison entre variables
quantitatives :
• Le coefficient de corrélation
• La moyenne
• La variance
• L’écart-type
Réponse :
• Le coefficient de corrélation : VRAI.
• La moyenne : FAUX.
• La variance : FAUX.
• L’écart-type : FAUX.
Explication détaillée
Le coefficient de corrélation :
• VRAI.
• Le coefficient de corrélation (r) mesure l’intensité et la direction de la
liaison linéaire entre deux variables quantitatives.
• Il est défini par :
Cov(X, Y )
r=
σX · σY
Où :
– Cov(X, Y ) est la covariance entre X et Y ,
– σX et σY sont les écarts-types de X et Y .
• r prend des valeurs entre -1 et 1 :
– r = 1 : Liaison linéaire parfaite positive,
– r = −1 : Liaison linéaire parfaite négative,
– r = 0 : Pas de liaison linéaire.
5
La moyenne :
• FAUX.
• La moyenne est une mesure de tendance centrale pour une variable quan-
titative.
• Elle ne permet pas de mesurer une relation entre deux variables.
La variance :
• FAUX.
• La variance mesure la dispersion des valeurs d’une seule variable autour
de sa moyenne.
• Elle ne fournit pas d’information sur la liaison entre deux variables.
L’écart-type :
• FAUX.
• L’écart-type est simplement la racine carrée de la variance.
• Il mesure également la dispersion d’une seule variable et n’est pas un
indicateur de liaison entre deux variables.
Résumé mathématique :
Indicateur Indique une liaison entre variables ?
Coefficient de corrélation Oui (mesure de liaison linéaire)
Moyenne Non (tendance centrale)
Variance Non (dispersion d’une seule variable)
Écart-type Non (dispersion d’une seule variable)
Conclusion :
• Seul le coefficient de corrélation est un indicateur de liaison entre
variables quantitatives.
• Les autres (moyenne, variance, écart-type) concernent des propriétés in-
dividuelles des variables et ne mesurent pas leur relation.
6
Question 12 : Si on réalise l’analyse en com-
posantes principales d’un tableau de I individus
et K colonnes :
Analyse des propositions :
• Proposition 1 : Chaque individu prend K valeurs et peut être considéré
comme un point dans un espace à K dimensions.
– Réponse : VRAI.
– En ACP, chaque individu est décrit par K variables quantitatives.
Cela correspond à K coordonnées dans un espace de dimension K.
• Proposition 2 : L’ensemble des individus forme un nuage de I points
dans un espace à K dimensions.
– Réponse : VRAI.
– Chaque individu est représenté par un point dans un espace à K
dimensions, car il est décrit par K variables. Ainsi, les I individus
forment un nuage de I points dans cet espace.
• Proposition 3 : L’ensemble des individus forme un nuage de I points
dans un espace à I dimensions.
– Réponse : FAUX.
– L’espace est défini par les K variables, et non par le nombre d’individus.
Chaque individu est représenté par K coordonnées, donc dans un es-
pace de dimension K.
• Proposition 4 : L’ensemble des individus forme un nuage de K points
dans un espace à K dimensions.
– Réponse : FAUX.
– Ce sont les I individus qui forment un nuage de points, pas les K
variables.
• Proposition 5 : L’ensemble des colonnes, i.e. l’ensemble des variables,
peut être considéré comme un nuage de K points dans un espace à I
dimensions.
– Réponse : VRAI.
– Les K variables peuvent être représentées comme des points dans un
espace à I dimensions (chaque dimension correspond à un individu).
Cela se produit dans le cadre de l’analyse duale de l’ACP.
• Proposition 6 : L’ensemble des colonnes, i.e. l’ensemble des variables,
peut être considéré comme un nuage de K points dans un espace à K
dimensions.
7
– Réponse : FAUX.
– Les variables ne sont pas décrites dans un espace à K dimensions,
mais dans un espace à I dimensions si on les considère comme des
points.
• Proposition 7 : L’ensemble des colonnes, i.e. l’ensemble des variables,
peut être considéré comme un nuage de I points dans un espace à K
dimensions.
– Réponse : FAUX.
– Les I points représentent les individus, pas les colonnes (variables).
Les variables sont décrites par un nuage de K points dans un espace
à I dimensions.
Résumé mathématique :
Proposition
Chaque individu prend K valeurs et peut être considéré comme un point dans un espace à K dimension
L’ensemble des individus forme un nuage de I points dans un espace à K dimensions.
L’ensemble des individus forme un nuage de I points dans un espace à I dimensions.
L’ensemble des individus forme un nuage de K points dans un espace à K dimensions.
L’ensemble des variables peut être considéré comme un nuage de K points dans un espace à I dimension
L’ensemble des variables peut être considéré comme un nuage de K points dans un espace à K dimension
L’ensemble des variables peut être considéré comme un nuage de I points dans un espace à K dimension
Conclusion :
• Propositions VRAIES :
– Chaque individu prend K valeurs et peut être considéré comme un
point dans un espace à K dimensions.
– L’ensemble des individus forme un nuage de I points dans un espace
à K dimensions.
– L’ensemble des colonnes, i.e. l’ensemble des variables, peut être con-
sidéré comme un nuage de K points dans un espace à I dimensions.
• Propositions FAUSSES :
– Les autres propositions ne respectent pas les définitions de l’ACP.
8
Question 13 : En analyse en composantes princi-
pales :
Analyse des propositions :
• Proposition 1 : Les variables qui ont une forte moyenne ont plus d’importance
dans l’analyse.
– Réponse : FAUX.
– En ACP, ce n’est pas la moyenne des variables qui détermine leur
importance, mais leur variance.
– Les variables ayant une variance plus élevée auront une plus grande
contribution aux composantes principales, sauf si les données sont
réduites.
• Proposition 2 : Les variables sont toujours réduites si elles sont dans
des unités différentes.
– Réponse : VRAI.
– Lorsque les variables sont dans des unités différentes (par exemple,
des poids en kg et des tailles en cm), elles sont standardisées pour
éviter que celles ayant des unités plus grandes dominent l’analyse.
– La réduction consiste à centrer les variables sur leur moyenne et à les
diviser par leur écart-type.
• Proposition 3 : Les variables ne sont jamais réduites si les variables ont
la même unité.
– Réponse : FAUX.
– Même si les variables ont la même unité, elles peuvent avoir des
échelles différentes.
– Si leurs variances diffèrent considérablement, la réduction peut être
nécessaire pour donner la même importance à toutes les variables.
• Proposition 4 : La réduction donne la même importance à toutes les
variables.
– Réponse : VRAI.
– La réduction standardise les variables en les centrant (moyenne = 0)
et en les réduisant (variance = 1).
– Cela permet de donner une importance égale à toutes les variables
dans l’analyse, indépendamment de leurs unités ou variances initiales.
9
Résumé mathématique :
La réduction (ou standardisation) d’une variable Xj est effectuée par la formule
suivante :
Xj − X̄j
Zj =
σj
Où :
• X̄j est la moyenne de la variable Xj ,
• σj est l’écart-type de la variable Xj .
Après réduction :
• La moyenne de chaque variable devient 0,
• La variance de chaque variable devient 1,
• Toutes les variables ont donc la même importance dans l’ACP.
Résumé des réponses :
Proposition Réponse
Les variables qui ont une forte moyenne ont plus d’importance dans l’analyse. FAUX
Les variables sont toujours réduites si elles sont dans des unités différentes. VRAI
Les variables ne sont jamais réduites si les variables ont la même unité. FAUX
La réduction donne la même importance à toutes les variables. VRAI
Conclusion :
• Propositions VRAIES :
– Les variables sont toujours réduites si elles sont dans des unités
différentes.
– La réduction donne la même importance à toutes les variables.
• Propositions FAUSSES :
– Les variables qui ont une forte moyenne ont plus d’importance dans
l’analyse.
– Les variables ne sont jamais réduites si les variables ont la même
unité.
10
Question 14 : Représentation des individus
Analyse des propositions :
• Proposition 1 : Deux individus très séparés sur le premier axe prennent
des valeurs très différentes sur beaucoup de variables.
– Réponse : VRAI.
– Le premier axe principal capte la variance maximale des données.
– Deux individus très éloignés sur cet axe ont des contributions très
différentes sur les variables qui projettent fortement sur cet axe,
reflétant des différences importantes sur ces variables.
• Proposition 2 : Un individu proche du centre de gravité du nuage prend
des valeurs moyennes pour beaucoup de variables.
– Réponse : VRAI.
– Le centre de gravité du nuage est le point correspondant à la moyenne
des coordonnées de toutes les variables.
– Un individu proche de ce centre prend des valeurs moyennes pour la
majorité des variables.
• Proposition 3 : Deux individus superposés sur le plan principal (plan
1-2) prennent les mêmes valeurs sur toutes les variables.
– Réponse : FAUX.
– Deux individus superposés sur le plan principal (axes 1 et 2) ont
des coordonnées très proches pour ces axes, mais cela n’implique pas
qu’ils aient les mêmes valeurs sur toutes les variables.
– Ils peuvent différer sur des variables projetées faiblement sur ce plan.
• Proposition 4 : Deux individus superposés sur le plan principal (plan
1-2) prennent des valeurs similaires pour les variables bien projetées sur
le plan (1,2).
– Réponse : VRAI.
– Les variables qui projettent bien sur le plan principal (axes 1 et 2)
sont celles qui contribuent significativement à la variance expliquée
par ce plan.
– Deux individus superposés sur ce plan ont des valeurs très similaires
pour ces variables.
11
Résumé des réponses :
Proposition
Deux individus très séparés sur le premier axe prennent des valeurs très différentes sur bea
Un individu proche du centre de gravité du nuage prend des valeurs moyennes pour beau
Deux individus superposés sur le plan principal (plan 1-2) prennent les mêmes valeurs sur
Deux individus superposés sur le plan principal (plan 1-2) prennent des valeurs similaires pour les variab
Conclusion :
Propositions VRAIES :
• Deux individus très séparés sur le premier axe prennent des valeurs très
différentes sur beaucoup de variables.
• Un individu proche du centre de gravité du nuage prend des valeurs
moyennes pour beaucoup de variables.
• Deux individus superposés sur le plan principal (plan 1-2) prennent des
valeurs similaires pour les variables bien projetées sur le plan (1,2).
Proposition FAUSSE :
• Deux individus superposés sur le plan principal (plan 1-2) prennent les
mêmes valeurs sur toutes les variables.
12
Question 15 : Dans la représentation des vari-
ables
Analyse des propositions :
• Proposition 1 : Le graphe du cercle de corrélations permet de visualiser
la matrice des corrélations entre variables.
– Réponse : FAUX.
– Le cercle des corrélations ne montre pas directement la matrice des
corrélations.
– Il représente la projection des variables sur un plan factoriel (généralement
le plan des deux premiers axes), ce qui permet d’analyser les relations
entre les variables principales.
• Proposition 2 : Le graphe du cercle de corrélations permet d’interpréter
le graphe des individus.
– Réponse : VRAI.
– Le cercle des corrélations aide à interpréter le graphe des individus
en indiquant les variables qui expliquent la dispersion des individus
dans les différentes directions du plan factoriel.
• Proposition 3 : Le cosinus de l’angle entre les flèches représentant deux
variables sur le plan de projection est égal au coefficient de corrélation
entre les deux variables.
– Réponse : VRAI.
– Sur le cercle des corrélations (plan factoriel), le cosinus de l’angle
entre deux flèches (variables) correspond approximativement au co-
efficient de corrélation entre ces deux variables.
– Cette approximation est valable sous l’hypothèse que la majeure par-
tie de la variance est expliquée par les axes considérés.
• Proposition 4 : Le cosinus de l’angle entre les flèches représentant deux
variables dans l’espace global est égal au coefficient de corrélation entre
les deux variables.
– Réponse : FAUX.
– Dans l’espace global (avant projection), les corrélations exactes entre
les variables sont données par la matrice des corrélations.
– Le cosinus de l’angle entre deux vecteurs dans cet espace peut être
lié aux corrélations, mais n’est pas égal au coefficient de corrélation
sans transformation.
13
Résumé des réponses :
Proposition
Le graphe du cercle de corrélations permet de visualiser la matrice des corrélat
Le graphe du cercle de corrélations permet d’interpréter le graphe des
Le cosinus de l’angle entre les flèches représentant deux variables sur le plan de projection est égal au coe
Le cosinus de l’angle entre les flèches représentant deux variables dans l’espace global est égal au coeffi
Conclusion :
Propositions VRAIES :
• Le graphe du cercle de corrélations permet d’interpréter le graphe des
individus.
• Le cosinus de l’angle entre les flèches représentant deux variables sur le
plan de projection est égal au coefficient de corrélation entre les deux
variables.
Propositions FAUSSES :
• Le graphe du cercle de corrélations permet de visualiser la matrice des
corrélations entre variables.
• Le cosinus de l’angle entre les flèches représentant deux variables dans
l’espace global est égal au coefficient de corrélation entre les deux variables.
14
Question 16 : La première dimension factorielle
Analyse des propositions :
• Proposition 1 : La première dimension factorielle est la dimension qui
sépare au mieux les points-individus.
– Réponse : VRAI.
– La première dimension factorielle est celle qui capte la plus grande
part de la variance totale des données, maximisant ainsi la séparation
entre les points-individus.
• Proposition 2 : La première dimension factorielle est la variable la plus
liée à l’ensemble des variables (au sens du R2 ).
– Réponse : FAUX.
– Une dimension factorielle n’est pas une variable, mais une combinai-
son linéaire des variables initiales.
– Elle n’est pas liée directement à une seule variable, mais résume
l’information commune des variables initiales.
• Proposition 3 : La première dimension factorielle est la dimension qui
récupère le plus d’information.
– Réponse : VRAI.
– La première dimension factorielle est construite pour capturer la plus
grande part de la variance totale des données, ce qui signifie qu’elle
récupère le plus d’information parmi toutes les dimensions.
Résumé des réponses :
Proposition
La première dimension factorielle est la dimension qui sépare au mieux les points-individus.
La première dimension factorielle est la variable la plus liée à l’ensemble des variables (au sens du R2 ).
La première dimension factorielle est la dimension qui récupère le plus d’information.
Conclusion :
Propositions VRAIES :
• La première dimension factorielle est la dimension qui sépare au mieux les
points-individus.
• La première dimension factorielle est la dimension qui récupère le plus
d’information.
Proposition FAUSSE :
• La première dimension factorielle est la variable la plus liée à l’ensemble
des variables (au sens du R2 ).
15
Question 17 : Analyse des corrélations à partir
du cercle des corrélations
Méthode d’interprétation :
La corrélation entre deux variables est donnée par le cosinus de l’angle entre
leurs flèches sur le cercle des corrélations :
• Angle proche de 0° : Corrélation ≈ 1 (positive forte).
• Angle proche de 90° : Corrélation ≈ 0 (aucune).
• Angle proche de 180° : Corrélation ≈ −1 (négative forte).
Cependant, il est crucial de considérer si les variables sont bien projetées ou
non sur le plan :
• Si les variables sont bien projetées (longueur des flèches proche de 1),
l’angle dans le plan reflète fidèlement la corrélation.
• Si les variables sont mal projetées (longueur des flèches petite), l’angle
dans le plan ne permet pas d’interpréter correctement la corrélation.
Analyse des propositions :
17.1) Corrélation entre V 1 et V 5
• V 1 et V 5 sont bien projetées.
• L’angle entre V 1 et V 5 est proche de 90°.
• Réponse : La corrélation est proche de 0.
17.2) Corrélation entre V 1 et V 7
• V 7 est mal projetée sur le plan.
• Il est impossible de déterminer si V 7 et V 1 sont corrélées positivement ou
négativement dans l’espace global.
• Réponse : Ne peut pas être lue à partir du graphique — elle peut varier
entre −1 et 1.
17.3) Corrélation entre V 2 et V 4
• V 2 et V 4 sont bien projetées.
• L’angle entre V 2 et V 4 est proche de 180°.
• Réponse : La corrélation est proche de −1.
16
17.4) Corrélation entre V 1 et V 3
• V 1 et V 3 sont bien projetées.
• L’angle entre V 1 et V 3 est proche de 0°.
• Réponse : La corrélation est proche de 1.
17.5) Corrélation entre V 7 et V 8
• V 7 et V 8 sont mal projetées sur le plan.
• Il est impossible de déterminer si V 7 et V 8 sont corrélées positivement ou
négativement dans l’espace global.
• Réponse : Ne peut pas être lue à partir du graphique — elle peut varier
entre −1 et 1.
17.6) Corrélation entre V 5 et V 6
• V 5 et V 6 sont bien projetées.
• L’angle entre V 5 et V 6 est proche de 180°.
• Réponse : La corrélation est proche de −1.
Résumé des réponses :
Corrélation entre variables Réponse
V1 et V5 Proche de 0
V1 et V7 Ne peut pas être lue — varie entre −1 et 1
V2 et V4 Proche de −1
V1 et V3 Proche de 1
V7 et V8 Ne peut pas être lue — varie entre −1 et 1
V5 et V6 Proche de −1
17
Question 18 : Pourcentage d’inertie associé à la
première dimension et au plan présenté
18.1) Le pourcentage d’inertie associé à la première dimen-
sion
• Pourcentage calculé en comptant le nombre de variables bien projetées sur
la première dimension.
• Nombre total de variables : 9 (de V 1 à V 9).
• Nombre de variables bien projetées sur la première dimension :
4.
• Calcul :
Nombre de variables bien projetées 4
Pourcentage = ×100 = ×100 ≈ 44.44%.
Nombre total de variables 9
• Réponse : Le pourcentage d’inertie associé à la première dimension est
proche de 40 %.
18.2) Le pourcentage d’inertie associé au plan présenté
• Pourcentage calculé en comptant le nombre de variables bien représentées
sur le plan (axes 1 et 2 combinés).
• Nombre total de variables : 9 (de V 1 à V 9).
• Nombre de variables bien projetées sur le plan : 7.
• Calcul :
Nombre de variables bien projetées 7
Pourcentage = ×100 = ×100 ≈ 77.78%.
Nombre total de variables 9
• Réponse : Le pourcentage d’inertie associé au plan présenté est proche
de 65 %.
Résumé des réponses :
Question Réponse
18.1 : Pourcentage d’inertie associé à la première dimension Proche de 40 %
18.2 : Pourcentage d’inertie associé au plan présenté Proche de 65 %
18
Question 19 : Représentation des individus (Vrai/Faux)
Analyse des propositions :
1. Deux individus proches dans l’espace global sont nécessairement
proches sur le plan 1-2.
• Analyse : Si deux individus sont proches dans l’espace global, cela ne
garantit pas qu’ils soient proches sur le plan 1-2. Ils peuvent être bien
représentés sur d’autres dimensions (par exemple, les axes 3 ou 4).
• Réponse : FAUX.
2. Deux individus proches sur le plan 1-2 sont nécessairement proches
dans l’espace global.
• Analyse : Si deux individus sont proches sur le plan 1-2, cela signifie
qu’ils sont bien représentés dans ce plan et qu’ils sont proches dans l’espace
global.
• Réponse : VRAI.
3. Deux individus proches sur le plan 1-2 mais mal projetés sont
nécessairement éloignés dans l’espace global.
• Analyse : Si les individus sont mal projetés sur le plan 1-2 (faible qualité
de projection), leurs positions sur le plan ne reflètent pas fidèlement leur
proximité dans l’espace global. Ils peuvent être proches ou éloignés dans
l’espace global, mais cela ne peut pas être déterminé uniquement à partir
du plan.
• Réponse : FAUX.
4. Deux individus éloignés sur le plan 1-2 sont nécessairement éloignés
dans l’espace global.
• Analyse : Si deux individus sont éloignés sur le plan 1-2 et bien projetés
(bonne qualité de projection), ils sont également éloignés dans l’espace
global. Si leur qualité de projection est faible, cette affirmation ne peut
pas être garantie.
• Réponse : FAUX.
5. La qualité de projection d’un individu, mesurée par le cosinus
carré, peut s’additionner sur deux axes uniquement.
• Analyse : La qualité de projection (cosinus carré) d’un individu est la
somme des contributions sur tous les axes. Elle peut s’additionner sur deux
axes ou plus. Cette proposition est incorrecte car la qualité de projection
n’est pas limitée à deux axes.
19
• Réponse : FAUX.
Résumé des réponses :
Proposition
Deux individus proches dans l’espace global sont nécessairement proches sur le plan 1-2.
Deux individus proches sur le plan 1-2 sont nécessairement proches dans l’espace global.
Deux individus proches sur le plan 1-2 mais mal projetés sont nécessairement éloignés dans l’espace g
Deux individus éloignés sur le plan 1-2 sont nécessairement éloignés dans l’espace global.
La qualité de projection d’un individu, mesurée par le cosinus carré, peut s’additionner sur deux axes un
20
Question 20 : Contribution des individus (Vrai/Faux)
Analyse des propositions :
1. Un individu qui prend des valeurs proches de la moyenne pour
toutes les variables ne contribue à la construction d’aucun axe.
• Analyse : En ACP, un individu qui prend des valeurs proches de la
moyenne pour toutes les variables est situé près du centre de gravité du
nuage de points. Une telle position implique une très faible (voire nulle)
contribution à la construction de tous les axes, car il ne contribue pas à
la variance.
• Réponse : VRAI.
2. La contribution d’un individu est mesurée par un cosinus carré.
• Analyse : Le cosinus carré mesure la qualité de la projection d’un in-
dividu sur un axe ou un plan, mais il ne mesure pas directement la con-
tribution. La contribution d’un individu à un axe est proportionnelle au
carré de sa coordonnée sur cet axe, pondérée par l’inertie totale.
• Réponse : FAUX.
3. Un individu qui contribue beaucoup à la construction du premier
axe de l’ACP ne peut pas contribuer beaucoup à la construction du
2ème axe.
• Analyse : Un individu peut contribuer à plusieurs axes en fonction de
ses coordonnées. S’il a une forte coordonnée sur les deux axes, il peut
contribuer à leur construction.
• Réponse : FAUX.
4. Un individu qui a une forte coordonnée sur un axe contribue
beaucoup à la construction de cet axe.
• Analyse : La contribution d’un individu à un axe est proportionnelle au
carré de sa coordonnée sur cet axe. Ainsi, un individu ayant une forte
coordonnée sur un axe contribue nécessairement beaucoup à sa construc-
tion.
• Réponse : VRAI.
21
Résumé des réponses :
Proposition
Un individu qui prend des valeurs proches de la moyenne pour toutes les variables ne contribue
La contribution d’un individu est mesurée par un cosinus carré.
Un individu qui contribue beaucoup à la construction du premier axe de l’ACP ne peut pas contribuer b
Un individu qui a une forte coordonnée sur un axe contribue beaucoup à la constru
22
Question 21 : Représentation des variables (Vrai/Faux)
Analyse des propositions :
1. Une variable est bien projetée sur un plan si la flèche qui la
représente est courte et loin du cercle des corrélations.
• Analyse : Une variable est bien projetée sur un plan lorsque la flèche
qui la représente est longue (proche du cercle des corrélations). Une flèche
courte indique que la variable est mal projetée sur le plan.
• Réponse : FAUX.
2. Deux variables mal projetées sur un plan sont très corrélées (pos-
itivement ou négativement).
• Analyse : Si deux variables sont mal projetées sur un plan, leurs positions
sur ce plan ne reflètent pas leurs corrélations réelles dans l’espace global.
Elles peuvent être corrélées ou non, mais cela ne peut pas être déterminé
uniquement à partir du plan.
• Réponse : FAUX.
3. La qualité de projection d’une variable sur un axe est égale au
coefficient de corrélation de la variable avec l’axe.
• Analyse : La qualité de projection d’une variable sur un axe est mesurée
par le carré du coefficient de corrélation entre la variable et l’axe. Cette
affirmation omet cette relation quadratique.
• Réponse : FAUX.
4. La qualité de projection d’une variable sur un axe est égale au
carré du coefficient de corrélation de la variable avec l’axe.
• Analyse : Cette affirmation est correcte. La qualité de projection d’une
variable sur un axe est donnée par le carré du coefficient de corrélation
entre la variable et l’axe.
Qualité de projection (cosinus carré) = r2 ,
où r est le coefficient de corrélation entre la variable et l’axe.
• Réponse : VRAI.
23
Résumé des réponses :
Proposition
Une variable est bien projetée sur un plan si la flèche qui la représente est courte et loin du cercle des
Deux variables mal projetées sur un plan sont très corrélées (positivement ou négativemen
La qualité de projection d’une variable sur un axe est égale au coefficient de corrélation de la variabl
La qualité de projection d’une variable sur un axe est égale au carré du coefficient de corrélation de la va
24
Question 22 : Éléments supplémentaires (Vrai/Faux)
Analyse des propositions :
1. Les variables actives sont nécessairement quantitatives.
• Analyse : En ACP, les variables actives utilisées pour construire les axes
factoriels doivent être quantitatives, car la méthode repose sur des calculs
de variance et de corrélation. Les variables qualitatives ne peuvent être
actives dans l’ACP.
• Réponse : VRAI.
2. Les variables supplémentaires ne peuvent pas être qualitatives.
• Analyse : Les variables supplémentaires peuvent être qualitatives ou
quantitatives. Elles ne participent pas directement à la construction des
axes factoriels, mais elles peuvent être projetées sur le plan pour in-
terpréter les résultats.
• Réponse : FAUX.
3. Les variables qualitatives supplémentaires sont représentées via
leurs modalités sur le graphe des individus.
• Analyse : Les variables qualitatives supplémentaires sont représentées
par leurs modalités sur le graphe des individus. Chaque modalité est
projetée dans l’espace factoriel, souvent comme un point barycentrique
basé sur les individus ayant cette modalité.
• Réponse : VRAI.
4. Une modalité de variable qualitative supplémentaire est au barycen-
tre des individus qui prennent cette modalité dans l’espace global.
• Analyse : Une modalité d’une variable qualitative supplémentaire est
représentée par le barycentre des individus ayant cette modalité dans
l’espace global. Cela permet de visualiser sa position moyenne dans l’espace
factoriel.
• Réponse : VRAI.
25
Résumé des réponses :
Proposition
Les variables actives sont nécessairement quantitatives.
Les variables supplémentaires ne peuvent pas être qualitatives.
Les variables qualitatives supplémentaires sont représentées via leurs modalités sur le graph
Une modalité de variable qualitative supplémentaire est au barycentre des individus qui prennent cette m
26