0% ont trouvé ce document utile (0 vote)
46 vues17 pages

Cours ACP Chapitre 5 Final

L'Analyse en Composantes Principales (ACP) est une méthode statistique utilisée pour réduire la dimensionnalité des données tout en conservant l'essentiel de l'information. Elle permet de résumer les relations entre les variables à l'aide de facteurs synthétiques, facilitant ainsi l'interprétation des données complexes. L'ACP est largement utilisée pour visualiser des données multidimensionnelles et identifier des patterns au sein d'un ensemble de données.

Transféré par

hajar khindouf
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
46 vues17 pages

Cours ACP Chapitre 5 Final

L'Analyse en Composantes Principales (ACP) est une méthode statistique utilisée pour réduire la dimensionnalité des données tout en conservant l'essentiel de l'information. Elle permet de résumer les relations entre les variables à l'aide de facteurs synthétiques, facilitant ainsi l'interprétation des données complexes. L'ACP est largement utilisée pour visualiser des données multidimensionnelles et identifier des patterns au sein d'un ensemble de données.

Transféré par

hajar khindouf
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

10/01/2025

Statistiques et
Analyse de Données
Chapitre V :
L’Analyse en Composantes Principales
Prof. BARAKA Achraf Chakir
[Link]@[Link]

1 2

Problématique
• Tirer des conclusions à partir d’un tableau de cinq lignes
individus et deux colonnes variables est un exercice simple.
• Mais lorsque le tableau a 1000 lignes et 50 colonnes, les
choses deviennent plus complexes.
Introduction • Les méthodes d’analyses factorielles (tels que ACP)
permettent une représentation plus accessible de la
structure des données en ne retenant que l’essentiel de
l’information.

3 4

Généralités Définition
• L’ACP ou l’Analyse Factorielle en Composante Principale fait • C’est une technique exploratoire pour résumer les relations entre
partie des analyses descriptives multivariées. les variables à l’aide d’un jeu des facteurs aussi réduit que
possible.
• Historiquement, il s’agit de l’un des plus anciennes • Outre l’aspect réduction des données, ces facteurs sont sensés
méthodes d’analyse de données. Mais les applications discriminer les données de manière à être facilement
informatiques ont considérablement modifié les conditions interprétable.
et modalités d’application, en rendant notamment possible • L’ACP est une technique statistique dont le but est de représenter
le traitement d’un très grand nombre de données. C’est enfin les relations qui lient les variables à travers des valeurs prises par
la méthode la plus connue et la plus utilisée. les individus.
• L’ACP est un cas particulier de l’analyse factorielle (AF). • Donc l’aspect de l’étude est de résumer l’ensemble des variables
en un petit nombre de variables synthétiques appelées facteurs.

5 6

1
10/01/2025

Définition Définition
• Mathématiquement, on obtiendrait le
• Tout cela est réalisé par la projection de notre dataset
meilleur ajustement du nuage par des sous-
initiale dans un espace réduit.
espaces vectoriels.
• La projection, c’est la fonction qui permet de représenter des
• Algébriquement, il s’agit de chercher les
points dans un espace plus petit impliquant une perte
valeurs propres maximales de la matrice des
d’information.
données et par conséquent ses vecteurs propres
• Pour minimiser la perte : associes qui représenteront ces sous-espaces
– Maximiser la variance de nos projections. vectoriels (axes factoriels ou principales).
– Minimiser la distance entre nos données et nos projections. • Géométriquement, on représente le tableau
comme un nuage de points.

8 10

Définition

• Lors de la projection, le nuage peut


être déformé est donc serait diffèrent
du réel, alors les méthodes
d’ajustement consistent en minimiser
cette possible déformation et ce en Présentation du cadre théorique
maximisant les distances projetées.

11 13

Présentation du cadre théorique Présentation du cadre théorique

14 15

2
10/01/2025

Présentation du cadre théorique Présentation du cadre théorique

16 17

Présentation du cadre théorique Présentation du cadre théorique

18 19

 Objectifs de l’analyse
 Variables de l’analyse

Procédure Formuler le problème

Echelle
Taille de
l’échantillon

Lancer l’ACP Saisie des données

Calcul la matrice de corrélations et vérifier si les données  Test KMO


Application de l’ACP sur les indicateurs de l’efficacité sont-elles factorisables  Test Bartlett

des dépenses publiques


Extraire les facteurs et déterminer leur nombre • Variance totale expliquée

Interpréterles facteurs

 Matrice de composantes et Matrices des


composantes après rotation
 Diagramme de composantes dans l’espace
20 après rotation 21

3
10/01/2025

Application de l’ACP Application de l’ACP


Sens de la
La liste des Pays
Domaine Indicateurs contribution
AFRIQUE SUD à l'indicateur global
JORDANIE
Taux d’emploi des jeunes +
TUNISIE Education
Taux de chômage des jeunes -
COREE SUD
Espérance de vie +
CHILI
Santé Nombre de lits d’hôpital par 10 000 habitants +
EGYPTE
Nombre de médecins par 10 000 habitants +
TURQUIE
Nombre de meurtres par 10 000 habitants -
IRAN Sécurité Nombre de détenus par 100 000 habitants -
MAROC La part des dépenses militaires dans le PIB +
L’ALGERIE R&D publique % PIB +
Innovation
PEROU Nombre brevets triadiques % population +
MALAISIE
Pauvreté Pourcentage de la population vivant avec au moins 2 dollar par jour -
MEXIQUE
BREZIL Marché du travail Taux d emploi +

Tableau: Tableau des indicateurs utilisés

22 23

Application de l’ACP Application de l’ACP


La variance totale expliquée
Matrice de corrélation
Valeurs propres initiales

TEJ TCJ EV NLH NMH NMEURT DMIL NDETENUS R et D NBREVET PAUVRET TE Composante Total % de la variance % cumulés
1 4,109 34,246 34,246
TEJ 1 -0,761 -0,17 -0,055 -0,146 0,787 -0,411 0,125 0,156 0,61 0,192 0,88

TCJ -0,761 1 -0,183 0,228 0,009 -0,539 0,541 -0,041 0,289 -0,136 0,277 -0,84 2 2,369 19,745 53,991
EV -0,17 -0,183 1 0,289 0,141 -0,001 -0,415 0,562 0 -0,192 -0,3 0,122
3 2,023 16,858 70,849
NLH -0,055 0,228 0,289 1 0,148 0,278 -0,292 0,087 0,578 0,533 -0,184 -0,075
4 1,610 13,417 84,265
NMH -0,146 0,009 0,141 0,148 1 0,177 -0,117 -0,266 -0,358 0,065 -0,25 -0,158
Corrélation

5 ,802 6,679 90,945


NMEURT 0,787 -0,539 -0,001 0,278 0,177 1 -0,491 0,169 0,187 0,8 -0,001 0,74

6 ,442 3,679 94,624


DMIL -0,411 0,541 -0,415 -0,292 -0,117 -0,491 1 -0,257 -0,003 -0,194 0,329 -0,442

7 ,354 2,950 97,574


NDETENUS 0,125 -0,041 0,562 0,087 -0,266 0,169 -0,257 1 0,547 0,163 0,201 0,24

RetD 0,156 0,289 0 0,578 -0,358 0,187 -0,003 0,547 1 0,574 0,285 -0,021
8 ,194 1,619 99,193

NBREVET 0,61 -0,136 -0,192 0,533 0,065 0,8 -0,194 0,163 0,574 1 0,11 0,476 9 ,064 ,532 99,725

PAUVRET 0,192 0,277 -0,3 -0,184 -0,25 -0,001 0,329 0,201 0,285 0,11 1 0,065 10 ,033 ,275 100,000

TE 0,88 -0,84 0,122 -0,075 -0,158 0,74 -0,442 0,24 -0,021 0,476 0,065 1 11 1,175E-16 9,791E-16 100,000

12 -1,842E-16 -1,535E-15 100,000

24 25

Application de l’ACP Application de l’ACP


La matrice des composantes
Matrice des composantes

Composante

1 2 3 4
NMEURT 0,902 0,023 -0,041 0,292

TEJ 0,896 -0,121 -0,385 -0,006

TE 0,889 -0,252 -0,195 -0,189

TCJ -0,729 0,608 0,018 0,178

NBREVET 0,713 0,475 -0,124 0,446

DMIL -0,629 0,201 -0,505 0,071

R et D 0,265 0,915 0,01 -0,073

NLH 0,243 0,59 0,535 0,418

EV 0,151 -0,025 0,807 -0,448

PAUVRET -0,013 0,417 -0,629 -0,232

NDETENUS 0,336 0,459 0,274 -0,675

NMH -0,039 -0,289 0,396 0,602

Figure : Le graphique des valeurs propres


26 27

4
10/01/2025

Application de l’ACP Application de l’ACP


Représentation graphique des pays dans le plan factoriel (F1,F2)

Observations (axes F1 et F2 : 57,40 %)


6

Corée Sud
Afrique Sud
4

F2 (24,20 %)
Tunisie
Brésil Iran
0
Algérie
Chili
Turquie Maroc
Jordanie
Pérou Syrie
Malaisie Egypte
-2 Mexique

-4

-6
-8 -6 -4 -2 0 2 4 6 8

F1 (33,20 %)

Figure : La représentation graphique des pays sur le plan Factoriel (F1, F2)
Figure : Représentation graphique des indicateurs dans le plan factoriel (F1, F2)

28 29

Application de l’ACP

• Maroc, Algérie, Iran, Chili, Turquie, Egypte, Jordanie


Classe 1

• Malaisie, Mexique, Pérou, Brésil


Classe 2

Classe 3
• Corée de Sud Objectifs
• Afrique du Sud
Classe 4

30 31

ACP Objectifs
• L’algorithme de l’ACP effectue sur la matrice • L’ACP manipule les individus ainsi que les variables dont ils
individus/variables différentes opérations (centrage- sont abordés différemment :
réduction des données, extraction de valeurs propres et de
vecteurs propres…), en vue de passer du nombre de variables – On examine les variables à travers les corrélations qui les
initial à un petit nombre de variables obtenues par relient positivement ou négativement.
combinaison des premières. – On examine les individus selon leurs ressemblances ou
• Ces nouvelles composantes forment les axes du mapping. La leurs dissemblances afin de déterminer une typologie.
première composante est celle qui résume le mieux les – On cherche à relier les deux points de vue en
informations contenues dans le tableau. La deuxième
apporte un pourcentage inférieur mais complémentaire caractérisant les classes d’individus par des variables et
d’information, et ainsi de suite. groupe.

32 34

5
10/01/2025

ACP Objectifs
• Les variables sont représentées sur le mapping. • Visualiser des données multidimensionnelles en 2 ou 3
• Les axes du mapping ne correspondent généralement pas à dimensions.
l’une ou l’autre des variables mais à un regroupement • Décorréler les variables : l’ACP génère de nouvelles
optimal de plusieurs variables (ex : revenu et niveau variables non corrélées.
d’études peuvent participer ensemble à la formation d’un
axe dans la mesure où elles peuvent être fortement • Débruiter les données.
corrélées).
• Effectuer une réduction de dimension des données.
• Le tableau de départ de l’ACP comporte les individus en
ligne et les variables en colonne, avec, dans chaque case, la
réponse numérique de l’individu à la question
correspondante.

35 36

ACP Méthode d’analyse


descriptive multidimensionnelle
est

Méthode Factorielle
Recherche
Conditions et Procédure
Facteurs
qui remplacent les variables initiales

Réduit

Nombre données
en déformant le moins
possible la réalité 38

 Objectifs de l’analyse
 Variables de l’analyse

Conditions d’utilisation Procédure Formuler le problème

Echelle
Taille de
l’échantillon

• L’analyse en composantes principales est fondée sur le calcul des Lancer l’ACP Saisie des données
moyennes, variances et coefficients de corrélation.
• Les données doivent donc être quantitatives : elles peuvent être Calcul la matrice de corrélations et vérifiersi les données  Test KMO
sont-elles factorisables  Test Bartlett
discrètes ou ordinales.
• Les questions qualitatives ordinales, peuvent être recodifiées
Extraire les facteurs et déterminer leur nombre • Variance totale expliquée
pour entrer dans le tableau de l’ACP.
• Cette recodification doit être généralement préparée à l’avance.
• Toutefois, certains logiciels d’analyse permettent de réaliser cette Interpréterles facteurs
recodification en direct, lors du choix des variables à faire entrer
dans l’ACP.
 Matrice de composantes et Matrices des
composantes après rotation
 Diagramme de composantes dans l’espace
39 après rotation 40

6
10/01/2025

41 42

43 44

Test KMO Test de Sphéricité de Bartlett


• Le test de Kaiser-Meyer-Olkin est une mesure généralisée de la • Le test de sphéricité de Bartlett, « permet de juger de l’inégalité
corrélation partielle entre les variables de l’analyse. des racines latentes, c’est-à-dire de l’absence significative de
sphéricité du modèle mentionné. Si le modèle s’avère
sphérique, on peut résumer que les corrélations entre les variables
• L’Indice KMO varie entre 0 et 1 et donne un aperçu global de la qualité des sont voisines de zéro et donc qu’il n’y a pas intérêt à remplacer les
corrélations à l’examen de la matrice de corrélation. variables par des composantes. »
.
• Cette mesure indique si la matrice de corrélation est une matrice
identité à l'intérieur de laquelle toutes les corrélations sont égales à
zéro. c. à. d. vérifier si les données devraient être adaptées à la
réduction desdonnées.

45 46

7
10/01/2025

Test de Sphéricité de Bartlett Procédure


Etape 1 – Centrer Réduire
• Dans ce test, on doit considérer seulement la signification du test.
• Cette étape aussi appelée « Standarisation » permet de
• La valeur observée doit être inférieure ou égale à 0,05. mettre à la même échelle les valeurs des différentes variables
qui composent notre dataset.
• Pour que nous puissions rejeter l'hypothèse nulle voulant qu'il • Mathématiquement, cette opération se réalise en
soustrayant la moyenne et en divisant par l’écart type pour
s'agisse d'une matrice identité qui signifie que toutes les variables
chaque valeur de chaque variable :
sont parfaitement indépendantes les unes des autres.

47 48

Procédure Procédure
Etape 2 - Matrice de Covariance Etape 3 – Calcule des vecteurs et valeurs propres
• La seconde étape est de calculer la matrice de covariance. La • Ils permettent de déterminer les composantes principales de
matrice de covariance permet de détecter les variables qui notre dataset.
sont fortement liées ou pas. • Les vecteurs propres forment une base orthonormale de
notre dataset et une des propriétés intéressante, c’est que
• La covariance est calculée sur chaque paire des variables leur direction reste inchangée quelque soit la
contenues dans notre dataset. L’algorithme peut grâce à transformation qu’ils subissent.
cette étape savoir quelle variable réduire sans perdre trop
d’information : • Les vecteurs propres déterminent la direction de notre
nouvel espace et les valeurs propres la quantité
d’information (variance) retenues par les vecteurs propres.

49 50

Procédure
Etape 4 – Trie des valeurs propres et projection
• Pour appliquer notre projection sur notre nouvel espace
réduit, on doit décider quels vecteurs propres garder et lesquelles
on doit mettre de côté.
• Pour cela, on inspecte les différentes valeurs propres associés, on
les trie dans l’ordre décroissant. Les valeurs propres les plus
grandes retiennent le plus d’information. On sélectionne alors
Exemple Illustratif
les k vecteurs propres liées au k valeurs propres les plus grandes.
L’objectif étant de minimiser le nombre de dimensions tout en
essayant de maximiser la variance.
• On peut maintenant transformer notre dataset original à n
dimension dans notre nouvel espace à k dimension.

51 52

8
10/01/2025

Exemple illustratif Exemple illustratif


• Imaginons que nous avons des données d'expression de • Quand on applique l'ACP, la première étape consiste à normaliser les data
gènes : • La normalisation permet de ramener les niveaux d'expression de chaque
gène.

53 54

Exemple illustratif Exemple illustratif


• Ce qu'on voit sur la figure : Les moyennes d'expression de • L'écart-type de chaque distribution est égal à 1 :
chaque gène sont alignées à la même valeur, qui est égale à
zéro.

55 56

Exemple illustratif Exemple illustratif


• On remarque qu'on visualise mieux les données sous certains angles de vue, alors
• Puisque nous avons seulement trois variables les gènes A, B que sous d'autres angles de vue on voit moins bien.
et C, on peut afficher tous les points dans un graphique 3D. • Par exemple sur la première et la dernière figure les données sont visuellement
mieux représentées que sur la figure au centre. On voit mieux la répartition des
points.

57 58

9
10/01/2025

Exemple illustratif Exemple illustratif


• Si on tourne encore la figure, on peut peut-être • Pour trouver cette projection, l'ACP se base sur la variance.
trouver un meilleur angle de vue. par • Tout d'abord la méthode identifie l'axe selon lequel la variance
exemple, celui-ci => observée dans les données est maximale.
• Est ce que cet angle de vue permet de voir au
mieux les données ?
• C'est justement l‘ACP qui nous permet de
retrouver la projection avec la meilleure
représentation possible des données.

59 60

Exemple illustratif Exemple illustratif


• Cet axe représente la première composante principale de l'ACP • Ensuite, la méthode place un second axe dans la direction de
dessinée en flèche bleue sur la figure ci-dessous : la variance maximale, parmi les directions restantes, de telle
façon qu'il soit perpendiculaire au premier. C'est la
• Selon cet axe les données varient le plus. deuxième composante principale.

61 62

Exemple illustratif Exemple illustratif


• Et ainsi de suite, Le troisième axe est placé perpendiculaire aux deux axes • Par construction, la première composante explique le maximum de la variance
précédents. C'est la troisième composante principale. dans les données, ici 73% de la variance totale. Ensuite, la deuxième
composante explique 25% supplémentaires de la variance totale. Et finalement
• L'ACP identifie autant de composantes principales que de variables dans la troisième et dernière composante explique les 2% restants.
les données. Ici, nous avons 3 variables, donc 3 axes principales.
• Les trois composantes expliquent ainsi 100% de la variance totale.

63 64

10
10/01/2025

Exemple illustratif Exemple illustratif


• Si on prend la première et la deuxième composante • Cela nous permet de projeter les données en deux dimensions seulement
principale, ces ceux composantes ensemble expliquent 98% en conservant le maximum d'information possible sur les données.
de la variance totale, c.-à-d. que ces deux axes sont capables • On peut dire que ces axes nous indiquent le meilleur angle de vue sur les
de représenter quasiment la totalité des données. données.

65 66

Exemple illustratif Exemple illustratif


• Nous avons retrouvé le plan qui correspond à la variance maximale dans les
• Effectivement, en visualisant les données et nous avons projeté les données sur ce plan.
données dans le repère orthonormé
• Nous avons transformé les données multi-dimensions (trois dimensions dans
des deux composantes principales de notre exemple) en seulement deux dimensions.
l'ACP, nous avons une très bonne
représentation des points d'origine.

67 68

Exemple illustratif Exemple illustratif


• L'avantage de cette projection est de pouvoir visualiser les données sur une • Sur la figure à droite, nous avons perdu 2% d'information sur les données.
figure, avec le meilleur angle de vue possible.
• On ne voit pas tout mais on voit le maximum de ce qui est possible en réduisant
• Par contre, il y a un prix à payer. C'est la perte d'information. le champ de vision à deux dimensions.

69 70

11
10/01/2025

Exemple illustratif Exemple illustratif


• En faisant une ACP, on peut se poser la question comment • Il est assez courant de les représenter sur, ce qu'on
les axes initiaux, qui correspondent aux gènes A, B et C sont appelle, le cercle de corrélation. Il s'agit d'un cercle de taille 1
placés par rapport aux nouveaux axes des deux composantes où on place les variables initiales sous formes de flèches. La
principales. longueur des flèches peut être variable de 0 à 1.

71 72

Exemple illustratif Exemple illustratif


• On peut voir, par exemple, que la f lèche du gène B est presque parfaitement
• La projection de la flèche sur la composante principale alignée avec la première composante principale, seulement elle pointe dans le
correspond au coefficient de corrélation entre cette variable sens inverse. La projection de la flèche du gène B sur l'axe des abscisses est
et la composante de l'ACP. proche de -1. Cela veut dire que la variable "Gène B" est anticorrélée avec la
première composante principale. On peut interpréter les autres variables de la
même façon.

73 74

Exemple illustratif Exemple illustratif


• Le cercle de corrélation est pratique aussi pour retrouver visuellement les
• Le gène A et le gène C ne sont presque pas corrélés car l'angle entre ces
variables corrélées et non-corrélées.
• Par exemple, le gène A et le gène C ne sont presque pas corrélés. flèches est proche d'un angle droit.

75 76

12
10/01/2025

Exemple illustratif
• Soit un jeu de données avec les clients d'un
magasin décrit par trois variables en
colonne, leur type (Barbare, Géant, Alien), leur
poids total et la taille de leurs oreilles
Exemple Illustratif 2 • Supposons que nous voulons explorer les
données ? Quel serait le moyen le plus simple
de le faire ?

77 78

Exemple illustratif Exemple illustratif


• Un nuage de points peut être réalisé
avec le poids sur l'axe des X et la taille • Premièrement on peut dire que
des oreilles sur l'axe des Y en coloriant la taille des oreilles diminue
les points par type de clients. grossièrement avec le poids total.
• Une grande quantité d'informations
peut être extraite de ce graphique.

79 80

Exemple illustratif Exemple illustratif

• Deuxièmement les géants sont • Troisièmement les Aliens et les


plus lourds que les aliens et les barbares ont des oreilles de taille
barbares. équivalente légèrement que celle
des géants.

81 82

13
10/01/2025

Exemple illustratif Exemple illustratif


• Mais que faire si on veut analyser un jeu de données avec plus de trois
• Maintenant si on veut analyser un jeu variables quantitatives.
de données avec trois variables • On rajoute par exemple la taille totale et la pointure pour chaque client.
quantitatives.
• Un simple nuage de points en 3D bien
évidemment pourrait faire l'affaire.

83 84

Exemple illustratif Exemple illustratif


• Il faut tout simplement donc réaliser une ACP.
• Conceptuellement toutes les colonnes d'un jeu de données
contiennent de l'information potentiellement intéressantes.
• L'ACP crée un jeu de données artificiel avec un nombre de
dimensions égal à celui du premier, la seule différence est
que la première dimension de l'ACP concentre la majeure
partie de l'information.
• Dans le monde de l'ACP l'information est appelée inertie et
les dimensions sont appelés facteurs ou axes.

85 86

Exemple illustratif Exemple illustratif


• Après avoir réaliser une ACP sur notre exemple :
• Ci-dessous les deux graphiques importants dans l'ACP à interpréter : • Premièrement le Cercle des
corrélations, l'axe horizontal n'est
autre que la première dimension
de l'ACP.

87 88

14
10/01/2025

Exemple illustratif Exemple illustratif

• L'axe vertical est la deuxième dimension. • Chaque ligne orange représente une variable.
• Un axe séparé par un angle aigu sont des
variables corrélés positivement.
• Nous voyons par exemple que le poids et la
taille sont positivement liés.

89 90

Exemple illustratif Exemple illustratif

• Les angles droits reflète • Les grands angles représentent des


corrélations négatives.
l'indépendance, nous pouvons dire par
• La taille des oreilles est corrélé
exemple que la pointure n'est pas liée à négativement au poids total (déjà vu dans
la taille et au poids. le nuage de points).

91 92

Exemple illustratif Exemple illustratif


• Pour le deuxième graphique des « Observations » : • Le graphique des observations affiche
les différents individus sur les mêmes
dimensions d'ACP utilisé dans le cercle
des corrélations comme nous l'avons
déjà fait pour le nuage de points nous
avons colorer les points en fonction du
type d’individus.
• Le type d’individus dans ce contexte est
une variable dites supplémentaires.

93 94

15
10/01/2025

Exemple illustratif Exemple illustratif


• Il apparaît que les géants sont plutôt • Ils s'opposent aux Barbares et
localisés sur la droite cela veut dire aux Aliens plus maigre mais
que les géants sont plutôt lourd et muni d'oreilles plus grandes.
de grande taille.

95 96

Exemple illustratif Exemple illustratif


• Donc il fau procéder à une vérification parce que cela : soit
• Il est intéressant de noter c'est un cas à traiter comme il est, ou bien il s'agit peut-être
d'une erreur de saisie dans le tableau de données.
également l'excentricité de ce géant
"Xubgir" qui semble avoir une
pointure anormalement grande.

97 98

Exemple illustratif
• L'ACP nous a permis d'extraire rapidement une quantité
d'informations intéressantes à partir d'un jeu de données
multidimensionnelles grâce à deux graphiques simples.
Informations recueillies :
Poids corrélé positivement à taille. Récapitulation
Poids et taille oreilles corrélés négativement.
Barbares et Aliens plus petits que géants.
« Xugbir » avec des grands pieds.

99 100

16
10/01/2025

ACP – Avantages et Limites

Merci Pour votre attention

101 103

17

Vous aimerez peut-être aussi