0% ont trouvé ce document utile (0 vote)
51 vues68 pages

Cours Acp L3

Transféré par

sayoubasore500
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
51 vues68 pages

Cours Acp L3

Transféré par

sayoubasore500
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Exemple

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 2 / 56


Questions

1 Que peux t’on dire de particulier sur Nice ?


2 Grenoble et Lyon se ressemblent-ils ? Qu’est ce qui les caractérise ?
3 En quoi Lille et Nice sont di↵érents ?
4 Quelles sont les particularités de Brest ?
5 Y a t’il des villes qui se ressemblent ?
6 Quels mois sont liés ?

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 3 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 4 / 56


Contexte, données
Variables
1 ... k ... K
1 x11 ... x1k ... x1K

Individus i xi1 ... xik ... xiK

I xI 1 ... xIk ... xIK

Moy x1 ... xk ... xK


Ec. type 1 ... k ... K

I individus
K variables aléatoires quantitatives
Domaine de la statistique exploratoire multidimensionelle

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 5 / 56


Exemples

Université : note de l’étudiant i dans le module k


Écologie : concentration du polluant k dans la rivière i
Économie : valeur de l’indicateur k pour une année ou un pays i
Marketing : valeur de satisfaction k pour la marque i
Football : statistique k (possession, nb de tirs, etc...) de l’équipe i
Biologie : mesure k sur l’animal i
Météorologie : tempéature au mois k de la ville i

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 6 / 56


Exemple 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 7 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 9 / 56


Objectifs de l’ACP

2 axes d’étude
1 Étude des individus

I ressemblance/di↵érence entre individus


I caractérisation des individus
I visualisation synthétique des profils d’individus

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 10 / 56


Objectifs de l’ACP

2 axes d’étude
1 Étude des individus

I ressemblance/di↵érence entre individus


I caractérisation des individus
I visualisation synthétique des profils d’individus
2 Étude des variables
I liaisons entre variables : corrélations
I indicateur synthétique

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 10 / 56


Exemple 1
21

Marseille

Montpellier Nice
20

Bordeaux
19

Toulouse
Lyon
Température en Juin

18

Grenoble

Paris
Clermont
Strasbourg Nantes
Vichy
17

Rennes
16

Lille
15

Brest

1 2 3 4 5 6 7

Température en Janvier

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 11 / 56


Exemple 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 12 / 56


Principe de l’ACP en quelques mots

Transformer un grand nombre de variables corrélées en un plus petit


nombre de variables non corrélées, appelées composantes principales
Expliquer au mieux la variabilité des données à l’aide de ces
composantes
Trouver la meilleure projection pour compresser un ensemble
d’individus de grande dimension en un ensemble d’individus de
moindre dimension

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 13 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 18 / 56


Nuage Ni des individus

1 ... k ... K
1

i xi1 ... xik ... xiK

GI x1 ... xk ... xK

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56


Nuage Ni des individus

Espace des individus : RK

1 ... k ... K d2(Mi,Mj)


NI

1 Mj

Mi
GI
i xi1 ... xik ... xiK

I 0 k
xk xik

GI x1 ... xk ... xK

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56


Nuage Ni des individus

Espace des individus : RK

1 ... k ... K d2(Mi,Mj)


NI

1 Mj

Mi
GI
i xi1 ... xik ... xiK

I 0 k
xk xik

GI x1 ... xk ... xK

K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56


Nuage Ni des individus
Espace des individus : RK

1 ... k ... K d2(Mi,Mj)


NI

1 Mj

Mi
GI
i xi1 ... xik ... xiK

I 0 k
xk xik

GI x1 ... xk ... xK

K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1
On appele inertie du nuage :
I I K
1 X 2 1 XX PK
d (GI , Mi ) = (xik xk ) 2 = k=1
2
k ljbgfg
I I
i=1 i=1 k=1
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56
Nuage Ni des individus
Espace des individus : RK

1 ... k ... K d2(Mi,Mj)


NI

1 Mj

Mi
GI
i xi1 ... xik ... xiK

I 0 k
xk xik

GI x1 ... xk ... xK

K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1

On veut visualiser ce nuage, en avoir une image approchée respectant sa


forme, sa structure

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56


Centrage et réduction

Centrer ne modifie pas la forme du nuage : toujours centrer


NI

Mj

Mi
GI

xik xik xk
0 k
xk xik

L’origine est confondue avec le centre de gravité du nuage

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 20 / 56


Centrage et réduction

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 21 / 56


Centrage et réduction

Réduire les données est indispensable si les unités de mesure sont


di↵érentes d’une variable à l’autre
xik xk
xik
k
L’inertie d’un nuage de points centrés réduits vaut K (nb variables)

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 21 / 56


Exemple

Faire une ACP de ce tableau : en obtenir une image approchée la plus


fidèle possible
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 22 / 56
1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 23 / 56


Meilleure représentation axiale

Espace des individus : RK

NI

Mi u1

Hi

GI = O

0 k

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 24 / 56


Meilleure représentation axiale

Espace des individus : RK

NI

Mi u1

Hi

GI = O

0 k

PI 2
Objectif : trouver u1 qui maximise i=1 OHi
u1 est l’axe d’inertie maximum

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 24 / 56


Premier axe principal u1

L’axe u1 d’inertie maximum est engendré par le vecteur propre de la


matrice de corrélation associée à la plus grande valeur propre 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 25 / 56


Premier axe principal u1

L’axe u1 d’inertie maximum est engendré par le vecteur propre de la


matrice de corrélation associée à la plus grande valeur propre 1

Cet axe passe par le centre de gravité du nuage de points

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 25 / 56


Premier axe principal u1

L’axe u1 d’inertie maximum est engendré par le vecteur propre de la


matrice de corrélation associée à la plus grande valeur propre 1

Cet axe passe par le centre de gravité du nuage de points

L’inertie expliquée par ce premier axe est égale à 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 25 / 56


Premier axe principal u1

L’axe u1 d’inertie maximum est engendré par le vecteur propre de la


matrice de corrélation associée à la plus grande valeur propre 1

Cet axe passe par le centre de gravité du nuage de points

L’inertie expliquée par ce premier axe est égale à 1

La part d’inertie expliquée par u1 est égale à 1 /K

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 25 / 56


Première composante principale F1

Rappel : un individu i est composé de K attributs xi1 , . . . , xiK , et


représente un point dans un espace à K dimensions.

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 26 / 56


Première composante principale F1

Rappel : un individu i est composé de K attributs xi1 , . . . , xiK , et


représente un point dans un espace à K dimensions.
La première composante principale F1 est une nouvelle variable dont la
valeur pour chaque individu Mi vaut :
la longueur de la projection de Mi sur le premier axe principal u1
! !
le produit scalaire entre OMi et u1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 26 / 56


Première composante principale F1

Rappel : un individu i est composé de K attributs xi1 , . . . , xiK , et


représente un point dans un espace à K dimensions.
La première composante principale F1 est une nouvelle variable dont la
valeur pour chaque individu Mi vaut :
la longueur de la projection de Mi sur le premier axe principal u1
!
le produit scalaire entre OMi et !
u1
Résultats :
E [F1 ] = 0
Var [F1 ] = 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 26 / 56


Meilleure représentation plane

Mi

u1
On cherche un plan P(u1 , u2 ) qui
XI
O
Hi
maximise OHi 2
u2
i=1
Plan d’inertie maximale

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 27 / 56


Meilleure représentation plane
Mi

u1
On cherche un plan P(u1 , u2 ) qui
XI
O
Hi
maximise OHi 2
u2
i=1
Plan d’inertie maximale

Résultats :
l’axe d’inertie maximal est dans le plan d’inertie maximal
u2 est l’axe d’inertie maximal avec u2 ? u1
u2 est engendré par le vecteur propre unitaire de la matrice de
corrélation associé à la deuxième plus grande valeur propre 2

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 27 / 56


Le premier plan principal

Le premier plan principal est le plan engendré par les deux premiers axes
principaux u1 et u2 .
Dans ce plan, chaque point du nuage est représenté par 2 coordonnées :
les produits scalaires sur chacun des deux axes principaux.
Inertie expliquée par le premier plan principal : 1 + 2
1+ 2
Part de l’inertie totale expliquée par le premier plan principal : K

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 28 / 56


Suite d’axes de représentation de Ni

Problème : Trouver une suite d’axes orthogonaux d’inertie maximum


Soit us un vecteur unitaire, s 1 Soit His la projection de Mi sur us
X I
Je veux trouver us tel que (OHis )2 soit maximum avec la contrainte
i=1
us ? ut , 8t < s

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 29 / 56


Suite d’axes de représentation de Ni

Problème : Trouver une suite d’axes orthogonaux d’inertie maximum


Soit us un vecteur unitaire, s 1 Soit His la projection de Mi sur us
X I
Je veux trouver us tel que (OHis )2 soit maximum avec la contrainte
i=1
us ? ut , 8t < s

Solution : us est le vecteur propre de la matrice de corrélation associé à la


valeur propre de rang s : s

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 29 / 56


Exemple

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 30 / 56


Exemple

Individuals factor map (PCA)

Brest
4
2
Dim 2 (18.97%)

Rennes
Nantes

Nice
Lille

Bordeaux
0

Paris Toulouse
Vichy Montpellier
Clermont
Marseille

Grenoble Lyon
-2

Strasbourg

-5 0 5

Dim 1 (79.85%)

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 31 / 56


Représentation des variables associée au premier plan de
l’ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 33 / 56


Exemple
Variables factor map (PCA)
1.0

Janv
Janv
Dece
Dece
0.5

Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)

Mars Octo
Mars Octo
0.0

Avri Sept
Avri Sept

Aout
Aout
Mai
Mai
-0.5

juil Juin
juil Juin
-1.0

-1.0 -0.5 0.0 0.5 1.0


Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 34 / 56
Dim 1 (79.85%)
Exemple

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 35 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 36 / 56


Nuage des variables Nv

1 ... k ... K
1 x1k

i xi1 ... xik ... xiK

I xIk

GV 0 ... 0 ... 0
Ecart-type 1 ... 1 ... 1

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 37 / 56


Nuage des variables Nv
1 ... k ... K
1 x1k

i xi1 ... xik ... xiK

I xIk

GV 0 ... 0 ... 0
Ecart-type 1 ... 1 ... 1
cos(Mk , Ml ) =

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 37 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 38 / 56


Ajustement du nuage des variables

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 39 / 56


Ajustement du nuage des variables

PK s 2
P s 2
P 2
Maximiser k=1 (OHk ) = k (cos ✓k ) = k (r (k, v ))
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 39 / 56
Ajustement du nuage des variables

Soit vs un vecteur unitaire de la direction de rang s Soit Hks la projection


de Mk sur vs
XK
L’axe optimal est tel que (OHks )2 maximum, sous la contrainte
k=1
vs ? vt , 8 t < s

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 40 / 56


Ajustement du nuage des variables

Soit vs un vecteur unitaire de la direction de rang s Soit Hks la projection


de Mk sur vs
XK
L’axe optimal est tel que (OHks )2 maximum, sous la contrainte
k=1
vs ? vt , 8 t < s
K
X X X
(OHks )2 = (cos✓ks )2 = (r (k, v ))2
k=1 k k

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 40 / 56


Ajustement du nuage des variables

Soit vs un vecteur unitaire de la direction de rang s Soit Hks la projection


de Mk sur vs
XK
L’axe optimal est tel que (OHks )2 maximum, sous la contrainte
k=1
vs ? vt , 8 t < s
K
X X X
(OHks )2 = (cos✓ks )2 = (r (k, v ))2
k=1 k k

On obtient exactement la même chose qu’avec les individus ! !

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 40 / 56


Exemple
Variables factor map (PCA)
1.0

Janv
Janv
Dece
Dece
0.5

Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)

Octo
Mars Octo
Mars
0.0

Avri Sept
Avri Sept

Aout
Aout
Mai
Mai
-0.5

juil Juin
juil Juin
-1.0

-1.0 -0.5 0.0 0.5 1.0

Dim 1 (79.85%)
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 41 / 56
Exemple
Variables factor map (PCA)
1.0

Janv
Dece
Dece
0.5

Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)

Mars Octo
Mars Octo
0.0

Sept
Avri Sept
Avri

Aout
Aout
Mai
Mai
-0.5

juil Juin
juil Juin
-1.0

-1.0 -0.5 0.0 0.5 1.0

Dim 1 (79.85%)

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 42 / 56


Projections

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 43 / 56


Projections

Seules les variables bien projetées peuvent être interprétées

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 43 / 56


Bilan ajustement des nuages

Variables factor map (PCA)

1.0
Individuals factor map (PCA)
Janv
Janv
Dece
Dece

0.5
Brest Fevr
Fevr
4

Nove
Nove
Dim 2 (18.97%)

Mars Octo
Mars Octo
2
Dim 2 (18.97%)

Rennes
0.0

Nantes

Nice
Lille

Bordeaux
Avri Sept
Avri Sept
0

Paris Toulouse
Vichy Montpellier
Clermont
Marseille
Aout
Aout
Mai
Mai
-0.5

juil Juin
Juin
Grenoble Lyon
juil
-2

Strasbourg

-5 0 5

Dim 1 (79.85%)
-1.0

-1.0 -0.5 0.0 0.5 1.0

Dim 1 (79.85%)

Aide à interpréter les individus


Représentation optimale des variables
Visualisation de la matrice des corrélations

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 44 / 56


1 Contexte, données, problème

2 ACP : objectifs

3 Nuage des individus

4 Ajustement du nuage d’individus

5 Nuages des variables

6 Ajustement du nuage des variables

7 Déroulement, intérprétation d’une ACP

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 45 / 56


Sur un exemple

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 46 / 56


Répartition de l’inertie

Données centrées-réduites : inertie = nombre de variables


Comment se répartit-elle dans les di↵érentes composantes principales ?

Axe Valeur propre % d’inertie % cumulé d’inertie


1 5.84 38.9 38.9
2 1.97 13.1 52
3 1.83 12.2 64.1
4 0.99 6.6 70.7
5 0.92 6.1 76.8
6 0.85 5.7 82.5
... ...
15 0.05 0.36 100

! Choix du nombre de dimensions à interpréter

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 47 / 56


Premier plan factoriel

2
Individuals factor map (PCA)
3

4
4

Schalke 04

Sevilla
Getafe
Eintracht Frankfurt
RasenBallsport Leipzig
Leganes
Alaves Atletico Madrid Real Madrid
2

Hoffenheim Barcelona
VfB Stuttgart
Mainz 05 Girona Valencia
Bayer Leverkusen Lyon
Hamburger SV
Werder Bremen Bordeaux
Deportivo Monaco
Las Palmas
La Coruna Paris Saint Germain
FC Cologne Augsburg Athletic
Villarreal
Bilbao Lille
Toulouse
MalagaMontpellier
EibarDijon Fiorentina Marseille
Hertha Berlin
SPAL Saint-Etienne
2013 Torino Atalanta Bayern Munich
Espanyol
Hannover 96 Metz Rennes GuingampCelta Vigo Borussia Dortmund
AC Milan
Wolfsburg
Genoa
Dim 2 (13.12%)

Caen
Cagliari Nantes Real Sociedad
Amiens Strasbourg
Angers
Benevento Chelsea Juventus
Sassuolo Borussia M.Gladbach
0

Crotone Nice
Lazio Arsenal
LevanteBologna Inter
Verona Troyes
Freiburg Real Betis Napoli
Udinese
Crystal Palace
Sampdoria Tottenham Manchester City
West Ham
Huddersfield Roma
Everton Watford Liverpool
Southampton
Chievo Manchester United
-2

West Bromwich Albion

Burnley Newcastle
Stoke United
Leicester
Swansea
Brighton

Bournemouth
-4

-5 0 5 10

Dim 1 (38.90%)

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 48 / 56


Premier plan factoriel
Variables factor map (PCA)
1.0

Fautes
FautesSubies
Tacles
0.5

Interception HorsJeu

Jaune TirsCadres
Dim 2 (13.12%)

Tirs
Dribbles
Possession
PassesReuss
0.0

Rouge

Buts
TirsContre
DuelsAeriens
−0.5
−1.0

−1.0 −0.5 0.0 0.5 1.0

Dim 1 (38.90%)
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 49 / 56
Deuxième plan factoriel

Individuals factor map (PCA)

1
2
3
Saint-Etienne
3

4
5

RasenBallsport Leipzig

Lille
Nantes
2

Troyes Real Madrid


Borussia Dortmund
Verona Metz Dijon
Chelsea
Watford
LeicesterHuddersfield Hertha Berlin
Freiburg
Rennes Strasbourg
AC Milan
Real Sociedad
1

Hamburger SV
Cagliari Wolfsburg
VfB Stuttgart
Atalanta
Dim 4 (6.61%)

ParisMalaga
Saint Germain Lazio EvertonNapoli
Caen
Bologna Crotone
Tottenham
Villarreal Newcastle United
Eibar FC Cologne
Nice Benevento Amiens
Real Betis Atletico Madrid Bayer Leverkusen
Guingamp
Genoa
Sevilla Lyon Liverpool
Borussia M.Gladbach
Sampdoria Udinese Mainz 05
0

Torino AngersMarseille Fiorentina


Chievo Roma Augsburg
Werder Bremen
Manchester City Eintracht
Stoke Frankfurt
Levante
SPAL 2013 WestSassuolo
Ham Brighton
Leganes Bayern Munich
Southampton
Getafe Valencia Espanyol
Las Palmas West Bromwich Albion
Hoffenheim
Alaves Barcelona
Bordeaux Arsenal
Manchester
Juventus
Swansea United Schalke 04
Burnley
Bournemouth
-1

Montpellier Hannover 96
Crystal Palace
InterBilbao
Toulouse Athletic
Monaco
Deportivo La Coruna
Celta Vigo
-2

Girona
-3

-6 -4 -2 0 2 4 6

Dim 3 (12.23%)

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 50 / 56


Contribution variables, individus à un axe

r (x,k ,vs )2
Contribution d’une variable k à un axe s : r (x ,vs )2
P
j ,j

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 51 / 56


Contribution variables, individus à un axe

r (x,k ,vs )2
Contribution d’une variable k à un axe s : r (x ,vs )2
P
j ,j

F2
Contribution d’un individu i à un axe s : P is 2
j Fjs

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 51 / 56


Qualité de représentation : variables, individus

Qualité de représentation d’une variable : cos 2 entre la variable et sa


projection

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 52 / 56


Qualité de représentation : variables, individus

Qualité de représentation d’une variable : cos 2 entre la variable et sa


projection

Qualité de représentation d’un individu : cos 2 entre OMi et OHi sa


projection

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 52 / 56


Qualité de représentation : variables, individus

Qualité de représentation d’une variable : cos 2 entre la variable et sa


projection

Qualité de représentation d’un individu : cos 2 entre OMi et OHi sa


projection

Seuls les éléments bien projetés peuvent être interprétés

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 52 / 56


Pratique de l’ACP

1 Choisir les variables actives


2 Choisir de réduire ou non les variables
3 Réaliser l’ACP
4 Choisir le nombre de dimensions à interpréter
5 Interpréter simultanément le graphe des individus et celui des variables
6 Utiliser les indicateurs pour enrichir l’interprétation
7 Revenir aux données brutes pour interpréter

Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 56 / 56

Vous aimerez peut-être aussi