Cours Acp L3
Cours Acp L3
2 ACP : objectifs
I individus
K variables aléatoires quantitatives
Domaine de la statistique exploratoire multidimensionelle
2 ACP : objectifs
2 axes d’étude
1 Étude des individus
2 axes d’étude
1 Étude des individus
Marseille
Montpellier Nice
20
Bordeaux
19
Toulouse
Lyon
Température en Juin
18
Grenoble
Paris
Clermont
Strasbourg Nantes
Vichy
17
Rennes
16
Lille
15
Brest
1 2 3 4 5 6 7
Température en Janvier
2 ACP : objectifs
1 ... k ... K
1
GI x1 ... xk ... xK
1 Mj
Mi
GI
i xi1 ... xik ... xiK
I 0 k
xk xik
GI x1 ... xk ... xK
1 Mj
Mi
GI
i xi1 ... xik ... xiK
I 0 k
xk xik
GI x1 ... xk ... xK
K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1
1 Mj
Mi
GI
i xi1 ... xik ... xiK
I 0 k
xk xik
GI x1 ... xk ... xK
K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1
On appele inertie du nuage :
I I K
1 X 2 1 XX PK
d (GI , Mi ) = (xik xk ) 2 = k=1
2
k ljbgfg
I I
i=1 i=1 k=1
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 19 / 56
Nuage Ni des individus
Espace des individus : RK
1 Mj
Mi
GI
i xi1 ... xik ... xiK
I 0 k
xk xik
GI x1 ... xk ... xK
K
X
d 2 (Mi , Mj ) = (xik xjk )2
k=1
Mj
Mi
GI
xik xik xk
0 k
xk xik
2 ACP : objectifs
NI
Mi u1
Hi
GI = O
0 k
NI
Mi u1
Hi
GI = O
0 k
PI 2
Objectif : trouver u1 qui maximise i=1 OHi
u1 est l’axe d’inertie maximum
Mi
u1
On cherche un plan P(u1 , u2 ) qui
XI
O
Hi
maximise OHi 2
u2
i=1
Plan d’inertie maximale
u1
On cherche un plan P(u1 , u2 ) qui
XI
O
Hi
maximise OHi 2
u2
i=1
Plan d’inertie maximale
Résultats :
l’axe d’inertie maximal est dans le plan d’inertie maximal
u2 est l’axe d’inertie maximal avec u2 ? u1
u2 est engendré par le vecteur propre unitaire de la matrice de
corrélation associé à la deuxième plus grande valeur propre 2
Le premier plan principal est le plan engendré par les deux premiers axes
principaux u1 et u2 .
Dans ce plan, chaque point du nuage est représenté par 2 coordonnées :
les produits scalaires sur chacun des deux axes principaux.
Inertie expliquée par le premier plan principal : 1 + 2
1+ 2
Part de l’inertie totale expliquée par le premier plan principal : K
Brest
4
2
Dim 2 (18.97%)
Rennes
Nantes
Nice
Lille
Bordeaux
0
Paris Toulouse
Vichy Montpellier
Clermont
Marseille
Grenoble Lyon
-2
Strasbourg
-5 0 5
Dim 1 (79.85%)
Janv
Janv
Dece
Dece
0.5
Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)
Mars Octo
Mars Octo
0.0
Avri Sept
Avri Sept
Aout
Aout
Mai
Mai
-0.5
juil Juin
juil Juin
-1.0
2 ACP : objectifs
1 ... k ... K
1 x1k
I xIk
GV 0 ... 0 ... 0
Ecart-type 1 ... 1 ... 1
I xIk
GV 0 ... 0 ... 0
Ecart-type 1 ... 1 ... 1
cos(Mk , Ml ) =
2 ACP : objectifs
PK s 2
P s 2
P 2
Maximiser k=1 (OHk ) = k (cos ✓k ) = k (r (k, v ))
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 39 / 56
Ajustement du nuage des variables
Janv
Janv
Dece
Dece
0.5
Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)
Octo
Mars Octo
Mars
0.0
Avri Sept
Avri Sept
Aout
Aout
Mai
Mai
-0.5
juil Juin
juil Juin
-1.0
Dim 1 (79.85%)
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 41 / 56
Exemple
Variables factor map (PCA)
1.0
Janv
Dece
Dece
0.5
Fevr
Fevr
Nove
Nove
Dim 2 (18.97%)
Mars Octo
Mars Octo
0.0
Sept
Avri Sept
Avri
Aout
Aout
Mai
Mai
-0.5
juil Juin
juil Juin
-1.0
Dim 1 (79.85%)
1.0
Individuals factor map (PCA)
Janv
Janv
Dece
Dece
0.5
Brest Fevr
Fevr
4
Nove
Nove
Dim 2 (18.97%)
Mars Octo
Mars Octo
2
Dim 2 (18.97%)
Rennes
0.0
Nantes
Nice
Lille
Bordeaux
Avri Sept
Avri Sept
0
Paris Toulouse
Vichy Montpellier
Clermont
Marseille
Aout
Aout
Mai
Mai
-0.5
juil Juin
Juin
Grenoble Lyon
juil
-2
Strasbourg
-5 0 5
Dim 1 (79.85%)
-1.0
Dim 1 (79.85%)
2 ACP : objectifs
2
Individuals factor map (PCA)
3
4
4
Schalke 04
Sevilla
Getafe
Eintracht Frankfurt
RasenBallsport Leipzig
Leganes
Alaves Atletico Madrid Real Madrid
2
Hoffenheim Barcelona
VfB Stuttgart
Mainz 05 Girona Valencia
Bayer Leverkusen Lyon
Hamburger SV
Werder Bremen Bordeaux
Deportivo Monaco
Las Palmas
La Coruna Paris Saint Germain
FC Cologne Augsburg Athletic
Villarreal
Bilbao Lille
Toulouse
MalagaMontpellier
EibarDijon Fiorentina Marseille
Hertha Berlin
SPAL Saint-Etienne
2013 Torino Atalanta Bayern Munich
Espanyol
Hannover 96 Metz Rennes GuingampCelta Vigo Borussia Dortmund
AC Milan
Wolfsburg
Genoa
Dim 2 (13.12%)
Caen
Cagliari Nantes Real Sociedad
Amiens Strasbourg
Angers
Benevento Chelsea Juventus
Sassuolo Borussia M.Gladbach
0
Crotone Nice
Lazio Arsenal
LevanteBologna Inter
Verona Troyes
Freiburg Real Betis Napoli
Udinese
Crystal Palace
Sampdoria Tottenham Manchester City
West Ham
Huddersfield Roma
Everton Watford Liverpool
Southampton
Chievo Manchester United
-2
Burnley Newcastle
Stoke United
Leicester
Swansea
Brighton
Bournemouth
-4
-5 0 5 10
Dim 1 (38.90%)
Fautes
FautesSubies
Tacles
0.5
Interception HorsJeu
Jaune TirsCadres
Dim 2 (13.12%)
Tirs
Dribbles
Possession
PassesReuss
0.0
Rouge
●
Buts
TirsContre
DuelsAeriens
−0.5
−1.0
Dim 1 (38.90%)
Simon Malinowski (Univ. Rennes 1/IRISA) 1er décembre 2021 49 / 56
Deuxième plan factoriel
1
2
3
Saint-Etienne
3
4
5
RasenBallsport Leipzig
Lille
Nantes
2
Hamburger SV
Cagliari Wolfsburg
VfB Stuttgart
Atalanta
Dim 4 (6.61%)
ParisMalaga
Saint Germain Lazio EvertonNapoli
Caen
Bologna Crotone
Tottenham
Villarreal Newcastle United
Eibar FC Cologne
Nice Benevento Amiens
Real Betis Atletico Madrid Bayer Leverkusen
Guingamp
Genoa
Sevilla Lyon Liverpool
Borussia M.Gladbach
Sampdoria Udinese Mainz 05
0
Montpellier Hannover 96
Crystal Palace
InterBilbao
Toulouse Athletic
Monaco
Deportivo La Coruna
Celta Vigo
-2
Girona
-3
-6 -4 -2 0 2 4 6
Dim 3 (12.23%)
r (x,k ,vs )2
Contribution d’une variable k à un axe s : r (x ,vs )2
P
j ,j
r (x,k ,vs )2
Contribution d’une variable k à un axe s : r (x ,vs )2
P
j ,j
F2
Contribution d’un individu i à un axe s : P is 2
j Fjs