Chap5 Visualisation
Chap5 Visualisation
j
j
N j
det R 1 * 2 * 3
p
R U k k U k
P
U k*
6) Représentation des individus Ck ZU k Uk *
Uk
Id
7) Représentation des variables: ACP normée (Certains travaux utilisent
cette formule Coord j, k k * U kj pour représenter les variables
Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 269
2) Analyse en Composantes Principales ING3-DS
Représentation des variables
.C
N
P .X j
.C ki 1
X j t
j i i k
Cov X , C k
Cor X , C Kj
i 1
N
X j . Ck X . k j X . k
j
Cor X , C K Coord j , k
j
k * U kj
i k
P .C i
1 N i N
Moy C k 0 i 1
n
0 C k 0 C ki 0
P
N i 1 i 1
i
i 1
N
Var C k k Var C k Pi . C i 2 1 t
k Ck * Ck
i 1 N
Cov C i , C j
Cor C i , C j 0 Cov C i , C j 0 C i * C j 0
1 t
C . C
i j
N
U i , U j M U it MU j 0 i j U i 2
U i , U i M U it MU i 1
P
Tr R k P
k 1
Exemple
Une étude consiste à déterminer les facteurs de la localisation
internationale d’une marque. Soit le tableau des données suivant:
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
xij g j 1 t
z R Z *Z
j N
Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 273
Centre de gravité Ingénieur DS 3
p .x i ij
1 N
40 40 60 60
x g
j j i 1
N
xij ; x1 g 1 IDE 50
p
N i 1 4
i
i 1
2 5366
x g T _C 2
5
4
3 6424
x g T _ I 4
3
4
Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 274
La matrice centrée Ingénieur DS 3
Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4
X p
Var X j 2 j
n
i 1
i
x ij x
j 2
1
N
x
n
i 1
ij x x x
j 2 2
j j 2
1
N
x
n
i 1
ij
2
x
j 2
Var X 1
x 2
1
x
1 2
1
N
n
xi1
i 1
2
14 (40)
x
1 2 2
(40) 2 (60) 2 (60) 2 50 100
2
1 X 1 Var X 1 100 10
Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4
X p
Var X j 2 j
n
i 1
i
x ij x
j 2
1
N
x
n
i 1
ij x x x
j 2 2
j j 2
1
N
x
n
i 1
ij
2
x
j 2
Var X : T _ C x
2
2
2
x
2 2
1
N
n
xi 2
i 1
2
x 14 (5)
2 2 2
(3) 2 (6) 2 (6) 2 5 2 3
2
2 X 2 3 / 2
Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4
X p
Var X j 2 j
i 1
n
i
x ij x
j 2
1
N
x
n
i 1
ij x x x
j 2 2
j j 2
1
N
x
n
i 1
ij
2
x
j 2
Var X : T _ I x
3
2
3
x
3 2
1
N
n
xi 3
i 1
2
x 14 (6)
3 2 2
(4) 2 (2) 2 (4) 2 4 2
2
3 X 3 : T _ I 2
Z-score
j
x ij x
z score
j
40 50 5 5 6 4 10 0 2
40 50 3 5 4 4 10 2 0
X X g
C
60 50 65 24 10 1 2
60 50 6 5 4 4 10 1 0
10 / 10 0 / 3/ 2 2 / 2 1 0 2
xij g j
10 / 10 2 / 3/ 2 0 / 2 1 2 2/ 3 0
Z XR
C
j 10 / 10 1 / 3/ 2 2 / 2 1 2 / 3 2
10 / 10 1 / 0 / 2 1 0
3/ 2 2/ 3
xij g j
1 t
z R Z *Z
j N
10 / 10 0 / 3/ 2 2 / 2 1 0 2
xij g j
10 / 10 2 / 3/ 2 0 / 2 1 2 2/ 3 0
Z XR
C
j 10 / 10 1 / 3/ 2 2 / 2 1 2 / 3 2
10 / 10 1 / 0 / 2 1 0
3/ 2 2/ 3
4 4 2 / 3 2 2 1 2/ 3 2/2
1 t 1
R Z *Z 4 2 / 3 4 2/ 3 2 / 3 1 1/ 2 3
N 4
2 2 2/ 3 4 2 / 2 1/ 2 3 1
1 2/ 3 2/2
1 t
R Z *Z 2 / 3 1 1/ 2 3
N
2 / 2 1 / 2 3 1
3) Calcul des valeurs propres k de la matrice R detR I 0
1 2/ 3 2/2
dét R I R I 2/ 3 1 1/ 2 3 0
2 / 2 1/ 2 3 1
1 2/ 3 2/2
1 t
R Z *Z 2 / 3 1 1/ 2 3
N
2 / 2 1 / 2 3 1
3) Calcul des valeurs propres k de la matrice R detR I 0
P
Tr R Rii 1 1 1 3
Tr R k P P
i 1
k 1
k 1
k 2,2330 0,7148 0,0522 3 P
1 2 / 3 2 /2 x x 0,0443
R U 2 2 U 2 2 / 3 1 1 / 2 3 y 0,7148 y U 2
normalisé
0,6451
z 0,7628
2 / 2 1 / 2 3 1 z
10 / 10 0 / 3/ 2 2 / 2 1 0 2
xij g j
10 / 10 2 / 3/ 2 0 / 2 1 2 2/ 3 0
Z XR
C
j 10 / 10 1 / 3/ 2 2 / 2 1 2 / 3 2
10 / 10 1 / 0 / 2 1 0
3/ 2 2/ 3
0,6588 0,0443
U1normalisé 0,5551 U 2normalisé 0,6451
0,5078 0,7628
1 0 2 1,3765
0,6588
1 2 2/ 3 0 1,5653
C1 * 0,5551 1,8298
1 2/ 3 2
1 0,5078
2/ 3 0 1,1120
1 0 2 1,0345
0,0443
1 2 2/ 3 0 1,0977
C2 * 0,6451 0,5077
1 2 / 3 2
1 0,7628 0,5710
2/ 3 0
0,6588 0,9845
Cor X j , C1 1 * U1j 2,233 * 0,5551 0,8295
0,5078 0,7584
0,0443 0,0375
Cor X j , C2 2 * U 2j 0,7148 * 0,6451 0,5454
0,7628 0,6449
C1
C2
C1
C2
1
L’inertie extraite par l’axe U1: Q1 0.7443 74,43%
1 2 3
1,000 0 1,4142
1,000 1,6330 0
Z1, 2 Z 1 Z 2 Z 3
1,0000 0,8168 1,4142
1,0000 0,8165 0