0% ont trouvé ce document utile (0 vote)
35 vues29 pages

Chap5 Visualisation

Transféré par

adelbendisari7
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
35 vues29 pages

Chap5 Visualisation

Transféré par

adelbendisari7
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre5

Visualisation des données


ACP
2) Analyse en Composantes Principales ING3-DS
2.5 Les variantes d’ACP
ACP normée (centrée réduite) utilise la matrice de corrélation R
xij  g j
1)Tableau centré réduit (moy=0, sigma=1) z 
j
2) La matrice de corrélation R:
xij  g j 1 t 1 1  M  D 1 j  1.....P
z  R  Z *Z ou
R  M 2 *V * M 2
avec
 2

j
j
N j

3) Calcul des valeurs propres k de la matrice R detR  I   0  i


Qj  i 1
 80%

det R   1 * 2 * 3
p

4) Calcul de la qualité de représentation : 


i 1
i

R  U k  k  U k
P

5)Les axes principaux U k de la matrice R Tr R   P   k


k 1

U k*
6) Représentation des individus Ck  ZU k Uk  *
Uk
Id
7) Représentation des variables: ACP normée (Certains travaux utilisent
cette formule Coord  j, k   k * U kj pour représenter les variables
Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 269
2) Analyse en Composantes Principales ING3-DS
Représentation des variables

Pour représenter les variables, généralement il y’a deux manières:


1) à l’aide du coefficient de corrélation :  1  CorX j , Ck   1

  .C
N

   P .X j
.C ki 1
X j t

 
j i i k
Cov X , C k
Cor X , C Kj
 i 1
 N
 X j . Ck  X . k j  X . k
j

2) à l’aide d’un produit entre la racine carrée de k et vecteur propre U k


Si les variables sont normalisées (cas d’une ACP normée- Matrice R)

Cor X , C K   Coord  j , k  
j
k * U kj

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2023/2024 270


2) Analyse en Composantes Principales ING3-DS
2.5 Les propriétés de Ck

 i k
P .C i

1 N i N
Moy C k   0  i 1
n
 0   C k  0   C ki  0
P
N i 1 i 1
i
i 1

 
N
Var C k   k  Var C k    Pi . C i 2 1 t
k  Ck * Ck
i 1 N

Cov C i , C j 
Cor C i , C j    0  Cov C i , C j   0  C i * C j  0
1 t
 C . C
i j
N

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 271


2) Analyse en Composantes Principales ING3-DS
2.5 Les propriétés de vecteurs propres Uk

•Les vecteurs propres constituent une base ortho-normée:

 U i , U j  M  U it MU j  0 i  j U i 2
 U i , U i  M  U it MU i  1

P
Tr R    k  P
k 1

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 272


ACP Ingénieur DS 3

Exemple
Une étude consiste à déterminer les facteurs de la localisation
internationale d’une marque. Soit le tableau des données suivant:
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4

1) Trouver la matrice de corrélation


2) À l’aide d’une ACP Normée (données hétérogènes), représenter le nauge de
points.
3) Représenter les variables à l’aide d’un cercle de corrélation

xij  g j 1 t
z  R  Z *Z
j N
Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 273
Centre de gravité Ingénieur DS 3

Principe: représente la moyenne pour chaque variable


N IDE: Investissement direct étranger
 p .x i ij
1 N
x g 
j j i 1
N
 x ; ij
Pays IDE Taux_croissance Taux_inflation
p
N i 1 A 40 5 6
i
i 1 B 40 3 4
1 C 60 6 2
j  1... p; i  1...N & pi 
N D 60 6 4
N

 p .x i ij
1 N
40  40  60  60
x g 
j j i 1
N
  xij ;  x1  g 1  IDE   50
p
N i 1 4
i
i 1
2 5366
x  g T _C  2
5
4
3 6424
x  g T _ I  4
3

4
Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 274
La matrice centrée Ingénieur DS 3

Principe: on calcule la différence par rapport au centre de gravité


IDE: Investissement direct étranger

Pays IDE Taux_croissance Taux_inflation


A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4

La matrice centrée: X C  X  g  x ijc  x ij  x j


 40  50 5  5 6  4    10 0  2 
   
 40  50 3  5 4  4    10  2 0 
X  X g 
C
 
60  50 65 24  10  1  2 
   
 60  50 6  5 4  4    10  1 0 
 

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 275
Calcul des écarts types (standard deviation) Ingénieur DS 3

Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4

    X    p
Var X j 2 j
n

i 1
i 
 x ij  x 
j 2

1
N
 x
n

i 1
ij x   x  x 
j 2 2
j j 2

1
N
 x 
n

i 1
ij
2
 
 x
j 2

Var X 1
 x 2
1

 x
1 2

1
N
n

 xi1 
i 1
2
   14 (40)
 x
1 2 2
 (40) 2  (60) 2  (60) 2   50  100
2

 1   X 1   Var X 1   100  10

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 276


Calcul des écarts types (standard deviation) Ingénieur DS 3

Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4

    X    p
Var X j 2 j
n

i 1
i 
 x ij  x 
j 2

1
N
 x
n

i 1
ij x   x  x 
j 2 2
j j 2

1
N
 x 
n

i 1
ij
2
 x  
j 2


Var X : T _ C  x
2
 2
2
 
 x
2 2

1
N
n

 xi 2 
i 1
2
 x    14 (5)
2 2 2
 (3) 2  (6) 2  (6) 2  5  2 3
2
 2   X 2   3 / 2

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 277


Calcul des écarts types (standard deviation) Ingénieur DS 3

Principe
Pays IDE Taux_croissance Taux_inflation
A 40 5 6
B 40 3 4
C 60 6 2
D 60 6 4
g:centre de gravité 50 5 4

    X    p
Var X j 2 j

i 1
n

i 
 x ij  x
j 2
 
1
N
 x
n

i 1
ij x   x  x 
j 2 2
j j 2

1
N
 x 
n

i 1
ij
2
 
 x
j 2


Var X : T _ I  x
3
 2
3
 
 x
3 2

1
N
n

 xi 3 
i 1
2
 x    14 (6)
3 2 2

 (4) 2  (2) 2  (4) 2  4   2
2

 3   X 3 : T _ I   2

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 278


Matrice centrée réduite Ingénieur DS 3

Z-score
j
x ij  x
z  score 
j

 40  50 5  5 6  4    10 0  2 
   
 40  50 3  5 4  4    10  2 0 
X  X g 
C
 
60  50 65 24  10  1  2 
   
 60  50 6  5 4  4    10  1 0 

  10 / 10 0 / 3/ 2  2 / 2   1 0  2
   
xij  g j
  10 / 10  2 / 3/ 2 0 / 2   1  2 2/ 3 0 
Z  XR 
C
  
j   10 / 10  1 / 3/ 2  2 / 2   1  2 / 3  2
  10 / 10  1 / 0 / 2    1  0 
 3/ 2 2/ 3

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 279


Matrice de corrélation Ingénieur DS 3

xij  g j
1 t
z  R  Z *Z
j N
  10 / 10 0 / 3/ 2  2 / 2   1 0  2
   
xij  g j
  10 / 10  2 / 3/ 2 0 / 2   1  2 2/ 3 0 
Z  XR 
C
  
j   10 / 10  1 / 3/ 2  2 / 2   1  2 / 3  2
  10 / 10  1 / 0 / 2    1  0 
 3/ 2 2/ 3

 4 4 2 / 3 2 2   1 2/ 3  2/2
1 t 1   
R  Z *Z  4 2 / 3 4  2/ 3   2 / 3 1 1/ 2 3 
N 4   
 2 2 2/ 3 4    2 / 2 1/ 2 3 1 

Dr N. NEGGAZ -Maître de Conférences –A Chapitre 3: Nettoyage des données Année:2024/2025 280


2) Analyse en Composantes Principales ING3-DS
Matrice de corrélation

 1 2/ 3  2/2 
1 t  
R  Z *Z   2 / 3 1  1/ 2 3 
N  
  2 / 2  1 / 2 3 1 
3) Calcul des valeurs propres k de la matrice R detR  I   0

1  2/ 3  2/2
dét R  I   R  I  2/ 3 1   1/ 2 3  0
 2 / 2  1/ 2 3 1 

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 281


2) Analyse en Composantes Principales ING3-DS
Matrice de corrélation

 1 2/ 3  2/2 
1 t  
R  Z *Z   2 / 3 1  1/ 2 3 
N  
  2 / 2  1 / 2 3 1 
3) Calcul des valeurs propres k de la matrice R detR  I   0

 1  2,2330 2  0,7148 3  0,0522


P

P
Tr R    Rii  1  1  1  3
Tr R    k  P P
i 1

k 1

k 1
k  2,2330  0,7148  0,0522  3  P

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 282


2) Analyse en Composantes Principales ING3-DS
Matrice de corrélation  1 2/ 3  2/2 
1 t  
R  Z *Z   2 / 3 1  1/ 2 3 
N  
  2 / 2  1 / 2 3 1 
3) Calcul des valeurs propres k de la matrice R detR  I   0
 1  2,2330 2  0,7148 3  0,0522
j

4) Calcul de la qualité de représentation :


 i
Qj  i 1
p
 80%
 i
1 2,2330 i 1
Q1    0,7443
p
2,2330  0,7148  0,0522

i 1
i Il y’a deux axes
1  2 2,2330  0,7148
principaux u1, u2
Q2    0,9826  98,26%  80% relatifs aux valeurs
p
2,2330  0,7148  0,0522

i 1
i
propres λ1, λ2.

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 283


Recherche des axes principaux :Uk ING3-DS
Matrice de corrélation  1 2/ 3  2/2 
1 t  
R  Z *Z   2 / 3 1  1/ 2 3 
N  
  2 / 2  1 / 2 3 1 
R R  U k  k  U k
5)Les axes principaux U k de la matrice

 1  2,2330 2  0,7148 3  0,0522


 1 2 / 3  2 / 2   x  x  0,6588 
       
R  U 1  1  U1   2 / 3 1  1 / 2 3    y   2,233 y   U1normalisé
  0,5551 
    z   0,5078 
  2 / 2  1 / 2 3 1   z     

 1 2 / 3  2 /2   x  x  0,0443 
       
R  U 2  2  U 2   2 / 3 1  1 / 2 3    y   0,7148 y   U 2
normalisé
  0,6451 
    z  0,7628 
  2 / 2  1 / 2 3 1   z     

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 284


Recherche des axes principaux :Uk ING3-DS
Représentation des individus

6) Représentation des individus Ck  ZU k

  10 / 10 0 / 3/ 2  2 / 2   1 0  2
   
xij  g j
  10 / 10  2 / 3/ 2 0 / 2   1  2 2/ 3 0 
Z  XR 
C
  
j   10 / 10  1 / 3/ 2  2 / 2   1  2 / 3  2
  10 / 10  1 / 0 / 2    1  0 
 3/ 2 2/ 3

 0,6588   0,0443 
   
U1normalisé   0,5551  U 2normalisé   0,6451 
  0,5078   0,7628 
   

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 285


Recherche des axes principaux :Uk ING3-DS
Représentation des individus

6) Représentation des individus Ck  ZU k

 1 0  2   1,3765 
   0,6588   
 1  2 2/ 3 0      1,5653 
C1    *  0,5551    1,8298 
1  2/ 3  2 
   
1   0,5078   
 2/ 3 0   1,1120 

 1 0  2  1,0345 
   0,0443   
 1  2 2/ 3 0      1,0977 
C2    *  0,6451     0,5077 
1  2 / 3  2   
1    0,7628   0,5710 
 2/ 3 0   

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 286


Recherche des axes principaux :Uk ING3-DS
Représentation des individus

6) Représentation des individus Ck  ZU k

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 287


Recherche des axes principaux :Uk ING3-DS
RepréSentation des variables
7) Représentation des variables: ACP normée (Certains travaux utilisent
cette formule Coord  j, k   k * U kj pour représenter les variables

 0,6588   0,9845 
   
Cor X j , C1   1 * U1j  2,233 *  0,5551    0,8295 
  0,5078    0,7584 
   

 0,0443   0,0375 
   
 
Cor X j , C2  2 * U 2j  0,7148 *  0,6451    0,5454 
 0,7628   0,6449 
   

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 288


2) Analyse en Composantes Principales ING3-DS
10- Représentation des variables
𝑪𝒐𝒓 𝐈𝐃𝐄, 𝑪𝟏 𝑪𝒐𝒓 𝐈𝐃𝐄, 𝑪𝟐 𝟎, 𝟗𝟖𝟒𝟓 𝟎. 𝟎𝟑𝟕𝟓
𝑪𝒐𝒓 = 𝑪𝒐𝒓 𝐓_𝐂𝐫, 𝑪𝟏 𝑪𝒐𝒓 𝐓_𝐂𝐫, 𝑪𝟐 = 𝟎. 𝟖𝟐𝟗𝟓 𝟎. 𝟓𝟒𝟓𝟒 − 𝟏 ≤ 𝒄𝒐𝒓 𝑿𝒋 , 𝑪𝒌 ≤ 𝟏
𝑪𝒐𝒓 𝐓_𝐈𝐧, 𝑪𝟏 𝑪𝒐𝒓 𝐓_𝐈𝐧, 𝑪𝟐 −𝟎, 𝟕𝟓𝟖𝟒 𝟎. 𝟔𝟒𝟒𝟗

Comp2 La deuxième composante Comp2


est positivement corrélée avec les
trois variables (IDE, Taux_Cr et
Taux_In). Comp2 nous informe sur
l’état économique d’un pays Comp2
≈IDE+Taux_Cr+Taux_In
(Comp3≈moyenne).
Comp1 Comp1 est positivement corrélée
avec IDE, Taux_Cr et négativement
corrélée avec Taux_In..
Comp1 ≈ IDE+Taux_Cr -Taux_In

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2023/2024 289


2) Analyse en Composantes Principales ING3-DS
Les partitions possibles

C1

C2

P1  B, C, A, D C1 : Les pays puissants économiquement.


C2 : Les pays pauvres économiquement
Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2023/2024 290
2) Analyse en Composantes Principales ING3-DS
Les partitions possibles

C1
C2

P2  A, B, C , D C1 : Les pays dont IDE+Taux_Cr>Taux_In


C2 : Les pays IDE+Taux_Cr<Taux_In
Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2023/2024 291
2) Analyse en Composantes Principales ING3-DS
Q3- Reconstitution approchée du tableau de données Le 29/10/2023

3- Reconstituer de façon approchée le tableau de données


à partir du peremier (axe), puis à partir des deux premiers,
puis des troix
P
Z   ( ZU k ) * U t
k
k 1

A-Reconstituer de façon approchée le tableau de notes à partir du peremier facteur(axe):

1
L’inertie extraite par l’axe U1: Q1   0.7443  74,43%
1  2  3

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 292


2) Analyse en Composantes Principales ING3-DS
Q3- Reconstitution approchée du tableau de données
A-Reconstituer de façon approchée le tableau de notes à partir du peremier facteur(axe):
1
L’inertie extraite par l’axe U1: Q1   0.7443  74,43%
1  2  3
 1 0  2
 
xij  g j
 1  2 2/ 3 0 
Tableau centré réduit: Z  XR 
C
 
j 1  2/ 3  2
1  0 
P  2/ 3
Z   ( ZU k ) * U kt
k 1

  1,3765    0,9068  0,7641 0,6986 


   
  1,5653    1,0312  0,8689 0,7944 
Z1  ( ZU 1 ) * U1t   * 0,6588 0,5551  0,5078  
1,8298   1,2054 1,0157  0,9286 
   
 1,1120   0,7326 0,6173  0,5644 
  

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 293


2) Analyse en Composantes Principales ING3-DS
Q3- Reconstitution approchée du tableau de données

A-Reconstituer de façon approchée le tableau de notes à partir du peremier facteur(axe):


1  2 2,2330  0,7148
L’inertie extraite par l’axe U1& U2: Q2    0,9826  98,26%  80%
p
2,2330  0,7148  0,0522

i 1
i

Tableau centré réduit:


 1 0  2   1 0  1,4142 
   
xij  g j
 1  2 2/ 3 0    1  1,6330 0 
Z  X RC    
P
j  1  2 / 3  2    1  0,8165  1,4142 
Z   ( ZU k ) * U kt 1   0 
 2/ 3 0    1  0,8165
k 1

 1,0345   0,0458 0,6673 0,7891 


   
  1,0977    0,0486  0,7082  0,8374 
Z 2  ( ZU 2 ) * U 2t   * 0,0443 0,6451 0,7628  
 0,5077    0,0225  0,3275  0,3873 
   
 0,5710   0,0253 0,03684 0,4356 
   

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 294


2) Analyse en Composantes Principales ING3-DS
Q3- Reconstitution approchée du tableau de données

A-Reconstituer de façon approchée le tableau de notes à partir du plan principal (U1,U2):

L’inertie extraite par l’axe U1& U2: Tableau centré réduit:


1  2 2,2330  0,7148
Q2    0,9826  98,26%  80%
p
2,2330  0,7148  0,0522
 i
i 1
 1 0  2   1 0  1,4142 
   
xij  g j
 1  2 2/ 3 0    1  1,6330 0 
Z  X RC    
j 1  2 / 3  2    1  0,8165  1,4142 
1   0 
P  2/ 3 0    1  0,8165
Z   ( ZU k ) * U kt
k 1

  0,9068  0,7641 0,6986   0,0458 0,6673 0,7891    0,8610  0,0968 1,4877 


     
  1,0312  0 ,8689 0,7944    0,0486  0,7082  0,8374    1,0798  1 ,5770  0, 0430 
Z1, 2  Z 1 Z 2      
1,2054 1,0157  0,9286  0,0225  0,3275  0,3873 1,1829 0,6882  1,3159 
     
 0,7326    0,0253 0,03684 0,4356   0,7579  
 0,6173 0 ,5644     0 ,9857 0 ,1288 

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2024/2025 295


2) Analyse en Composantes Principales ING3-DS
Q3- Reconstitution approchée du tableau de données
1  2  3
L’inertie extraite par l’axe U1, U2 & U3: Q3   1  100%
1  2  3
  0,1848    0,01387 0.0970  0,0740 
   
 0,1064   0,0798  0,0558 0.0426 
Z 3  ( ZU 3 ) * U 3t   * 0,7510  0,5250 0, 4004  
 0,2439    0,1832 0,1281  0,0977 
   
 0,3223   0,2421  0,1692 0,1291 
  
P
Z   ( ZU k ) * U kt
k 1

  1,000 0 1,4142 
 
  1,000  1,6330 0 
Z1, 2  Z 1 Z 2  Z 3  
1,0000 0,8168  1,4142 
 
 1,0000 0,8165 0 

Dr N. NEGGAZ -Maître de Conférences –A Chapitre5: Visualisation des données Année:2023/2024 296

Vous aimerez peut-être aussi