Année Universitaire : 2021-2022
Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30
Exercice 1 : (10 points)
On applique une analyse factorielle des correspondances sur les deux variables qualitatives « secteur d’activité »
et « zone géographique », sur un ensemble d’entreprises.
a) Problématiques :
Y a-t-il un lien entre les variables étudiées, zone géographique et secteur d’activité ?
À quelle limite, la position géographique de l’entreprise détermine leur secteur d’activité ?
b) Les données :
On pose en ligne, la variable « zone géographique » avec 6 modalités (Settat, Berrechid, Benahmed, Oued Zem,
Khouribga et Benslimane) et en colonne, la variable « secteur d’activité » avec 8 modalités : Industrie Textile et
Cuir (ITC), Industrie Agro- Alimentaire (IAA), Industrie Métallique, Métallurgique et Electrique (IMME),
Industrie Chimique et Para Chimique (ICPC), Bâtiment et Travaux Publics (BTP), Tourisme, Commerce et
Services).
Ta ble au des correspondances global
Secteur d'activité de l'entrepris e
Marge
Zone géographique ITC IA A IMME ICPC BTP Touris me Commerce Servic es ac tive
Settat 0 0 1 2 6 0 6 18 33
Berrchid 2 2 2 2 4 0 24 15 51
Benahmed 0 0 0 0 0 0 0 2 2
Oued Zem 0 0 0 0 0 0 1 0 1
Khouribga 0 1 0 0 0 0 4 2 7
Benslimane 0 0 0 0 0 2 2 2 6
Marge act ive 2 3 3 4 10 2 37 39 100
c) Les résultats :
Résumé
Valeur singulière de
Proportion d'inertie confiance
Valeur Pris en Corrélation
Di mension singuli ère Inertie Khi-deux Sig. compte Cumul é Ecart-type 2
1 .573 .329 .585 .585 .159 .036
2 .424 .179 .319 .904 .079
3 .188 .035 .063 .967
4 .111 .012 .022 .989
5 .080 .006 .011 1.000
Total .562 56.238 .013 1.000 1.000
Caractéristiques des points lignes
Score dans la
dim ension Contribution
De poi nt à inertie De dim ens ion à inertie
Zone de dim ens ion de poi nt
géographique Masse 1 2 Inertie 1 2 1 2 Total
Settat .330 .238 -.795 .101 .033 .492 .107 .876 .982
Berrchid .510 .179 .407 .051 .028 .200 .184 .704 .887
Benahmed .020 .110 -1.279 .031 .000 .077 .004 .443 .447
Oued Zem .010 .014 1.570 .017 .000 .058 .000 .613 .613
Khouri bga .070 .107 1.018 .054 .001 .171 .009 .569 .577
Bensli mane .060 -2.99 -.113 .308 .937 .002 .999 .001 1.000
Total actif 1.000 .562 1.000 1.000
Année Universitaire : 2021-2022
Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30
Caractéristiques des points colonnes
Score dans
la dimensi on Contribution
De poi nt à
inertie de De dim ens ion à
Secteur dim ension inertie de point
d'activi té de
l'entreprise Masse 1 2 Inertie 1 2 1 2 Total
ITC .020 .312 .961 .019 .003 .044 .058 .407 .465
IAA .030 .270 1.442 .044 .004 .147 .029 .604 .632
IMME .030 .346 .015 .006 .006 .000 .330 .000 .331
ICPC .040 .363 -.458 .010 .009 .020 .306 .358 .663
BTP .100 .374 -.741 .040 .024 .130 .198 .575 .773
Touris me .020 -5.219 -.267 .313 .950 .003 .997 .002 .999
Comm erce .370 .008 .665 .072 .000 .386 .000 .968 .968
Services .390 .063 -.541 .058 .003 .270 .015 .836 .852
Total actif 1.000 .562 1.000 1.000
Points de ligne et de colonne
Symétrique Normalisation
2.0
1.8
1.6
1.4
1.2 Tour isme
1.0 Benslimane
.8
.6
.4
.2 IAA
OuedBenahmed
Khouribga
Zem Ser vices
Commerce ITC
IMME
.0 ICPC
-.2 BTP Settat
-.4 Berr chid
-.6
Dimension 2
-.8
-1.0 Secteur d'activité
-1.2
-1.4 de l'entreprise
-1.6
-1.8
-2.0 Zone géographique
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0
Dimension 1
Travail à faire
1. Quelle est la méthode utilisée et pourquoi ? (1 pt)
2. Donner les tableaux des profils lignes et des profils colonnes pour cette étude et quelle est la
signification d’une valeur dans chaque tableau ? (2 pt)
3. Faire un test khi deux relativement à l’indépendance entre les deux variables. (1 pt)
4. Quel est le nombre maximum de composantes qu’on peut utiliser ? Comment est-il calculé ?
(1 pt)
5. Quel est le taux d'inertie expliquée par le plan principal formé par le 1 er axe et le 2ème axe ?
Interpréter ce résultat (1 pt)
6. Quelles sont les profils qui contribuent le plus à la formation du premier axe ? (1p)
7. Quels sont les profils lignes les mieux représentés par le plan principal ? (1 pt)
8. Faire une analyse de la représentation graphique et répondre à la problématique posée au
début de l’énoncé (2 pt)
Année Universitaire : 2021-2022
Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30
Exercice 2 : (10 points)
On a rassemblé les résultats de 15 enfants de 10 ans à 6 tests d’intelligence (scores 0 a 5). Les variables observées
sont : CUB (cubes de kohs), PUZ (assemblage d’objets), CAL (calcul mental), MEM (mémoire immédiate des
chiffres), COM (compréhension de phrases), VOC (vocabulaire). Le protocole observé est le suivant.
TEST CUB PUZ CAL MEM COM VOC
I1 5 5 4 0 1 1
I2 4 3 3 2 2 1
I3 2 1 2 3 2 2
I4 5 3 5 3 4 3
I5 4 4 3 2 3 2
I6 2 0 1 3 1 1
I7 3 3 4 2 4 4
I8 1 2 1 4 3 3
I9 0 1 0 3 1 0
I10 2 0 1 3 1 0
I11 1 2 1 1 0 1
I12 4 2 4 2 1 2
I13 3 2 3 3 2 3
I14 1 0 0 3 2 2
I15 2 1 1 2 3 2
On traite ces données par une analyse en composante principales normée. Les principaux résultats de cette ACP
sont indiqués ci-dessous
Matrice de corrélation
CUB PUZ CAL MEM COM VOC
CUB 1.000 .732 .921 -.449 .309 .273
PUZ .732 1.000 .751 -.614 .281 .285
CAL .921 .751 1.000 -.369 .408 .487
MEM -.449 -.614 -.369 1.000 .303 .202
COM .309 .281 .408 .303 1.000 .782
VOC .273 .285 .487 .202 .782 1.000
Variance appliquée totale
Valeurs Sommes des carrés
propres chargées
Composante Total % de la variance % cumulés Total % de la variance % cumulés
1 3.258 54.302 54.302 3.258 54.302 54.302
2 1.837 30.619 84.921 1.837 30.619 84.921
3 .443 7.383 92.304
4 .254 4.229 96.534
5 .168 2.799 99.333
6 4.004E-02 .667 100.000
Année Universitaire : 2021-2022
Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30
Représentation des individus dans le premier plan factoriel Projection des variables sur le plan factoriel
2
8 Diagramme de composantes
1,0
7 4 mem com
1 voc
14 13
3 15
,5
6 5
0
9 10
12
2 cal
0,0
cub
-1 puz
Composante 2
11
-,5
-2 1
-1,0
-1,0 -,5 0,0 ,5 1,0
-3
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0 Composante 1
REGR factor score 1 for analysis 1
Travail à faire :
1- Quelle est la méthode utilisée et pourquoi ? (1 pt)
2- Quels sont les tests d’intelligence les plus fortement corrélés entre eux ? (1.5 pt)
3- Quelle est l’inertie expliquée par chacune des composantes principales ? (1 pt)
4- Proposez-vous de retenir combien de facteurs et pourquoi ? (1 pt)
5- Quelles sont les variables qui sont corrélées positivement avec le premier facteur principal ? Quelles sont
celles qui sont corrélées négativement ? Comment peut-on caractériser cet axe par rapport aux variables
de départ (individus) ? (2 pt)
6- Quelles sont les variables qui sont corrélées positivement avec le deuxième facteur principal ? Quelles
sont celles qui sont corrélées négativement ? Comment peut-on caractériser cet axe par rapport aux
variables de départ (individus) ? (2 pt)
7- Faire une analyse de ce problème, en donnant vos interprétations ? (1.5 pt)