0% ont trouvé ce document utile (0 vote)
33 vues4 pages

Analyse des Données : Examen Final 2021

Le document présente un examen final pour une classe de 2ème année en Analyse des Données, comprenant deux exercices principaux. Le premier exercice traite d'une analyse factorielle des correspondances entre le secteur d'activité et la zone géographique d'entreprises, tandis que le second exercice concerne une analyse en composantes principales sur les résultats de tests d'intelligence d'enfants. Chaque exercice inclut des questions sur les méthodes utilisées, les résultats et les interprétations des données.

Transféré par

Pascal Malle
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
33 vues4 pages

Analyse des Données : Examen Final 2021

Le document présente un examen final pour une classe de 2ème année en Analyse des Données, comprenant deux exercices principaux. Le premier exercice traite d'une analyse factorielle des correspondances entre le secteur d'activité et la zone géographique d'entreprises, tandis que le second exercice concerne une analyse en composantes principales sur les résultats de tests d'intelligence d'enfants. Chaque exercice inclut des questions sur les méthodes utilisées, les résultats et les interprétations des données.

Transféré par

Pascal Malle
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Année Universitaire : 2021-2022

Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30

Exercice 1 : (10 points)


On applique une analyse factorielle des correspondances sur les deux variables qualitatives « secteur d’activité »
et « zone géographique », sur un ensemble d’entreprises.

a) Problématiques :
Y a-t-il un lien entre les variables étudiées, zone géographique et secteur d’activité ?
À quelle limite, la position géographique de l’entreprise détermine leur secteur d’activité ?
b) Les données :
On pose en ligne, la variable « zone géographique » avec 6 modalités (Settat, Berrechid, Benahmed, Oued Zem,
Khouribga et Benslimane) et en colonne, la variable « secteur d’activité » avec 8 modalités : Industrie Textile et
Cuir (ITC), Industrie Agro- Alimentaire (IAA), Industrie Métallique, Métallurgique et Electrique (IMME),
Industrie Chimique et Para Chimique (ICPC), Bâtiment et Travaux Publics (BTP), Tourisme, Commerce et
Services).

Ta ble au des correspondances global

Secteur d'activité de l'entrepris e


Marge
Zone géographique ITC IA A IMME ICPC BTP Touris me Commerce Servic es ac tive
Settat 0 0 1 2 6 0 6 18 33
Berrchid 2 2 2 2 4 0 24 15 51
Benahmed 0 0 0 0 0 0 0 2 2
Oued Zem 0 0 0 0 0 0 1 0 1
Khouribga 0 1 0 0 0 0 4 2 7
Benslimane 0 0 0 0 0 2 2 2 6
Marge act ive 2 3 3 4 10 2 37 39 100

c) Les résultats :
Résumé

Valeur singulière de
Proportion d'inertie confiance

Valeur Pris en Corrélation


Di mension singuli ère Inertie Khi-deux Sig. compte Cumul é Ecart-type 2
1 .573 .329 .585 .585 .159 .036
2 .424 .179 .319 .904 .079
3 .188 .035 .063 .967
4 .111 .012 .022 .989
5 .080 .006 .011 1.000
Total .562 56.238 .013 1.000 1.000

Caractéristiques des points lignes

Score dans la
dim ension Contribution
De poi nt à inertie De dim ens ion à inertie
Zone de dim ens ion de poi nt
géographique Masse 1 2 Inertie 1 2 1 2 Total
Settat .330 .238 -.795 .101 .033 .492 .107 .876 .982
Berrchid .510 .179 .407 .051 .028 .200 .184 .704 .887
Benahmed .020 .110 -1.279 .031 .000 .077 .004 .443 .447
Oued Zem .010 .014 1.570 .017 .000 .058 .000 .613 .613
Khouri bga .070 .107 1.018 .054 .001 .171 .009 .569 .577
Bensli mane .060 -2.99 -.113 .308 .937 .002 .999 .001 1.000
Total actif 1.000 .562 1.000 1.000
Année Universitaire : 2021-2022

Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30

Caractéristiques des points colonnes

Score dans
la dimensi on Contribution
De poi nt à
inertie de De dim ens ion à
Secteur dim ension inertie de point
d'activi té de
l'entreprise Masse 1 2 Inertie 1 2 1 2 Total
ITC .020 .312 .961 .019 .003 .044 .058 .407 .465
IAA .030 .270 1.442 .044 .004 .147 .029 .604 .632
IMME .030 .346 .015 .006 .006 .000 .330 .000 .331
ICPC .040 .363 -.458 .010 .009 .020 .306 .358 .663
BTP .100 .374 -.741 .040 .024 .130 .198 .575 .773
Touris me .020 -5.219 -.267 .313 .950 .003 .997 .002 .999
Comm erce .370 .008 .665 .072 .000 .386 .000 .968 .968
Services .390 .063 -.541 .058 .003 .270 .015 .836 .852
Total actif 1.000 .562 1.000 1.000

Points de ligne et de colonne


Symétrique Normalisation
2.0
1.8
1.6
1.4
1.2 Tour isme
1.0 Benslimane
.8
.6
.4
.2 IAA
OuedBenahmed
Khouribga
Zem Ser vices
Commerce ITC
IMME
.0 ICPC
-.2 BTP Settat
-.4 Berr chid
-.6
Dimension 2

-.8
-1.0 Secteur d'activité
-1.2
-1.4 de l'entreprise
-1.6
-1.8
-2.0 Zone géographique
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0

Dimension 1

Travail à faire
1. Quelle est la méthode utilisée et pourquoi ? (1 pt)
2. Donner les tableaux des profils lignes et des profils colonnes pour cette étude et quelle est la
signification d’une valeur dans chaque tableau ? (2 pt)
3. Faire un test khi deux relativement à l’indépendance entre les deux variables. (1 pt)
4. Quel est le nombre maximum de composantes qu’on peut utiliser ? Comment est-il calculé ?
(1 pt)
5. Quel est le taux d'inertie expliquée par le plan principal formé par le 1 er axe et le 2ème axe ?
Interpréter ce résultat (1 pt)
6. Quelles sont les profils qui contribuent le plus à la formation du premier axe ? (1p)
7. Quels sont les profils lignes les mieux représentés par le plan principal ? (1 pt)
8. Faire une analyse de la représentation graphique et répondre à la problématique posée au
début de l’énoncé (2 pt)
Année Universitaire : 2021-2022

Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30

Exercice 2 : (10 points)


On a rassemblé les résultats de 15 enfants de 10 ans à 6 tests d’intelligence (scores 0 a 5). Les variables observées
sont : CUB (cubes de kohs), PUZ (assemblage d’objets), CAL (calcul mental), MEM (mémoire immédiate des
chiffres), COM (compréhension de phrases), VOC (vocabulaire). Le protocole observé est le suivant.
TEST CUB PUZ CAL MEM COM VOC
I1 5 5 4 0 1 1
I2 4 3 3 2 2 1
I3 2 1 2 3 2 2
I4 5 3 5 3 4 3
I5 4 4 3 2 3 2
I6 2 0 1 3 1 1
I7 3 3 4 2 4 4
I8 1 2 1 4 3 3
I9 0 1 0 3 1 0
I10 2 0 1 3 1 0
I11 1 2 1 1 0 1
I12 4 2 4 2 1 2
I13 3 2 3 3 2 3
I14 1 0 0 3 2 2
I15 2 1 1 2 3 2

On traite ces données par une analyse en composante principales normée. Les principaux résultats de cette ACP
sont indiqués ci-dessous

Matrice de corrélation
CUB PUZ CAL MEM COM VOC
CUB 1.000 .732 .921 -.449 .309 .273
PUZ .732 1.000 .751 -.614 .281 .285
CAL .921 .751 1.000 -.369 .408 .487
MEM -.449 -.614 -.369 1.000 .303 .202
COM .309 .281 .408 .303 1.000 .782
VOC .273 .285 .487 .202 .782 1.000

Variance appliquée totale


Valeurs Sommes des carrés
propres chargées

Composante Total % de la variance % cumulés Total % de la variance % cumulés


1 3.258 54.302 54.302 3.258 54.302 54.302
2 1.837 30.619 84.921 1.837 30.619 84.921
3 .443 7.383 92.304
4 .254 4.229 96.534
5 .168 2.799 99.333
6 4.004E-02 .667 100.000
Année Universitaire : 2021-2022

Examen Final
CLASSE : 2éme année
MATIERE : Analyse des Données PROFESSEUR : AHDIL IMANE
Date : 11 Novembre 2021 DUREE : 1h30

Représentation des individus dans le premier plan factoriel Projection des variables sur le plan factoriel

2
8 Diagramme de composantes
1,0
7 4 mem com
1 voc
14 13
3 15
,5

6 5
0
9 10
12
2 cal
0,0
cub
-1 puz
Composante 2

11
-,5

-2 1

-1,0
-1,0 -,5 0,0 ,5 1,0
-3
-2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0 Composante 1

REGR factor score 1 for analysis 1

Travail à faire :

1- Quelle est la méthode utilisée et pourquoi ? (1 pt)


2- Quels sont les tests d’intelligence les plus fortement corrélés entre eux ? (1.5 pt)
3- Quelle est l’inertie expliquée par chacune des composantes principales ? (1 pt)
4- Proposez-vous de retenir combien de facteurs et pourquoi ? (1 pt)
5- Quelles sont les variables qui sont corrélées positivement avec le premier facteur principal ? Quelles sont
celles qui sont corrélées négativement ? Comment peut-on caractériser cet axe par rapport aux variables
de départ (individus) ? (2 pt)
6- Quelles sont les variables qui sont corrélées positivement avec le deuxième facteur principal ? Quelles
sont celles qui sont corrélées négativement ? Comment peut-on caractériser cet axe par rapport aux
variables de départ (individus) ? (2 pt)
7- Faire une analyse de ce problème, en donnant vos interprétations ? (1.5 pt)

Vous aimerez peut-être aussi