0% ont trouvé ce document utile (0 vote)
125 vues7 pages

Analyse Factorielle et Répartition des Prix Nobel

serie TD2

Transféré par

hafsalamrabat
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
125 vues7 pages

Analyse Factorielle et Répartition des Prix Nobel

serie TD2

Transféré par

hafsalamrabat
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Sidi Mohamed Ben Abdellah

Ecole Nationale des Sciences Appliquées Fès ENSAF


Département Génie Industriel

Analyse de Données
Travaux Dirigés 2, GESI2
Pr : M. Sayyouri

Exercice 1
On considère le tableau de contingence suivant croisant deux variables qualitatives V1 et
V2 à trois modalités (respectivement x, y, z et a, b, c).

Questions

1. Dans le cadre de l’étude du lien de dépendance entre les variables V1 et V2, déterminer
le tableau des effectifs théoriques attendus sous l’hypothèse d’indépendance.
2. Calculer l’indicateur global de distance χ2 entre les deux tableaux.

On désire maintenant poursuivre l’étude du lien de dépendance entre les deux variables à
l’aide d’une analyse factorielle des correspondances.

3. Calculer la marge ligne et la marge colonne du Tableau 1.


4. Calculer les profils lignes ainsi que les profils colonnes.
5. Quels sont les poids attribués à chacun des profils-lignes ? Même question pour les
profils-colonnes.
6. Calculer le centre de gravité des profils lignes et celui des profils colonnes
7. Déterminer l’inertie totale associée au nuage des profils lignes. Comment la valeur de
l’inertie obtenue est-elle liée à la valeur de D2 calculées à la question 2 ?

On réalise l’AFC du Tableau 1 (après centrage des données). Un extrait des résultats est
fourni comme suit :

1
8. Combien d’axes factoriels l’analyse produit-elle ? Rappeler la formule utilisée.
9. Calculer l’inertie de l’axe 2.
10. Rappeler les formules quasi barycentriques liant les coordonnées des modalités lignes
aux coordonnées des modalités colonnes.
11. En déduire les coordonnées des modalités x, y, et z sur l’axe 1 puis sur l’axe 2.
12. Construire la représentation superposée des modalités lignes et des modalités colonnes
pour les axes 1 et 2.
13. Soit la modalité ligne supplémentaire t dont les valeurs sont données dans le Tableau
2. Calculer son profil. En déduire sa position sur le plan factoriel de la question
précédente.

Exercice 2
On étudie la répartition de 296 prix Nobel selon le pays (8 pays : USA, Grande-Bretagne,
République Fédérale Allemande, France) et la discipline (6 disciplines : Chimie, Economies,
Littérature, Médecine, Paix, Physique). Sous forme de tableau de contingence, les données
sont les suivantes :

Chimie Economie Littérature Médecine Paix Physique Somme


Allemagne 24 1 8 18 5 24 80
Canada 4 3 2 4 1 4 18
France 8 3 11 12 10 9 53
GB 23 6 7 26 11 20 93
Italie 1 1 6 5 1 5 19
Japon 6 0 2 3 1 11 23
Russie 4 3 5 2 3 10 27
USA 51 43 8 70 19 66 257
Somme 121 60 49 140 51 149 570

1. Réalisez une AFC en utilisant le tableau de données ci-dessus.


2. Interprétez les résultats de l'AFC, en répondant notamment aux questions suivantes :
a. La répartition des prix Nobel par discipline est-elle la même pour les 8 pays ?
b. Quels sont les pays les plus proches du point de vue du type de prix Nobel reçu ?
c. Quels sont les pays les plus atypiques ?

2
Exercice 3

Une entreprise veut choisir un nom pour un nouveau produit, qui doit paraître de
qualité supérieure, prestigieux, luxueux, convenant à un public masculin,
connaisseur, raffiné, distingué, de niveau socio-économique élevé.
L'entreprise hésite entre 12 marques (cf 1ère ligne du tableau ci-dessous). Pour faire
un choix entre ces marques, un échantillon de clients potentiels a été interrogé. Onze
attributs leur étaient proposés (cf. 1ère colonne du tableau). Pour chaque attribut,
la personne interrogée devait désigner une ou plusieurs marques auxquelles
l'attribut se rapportait le mieux.

Les résultats obtenus sont les suivants :

On traite ce tableau par une méthode d'analyse des données multidimensionnelles.


Les principaux résultats sont rassemblés dans les tableaux et graphiques ci-
dessous :
Fréquences

3
Fréquences lignes

Fréquences colonnes

Taux de liaison

4
Valeurs propres

Résultats relatifs aux lignes

Résultats relatifs aux colonnes

5
Questions

1. Quelle est la méthode d'analyse utilisée ici ? Pourquoi utilise-t-on cette méthode?
2. a) Dans le tableau des fréquences lignes, on lit 20,35% à l'intersection de la ligne
"sobre-élégant" et de la colonne "alezan". Comment a été obtenue cette valeur ?
Que signifie-t-elle ?
b) Comparer qualitativement le profil de la marque "Corsaire" au profil moyen.
3. a) La première valeur indiquée dans le tableau des taux de liaison est -0,868.
Indiquer le calcul qui a permis d'obtenir cette valeur.
b) Au vu du tableau des taux de liaison, indiquer une modalité ligne et une
modalité colonne qui "s'attirent". Indiquer une modalité ligne et une modalité
colonne qui "se repoussent".
b) Quel est le taux de liaison maximum du tableau ? Comment pourrait-on
exprimer d'une autre façon le résultat correspondant à ce taux de liaison.
4. Le coefficient Phi-2 de ce tableau vaut 0,60855. Relier ce résultat aux valeurs
propres d'une part, au khi-2 du tableau d'autre part.
5. Au vu du tableau des valeurs propres, combien de variables factorielles faudrait-
il étudier dans le cadre d'une étude complète des données observées
6. a) En utilisant le tableau des résultats relatifs aux lignes, calculer la distance du
point représentant la modalité "Nouveau-riche" à l'origine du repère, dans
l'espace de dimension 3 défini par les 3 premiers axes factoriels.
b) Rappeler la définition de la notion de qualité de représentation d'un point.
c) En utilisant la qualité de représentation indiquée dans le tableau, calculer la

6
distance du point représentant la modalité "Nouveau-riche" à l'origine du repère
dans l'espace de dimension 10 défini par l'ensemble des axes factoriels.
d) Mêmes questions pour le point représentant la modalité "Sobre-élégant".
e) Dans la représentation en 3 dimensions, "Nouveau-riche" est plus près du
profil moyen que "Sobre-élégant". En est-il de même dans la réalité, c'est-à-dire
dans l'espace de dimension 10 ?
7. Etude de la première variable factorielle
a) On considère le nuage des attributs. Quels sont les individus dont la
contribution est supérieure à la moyenne ? Pour chacun d'eux, préciser le signe
de la coordonnée correspondante. Comment peut-on interpréter cet axe en
termes d'opposition entre attributs.
b) Même question pour le nuage des marques envisagées.
8. Mener une étude analogue pour la deuxième variable.
9. Faire une synthèse des deux études précédentes en décrivant les résultats obtenus dans le
premier plan factoriel.
10. A votre avis, quelle est la marque qui a finalement été retenue par l'entreprise ?

Vous aimerez peut-être aussi