0% ont trouvé ce document utile (0 vote)
54 vues1 page

TD3 2024 Correction

Le document présente une analyse des données concernant des races de chiens, mettant en évidence des observations confondues et le calcul de l'inertie totale. Il identifie les contributions des catégories aux axes principaux et souligne que certaines caractéristiques, comme l'intelligence et l'agressivité, sont sous-représentées. Enfin, il mentionne les chiens qui influencent le plus les axes principaux de l'analyse.

Transféré par

didiloulijat19
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
54 vues1 page

TD3 2024 Correction

Le document présente une analyse des données concernant des races de chiens, mettant en évidence des observations confondues et le calcul de l'inertie totale. Il identifie les contributions des catégories aux axes principaux et souligne que certaines caractéristiques, comme l'intelligence et l'agressivité, sont sous-représentées. Enfin, il mentionne les chiens qui influencent le plus les axes principaux de l'analyse.

Transféré par

didiloulijat19
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Filières : GI & SI et Big Data, semestre 8

Département : Génie Informatique et Mathématiques

Analyse des données

TD 3
1- Les paires d'individus (buldog, teckel), (chihuahua,pekinois) ont des valeurs identiques
pour les 7 variables.
Cela signifie simplement qu'il y aura des observations confondues.
De même, le couple (dalmatien,labrador) a les mêmes valeurs sur les 6 variables qui seront
analysées ; les points seront encore confondus.

2- Le nombre de modalités actives est égal à 16, ce qui conduit à K-J= 16 - 6 = 10 valeurs
propres non nulles.
L'inertie totale est donc K/J-1=16 /6 -1 = 5/3 ≈ 1,667.

3- Si on retient les valeurs propres supérieures à 1/6, on est conduit à garder 3 valeurs
propres, pour une
inertie totale de 1,08 (64%). Toutefois, on constate une chute très nette des valeurs propres
après la deuxième, et on décide de ne considérer que les deux premiers axes (soit 52% de
l'inertie totale).

4- On regarde les catégories dont les contributions aux axes (données au début de la
section) sont grandes par
rapport à leur poids (au moins deux fois plus).
Axe 1 : d'un côté les chiens légers (POI.1 : 1401 > 2 ×494 (=2 ×ni/np) ) et petits (TAI.1 : 1260 > 2
×432) ; à l'opposé, les chiens très lourds (POI.3 : 660 > 2 × 309).
Axe 2 : d'un côté les chiens moyennement moyennement grands (TAI.2 : 1217 > 2 × 309),
assez rapides (VEL.2 :
1012 > 2 _ 494) ; de l'autre, les chiens lents (VEL.1 : 1752 > 2 _ 617) et soit très lourds (POI.3 :
761 > 2 _ 309) soit très petits (TAI.1 : 959 > 2 _ 432).

5- On regarde la table des cosinus carrés. On remarque que les colonnes contiennent les
cosinus carrés cumulés,
on peut donc directement lire la second colonne du tableau. Les catégories particulièrement mal
représentées sont : INT.3 (924), INT.2 (2024), AGR.1 (1729) et AGR.2 (1729). On peut dire en
général que l'intelligence et l'agressivité ne sont pas prises en compte ici.

6- On regarde les coordonnées, Les chiens qui contribuent le plus au premier plan principal
sont :
Axe 1 : d'un côté dogueall (-1,05) ; de l'autre buldog (1, 01), teckel (1,01)
Axe 2 : d'un côté basset (-1,10), mastiff (-0,88) ; de l'autre boxer (0,88), dalmatie (0,99),
epagneub (1,04), labrador (0,99).

Vous aimerez peut-être aussi