Filières : GI & SI et Big Data, semestre 8
Département : Génie Informatique et Mathématiques
Analyse des données
TD 3
1- Les paires d'individus (buldog, teckel), (chihuahua,pekinois) ont des valeurs identiques
pour les 7 variables.
Cela signifie simplement qu'il y aura des observations confondues.
De même, le couple (dalmatien,labrador) a les mêmes valeurs sur les 6 variables qui seront
analysées ; les points seront encore confondus.
2- Le nombre de modalités actives est égal à 16, ce qui conduit à K-J= 16 - 6 = 10 valeurs
propres non nulles.
L'inertie totale est donc K/J-1=16 /6 -1 = 5/3 ≈ 1,667.
3- Si on retient les valeurs propres supérieures à 1/6, on est conduit à garder 3 valeurs
propres, pour une
inertie totale de 1,08 (64%). Toutefois, on constate une chute très nette des valeurs propres
après la deuxième, et on décide de ne considérer que les deux premiers axes (soit 52% de
l'inertie totale).
4- On regarde les catégories dont les contributions aux axes (données au début de la
section) sont grandes par
rapport à leur poids (au moins deux fois plus).
Axe 1 : d'un côté les chiens légers (POI.1 : 1401 > 2 ×494 (=2 ×ni/np) ) et petits (TAI.1 : 1260 > 2
×432) ; à l'opposé, les chiens très lourds (POI.3 : 660 > 2 × 309).
Axe 2 : d'un côté les chiens moyennement moyennement grands (TAI.2 : 1217 > 2 × 309),
assez rapides (VEL.2 :
1012 > 2 _ 494) ; de l'autre, les chiens lents (VEL.1 : 1752 > 2 _ 617) et soit très lourds (POI.3 :
761 > 2 _ 309) soit très petits (TAI.1 : 959 > 2 _ 432).
5- On regarde la table des cosinus carrés. On remarque que les colonnes contiennent les
cosinus carrés cumulés,
on peut donc directement lire la second colonne du tableau. Les catégories particulièrement mal
représentées sont : INT.3 (924), INT.2 (2024), AGR.1 (1729) et AGR.2 (1729). On peut dire en
général que l'intelligence et l'agressivité ne sont pas prises en compte ici.
6- On regarde les coordonnées, Les chiens qui contribuent le plus au premier plan principal
sont :
Axe 1 : d'un côté dogueall (-1,05) ; de l'autre buldog (1, 01), teckel (1,01)
Axe 2 : d'un côté basset (-1,10), mastiff (-0,88) ; de l'autre boxer (0,88), dalmatie (0,99),
epagneub (1,04), labrador (0,99).