Université Hassiba Benbouali de Chlef 2024/2025
Faculté des sciences Master 1 ISIA
Département d’informatique Module: MOAD
Chargée de cours :Mme KROLKRAL
Travaux dirigés N°3
Exercice N°1: Supposons que vous travaillez pour une entreprise de commerce électronique
et que vous souhaitez prédire si un utilisateur va acheter un produit donné en fonction de deux
caractéristiques : le temps passé sur le site Web et le montant total dépensé précédemment.
Vous disposez d'un ensemble de données d'apprentissage qui comprend des informations sur
les utilisateurs et leur comportement d'achat (acheté ou non acheté).
Temps passé (heures) Montant dépensé (en euros) Acheté
4 75 oui
2 55 non
3 60 non
5 85 oui
1 30 non
2 45 oui
- Prédire si un nouvel utilisateur qui passe 3 heures sur le site et a dépensé 70 euros
achètera ou non le produit.
Note : Il est important de normaliser les caractéristiques pour que chacune ait le même poids
dans le calcul de la distance. Vous pouvez utiliser la méthode de mise à l'échelle min-max
suivante:
X X min
X scaled
X max X min
Exercice N°2: Un hôpital utilise un modèle de Machine Learning pour diagnostiquer une
maladie à partir d’examens médicaux. Le modèle prédit si un patient est malade (1) ou non
malade (0).
Après l’évaluation du modèle sur 100 patients, on obtient les résultats suivants :
40 patients malades correctement détectés.
30 patients sains correctement identifiés.
20 patients malades non détectés.
10 patients sains mal classifiés comme malades.
Questions :
1. Construisez la matrice de confusion basée sur ces résultats.
2. Calculez l’exactitude (accuracy) du modèle.
3. Déterminez la sensibilité (recall) et la spécificité (specificity).
4. Expliquez l’impact des faux positifs et faux négatifs dans ce contexte médical.
Exercice N°3 :
Supposons que nous ayons un modèle de classification avec trois classes : A, B et C. Après
avoir testé notre modèle, nous obtenons les résultats suivants représentant la matrice de
confusion sur un ensemble de données de test contenant 150 exemples:
Prédit A Prédit B Prédit C
Réel A 50 10 5
Réel B 5 30 25
Réel C 5 0 40
- Calculer les métriques suivantes et argumentez (macro_score, accuracy).