0% ont trouvé ce document utile (0 vote)
238 vues2 pages

Classifieur KNN pour prédire le diabète

Ce document décrit les étapes pour créer un classifieur KNN pour prédire si une personne aura un diagnostic de diabète positif ou négatif. Il explique comment importer les bibliothèques nécessaires, charger la base de données, préparer les données, diviser les données en apprentissage et test, entraîner le modèle KNN, et évaluer les performances du modèle.

Transféré par

Manal Ess
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
238 vues2 pages

Classifieur KNN pour prédire le diabète

Ce document décrit les étapes pour créer un classifieur KNN pour prédire si une personne aura un diagnostic de diabète positif ou négatif. Il explique comment importer les bibliothèques nécessaires, charger la base de données, préparer les données, diviser les données en apprentissage et test, entraîner le modèle KNN, et évaluer les performances du modèle.

Transféré par

Manal Ess
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

F DUT : Intelligence Artificielle et Technologies Émergentes

Module : Introduction aux sciences des données

TP1 : L’algorithme d’apprentissage automatique KNN

Exercice : Créer un classifieur KNN pour prédire si une personne aura un diagnostic de diabète
positif ou non.
Nous avons un ensemble de données de 768 personnes qui ont été diagnostiquées positives avec
le diabète et d’autres ont été diagnostiquées négatives.
Suivre les étapes suivantes pour créer le classifieur KNN et l’utiliser pour faire des tests :
1. Importer les bibliothèques nécessaires : pandas, numpy, matplotlib, et sklearn.
La bibliothèque sklearn comprend plusieurs fonctions :
- from sklearn.model_selection import train_test_split
- from [Link] import StandardScaler
- from [Link] import KNeighborsClassifier
- from [Link] import confusion_matrix
- from [Link] import plot_confusion_matrix
- from [Link] import f1_score
- from [Link] import accuracy_score
2. Créer un compte sous Kaggle pour télécharger la base de données ‘[Link]’. Utiliser
le lien suivant : [Link]
3. Lire la base de données avec pandas.
4. Afficher la longueur (nombre d’enregistrements) de la base de données.
5. Afficher les 10 premières lignes de la base de données.
6. On remarque que les colonnes 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', et
'BMI' contiennent des valeurs nulles (0). Remplacer les valeurs 0 par la valeur moyenne de
la colonne correspondante.
7. Afficher les 10 premières lignes de la base de données après avoir enlevé les valeurs nulles.
8. Préciser les entrées X du classifieur KNN (les colonnes ‘Pregnancies’, ‘Glucose’,
‘BloodPressure’, ‘SkinThickness’, ‘Insulin’, ‘BMI’, ‘DiabetesPedigreeFunction’, et
‘Age’) et la sortie y du classifieur (la colonne ‘Outcome’)
9. Diviser la base de données en 2 parties : apprentissage (80% du nombre total des
enregistrements) et test (20%). Utiliser la fonction train_test_split.
F DUT : Intelligence Artificielle et Technologies Émergentes
Module : Introduction aux sciences des données

10. Afficher les longueurs des données de la base d’apprentissage et celles de test.
11. Mettre les données d’entrée de la base d’apprentissage et celles de test à l'échelle (Features
scaling). Utiliser les fonctions fit_transform() pour les entrées de la base d’apprentissage
et transform() pour les entrées de la base de test.
12. Afficher les entrées de la base d’apprentissage et de test après mise à l’échelle.
13. Définir le classifieur KNN. Utiliser la fonction ‘KNeighborsClassifier()’. Utiliser la
distance euclidienne pour calculer la similarité entre les données. Faire des tests avec
d’autres distances.
14. Faire l’entrainement du modèle sur les données de la base d’apprentissage en utilisant le
classifieur KNN et la fonction ‘fit()’.
15. Calculer les prédictions sur les données de la base de test en utilisant le classifieur KNN et
la fonction ‘predict()’.
16. Faire l’évaluation du modèle avec la matrice de confusion, F1-score, et la précision
(accuracy).
17. Afficher la matrice de confusion.

Vous aimerez peut-être aussi