TP KNN

Le document décrit un TP sur la classification avec l'algorithme des k plus proches voisins (k-NN). Il explique le fonctionnement de l'algorithme k-NN et donne comme exercice l'implémentation d'un classificateur k-NN pour prédire si une tumeur mammaire est maligne ou bénigne à partir d'un jeu de données.

Transféré par

Hanane KARDI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

373 vues3 pages

TP KNN

Transféré par

Hanane KARDI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Master Data Science & Big Data

Année 2022-2023
TP : Machine Learning

TP- K-Nearest Neighbors

 KNN

Le but de ce TP est l’application des enseignements au niveau du cours

ML partie, KNN.

Explication :
K plus proches voisins (k-NN) est un algorithme de classification qui utilise les K points les plus
proches pour déterminer la classification d'un ensemble de données.

Voici un exemple de classification avec k-NN : L'image représente un point rond qui est un
échantillon de test et doit être classifié comme un carré ou un triangle.

Dans le cas de K = 3, les 3 voisins les plus proches sont sélectionnés, comme indiqué par le cercle
solide. En examinant les 3 voisins les plus proches, il y a deux triangles et un carré à l'intérieur du

Bonne Chance !
cercle solide. Par conséquent, le point de test devrait être classifié comme un triangle. Maintenant, si
nous augmentons K à 5, cela signifie que nous considérons les 5 voisins les plus proches, comme
indiqué par le cercle en pointillés. En examinant les 5 voisins les plus proches, il y a trois carrés et
deux triangles à l'intérieur du cercle en pointillés. Par conséquent, le point de test devrait être
classifié comme un carré.

Cela montre comment la classification peut varier en fonction du nombre de voisins considérés dans
l'algorithme k-NN.

En choisissant un K plus grand, la décision finale peut être influencée par une majorité de voisins
appartenant à une classe particulière.

Il est important de choisir judicieusement la valeur de K en fonction des caractéristiques des données
et du problème de classification spécifique. Une valeur de K trop petite peut conduire à une
sensibilité excessive aux données d'entraînement, tandis qu'une valeur de K trop grande peut
conduire à une perte d'informations et à une mauvaise généralisation.

Le choix de K dans l'algorithme k-NN est donc crucial pour obtenir de bonnes performances de
classification. Il est recommandé d'expérimenter différentes valeurs de K et d'évaluer les
performances du modèle en utilisant des métriques d'évaluation appropriées telles que l'exactitude,
la précision et le rappel.

Exercice :
Titre : Classification du cancer du sein avec les k-plus proches voisins (k-
NN)

Objectif : Implémenter un classificateur k-plus proches voisins (k-NN)

pour prédire si une tumeur mammaire est maligne ou bénigne en
utilisant le jeu de données sur le cancer du sein.

Instructions :
1- Utilisez le jeu de données "cancer.csv".
2- Importez la bibliothèque Pandas.
3- Chargez le jeu de données "cancer.csv" en utilisant la méthode
read_csv() et stockez-le dans une variable df.
4- Affichez un résumé du jeu de données en utilisant la méthode info().
5- Supprimez la colonne "id" du dataframe en utilisant la méthode
drop().
6- Supprimez la colonne "Unnamed: 32" du dataframe en utilisant la
méthode drop().

Bonne Chance !
7- Divisez le jeu de données en un ensemble d'entraînement (80%) et un
ensemble de test (20%) en utilisant la méthode train_test_split() de la
bibliothèque scikit-learn.
8- Importez le modèle k-plus proches voisins (k-NN) en utilisant la classe
KNeighborsClassifier de la bibliothèque scikit-learn.
9- Instanciez un objet de la classe KNeighborsClassifier en spécifiant le
nombre de voisins à considérer (par exemple, k=5).
10- Entraînez le modèle en utilisant la méthode fit() avec les données
d'entraînement.
11- Faites des prédictions sur l'ensemble de test en utilisant la méthode
predict().
12- Calculez et affichez la matrice de confusion en utilisant la fonction
confusion_matrix() de la bibliothèque scikit-learn.
13- Calculez et affichez l'exactitude (accuracy), la précision (precision) et
le rappel (recall) en utilisant les fonctions appropriées de la
bibliothèque scikit-learn.
14- Tracez un graphique de la précision (accuracy) en fonction de la
valeur de k (nombre de voisins) pour k=1 à k=40. Interprétez les
résultats obtenus et discutez des performances du modèle.

Bonne Chance !

Vous aimerez peut-être aussi

Définition de K-nearest neighbors
Pas encore d'évaluation
Définition de K-nearest neighbors
25 pages
Introduction aux KNN en Machine Learning
Pas encore d'évaluation
Introduction aux KNN en Machine Learning
8 pages
Le KNN
Pas encore d'évaluation
Le KNN
14 pages
Leçon5 KNN
100% (1)
Leçon5 KNN
10 pages
TP4 : Classification avec k-NN en Python
Pas encore d'évaluation
TP4 : Classification avec k-NN en Python
3 pages
Corrigé Examen Kmeans et Clustering
Pas encore d'évaluation
Corrigé Examen Kmeans et Clustering
5 pages
Kmeans
100% (2)
Kmeans
23 pages
Quiz 02-K Nearest Neighbors
100% (1)
Quiz 02-K Nearest Neighbors
1 page
Presentation KNN
Pas encore d'évaluation
Presentation KNN
11 pages
Examen Master 2 ISEFAR : Classification Data-Mining
Pas encore d'évaluation
Examen Master 2 ISEFAR : Classification Data-Mining
3 pages
Introduction à l'apprentissage non supervisé
Pas encore d'évaluation
Introduction à l'apprentissage non supervisé
43 pages
TD4-Clustering1 (Corrigé)
100% (1)
TD4-Clustering1 (Corrigé)
3 pages
Syllabus m1 Gadm Azizi Module Datamining2021 2022
Pas encore d'évaluation
Syllabus m1 Gadm Azizi Module Datamining2021 2022
6 pages
Data Mining CAH
Pas encore d'évaluation
Data Mining CAH
18 pages
Classification supervisée en Machine Learning
Pas encore d'évaluation
Classification supervisée en Machine Learning
11 pages
Introduction au K Nearest Neighbours (KNN)
Pas encore d'évaluation
Introduction au K Nearest Neighbours (KNN)
9 pages
Corrige 02 Sujets Des Concours D'accès Au Doctorat en Systèmes Intelligents Et Apprentissage Automatique Ghardaïa 2022
Pas encore d'évaluation
Corrige 02 Sujets Des Concours D'accès Au Doctorat en Systèmes Intelligents Et Apprentissage Automatique Ghardaïa 2022
17 pages
Introduction à l'Apprentissage Artificiel
Pas encore d'évaluation
Introduction à l'Apprentissage Artificiel
38 pages
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
50% (2)
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
10 pages
MLP Keras : Classification et Régression
Pas encore d'évaluation
MLP Keras : Classification et Régression
11 pages
Traitement Image 2
Pas encore d'évaluation
Traitement Image 2
74 pages
TD Machine Learning
Pas encore d'évaluation
TD Machine Learning
39 pages
Algorithme de Kaprekar en 4 chiffres
100% (1)
Algorithme de Kaprekar en 4 chiffres
2 pages
Introduction aux SVM et classification
Pas encore d'évaluation
Introduction aux SVM et classification
18 pages
Arbres - Decision 18 19
Pas encore d'évaluation
Arbres - Decision 18 19
76 pages
Introduction à l'IA et au Machine Learning
Pas encore d'évaluation
Introduction à l'IA et au Machine Learning
19 pages
Cours 4 Clustering
Pas encore d'évaluation
Cours 4 Clustering
40 pages
Cours - 8 Perceptron SVM
Pas encore d'évaluation
Cours - 8 Perceptron SVM
52 pages
TP 1 - Initiation À La ML
Pas encore d'évaluation
TP 1 - Initiation À La ML
2 pages
Introduction à la Fouille de Données
Pas encore d'évaluation
Introduction à la Fouille de Données
30 pages
Epreuve DM Concours de Doctorat Univ Annaba 2019-2020 (Tchi Drive)
100% (1)
Epreuve DM Concours de Doctorat Univ Annaba 2019-2020 (Tchi Drive)
3 pages
03-Apprentissage Automatique
Pas encore d'évaluation
03-Apprentissage Automatique
63 pages
Introduction à l'algorithme k-NN
Pas encore d'évaluation
Introduction à l'algorithme k-NN
22 pages
Arbre de décision pour Covid-19 et achats
Pas encore d'évaluation
Arbre de décision pour Covid-19 et achats
8 pages
Optimisation des Hyperparamètres en ML
Pas encore d'évaluation
Optimisation des Hyperparamètres en ML
39 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
Structure de Tas et Tri par Tas
Pas encore d'évaluation
Structure de Tas et Tri par Tas
29 pages
Output 4
Pas encore d'évaluation
Output 4
3 pages
DBSCAN
Pas encore d'évaluation
DBSCAN
6 pages
TP4: Apprentissage Supervisé en IA
Pas encore d'évaluation
TP4: Apprentissage Supervisé en IA
5 pages
Introduction au Data Mining et ses enjeux
Pas encore d'évaluation
Introduction au Data Mining et ses enjeux
26 pages
Datamining : Exercices et Corrigés Master
Pas encore d'évaluation
Datamining : Exercices et Corrigés Master
6 pages
Leçon6-Arbre de Decision
100% (2)
Leçon6-Arbre de Decision
25 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
39 pages
Classification Par Arbre de Décision ID3 C4.5 EXC
Pas encore d'évaluation
Classification Par Arbre de Décision ID3 C4.5 EXC
103 pages
7 Apprentissage Non Supervisé
Pas encore d'évaluation
7 Apprentissage Non Supervisé
25 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
71 pages
Techniques de Clustering
100% (2)
Techniques de Clustering
50 pages
Apprentissage Supervise
Pas encore d'évaluation
Apprentissage Supervise
52 pages
TD Machine Regression Python
Pas encore d'évaluation
TD Machine Regression Python
3 pages
Arbres de Décision en Machine Learning
Pas encore d'évaluation
Arbres de Décision en Machine Learning
82 pages
Examen de Réseaux de Neurones - Tlemcen
Pas encore d'évaluation
Examen de Réseaux de Neurones - Tlemcen
4 pages
Examen
Pas encore d'évaluation
Examen
4 pages
Clustering et Similarité des Données
Pas encore d'évaluation
Clustering et Similarité des Données
57 pages
Techniques de Datamining en Cours
Pas encore d'évaluation
Techniques de Datamining en Cours
19 pages
Optimisation des Arbres de Décision
Pas encore d'évaluation
Optimisation des Arbres de Décision
26 pages
Cours DL - Part5 (Prof)
Pas encore d'évaluation
Cours DL - Part5 (Prof)
78 pages
TP-KNN Compress
Pas encore d'évaluation
TP-KNN Compress
3 pages
TP 5: Algorithme Des K Plus Proches Voisins: Préparation Des Données: Distance
Pas encore d'évaluation
TP 5: Algorithme Des K Plus Proches Voisins: Préparation Des Données: Distance
3 pages
Blue Simple Professional CV Resume
Pas encore d'évaluation
Blue Simple Professional CV Resume
1 page
Primitives Usuelles
100% (1)
Primitives Usuelles
2 pages
Manuel D'utilisation Sage ECF
Pas encore d'évaluation
Manuel D'utilisation Sage ECF
90 pages
QCM Word 2007 Level 1 B
100% (5)
QCM Word 2007 Level 1 B
4 pages
Comprendre Internet et ses Technologies
Pas encore d'évaluation
Comprendre Internet et ses Technologies
8 pages
Iec 60904-2
Pas encore d'évaluation
Iec 60904-2
28 pages
COURS L'Analyse Fonctionnelle
Pas encore d'évaluation
COURS L'Analyse Fonctionnelle
5 pages
E. Barbin, Un Prétendant Au Titre de Critère de L'acte Administratif - Présentation Du Finaliste
Pas encore d'évaluation
E. Barbin, Un Prétendant Au Titre de Critère de L'acte Administratif - Présentation Du Finaliste
5 pages
01 - Bits Octets (Cours Élève) SCR
Pas encore d'évaluation
01 - Bits Octets (Cours Élève) SCR
2 pages
Redresseurs Mono
Pas encore d'évaluation
Redresseurs Mono
24 pages
Notions de Base - Rappel
Pas encore d'évaluation
Notions de Base - Rappel
21 pages
Schémas de Câblage Et Prérequis FR
Pas encore d'évaluation
Schémas de Câblage Et Prérequis FR
7 pages
Smartphone Huawei Huawei p20 Lite 128go Rose Da
Pas encore d'évaluation
Smartphone Huawei Huawei p20 Lite 128go Rose Da
1 page
LB Comment Créer Un Serious Game
Pas encore d'évaluation
LB Comment Créer Un Serious Game
42 pages
Principes du Lean et Management Visuel
100% (1)
Principes du Lean et Management Visuel
3 pages
Manuel Atelier 1400ZZR Phase 1 1-5
Pas encore d'évaluation
Manuel Atelier 1400ZZR Phase 1 1-5
99 pages
Évolution des Télécoms au Maroc
Pas encore d'évaluation
Évolution des Télécoms au Maroc
5 pages
Guide d'Installation FreePBX Distro
Pas encore d'évaluation
Guide d'Installation FreePBX Distro
110 pages
Introduction A La Formation en Geomatique Tchotsoua 2019 2020
Pas encore d'évaluation
Introduction A La Formation en Geomatique Tchotsoua 2019 2020
4 pages
Pe Electronique Automobile 2017 Niv4
Pas encore d'évaluation
Pe Electronique Automobile 2017 Niv4
63 pages
Guide complet sur les composants PC
Pas encore d'évaluation
Guide complet sur les composants PC
26 pages
Editions ENI - Référentiel - Power BI Desktop
Pas encore d'évaluation
Editions ENI - Référentiel - Power BI Desktop
5 pages
Tableau Appareils Aspen HYSYS
Pas encore d'évaluation
Tableau Appareils Aspen HYSYS
1 page
Le Système de Freinage
Pas encore d'évaluation
Le Système de Freinage
9 pages
Cahier de Charges - Installation D'une Nouvelle Ligne de Production
Pas encore d'évaluation
Cahier de Charges - Installation D'une Nouvelle Ligne de Production
4 pages
Cours Complet Culture Digitale
Pas encore d'évaluation
Cours Complet Culture Digitale
4 pages
Spécifications Scania Porteur 6x2*4 Gaz
Pas encore d'évaluation
Spécifications Scania Porteur 6x2*4 Gaz
7 pages
Control MP 204 1x235300 A Direct U2
Pas encore d'évaluation
Control MP 204 1x235300 A Direct U2
5 pages
Portes Et Circuits Quantiques
Pas encore d'évaluation
Portes Et Circuits Quantiques
19 pages
Charte de l'audit interne Unédic 2014
Pas encore d'évaluation
Charte de l'audit interne Unédic 2014
10 pages