Algorithme K-Nearest Neighbors (KNN) Analyse Et Implémentation

Le document présente l'algorithme K-Nearest Neighbors (KNN) et son implémentation pour la classification de données médicales, en détaillant les étapes de préparation, normalisation, entraînement et évaluation du modèle. Il compare également KNN à l'algorithme Support Vector Machine (SVM), soulignant les performances respectives des deux méthodes. La conclusion insiste sur l'importance de choisir l'algorithme approprié en fonction des caractéristiques des données et des objectifs d'analyse.

Transféré par

Nour Krid

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

34 vues21 pages

Algorithme K-Nearest Neighbors (KNN) Analyse Et Implémentation

Transféré par

Nour Krid

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Algorithme K-

Nearest
Neighbors (KNN)

Analyse et
Implémentation
Plan :

01 Theory lesson
You can describe the topic of the section
here
02 Features of the topic
You can describe the topic of the section
here
03 Tips
You can describe the topic of the section
here
04 Practical exercise
You can describe the topic of the section
here
Qu'est-ce que KNN ?
• Méthode d'apprentissage supervisé.

• Prédit la classe d'un échantillon en fonction des 'k' voisins les plus
proches.

• Basé sur la distance (euclidienne, manhattan, etc.) pour identifier les

voisins.
Description de la Base de Données

• Structure de la Base de Données :

La base de données contient plusieurs colonnes, dont :
température : Valeurs de température (en degrés, probablement Celsius).
pouls : Fréquence cardiaque (en battements par minute).
oxygène : Taux d'oxygène dans le sang (en pourcentage).
glycémie : Taux de glucose dans le sang (en mg/dL).
tension : Tension artérielle (en mmHg).
label : Variable cible indiquant la classe (0 ou 1), probablement liée à la
présence ou à l'absence
d'une maladie.
• Valeurs Manquantes :
Il y a 52 lignes avec des valeurs manquantes dans l'ensemble des colonnes.
Cela
peut poser des défis lors de l'analyse, car les algorithmes d'apprentissage
automatique ne peuvent pas gérer les valeurs manquantes directement.

—
Chargement des données
import pandas as pds # Importation de la bibliothèque pandas sous le nom 'pds’
dataset = pds.read_csv('/content/drive/MyDrive/maladie_observations.csv’) #
Chargement du fichier CSV dans un DataFrame
[Link]().sum() # Vérification du nombre de valeurs manquantes dans chaque
colonnedataset = [Link]() # Suppression des lignes contenant des valeurs
manquantes
Visualisation des données
import seaborn as sns # Importation de la bibliothèque Seaborn pour la visualisation des données
import [Link] as plt # Importation de Matplotlib pour afficher les graphiques
[Link](x='label', data=dataset) # Création d'un graphique en barres comptant les occurrences de
chaque catégorie dans la colonne 'label'
[Link]() # Affichage du graphique
Préparation des données
X = dataset[['temperature', 'pouls', 'oxygene', 'glycemie', 'tension']] # Sélection des
caractéristiques (features) utilisées pour l'entraînement du modèle
y = dataset['label'] # Définition de la variable cible (label) pour la classification
from sklearn.model_selection import train_test_split # Importation de la fonction pour
diviser les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=101)
# Division des données :
# - 60% pour l'entraînement
# - 40% pour le test
# - random_state=101 permet de reproduire la même répartition à chaque exécution
Normalisation des données

from [Link] import StandardScaler # Importation du module

pour la normalisation des données
scaler = StandardScaler() # Création d'un objet StandardScaler pour
normaliser les données
[Link](X_train) # Apprentissage des paramètres de normalisation
(moyenne et écart-type) sur l'ensemble d'entraînement
X_train_norm = [Link](X_train) # Transformation des données
d'entraînement en appliquant la normalisation
X_test_norm = [Link](X_test) # Transformation des données de
test en utilisant les mêmes paramètres appris sur X_train
Entraînement du modèle KNN

● from [Link] import KNeighborsClassifier # Importation du modèle de

classification KNN (K-Nearest Neighbors)
● knn = KNeighborsClassifier(n_neighbors=1) # Création d'un modèle KNN avec 1 voisin
● [Link](X_train_norm, y_train) # Entraînement du modèle sur les données normalisées
d'entraînement
Prédiction et évaluation
• y_pred = [Link](X_test_norm) # Prédiction des classes sur les données de
test normalisées
from sklearn import metrics # Importation du module metrics pour évaluer les
performances
# Affichage du rapport de classification, qui donne des métriques comme la précision, le
rappel et le F1-score
• print(metrics.classification_report(y_test, y_pred))
# Affichage de la matrice de confusion pour voir les vrais positifs, faux positifs, vrais
négatifs, et faux négatifs
• print(metrics.confusion_matrix(y_test, y_pred))
Algorithme
Support
Vector
Machine
(SVM)
Analyse et Implémentation
Qu'est-ce que SVM ?

• Méthode d'apprentissage supervisé.

• Trouve l'hyperplan qui sépare les classes avec le plus grand marge.
• Utilisé pour la classification et la régression.
Chargement des données
import pandas as pds # Importation de la bibliothèque pandas sous le nom 'pds’
dataset = pds.read_csv('/content/drive/MyDrive/maladie_observations.csv’) # Chargement du
fichier CSV dans un DataFrame
[Link]().sum() # Vérification du nombre de valeurs manquantes dans chaque
colonnedataset = [Link]() # Suppression des lignes contenant des valeurs manquantes
Préparation des données

● x = [Link][:, 0:-1].values # Sélection des caractéristiques (toutes les colonnes sauf la

dernière)
● y = [Link][:, -1].values # Sélection de la cible (la dernière colonne)
● from sklearn.model_selection import train_test_split # Importation de la fonction pour
diviser les données
# Division des données en ensembles d'entraînement et de test (80% pour l'entraînement et 20%
pour le test)
● x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)
Entraînement du modèle SVM

● from [Link] import SVC # Importation du classificateur SVM avec un noyau linéaire
● classifier = SVC(kernel='linear', random_state=0) # Création du classificateur SVM avec
noyau linéaire
● [Link](x_train, y_train) # Entraînement du classificateur sur les données
d'entraînement
Prédiction et évaluation
• y_pred = [Link](x_test) # Prédiction des classes sur les données de test avec le
classificateur SVM
• from [Link] import classification_report # Importation du module pour évaluer les
performances
# Affichage du rapport de classification qui fournit des métriques comme la précision, le rappel et le F1-
score
• print(classification_report(y_test, y_pred))
# Affichage de la matrice de confusion qui montre les vrais positifs, faux positifs, vrais négatifs et faux
négatifs
• print(metrics.confusion_matrix(y_test, y_pred))
Matrice de confusion
from [Link] import ConfusionMatrixDisplay # Importation de la classe pour afficher la matrice
de confusion
# Affichage de la matrice de confusion avec les étiquettes des classes ['0', '1']
• cm_display = ConfusionMatrixDisplay(confusion_matrix=confusion_matrix, display_labels=['0', '1'])
# Visualisation de la matrice de confusion sous forme graphique
• cm_display.plot()
Comparaison des Résultats

KNN:
• Précision élevée, rappel parfait pour la classe 1.
• Matrice de confusion montre un excellent classement.
SVM:
• Précision parfaite pour la classe 0, légèrement inférieur pour la classe 1.
• Matrice de confusion montre quelques faux positifs et faux négatifs
Conclusion :

•La sélection de l'algorithme d'apprentissage automatique doit être basée sur les
caractéristiques des données et les objectifs de l'analyse.
•KNN est simple et efficace pour des ensembles de données de petite à moyenne taille.
•SVM est plus robuste et adapté aux données complexes ou volumineuses.
•L'évaluation comparative des algorithmes est essentielle pour optimiser les résultats et
prendre des décisions éclairées en intelligence artificielle.
Merci pour
votre attention

Vous aimerez peut-être aussi

Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
TD2 KNN Classification
Pas encore d'évaluation
TD2 KNN Classification
12 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Med Yassine Tanabene Rapport TP2
Pas encore d'évaluation
Med Yassine Tanabene Rapport TP2
13 pages
Introduction à l'Intelligence Artificielle
Pas encore d'évaluation
Introduction à l'Intelligence Artificielle
11 pages
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
Pas encore d'évaluation
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
14 pages
TP Classificateur KNN - Ipynb - Colab
Pas encore d'évaluation
TP Classificateur KNN - Ipynb - Colab
8 pages
Classification supervisée en Machine Learning
Pas encore d'évaluation
Classification supervisée en Machine Learning
11 pages
Classifieur KNN pour prédire le diabète
Pas encore d'évaluation
Classifieur KNN pour prédire le diabète
2 pages
Classification du cancer du sein avec MLP
Pas encore d'évaluation
Classification du cancer du sein avec MLP
5 pages
TP2 SVM 2
Pas encore d'évaluation
TP2 SVM 2
3 pages
Classification du cancer du sein par SVM
Pas encore d'évaluation
Classification du cancer du sein par SVM
6 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Classification K-NN avec IRIS et MNIST
Pas encore d'évaluation
Classification K-NN avec IRIS et MNIST
4 pages
Classification SVM sur données pulsar
Pas encore d'évaluation
Classification SVM sur données pulsar
4 pages
Classification Et Évaluation: Objectif Du TP 4
Pas encore d'évaluation
Classification Et Évaluation: Objectif Du TP 4
5 pages
TP4: Apprentissage Supervisé en IA
Pas encore d'évaluation
TP4: Apprentissage Supervisé en IA
5 pages
Comparaison des classifieurs d'images
Pas encore d'évaluation
Comparaison des classifieurs d'images
6 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
74 pages
Le KNN
Pas encore d'évaluation
Le KNN
14 pages
Traitement de données et prédiction de classes
Pas encore d'évaluation
Traitement de données et prédiction de classes
2 pages
TP4 - KNN - EX1 K
Pas encore d'évaluation
TP4 - KNN - EX1 K
4 pages
KNN pour prédire le Churn client
Pas encore d'évaluation
KNN pour prédire le Churn client
2 pages
TP4 1
Pas encore d'évaluation
TP4 1
5 pages
TP4 : Classification avec k-NN en Python
Pas encore d'évaluation
TP4 : Classification avec k-NN en Python
3 pages
Application de l'algorithme K-NN
Pas encore d'évaluation
Application de l'algorithme K-NN
3 pages
Chapitre - MachineLearning - Arbre de Decison
Pas encore d'évaluation
Chapitre - MachineLearning - Arbre de Decison
31 pages
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
Pas encore d'évaluation
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
14 pages
KNN pour la classification des iris
Pas encore d'évaluation
KNN pour la classification des iris
1 page
TP2: Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
TP2: Apprentissage Supervisé Avec Python: Objectifs
3 pages
Analyse Et Prédiction Des Crises Cardiaques
Pas encore d'évaluation
Analyse Et Prédiction Des Crises Cardiaques
30 pages
TP 5: Algorithme Des K Plus Proches Voisins: Préparation Des Données: Distance
Pas encore d'évaluation
TP 5: Algorithme Des K Plus Proches Voisins: Préparation Des Données: Distance
3 pages
Analyse des modèles de classification ML
Pas encore d'évaluation
Analyse des modèles de classification ML
2 pages
SVM pour classifier fruits et salaires
Pas encore d'évaluation
SVM pour classifier fruits et salaires
4 pages
Entraînement de modèles KNN avec Iris
Pas encore d'évaluation
Entraînement de modèles KNN avec Iris
18 pages
TP-KNN Compress
Pas encore d'évaluation
TP-KNN Compress
3 pages
CM4 KNN
Pas encore d'évaluation
CM4 KNN
38 pages
Évaluation des modèles en Machine Learning
Pas encore d'évaluation
Évaluation des modèles en Machine Learning
51 pages
TD1 KNN Classification Algorithmique
Pas encore d'évaluation
TD1 KNN Classification Algorithmique
7 pages
Introduction à la classification supervisée
Pas encore d'évaluation
Introduction à la classification supervisée
20 pages
Tutoriels Utilisation de KNN
Pas encore d'évaluation
Tutoriels Utilisation de KNN
10 pages
TP KNN
Pas encore d'évaluation
TP KNN
3 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
7 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
Machine Learning Python Guide
100% (1)
Machine Learning Python Guide
6 pages
Rapport de classification SVM avec sklearn
Pas encore d'évaluation
Rapport de classification SVM avec sklearn
1 page
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
03-SVM Avancé - Faire Le Graphique
Pas encore d'évaluation
03-SVM Avancé - Faire Le Graphique
4 pages
Utilisation de KNN en Python : Guide Pratique
Pas encore d'évaluation
Utilisation de KNN en Python : Guide Pratique
6 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
Resume Machine Learning
Pas encore d'évaluation
Resume Machine Learning
2 pages
Guide Complet sur l'Apprentissage Machine
Pas encore d'évaluation
Guide Complet sur l'Apprentissage Machine
26 pages
K-plus Proches Voisins : Classification et Régression
Pas encore d'évaluation
K-plus Proches Voisins : Classification et Régression
3 pages
ML 1
Pas encore d'évaluation
ML 1
41 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
K-Means Clustering pour Clients et Revenus
Pas encore d'évaluation
K-Means Clustering pour Clients et Revenus
4 pages
Projet Machine Learning
Pas encore d'évaluation
Projet Machine Learning
21 pages
TP 6 Algorithme KNN
Pas encore d'évaluation
TP 6 Algorithme KNN
7 pages
Méthodes Numériques en Génie Civil
Pas encore d'évaluation
Méthodes Numériques en Génie Civil
3 pages
Exercices - Corriges - Algorithme Genetique
Pas encore d'évaluation
Exercices - Corriges - Algorithme Genetique
6 pages
Transformations nucléaires en physique
Pas encore d'évaluation
Transformations nucléaires en physique
10 pages
COURS MDC2 - Terre Cuite
100% (1)
COURS MDC2 - Terre Cuite
5 pages
Les Paroles Rapportées
Pas encore d'évaluation
Les Paroles Rapportées
3 pages
Effet de levier et rentabilité financière
Pas encore d'évaluation
Effet de levier et rentabilité financière
2 pages
Bilan Radiatif de la Terre
Pas encore d'évaluation
Bilan Radiatif de la Terre
2 pages
Introduction aux Équations Différentielles
Pas encore d'évaluation
Introduction aux Équations Différentielles
110 pages
Chapitre 3 - Optique Physique
Pas encore d'évaluation
Chapitre 3 - Optique Physique
29 pages
VarioCam Plus de Porsche
Pas encore d'évaluation
VarioCam Plus de Porsche
3 pages
TS Ex. Sur Les Limites de Fonctions Par Comparaison
Pas encore d'évaluation
TS Ex. Sur Les Limites de Fonctions Par Comparaison
4 pages
Lexique Simplifié Du Vocabulaire Télécommunication
Pas encore d'évaluation
Lexique Simplifié Du Vocabulaire Télécommunication
10 pages
Demonter Et Remonter Radiateur Eau Chaude
Pas encore d'évaluation
Demonter Et Remonter Radiateur Eau Chaude
4 pages
Exploitation Ferroviaire DIF (Voie Et Ouvrages)
Pas encore d'évaluation
Exploitation Ferroviaire DIF (Voie Et Ouvrages)
29 pages
Diagnostic Des Machines Tournantes
Pas encore d'évaluation
Diagnostic Des Machines Tournantes
8 pages
Emploi Du Temps GM S1 2025 - 2026 V16
Pas encore d'évaluation
Emploi Du Temps GM S1 2025 - 2026 V16
8 pages
Dev3 2025 4ème
Pas encore d'évaluation
Dev3 2025 4ème
2 pages
TMEL - Automatisme Schèma A3
Pas encore d'évaluation
TMEL - Automatisme Schèma A3
4 pages
Puissance ELEC PDF
Pas encore d'évaluation
Puissance ELEC PDF
8 pages
Math c4
Pas encore d'évaluation
Math c4
4 pages
Série1 20 21
Pas encore d'évaluation
Série1 20 21
4 pages
Intégrales au Bac Économie 2023
Pas encore d'évaluation
Intégrales au Bac Économie 2023
4 pages
Galbe Manche Brun Maurel
Pas encore d'évaluation
Galbe Manche Brun Maurel
4 pages
Exercices d'Algèbre Linéaire - TD 1
Pas encore d'évaluation
Exercices d'Algèbre Linéaire - TD 1
8 pages
12 Brochure TD
100% (2)
12 Brochure TD
22 pages
Dm5eme (1) - Copie
Pas encore d'évaluation
Dm5eme (1) - Copie
2 pages
SIG Notion
Pas encore d'évaluation
SIG Notion
6 pages
TD - Chapitre 4 - Correcteur Numerique
Pas encore d'évaluation
TD - Chapitre 4 - Correcteur Numerique
3 pages
TD2-grue MODELISATION
Pas encore d'évaluation
TD2-grue MODELISATION
4 pages
Introduction aux Codes Cycliques
Pas encore d'évaluation
Introduction aux Codes Cycliques
17 pages