PROJECT INTELLIGENCE
ARTIFICIAL : ALGORITHME
K_MEANS ET SVM
ELABORE PAR : MOHAMED BRIKI
1
Objectif de la presentation
2
Presentation du dataset
3
• Prétraitement de dataset
Application du K-means
Plan de projet
4
5
Application du SVM
6
Application du SVM sur la resultat du k-means
7
• Evaluation les performances des algorithmeS
7 Conclusion
Objectif de la présentation
Expliquer le fonctionnement des Illustrer leur application sur un dataset Comparer les performances des deux
algorithmes K-means et SVM. réel. méthodes.
Présentation du dataset
accident_data.csv importés depuis Kagel,
Ce dataset contient des informations sur 200 accidents de la route,
incluant l'âge, le genre, la vitesse d'impact, et l'utilisation du casque ou
de la ceinture de sécurité. Il permet d’analyser les facteurs influençant
la survie des victimes.
Présentation du dataset
Vérification les types de données
Vérification les colonnes de
dataset
Prétraitement de dataset
Remplissage la colonne manquante de la colonne
Genre par le mot la plus fréquentes
Remplissage les valeurs manquant de la colonne
Vitesse d'impact par la moyenne
Prétraitement de dataset
Encodage : Transformation des données catégorielles
Prétraitement de dataset
Normalisation (Min-Max scaling) :
A- introduction
•L'algorithme K-Means est une méthode de
clustering non supervisé qui divise un ensemble de
données en K groupes (clusters). Chaque point est
affecté au cluster dont le centre est le plus proche,
en utilisant une mesure de distance euclidienne est
utilisée pour évaluer la similarité entre un point Xj
et le centre d’un cluster μi, définie par la formule
suivante :
•d est le nombre de dimensions des données,
• Xj représente un point de données,
•μi est le centre du cluster.
B-Entraînement du K-means
Pour choisir le nombre optimal de clusters (K), on utilise la méthode du coude, qui analyse
la variation de l’inertie intra-cluster en fonction de K
K=3
K=4
C- RESULTAT K_MEANS:
D-INTERPRETATION
Interprétation de l’Algorithme K_means
• Cluster 0 à 3 : Chaque cluster représente un groupe d'individus ayant des
caractéristiques similaires. Par exemple :
• Cluster 0 : Pourrait inclure des jeunes conducteurs avec des vitesses d'impact
relativement faibles.
•Cluster 1 : Pourrait regrouper des conducteurs d'âge moyen avec des vitesses modérées.
•Cluster 2 : Pourrait inclure des conducteurs âgés avec des vitesses d'impact élevées.
•Cluster 3 : Pourrait représenter des jeunes ou des personnes âgées conduisant à des
vitesses très élevées.
A-INTRODUCTION
L'algorithme SVM (Support Vector Machine) est
un modèle de classification supervisé qui cherche
à séparer les classes en trouvant un hyperplan
optimal tout en maximisant la marge entre elles.
Il est efficace pour les données linéaires et non
linéaires grâce à l'utilisation de noyaux pour
transformer l'espace des données.
B-
Entraînement
SVM:
B-
EVALUATION
SVM:
C-Visualisation des clusters selon
l’algorithme SVM
B-PERFORMANCE DE SVM: B-PERFORMANCE DE K_MEANS:
Conclusion
En conclusion, le choix entre K-means et SVM dépend du type de problème et de la
nature des données. K-means, étant un algorithme non supervisé, est idéal pour
identifier des groupes, tandis que SVM, en tant qu'algorithme supervisé, offre une
meilleure précision en séparant les classes. Des recherches futures pourraient se
concentrer sur l'exploration d'algorithmes de classification plus avancés.
Merci pou votre attention