0% ont trouvé ce document utile (0 vote)
118 vues19 pages

Projet IA

Cette présentation compare les algorithmes K-means et SVM en utilisant un dataset sur les accidents de la route. K-means est utilisé pour le clustering des données, tandis que SVM est appliqué pour la classification, avec une évaluation de leurs performances respective. La conclusion souligne que le choix entre les deux algorithmes dépend du type de problème et de la nature des données.

Transféré par

Mohamed Briki
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
118 vues19 pages

Projet IA

Cette présentation compare les algorithmes K-means et SVM en utilisant un dataset sur les accidents de la route. K-means est utilisé pour le clustering des données, tandis que SVM est appliqué pour la classification, avec une évaluation de leurs performances respective. La conclusion souligne que le choix entre les deux algorithmes dépend du type de problème et de la nature des données.

Transféré par

Mohamed Briki
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

PROJECT INTELLIGENCE

ARTIFICIAL : ALGORITHME
K_MEANS ET SVM
ELABORE PAR : MOHAMED BRIKI
1
Objectif de la presentation

2
Presentation du dataset

3
• Prétraitement de dataset

Application du K-means
Plan de projet
4

5
Application du SVM

6
Application du SVM sur la resultat du k-means

7
• Evaluation les performances des algorithmeS

7 Conclusion
Objectif de la présentation

Expliquer le fonctionnement des Illustrer leur application sur un dataset Comparer les performances des deux
algorithmes K-means et SVM. réel. méthodes.
Présentation du dataset
accident_data.csv importés depuis Kagel,
Ce dataset contient des informations sur 200 accidents de la route,
incluant l'âge, le genre, la vitesse d'impact, et l'utilisation du casque ou
de la ceinture de sécurité. Il permet d’analyser les facteurs influençant
la survie des victimes.
Présentation du dataset

Vérification les types de données

Vérification les colonnes de


dataset
Prétraitement de dataset
Remplissage la colonne manquante de la colonne
Genre par le mot la plus fréquentes

Remplissage les valeurs manquant de la colonne


Vitesse d'impact par la moyenne
Prétraitement de dataset
Encodage : Transformation des données catégorielles
Prétraitement de dataset
Normalisation (Min-Max scaling) :
A- introduction
•L'algorithme K-Means est une méthode de
clustering non supervisé qui divise un ensemble de
données en K groupes (clusters). Chaque point est
affecté au cluster dont le centre est le plus proche,
en utilisant une mesure de distance euclidienne est
utilisée pour évaluer la similarité entre un point Xj
et le centre d’un cluster μi, définie par la formule
suivante :

•d est le nombre de dimensions des données,


• Xj représente un point de données,
•μi est le centre du cluster.
B-Entraînement du K-means
Pour choisir le nombre optimal de clusters (K), on utilise la méthode du coude, qui analyse
la variation de l’inertie intra-cluster en fonction de K

K=3

K=4
C- RESULTAT K_MEANS:
D-INTERPRETATION

Interprétation de l’Algorithme K_means


• Cluster 0 à 3 : Chaque cluster représente un groupe d'individus ayant des
caractéristiques similaires. Par exemple :
• Cluster 0 : Pourrait inclure des jeunes conducteurs avec des vitesses d'impact
relativement faibles.
•Cluster 1 : Pourrait regrouper des conducteurs d'âge moyen avec des vitesses modérées.
•Cluster 2 : Pourrait inclure des conducteurs âgés avec des vitesses d'impact élevées.
•Cluster 3 : Pourrait représenter des jeunes ou des personnes âgées conduisant à des
vitesses très élevées.
A-INTRODUCTION

L'algorithme SVM (Support Vector Machine) est


un modèle de classification supervisé qui cherche
à séparer les classes en trouvant un hyperplan
optimal tout en maximisant la marge entre elles.
Il est efficace pour les données linéaires et non
linéaires grâce à l'utilisation de noyaux pour
transformer l'espace des données.
B-
Entraînement
SVM:
B-
EVALUATION
SVM:
C-Visualisation des clusters selon
l’algorithme SVM
B-PERFORMANCE DE SVM: B-PERFORMANCE DE K_MEANS:
Conclusion
En conclusion, le choix entre K-means et SVM dépend du type de problème et de la
nature des données. K-means, étant un algorithme non supervisé, est idéal pour
identifier des groupes, tandis que SVM, en tant qu'algorithme supervisé, offre une
meilleure précision en séparant les classes. Des recherches futures pourraient se
concentrer sur l'exploration d'algorithmes de classification plus avancés.
Merci pou votre attention

Vous aimerez peut-être aussi