0% ont trouvé ce document utile (0 vote)

89 vues4 pages

TP3 SVM

Ce document présente une séance de travaux pratiques sur l'utilisation des machines à vecteurs de support (SVM) pour la classification de données avec Python et Scikit-learn. Il décrit le chargement des données Iris, la modélisation SVM linéaire et non linéaire, et l'optimisation des hyperparamètres.

Transféré par

David

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

89 vues4 pages

TP3 SVM

Transféré par

David

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Ecole Supérieure d’Informatique – Master I Sciences de données (2020 - 2021) – Dr Sibiri T.

TP 3 : SVM

L’objectif de cette séance de travaux pratiques est d’illustration l’utilisation des

machines à vecteurs de support (Support Vector Machines, SVM) pour les problèmes
de classification linéaires en python avec Scikit-learn.

1. Chargement de données
Dans cet exemple nous allons travailler avec la base de données Iris, facilement
accessible dans sklearn. Cette base contient 150 instances d’iris (un type de plante,
chaque observation décrit sa morphologie). L’objectif est de classer chaque instance en
une des trois catégories : Iris setosa, Iris virginica ou Iris versicolor.

Les attributs du jeu de données sont :

 longueur de sépale,
 largeur de sépale,
 longueur de pétale,
 largeur de pétale,
 classe : Iris Setosa, Iris Versicolor ou Iris Virginica..

2. Partition des données

Pour pouvoir afficher les résultats, on va utiliser seulement les premiers deux attributs
(longueur et largeur des sépales).

Pour la suite de l’étude, il faudra mettre en commentaire, l’affichage des données.

Ensuite scinder les données en apprentissage (90%) et test (10%)

import matplotlib.pyplot as plt

from sklearn import svm, datasets
from sklearn.model_selection import train_test_split

# Chargement des données

iris = datasets.load_iris()

X, y = iris.data[:, :2], iris.target

# On conserve 50% du jeu de données pour l'évaluation
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1)
2. Modélisation
Ecole Supérieure d’Informatique – Master I Sciences de données (2020 - 2021) – Dr Sibiri T.

3. SVM linéaires

Dans Scikit-learn, les SVM sont implémentées dans le module « sklearn.svm ». Dans
cette partie nous allons nous intéresser à la version linéaire (Scikit-learn utilise les
bibliothèques libLinear et libSVM). La classe qui nous intéresse est « linearSVC »
(classification) et « linearSVR » (pour la régression) ayant les paramètres suivants :

 dual: optionnel (default=True). Détermine si la méthode duale de résolution

sera utilisé ou non.
 C : le paramètre cout
 Multi_class: choix de la méthode dans le cas multiclasse : « ovr » : « one-vs-
rest » et « crammer_singer » : « one-vs-one »
 Fit_intercept(default=True) : boolean, retourne la valeur de 𝛽0
 max_iter (default = 1000): nombre maximal d’itération

Le code suivant permet d’entrainer une machine à vecteur de support linéaire

C = 1.0 # paramètre de régularisation

lin_svc = svm.LinearSVC(C=C)
lin_svc.fit(X_train, y_train)

3.1 Calculez le score d’échantillons bien classifiés sur le jeu de données de test.

A présent visualisons la surface de décision apprise par le modèle :

# Créer la surface de décision discretisée

x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
# Pour afficher la surface de décision on va discrétiser l'espace avec un pas
h
h = max((x_max - x_min) / 100, (y_max - y_min) / 100)
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

# Surface de décision
Z = lin_svc.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contourf(xx, yy, Z, cmap=plt.cm.coolwarm, alpha=0.8)

# Afficher aussi les points d'apprentissage
plt.scatter(X_train[:, 0], X_train[:, 1], label="train", edgecolors='k',
c=y_train, cmap=plt.cm.coolwarm)
plt.scatter(X_test[:, 0], X_test[:, 1], label="test", marker='*', c=y_test,
cmap=plt.cm.coolwarm)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.title("LinearSVC")
Ecole Supérieure d’Informatique – Master I Sciences de données (2020 - 2021) – Dr Sibiri T.

3.2 Testez différentes valeurs pour le paramètre C. Comment la frontière de décision

évolue en fonction de C ?

3.3 D’après la visualisation ci-dessus, ce modèle vous paraît-il adapté au problème ? Si

non, que peut-on faire pour l’améliorer ?

3.4 Réalisez l’optimisation d’une nouvelle machine à vecteur de support linéaire mais
en utilisant les quatre attributs du jeu de données Iris. Le score de classification en test
a-t-il augmenté ? Pourquoi ?

4. SVM non linéaires

Dans la librairie de Scikit-learn, les SVM non linéaires sont implémentés graçe aux
classes SVC et SVR. Les paramètres les plus importants sont :

 C: optionnel (default=1.0). paramètre cout

 Kernel (default = ‘rbf’): type de fonction noyau (‘linear’ : noyau linéaire, ‘poly’ :
noyau polynomial, ‘rbf’ : noyau RBF, ‘sigmoid’ : noyau sigmoide,

‘precomputed’ : matrice de noyau précalculée

 coef0 (default=0) : paramètre initial définit en fonction du noyau utilisé

 probability (default = False): Calcule la probabilité associée à chaque classe pour

un individu donné
 gamma (default = ‘scale’): si gamma = ‘auto’, alors gamma = 1/p (p étant le nombre
d’attributs)
 decision_function_shape (default ‘ovr’): choix de la stratégie de classification multi
classe

4.1 Reprendre la classification en considérant un noyau gaussien.

from sklearn import svm

clf = svm.SVC(C=0.1, kernel='rbf', gamma=0.25)

clf.fit(X_train, y_train)
Ecole Supérieure d’Informatique – Master I Sciences de données (2020 - 2021) – Dr Sibiri T.

4.2 Testez l’effet du paramètre d’échelle du noyau (gamma) et du paramètre de

régularisation C

4.3 Comme dans le cas précédent, nous pouvons afficher la frontière de décision en ne
conservant que deux variables explicatives

# Pour afficher la surface de décision on va discrétiser l'espace avec un pas

h
h = .02
# Créer la surface de décision discretisée
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

# Surface de décision
Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

plt.contourf(xx, yy, Z, cmap=plt.cm.coolwarm, alpha=0.8)

Que constatez-vous par rapport au cas précédent (cas linéaire ?)

Vous aimerez peut-être aussi

TP SVM
Pas encore d'évaluation
TP SVM
4 pages
TP2 SVM 2
Pas encore d'évaluation
TP2 SVM 2
3 pages
TP3 - SVM-23-24
Pas encore d'évaluation
TP3 - SVM-23-24
3 pages
SVM pour classifier fruits et salaires
Pas encore d'évaluation
SVM pour classifier fruits et salaires
4 pages
TP SVM
Pas encore d'évaluation
TP SVM
7 pages
03-SVM Avancé - Faire Le Graphique
Pas encore d'évaluation
03-SVM Avancé - Faire Le Graphique
4 pages
Introduction au SVM en Machine Learning
Pas encore d'évaluation
Introduction au SVM en Machine Learning
8 pages
TP1 Classification SVM
Pas encore d'évaluation
TP1 Classification SVM
4 pages
Classification avec KNN et SVM en Python
100% (2)
Classification avec KNN et SVM en Python
16 pages
Introduction aux Machines à Vecteurs Supports
Pas encore d'évaluation
Introduction aux Machines à Vecteurs Supports
16 pages
TP SVM : Classification et Noyaux
Pas encore d'évaluation
TP SVM : Classification et Noyaux
7 pages
Introduction aux Support Vector Machines
Pas encore d'évaluation
Introduction aux Support Vector Machines
22 pages
Expose de Machine Learning-Final
Pas encore d'évaluation
Expose de Machine Learning-Final
26 pages
Big Data Analytics - Support Vector Machine
Pas encore d'évaluation
Big Data Analytics - Support Vector Machine
228 pages
Rapport sur les Machines à Vecteurs de Support
100% (1)
Rapport sur les Machines à Vecteurs de Support
9 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Exposé de SVM
0% (1)
Exposé de SVM
8 pages
Devoir Référencement en Apprentissage Machine
Pas encore d'évaluation
Devoir Référencement en Apprentissage Machine
3 pages
Classification supervisée en Machine Learning
Pas encore d'évaluation
Classification supervisée en Machine Learning
11 pages
Classification SVM en Machine Learning
Pas encore d'évaluation
Classification SVM en Machine Learning
39 pages
"SVM : Théorie et Applications"
Pas encore d'évaluation
"SVM : Théorie et Applications"
11 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
Classification SVM sur datasets Iris et Moons
Pas encore d'évaluation
Classification SVM sur datasets Iris et Moons
3 pages
3-Big Data Exercices ISIA Partie 2 Centrale Dec2018 Janv 2019
Pas encore d'évaluation
3-Big Data Exercices ISIA Partie 2 Centrale Dec2018 Janv 2019
88 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
Classification du cancer du sein par SVM
Pas encore d'évaluation
Classification du cancer du sein par SVM
6 pages
Notions sur les Support Vector Machines
Pas encore d'évaluation
Notions sur les Support Vector Machines
23 pages
Introduction à la classification supervisée
Pas encore d'évaluation
Introduction à la classification supervisée
20 pages
TP Régression Linéaire avec Python 2024
Pas encore d'évaluation
TP Régression Linéaire avec Python 2024
8 pages
Optimisation SVM et Analyse des Hyperparamètres
Pas encore d'évaluation
Optimisation SVM et Analyse des Hyperparamètres
14 pages
Classification SVM sur données pulsar
Pas encore d'évaluation
Classification SVM sur données pulsar
4 pages
TD 3 Classification: Exercice 1
Pas encore d'évaluation
TD 3 Classification: Exercice 1
12 pages
Méthodes supervisées en apprentissage machine
Pas encore d'évaluation
Méthodes supervisées en apprentissage machine
4 pages
Machine Learning - Partie 5 - Support Vector Machines
Pas encore d'évaluation
Machine Learning - Partie 5 - Support Vector Machines
35 pages
Chap05.machine Vecteurs Support
Pas encore d'évaluation
Chap05.machine Vecteurs Support
44 pages
6 - Apprentissage Supervise - Support Vector Machines
Pas encore d'évaluation
6 - Apprentissage Supervise - Support Vector Machines
47 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Partie SVM
Pas encore d'évaluation
Partie SVM
5 pages
ML 1
Pas encore d'évaluation
ML 1
41 pages
Arbres de décision et méthodes d'ensemble en ML
Pas encore d'évaluation
Arbres de décision et méthodes d'ensemble en ML
7 pages
Code
Pas encore d'évaluation
Code
4 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
7 pages
Validation croisée et réglage hyperparamètres
Pas encore d'évaluation
Validation croisée et réglage hyperparamètres
4 pages
Entraînement de modèles KNN avec Iris
Pas encore d'évaluation
Entraînement de modèles KNN avec Iris
18 pages
Introduction aux SVM et Classification Binaire
Pas encore d'évaluation
Introduction aux SVM et Classification Binaire
50 pages
IFT6390 Programming Midterm
Pas encore d'évaluation
IFT6390 Programming Midterm
16 pages
Introduction aux SVM et classification
Pas encore d'évaluation
Introduction aux SVM et classification
18 pages
Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
Activite-Sequence 3-SVM
Pas encore d'évaluation
Activite-Sequence 3-SVM
2 pages
Examen M1 : Apprentissage automatique en Python
100% (1)
Examen M1 : Apprentissage automatique en Python
3 pages
Cours SVM
Pas encore d'évaluation
Cours SVM
18 pages
Comparaison des classifieurs d'images
Pas encore d'évaluation
Comparaison des classifieurs d'images
6 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
Seance 4
Pas encore d'évaluation
Seance 4
26 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
Probabilité+Et+Statistiques+ +partie+2+ +probabilité
Pas encore d'évaluation
Probabilité+Et+Statistiques+ +partie+2+ +probabilité
88 pages
Designs Partterns Structuraux
Pas encore d'évaluation
Designs Partterns Structuraux
37 pages
Chp5 DET
Pas encore d'évaluation
Chp5 DET
13 pages
Design Pattern Structuraux
Pas encore d'évaluation
Design Pattern Structuraux
25 pages
Be2025-Notice 2025
Pas encore d'évaluation
Be2025-Notice 2025
2 pages
Présentation CFD Certifiicat
Pas encore d'évaluation
Présentation CFD Certifiicat
8 pages
Projets Tuteures 2023
Pas encore d'évaluation
Projets Tuteures 2023
12 pages
Debout Sainte Cohorte
100% (1)
Debout Sainte Cohorte
2 pages
Directive Doctorat Systemes Information 21022022
Pas encore d'évaluation
Directive Doctorat Systemes Information 21022022
6 pages
Guide de Surveillance Sanitaire au Burkina
Pas encore d'évaluation
Guide de Surveillance Sanitaire au Burkina
222 pages
Intelligence Artificielle en Santé : Enjeux et Perspectives
Pas encore d'évaluation
Intelligence Artificielle en Santé : Enjeux et Perspectives
29 pages
7 Mots Hébreux pour Louer Dieu
Pas encore d'évaluation
7 Mots Hébreux pour Louer Dieu
5 pages
Cherchez le Royaume de Dieu d'abord
Pas encore d'évaluation
Cherchez le Royaume de Dieu d'abord
5 pages