TP SVM

Ce document présente un TP sur les machines à vecteurs supports. Il introduit les SVM linéaires et non linéaires, ainsi que l'astuce du noyau. Plusieurs exercices sont proposés pour entraîner des SVM sur des ensembles de données synthétiques et étudier l'influence des hyperparamètres.

Transféré par

zelda

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

105 vues4 pages

TP SVM

Transféré par

zelda

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP - Machines à vecteurs supports.

L’objet de cette séance de TP est de vous familiariser avec les machines à vecteurs supports. Il s’agit
d’une famille d’algorithmes pouvant servir à diverses tâches d’apprentissage (classification, régression. . . ).
Nous nous intéresserons ici uniquement aux problème de classification à deux classes.

libSVM
Nous allons nous servir de la librairie libSVM disponible à l’adresse http://www.csie.ntu.edu.tw/
~cjlin/libsvm/. Le site contient une archive contenant le code nécessaire à l’entraı̂nement des SVMs, la
documentation sur le fonctionnement de la librairie et un guide pratique pour l’utilisation des machines à
vecteurs supports.
Avant de commencer le TP, téléchargez et compilez libSVM en utilisant la commande make dans le
répertoire MATLAB depuis Octave.

1 SVM linéaires
1.1 Cas séparable
Dans cette première partie, nous nous intéressons à une SVM linéaire à marges rigides . Cette première
version de SVM fournit un classifieur (une fonction linéaire h) pour deux classes linéairement séparables, i.e.
telles qu’il existe un hyperplan séparateur (d’équation h(x) = 0).
Formellement, on pose (xi , yi )ni=1 un ensemble de n points d’entraı̂nement, avec xi ∈ Rd et yi ∈ {−1, 1}.
On résoud ensuite :
1 2

minimiser 2 ||w||
sous contraintes ∀i, yi (< w, xi > +b) ≥ 1
On obtient alors une suite de coefficients réels (αi )ni=1 et
n
X
w= αi yi xi (1)
i=1

h(x) =< w, x > +b. (2)

Les vecteurs xi tels que αi 6= 0 sont appelés vecteurs supports.

Exercice 1
On se place dans le cas où d = 2.
1. Un ensemble de points d’entraı̂nement se présente pour libSVM comme la données de deux matrices
X et label. X est une matrice dont chaque ligne représente un point d’entraı̂nement (n lignes × d
colonnes). label est une vecteur colonne contenant la classe de chaque exemple.

1
On propose :    
0 0 −1
0 1  1
X=
1
 label =  
0  1
1 1 −1
2. Tracez les éléments de l’ensemble d’entraı̂nement, en distinguant les classes.
3. Entraı̂nez une SVM linéaire sur cet ensemble.
Aide : l’instruction model = svmtrain(label, X, ’options’) retourne le résultat de l’entraı̂nement
d’une SVM suivant les options spécifiées en argument. (Tapez svmtrain dans Octave ou consultez la
documentation pour plus de détails).
Par exemple, ici : model = svmtrain(label, X, ’-s 0 -t 0 -c 1e6’).
4. Que constatez-vous ? Quelle explication simple pouvez-vous proposer ?
5. Écrivez un script permettant de générer un ensemble de n points d’entraı̂nement linéairement séparables.
On commence en définissant la classe 1 comme les (a, b) ∈ R2 tels que a ≥ 0.
6. Tracez les éléments de ce nouvel ensemble d’entraı̂nement, en distinguant les classes.
7. Entraı̂nez une SVM avec les mêmes options.
8. Tracez sur un même graphe l’ensemble d’entraı̂nement, les vecteurs supports et la droite de séparation.
Indications :
– Après appel de svmtrain, la structure model contient l’ensemble des paramètres de la SVM : vecteurs
supports (model.SVs), coefficients αi (model.sv coef) et b (égal à - model.rho).
– Les matrices retournées sont sous forme sparse, utilisez full pour obtenir la matrice dense corres-
pondante.
9. Proposez un nouvel ensemble d’entraı̂nement linéairement séparable et testez de la même manière une
SVM à marges rigides.

1.2 Cas non séparable

Comme vous avez pu le constater, un inconvénient majeur des machines linéaires à marge rigides est leur
incapacité à traiter le cas où l’ensemble de points d’entraı̂nement n’est pas linéairement séparable.
Pour pallier à ce défaut, les machines à marges souples ont étés introduites. L’idée employée est de
d’autoriser la mauvaise classification de quelques exemples d’entraı̂nement.
Nous introduisons pour cela les variables ressorts ζi > 0 et le problème d’optimisation devient :
 1 2
Pn
 minimiser 2 ||w|| + C i=1 ζi
sous contraintes ∀i, yi (< w, xi > +b) ≥ 1 − ζi
∀i, ζi ≥ 0


La constante C > 0 (coût d’erreur) est un paramètre contrôlant la pénalisation des erreurs de classifica-
tion. La résolution aboutit à une fonction de décision h similaire au cas non séparable (éq. ??)

Exercice 2
La valeur de C est spécifiée par l’option ’-c val’ dans libSVM. 1
1. Essayer l’exemple du XOR avec une SVM à marges souples (C = 1 par ex.). Que constatez-vous ?
2. Modifiez le script de générations de points de façon à ajouter du bruit à l’exemple précédent : avec
probabilité p, le point xi = (xi,1 , xi,2 ) a le label -1 alors que xi,1 > 0.
3. Écrivez un script qui, pour un couple (n, p, C) donné :
1. En toute rigueur, libSVM n’implémente pas les SVM à marges rigides. Nous les avons simulé dans l’exercice 1 en prenant
une valeur de C extrêmement élevée.

2
– Génère un ensemble de n points d’entraı̂nement bruité comme précédemment.
– Entraı̂ne une SVM sur cet ensemble de points avec la valeur spécifiée de C.
– Affiche sur un même graphe, les points d’entraı̂nement, les vecteurs supports, et la droite de séparation.
Testez différentes valeurs de C et p.
4. Fixez C et tracez la précision du classifieur en fonction de p.
Indication : [predicted label, accuracy]=svmpredict(label, X, model) calcule à partir de model
les labels prédits des points de X. Le passage en paramètre des classes exactes des points de X dans
label permet de calculer le taux de précision de la SVM.
5. Écrivez une fonction accuracy = testC(n, m, p, valC) :
– Génère, toujours de la même façon, un ensemble de n + m points.
– Découpe cet ensemble en un ensemble de n points d’apprentissage et un ensemble de m points de
test.
– Entraı̂ne une SVM linéaire pour chaque c ∈ valC sur l’ensemble d’apprentissage.
– Calcule et retourne la précision de chacune de ces machines sur l’ensemble de test.
Indications :
– num2str convertit un nombre en chaı̂ne de caractères.
– cstrcat permet de concaténer deux chaı̂nes de caractères.
6. Tracez la précision en fonction de C en fixant les autres paramètres.
7. Tracez la précision en fonction de C dans le cas où les classes sont définies selon une fonction φ non
linéaire. Par exemple, xi = (xi,1 , xi,2 ) est dans la classe 1 ssi φ(xi,1 , xi,2 ) > 0 avec φ(a, b) = a + b3 .

2 Noyaux
L’ astuce du noyau est une méthode permettant d’étendre l’espace H d’hypothèses. L’idée est de
plonger les données d’entraı̂nements via une fonction φ dans un espace de grande dimension (feature space).
Formellement, il s’agit de résoudre le problème suivant :
 1 2
Pn
 minimiser 2 ||w|| + C i=1 ζi
sous contraintes ∀i, yi (< w, φ(xi ) > +b) ≥ 1 − ζi
∀i, ζi ≥ 0


La fonction de décision h s’écrit maintenant

n
X
h(x) = αi yi K(xi , x) + b. (3)
i=1

Exercice 3
Dans cette exercice, nous travaillerons avec des noyaux gaussiens : K(x, y) = exp(−γkx − yk2 ), avec
γ > 0 paramètre.
1. Reprenez encore une fois l’exemple du XOR en entraı̂nant une SVM avec noyau gaussien (C = 1, γ = 1).
Que constate-t-on ?
On reprend la fonction φ précédente.
2. Écrivez une fonction plotzone(model) traçant sur en couleurs distinctes, l’ensemble des points du
plan tels que h(x1 , x2 ) > 0 et h(x1 , x2 ) < 0.
3. En fixant C à 1, prenez des valeurs de plus en plus grandes pour γ et tracez l’ensemble d’apprentissage
sur un graphe, et les frontières de décisions sur un autre graphe.
Que remarquez-vous ?

3
Exercice 4
Une SVM à noyau gaussien fait intervenir deux paramètres, C et γ, influençant les performances de
classification. Nous ne pouvons pas déterminer a priori pour chaque tâche de classification, les paramètres
les plus efficaces.
Pour déterminer les paramètres, il est souvent fait appel à la méthode de validation croisée à n plis :
1. l’ensemble d’apprentissage est divisé en n sous-ensembles de même taille.
2. pour un jeu de paramètres donné, chacun de ces n sous-ensembles est testé avec une machine entraı̂née
sur les n − 1 autres sous-ensembles.
3. On obtient ainsi, pour chaque couple (C, γ) une valeur de précision correspondant au pourcentage
d’exemples bien classés. On conserve le couple de précision maximale.
L’option ’-v n’ de la fonction svmtrain réalise la validation croisée à n plis et retourne l’indice de
précision correspondant au couple (C, γ) courant.
1. Réalisez une fonction [vc, c, gamma]=gridsearch(label, X, valC, valGamma, n) qui calcule, pour
chaque couple (C, γ) passé en paramètres, la précision associée et qui retourne le score maximal et le
couple correspondant.
2. Effectuez la recherche du meilleur couple pour φ.
Conseil : Prenez des puissances de 2 pour C et γ. Par exemple, C = 2−5 , . . . , 210 et γ = 2− 15, . . . , 23 ,
quitte à affiner votre recherche dans un second temps.
3. Tracez la précision en fonction de C et γ (carte de chaleur).
4. Tracez la solution optimale que vous avez obtenue.

Vous aimerez peut-être aussi

TP SVM : Classification et Noyaux
Pas encore d'évaluation
TP SVM : Classification et Noyaux
7 pages
Big Data Analytics - Support Vector Machine
Pas encore d'évaluation
Big Data Analytics - Support Vector Machine
228 pages
Rapport sur les Machines à Vecteurs de Support
100% (1)
Rapport sur les Machines à Vecteurs de Support
9 pages
Introduction aux SVM pour ingénieurs
Pas encore d'évaluation
Introduction aux SVM pour ingénieurs
38 pages
Classification SVM en Machine Learning
Pas encore d'évaluation
Classification SVM en Machine Learning
39 pages
TP SVM
Pas encore d'évaluation
TP SVM
7 pages
Optimisation SVM et Analyse des Hyperparamètres
Pas encore d'évaluation
Optimisation SVM et Analyse des Hyperparamètres
14 pages
Notions sur les Support Vector Machines
Pas encore d'évaluation
Notions sur les Support Vector Machines
23 pages
"SVM : Théorie et Applications"
Pas encore d'évaluation
"SVM : Théorie et Applications"
11 pages
Activite-Sequence 3-SVM
Pas encore d'évaluation
Activite-Sequence 3-SVM
2 pages
Introduction aux Machines à Vecteurs Supports
Pas encore d'évaluation
Introduction aux Machines à Vecteurs Supports
16 pages
SVM et Noyaux : Guide Pratique
Pas encore d'évaluation
SVM et Noyaux : Guide Pratique
2 pages
Exposé de SVM
0% (1)
Exposé de SVM
8 pages
TP3 - SVM-23-24
Pas encore d'évaluation
TP3 - SVM-23-24
3 pages
TP3 SVM
Pas encore d'évaluation
TP3 SVM
4 pages
TP2 SVM 2
Pas encore d'évaluation
TP2 SVM 2
3 pages
Machine Learning - Partie 5 - Support Vector Machines
Pas encore d'évaluation
Machine Learning - Partie 5 - Support Vector Machines
35 pages
Chap05.machine Vecteurs Support
Pas encore d'évaluation
Chap05.machine Vecteurs Support
44 pages
6 - Apprentissage Supervise - Support Vector Machines
Pas encore d'évaluation
6 - Apprentissage Supervise - Support Vector Machines
47 pages
Introduction au SVM en Machine Learning
Pas encore d'évaluation
Introduction au SVM en Machine Learning
8 pages
Introduction aux Support Vector Machines
Pas encore d'évaluation
Introduction aux Support Vector Machines
22 pages
Partie SVM
Pas encore d'évaluation
Partie SVM
5 pages
7) L'Algorithme SVM
Pas encore d'évaluation
7) L'Algorithme SVM
43 pages
SVM : Régularisation et Validation Croisée
Pas encore d'évaluation
SVM : Régularisation et Validation Croisée
56 pages
SVM pour classifier fruits et salaires
Pas encore d'évaluation
SVM pour classifier fruits et salaires
4 pages
Expose de Machine Learning-Final
Pas encore d'évaluation
Expose de Machine Learning-Final
26 pages
Chap Svm2019dernièreversion
Pas encore d'évaluation
Chap Svm2019dernièreversion
63 pages
Cours SVM
Pas encore d'évaluation
Cours SVM
18 pages
Seance 4
Pas encore d'évaluation
Seance 4
26 pages
Introduction aux Support Vector Machines
Pas encore d'évaluation
Introduction aux Support Vector Machines
42 pages
ML SVM Court 5 French
Pas encore d'évaluation
ML SVM Court 5 French
26 pages
Un Peu de Machine Learning Avec Les SVM
Pas encore d'évaluation
Un Peu de Machine Learning Avec Les SVM
23 pages
SVM et Arbres de Décision : Concepts Clés
Pas encore d'évaluation
SVM et Arbres de Décision : Concepts Clés
28 pages
SVMet Noyaux
Pas encore d'évaluation
SVMet Noyaux
57 pages
3-Big Data Exercices ISIA Partie 2 Centrale Dec2018 Janv 2019
Pas encore d'évaluation
3-Big Data Exercices ISIA Partie 2 Centrale Dec2018 Janv 2019
88 pages
Introduction Aux SVM: Hyperplan Optimal
Pas encore d'évaluation
Introduction Aux SVM: Hyperplan Optimal
5 pages
Cours IIA5 Big Data SVM Thème Fondement Mathématiques
100% (1)
Cours IIA5 Big Data SVM Thème Fondement Mathématiques
14 pages
Support Vector Machine SVM
Pas encore d'évaluation
Support Vector Machine SVM
15 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
SVM 2
Pas encore d'évaluation
SVM 2
31 pages
Introduction aux SVM et Classification Binaire
Pas encore d'évaluation
Introduction aux SVM et Classification Binaire
50 pages
Classifieurs en Classification Supervisée
Pas encore d'évaluation
Classifieurs en Classification Supervisée
32 pages
Classification supervisée avec SVM
Pas encore d'évaluation
Classification supervisée avec SVM
28 pages
Introduction aux SVM et optimisation
Pas encore d'évaluation
Introduction aux SVM et optimisation
5 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
7 pages
Introduction aux SVM et leur utilité
Pas encore d'évaluation
Introduction aux SVM et leur utilité
41 pages
STT3795 - S04
Pas encore d'évaluation
STT3795 - S04
60 pages
Classification supervisée en Machine Learning
Pas encore d'évaluation
Classification supervisée en Machine Learning
11 pages
Introduction aux SVM Linéaires Cnam
Pas encore d'évaluation
Introduction aux SVM Linéaires Cnam
8 pages
03-SVM Avancé - Faire Le Graphique
Pas encore d'évaluation
03-SVM Avancé - Faire Le Graphique
4 pages
Rapport Article
Pas encore d'évaluation
Rapport Article
9 pages
Introduction aux machines à vecteurs de support
Pas encore d'évaluation
Introduction aux machines à vecteurs de support
13 pages
Exercices SVM pour Master STIC
Pas encore d'évaluation
Exercices SVM pour Master STIC
2 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
SVM 7
100% (5)
SVM 7
45 pages
L'image Et La Video
Pas encore d'évaluation
L'image Et La Video
32 pages
Guide de la modulation de phase
Pas encore d'évaluation
Guide de la modulation de phase
15 pages
Cours Les Sous-Programmes
Pas encore d'évaluation
Cours Les Sous-Programmes
2 pages
Attaques et Décryptage de Chiffres Classiques
Pas encore d'évaluation
Attaques et Décryptage de Chiffres Classiques
3 pages
Tok Booster
Pas encore d'évaluation
Tok Booster
1 page
Types et fonctionnement des compresseurs d'air
100% (2)
Types et fonctionnement des compresseurs d'air
38 pages
Tension du Réseau Électrique en Usine
Pas encore d'évaluation
Tension du Réseau Électrique en Usine
4 pages
Rapport de Stage Ok
Pas encore d'évaluation
Rapport de Stage Ok
11 pages
Management de l'Innovation : Concepts Clés
Pas encore d'évaluation
Management de l'Innovation : Concepts Clés
24 pages
CHAP 1 (Leçon 1 GENERALITES SUR LA CORRESPONDANCE COMMERCIALE)
Pas encore d'évaluation
CHAP 1 (Leçon 1 GENERALITES SUR LA CORRESPONDANCE COMMERCIALE)
2 pages
Samsung SM A105fn Ds 3082091
Pas encore d'évaluation
Samsung SM A105fn Ds 3082091
145 pages
POEI Testeur Logiciel Thalès
Pas encore d'évaluation
POEI Testeur Logiciel Thalès
2 pages
Résolution de Sudoku en Langage C
Pas encore d'évaluation
Résolution de Sudoku en Langage C
3 pages
Fiche Calcul Matriciel TC - Techno1
Pas encore d'évaluation
Fiche Calcul Matriciel TC - Techno1
16 pages
M112-Mécanique Et Hydraulique Industrielle S2 Stagiaire
100% (1)
M112-Mécanique Et Hydraulique Industrielle S2 Stagiaire
19 pages
Document de Filtre
Pas encore d'évaluation
Document de Filtre
5 pages
Déclaration de conformité AGCO Tracteur
100% (67)
Déclaration de conformité AGCO Tracteur
10 pages
Demande de Licence de Football 2022-2023
Pas encore d'évaluation
Demande de Licence de Football 2022-2023
1 page
TP Chiffrement Asymétrique avec GPG
Pas encore d'évaluation
TP Chiffrement Asymétrique avec GPG
3 pages
Brochure Store Access
Pas encore d'évaluation
Brochure Store Access
10 pages
FRENCH Manual of Use Installation and Operation1
Pas encore d'évaluation
FRENCH Manual of Use Installation and Operation1
32 pages
Décomposition de Dunford: Théorie et Applications
Pas encore d'évaluation
Décomposition de Dunford: Théorie et Applications
4 pages
Devoir de Synthèse N°3 Corrigé 2008 2009)
100% (3)
Devoir de Synthèse N°3 Corrigé 2008 2009)
12 pages
Facture Ooredoo Tunisie Février 2021
Pas encore d'évaluation
Facture Ooredoo Tunisie Février 2021
8 pages
LEDriving sx180
Pas encore d'évaluation
LEDriving sx180
8 pages
TP Traitement D'image
Pas encore d'évaluation
TP Traitement D'image
4 pages
TIC - 3ème Année - 2017
Pas encore d'évaluation
TIC - 3ème Année - 2017
3 pages
Observateur d'état pour traitement de minerais
Pas encore d'évaluation
Observateur d'état pour traitement de minerais
3 pages
N° 524006926443 Du 29 Octobre 2024 Valable Jusqu'au 31 Décembre 2024
Pas encore d'évaluation
N° 524006926443 Du 29 Octobre 2024 Valable Jusqu'au 31 Décembre 2024
5 pages
La Poste Catalogue Service Universel Postal
Pas encore d'évaluation
La Poste Catalogue Service Universel Postal
79 pages