Introduction aux SVM et Noyaux

Ce document présente des exercices sur les machines à vecteurs de support (SVM). Il introduit la marge et la formulation du problème d'optimisation du SVM. Il aborde ensuite la formulation duale, les noyaux et leur propriétés ainsi que des exemples de noyaux sur les chaînes de caractères.

Transféré par

N T

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

408 vues6 pages

Introduction aux SVM et Noyaux

Transféré par

N T

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Machine Learning – Machine Learning– 2023fev année 2022-2023

TD 5 : SVM

Exercice 1 – Support Vector Machine

On considère ici un problème de classification binaire vers Y = { 1, +1} de données dans un espace de
description X 2 Rd . On note {(xi , y i ) 2 (X, Y )}, i 2 {1, . . . , n} l’ensemble d’apprentissage considéré.
La fonction de décision du classifieur considéré est donnée par : fw,b (x) = sign(wT x + b).
On considère dans un premier temps un ensemble de données linéairement séparable. Cet ensemble de
données et la frontière de décision sont représentés (en 2D) sur la figure 1.

Figure 1 – Ensemble de données linéairement séparables

Q 1.1 Marge
Sur cette figure, l’échantillon xi et de label y i est représenté par le point A. On s’intéresse à sa distance
signée i à la frontière de decision (dont le point le plus proche est représenté en B sur la figure).
Q 1.1.1 Sachant que w/||w|| est un vecteur unitaire orthogonal à la frontière de décision, donner
l’expression de i en fonction de xi , y i , w et b.
Q 1.1.2 Montrer que la distance et la solution ne change pas en multipliant la solution par un scalaire,
i.e. pour (↵w, ↵b). Que cela implique-t-il si l’on souhaite éloigner au maximum (au sens géométrique)
les points de la frontière de décision ?
Q 1.2 Formulation du SVM
On considère alors le problème d’optimisation sous contraintes suivant :
1
min ||w||2
w,b 2

s.t. y i (wT xi + b) 1, 8i 2 {1, . . . , n}

Q 1.2.1 Pourquoi choisit-on la contrainte 1 plutôt que 0 ? Pourquoi 1 ?

Q 1.2.2 Poser le Lagrangien à considérer pour optimiser ce problème sous contraintes
Q 1.2.3 Donner la solution analytique de la minimisation de ce Lagrangien selon w et b
EI
Exa
y Wxitb XA XB 8
aw Xi tbs
XiYi
wixistbat
y Yg s.cn YiI Fow
yi
Fwpt yikwixistbzlew.fi te tb

à optimiser argmin lait

1 giga b e 0 seul solutionpos

È én'introduisant
dictyicw.xis byiz
o.diso yipw.is
D 71 2947 9

Fête
Éptimiser
zmwp.IE xi lf ykw.xis bgi yo en introduisant
Lagrangien
arymiyargman
Ew w Éxyigxi o w Édigixi
Ï Édigio
IHÉdigixillayÉdictyiewixis byi
xiIIKigigExys I xD Étriby
ECEYIcaiyixi.gg s E
ÉTÉ cyyixixiy
Écaiylib
I
D
EEtixigiayscxt.gs
ix SVM
ne dépendque des points à support

1.2.9 Choisir un noyau CX x KIX apex x

t yiewxistbyistgi argminuwHKEYi
Kw
Ï KITT condition
aill Gr yilwxitb 0 Bigi O il faut
à résoudre K xitp
Le ÉÉN Épi ltgi yicwtxitbD Epigi.tkEjidiso pro
di pitkeo Kaitfi
Fw w Éagigxi a

Ï É digi o

Lie JOKE
t yiewixis by 0 25 0
points bien classé
tyicw.xiz P Si 0 bien classe
byiko
profiai
o mal classé non sur la marge
ai o 0 fr 0 point sur la marge
fi

qu'ex ew b

ÉTÉ Liyicxix b à partir de noyau

ÉÉdigikyi
kcx.ME qui xD

ok ix y ecfixl.de et.IM
cxh
Teq y
KIK Xcx qu'D
ktkx.gs fenidysted'exifin

qqit.fi ha
Klx g t'ix y
Glx pays fix y
Équieinfeysej Éidiexsei Élyse
Épicxificy
IEficxspicy
ÉÉ fixinguyspicxifigs
ÉTÉ enjoy dicageys

quali d
2 Hex 7 est un noyau

ex XD Yax j x

Este noyau
Q I
id 91 02 noyau d'après a 1.2
fa
f 927 noyau par récurrence
d'apres

z.
fcn
E NlAl5
t
w ns
Q Wi NIEX
l apparat on pas
dans X X
m'merde
M chose
Si w WE EX noyau à noyon transférer
si c X.x noyanto données
Donc k bien un noyau
2 I ABCDE F 42
2 Bc D Et G 43
Lez
4 GA BC DE
Qc
Machine Learning – Machine Learning– 2023fev page 2

Q 1.2.4 En déduire une nouvelle formulation “duale” de notre problème d’optimisation sous contraintes

Q 1.2.5 Que cette nouvelle formulation permet-elle ?

Q 1.2.6 Quel est le problème du problème d’optimisation que l’on a considéré ? Proposer une nouvelle
formulation qui corrige ce problème
Q 1.2.7 Proposer la formulation duale de ce nouveau problème
Q 1.2.8 Donner la fonction de classification obtenue après optimisation de cette formulation duale
du SVM
Q 1.2.9 D’après les conditions de Karush-Kuhn-Tucker (KKT) concernant les propriétés de la
solution optimale d’un Lagrangien, on a : ai (1 ⇠i y i (wT xi + b)) = 0, 8i 2 {1..N } et i ⇠i = 0, 8i 2
{1..N }. Qu’en déduire pour les paramètres ai obtenus à l’optimum ?
Q 1.2.10 Qu’en déduire pour l’estimation du biais b ?

Exercice 2 – Noyaux

Q 2.1 Montrez que si K et K 0 sont deux noyaux (i.e. il existe et 0 telles que K(x, y) =< (x), (y) >
, K 0 (x, y) =< 0 (x), 0 (y) >) :
Q 2.1.1 cK est un noyau pour c 2 R+
Q 2.1.2 K + K 0 est un noyau ;
Q 2.1.3 KK 0 est un noyau ;
Q 2.1.4 (1+ < x, x0 >)d est un noyau.

Exercice 3 – Noyaux sur les chaînes de caractères

Soit S une séquence de mots sur un alphabet A fini. Montrez que :

1. K(x, x0 ) = nombre de sous-chaînes de longueur 5 que x et x0 ont en commun est un noyau ;
2. K(x, x0 ) = 1 si x et x0 ont au moins une sous-chaîne de longueur 5 en commun, 0 sinon, n’est
pas un noyau (indice : considérez 3 chaînes x,x0 et x00 ).

Vous aimerez peut-être aussi

Introduction aux SVM et classification
Pas encore d'évaluation
Introduction aux SVM et classification
18 pages
Optimisation Non-Linéaire L3
Pas encore d'évaluation
Optimisation Non-Linéaire L3
53 pages
Machine Learning Examen Corrigé 2023
Pas encore d'évaluation
Machine Learning Examen Corrigé 2023
5 pages
Examen Ratt 2019 - Corrigé Type
100% (1)
Examen Ratt 2019 - Corrigé Type
5 pages
TD4-Clustering1 (Corrigé)
100% (1)
TD4-Clustering1 (Corrigé)
3 pages
Forets
Pas encore d'évaluation
Forets
19 pages
Arbres de Décision et Classification
Pas encore d'évaluation
Arbres de Décision et Classification
44 pages
Théorie Bayesienne pour Étudiants Avancés
Pas encore d'évaluation
Théorie Bayesienne pour Étudiants Avancés
2 pages
Processus Stochastqiues
Pas encore d'évaluation
Processus Stochastqiues
114 pages
Examen Processus Stochastiques 2021
Pas encore d'évaluation
Examen Processus Stochastiques 2021
6 pages
Logique à Prolog : Puzzles et Prédicats
Pas encore d'évaluation
Logique à Prolog : Puzzles et Prédicats
43 pages
Optimisation Multiobjectif par Hachimi
Pas encore d'évaluation
Optimisation Multiobjectif par Hachimi
50 pages
Exam 1
Pas encore d'évaluation
Exam 1
4 pages
TD21
Pas encore d'évaluation
TD21
2 pages
Chapitre 1 MOP2020
100% (1)
Chapitre 1 MOP2020
10 pages
Optimisation Combinatoire Avancée
Pas encore d'évaluation
Optimisation Combinatoire Avancée
121 pages
Modèles de Régression Linéaire Appliquée
100% (1)
Modèles de Régression Linéaire Appliquée
127 pages
Exercices sur les chaînes de Markov
Pas encore d'évaluation
Exercices sur les chaînes de Markov
14 pages
Chapitre 1 Fouille de Données
Pas encore d'évaluation
Chapitre 1 Fouille de Données
36 pages
Estimation de la probabilité conditionnelle
Pas encore d'évaluation
Estimation de la probabilité conditionnelle
35 pages
TD 1 - ML
100% (1)
TD 1 - ML
3 pages
Solutions TP6 Processus Stochastiques
Pas encore d'évaluation
Solutions TP6 Processus Stochastiques
4 pages
Propriétés et Théorèmes des Vecteurs Gaussiens
Pas encore d'évaluation
Propriétés et Théorèmes des Vecteurs Gaussiens
8 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Cours 5-6 Perceptron-SVM
100% (1)
Cours 5-6 Perceptron-SVM
76 pages
DataMining Et Analyse de Données - Partie 2
Pas encore d'évaluation
DataMining Et Analyse de Données - Partie 2
108 pages
Cours MOP 2019
100% (1)
Cours MOP 2019
50 pages
Examen Final 2018 Corrigé Type
Pas encore d'évaluation
Examen Final 2018 Corrigé Type
5 pages
Modèles ML: Diagnostic et Prévision
Pas encore d'évaluation
Modèles ML: Diagnostic et Prévision
2 pages
Apprentissage 1516 Lasso
Pas encore d'évaluation
Apprentissage 1516 Lasso
46 pages
Théorie des Jeux : Concepts et Résolution
Pas encore d'évaluation
Théorie des Jeux : Concepts et Résolution
71 pages
Méthodes de Monte Carlo Pour La Finance
Pas encore d'évaluation
Méthodes de Monte Carlo Pour La Finance
72 pages
Examen ML: Classification et Préparation
Pas encore d'évaluation
Examen ML: Classification et Préparation
6 pages
ID3 Et C4.5
Pas encore d'évaluation
ID3 Et C4.5
7 pages
Tests d'Hypothèses et Chi-Deux
Pas encore d'évaluation
Tests d'Hypothèses et Chi-Deux
35 pages
OptimisationMultiCriteres Etudiant
Pas encore d'évaluation
OptimisationMultiCriteres Etudiant
36 pages
Exam SR RO SMI5 1617
Pas encore d'évaluation
Exam SR RO SMI5 1617
2 pages
Calcul Stochastique en Finance
Pas encore d'évaluation
Calcul Stochastique en Finance
181 pages
Régression Logistique: Classification Binaire
100% (1)
Régression Logistique: Classification Binaire
17 pages
Mathf 207 Seance 5 Corr
Pas encore d'évaluation
Mathf 207 Seance 5 Corr
9 pages
Introduction aux Lois de Probabilité
Pas encore d'évaluation
Introduction aux Lois de Probabilité
17 pages
Examen OCclass 2008 Corrigé
Pas encore d'évaluation
Examen OCclass 2008 Corrigé
6 pages
Exam Modeles Pour Le Datamining 2016 2017
Pas encore d'évaluation
Exam Modeles Pour Le Datamining 2016 2017
2 pages
Cours SVM
Pas encore d'évaluation
Cours SVM
18 pages
V2 - Apprentissage Automatique Et Classification
Pas encore d'évaluation
V2 - Apprentissage Automatique Et Classification
6 pages
Algorithme Branch and Bound pour KP
Pas encore d'évaluation
Algorithme Branch and Bound pour KP
104 pages
Théorème de Gauss-Markov en régression
Pas encore d'évaluation
Théorème de Gauss-Markov en régression
3 pages
Intervalles de Confiance et Statistiques
100% (1)
Intervalles de Confiance et Statistiques
4 pages
Calcul Stochastique Avancé
Pas encore d'évaluation
Calcul Stochastique Avancé
111 pages
Introduction à l'Algorithme de Simplexe
Pas encore d'évaluation
Introduction à l'Algorithme de Simplexe
38 pages
Estimation et Risque en Statistique
Pas encore d'évaluation
Estimation et Risque en Statistique
104 pages
Exercices sur les chaînes de Markov
Pas encore d'évaluation
Exercices sur les chaînes de Markov
4 pages
2023.examen Yy
Pas encore d'évaluation
2023.examen Yy
3 pages
Programmation Non Linéaire
100% (1)
Programmation Non Linéaire
251 pages
Machine Learning CH3
Pas encore d'évaluation
Machine Learning CH3
46 pages
Exercice corrigé SVM sur vins de Bordeaux
Pas encore d'évaluation
Exercice corrigé SVM sur vins de Bordeaux
2 pages
Exercices sur les variables aléatoires
Pas encore d'évaluation
Exercices sur les variables aléatoires
2 pages
Chap 1+2
Pas encore d'évaluation
Chap 1+2
11 pages
Exercices sur les SVM et noyaux
0% (1)
Exercices sur les SVM et noyaux
3 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
Statistiques 1
100% (1)
Statistiques 1
48 pages
Statistique Et Calcul Des Erreurs Appliqués À La Topographie
Pas encore d'évaluation
Statistique Et Calcul Des Erreurs Appliqués À La Topographie
4 pages
Serie2 Enonce
Pas encore d'évaluation
Serie2 Enonce
9 pages
Annatut' UE4-Biostat 2014-2015
Pas encore d'évaluation
Annatut' UE4-Biostat 2014-2015
67 pages
Chapitre 2 Econométrie
Pas encore d'évaluation
Chapitre 2 Econométrie
9 pages
Ingénieur Statistique au Rectorat
Pas encore d'évaluation
Ingénieur Statistique au Rectorat
4 pages
Dramane Cessouma CV
Pas encore d'évaluation
Dramane Cessouma CV
3 pages
Corrige TD1 2015 2016
67% (3)
Corrige TD1 2015 2016
54 pages
Syllabus-Probabilité Et Statistique
Pas encore d'évaluation
Syllabus-Probabilité Et Statistique
13 pages
Feuilletage 2734
Pas encore d'évaluation
Feuilletage 2734
25 pages
Syllabus STAT MPDEV-19-20
Pas encore d'évaluation
Syllabus STAT MPDEV-19-20
4 pages
Exe Prob
Pas encore d'évaluation
Exe Prob
12 pages
Vocabulaire et méthodes d'analyse de données
Pas encore d'évaluation
Vocabulaire et méthodes d'analyse de données
23 pages
Module 3-Manuel-150518
Pas encore d'évaluation
Module 3-Manuel-150518
55 pages
Econometrie Des Donnees de Panel CH 1. Modeles Lineaires Non Dynamiques (PDFDrive)
Pas encore d'évaluation
Econometrie Des Donnees de Panel CH 1. Modeles Lineaires Non Dynamiques (PDFDrive)
183 pages
Methodes D Echantiollonnage
Pas encore d'évaluation
Methodes D Echantiollonnage
7 pages
Presentation APROSTAB - Formation - Critère D'éligibilité
Pas encore d'évaluation
Presentation APROSTAB - Formation - Critère D'éligibilité
2 pages
TD Tas 2
Pas encore d'évaluation
TD Tas 2
2 pages
Série D'exercices N°1 Avec Correction - Math - Probabilités - Bac Mathématiques (2019-2020) MR Zaag Brahim Sedki
Pas encore d'évaluation
Série D'exercices N°1 Avec Correction - Math - Probabilités - Bac Mathématiques (2019-2020) MR Zaag Brahim Sedki
2 pages
Langue Et Communication
Pas encore d'évaluation
Langue Et Communication
61 pages
Analyse Qualitative et Quantitative B3
Pas encore d'évaluation
Analyse Qualitative et Quantitative B3
21 pages
Manuel TP Statistiques pour TSGE
100% (1)
Manuel TP Statistiques pour TSGE
27 pages
Corrige Examen Stat Proba 21-22-1
Pas encore d'évaluation
Corrige Examen Stat Proba 21-22-1
6 pages
Concours Statistique et Économie 2017
Pas encore d'évaluation
Concours Statistique et Économie 2017
7 pages
MasterMBD TD1
Pas encore d'évaluation
MasterMBD TD1
2 pages
License Statistics and Data Anlaysis
100% (1)
License Statistics and Data Anlaysis
38 pages
Sociologie de L'éducation - Mohamed Cherkaoui
100% (3)
Sociologie de L'éducation - Mohamed Cherkaoui
87 pages
06-Interval Confiance PDF
Pas encore d'évaluation
06-Interval Confiance PDF
23 pages
Cours Statistisques Et Probabilités L2 ISSGEA 2022-2023 DRAFT00
Pas encore d'évaluation
Cours Statistisques Et Probabilités L2 ISSGEA 2022-2023 DRAFT00
45 pages
Comprendre la Cointégration Économique
Pas encore d'évaluation
Comprendre la Cointégration Économique
10 pages