0% ont trouvé ce document utile (0 vote)

41 vues10 pages

4 Ac

L'analyse discriminante est une méthode utilisée pour décrire et classer des individus en fonction de variables explicatives, couramment appliquée dans des domaines tels que le crédit scoring et le diagnostic médical. Elle vise à établir une relation entre des symptômes et des diagnostics en maximisant la variance interclasse tout en minimisant la variance intraclasse. Le document aborde également des méthodes d'affectation basées sur des règles géométriques et des modèles bayésiens pour améliorer la précision des classifications.

Transféré par

lcflak630

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

41 vues10 pages

4 Ac

Transféré par

lcflak630

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

[theorem]Définition

L’Analyse discriminante

Leila HAMDAD

Leila HAMDAD Introduction au Machine Learning

Plan

1 Introduction

Leila HAMDAD Introduction au Machine Learning

Introduction

Introduction
L’analyse discriminante est une méthode de description et de classement
des individus caractérisés par un certain nombre de variables
explicatives(attributs). C’est une méthode très utilisée en credit scoring,
diagnostic automatique, contrôle de qualité, prévision de risques,
reconnaissance des formes
Exemple
Exemple d’application : Soit une population de malades souffrant de
maladie cardiaques, On observe un certain nombre de symptômes
caractéristiques. Chaque malade est représenté par un vecteur dans
l’espace des symptômes. Le médecin pose un diagnostic sur les maldes,
donc le nuage de malades est scindé en plusieurs sous nuages relatives
chacun à un diagnostic.

Le but de L’AD est d’étudier la relation entre les symptômes (x) et les
diagnostics (y ). L’AD cherchera un système de combinaison linéaire des
variables qui permet de discriminer au mieux les modalités de la variables
qualitatives y . Cette combinaison est celle qui vérifiera que la variance
entre modalités est grande et la variance correspondant à la modalité est
minimal.
Leila HAMDAD Introduction au Machine Learning
Introduction

Centres de Gravités
Le centre de gravité du nuage N(I ) :
1
 
n X
X  . 
g=  .. 
pi xi =  
i=1 2
X
Le centre de gravité du nuage N(Ik )
1

nk X
X  . 
gk = pik xik = 
 .. 

i=1 2
X
Comme on a m centres de gravités gk , k = 1, ..., m, on définit le nuage
des centres de gravités N(G ) = {(gk , p k ), k = 1, ..., m}, tel que p k = nnk

Remarque
Les centres de gravités de N(I ) et de N(G ) sont identiques.

Leila HAMDAD Introduction au Machine Learning

Introduction

Problème de l’AD

D’après le théorème de Huygens, on a

I = IG + Ik

tels que I représente l’inertie du nuage N(I ), IG est l’inertie du nuage

N(G ) et Ik est l’inertie du nuage N(Ik ).
Pour un vecteur donné u dans R p , cela se traduit par

u t Vu = u t Eu + u t Du

où ,V , E et D , sont les matrices de variances covariances totale, inter

classes et intra classes respectivement.
Le problème de l’AD se formule ainsi : Trouver un vecteut u dans R p qui
t
maximise la quantité uut Vu
Eu
. C’est à dire choisir parmi les formes linéaires,
celle qui maximise l’inertie interclasse et minimise l’inertie intraclasse.

Leila HAMDAD Introduction au Machine Learning

Introduction

Résolution du problème

t
: Rendre maximale uut Vu
Eu
c’est maximiser u t Eu et minimiser u t Vu, et
puisque V = E + D, donc minimiser u t Du.
ainsi
u t Eu u t Eu
max t ⇔ max t = max ψ(u)
u Vu u Du
Le vecteur u qui maximise cette fonction, annule donc la dérivée dψ(u)du .
La résolution de ce problème mène au résultat suivant, l’axe qui
discrimine au mieux léchantillon d’apprentissage est engendré par le
vecteur u, vecteur propre de la matrice D −1 E , associé à la plus grande
valeur propre.

Leila HAMDAD Introduction au Machine Learning

Introduction

Règles d’affectation

Une fois trouvées les fonctions discriminantes qui séparent au mieux les
individus répartis en m classes, on veut trouver la classe d’affectation
d’un nouvel individu, pour lequel on connaı̂t les valeurs des variables
(X l , X 2 , ..., X p ).
Règle géométrique : Une règle simple et géométrique affecte le nouvel
individu dont le centre de gravité est le plus proche selon la distance de
Mahalhanobis.
Cette approche purement géométrique ne prend cependant pas en compte
les probabilités à priori des différentes classes, qui peuvent être très
inégales dans certaines applications (prévision de défaillance par exemple,
ou diagnostic d’un événement rare). Le modèle bayésien d’affectation qui
est une méthode probabiliste permet d’améliorer cet inconvénient.

Leila HAMDAD Introduction au Machine Learning

Introduction

Le modèle bayésien d’affectation

Au moment de l’apprentissage, nous savons que l’individu i appartient au
groupe Ik (appartenance codée par la valeur : Yi = k) et nous calculons
une estimation de la probabilité P(Xi /Ik ), Au moment de l’affectation
d’un nouvel individu noté x, on peut calculer les différents P(x/Ik ) pour
k = l, 2, ..., m.
Il paraı̂t raisonnable d’affecter x à la classe Ik pour laquelle P(x/Ik ) est
maximale.
Cependant, ce ne sont pas les probabilités P(x/Ik ) qu’il faudrait
connaı̂tre mais les probabilités P(Ik /x), c’est-à-dire la probabilité du
groupe Ik sachant que x est réalisé.
D’aprés le Théorème de Bayes :

P(x/Ik )P(Ik )
P(I /x) = m
P
P(x/Ik )P(Ik )
k=1

P(Ik ) est la probabilité à priori du groupe k. Le dénominateur est le

même pour toutes les classes. La classe d’affectation de x sera celle pour
laquelle le produit P(x/Ik )P(Ik ) est maximal.
Leila HAMDAD Introduction au Machine Learning
Introduction

Le modèle bayésien dans le cas normal

Soit fk (X ) la densité de probabilité de x connaissant Ik dans le cas

multinormal, gk et Dk désignant respectivement la moyenne et la matrice
des covariances théoriques à l’intérieur du groupe Ik :
−p −1 −1
fk (X ) = (2π) 2 |Dk | 2 exp{ (x − gk )t Dk−1 (x − gk )}.
2

L’affectation se fera selon la règle : choisir kb tel que

fbk (X )P(Ibk ) = maxfk (X )P(Ik , k = 1, ..., m
ce qui est équivalent à trouver le minimum sur k de la fonction sck (x)
appelée score discriminant :

sck (x) = (x − gk )t Dk−1 (x − gk ) + log |Dk | − 2logP(Ik

Leila HAMDAD Introduction au Machine Learning

Introduction

Le modèle bayésien dans le cas nonparamétrique

Lorsque la densité fk (X ) est inconnue, elle est estimée par l’estimateur à

noyau (Parzen et Rosenblatt en (1962)), elle est définie par
nk
1 X x − xi
fk (X ) = K( ).
hnk h
i=1

R que K (x) est la fonction noyau qui vérifie que k(x) ≥ 0 et

tels
k(x)dx = 1. Cette densité peut prendre plusieurs forme dont :
Z
−x 2
k(x) = e 2 dx.

h est appelé fenêtre de lissage, c’est un paramètre très important, qui est
déterminé de façon à garantir un faible biais et une faible variance. La
méthode de validation croisée est utilisée pour déterminer h.

Leila HAMDAD Introduction au Machine Learning

Vous aimerez peut-être aussi

6.cours AD
Pas encore d'évaluation
6.cours AD
4 pages
KNN Talk
Pas encore d'évaluation
KNN Talk
32 pages
Présentation Cours SVM
Pas encore d'évaluation
Présentation Cours SVM
15 pages
Présentation Cours Apprentissage
Pas encore d'évaluation
Présentation Cours Apprentissage
28 pages
Chapitre II
Pas encore d'évaluation
Chapitre II
48 pages
Cours Bishop
Pas encore d'évaluation
Cours Bishop
10 pages
Applications de l'Intelligence Artificielle
Pas encore d'évaluation
Applications de l'Intelligence Artificielle
65 pages
Intro DMBeamer 2018
Pas encore d'évaluation
Intro DMBeamer 2018
30 pages
Cours Complet ML Mory - (Partie 5 - Apprentissage Non-Supervisé)
Pas encore d'évaluation
Cours Complet ML Mory - (Partie 5 - Apprentissage Non-Supervisé)
43 pages
A7 Add
Pas encore d'évaluation
A7 Add
18 pages
Objectifs
Pas encore d'évaluation
Objectifs
33 pages
Xups13 02
Pas encore d'évaluation
Xups13 02
34 pages
Seance 3
Pas encore d'évaluation
Seance 3
30 pages
Chap4 - Réseaux Bayésiens
Pas encore d'évaluation
Chap4 - Réseaux Bayésiens
27 pages
Classification Automatique
Pas encore d'évaluation
Classification Automatique
48 pages
Présentation Cours ACP
Pas encore d'évaluation
Présentation Cours ACP
21 pages
Classifieurs Linéaires
Pas encore d'évaluation
Classifieurs Linéaires
42 pages
Résumé Chap6 AFD
Pas encore d'évaluation
Résumé Chap6 AFD
4 pages
Analyse Discriminante v2
100% (1)
Analyse Discriminante v2
43 pages
Introduction au Machine Learning et Deep Learning
Pas encore d'évaluation
Introduction au Machine Learning et Deep Learning
36 pages
RDF Ds 0102
Pas encore d'évaluation
RDF Ds 0102
6 pages
Introduction ' A L'intelligence Artificielle: Big Data
Pas encore d'évaluation
Introduction ' A L'intelligence Artificielle: Big Data
10 pages
Introduction à la fouille de données
Pas encore d'évaluation
Introduction à la fouille de données
83 pages
0 Intro - New
Pas encore d'évaluation
0 Intro - New
16 pages
04 Classification Lineaire 2pages
Pas encore d'évaluation
04 Classification Lineaire 2pages
65 pages
CA-Chapitre 3
Pas encore d'évaluation
CA-Chapitre 3
29 pages
Fondements de l'apprentissage machine
Pas encore d'évaluation
Fondements de l'apprentissage machine
12 pages
Classification: Méthodes et Applications
Pas encore d'évaluation
Classification: Méthodes et Applications
46 pages
K Means
Pas encore d'évaluation
K Means
32 pages
Chapitre 3-Apprentissage Non Supervisé
Pas encore d'évaluation
Chapitre 3-Apprentissage Non Supervisé
85 pages
Classification Supervisée Et Non Supervisé
Pas encore d'évaluation
Classification Supervisée Et Non Supervisé
5 pages
Introbf
Pas encore d'évaluation
Introbf
32 pages
Classifieurs Paramétriques et Décision Bayésienne
Pas encore d'évaluation
Classifieurs Paramétriques et Décision Bayésienne
30 pages
Introduction à l'apprentissage statistique
Pas encore d'évaluation
Introduction à l'apprentissage statistique
48 pages
TP ML Supervise
Pas encore d'évaluation
TP ML Supervise
9 pages
Cours Apprentissage
Pas encore d'évaluation
Cours Apprentissage
24 pages
Classification Bayésienne Simplifiée
Pas encore d'évaluation
Classification Bayésienne Simplifiée
41 pages
Classification bayésienne en science des données
Pas encore d'évaluation
Classification bayésienne en science des données
69 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
SN 372
Pas encore d'évaluation
SN 372
2 pages
Classification du Trafic Réseau Maillé
Pas encore d'évaluation
Classification du Trafic Réseau Maillé
10 pages
Poly FML
Pas encore d'évaluation
Poly FML
34 pages
TD 3
Pas encore d'évaluation
TD 3
12 pages
Analyse Discriminante-Methodes Geometriques Cle8b864f
Pas encore d'évaluation
Analyse Discriminante-Methodes Geometriques Cle8b864f
53 pages
Analyse Discriminante Quadratique
Pas encore d'évaluation
Analyse Discriminante Quadratique
30 pages
Slides-Part 4
Pas encore d'évaluation
Slides-Part 4
4 pages
Cours Datamining P2
Pas encore d'évaluation
Cours Datamining P2
26 pages
Classifieurs en Classification Supervisée
Pas encore d'évaluation
Classifieurs en Classification Supervisée
32 pages
Serie N2
Pas encore d'évaluation
Serie N2
2 pages
ML-Chap I Introduction
Pas encore d'évaluation
ML-Chap I Introduction
43 pages
ML Seance 3
Pas encore d'évaluation
ML Seance 3
103 pages
Modélisation et apprentissage statistique
Pas encore d'évaluation
Modélisation et apprentissage statistique
103 pages
Prédiction de Classe par Analyse de Données
Pas encore d'évaluation
Prédiction de Classe par Analyse de Données
1 page
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
7 pages
Seance 1
Pas encore d'évaluation
Seance 1
26 pages
BigData2 CM1
Pas encore d'évaluation
BigData2 CM1
35 pages
Anne Philippe Stat Bayes 2017
Pas encore d'évaluation
Anne Philippe Stat Bayes 2017
41 pages
ML Motivation ApprentissatgeStat French
Pas encore d'évaluation
ML Motivation ApprentissatgeStat French
37 pages
SR9 ClassifSuperviseeBayes
Pas encore d'évaluation
SR9 ClassifSuperviseeBayes
92 pages
Chap 2 - Codesign Généralités
Pas encore d'évaluation
Chap 2 - Codesign Généralités
20 pages
ALTERNATIF
Pas encore d'évaluation
ALTERNATIF
16 pages
Chap 7 - Cosynthèse
Pas encore d'évaluation
Chap 7 - Cosynthèse
27 pages
La Place
Pas encore d'évaluation
La Place
9 pages
Chap 4 Modélisation
Pas encore d'évaluation
Chap 4 Modélisation
32 pages
Chap 0 - Conception - Circuits Intégrés
Pas encore d'évaluation
Chap 0 - Conception - Circuits Intégrés
59 pages
Random Forest
Pas encore d'évaluation
Random Forest
6 pages
Solution EP
Pas encore d'évaluation
Solution EP
5 pages
Nom . .Prénom Groupe
Pas encore d'évaluation
Nom . .Prénom Groupe
2 pages
Présentation Cours Res Neur
Pas encore d'évaluation
Présentation Cours Res Neur
9 pages
Solution CI BWEB 2017 S2
Pas encore d'évaluation
Solution CI BWEB 2017 S2
2 pages
Examen Bureautique et Web
Pas encore d'évaluation
Examen Bureautique et Web
2 pages
Guide Complet du Publipostage Automatisé
Pas encore d'évaluation
Guide Complet du Publipostage Automatisé
5 pages
Régression Linéaire: Concepts et Applications
Pas encore d'évaluation
Régression Linéaire: Concepts et Applications
21 pages
Concepts Matriciels et Statistiques
Pas encore d'évaluation
Concepts Matriciels et Statistiques
8 pages
Chap 2
Pas encore d'évaluation
Chap 2
38 pages
Chap 6
Pas encore d'évaluation
Chap 6
34 pages
Techniques d'Analyse de Données et Data Mining
Pas encore d'évaluation
Techniques d'Analyse de Données et Data Mining
15 pages
Réductions Commerciales et Financières : Définitions et Comptabilisation
Pas encore d'évaluation
Réductions Commerciales et Financières : Définitions et Comptabilisation
3 pages
TVA sur Immobilisations : Exemples Pratiques
Pas encore d'évaluation
TVA sur Immobilisations : Exemples Pratiques
5 pages
Chap 8
Pas encore d'évaluation
Chap 8
35 pages
Opérations Usuelles Ventes
Pas encore d'évaluation
Opérations Usuelles Ventes
10 pages
Chap 1
Pas encore d'évaluation
Chap 1
43 pages
Cours sur la Fragmentation des Roches
Pas encore d'évaluation
Cours sur la Fragmentation des Roches
18 pages
Lancer de Poids
Pas encore d'évaluation
Lancer de Poids
17 pages
La Categorisation, Les Types de Proces
Pas encore d'évaluation
La Categorisation, Les Types de Proces
39 pages
Catalogue Produits Enicab
Pas encore d'évaluation
Catalogue Produits Enicab
104 pages
Rapport Final Groupe 8 Projet Intégrateur
100% (1)
Rapport Final Groupe 8 Projet Intégrateur
61 pages
Systeme Catalytique
100% (1)
Systeme Catalytique
7 pages
Devoir de Sciences Physiques : Hydrocarbures et Lentilles
Pas encore d'évaluation
Devoir de Sciences Physiques : Hydrocarbures et Lentilles
1 page
Chap 1 Sur Les Systèmes de Maintenance À Bord (Ata 45)
Pas encore d'évaluation
Chap 1 Sur Les Systèmes de Maintenance À Bord (Ata 45)
22 pages
Compilation Examens Geo Et Histoire
Pas encore d'évaluation
Compilation Examens Geo Et Histoire
10 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
3 pages
Découverte de la Chimie Moderne
Pas encore d'évaluation
Découverte de la Chimie Moderne
4 pages
Antonin Artaud - Pour en Finir Avec Le Jugement de Dieu (1947)
Pas encore d'évaluation
Antonin Artaud - Pour en Finir Avec Le Jugement de Dieu (1947)
34 pages
Étude de faisabilité : lampadaires solaires en Guinée
100% (2)
Étude de faisabilité : lampadaires solaires en Guinée
78 pages
Analyse de "Nuit Rhénane" d'Apollinaire
Pas encore d'évaluation
Analyse de "Nuit Rhénane" d'Apollinaire
2 pages
Hero Student Academy WEB NOVEL (FR)
Pas encore d'évaluation
Hero Student Academy WEB NOVEL (FR)
68 pages
1ère A - APC - Les Alcanes
Pas encore d'évaluation
1ère A - APC - Les Alcanes
5 pages
Activités Graphiques et Ludiques
Pas encore d'évaluation
Activités Graphiques et Ludiques
33 pages
0-Fiche Validation Sujet P2E 2021-2022
Pas encore d'évaluation
0-Fiche Validation Sujet P2E 2021-2022
2 pages
Tragédie d'Œdipe Roi de Sophocle
Pas encore d'évaluation
Tragédie d'Œdipe Roi de Sophocle
50 pages
Gestion Mémoire 1 Serie Systeme D'exploitation
Pas encore d'évaluation
Gestion Mémoire 1 Serie Systeme D'exploitation
130 pages
Selectra - Prom FR
Pas encore d'évaluation
Selectra - Prom FR
2 pages
A1 Fiche de Lecture N°7 La Météo À Paris
Pas encore d'évaluation
A1 Fiche de Lecture N°7 La Météo À Paris
2 pages
Peur et guérison : un nouveau paradigme
Pas encore d'évaluation
Peur et guérison : un nouveau paradigme
40 pages
CTC Bon - de - Commande
Pas encore d'évaluation
CTC Bon - de - Commande
1 page
Une Visite Distinguée à Brakelheim
Pas encore d'évaluation
Une Visite Distinguée à Brakelheim
51 pages
Projet PCA
Pas encore d'évaluation
Projet PCA
27 pages
Lierre terrestre : secrets, usages et bienfaits
Pas encore d'évaluation
Lierre terrestre : secrets, usages et bienfaits
21 pages
Trousse de Lecture C1
100% (1)
Trousse de Lecture C1
10 pages
Rapport Prediction Flux Tresorerie ARIMA
Pas encore d'évaluation
Rapport Prediction Flux Tresorerie ARIMA
5 pages
Avis Technique Panneau Bilame
Pas encore d'évaluation
Avis Technique Panneau Bilame
48 pages