Classification et regression
Volume important des données
Analyse des données
Source de Exploratoire : rechercher des régularités
données dans les données
Confirmatoire : répondre à des questions
précises
Descriptive : caractériser les données
observées
Décisionnelle : aller au-delà des données
observées
Comment accélérer le processus de
Développer les Outils de Classification catégorisation des données tout en
Automatique assurant plus de précision?
Exemple d’application
A Quoi Sert la Classification Automatique ?
La classification automatique (clustering) est
évaluer
l’opération la qualité
d’arranger, selon des données,
certains critères, une
Extraire
distribution des les données pertinentes
données composée etd’un
importantes,
Text Mining Segmentation d’image Reconnaissance de signature
Découvrir la structure des données,
Sécuritéd’observations hétérogènes
ensemble dans des
Biologie Finance
groupescontenant
Organiser
deset observations
gérer les données.
homogènes,
appelés classes.
Préparation de données
- Intégration, réduction et Procédure de
transformation des classification Analyse des résultats
données automatique et
Collection des - Etablissement des validation des • Interprétation
Données objectifs résultats • Compréhension
• Décision
Etat de l’art
Approche utilisée
Classification automatique
Contributions Réseaux de Neurones Artificiels
Expérimentations
Conclusion & perspectives
Quelle
mesure de
ressemblance
?
Comment
Quelle est la identifier une Quel
validité de ce approche de processus de
résultat ? traitement?
classification
?
Comment
définir le
nombre des
classes ?
Etat de l’art
Approche utilisée
Classification automatique
Contributions Réseaux de Neurones Artificiels
Expérimentations
Conclusion & perspectives
Mesure de Distance
Facteurs
d’homogénéité
n
Temps de calcul réduit
Similarité
, y) ( xi yi ) 2
DE(xConnectivité
Proximité i 1
n
calcule le chemin parcouru en forme de grille DE ( X i , Yi ) X i ,k Yi ,k
k 1
Objectif
T
Maximiser DM(X μ la 1 X μ
, μ ) etX minimiser
basée sur la corrélation entre leslavariables
ressemblance inter-classe
q k q k k q k
ressemblance intra-classe.
Etat de l’art
Approche utilisée
Classification automatique
Contributions Réseaux de Neurones Artificiels
Expérimentations
Conclusion & perspectives
les différentes approches de classification automatique
PROCEDURES GLOBALES PROCEDURES LOCALES
Approches statistiques non
Approches paramétriques
Approches
statistiques métriques
Approches
Analyse des Détection des modes Détection des
Connexionnistes
mélanges contours des modes
Apprentissage Maxima Local
Connexionnistes Opérateurs
différentiels
Techniques de Convexité
partitionnement Morphologie
Morphologie Mathématique
Méthodes
hiérarchiques
Statistiques
d’Ordre
Champ de Markov
Analyse de Texture
Clustering K-means algorithm
Principle
An algorithm that works in two
steps
1. Assignment of points to
nearest center
2. displacement from the center
to the average of the cluster