Apprentissage Automatique
1. Introduction
Le but de cet enseignement est de s‟initier à l‟apprentissage artificiel et à la modélisation de
systèmes de classification ; mais, également, d‟étudier et pouvoir, au final, concevoir des
algorithmes de prédiction. De tels modèles seront capables de prédire la nature (forme,
apparence, texture, couleur, …) et/ou le comportement (fonction, fonctionnement, variable,
variations, …) de nouveaux exemples.
Cependant, la quantité de données récupérées par la technologie imagerie ou dans des fichiers
BD dans divers domaines est très conséquente. L‟analyse directe de ces données pourra donc
s‟avérer très lente ou trop complexe, voire impossible par des méthodes traditionnelles. Le but
principal des techniques d‟optimisation (méthode statistique, ACP, …) est de filtrer et réduire
l‟ensemble des données extraites ou acquises du monde réel afin de sélectionner et ne porter
intérêt qu‟à un sous-ensemble des variables les plus pertinentes pour le problème à traiter.
Exemple, soit un vecteur caractéristique 𝑉 = 𝑣1 , 𝑣2 , … , 𝑥𝑛 , 𝑛 ≫ 0, représentant les
caractéristiques d‟une classe objets de la nature (voitures, plantes, …), ainsi cet espace de
dimension 𝒏 est réduit en un espace de dimension 𝒌, avec 𝒌 < 𝒏, qui est aussi représentatif
et discriminant que celui de dimension 𝑛, mais plus facile à traiter.
2. Contexte Général
Une fois les données acquises du terrain ou du réel (images, vidéos, fichiers BD) sous forme
de données brutes, il faut les analyser et en extraire de l‟information sous forme de nouvelles
connaissances, de descripteurs ou de vecteur de caractéristiques. Lorsque les données sont
conséquentes leur traitement peut se faire par différentes méthodes en particulier le traitement
statistique (dénombrement) lequel est un privilégié des disciplines de l‟IA.
Les deux disciplines (intelligence artificielle –IA et fouille de données –FD) regroupent en
commun différentes techniques de construction de modèles, elles sont récapitulées sur le
schéma de la Figure 1.
1
Construction de Modèles
(en IA et FD)
A.A Méthodes Statistiques
Analyse en composante principale (ACP)
Appr. Semi- Analyse Factorielle (AF)
Appr. Par Appr. Non- Appr.
supervisé/a
renforcement supervisé Supervisé
utomatique
Clustering ou Règles Classification Régression
regroupement d‟association (sortie discrète) (sortie continue)
Figure 1. Schéma des différentes techniques issues de l’IA et FD pour
la construction de modèles de données.
Les deux principales composantes de la construction de modèles d‟apprentissage et de
classification sont des techniques issues de la statistique multivariée ou bien des techniques
d‟apprentissage automatique (AA).
Nous nous intéressons plus spécialement aux techniques de l‟apprentissage automatique.
3. Présentation de la Problématique
Les méthodes dédiées à l‟AA visent à construire des modèles génériques à partir de données
fournies (observées). Ainsi, ces observations ou échantillons sont vues comme des exemples
illustrant les relations entre des variables observées.
Le but : est alors d‟utiliser ces exemples pour en déduire des caractéristiques ou propriétés
liant ces données entre elles.
Problème : la difficulté repose sur le fait que les données de l‟ensemble d‟apprentissage ne
contient souvent qu‟un nombre fini d‟exemples (cas, des méthodes statistiques).
Ainsi, on ne dispose donc pas de l‟ensemble de tous les comportements ou états possibles,
en fonction de toutes les entrées possibles (cas, des modèles non-déterministes ou
probabilistes).
2
4. Données d’Apprentissage
Les données d‟apprentissage sont, souvent, réparties en 3 catégories :
- L’ensemble d’apprentissage ou population d’entrainement : constitue l‟ensemble des
candidats ou exemples (images, attributs, DB, …) utilisés pour générer le modèle
d‟apprentissage. Alors que,
- l’ensemble de Test est constitué des candidats sur lesquels sera appliqué le modèle
d‟apprentissage (pour tester et corriger l‟algorithme).
- L’ensemble de validation peut être utilisé lors de l‟apprentissage (comme sous population
de l‟ensemble d‟apprentissage) afin de valider (intégrer) le modèle et d‟éviter le sur-
apprentissage.
NB : Selon les domaines, les connaissances ou données d‟apprentissage (tel en IA) peuvent
être de diverses formes : mots, phrases, variables ou attributs, des vecteurs de valeurs :
définissant un ensemble de propriétés d‟un objet, …
5. Types d’Apprentissage
En fonction du type de problème que l‟on se pose, voir Fig. 2.1, on peut avoir à mettre en
place différents types d‟apprentissage :
- Apprentissage Supervisé : Cette approche a pour objectif la conception d‟un modèle
reliant des données d‟apprentissage à un ensemble de valeurs de sortie (un
comportement).
e1 Modèle ou s1
… Algorithme …
en d’apprentissage sn
Figure 2.3. Schéma d’un modèle supervisé.
- Apprentissage par Renforcement [Kae 96] : Les données en entrée sont les mêmes que
pour l‟apprentissage supervisé, cependant l’apprentissage est guidé par l’environnement
sous la forme de récompenses ou de pénalités données en fonction de l’erreur commise
lors de l‟apprentissage.
- Apprentissage Non-Supervisé [Bar 89] : Il vise à concevoir un modèle structurant
l‟information. La différence ici est que les comportements (ou catégories ou encore les
classes) des données d‟apprentissage ne sont pas connus, c’est ce que l’on cherche à
trouver.
3
C1 : classe 1
e1 Modèle ou
… Algorithme
en d’apprentissage C3
C2
Figure 4. Schéma d’un modèle non supervisé.
- Apprentissage Semi-Supervisé : Les données d‟entrée sont constituées
d‟exemples étiquetés et non étiquetés. Ce qui peut être très utile quand on a deux types de
données, car cela permet de ne pas en laisser de côté et d‟utiliser toute l‟information.
e1 s1
e2 Modèle ou ?
… …
ek Algorithme ?
… …
en-1 d’apprentissage sn-1
en ?
Figure 2.5. Schéma d’un modèle semi-supervisé ou incrémental.
NB : Dans notre cas, nous nous concentrerons sur les types d‟apprentissage à savoir
supervisé et non-supervisé.