Table des matières
0.1 Introduction à l’apprentissage automatique . . . . . . . . . . . . . . . 4
0.1.1 apprentissage non supervisé : . . . . . . . . . . . . . . . . . . 4
0.1.2 apprentissage supervisé : . . . . . . . . . . . . . . . . . . . . . 5
1
Table des figures
2
Liste des tableaux
3
LISTE DES TABLEAUX
0.1 Introduction à l’apprentissage automatique
Dans de nombreuses disciplines scientifiques, l’objectif premier est de modéliser
la relation entre un ensemble de quantités observables (entrées) et un autre ensemble
de variables qui y sont liées (sorties). Une fois qu’un tel modèle mathématique est
déterminé, il est possible de prédire la valeur des variables souhaitées en mesurant les
observables. Malheureusement, de nombreux phénomènes du monde réel sont trop
complexes pour être modélisés directement sous la forme d’une relation entrée-sortie
fermée. L’apprentissage automatique fournit des techniques qui peuvent construire
automatiquement un modèle informatique de ces relations complexes en traitant
les données disponibles et en maximisant un critère de performance dépendant du
problème. Le processus automatique de construction du modèle est appelé ”for-
mation” et les données utilisées à des fins de formation sont appelées ”données de
formation”. Le modèle formé peut fournir de nouvelles idées sur la façon dont les
variables d’entrée sont mises en correspondance avec la sortie et il peut être utilisé
pour faire des prédictions pour de nouvelles valeurs d’entrée qui ne faisaient pas
partie des données de formation.
Pour pouvoir apprendre un modèle précis, les algorithmes d’apprentissage auto-
matique nécessitent souvent de grandes quantités de données d’apprentissage. C’est
pourquoi, une première étape importante dans l’utilisation des techniques d’appren-
tissage automatique consiste à collecter un large ensemble d’exemples d’appren-
tissage représentatifs et de les stocker sous sous une forme adaptée à des fins de
calcul. Les progrès récents de la collecte, du stockage et de la capacité de traitement
des données numériques ont rendu possible l’application de l’apprentissage automa-
tique dans de nombreux domaines tels que le diagnostic médical, la bioinformatique,
l’informatique chimique, l’analyse des réseaux sociaux, l’analyse des marchés bour-
siers et la robotique. Il existe généralement plus d’un modèle de calcul qui peut
être entraı̂né pour un problème d’apprentissage automatique donné. qui peut être
formé pour un problème d’apprentissage automatique donné. Malheureusement, il
n’existe pas de règle fixe pour sélectionner un modèle ou un algorithme particulier.
Les performances d’un modèle spécifique dépendent de nombreux facteurs tels que
la quantité et la qualité des données d’apprentissage, la complexité et la forme de
la relation entre les données d’entrée et les données de sortie. la complexité et la
forme de la relation entre les variables d’entrée et de sortie, et les contraintes de
calcul, telles que le temps d’apprentissage et la mémoire disponibles. En fonction
du problème, il est souvent nécessaire d’essayer différents modèles et algorithmes
pour trouver le meilleur. différents modèles et algorithmes pour trouver ceux qui
conviennent le mieux.
Les techniques d’apprentissage automatique peuvent être classées en deux grandes
catégories, selon que les valeurs de sortie doivent ou non être présentes dans les
données d’apprentissage [?].
0.1.1 apprentissage non supervisé :
Considérons une machine (ou un organisme vivant) qui reçoit une séquence
d’entrées x1 , x2 , x3 , ..., où xt est l’entrée sensorielle au temps t. Cette entrée, que
nous appellerons souvent les données, peut correspondre à une image sur la rétine,
page 4
LISTE DES TABLEAUX
aux pixels d’un appareil photo ou à une forme d’onde sonore. Elle peut également
correspondre à des données sensorielles moins évidentes, par exemple les mots d’un
article de presse ou la liste des articles d’un panier de supermarché.
On peut distinguer quatre types différents d’apprentissage automatique. Dans
l’apprentissage supervisé, on donne également à la machine1 une séquence de sorties
souhaitées y1 , y2 , ... L’objectif de la machine est d’apprendre à produire la sortie
correcte en fonction d’une nouvelle entrée. Cette sortie peut être une étiquette de
classe (en classification) ou un nombre réel (en régression).
Dans l’apprentissage par renforcement, la machine interagit avec son environne-
ment en produisant des actions a1 , a2 , .... Ces actions affectent l’état de l’environne-
ment, ce qui a pour conséquence que la machine reçoit des récompenses scalaires (ou
des punitions) r1 , r2 , .... L’objectif de la machine est d’apprendre à agir de manière
à maximiser les récompenses futures qu’elle reçoit (ou à minimiser les punitions) au
cours de sa vie. L’apprentissage par renforcement est étroitement lié aux domaines
de la théorie de la décision (en statistiques et en sciences de gestion) et de la théorie
du contrôle (en ingénierie). Les problèmes fondamentaux étudiés dans ces domaines
sont souvent formellement équivalents, et les solutions sont les mêmes, bien que des
aspects différents du problème et de la solution soient généralement mis en avant.
Un troisième type d’apprentissage automatique est étroitement lié à la théorie des
jeux et généralise l’apprentissage par renforcement. Ici encore, la machine reçoit des
données, effectue des actions et reçoit des récompenses. Cependant, l’environnement
avec lequel la machine interagit n’est pas un monde statique, mais il peut contenir
d’autres machines qui peuvent également détecter, agir, recevoir des récompenses
et apprendre. Le but de la machine est donc d’agir de manière à maximiser les
récompenses à la lumière des actions actuelles et futures des autres machines. Bien
qu’il existe de nombreux travaux sur la théorie des jeux pour les systèmes simples,
le cas dynamique avec de multiples machines qui s’adaptent reste un domaine de
recherche actif et difficile.
Enfin, dans l’apprentissage non supervisé, la machine reçoit simplement des
entrées x1, x2, ..., mais n’obtient ni les sorties cibles supervisées, ni les récompenses
de son environnement. Il peut sembler quelque peu mystérieux d’imaginer ce que
la machine pourrait apprendre étant donné qu’elle ne reçoit aucun retour de son
environnement. Cependant, il est possible de développer un cadre formel pour l’ap-
prentissage non supervisé basé sur la notion que l’objectif de la machine est de
construire des représentations de l’entrée qui peuvent être utilisées pour la prise de
décision, la prédiction des entrées futures, la communication efficace des entrées à
une autre machine, etc. En un sens, l’apprentissage non supervisé peut être considéré
comme la recherche de modèles dans les données, au-delà de ce qui serait considéré
comme du pur bruit non structuré [?].
0.1.2 apprentissage supervisé :
L’apprentissage supervisé est simplement une formalisation de l’idée d’apprentis-
sage à partir d’exemples. Dans l’apprentissage supervisé, l’apprenant (généralement
un programme informatique) dispose de deux ensembles de données, un ensemble
d’apprentissage et un ensemble de test. L’idée est que l’apprenant ”apprenne” à
partir d’un ensemble d’exemples étiquetés dans l’ensemble d’apprentissage afin de
pouvoir identifier des exemples non étiquetés dans l’ensemble de test avec la plus
page 5
LISTE DES TABLEAUX
grande précision possible. Autrement dit, l’objectif de l’apprenant est de développer
une règle, un programme ou une procédure qui classe les nouveaux exemples (dans
l’ensemble de test) en analysant les exemples qui lui ont été donnés et qui ont déjà
une étiquette de classe. Par exemple, un ensemble d’apprentissage peut consister en
des images de différents types de fruits (par exemple, des pêches et des nectarines),
où l’identité du fruit dans chaque image est donnée à l’apprenant. L’ensemble de test
sera ensuite composé d’autres morceaux de fruits non identifiés, mais appartenant
aux mêmes classes. L’objectif est que l’apprenant développe une règle capable d’iden-
tifier les éléments de l’ensemble de test. Il existe de nombreuses approches différentes
qui tentent d’élaborer la meilleure méthode possible pour classer les exemples de l’en-
semble de test à l’aide des données fournies par l’ensemble d’apprentissage. Nous en
aborderons quelques-unes dans ce document, après avoir défini plus formellement l
l’apprentissage supervisé de manière plus formelle.
Dans l’apprentissage supervisé, l’ensemble d’apprentissage est constitué de n
paires ordonnées (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), où chaque xi est une mesure ou un
ensemble de mesures d’un point de données unique, et yi est l’étiquette de ce point
de données [?] .
page 6