0% ont trouvé ce document utile (0 vote)
41 vues15 pages

2 - Types D'apprentissage Automatique

Transféré par

Dr. Chekir Amira
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
41 vues15 pages

2 - Types D'apprentissage Automatique

Transféré par

Dr. Chekir Amira
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Mohamed Boudiaf – M’sila

Département Informatique
Master Intelligence Artificielle
2020-2021
Chapitre 2
Types d’apprentissage
automatique
Dr. Mehenni Tahar
Approches de Machine Learning
Types de Machine Learning

• Supervised Learning (Apprentissage Supervisé)


• Unsupervised Learning (Apprentissage Non
Supervisé)
• Ensemble Learning
• Deep Learning (Apprentissage Profond)
• Reinforcement Learning (Apprentissage par
Renforcement)
Apprentissage supervisé
• Définition (Apprentissage supervisé) : On appelle
apprentissage supervisé la branche du machine learning
qui s’intéresse aux problèmes pouvant être formalisés de
la façon suivante :
• Etant données n observations {xi}i=1;…;n décrites dans un
espace X, et leurs étiquettes {yi}i=1;…;n décrites dans un
espace Y
• On suppose que les étiquettes peuvent être obtenues à
partir des observations grâce à une fonction  : X → Y fixe
et inconnue : yi = (xi) + i, où i est un bruit aléatoire.
• Il s’agit alors d’utiliser les données pour déterminer une
fonction f : X → Y telle que, pour tout couple (x;(x))XxY,
f(x)  (x).
Apprentissage supervisé
Apprentissage supervisé
Classification binaire
• Dans le cas où les étiquettes sont binaires, elles indiquent
l’appartenance à une classe. On parle alors de classification binaire.
• Définition (Classification binaire): Un problème d’apprentissage
supervisé dans lequel l’espace des étiquettes est binaire,
autrement dit Y = {0; 1}, est appelé un problème de classification
binaire.
• Voici quelques exemples de problèmes de classification binaire :
o Identifier si un email est un spam ou non ;
o Identifier si un tableau a été peint par Picasso ou non ;
o Identifier si une image contient ou non une girafe ;
o Identifier si une molécule peut ou non traiter la dépression ;
o Identifier si une transaction financière est frauduleuse ou non.
Apprentissage supervisé
Classification multi-classe
• Définition (Classification multi-classe): Un problème
d’apprentissage supervisé dans lequel l’espace des étiquettes
est discret et fini, autrement dit Y = {1; 2; … ;C}, est appelé un
problème de classification multi-classe. C est le nombre de
classes.
• Voici quelques exemples de problèmes de classification
multi-classe :
o Identifier en quelle langue un texte est écrit ;
o Identifier lequel des 10 chiffres arabes est un chiffre
manuscrit
o Identifier l’expression d’un visage parmi une liste
prédéfinie de possibilités (colère, tristesse, joie, etc.) ;
o Identifier à quelle espèce appartient une plante ;
o Identifier les objets présents sur une photographie.
Apprentissage supervisé
Régression

• Définition (Régression): Un problème d’apprentissage


supervisé dans lequel l’espace des étiquettes est Y = R
est appelé un problème de régression.

• Voici quelques exemples de problèmes de régression :


o Prédire le nombre de clics sur un lien ;
o Prédire le nombre d’utilisateurs et utilisatrices d’un
service en ligne à un moment donné ;
o Prédire le prix d’une action en bourse ;
o Prédire l’affinité de liaison entre deux molécules ;
o Prédire le rendement d’un plant de maïs.
Apprentissage Non Supervisé

• Définition (Apprentissage non supervisé): On


appelle apprentissage non supervisé la branche du
machine learning qui s’intéresse aux problèmes
pouvant être formalisés de la façon suivante :
• Etant données n observations {xi}i=1;…;n décrites dans
un espace X, il s’agit d’apprendre une fonction sur X
qui vérifie certaines propriétés.
Apprentissage Non Supervisé
Clustering
• Le clustering, ou partitionnement, consiste à identifier des groupes (ou
clusters) dans les données.
• Cela permet de comprendre leurs caractéristiques générales, et
éventuellement d’inférer les propriétés d’une observation en fonction du
groupe auquel elle appartient.

• Définition (Partitionnement) On appelle partitionnement ou clustering


un problème d’apprentissage non supervisé pouvant être formalisé
comme la recherche d’une partition 𝐾 𝑘=1 𝐶𝑘 des n observations {x }i=1;…;n.
i

Cette partition doit être pertinente au vu d’un ou plusieurs critères à


préciser.
Apprentissage Non Supervisé
Clustering
• Voici quelques exemples de problèmes de partitionnement
• La segmentation de marché consiste à identifier des groupes
d’usagers ou de clients ayant un comportement similaire.
• Identifier des groupes de documents ayant un sujet similaire, sans les
avoir au préalable étiquetés par sujet
• La compression d’image peut être formulée comme un problème de
partitionnement consistant à regrouper des pixels similaires pour
ensuite les représenter plus efficacement.
• La segmentation d’image consiste à identifier les pixels d’une image
appartenant à la même région.
• Identifier des groupes parmi les patients présentant les mêmes
symptômes permet d’identifier des sous-types d’une maladie, qui
pourront être traités différemment.
Apprentissage Non Supervisé
Réduction de dimension
• Il s’agit de trouver une représentation des données dans un espace de
dimension plus faible que celle de l’espace dans lequel elles sont
représentées à l’origine.
• Cela permet de réduire les temps de calcul et l’espace mémoire
nécessaire au stockage les données, mais aussi souvent d’améliorer les
performances d’un algorithme d’apprentissage supervisé entraîné par la
suite sur ces données.
• Définition (Réduction de dimension): On appelle réduction de dimension
un problème d’apprentissage non supervisé pouvant être formalisé
comme la recherche d’un espace Z de dimension plus faible que l’espace
X dans lequel sont représentées n observations {xi}i=1;…;n. Les projections
{zi}i=1;…;n des données sur Z doivent vérifier certaines propriétés à préciser.
Apprentissage par renforcement
• Dans le cadre de l’apprentissage par renforcement, le système
d’apprentissage peut interagir avec son environnement et accomplir des
actions.
• En retour de ces actions, il obtient une récompense, qui peut être positive
si l’action était un bon choix, ou négative dans le cas contraire.
• La récompense peut parfois venir après une longue suite d’actions ; c’est
le cas par exemple pour un système apprenant à jouer au go ou aux
échecs.
• Ainsi, l’apprentissage consiste dans ce cas à définir une politique, c’est-à-
dire une stratégie permettant d’obtenir systématiquement la meilleure
récompense possible.
• Les applications principales de l’apprentissage par renforcement se
trouvent dans les jeux (échecs, go, etc) et la robotique.
Ensemble learning
• Utiliser un modèle pour prédire un comportement, c’est un
premier pas. Mais agréger des milliers de modèles ayant des avis
divergents mais pouvant être chacun spécialisés sur des parties de
la data donne le plus souvent de meilleurs résultats. Nous parlons
alors de méthodes ensemblistes, dont les plus connues sont le
boosting et le bagging.
• Boosting: Il s’agit ici de construire un système où les classifieurs
sont utilisés les uns à la suite des autres, chacun réduisant
l’ensemble de classes possibles pour un objet à classer.
• Bagging: L’organisation parallèle des experts d’un ensemble de
classifieurs implique que chaque classifieur individuel produise une
sortie simultanée. L’ensemble de ces sorties est ensuite fusionné
de façon à produire une décision unique.
Deep Learning
• Le deep Learning s'appuie sur un réseau de neurones artificiels s'inspirant
du cerveau humain. Ce réseau est composé de dizaines voire de centaines
de « couches » de neurones, chacune recevant et interprétant les
informations de la couche précédente.
• Le système apprendra par exemple à reconnaître les lettres avant de
s'attaquer aux mots dans un texte, ou détermine s'il y a un visage sur une
photo avant de découvrir de quelle personne il s'agit.
• À chaque étape, les « mauvaises » réponses sont éliminées et renvoyées
vers les niveaux en amont pour ajuster le modèle mathématique. Au fur
et à mesure, le programme réorganise les informations en blocs plus
complexes. Lorsque ce modèle est par la suite appliqué à d'autres cas, il
est normalement capable de reconnaître un chat sans que personne ne lui
ait jamais indiqué qu'il n'ai jamais appris le concept de chat. Les données
de départ sont essentielles : plus le système accumule d'expériences
différentes, plus il sera performant.

Vous aimerez peut-être aussi