0% ont trouvé ce document utile (0 vote)
13 vues38 pages

Introduction à l'apprentissage automatique

Transféré par

lompoabdoulkarim48
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
13 vues38 pages

Introduction à l'apprentissage automatique

Transféré par

lompoabdoulkarim48
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

introduction à l’apprentissage automatique

Thanh-Nghi DO, Nguyen-Khang PHAM


Université de Can Tho
dtnghi@[Link], pnkhang@[Link]

Hanoi
Mars 2019
Plan

■ Motivation
■ Définitions et problématique

■ Applications

2
Plan

■ Motivation
■ Définitions et problématique

■ Applications

3
■ Motivation
■ Définitions et problématique
Applications
Motivation

■ Pourquoi l’apprentissage automatique?


● Phénomène physique, biologique, financier, etc: trop complexe
pour être décrit de manière déterministe
● Techniques d’apprentissage automatique
● Volonté de remplacer les experts humains
● S’adapter à un environnement
● Résoudre de nouveaux problèmes
● Analyser des données
● Reconnaître des formes, des visages, …
● Contrôler un robot
● Jouer, etc
4
Plan

■ Motivation
■ Définitions et problématique

■ Applications

5
■ Motivation
■ Définitions et problématique
Applications
Définitions

■ Wikipédia
● Apprentissage est un ensemble de mécanismes menant à
l'acquisition de savoir-faire, de savoirs ou de connaissances
● Apprentissage consiste à acquérir ou à modifier une
représentation d'un environnement de façon à permettre avec
celui-ci des interactions efficaces ou de plus en plus efficaces
● Apprentissage automatique concerne la conception,
l'analyse, le développement et l'implémentation de méthodes
permettant à une machine (au sens large) d'évoluer par un
processus systématique, et ainsi de remplir des tâches
difficiles ou impossibles à remplir par des moyens
algorithmiques plus classiques

6
■ Motivation
■ Définitions et problématique
Applications
Définitions

■ Apprentissage automatique
● Implique la conception et le développement de tout programme
qui améliore son mode de fonctionnement par acquisition de
connaissances et aptitudes nouvelles
● Utilise des algorithmes qui permettent l'évolution du
comportement, des données abstraites et des formes par les
ordinateurs
● Science qui consiste à forcer les ordinateurs à agir sans qu'ils
soient programmés séparément
● Algorithme apprend de ses erreurs pour développer par la suite
les meilleurs résultats sans intervention humaine
● a pour objectif de concevoir des programmes pouvant
s’améliorer automatiquement avec l'expérience 7
■ Motivation
■ Définitions et problématique
Applications
Définitions

■ Apprentissage automatique
● Tom Mitchell (1998)
• Apprendre pour mieux faire !
• Un programme informatique est dit apprendre de
l’expérience E pour la tâche T et une mesure de performance
P si sa performance sur T, comme mesurée par P, s’améliore
avec l’expérience E.

8
■ Motivation
■ Définitions et problématique
Applications
Définitions

■ Supposons que votre logiciel lit vos emails qui sont marqués spam
ou non-spam, et à partir de cela, il apprend pour mieux filtre des
emails, quel est la tâche T ?
a) Classifier des emails spams ou non-spams.

b) Lire l’étiquette des emails.

c) Nombre d’emails bien classifiés par rapport à tous les emails


filtrés.
d) Ce n’est pas un problème d’apprentissage automatique

9
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé
● Variable Y à expliquer, décrite par m individus dont on
connaît n variables explicatives synthétisées dans X
● Ensemble d’apprentissage DTrain = {(X1, Y1) , . . . ,(Xm, Ym)}
● Connaissant DTrain, on cherche f fonction des n prédicteurs
telle que la variable Y s’explique au mieux en fonction des n
prédicteurs: Y = f(X) + ε
● Apprentissage est supervisé puisque conditionné par la
donnée d’étiquettes (labels, valeurs) pour chacun des m
individus: les Yi
● Méthodes: modèle de régression, arbres de classification,
réseaux de neurones, séparateurs à vaste marge, kNN, etc
10
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: classification

11
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: classification

12
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: classification

new

13
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: régression

14
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: régression

15
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage supervisé: régression

new

16
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Quiz
● Problème 1: Votre entreprise possède un nombre important des produits
identiques. Vous voulez prédire combien produits seront vendus dans 3
mois.
● Problème 2: Vous voulez développer un logiciel qui peut examiner chaque
compte de clients et décide s’il est anormal.

a) Tous les deux sont régressions.


b) Problème 1: régression et problème 2: classification.
c) Problème 1: classification et problème 1: régression.
d) Tous les deux sont classifications.

17
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage non-supervisé
● Pas de variable Y à expliquer, mais toujours m individus
décrits par n variables chacun
● a pour objectif de trouver une taxonomie (groupements,
caractéristiques communes) dans les données
● Méthodes: clustering hiérarchique, k-moyennes, etc

18
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage non-supervisé: clustering

19
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Apprentissage non-supervisé: clustering

20
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Quiz
● Dans les exemples ci-dessous, quels problèmes vous voulez utiliser un
algorithme non-supervisé.

a) Etant donné un ensemble des emails étiqueté spam et non-spam,


apprendre un filtre de spam.
b) Etant donné un ensemble des articles nouvelles trouvés dans le web,
groupez-les en thème qui parle à une même chose.
c) Etant donné une base de données de clients, découvrez segments de
marché et groupez clients en segments de marché.
d) Etant donné en ensemble des données de patients qui sont diagnostiqués
diabètes ou non, apprendre à classifier des nouveaux patients comme
diabètes ou non.

21
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Taille de données
● m, n: sont raisonnables; des hypothèses relatives au modèle
linéarité et aux distributions sont vérifiées; l’échantillon est
supposé suivre des lois (gaussienne, binomiale, poisson. . .); les
techniques statistiques sont optimales
● il semble difficile de faire beaucoup mieux dans le cas
d’échantillons de taille restreinte;
● les hypothèses distributionnelles ne sont pas vérifiées;
● les relations supposées entre les variables ne sont pas linéaires;
● le volume des données (big data) est important

22
■ Motivation
■ Définitions et problématique
Applications
Problématique

■ Choix de méthode
● de très nombreux méthodes d’apprentissage proposées
● il n’y a pas de “meilleure méthode”
● chacune est plus ou moins bien adaptée au problème posé, à
la nature des données ou encore aux propriétés de la fonction
f à approcher ou estimer
● il est alors important de savoir comparer des méthodes afin de
choisir la plus pertinente
● cette comparaison repose sur une estimation d’erreur (de
régression ou de classification)

23
Plan

■ Motivation
■ Définitions et problématique

■ Applications

24
■ Motivation
■ Définitions et problématique
Applications
Applications

■ Bio-informatique
■ Classification de la séquence d’ADN
■ Aide au diagnostic
■ Vision par ordinateur
■ Reconnaissance de l'écriture manuscrite
■ Reconnaissance de la parole
■ Détection de fraudes
■ Analyse des marchés financiers

25
■ Motivation
■ Définitions et problématique
Applications
Applications

■ Recherche d’information
■ Analyse et indexation d'images et de vidéo
■ Recherche d'image par le contenu
■ Jeux (système autodidacte)
■ Traitement automatique des langues
■ Système de recommandation
■ Analyse automatique d'opinion
■ Robotique

26
■ Motivation
■ Définitions et problématique
Applications
Applications

27
■ Motivation
■ Définitions et problématique
Applications
Applications

28
■ Motivation
■ Définitions et problématique
Applications
Applications

29
■ Motivation
■ Définitions et problématique
Applications
Applications

30
■ Motivation
■ Définitions et problématique
Applications
Applications

Catégorie: [Link].

31
■ Motivation
■ Définitions et problématique
Applications
Applications

32
■ Motivation
■ Définitions et problématique
Applications
Applications

33
■ Motivation
■ Définitions et problématique
Applications
Applications

34
■ Motivation
■ Définitions et problématique
Applications
Applications

Cancer?

35
■ Motivation
■ Définitions et problématique
Applications
Applications

36
■ Motivation
■ Définitions et problématique
Applications
Applications

37

Vous aimerez peut-être aussi