0% ont trouvé ce document utile (0 vote)

657 vues37 pages

Concepts de Base en Apprentissage Automatique

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

657 vues37 pages

Concepts de Base en Apprentissage Automatique

Transféré par

Alimi Tahar

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 1

Concepts de base de
l’apprentissage automatique

2018-2019 1
Plan

• Apprentissage
•Apprentissage automatique
•Classification
•Evaluation

2018-2019 2
Apprentissage

2018-2019 3
Apprentissage
•Acquérir de nouvelles connaissances.
•Contracter de nouvelles habitudes.
•Avoir une connaissance extraite à partir d’un ensemble
d’exemples.

C’est la capacité d’améliorer

l’accomplissement d’une tâche en
interagissant avec un environnement.

2018-2019 4
Apprentissage
Automatique

2018-2019 5
Apprentissage automatique=
Machine learning
•Simuler la cognition humaine.
•Doter la machine d’un mécanisme d’apprentissage.
Machine learning = Intersection de l’informatique,
statistiques et domaines particuliers.

Informatique

Domaine
d’application
Statistiques

2018-2019 6
Domaines d’application

Datamining
Exploiter les données historiques pour améliorer les
décisions (Médecine, Banque,…)

Applications non classiques

(Reconnaissance de la parole, Conduite automatique,…)

Programmes auto-adaptatifs
(Lecture des journaux selon le thème,…)

2018-2019 7
Apprentissage supervisé
•On dispose d’un ensemble de paires d'entrée(s)/sortie(s)
de la forme (xi, yi)
•xi : entrée(s) possible(s) Descriptions ou situations
•Yi : sortie(s) associée(s) à xi Actions ou prédictions
•Les paires d'entrée(s)/sortie(s) sont appelées les
exemples qui proviennent d'une fonction inconnue.
•Il s’agit de trouver une bonne approximation d’une
fonction f dont on connaît le résultat que pour un certain
nombre d’exemples.

On demande au système de généraliser

2018-2019 8
Exemples
•Une fonction h aussi proche que possible de f où f(xi) =(yi)
0 0
1 1
4 64 h(x) = x3
5 125
•Une distribution de probabilité P(xi , yi)
•Quelle est la probabilité qu’un client avec tel profil achète tel produit ?
•Dans un jeu de cartes:
•les cartes gagnantes sont: 9♥, Roi ♥ et 7♦.
•les cartes perdantes sont: 3♠, 4♣ et 6♣.

Les cartes rouges sont gagnantes et les cartes numériques noires

sont perdantes
2018-2019 9
Apprentissage supervisé

•Apprentissage supervisé avec variable réponse continue.

Régression, Estimation de densité
•Apprentissage supervisé avec variable réponse discrète.
Classification ou Analyse discriminante
•Apprentissage supervisé avec variable réponse booléenne.
Apprentissage de concept

2018-2019 10
Apprentissage non supervisé
•On ne dispose pas d’un ensemble de paires
d'entrée(s)/sortie(s).
On dispose uniquement d’un ensemble d’entrées.
•Regrouper les entrées en un nombre fixe de groupes
(clusters):
•Les entrées de chaque groupe sont proches les uns des autres.
•On utilise une certaine métrique dans l’espace des entrées.
• Découvrir de nouvelles relations dans les données (ex:
Réseaux Bayésiens).

2018-2019 11
Exemples
•Segmentation du marché
• Quelles sont les catégories principales des clients typiques
dans le domaine vestimentaire?
•Enfants, jeunes, adultes, etc.
•Classique, habillé, sport, etc.
•Domaine médical: Découverte de nouveaux liens
•Il y a un lien entre visiter l’Asie et attraper la tuberculose.

2018-2019 12
Apprentissage semi-supervisé

•L’apprentissage semi-supervisé utilise un ensemble de

données étiquetées et non-étiquetés.

Apprentissage semi-supervisé peut améliorer

les performances en combinant les données
avec labels et sans labels

2018-2019 13
Apprentissage par renforcement
• L’algorithme d’apprentissage doit trouver une stratégie
d’actions pour obtenir éventuellement une récompense (ou
pénalité).
La récompense ou la pénalité arrive (généralement)
suite à un ensemble d’actions

Maximiser le gain (ou inversement) à long terme

(apprentissage de réflexes, apprentissage de planification,…)

2018-2019 14
Exemples
•Jeux d’échecs
•On joue contre un adversaire.
•il y a une stratégie d’actions.
•C’est en fin de partie, qu’on va avoir le résultat de nos
actions:
•Victoire
•Nul
•Défaite
•Contrôle de robots (Aibo)
•Aibo réagit à son environnement,
il peut s’adapter en vue d’obtenir
plus de renforcements positifs.

2018-2019 15
N’oubliez pas

Parmi les tâches de l’apprentissage:

La classification

2018-2019 16
Classification

2018-2019 17
Classification

2018-2019 18
Apprentissage par exemples
•On dispose d’un grand ensemble d’exemples (objets).
•On cherche à trouver une structure relative à ces
exemples pour obtenir un modèle.
•Ce modèle permet de:
oExtraire une procédure de classification à partir
d’exemples.
oClasser un nouvel exemple.
⁞
oPrévoir une valeur numérique.
oComprendre la structure des exemples.
2018-2019 19
Ensemble d’apprentissage

2018-2019 20
Ensemble test

2018-2019 21
Domaines d’application
•Banque: attribution de crédits.
oUtiliser un historique de crédits accordés et non
accordés avec la situation personnelle du client.
•Médecine: aide au diagnostic
oCaractériser les symptômes des anciens patients
et de leurs maladies.
•Marketing: établir un profil client
oFaire une segmentation automatique des clients
pour le marketing direct.

2018-2019 22
Domaines d’application
•Analyse financière: prévision d’évolution des marchés

•Assurance: analyse de risques

•Télécoms: détection de fraudes

•Sécurité: détection d’intrusions

2018-2019 23
Approche paramétrique
•Proposition d’un modèle dont on estime ses paramètres
à partir des exemples (phase d’apprentissage).
•Les hypothèses que l’on fait sur les lois de probabilité
font partie d’une famille de distributions.
oSi on sait que P est une distribution normale, il suffit
d’estimer ses deux paramètres
oSa moyenne
oSon écart type
Avoir une bonne approximation de la distribution P.

Déterminer une procédure de classification.

2018-2019 24
Approche non paramétrique

•Pas d’hypothèses sur le modèle que suivent les données.

•Les problèmes à résoudre sont plus complexes que
ceux traités par les méthodes paramétriques.
oMéthodes statistiques.
oMéthodes issues de l’intelligence artificielle.

2018-2019 25
Classification supervisée

•Les classes sont définies a priori.

•Découverte de règles ou formules pour ranger les
données dans des classes prédéfinies.
oConstruction d'un modèle sur les données dont la
classe est connue (Ensemble d’apprentissage).
oUtilisation pour classification des nouveaux objets.

2018-2019 26
Exemples
•Arbres de décision
•Méthodes K plus proches voisins
•Réseaux de neurones
•Machines à vecteurs supports (SVM)
.
.
.

2018-2019 27
Classification non supervisée
•Les instances d’apprentissage ne sont pas fournies avec
des classes.
L’ensemble d’apprentissage n’est pas étiqueté (on ne
connaît pas les classes a priori).

•Intuitivement les objets de même classe sont “proches”

les uns des autres.
Mesure de similarité ou de distance

Regrouper les exemples similaires:

Segmentation et cluster

2018-2019 28
Exemples
•Centres mobiles
•Réseaux de Kohonen
.
.
.

2018-2019 29
Réduction de multi-classes à
deux classes
•Problème de classification à plusieurs classes.

Plusieurs problèmes de classification binaire

•C’est la méthode un contre tous mais qui n’est pas

forcement la meilleure.

2018-2019 30
Evaluation

2018-2019 31
Evaluation
•Utilisation d’un ensemble test.

•Pourcentage de classification correcte (PCC).

•Taux d’erreur de classification.

•Utilisation de la validation croisée.

2018-2019 32
Pourcentage de Classifcation
Correcte (PCC) (1)

2018-2019 33
Pourcentage de Classifcation
Correcte (PCC) (2)

2018-2019 34
Matrice de confusion

•Bon classifieur: sur les diagonales.

•Identifier les classes mal comprises (apprises).
•Comparer les classifieurs selon la classe.
•Fixer des pénalités.
2018-2019 35
Validation croisée

•Partition de l’ensemble d’apprentissage T en n

ensembles disjoints (T1, T2,…, Tn) de même taille |Ti|.
•Pour chaque i = 1, 2, …, n
1.On fait l’apprentissage sur T – {Ti}
2.On teste sur Ti
3.On calcule le PCC sur Ti
•On fait la moyenne des PCC.

2018-2019 36
A suivre…

•Une technique de classification en apprentissage

supervisé.

Arbres de décision

2018-2019 37

Vous aimerez peut-être aussi

Cours ML Chap1
Pas encore d'évaluation
Cours ML Chap1
54 pages
Chapitre II Machine Learning
Pas encore d'évaluation
Chapitre II Machine Learning
170 pages
CM1 Intro
Pas encore d'évaluation
CM1 Intro
42 pages
Rapport of Machine Learning
Pas encore d'évaluation
Rapport of Machine Learning
63 pages
Cours ML
Pas encore d'évaluation
Cours ML
127 pages
ML PR
Pas encore d'évaluation
ML PR
66 pages
Cours Deep 1
Pas encore d'évaluation
Cours Deep 1
99 pages
Cours IA et Machine Learning
100% (1)
Cours IA et Machine Learning
136 pages
Introduction au Machine Learning
100% (1)
Introduction au Machine Learning
78 pages
Cours - 8 Perceptron SVM
Pas encore d'évaluation
Cours - 8 Perceptron SVM
52 pages
Cours IA
100% (1)
Cours IA
253 pages
Notions Sur Les: Support Vector Machines
Pas encore d'évaluation
Notions Sur Les: Support Vector Machines
23 pages
Cours Datamining: Techniques et Processus
100% (1)
Cours Datamining: Techniques et Processus
49 pages
LED3SI - Module - M354 - Chap1-Chap2
Pas encore d'évaluation
LED3SI - Module - M354 - Chap1-Chap2
39 pages
Chapitre 6. Apprentissage Automatique Et Réseaux de Neurones
Pas encore d'évaluation
Chapitre 6. Apprentissage Automatique Et Réseaux de Neurones
23 pages
03-Apprentissage Automatique
Pas encore d'évaluation
03-Apprentissage Automatique
63 pages
Data Science For Business and Finance
100% (1)
Data Science For Business and Finance
51 pages
Tutoriel Python Deep Learning
Pas encore d'évaluation
Tutoriel Python Deep Learning
36 pages
Introduction Lapprentissage Par Renforcement Ensps
Pas encore d'évaluation
Introduction Lapprentissage Par Renforcement Ensps
24 pages
Clustering et Distances en ML
Pas encore d'évaluation
Clustering et Distances en ML
129 pages
SVM Machine À Vecteurs Du Support
Pas encore d'évaluation
SVM Machine À Vecteurs Du Support
37 pages
Cours Data Mining - MORIE
Pas encore d'évaluation
Cours Data Mining - MORIE
88 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Introduction au Machine Learning
100% (1)
Introduction au Machine Learning
18 pages
Introduction à l'Apprentissage Machine
Pas encore d'évaluation
Introduction à l'Apprentissage Machine
53 pages
Chapitre 3 Apprentissage Supervisé - Classification
Pas encore d'évaluation
Chapitre 3 Apprentissage Supervisé - Classification
85 pages
UP3 2 Fouille de Donnees Handout
Pas encore d'évaluation
UP3 2 Fouille de Donnees Handout
65 pages
Cours Perceptron
100% (1)
Cours Perceptron
58 pages
CM4 KNN
Pas encore d'évaluation
CM4 KNN
38 pages
Comprendre l'algorithme k-ppv
Pas encore d'évaluation
Comprendre l'algorithme k-ppv
26 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
16 pages
Réduction de Dimension et Apprentissage Machine
Pas encore d'évaluation
Réduction de Dimension et Apprentissage Machine
2 pages
Cours Machine Learning
Pas encore d'évaluation
Cours Machine Learning
204 pages
Data Mining Final
100% (1)
Data Mining Final
192 pages
Introduction aux SVM et classification
Pas encore d'évaluation
Introduction aux SVM et classification
18 pages
Chapitre 3 Apprentissage Supervis - Th-Orie Pratique Et Applications
Pas encore d'évaluation
Chapitre 3 Apprentissage Supervis - Th-Orie Pratique Et Applications
67 pages
TP 1 - Initiation À La ML
Pas encore d'évaluation
TP 1 - Initiation À La ML
2 pages
Naïve Bayes Classifier 1
Pas encore d'évaluation
Naïve Bayes Classifier 1
66 pages
Introduction au Machine Learning
100% (1)
Introduction au Machine Learning
106 pages
Classification Bayésienne Simplifiée
Pas encore d'évaluation
Classification Bayésienne Simplifiée
41 pages
Clustering et Similarité des Données
Pas encore d'évaluation
Clustering et Similarité des Données
57 pages
LApprentissage Par Renforcement
100% (1)
LApprentissage Par Renforcement
29 pages
Introduction à l'apprentissage par renforcement
Pas encore d'évaluation
Introduction à l'apprentissage par renforcement
67 pages
Machine Learning Cours Complet
Pas encore d'évaluation
Machine Learning Cours Complet
2 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
Apprentissage Supervisé par Ricco Rakotomalala
Pas encore d'évaluation
Apprentissage Supervisé par Ricco Rakotomalala
13 pages
TP3 - SVM-23-24
Pas encore d'évaluation
TP3 - SVM-23-24
3 pages
Cours1 - Intoduction À L'apprentissage Et Complexité
Pas encore d'évaluation
Cours1 - Intoduction À L'apprentissage Et Complexité
42 pages
Introduction au Machine Learning et IA
Pas encore d'évaluation
Introduction au Machine Learning et IA
63 pages
Cours Data Mining - Seance 1
Pas encore d'évaluation
Cours Data Mining - Seance 1
38 pages
Apprentissage: Régression Logistique
Pas encore d'évaluation
Apprentissage: Régression Logistique
3 pages
Introduction Aux Techniques de Machine Learning
100% (2)
Introduction Aux Techniques de Machine Learning
112 pages
COURS Fondement Machine Learning L3
100% (1)
COURS Fondement Machine Learning L3
16 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
Introduction Apprentissage Automatique
100% (1)
Introduction Apprentissage Automatique
115 pages
Cours 5-6 Perceptron-SVM
100% (1)
Cours 5-6 Perceptron-SVM
76 pages
01 Introduction DM
Pas encore d'évaluation
01 Introduction DM
26 pages
Chapitre 3 - Apprentissage Supervisé - Régression Linaire
Pas encore d'évaluation
Chapitre 3 - Apprentissage Supervisé - Régression Linaire
39 pages
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
50% (2)
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
10 pages
Classification Et Évaluation
Pas encore d'évaluation
Classification Et Évaluation
52 pages
Extrait1 Cours RDP Colores
Pas encore d'évaluation
Extrait1 Cours RDP Colores
5 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
11 pages
Réseau de Petri Colorés - M1 SINT
Pas encore d'évaluation
Réseau de Petri Colorés - M1 SINT
1 page
RDP Colores
Pas encore d'évaluation
RDP Colores
16 pages
RDP Serie 2021
Pas encore d'évaluation
RDP Serie 2021
2 pages
Microsoft Word - TD2 - RDP - Colorés
Pas encore d'évaluation
Microsoft Word - TD2 - RDP - Colorés
2 pages
Chapitre 2 - Arbres - de - Décision - Part1 PDF
Pas encore d'évaluation
Chapitre 2 - Arbres - de - Décision - Part1 PDF
34 pages
INF4163 Entrainement Mi Session AU24
Pas encore d'évaluation
INF4163 Entrainement Mi Session AU24
12 pages
Modèle Bon de Commande
100% (8)
Modèle Bon de Commande
2 pages
Plaquette Master Ids Parcours Tbts
Pas encore d'évaluation
Plaquette Master Ids Parcours Tbts
1 page
Brochure L1-L2 MASS 2010
Pas encore d'évaluation
Brochure L1-L2 MASS 2010
46 pages
Manuel d'utilisation Dyson AM05
Pas encore d'évaluation
Manuel d'utilisation Dyson AM05
12 pages
Référentiel BTS CPI : Industrialisation
Pas encore d'évaluation
Référentiel BTS CPI : Industrialisation
3 pages
Expose Si
Pas encore d'évaluation
Expose Si
27 pages
519112-01-FR Cyclic 2020
50% (2)
519112-01-FR Cyclic 2020
20 pages
Cours Info1 Recherches Sur Google
Pas encore d'évaluation
Cours Info1 Recherches Sur Google
3 pages
G.Mec-Master Energies Renouvelables en Mécanique - MAJ - 2025
Pas encore d'évaluation
G.Mec-Master Energies Renouvelables en Mécanique - MAJ - 2025
81 pages
CV Jason
Pas encore d'évaluation
CV Jason
2 pages
Coupe géotechnique des sondages SP1/SP2
Pas encore d'évaluation
Coupe géotechnique des sondages SP1/SP2
46 pages
Programmation Win32 et DLLs
Pas encore d'évaluation
Programmation Win32 et DLLs
17 pages
Radio Réveil Philips
Pas encore d'évaluation
Radio Réveil Philips
9 pages
Chauffe Eau Carrera CAR80-BEHW
Pas encore d'évaluation
Chauffe Eau Carrera CAR80-BEHW
16 pages
Clio 3 X85 Cup
Pas encore d'évaluation
Clio 3 X85 Cup
98 pages
Tinku Felizmente Cazado Llajtaymanta FT Grupo Venenox Alto Sax
Pas encore d'évaluation
Tinku Felizmente Cazado Llajtaymanta FT Grupo Venenox Alto Sax
1 page
Examplaire Facture Angem Et Nesda
Pas encore d'évaluation
Examplaire Facture Angem Et Nesda
110 pages
Coûts et Évaluation de la Qualité
Pas encore d'évaluation
Coûts et Évaluation de la Qualité
21 pages
Processus Prod Et Maintenance
Pas encore d'évaluation
Processus Prod Et Maintenance
2 pages
CV MBONGO Catherine
Pas encore d'évaluation
CV MBONGO Catherine
2 pages
Profile
Pas encore d'évaluation
Profile
2 pages
Créer une carte de contrôle Excel
100% (1)
Créer une carte de contrôle Excel
9 pages
Nouvelle Astuce Simple Pour Modifier Les DNS Sur Un ONT Nokia - FTTx- Fibre Optique - الألياف الضوئية - ForUMDZ ALGERIE INTERNET NTIC' Adsl, Fibre, 5G, AI Et Le Reste
100% (1)
Nouvelle Astuce Simple Pour Modifier Les DNS Sur Un ONT Nokia - FTTx- Fibre Optique - الألياف الضوئية - ForUMDZ ALGERIE INTERNET NTIC' Adsl, Fibre, 5G, AI Et Le Reste
1 page
Gestion des Incidents et Investigation Numérique
Pas encore d'évaluation
Gestion des Incidents et Investigation Numérique
3 pages
Admission Technicien Spécialisé 2023-2024
Pas encore d'évaluation
Admission Technicien Spécialisé 2023-2024
3 pages
Kbis - 32751 - 11 30 2021 02 32 08
Pas encore d'évaluation
Kbis - 32751 - 11 30 2021 02 32 08
1 page
Mbg-fim-Ann-09 Depose-Pose Bondage Et Element Elastique de Roue Bonatran
Pas encore d'évaluation
Mbg-fim-Ann-09 Depose-Pose Bondage Et Element Elastique de Roue Bonatran
13 pages
Réseaux HT et Distribution en France
Pas encore d'évaluation
Réseaux HT et Distribution en France
12 pages
Optimisation de l'Ordonnancement
Pas encore d'évaluation
Optimisation de l'Ordonnancement
4 pages