0% ont trouvé ce document utile (0 vote)
36 vues20 pages

Sécurité Informatique Ucc

Ce séminaire sur le Machine Learning aborde les concepts fondamentaux tels que la classification automatique et les différentes méthodes d'apprentissage automatique, y compris supervisé, non supervisé, semi-supervisé et par renforcement. Il présente également des algorithmes populaires et explore des techniques de classification hiérarchique et non hiérarchique. L'objectif est de fournir une compréhension des méthodes d'apprentissage qui permettent de créer des modèles d'intelligence artificielle performants.

Transféré par

Nzanzu Franck
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
36 vues20 pages

Sécurité Informatique Ucc

Ce séminaire sur le Machine Learning aborde les concepts fondamentaux tels que la classification automatique et les différentes méthodes d'apprentissage automatique, y compris supervisé, non supervisé, semi-supervisé et par renforcement. Il présente également des algorithmes populaires et explore des techniques de classification hiérarchique et non hiérarchique. L'objectif est de fournir une compréhension des méthodes d'apprentissage qui permettent de créer des modèles d'intelligence artificielle performants.

Transféré par

Nzanzu Franck
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

SÉMINAIRE DE

MACHINE LEARNING

KANYINDA NZUZI Isaac


Ingénieur Informaticien | Passionné & Chercheur en datascience |
Datascientist à la Regideso SA
Tél. +243819005160
Email. biiskan@[Link] | [Link]@[Link]
PLAN
I. INTRODUCTION
II. CLASSIFICATION AUTOMATIQUE
III. APPRENTISSAGE AUTOMATIQUE
IV. INTRODUCTION AU RÉSEAU DES NEURONES
V. CONCLUSION
CHAPITRE I:INTRODUCTION
Le Machine Learning, c'est l'art de donner vie aux données pour créer des modèles d'intelligence artificielle
capables d'apprendre de manière autonome.
Après avoir transformé vos données, vous sélectionnez un modèle parmi une gamme variée à votre disposition.
Vous appliquez ensuite un processus rigoureux d'optimisation qui aboutit à la création d'un modèle prédictif de
haute performance. C’est cette démarche que nous allons explorer ensemble dans ce cours d'initiation au Machine
Learning.
Dans le cadre de ce séminaire, vous allez découvrir un ensemble de techniques simples mais puissantes qui vont
vous permettre de sculpter les briques de base de l'IA.
Je vous propose d'aborder cela avec moi, étape par étape, en restant au plus proche des problématiques actuelles
qui sont au cœur des promesses de l'intelligence artificielle.
CHAPITRE I:INTRODUCTION
L'apprentissage automatique est une branche de l’intelligence artificielle (IA) et de l'informatique qui utilise
principalement des données et des algorithmes pour imiter la manière dont les êtres humains apprennent, en
améliorant progressivement sa précision.
L’une des branches de l’apprentissage automatique est la classification ou segmentation, elle permet
d'attribuer des individus à des groupes déjà définis. Et c’est de cette branche que nous parlons dans ce
travail.

Exemple: youtube utilise le machine learning pour recommander les vidéos selon votre habitude…
CHAPITRE II: CLASSIFICATION AUTOMATIQUE
II.1. METHODE D’APPRENTISSAGE AUTOMATIQUE
Les systèmes d’apprentissage automatique peuvent être classés en
fonction de l’importance et de la nature de la supervision qu’ils requièrent
durant la phase d’entraînement. Il existe 4 catégories majeures :
 apprentissage automatique supervisé ;
 apprentissage automatique non supervisé ;
 apprentissage automatique par renforcement;
 apprentissage automatique par transfert.
II.1.1. APPRENTISSAGE AUTOMATIQUE SUPERVISE

L’apprentissage automatique supervisé appelé également apprentissage supervisé


consiste à fournir à l’algorithme des données d’entraînement comportant les
solutions désirées, appelées étiquettes (en anglais labels).
L’apprentissage supervisé consiste en des variables d’entrée (x) et une variable de
sortie (Y). Vous utilisez un algorithme pour apprendre la fonction de mapping de
l’entrée à la sortie.
Y = f (X)
Le but est d’appréhender si bien la fonction de mapping enfin que lorsque vous
avez des nouvelles données d’entrée (x), vous puissiez être à mesure de prédire
les variables de sortie (Y) pour ces données.
L’apprentissage supervisé est généralement effectué dans le contexte de la
classification et de la régression.
II.1.1. APPRENTISSAGE AUTOMATIQUE SUPERVISE
Quelques exemples populaires d’algorithmes d’apprentissage automatique supervisé:
 K plus proches voisins;
 Régression linéaire ;
 Régression logistique ;
 SVM ;
 Arbres de décision ;
 Forêt aléatoires ;
 AdaBoost ;
 XGBoost;
 LightBoost;
 CatBoost
II.1.2. APPRENTISSAGE AUTOMATIQUE
NON SUPERVISE
L’apprentissage non supervisé, également appelé apprentissage automatique non
supervisé, utilise des algorithmes d'apprentissage automatique pour analyser et
regrouper des ensembles de données non étiquetées. Le système essaie d’apprendre
sans professeur.
Le système d’apprentissage non supervisé regroupe les algorithmes qui ont la capacité à
découvrir des similitudes et des différences dans les informations sans la supervision. Il
est également utilisé pour réduire le nombre de caractéristiques d'un modèle par le biais
du processus de réduction de la dimensionnalité. L'analyse en composantes principales
(ACP) et la décomposition en valeurs singulières (SVD) sont deux approches courantes
à cet égard. Les réseaux de neurones, le regroupement avec les k-moyennes, le
partitionnement hiérarchique, les méthodes de classification probabiliste, le SVM à une
classe, Forêt d’isolation, ACP etc. figurent parmi les algorithmes utilisés dans
l'apprentissage non supervisé.
II.1.3. APPRENTISSAGE SEMI-SUPERVISE
Etant donné que l’étiquette des données prend généralement beaucoup
de temps et d’argent, vous aurez souvent beaucoup d’observations non
étiquetées et peu d’observations étiquetées. Certains algorithmes
peuvent s’accommoder de données partiellement étiquetées. C’est ce
qu’on appelle l’apprentissage semi-supervisé.
La plupart des algorithmes d’apprentissage semi-supervisé sont des
combinaisons d’algorithmes non supervisés et supervisés.
II.1.4. APPRENTISSAGE PAR RENFORCEMENT

L’apprentissage par renforcement est quelque chose de très différent : le


système d’apprentissage appelé agent dans ce contexte, peut observer
l’environnement, sélectionner et accomplir des actions, et obtenir en retour
des récompenses ou pénalités. Il apprend par lui-même quelle est la
meilleure stratégie, ou politique, pour obtenir au final autant de
récompenses que possible.
III. CLASSIFICATION AUTOMATIQUE
La classification automatique ou segmentation est l’une des tâches
d’apprentissage non supervisé les plus courantes.
La classification automatique regroupe l'ensemble des méthodes statistiques
visant à détecter des groupes, généralement appelés classes, dans un
échantillon d'objets. L'essence de cette classification est que contrairement à
l'analyse discrimante (classification supervisée), il n'est pas nécessaire de
connaître à priori la structure d'un groupe.
III. CLASSIFICATION AUTOMATIQUE
Classification automatique
Méthode Hiérarchiques Méthode de partitionnement

Ascendante Descendante K-means Nuées dynamique Melange Fuzzyclustering Possibiliste


Gaussien

Sachant que généralement, la classification consiste à partitionner une population


hétérogène en de sous-groupe homogène de manière à minimiser l’inertie intra-
classe et maximiser l’inertie inter-classe, la métrique utilisée est la distance
euclidienne. Néanmoins, il en existe d’autres.
Partitionner X ensemble des données en K classes homogènes
En général, on peut parler de classification automatique si aucune information
n'est disponible concernant l'appartenance de certaines données à certaines
classes connues. Par ailleurs, le nombre de groupes recherchés peut être
connu a priori ou non.
Nous distinguons : la classification hiérarchique et non hiérarchique.
III.1. CLASSIFICATION HIERARCHIQUE
La classification hiérarchique (ou hierarchical clustering en anglais)
constitue depuis longtemps une forme de classification très populaire.
C'est l'une des approches les plus importantes pour l'exploration des
données multivariées. L'objectif est d'identifier des groupes d'objets
similaires dans un ensemble d'objets. Elle a l'avantage d'être
interprétable visuellement à l'aide des graphes ou arbres hiérarchiques.
On distingue deux types de classification hiérarchique :
III.1. CLASSIFICATION HIERARCHIQUE
 La classification ascendante hiérarchique CAH (agglomérative) : à
partir des éléments de départ, on forme de petites classes ne
comportant que les objets les plus semblables, puis à partir de celles-
ci, on construit des classes de moins en moins homogènes
jusqu'à obtenir la classe tout entière qui réunit tous les éléments.
 La classification descente hiérarchique CDH (divisive) : il s'agit d'une
dichotomie de la classe entière jusqu'à obtenir tous les éléments
terminaux. Elle favorise une évaluation décroissante opposée au
premier type.
III.2. CLASSIFICATION NON HIERARCHIQUE
La méthode non hiérarchique, connue aussi sous le nom de la méthode
de partitionnement font partie des méthodes exploratoires, génère une
classification en partitionnant des données, ce qui donne généralement
un ensemble des groupes ne sont pas chevauchant, sans relation
hiérarchique entre eux. Son avantages sont principalement est sa
simplicité et sa rapidité d'exécution même sur un grand nombre
d'observations. Nous pouvons lui reprocher une classification finale un
peu trop approximative et le besoin de spécifier à priori un nombre de
classes à obtenir en fin de procédure.
III.2. CLASSIFICATION NON HIERARCHIQUE
Critères d’homogénéité
Le critère mesurant l'homogénéité des classes c'est à dire la qualité de la
partition est souvent l'inertie intra classe de la partition et l'algorithme
itératif utilisé pour minimiser localement.
Les types les plus connus de la classification non hiérarchique sont :
 K-means,
 nuées dynamiques,
 centres mobiles…
IV. LOGIQUE FLOUE ET L’ALGORITHME Fuzzy C-MEANS

IV.1. INTRODUCTION
La logique de classification classique se limite à tracer les frontières
d’appartenance aux classes par calcul de distance entre le point et le
barycentre. Avec l’algorithme populaire qui est le K-means les points sont
affectés nécessairement à l’une des classes en leur accordant le même
degré d’appartenance. Or cela est éminemment discutable pour certains
individus où le rattachement à une classe plutôt qu’une autre tient à très
peu de choses dans le calcul des distances aux barycentres.
Ainsi la solution est d’introduire un indicateur de degré d’appartenance
aux classes.
IV. LOGIQUE FLOUE ET L’ALGORITHME Fuzzy C-MEANS

Nous allons se rendre bien compte que selon l’éloignement par rapport
au barycentre conditionnel, le degré d’appartenance des individus aux
classes peut différer.
III.2. CLASSIFICATION NON HIERARCHIQUE
La méthode non hiérarchique, connue aussi sous le nom de la méthode
de partitionnement font partie des méthodes exploratoires, génère une
classification en partitionnant des données, ce qui donne généralement
un ensemble des groupes ne sont pas chevauchant, sans relation
hiérarchique entre eux. Son avantages sont principalement est sa
simplicité et sa rapidité d'exécution même sur un grand nombre
d'observations. Nous pouvons lui reprocher une classification finale un
peu trop approximative et le besoin de spécifier à priori un nombre de
classes à obtenir en fin de procédure.

Vous aimerez peut-être aussi