0% ont trouvé ce document utile (0 vote)

37 vues38 pages

CH 5

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

37 vues38 pages

CH 5

Transféré par

marwaneouzaina

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction générale

Principes de base
Clustering : Algorithmes et applications
Réduction de Dimensionnalité
Détection des Anomalies
Conclusion

Machine learning

Pr. OMARI Kamal

FACULTE POLYDISCIPLINAIRE D’OUARZAZATE

10 février 2025

Pr. OMARI Kamal Machine learning

Introduction générale
Principes de base
Clustering : Algorithmes et applications
Réduction de Dimensionnalité
Détection des Anomalies
Conclusion

Chapitre 5 : L’Apprentissage Non Supervisé

1 Introduction générale

2 Principes de base

3 Clustering : Algorithmes et applications

4 Réduction de Dimensionnalité

5 Détection des Anomalies

6 Conclusion

Pr. OMARI Kamal Machine learning

Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Définition de l’apprentissage non supervisé

L’apprentissage non supervisé est une branche de l’apprentissage

automatique qui se distingue par son approche : contrairement à
l’apprentissage supervisé où les données sont étiquetées (c’est-à-
dire que chaque donnée possède une étiquette ou une valeur cible),
dans l’apprentissage non supervisé, les données sont utilisées sans
étiquettes. L’objectif principal est de découvrir des structures,
des patterns ou des relations cachées dans les données sans avoir
d’informations explicites sur celles-ci. Ce chapitre développe les
principes de base de l’apprentissage non supervisé et explore ses
applications principales.

Pr. OMARI Kamal Machine learning

Caractéristiques principales

Absence de labels : Les algorithmes travaillent

uniquement avec des entrées, sans sortie attendue.
Exploration de données : L’objectif principal est
d’identifier des regroupements, des associations ou des
anomalies.
Adaptabilité : Peut être utilisé dans des contextes variés
où l’étiquetage manuel des données est coûteux ou
impraticable.
Exemple : Analyser les habitudes de navigation sur un site
web pour regrouper les utilisateurs en fonction de leurs
comportements sans savoir au préalable à quelle catégorie
chaque utilisateur appartient.
Pr. OMARI Kamal Machine learning
Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Différences entre apprentissage supervisé et non supervisé

Critère Apprentissage supervisé Apprentissage non supervisé

Labels Nécessite des données étiquetées (entrée + sortie). Ne nécessite pas de labels; travaille uniquement avec les données brutes.
Objectif Prédire ou classifier en fonction des labels. Découvrir des structures ou des anomalies dans les données.
Algorithmes courants Régression, classification (ex. : Random Forest, SVM). Clustering, réduction de dimensionnalité, détection d’anomalies.
Exemple d’application Diagnostiquer une maladie à partir de symptômes. Identifier des regroupements de patients sans classification préalable.

Pr. OMARI Kamal Machine learning

Importance et rôle dans l’intelligence artificielle

L’apprentissage non supervisé joue un rôle clé dans l’intelligence
artificielle, notamment dans :
La découverte de connaissances : Permet de révéler des
structures ou des modèles cachés dans les données.
La réduction du travail humain : Supprime le besoin de
labels manuels, souvent coûteux à obtenir.
L’exploration initiale des données : Sert à comprendre
les données avant de passer à d’autres tâches, comme
l’apprentissage supervisé.
Les systèmes adaptatifs : Facilite l’ajustement des
modèles en fonction de nouvelles données non étiquetées,
comme dans les systèmes de recommandation ou les
moteurs de recherche.
Pr. OMARI Kamal Machine learning
Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Applications courantes
L’apprentissage non supervisé est utilisé dans divers domaines, grâce à sa
capacité à gérer des volumes importants de données non étiquetées. Voici
trois applications majeures :
Segmentation de clients
Objectif : Identifier des groupes homogènes de clients basés sur leurs
comportements ou caractéristiques.
Exemples d’utilisation :
Regrouper les clients en fonction de leur historique d’achats
pour un ciblage marketing.
Identifier les clients les plus susceptibles de quitter un
service.
Algorithmes utilisés : K-Means, Clustering hiérarchique, DBSCAN.
Cas pratique : Une banque utilise K-Means pour regrouper ses
clients selon leur comportement financier (épargnants, investisseurs,
débiteurs, etc.).
Pr. OMARI Kamal Machine learning
Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Applications courantes
Réduction de dimensionnalité pour la visualisation
Objectif : Simplifier des ensembles de données complexes en
préservant les informations essentielles pour une meilleure
visualisation et interprétation.
Exemples d’utilisation :
Visualisation des résultats d’un modèle d’apprentissage
profond dans un espace à deux dimensions.
Détection de variables redondantes dans de grands
ensembles de données.
Algorithmes utilisés : PCA (Principal Component Analysis),
t-SNE, UMAP.
Cas pratique : Dans une recherche génomique, PCA est utilisé pour
réduire les milliers de dimensions des données génétiques à deux
dimensions pour identifier des regroupements de gènes similaires.
Pr. OMARI Kamal Machine learning
Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Applications courantes
Détection de fraudes et d’anomalies
Objectif : Identifier des comportements ou événements
inhabituels qui diffèrent significativement des données
normales.
Exemples d’utilisation :
Détection de transactions suspectes dans un système
bancaire.
Identification d’accès non autorisés dans un réseau
informatique.
Algorithmes utilisés : Isolation Forest, Local Outlier
Factor (LOF), DBSCAN.
Cas pratique : Une entreprise de cybersécurité utilise
LOF pour détecter des anomalies dans les journaux de
connexion et prévenir les cyberattaques.
Pr. OMARI Kamal Machine learning
Introduction générale Définition de l’apprentissage non supervisé
Principes de base Différences entre apprentissage supervisé et non superv
Clustering : Algorithmes et applications Importance et rôle dans l’intelligence artificielle
Réduction de Dimensionnalité Applications courantes
Détection des Anomalies Importance de l’absence de labels
Conclusion

Importance de l’absence de labels

L’absence de labels est une caractéristique fondamentale de

l’apprentissage non supervisé. Contrairement à l’apprentissage
supervisé, qui utilise des données étiquetées, l’apprentissage non
supervisé analyse les données brutes sans indication explicite
des résultats attendus. Le modèle doit ainsi identifier de manière
autonome des structures, des tendances ou des similarités.
Toutefois, cette absence de labels pose des défis, notamment
pour évaluer la performance du modèle, faute de référence claire
pour mesurer la qualité des résultats.

Pr. OMARI Kamal Machine learning

Résumé

Cette introduction met en lumière la flexibilité de l’apprentissage

non supervisé, particulièrement dans les contextes où les données
ne peuvent pas être facilement étiquetées. Grâce à des approches
comme le clustering, la réduction de dimensionnalité et la détec-
tion d’anomalies, il constitue un outil puissant pour exploiter les
données de manière autonome et découvrir des informations pré-
cieuses.

Pr. OMARI Kamal Machine learning

Introduction générale
Principes de base Découverte de structures cachées dans les données
Clustering : Algorithmes et applications Groupement (Clustering)
Réduction de Dimensionnalité Réduction de dimensionnalité
Détection des Anomalies Détection d’anomalies
Conclusion

Découverte de structures cachées dans les données

L’objectif fondamental de l’apprentissage non supervisé est

d’identifier des structures ou des relations cachées dans un jeu
de données. Puisque les données ne sont pas étiquetées, il s’agit
de trouver des schémas significatifs sans supervision externe.
Voici les principaux processus impliqués dans cette découverte.

Pr. OMARI Kamal Machine learning

Groupement (Clustering)

Le groupement (clustering) est une approche d’apprentissage

non supervisé qui consiste à regrouper des points de données
similaires en clusters. L’objectif est de diviser un ensemble de
données en sous-ensembles où les éléments d’un même groupe
sont similaires entre eux, mais différents de ceux des autres
groupes.

Pr. OMARI Kamal Machine learning

Réduction de dimensionnalité

La réduction de dimensionnalité consiste à transformer un

ensemble de données avec de nombreuses variables en un espace
de dimensions inférieures, tout en préservant les relations et
structures essentielles. Cela facilite la visualisation,
l’interprétation et l’analyse des données, surtout lorsqu’elles
comportent des centaines ou des milliers de caractéristiques.

Pr. OMARI Kamal Machine learning

Détection d’anomalies

La détection d’anomalies, une composante clé de l’apprentissage

non supervisé, vise à identifier les données qui diffèrent
significativement du comportement ou de la distribution
générale. Par exemple, dans un ensemble de transactions
bancaires, une anomalie pourrait signaler une fraude. Cette
identification est essentielle pour des applications telles que la
surveillance des systèmes, la cybersécurité et la détection de
fraudes.

Pr. OMARI Kamal Machine learning

Conclusion

L’apprentissage non supervisé permet de découvrir des patterns

et des structures cachées dans les données sans avoir besoin de
labels, ce qui en fait un outil puissant pour l’exploration de
données complexes. Le clustering, la réduction de
dimensionnalité et la détection d’anomalies sont des applications
clés qui ont des implications dans divers domaines, de la
segmentation de marché à la cybersécurité. L’absence de
supervision directe des données ouvre de nombreuses
opportunités d’analyse, mais aussi des défis quant à l’évaluation
de la performance des modèles et à l’interprétation des résultats.