0% ont trouvé ce document utile (0 vote)

87 vues6 pages

Scikit

Scikit learn

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

87 vues6 pages

Scikit

Scikit learn

Transféré par

Amadou Sanoussi Nadia

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

INTRODUCTION

Scikit-learn est une bibliothèque libre python considéré comme un Framework destiné à
l’apprentissage automatique lancé initialement en 2007 par des membres de la communauté
scientifique python.

Scikit-learn est une bibliothèque libre Python destinée à l'apprentissage automatique. Elle est
développée par de nombreux contributeurs notamment dans le monde académique par des
instituts français d'enseignement supérieur et de recherche comme Inria.

Elle propose dans son Framework de nombreuses bibliothèques d’algorithmes à implémenter,

clé en main. Ces bibliothèques sont à disposition notamment des data scientists.

Elle comprend notamment des fonctions pour estimer des forêts aléatoires, des régressions
logistiques, des algorithmes de classification, et les machines à vecteurs de support. Cette
bibliothèque est construite sur NumPy, SciPy et Matplotlib
HISTORIQUE
Scikit-learn a été initialement développé par David Cournapeau dans le cadre d'un projet Google
Summer of Code en 2007. Plus tard cette année-là, Matthieu Brucher a rejoint le projet et a
commencé à l'utiliser dans le cadre de ses travaux de thèse.
Lancé initialement en 2007 par des membres de la communauté scientifique Python, le projet
scikit-learn a connu son véritable essor dans le cadre de travaux de recherche sur l'imagerie
fonctionnelle du cerveau, menés au sein de l'équipe-projet Pariétal d'Inria.

LES FONCTIONNALITES DE SCIKIT LEARN

Scikit-learn propose plusieurs type d’apprentissage notamment :

1. Apprentissage supervisé

Dans ce type d’apprentissage on considère un ensemble de données et chaque occurrence de cet

ensemble correspond à une étiquette précise. En fonction de l’espace 𝑌 des étiquettes, le processus
d’apprentissage correspond à :
 Une classification binaire dans le cas où l’ensemble 𝑌 = {1,0}.
 Une classification multi-classe ici l’ensemble des étiquettes est discret et fini 𝑌 = {1,2, … , 𝐶}.
 Une régression l’ensemble des étiquettes est continu et confondu à 𝑌 = ℝ.

Comme exemple d’apprentissage supervisé on a :

 Détection de spam
 Reconnaissance d’image et d’objet
 Diagnostiques médicaux
 Prévision météorologique

2. Apprentissage non supervisé

Dans ce type d’apprentissage l’ensemble des données dont nous disposons n’est pas étiqueté et
apprend sur le jeu de donnée sans supervision humaine. Nous distinguons deux principaux types
d’apprentissage non supervisés à savoir :
 Clustering est un modèle d’apprentissage qui consiste à regrouper des données en fonction de
leur similitude.
 Association qui permet d’identifier les points qui apparaissent ensemble et définit une relation
entre eux.

Comme exemple nous avons :

 Détection d’anomalie dans la finance.

 Moteur de recommandation et publicité personnalisée
 Clustering de données médicales.

3. Apprentissage par renforcement

L'apprentissage par renforcement (RL) est un domaine du machine learning où un agent
autonome apprend à prendre des décisions dans un environnement interactif afin de maximiser
sa récompense cumulée. L'agent peut explorer l'environnement, recevoir des récompenses pour
ses actions et apprendre à choisir les actions qui lui rapporteront le plus de récompenses à long
terme.
Comme exemple on a :
 Robotique:
Apprentissage à marcher: Un robot apprend à marcher en ajustant ses mouvements en fonction
des récompenses reçues pour se tenir debout et avancer.
 Jeux:
Apprentissage à jouer à des jeux vidéo: Un agent apprend à jouer à des jeux vidéo comme Go,
Dota 2 ou StarCraft en utilisant des algorithmes de deep reinforcement learning.

4. Arbre de décision
Un arbre de décision est un outil puissant qui peut être utilisé à la fois pour les problèmes

de classification et de régression. Il utilise un modèle arborescent pour prendre des

décisions et prédire le résultat. Il est constitué de racines et de nœuds. Les racines

représentent la décision de scission et les nœuds représentent une valeur de variable de

sortie. Un arbre de decision est un concept important.

Les arbres de décision sont utiles lorsque les variables dépendantes ne suivent pas une

relation linéaire avec la variable indépendante, c'est-à-dire que la régression linéaire ne

donne pas de résultats précis.

IMPORTANCE SCI-KIT LEARN

Scikit-Learn, également connu sous le nom de sklearn, est une bibliothèque Python

permettant d'implémenter des modèles d'apprentissage automatique et une modélisation

statistique. Grâce à scikit-learn, nous pouvons implémenter divers modèles d'apprentissage

automatique pour les outils de régression, de classification, de clustering et statistiques

pour analyser ces modèles. Il fournit également des fonctionnalités pour la réducti on de

dimensionnalité, la sélection de fonctionnalités, l'extraction de fonctionnalités, les

techniques d'ensemble et les ensembles de données intégrés. Nous examinerons ces

fonctionnalités une par une.

CARACTERISTIQUES DE SCI-KIT LEARN

1. Ensembles de données

Scikit-learn est livré avec plusieurs ensembles de données intégrés tels que l'ensemble de

données sur l'iris, l'ensemble de données sur les prix de l'immobilier, l'ensemble de

données sur le diabète, etc. Les principales fonctions de ces ensembles de données sont
qu'ils sont faciles à comprendre et que vous pouvez directement y implémenter des

modèles ML. Ces ensembles de données conviennent aux débutants. De même, vous

pouvez importer d'autres ensembles de données disponibles dans sklearn.

2. Fractionnement des données

Sklearn a fourni la fonctionnalité permettant de diviser l'ensemble de données pour la

formation et les tests. Le fractionnement de l'ensemble de données est essentiel pour une

évaluation impartiale des performances de prédiction. Nous pouvons définir la proportion

de nos données à inclure dans les ensembles de données d'entraînement et de test.

3. Régression linéaire

Ce modèle ML supervisé est utilisé lorsque la variable de sortie est continue et qu'elle suit

une relation linéaire avec les variables dépendantes. Il peut être utilisé pour prévoir les

ventes des mois à venir en analysant les données de ventes des mois précédents.

4. Régression logistique

La régression logistique est également un algorithme de régression supervisée, tout comme

la régression linéaire. La seule différence est que la variable de sortie est catégorielle. Il

peut être utilisé pour prédire si un patient souffre ou non d’une maladie cardiaque.

AVANTAGES ET INCOVENIENTS

Scikit-learn, une bibliothèque de machine learning très appréciée pour Python, offre plusieurs
avantages qui en font un outil précieux pour les data scientists et les praticiens du machine
learning. Voici quelques-uns de ses principaux atouts :

 Facilité d'utilisation : Scikit-learn est reconnue pour sa simplicité et son API cohérente.
Cela signifie qu'elle suit une structure claire et uniforme pour différentes tâches, ce qui
la rend facile à apprendre et à utiliser. Vous pouvez appliquer des méthodes et des
principes similaires à différents modèles et types de données, rationalisant ainsi le
workflow.

 Large éventail d'algorithmes : Scikit-learn propose une collection complète

d'algorithmes pour diverses tâches de machine learning. Elle couvre l'apprentissage
supervisé (classification, régression), l'apprentissage non supervisé (clustering), et plus
encore. Cela vous permet d'aborder un large éventail de problèmes sans avoir besoin de
changer de bibliothèque.

 Intégration avec d'autres bibliothèques Python : Scikit-learn s'intègre parfaitement avec

d'autres bibliothèques Python puissantes pour la science des données, telles que NumPy
et Pandas. Cela permet un workflow fluide, car vous pouvez exploiter ces bibliothèques
pour la manipulation de données, les calculs numériques et l'analyse de données avant
de les intégrer dans les modèles Scikit-learn.

 Open-source et gratuit : Scikit-learn est une bibliothèque open-source, disponible

gratuitement pour un usage commercial et non commercial. Cela élimine les coûts de
licence et favorise une large communauté active qui contribue à son développement et
fournit une documentation et un support étendus.

 Évolutivité et efficacité : Bien que Scikit-learn ne soit pas forcément la plus puissante
pour les tâches exceptionnellement complexes, elle offre une bonne évolutivité et une
bonne efficacité pour de nombreuses applications de machine learning. Cela la rend
adaptée à divers cas d'utilisation, du prototypage à la production.

Dans l'ensemble, l'approche conviviale de Scikit-learn, sa vaste sélection d'algorithmes et le

solide soutien de sa communauté en font un excellent choix pour les débutants comme pour les
praticiens expérimentés.

Scikit-learn est certes un excellent outil, mais il ne vient pas sans quelques inconvénients. Voici
quelques aspects à garder à la pointe :

 Manque de modèles à la pointe: Scikit-learn se concentre sur les algorithmes

d'apprentissage automatique classiques et éprouvés. Si vous avez besoin des modèles
les plus récents et les plus sophistiqués, en particulier pour les tâches de deep learning,
d'autres bibliothèques comme TensorFlow ou PyTorch pourraient être plus adaptées.

 Adapté à Python: Scikit-learn est conçu pour fonctionner avec Python. Cela peut être un
avantage pour les utilisateurs de Python, mais si vous travaillez dans un autre langage de
programmation, vous devrez peut-être envisager d'autres bibliothèques.

 Boîte noire pour certains modèles: Certains modèles de Scikit-learn peuvent

fonctionner comme des "boîtes noires", ce qui signifie qu'il peut être difficile
d'interpréter leurs résultats et de comprendre comment ils arrivent à leurs prédictions.
Cela peut être un inconvénient pour les applications où la compréhension du modèle est
cruciale.

 Limites de Scalabilité: Pour des tâches impliquant des ensembles de données massifs,
Scikit-learn peut rencontrer des problèmes d'efficacité et de scalabilité. D'autres
bibliothèques distribuées, comme Apache Spark, peuvent être plus performantes pour
gérer des volumes de données importants.

 Accent sur la prédiction plus que sur l'ingénierie des features: Scikit-learn excelle dans
la construction de modèles, mais la préparation des données et l'ingénierie des features
restent souvent à la charge de l'utilisateur. D'autres bibliothèques peuvent proposer des
outils plus avancés pour ces étapes cruciales du machine learning.

CONCLUSION

Vous aimerez peut-être aussi

Guide Débutant Scikit-learn : Modèles ML
Pas encore d'évaluation
Guide Débutant Scikit-learn : Modèles ML
2 pages
TP 8 ML
Pas encore d'évaluation
TP 8 ML
4 pages
Composants et Annotations de Spring Boot
Pas encore d'évaluation
Composants et Annotations de Spring Boot
44 pages
Présantion Générale Sue SAP
Pas encore d'évaluation
Présantion Générale Sue SAP
12 pages
QCM Sur Les Servlets - Questions Et Réponses - WayToLearnX
Pas encore d'évaluation
QCM Sur Les Servlets - Questions Et Réponses - WayToLearnX
13 pages
Mise en Place de Restrications Applocker Par Gpo
Pas encore d'évaluation
Mise en Place de Restrications Applocker Par Gpo
11 pages
Découverte de La Plateforme PortSwigger Web Security Academy
Pas encore d'évaluation
Découverte de La Plateforme PortSwigger Web Security Academy
13 pages
Initiation à Spring Boot : TP 1
Pas encore d'évaluation
Initiation à Spring Boot : TP 1
8 pages
Créer des services RESTful avec Spring
Pas encore d'évaluation
Créer des services RESTful avec Spring
10 pages
Chapitre2 - API REST
Pas encore d'évaluation
Chapitre2 - API REST
12 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
18 pages
Spring MVC Formulaires Et Fragments Réutilisables Avec Thymeleaf
Pas encore d'évaluation
Spring MVC Formulaires Et Fragments Réutilisables Avec Thymeleaf
31 pages
Fiche Memo Annotations Spring Boot
Pas encore d'évaluation
Fiche Memo Annotations Spring Boot
2 pages
TP Template Blade
Pas encore d'évaluation
TP Template Blade
7 pages
Atelier 1 Fullstack
Pas encore d'évaluation
Atelier 1 Fullstack
12 pages
Atelier 4 Spring Boot
Pas encore d'évaluation
Atelier 4 Spring Boot
15 pages
Tutoriel sur les services Web REST en Java
Pas encore d'évaluation
Tutoriel sur les services Web REST en Java
15 pages
Chap3 API
Pas encore d'évaluation
Chap3 API
24 pages
TP 5 Py Av
Pas encore d'évaluation
TP 5 Py Av
9 pages
Angular 8 et Spring Boot: Exposer un Web Service RESTful
Pas encore d'évaluation
Angular 8 et Spring Boot: Exposer un Web Service RESTful
41 pages
Introduction SAP v2.4
Pas encore d'évaluation
Introduction SAP v2.4
64 pages
Support JEE - Développement Web JEE - Servlet JSP Et Spring MVC
Pas encore d'évaluation
Support JEE - Développement Web JEE - Servlet JSP Et Spring MVC
121 pages
Spring Security
Pas encore d'évaluation
Spring Security
25 pages
Formation ABAP : Guide Complet
Pas encore d'évaluation
Formation ABAP : Guide Complet
22 pages
2 Pandas
Pas encore d'évaluation
2 Pandas
7 pages
Guide D'examen JEE Et QCM Spring Boot: Table Des Matières
Pas encore d'évaluation
Guide D'examen JEE Et QCM Spring Boot: Table Des Matières
15 pages
Architectures Distribuées et Spring Boot
Pas encore d'évaluation
Architectures Distribuées et Spring Boot
14 pages
Sécurité Du Web Et Des Applications
Pas encore d'évaluation
Sécurité Du Web Et Des Applications
4 pages
Introduction aux Web Services REST
Pas encore d'évaluation
Introduction aux Web Services REST
13 pages
Chapitre3 MatplotLib
Pas encore d'évaluation
Chapitre3 MatplotLib
40 pages
Introduction à Angular pour Développeurs
Pas encore d'évaluation
Introduction à Angular pour Développeurs
45 pages
SAP FIORI Supports de Cours PDF 1
Pas encore d'évaluation
SAP FIORI Supports de Cours PDF 1
34 pages
Cours Securite Des App Web Avec Spring Boot Et Spring Security
Pas encore d'évaluation
Cours Securite Des App Web Avec Spring Boot Et Spring Security
50 pages
TS4F01 - 1 Col26 Comptabilité Financière Dans SAP S/4HANA Academy Partie I 1/2
Pas encore d'évaluation
TS4F01 - 1 Col26 Comptabilité Financière Dans SAP S/4HANA Academy Partie I 1/2
20 pages
Sécurité des Applications Web : Failles et Préventions
Pas encore d'évaluation
Sécurité des Applications Web : Failles et Préventions
19 pages
Python Avancé pour Data Science
Pas encore d'évaluation
Python Avancé pour Data Science
14 pages
Chapitre 03 - Data Processing Spring Batch Et Kafka Streams
Pas encore d'évaluation
Chapitre 03 - Data Processing Spring Batch Et Kafka Streams
97 pages
Introduction à Spring MVC
Pas encore d'évaluation
Introduction à Spring MVC
91 pages
Analyse Technique Approfondie Pour La Gestion Des Transports Dans SAP S/4HANA, S4TM6 Col14
Pas encore d'évaluation
Analyse Technique Approfondie Pour La Gestion Des Transports Dans SAP S/4HANA, S4TM6 Col14
20 pages
CoursJEE-PrBelangour Chapitre3
Pas encore d'évaluation
CoursJEE-PrBelangour Chapitre3
22 pages
Spring Boot
Pas encore d'évaluation
Spring Boot
17 pages
Services Web : Concepts et Développement
Pas encore d'évaluation
Services Web : Concepts et Développement
63 pages
1 - TP 1 - Spring Boot + Rest + JAR
Pas encore d'évaluation
1 - TP 1 - Spring Boot + Rest + JAR
24 pages
Comparaison entre Spring MVC et REST
Pas encore d'évaluation
Comparaison entre Spring MVC et REST
38 pages
4 Jpa PDF
Pas encore d'évaluation
4 Jpa PDF
38 pages
SAP S 4 HANA Framework I-ERP Towards Digital Transformation
Pas encore d'évaluation
SAP S 4 HANA Framework I-ERP Towards Digital Transformation
6 pages
Cours Java Complet
Pas encore d'évaluation
Cours Java Complet
6 pages
Spring MVC (PDFDrive)
Pas encore d'évaluation
Spring MVC (PDFDrive)
64 pages
SB FR-chapitre8-spring-data-jpa Part2
Pas encore d'évaluation
SB FR-chapitre8-spring-data-jpa Part2
38 pages
Blog-1-Dune-Architecture-Monoloithique-vers-une-Architecture-Micro-services FR
Pas encore d'évaluation
Blog-1-Dune-Architecture-Monoloithique-vers-une-Architecture-Micro-services FR
10 pages
Atelier Micros Serivces 03 MiseEnPlace Partie01 Creation MS
Pas encore d'évaluation
Atelier Micros Serivces 03 MiseEnPlace Partie01 Creation MS
14 pages
Cours Spring Boot JWT
Pas encore d'évaluation
Cours Spring Boot JWT
55 pages
Tutoriel Spring Boot et JPA
Pas encore d'évaluation
Tutoriel Spring Boot et JPA
17 pages
Ajout d'un utilisateur avec JSF-JPA
Pas encore d'évaluation
Ajout d'un utilisateur avec JSF-JPA
7 pages
9 - Spring Security Architecture - v2
Pas encore d'évaluation
9 - Spring Security Architecture - v2
34 pages
Spring Framework - VF
Pas encore d'évaluation
Spring Framework - VF
26 pages
GRK PHP QCM
Pas encore d'évaluation
GRK PHP QCM
22 pages
TP1 Spring Boot
Pas encore d'évaluation
TP1 Spring Boot
2 pages
Progres2019 5
Pas encore d'évaluation
Progres2019 5
44 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
80 QCM sur Virtualisation, Cloud, Docker, GCP
Pas encore d'évaluation
80 QCM sur Virtualisation, Cloud, Docker, GCP
3 pages
Projet Conseiller D'orientation
Pas encore d'évaluation
Projet Conseiller D'orientation
2 pages
Devoir Ssi
Pas encore d'évaluation
Devoir Ssi
5 pages
Application Dans Les Domaines Signaux
Pas encore d'évaluation
Application Dans Les Domaines Signaux
1 page
Systèmes de Coordonnées : Polaires, Cylindriques et Sphériques
100% (1)
Systèmes de Coordonnées : Polaires, Cylindriques et Sphériques
26 pages
Avantages Et Inconvénients Scikit
Pas encore d'évaluation
Avantages Et Inconvénients Scikit
2 pages
1MRe Géom Vect
Pas encore d'évaluation
1MRe Géom Vect
94 pages
Cours 4 - Introduction À l'UML - Cas D'utilisation
Pas encore d'évaluation
Cours 4 - Introduction À l'UML - Cas D'utilisation
46 pages
Cours - Algorithmes Des Arbres
Pas encore d'évaluation
Cours - Algorithmes Des Arbres
31 pages
L2-Web Hiver 2024
Pas encore d'évaluation
L2-Web Hiver 2024
9 pages
EasyEda Manual 005 PDF
Pas encore d'évaluation
EasyEda Manual 005 PDF
16 pages
Plan Analytique Structure 092385100 2245 21052014
Pas encore d'évaluation
Plan Analytique Structure 092385100 2245 21052014
10 pages
Structure et Processus de Gestion d'Entreprise
Pas encore d'évaluation
Structure et Processus de Gestion d'Entreprise
10 pages
Support de Cours AUTOCAD 2D - Niveau Initiation
Pas encore d'évaluation
Support de Cours AUTOCAD 2D - Niveau Initiation
73 pages
Ievs VF
Pas encore d'évaluation
Ievs VF
29 pages
Config Depannage PC
100% (1)
Config Depannage PC
33 pages
IWG REGUS GROUP 2024-Public
Pas encore d'évaluation
IWG REGUS GROUP 2024-Public
36 pages
Classification Et Évaluation
Pas encore d'évaluation
Classification Et Évaluation
52 pages
Atelier 1 Initiation
Pas encore d'évaluation
Atelier 1 Initiation
7 pages
IA et Génie Logiciel : Défis et Opportunités
Pas encore d'évaluation
IA et Génie Logiciel : Défis et Opportunités
5 pages
6 Cah
Pas encore d'évaluation
6 Cah
13 pages
Mini Projet SIG & Carto 24-25
Pas encore d'évaluation
Mini Projet SIG & Carto 24-25
6 pages
Introduction Générale: Statistique Et Probabilités S2
Pas encore d'évaluation
Introduction Générale: Statistique Et Probabilités S2
10 pages
Chap3 Pipeline
Pas encore d'évaluation
Chap3 Pipeline
31 pages
Le Parisien - 1er Août 2025
Pas encore d'évaluation
Le Parisien - 1er Août 2025
36 pages
Sommaire 1 LA MONETIQUE - PDF
Pas encore d'évaluation
Sommaire 1 LA MONETIQUE - PDF
13 pages
Final
Pas encore d'évaluation
Final
59 pages
Contrôle d'accès RFID avec Arduino
Pas encore d'évaluation
Contrôle d'accès RFID avec Arduino
46 pages
Sujet Compta Bedy N°024
Pas encore d'évaluation
Sujet Compta Bedy N°024
3 pages
TD N1.1 Unix
Pas encore d'évaluation
TD N1.1 Unix
2 pages
Facture - Psc-2022-201385 - M. Et Mme Pezziardi PDF
100% (1)
Facture - Psc-2022-201385 - M. Et Mme Pezziardi PDF
1 page
Cours Chapitre-Ii D'automatisme Industriel Iia3 - 014234
Pas encore d'évaluation
Cours Chapitre-Ii D'automatisme Industriel Iia3 - 014234
34 pages
Installation et programmation Penta
Pas encore d'évaluation
Installation et programmation Penta
33 pages
Optimisation QoS dans les réseaux UMTS
100% (1)
Optimisation QoS dans les réseaux UMTS
13 pages
TP 05 Convolution Mouaadh and Salim
Pas encore d'évaluation
TP 05 Convolution Mouaadh and Salim
10 pages
Exercice MCT - TD MOT MCT - Merise - Exercice MCT Avec Corrigé - Exercice Lycée, Collège Et Primaire
75% (4)
Exercice MCT - TD MOT MCT - Merise - Exercice MCT Avec Corrigé - Exercice Lycée, Collège Et Primaire
1 page
Guide de L'utilisateur Pour Mesure Auto - 453562121031a - FR-FR
Pas encore d'évaluation
Guide de L'utilisateur Pour Mesure Auto - 453562121031a - FR-FR
16 pages