Introduction aunext slide
Machine Learning
Objectifs du cours
Découvrir les concepts fondamentaux de l'IA, du
Machine Learning (ML) et du Deep Learning (DL).
Apprendre les types de machine learning.
Comprendre le déroulement d’un projet ML.
Introduction aux bases de la régression.
next slide
Qu’est-ce que l’IA, le ML et le DL ?
Intelligence Artificielle (IA) :
La capacité d’une machine à simuler l’intelligence humaine pour résoudre des problèmes complexes.
Machine Learning (ML) :
Une sous-branche de l’IA où les machines apprennent à partir de données sans être explicitement programmées.
Deep Learning (DL) :
Une branche avancée du ML basée sur des réseaux neuronaux profonds pour résoudre des problèmes plus
complexes.
next slide
Domaines d’Application de l’IA et du Ml
next slide
Notions de Base en Machine Learning
Données :
Les données sont au cœur du machine learning.
Elles peuvent être structurées (tableaux, bases de données) ou non structurées (images, textes).
Features (Caractéristiques) :
Ce sont les variables d'entrée sur lesquelles le modèle fait ses prédictions.
Exemples : Surface d'une maison, âge d'un patient, couleur d'un fruit.
Labels (Étiquettes) :
Ce sont les résultats ou les cibles que le modèle essaie de prédire.
Exemples : Prix d'une maison (régression), catégorie d'un email (spam ou non) (classification).
next slide
Notions de Base en Machine Learning
Modèle :
Un modèle de machine learning est une fonction qui associe les features aux labels.
Il peut être représenté par des équations (régression) ou des structures plus complexes (réseaux
neuronaux, forêts d'arbres).
Exemples : Régression linéaire, Arbre de décision, K plus proches voisins (KNN).
Entraînement :
L'entraînement consiste à ajuster les paramètres du modèle à partir des données d'entrée
(features) et de sortie (labels).
Exemple : Ajuster les coefficients dans une régression linéaire pour minimiser l'erreur de prédiction.
next slide
Notions de Base en Machine Learning
Test :
Tester le modèle sur de nouvelles données (données non vues durant l'entraînement) pour évaluer
sa performance.
Exemple : Utiliser un ensemble de test pour vérifier si le modèle peut prédire correctement les prix
des maisons.
Évaluation des Performances :
Mesurer la précision du modèle avec des métriques adaptées au problème (précision, rappel, F1-
score, RMSE, etc.).
Exemple : Calculer la précision dans une tâche de classification ou l’erreur quadratique moyenne
(RMSE) dans une tâche de régression.
next slide
Cycle de Vie d’un Projet Machine
Learning
Étape 1 : Définition du Problème
Identifier les objectifs et le type de problème (classification, régression, etc.).
Exemple : Prédire le prix des maisons ou classifier des images.
Étape 2 : Collecte des Données
Rassembler des données pertinentes à partir de différentes sources (fichiers, bases de données, API).
Exemple : Données sur les caractéristiques des maisons (surface, localisation).
Étape 3 : Prétraitement des Données
Nettoyage : Suppression des données manquantes ou des valeurs aberrantes.
Transformation : Normalisation, encodage des catégories.
Exemple : Normaliser la taille des maisons en m².
Étape 4 : Division des Données
Séparer les données en ensembles d’entraînement, de validation, et de test (ex. 70%-15%-15%).
Objectif : Évaluer la performance du modèle sur des données non vues.
next slide
Cycle de Vie d’un Projet Machine
Learning
Étape 5 : Entraînement du Modèle
Choisir un algorithme adapté (régression linéaire, arbres de décision, réseaux neuronaux, etc.).
Ajuster les paramètres pour optimiser la performance.
Étape 6 : Évaluation
Mesurer les performances à l'aide de métriques (précision, RMSE, F1-score, etc.).
Comparer différents modèles pour sélectionner le meilleur.
Étape 7 : Déploiement
Intégrer le modèle dans une application réelle (API, application web, etc.).
Exemple : Utiliser Flask pour servir un modèle prédictif.
Étape 8 : Surveillance et Maintenance
Suivre les performances après le déploiement.
Mettre à jour le modèle avec de nouvelles données si nécessaire.
next slide
Types de Machine Learning
next slide
Types d’Apprentissage Supervisé
next slide
Introduction à la Régression
La régression est une méthode d’apprentissage supervisé utilisée pour prédire une
valeur continue à partir d'un ensemble de caractéristiques (features).
next slide
La regression
La régression est une méthode en Machine Learning
utilisée pour prédire des valeurs continues.
Elle modélise la relation entre une ou plusieurs variables
indépendantes (features) et une variable dépendante
(target).
Exemple :
Prédire le prix d'une maison en fonction de sa surface,
localisation, etc.
Prédire la consommation d'énergie en fonction de la
température extérieure.
Types de la regression
La regression lineaire Simple
La régression linéaire simple ajuste une droite pour minimiser l’erreur entre les valeurs prédites et réelles.
Utilise une seule feature pour prédire la target.
La regression lineaire Simple
Régression Linéaire Multiple
La régression linéaire multiple ajuste un hyperplan pour minimiser l’erreur entre les valeurs prédites
et réelles.
Utilise plusieurs features pour prédire la target
Régression Polynomiale
La régression polynomiale est une extension de la régression linéaire qui permet de modéliser des
relations non linéaires entre les variables indépendantes et dépendantes.
Elle est utile lorsque les données ne suivent pas une relation linéaire simple, mais peuvent être mieux
représentées par une courbe
Régression Arbres de Décision
Les arbres de décision divisent les données en segments en fonction de seuils sur les features
(caractéristiques).
Chaque division (ou nœud) vise à réduire l’erreur dans la prédiction de la variable cible.
Les feuilles (terminaux de l’arbre) contiennent les prédictions finales basées sur la moyenne (ou médiane)
des observations dans cette feuille.
Remarque:
Pas d’équation explicite comme dans les modèles linéaires.
L’arbre repose sur des décisions conditionnelles basées sur les valeurs des features.
Évaluation des Modèles de Régression
L'évaluation des modèles de régression est essentielle pour :
Mesurer la précision des prédictions.
Comparer plusieurs modèles.
Identifier les points faibles pour optimiser les performances.
Les métriques courantes utilisées pour évaluer les modèles incluent MAE, MSE, RMSE, R^2, et Adjusted R^2.