Département Génie Année Universitaire
Informatique 2024-2025
TP3 :
Intelligence Artificielle Responsable :
ML & DL
Régression Linéaire, Multiple et Dr. Fatma SBIAA
– 4 ème année génie Infos– Polynomiale
Objectifs :
✓ Comprendre les bases de la régression linéaire.
✓ Appliquer la régression linéaire simple, multiple.
✓ Évaluer les performances des modèles de régression développés.
Notions de Base:
➢ Description de l'ensemble de données "[Link]" :
Cette dataset est adaptée pour un problème de régression où l'objectif est de prédire le nombre total de
locations de vélos en fonction de diverses caractéristiques, y compris la date/heure, les conditions
météorologiques, la température, l'humidité, la vitesse du vent, etc. Elle est utile pour analyser les
tendances de location de vélos et optimiser la gestion des vélos en fonction des conditions
météorologiques et de la demande.
- Caractéristiques (Variables) :
➢ datetime : Cette colonne représente la date et l'heure de la mesure. Elle peut être utilisée
pour suivre la variation de la location de vélos en fonction du temps.
➢ season : Cette colonne indique la saison au moment de la mesure. Elle peut prendre des
valeurs telles que printemps, été, automne et hiver.
➢ holiday : Cette colonne est binaire (0 ou 1) et indique si le jour de la mesure est un jour
férié (1) ou non (0).
➢ workingday : Cette colonne est binaire (0 ou 1) et indique si le jour de la mesure est un
jour de travail (1) ou un jour de congé (0).
➢ weather : Cette colonne représente les conditions météorologiques au moment de la
mesure. Elle peut prendre différentes valeurs pour décrire le temps (par exemple,
ensoleillé, nuageux, pluvieux, etc.).
➢ temp : Cette colonne contient la température en degrés Celsius au moment de la mesure.
➢ atemp : Cette colonne représente la température ressentie (indice de chaleur ou
refroidissement).
➢ humidity : Cette colonne contient l'humidité relative au moment de la mesure.
➢ windspeed : Cette colonne représente la vitesse du vent au moment de la mesure.
➢ casual : Cette colonne indique le nombre de locations de vélos effectuées par des
utilisateurs occasionnels (non enregistrés) au moment de la mesure.
➢ registered : Cette colonne indique le nombre de locations de vélos effectuées par des
utilisateurs enregistrés au moment de la mesure.
- Variable Cible :count : nombre de locations des vélos (cible pour la prédiction).
Ecole Polytechnique de Sousse -1-
AU : 2024/2025
Application:
1. Chargement des données
1.1. Importez les bibliothèques nécessaires (scikit-learn, NumPy, Matplotlib).
1.2. Chargez l'ensemble de données "[Link]".
2. Exploration des données
2.1. Explorez les données en affichant des informations sur les caractéristiques disponibles
ainsi que les cibles: Visualisez les données en affichant des histogrammes.
2.2. Afficher la matrice de correlation pour identifier les données
2.3. Supprimer les données non pertinantes.
2.4. Séparez les données en ensembles d'entraînement et de test.
3. Régression Linéaire simple
3.1. Appliquez un modèle de régression linéaire simple sur les données d'entraînement tout
en prenant en consideration un seul critère (caractéristique).
3.2. Faites des prédictions sur l'ensemble de test.
3.3. Évaluez le modèle en calculant l'erreur quadratique moyenne (RMSE).
3.4. Tracez un graphique pour comparer les prédictions avec les vraies valeurs.
4. Régression Linéaire multiple
4.1. Pour appliquer la regression linéaire multiple,vous devez répartir à nouveaux vos
données pour pouvoir mettre dans X plus qu’une caractéristique.
4.2. Appliquez un modèle de régression linéaire multiple sur les données d'entraînement.
4.3. Faites des prédictions sur l'ensemble de test.
4.4. Évaluez le modèle en calculant l'erreur quadratique moyenne (RMSE).
4.5. Tracez un graphique pour comparer les prédictions avec les vraies valeurs.
5. Régression Polynomiale
5.1 Appliquez un modèle de régression polynomiale de degré 2 sur les données
d'entraînement.
5.2. Faites des prédictions sur l'ensemble de test avec le modèle polynomial.
5.3. Évaluez le modèle polynomial en calculant le RMSE.
5.4. Tracez un graphique pour comparer les prédictions avec les vraies valeurs.
6. Comparaison des Résultats
6.1. Comparez les performances de la régression linéaire et de la régression polynomiale en
fonction du RMSE.
6.2. Réfléchissez aux avantages et inconvénients de chaque modèle.
Ecole Polytechnique de Sousse -2-
AU : 2024/2025