TP Machine Learning – Prédiction
du prix des voitures
Enseignant : ADIL GHAFIR
MASTER AI Année universitaire 2024-2025
Objectifs du TP
• Manipuler un jeu de données réel (prix de voitures)
• Mettre en œuvre un pipeline complet de machine learning supervisé
• Utiliser la régression linéaire pour la prédiction
• Évaluer un modèle et le déployer via une interface simple (Gradio)
1. Import des bibliothèques
Consigne et explication
Question Explication
Importez les bibliothèques Les bibliothèques Python offrent des outils puissants pour
nécessaires pour le traite- la manipulation des données, leur visualisation et la créa-
ment de données, la tion de modèles prédictifs.
visualisation et le machine
learning (pandas, numpy,
matplotlib, seaborn,
scikit-learn).
2. Chargement des données
Consigne et explication
Question Explication
Chargez le fichier Cela permet de vérifier la structure et le contenu des don-
Data_Cars.csv dans nées avant d’aller plus loin dans l’analyse.
un DataFrame pandas et
affichez les 5 premières
lignes.
1
3. Prétraitement des données
Consigne et explication
Question Explication
Un prétraitement rigoureux facilite l’analyse et améliore la
qualité des modèles. L’encodage des variables catégorielles
1. Renommez les colonnes
est indispensable pour le machine learning.
pour plus de clarté
2. Vérifiez la présence de
valeurs manquantes
3. Encodez la variable
"Marque" en valeurs
numériques
4. Analyse exploratoire (EDA)
Consigne et explication
Question Explication
L’exploration des données aide à détecter les tendances,
les anomalies, et à choisir les variables les plus pertinentes
1. Affichez les statis-
pour la modélisation.
tiques descriptives du
DataFrame
2. Visualisez la matrice
de corrélation entre les
variables
5. Suppression de colonnes peu corrélées
Consigne et explication
Question Explication
Supprimez la colonne Garder uniquement les variables pertinentes rend le mod-
"Chevaux" si elle n’est pas èle plus performant et plus simple à interpréter.
corrélée au prix.
6. Séparation des données
Consigne et explication
Question Explication
Séparez les variables ex- La séparation X/y permet d’entraîner le modèle sur les
plicatives (X) de la vari- bonnes colonnes et d’évaluer ses performances.
able cible (y).
2
7. Création et entraînement du modèle
Consigne et explication
Question Explication
Créez et entraînez un mod- La régression linéaire est un modèle prédictif simple per-
èle de régression linéaire. mettant d’estimer la valeur d’une variable cible à partir
de variables explicatives.
8. Prédiction
Consigne et explication
Question Explication
Prédisez le prix des Cette étape permet de tester la capacité de générali-
voitures sur l’ensemble de sation du modèle sur des données non vues pendant
test avec votre modèle. l’apprentissage.
9. Évaluation du modèle
Consigne et explication
Question Explication
Évaluez la performance de L’évaluation permet de quantifier l’écart entre les prédic-
votre modèle avec l’erreur tions et la réalité, et d’ajuster le modèle si nécessaire.
quadratique moyenne
(MSE) et le score R2 .
10. Bonus : Interface Gradio
Consigne et explication
Question Explication
Créez une interface simple Gradio permet de transformer rapidement un modèle en
avec Gradio pour permet- une application interactive accessible à tous.
tre de prédire le prix d’une
voiture à partir de ses car-
actéristiques.
Remarques et conseils
• N’hésitez pas à documenter votre code par des commentaires.
• Sauvegardez votre notebook à chaque étape.
• Si vous êtes bloqué·e, posez des questions et travaillez en binôme.
• Pour aller plus loin, vous pouvez tester d’autres modèles ou visualisations !