Sommaire
I- Introduction
II- Collecte des Données
III- Analyse des Données
IV- Prétraitement des Données
V- Modélisation
VI- Évaluation du Modèle
VI- Conclusion
Rapport sur le travail effectué
I- Introduction
Le but de ce projet était de développer un modèle de prédiction des prix des voitures
d'occasion en utilisant une régression linéaire multiple. L'objectif principal était d'explorer
la relation entre différentes variables explicatives telles que l'année de mise en circulation,
le kilométrage, le nombre de chevaux et le prix des voitures d'occasion.
II- Collecte des Données
Les données ont été collectées à partir d'un fichier CSV contenant des informations sur les
voitures d'occasion, notamment l'année de mise en circulation, le kilométrage, le nombre
de chevaux, la marque et le prix.
III- Analyse des Données
Une analyse exploratoire des données a été effectuée pour comprendre la structure et la
distribution des données. Cela comprenait des visualisations telles que des histogrammes
pour explorer la distribution des prix, des diagrammes de dispersion pour examiner les
relations entre les variables explicatives et le prix, ainsi que des résumés statistiques pour
obtenir des informations sur les tendances centrales et la dispersion des données.
IV- Prétraitement des Données
Les données ont été prétraitées pour vérifier la présence de valeurs manquantes et pour
séparer les variables explicatives de la variable cible (le prix). Les données ont également
été divisées en ensembles d'entraînement et de test pour évaluer les performances du
modèle.
V- Modélisation
Un modèle de régression linéaire multiple a été utilisé pour prédire les prix des voitures
d'occasion en fonction des variables explicatives sélectionnées. Le modèle a été entraîné
sur l'ensemble d'entraînement et évalué sur l'ensemble de test.
VI- Évaluation du Modèle
Différentes métriques d'évaluation telles que l'erreur absolue moyenne (MAE), l'erreur
quadratique moyenne (MSE) et la racine carrée de l'erreur quadratique moyenne (RMSE)
ont été utilisées pour évaluer les performances du modèle. Une visualisation des valeurs
réelles par rapport aux valeurs prédites a également été réalisée pour évaluer visuellement
la performance du modèle.
VI- Conclusion
Le modèle de régression linéaire multiple développé a montré des performances
acceptables dans la prédiction des prix des voitures d'occasion. Cependant, il existe encore
des possibilités d'amélioration, notamment en explorant d'autres techniques de
modélisation et en ajoutant d'autres variables explicatives potentielles. Ce projet a permis
d'illustrer l'application pratique de l'apprentissage supervisé dans le domaine de
l'estimation des prix des voitures d'occasion.