0% ont trouvé ce document utile (0 vote)

277 vues3 pages

Mini Projet ML

Ce projet de mini-projet en machine learning vise à développer un modèle prédictif pour estimer les prix des voitures sur le marché marocain. Les étapes incluent la collecte et préparation des données, l'analyse exploratoire, l'étude des tendances du marché, la modélisation, la validation et l'optimisation, ainsi que le déploiement d'une interface utilisateur. Les livrables attendus comprennent un rapport d'analyse, un code Python documenté, un modèle opérationnel et une interface interactive.

Transféré par

yassinealami.affiliate

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

277 vues3 pages

Mini Projet ML

Transféré par

yassinealami.affiliate

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Machine learning - Licence d’excellence /S6

Mini-projet : Développement d’un modèle de prédiction des prix de voitures pour le marché
marocain

(A réaliser par binôme)

1. Introduction :
La prédiction des prix des voitures est un problème courant dans le marché de l'automobile. Un
modèle de Machine Learning bien conçu peut aider les acheteurs et vendeurs à estimer un prix
juste en fonction de divers critères. Ce projet vise à développer un modèle prédictif basé sur des
données réelles du marché marocain.
2. Objectifs
Les objectifs fixés pour ce projet sont les suivants :

- Collecter et préparer un jeu de données représentatif du marché automobile marocain.

- Explorer les données pour identifier les facteurs influençant le prix des véhicules.
- Expérimenter différentes méthodes de modélisation pour prédire le prix.
- Valider et améliorer la précision du modèle.
- Déployer une interface permettant une estimation facile du prix.

3. Déroulement du projet

Pour organiser efficacement ce projet, il est préférable d'avancer étape par étape. Ci-après
l’ensemble des étapes à suivre de la collecte des données à la mise en production du modèle.
Ce cheminement est donné à titre indicatif et peut être enrichi par l’ajout de tâches
supplémentaires en fonction des besoins rencontrés.

- Etape 1 : Collecte et Préparation des Données

La première étape consiste à recueillir et structurer les données nécessaires à la

modélisation. Les étudiants doivent rechercher des sources fiables et mettre en place un
processus de scraping pour extraire les informations pertinentes. Une fois les données
collectées, elles doivent être nettoyées et préparées pour garantir leur qualité et leur
cohérence.

Tâches à réaliser :

• Sources de données : Rechercher et extraire les annonces marocaines. Ci-après

quelques-uns : Avito.ma, Moteur.ma, Wandaloo Maroc.
• Extraction : Utiliser les techniques de web scraping à l'aide des bibliothèques
BeautifulSoup, Requests, Selenium ou Scrapy.
• Nettoyage :
o Supprimer les valeurs aberrantes et incohérentes.
o Gérer les valeurs manquantes (remplissage ou suppression).

1
Machine learning - Licence d’excellence /S6

• Encodage des variables : Transformer les variables catégoriques (ex : marque,

type de carburant, modèle) en valeurs numériques.
• Normalisation : Standardiser les variables continues (ex : kilométrage, puissance,
année).

- Etape 2 : Analyse Exploratoire des Données (EDA)

L'analyse exploratoire permet de mieux comprendre la distribution des données et

d’identifier les facteurs ayant un impact significatif sur les prix. Cette phase est
essentielle pour détecter d’éventuelles erreurs et orienter la sélection des modèles de
prédiction. Cette étape peut bien être réalisée en amont ou en aval de la préparation de
données.

Tâches à réaliser :

• Étudier la distribution des prix et d'autres variables pour comprendre la répartition

des valeurs.
• Identifier les corrélations entre les caractéristiques et le prix.
• Détecter et gérer les valeurs aberrantes.
• Générer des visualisations avec :
o Histogrammes pour observer la distribution des prix.
o Boxplots pour visualiser la répartition des prix par marque ou type de
carburant.
o Heatmaps pour identifier les corrélations entre les variables

- Etape 3 : Étude des Tendances du Marché

Cette étape vise à analyser en profondeur les tendances du marché automobile marocain.
Il s’agit d’identifier les modèles de voitures les plus populaires, les écarts de prix entre
différentes marques et de repérer les véhicules sous-évalués ou surestimés.

Tâches à réaliser :

• Analyser la distribution des prix pour détecter les éventuelles anomalies du marché.
• Identifier les facteurs ayant le plus d’impact sur le prix (âge du véhicule, marque,
carburant, kilométrage, etc.).
• Comparer les tendances des marques et modèles les plus populaires afin d’identifier
des modèles surévalués ou sous-évalués.
• Visualiser les tendances à travers des graphiques comparatifs et des analyses
statistiques.

- Etape 4 : Modélisation & Entraînement

Une fois les données préparées, il est temps de tester différents algorithmes pour prédire
les prix des véhicules. Les étudiants devront expérimenter plusieurs modèles et évaluer
leur performance afin de sélectionner la meilleure approche.

Tâches à réaliser :

2
Machine learning - Licence d’excellence /S6

• Expérimenter plusieurs modèles de Machine Learning.

• Diviser les données en ensembles d'entraînement et de test.
• Entraîner et comparer les modèles selon leur performance sur le jeu de test.

- Etape 5 : Validation et Optimisation

L’étape de validation permet de s’assurer que le modèle généralisera bien sur de

nouvelles données. Il s'agit d'évaluer la qualité des prédictions en utilisant différentes
métriques et d'ajuster les paramètres pour améliorer la performance globale.

Tâches à réaliser :

• Évaluer la performance des modèles en utilisant différentes métriques telles que:

o MAE (Mean Absolute Error) : Moyenne des erreurs absolues.
o RMSE (Root Mean Squared Error) : Écart-type des erreurs de prédiction.
o R² (coefficient de détermination) : Indicateur de qualité d'ajustement.
• Comparer les modèles et sélectionner le plus performant.
• Utiliser la validation croisée pour éviter l’overfitting.

- Etape 6 : Déploiement & Interface Utilisateur

Une fois un modèle performant obtenu, il doit être déployé pour permettre une utilisation
pratique. L'objectif est de concevoir une interface simple et intuitive permettant aux
utilisateurs d’entrer les caractéristiques d’un véhicule et d’obtenir une estimation de prix
en temps réel.

Tâches à réaliser :

• Créer une API avec Flask ou FastAPI permettant d’envoyer des requêtes et de
recevoir des prédictions.
• Concevoir une interface utilisateur avec Streamlit pour une utilisation interactive.
• Permettre aux utilisateurs d’entrer les caractéristiques d’un véhicule et d’obtenir
une estimation de prix en temps réel.

4. Résultats et livrables attendus

Une fois toutes les précédentes tâches effectuées et les résultats de la prédiction obtenus, il
est nécessaire de formaliser votre travail. La pertinence de votre approche, la performance
du modèle ainsi que la clarté et la fonctionnalité du code et de l’interface utilisateur seront
évalués à travers les livrables suivants :

- Un rapport d’analyse détaillant les tendances et les choix méthodologiques.

- Un code Python propre et bien documenté.
- Un modèle de Machine Learning opérationnel.
- Une interface interactive pour tester les prédictions en temps réel.

Vous aimerez peut-être aussi

Structure de Rapport
Pas encore d'évaluation
Structure de Rapport
3 pages
Rapport Projet ML
Pas encore d'évaluation
Rapport Projet ML
6 pages
Script PFM ML
Pas encore d'évaluation
Script PFM ML
3 pages
PFM ML
Pas encore d'évaluation
PFM ML
14 pages
Partie
Pas encore d'évaluation
Partie
4 pages
TP Machine Learning - Prédiction Du Prix Des Voitures: Enseignant: ADIL GHAFIR MASTER AI Année Universitaire 2024-2025
Pas encore d'évaluation
TP Machine Learning - Prédiction Du Prix Des Voitures: Enseignant: ADIL GHAFIR MASTER AI Année Universitaire 2024-2025
3 pages
Rapport Projet Automobile
Pas encore d'évaluation
Rapport Projet Automobile
14 pages
Consignes ProjetBigData Partie Analyse de Donnees 21 1 2023
Pas encore d'évaluation
Consignes ProjetBigData Partie Analyse de Donnees 21 1 2023
2 pages
Chapter 1
Pas encore d'évaluation
Chapter 1
14 pages
Présentation Du Mini-Projet - Prédiction Des Prix Des Ordinateurs Portables
Pas encore d'évaluation
Présentation Du Mini-Projet - Prédiction Des Prix Des Ordinateurs Portables
13 pages
Rapport
Pas encore d'évaluation
Rapport
36 pages
Machine Learning Atelier Unikik
Pas encore d'évaluation
Machine Learning Atelier Unikik
8 pages
New Car
Pas encore d'évaluation
New Car
4 pages
Presentation Cours ML Licence Excellence Introduction Seance 1
Pas encore d'évaluation
Presentation Cours ML Licence Excellence Introduction Seance 1
31 pages
Presentation Cours ML Licence Excellence Introduction Seance 1
Pas encore d'évaluation
Presentation Cours ML Licence Excellence Introduction Seance 1
31 pages
La Prédiction Du Prix Des Voitures D'occasion Au Maroc
Pas encore d'évaluation
La Prédiction Du Prix Des Voitures D'occasion Au Maroc
40 pages
Projets IA : Anomalies, Images, Sentiments, Performance
Pas encore d'évaluation
Projets IA : Anomalies, Images, Sentiments, Performance
2 pages
Intitule Projets Version 2
Pas encore d'évaluation
Intitule Projets Version 2
4 pages
Apprentissage Automatique - Cours
Pas encore d'évaluation
Apprentissage Automatique - Cours
15 pages
Modèle Intelligent de Prédiction Des Prix Des Voitures
Pas encore d'évaluation
Modèle Intelligent de Prédiction Des Prix Des Voitures
26 pages
Projet de Data Mining : RUL et Musique
Pas encore d'évaluation
Projet de Data Mining : RUL et Musique
3 pages
Étapes Pour Le Projet
Pas encore d'évaluation
Étapes Pour Le Projet
4 pages
AndreettaFontana Uqac 0862N 10926
Pas encore d'évaluation
AndreettaFontana Uqac 0862N 10926
75 pages
Rapport Machine Learning
100% (1)
Rapport Machine Learning
61 pages
TP Poly Regres 24 25
Pas encore d'évaluation
TP Poly Regres 24 25
3 pages
Chapitre Machine Learning1
Pas encore d'évaluation
Chapitre Machine Learning1
72 pages
Pfa 1
Pas encore d'évaluation
Pfa 1
22 pages
TP Ia
Pas encore d'évaluation
TP Ia
5 pages
Concepts et Techniques du Machine Learning
Pas encore d'évaluation
Concepts et Techniques du Machine Learning
6 pages
Intro Au Machine Learning
Pas encore d'évaluation
Intro Au Machine Learning
12 pages
Automatisation des Ventes avec BI et ML
Pas encore d'évaluation
Automatisation des Ventes avec BI et ML
94 pages
Cours Complet - de La Statistique Au Deep Learning - PROGRAMME
Pas encore d'évaluation
Cours Complet - de La Statistique Au Deep Learning - PROGRAMME
33 pages
Voix Off Lab02 Detaillee
Pas encore d'évaluation
Voix Off Lab02 Detaillee
3 pages
Mini Projet ML
Pas encore d'évaluation
Mini Projet ML
1 page
Comment Faire Une Prédiction Avec Python
100% (1)
Comment Faire Une Prédiction Avec Python
2 pages
Rapport Des TPs.
Pas encore d'évaluation
Rapport Des TPs.
64 pages
10 Projets Pour Un Portfolio Data Science Réussi
Pas encore d'évaluation
10 Projets Pour Un Portfolio Data Science Réussi
18 pages
Steps To Complete A Machine Learning
Pas encore d'évaluation
Steps To Complete A Machine Learning
11 pages
TP ML
Pas encore d'évaluation
TP ML
3 pages
TD Apprentissage
Pas encore d'évaluation
TD Apprentissage
8 pages
Dossier Competence
Pas encore d'évaluation
Dossier Competence
4 pages
eMBI Generation Des Donnees 26 06 2021
Pas encore d'évaluation
eMBI Generation Des Donnees 26 06 2021
86 pages
00 Intro Machine Learning 15 05 2025 OLYMPIADE 2025
Pas encore d'évaluation
00 Intro Machine Learning 15 05 2025 OLYMPIADE 2025
9 pages
Les Étapes de Création IA
Pas encore d'évaluation
Les Étapes de Création IA
3 pages
I. Comprendre Le Problème Et Les Données
Pas encore d'évaluation
I. Comprendre Le Problème Et Les Données
7 pages
Projets Vision par Ordinateur Étudiants
Pas encore d'évaluation
Projets Vision par Ordinateur Étudiants
4 pages
Rapport of Machine Learning
Pas encore d'évaluation
Rapport of Machine Learning
63 pages
IA Appliquée pour Ingénieurs GE
Pas encore d'évaluation
IA Appliquée pour Ingénieurs GE
42 pages
Feature Engineering.: Importation Des Bibliothèques
Pas encore d'évaluation
Feature Engineering.: Importation Des Bibliothèques
5 pages
Mission
Pas encore d'évaluation
Mission
3 pages
Enp Pfe Template
Pas encore d'évaluation
Enp Pfe Template
34 pages
Différentes Phases de L' Analyse
Pas encore d'évaluation
Différentes Phases de L' Analyse
3 pages
Examen 4SLEAM SP S2 2223
Pas encore d'évaluation
Examen 4SLEAM SP S2 2223
4 pages
Sujet 46
Pas encore d'évaluation
Sujet 46
14 pages
Rapport Fatma MANNAI VF Latex
Pas encore d'évaluation
Rapport Fatma MANNAI VF Latex
60 pages
Cours Regression
Pas encore d'évaluation
Cours Regression
29 pages
INTELLIGENCE Artificielle M
Pas encore d'évaluation
INTELLIGENCE Artificielle M
10 pages
Cours IA ML Modeles
Pas encore d'évaluation
Cours IA ML Modeles
5 pages
Article 6 Etapes Clefs Pour Reussir Votre Modele de Prediction
Pas encore d'évaluation
Article 6 Etapes Clefs Pour Reussir Votre Modele de Prediction
3 pages
Santé, Gym Douce et Nutrition Anticancer
Pas encore d'évaluation
Santé, Gym Douce et Nutrition Anticancer
180 pages
4e Leaon Fractions Gotz851vtq
Pas encore d'évaluation
4e Leaon Fractions Gotz851vtq
4 pages
Amélioration de la disponibilité électrique
Pas encore d'évaluation
Amélioration de la disponibilité électrique
79 pages
Français Langue Seconde: Concepts et Évolutions
Pas encore d'évaluation
Français Langue Seconde: Concepts et Évolutions
238 pages
Projet Travaux de VRD P/S Des 350 Logts Lpl+300 Logts Aadl A El Hamri Commune de Chetouane
Pas encore d'évaluation
Projet Travaux de VRD P/S Des 350 Logts Lpl+300 Logts Aadl A El Hamri Commune de Chetouane
9 pages
Convocation Concours Geipi Polytech 2023
Pas encore d'évaluation
Convocation Concours Geipi Polytech 2023
3 pages
Examen Simili 4 Maths
Pas encore d'évaluation
Examen Simili 4 Maths
3 pages
Diapo Memoire Upl GRH - 101528
Pas encore d'évaluation
Diapo Memoire Upl GRH - 101528
12 pages
Réhabilitation de l'eau à Douhoua
Pas encore d'évaluation
Réhabilitation de l'eau à Douhoua
17 pages
QVT-SST Fiche Prevention Tms
Pas encore d'évaluation
QVT-SST Fiche Prevention Tms
2 pages
Copie de Management Qualité
Pas encore d'évaluation
Copie de Management Qualité
2 pages
Brochure MDC FR
Pas encore d'évaluation
Brochure MDC FR
70 pages
Mesure de la Masse : Grammes et Kilogrammes
Pas encore d'évaluation
Mesure de la Masse : Grammes et Kilogrammes
16 pages
RSView ME : Guide pour Développeurs
Pas encore d'évaluation
RSView ME : Guide pour Développeurs
4 pages
Les Distances
Pas encore d'évaluation
Les Distances
12 pages
La Diffraction À L'infini Ou de Fraunhofer
Pas encore d'évaluation
La Diffraction À L'infini Ou de Fraunhofer
2 pages
Ang Orienté Trigo 1S2
Pas encore d'évaluation
Ang Orienté Trigo 1S2
2 pages
Étude Géotechnique Station d'Épuration
100% (1)
Étude Géotechnique Station d'Épuration
23 pages
CV B Sane FR 2024 B
Pas encore d'évaluation
CV B Sane FR 2024 B
5 pages
Extensions de Merise 2 : Modélisation BD
Pas encore d'évaluation
Extensions de Merise 2 : Modélisation BD
4 pages
Promotion des Femmes au Bénin : Stratégies et Actions
Pas encore d'évaluation
Promotion des Femmes au Bénin : Stratégies et Actions
129 pages
Doc
Pas encore d'évaluation
Doc
4 pages
Analyse Lineaire Theleme
Pas encore d'évaluation
Analyse Lineaire Theleme
2 pages
Stice 1952-8302 2011 Num 18 1 1028
Pas encore d'évaluation
Stice 1952-8302 2011 Num 18 1 1028
31 pages
Rapport-De-Stage AUTOMATISATION DE
100% (2)
Rapport-De-Stage AUTOMATISATION DE
59 pages
NB Fermat Mersenne
Pas encore d'évaluation
NB Fermat Mersenne
5 pages
Pendule Elastique Exercices Non Corriges 3
Pas encore d'évaluation
Pendule Elastique Exercices Non Corriges 3
6 pages
NF en 13101
Pas encore d'évaluation
NF en 13101
41 pages
Cours Diagnostic Territorial
Pas encore d'évaluation
Cours Diagnostic Territorial
12 pages
Définition et Formulation des Suspensions
100% (2)
Définition et Formulation des Suspensions
21 pages