0% ont trouvé ce document utile (0 vote)
23 vues2 pages

Testmlann

data-set python

Transféré par

omarjester29
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
23 vues2 pages

Testmlann

data-set python

Transféré par

omarjester29
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Test : Prédiction des prix de maisons avec un réseau de neurones ANN

Objectif : Concevoir un pipeline complet de régression avec un modèle ANN en utilisant Keras.

Instructions générales
• Vous travaillerez avec le dataset California Housing Prices téléchargeable ici : California
Housing Prices Dataset.
• Votre travail doit être effectué dans un Notebook Jupyter bien structuré et documenté.

Étapes et Consignes
1. Chargement et exploration des données
• Importez les données depuis le fichier CSV fourni.
• Affichez les premières lignes et la structure des données.
• Analysez la distribution de la cible (median_house_value) et des variables
explicatives.
• Identifiez les éventuelles valeurs manquantes ou anomalies.

2. Prétraitement des données


• Gérez les valeurs manquantes (imputation ou suppression).
• Transformez les variables catégoriques en données numériques (par exemple,
ocean_proximity).
• Normalisez les variables numériques pour qu'elles soient sur des échelles comparables.
• Divisez les données en un jeu d'entraînement (80%) et un jeu de test (20%).

3. Conception du modèle ANN


• Créez un réseau de neurones avec les caractéristiques suivantes :
• Une couche d'entrée correspondant au nombre de variables explicatives.
• Au moins deux couches cachées avec un nombre de neurones à définir (par exemple,
64 puis 32).
• Une fonction d'activation ReLU pour les couches cachées.
• Une couche de sortie avec un seul neurone (prédiction de la valeur) et une activation
linéaire.
• Compilez le modèle avec :
• Fonction de perte : Mean Squared Error (MSE).
• Optimiseur : Adam.
• Métrique : Mean Absolute Error (MAE).

4. Entraînement du modèle
• Entraînez le modèle sur le jeu d'entraînement en utilisant :
• Nombre d'époques : 50.
• Taille des lots (batch size) : 32.
• Fraction des données pour validation : 20%.
• Affichez les courbes d'apprentissage (perte et MAE sur l'entraînement et la validation).

5. Évaluation du modèle
• Évaluez les performances sur le jeu de test avec model.evaluate().
• Affichez les métriques pertinentes, notamment le MAE et le RMSE.
• Comparez les performances entre l'entraînement et le test (éventuel surapprentissage).

6. Sauvegarde et prédictions
• Sauvegardez le modèle entraîné dans un fichier .h5.
• Chargez ce modèle sauvegardé.
• Faites des prédictions sur de nouvelles données générées aléatoirement ou issues du jeu de
test.
• Comparez les prédictions aux valeurs réelles pour valider la qualité du modèle.

Livrables
Les étudiants doivent fournir :
1. Un Notebook Jupyter contenant tout le pipeline, bien documenté avec des commentaires et
des analyses.
2. Le fichier du modèle sauvegardé (model.h5).
3. Un court rapport expliquant les résultats, incluant les métriques et une interprétation des
performances du modèle.

Critères d'évaluation
Critère Points
Chargement et exploration des données 10
Prétraitement des données 20
Conception et paramétrage du modèle 20
Entraînement et traçabilité 20
Évaluation et métriques 15
Sauvegarde et prédictions 10
Clarté et documentation 5
Total 100

Vous aimerez peut-être aussi