0% ont trouvé ce document utile (0 vote)

16 vues4 pages

TP ML Regression Avancee

Ce TP sur la régression avancée vise à prédire le prix des maisons en utilisant le California Housing Dataset. Les étapes incluent le chargement et l'exploration des données, la séparation des ensembles d'entraînement et de test, la construction de modèles de régression, la comparaison de leurs performances, et l'optimisation des hyperparamètres. Enfin, une évaluation finale et une visualisation de l'importance des variables sont réalisées pour interpréter les résultats.

Transféré par

Hanene Ghazouani

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

16 vues4 pages

TP ML Regression Avancee

Transféré par

Hanene Ghazouani

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP Machine Learning – Régression avancée : Prédiction du prix des

maisons
🎯 Objectif : Mettre en œuvre plusieurs modèles de régression, les comparer et optimiser le
meilleur. Ce TP vous fera pratiquer la préparation de données, la comparaison de modèles
et la recherche d’hyperparamètres.

1. Chargement du jeu de données

Le jeu de données utilisé est le California Housing Dataset, disponible directement dans
scikit-learn.

from [Link] import fetch_california_housing

import pandas as pd

data = fetch_california_housing(as_frame=True)
df = [Link]
[Link]()

2. Exploration des données

import seaborn as sns

import [Link] as plt

print([Link]())
print([Link]())

[Link]([Link](), annot=True, cmap="coolwarm")

[Link]()

Questions :

 - Quelles sont les variables les plus corrélées avec la variable cible MedHouseVal ?
 - Y a-t-il des valeurs extrêmes ou aberrantes ?

3. Séparation des données

from sklearn.model_selection import train_test_split

X = [Link]("MedHouseVal", axis=1)
y = df["MedHouseVal"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

4. Construction d’un pipeline ML

from [Link] import StandardScaler

from [Link] import Pipeline
from sklearn.linear_model import LinearRegression
from [Link] import mean_squared_error

pipe_lr = Pipeline([
("scaler", StandardScaler()),
("model", LinearRegression())
])

pipe_lr.fit(X_train, y_train)
y_pred = pipe_lr.predict(X_test)

rmse = mean_squared_error(y_test, y_pred, squared=False)

print(f"RMSE (régression linéaire) : {rmse:.3f}")

5. Comparaison de plusieurs modèles

from [Link] import RandomForestRegressor, GradientBoostingRegressor

from [Link] import SVR

models = {
"Linear Regression": LinearRegression(),
"Random Forest": RandomForestRegressor(random_state=42),
"Gradient Boosting": GradientBoostingRegressor(random_state=42),
"Support Vector Regressor": SVR()
}

results = {}
for name, model in [Link]():
pipe = Pipeline([
("scaler", StandardScaler()),
("model", model)
])
[Link](X_train, y_train)
y_pred = [Link](X_test)
rmse = mean_squared_error(y_test, y_pred, squared=False)
results[name] = rmse

results_df = [Link].from_dict(results, orient="index",

columns=["RMSE"]).sort_values("RMSE")
print(results_df)

Question : Quel modèle obtient le plus faible RMSE ? Pourquoi, selon toi ?

6. Optimisation d’hyperparamètres (Grid Search)

from sklearn.model_selection import GridSearchCV

params = {
"model__n_estimators": [50, 100, 200],
"model__max_depth": [5, 10, None],
"model__min_samples_split": [2, 5, 10]
}

pipe_rf = Pipeline([
("scaler", StandardScaler()),
("model", RandomForestRegressor(random_state=42))
])

grid = GridSearchCV(pipe_rf, params, cv=3, scoring="neg_root_mean_squared_error",

n_jobs=-1)
[Link](X_train, y_train)

print("Meilleurs paramètres :", grid.best_params_)

print("Meilleur score (RMSE négatif) :", grid.best_score_)

7. Évaluation finale

best_model = grid.best_estimator_
y_pred = best_model.predict(X_test)
rmse = mean_squared_error(y_test, y_pred, squared=False)
print(f"RMSE sur test : {rmse:.3f}")

8. Interprétation et visualisation

import numpy as np
importances = best_model.named_steps["model"].feature_importances_
features = [Link]

[Link](x=importances, y=features)
[Link]("Importance des variables (Random Forest)")
[Link]()

🚀 Extensions possibles
 - Tester XGBoost ou LightGBM
 - Ajouter des interactions entre variables
 - Analyser les résidus du modèle
 - Visualiser les performances via un graphique prédictions vs valeurs réelles

Vous aimerez peut-être aussi

Voix Off Lab02 Detaillee
Pas encore d'évaluation
Voix Off Lab02 Detaillee
3 pages
Machine Learning (ML) : Scikit-Learn
Pas encore d'évaluation
Machine Learning (ML) : Scikit-Learn
7 pages
Testmlann
Pas encore d'évaluation
Testmlann
2 pages
TP 5 Machine Learning
Pas encore d'évaluation
TP 5 Machine Learning
10 pages
TP N°2: Régression Linéaire: Institut Supérieur: ML D'informatique Ines Bousrih de Mahdia 2024/ 2025
Pas encore d'évaluation
TP N°2: Régression Linéaire: Institut Supérieur: ML D'informatique Ines Bousrih de Mahdia 2024/ 2025
4 pages
Code
Pas encore d'évaluation
Code
4 pages
Machine Learning Regularisation L4 LMD
Pas encore d'évaluation
Machine Learning Regularisation L4 LMD
18 pages
Module 4
Pas encore d'évaluation
Module 4
49 pages
Mini Projet Modele de Regression
Pas encore d'évaluation
Mini Projet Modele de Regression
3 pages
Big Data Et Analyse Prédictive
Pas encore d'évaluation
Big Data Et Analyse Prédictive
44 pages
Regression Simple
Pas encore d'évaluation
Regression Simple
15 pages
Resume Machine Learning
Pas encore d'évaluation
Resume Machine Learning
2 pages
Analyse de Régression Linéaire
Pas encore d'évaluation
Analyse de Régression Linéaire
14 pages
Cahier Des Charges ML
Pas encore d'évaluation
Cahier Des Charges ML
3 pages
Exercice Prédiction Des Prix de Maisons Avec Une Régression Linéaire Simple
Pas encore d'évaluation
Exercice Prédiction Des Prix de Maisons Avec Une Régression Linéaire Simple
2 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
Examen M1 : Apprentissage automatique en Python
100% (1)
Examen M1 : Apprentissage automatique en Python
3 pages
Debutant Projet DataScience Baseline 1757400296
Pas encore d'évaluation
Debutant Projet DataScience Baseline 1757400296
6 pages
Projet IA 2024
Pas encore d'évaluation
Projet IA 2024
5 pages
TP Poly Regres 24 25
Pas encore d'évaluation
TP Poly Regres 24 25
3 pages
TP 5: Régression Linéaire Avec Knime Oration de Données: Techniques D'expl
Pas encore d'évaluation
TP 5: Régression Linéaire Avec Knime Oration de Données: Techniques D'expl
2 pages
TP Lasso Ridge
Pas encore d'évaluation
TP Lasso Ridge
3 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
Introduction à l'apprentissage automatique avec Scikit-Learn
Pas encore d'évaluation
Introduction à l'apprentissage automatique avec Scikit-Learn
44 pages
Analyse Prédictive avec Python et Pandas
Pas encore d'évaluation
Analyse Prédictive avec Python et Pandas
5 pages
TD Machine Learning
100% (5)
TD Machine Learning
4 pages
Alaa ET Salhi Zoubeir
Pas encore d'évaluation
Alaa ET Salhi Zoubeir
2 pages
Model Pytorch 1
Pas encore d'évaluation
Model Pytorch 1
3 pages
Atelier sur la régression en Python
Pas encore d'évaluation
Atelier sur la régression en Python
13 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
SLH Zou
Pas encore d'évaluation
SLH Zou
2 pages
Classification avec KNN et SVM en Python
100% (2)
Classification avec KNN et SVM en Python
16 pages
Régression Linéaire avec Scikit-Learn
Pas encore d'évaluation
Régression Linéaire avec Scikit-Learn
4 pages
Chap 2
Pas encore d'évaluation
Chap 2
34 pages
Guide Complet sur l'Apprentissage Machine
Pas encore d'évaluation
Guide Complet sur l'Apprentissage Machine
26 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
Pas encore d'évaluation
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
8 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Code Challenge4
Pas encore d'évaluation
Code Challenge4
4 pages
Optimisation de la Régression Linéaire avec Python
Pas encore d'évaluation
Optimisation de la Régression Linéaire avec Python
36 pages
Régression Linéaire Polynomiale Logistique
Pas encore d'évaluation
Régression Linéaire Polynomiale Logistique
11 pages
TP3 MLP Part II Régression
Pas encore d'évaluation
TP3 MLP Part II Régression
11 pages
Analyse et prédiction du Titanic avec Python
Pas encore d'évaluation
Analyse et prédiction du Titanic avec Python
8 pages
Sélection de modèles et régularisation en R
Pas encore d'évaluation
Sélection de modèles et régularisation en R
7 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Description TP INF242v2
Pas encore d'évaluation
Description TP INF242v2
4 pages
Machine Learning : Méthodes et Applications
Pas encore d'évaluation
Machine Learning : Méthodes et Applications
7 pages
Data Mining tp.5 Régression Linéaire Multiple
Pas encore d'évaluation
Data Mining tp.5 Régression Linéaire Multiple
13 pages
Prédiction de Prix par Régression Linéaire
Pas encore d'évaluation
Prédiction de Prix par Régression Linéaire
1 page
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
K-Means Clustering pour Clients et Revenus
Pas encore d'évaluation
K-Means Clustering pour Clients et Revenus
4 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
71 pages
Régressions Linéaire et Logistique en Python
Pas encore d'évaluation
Régressions Linéaire et Logistique en Python
3 pages
SVM pour classifier fruits et salaires
Pas encore d'évaluation
SVM pour classifier fruits et salaires
4 pages
Exam ML Blanc
Pas encore d'évaluation
Exam ML Blanc
4 pages
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
Pas encore d'évaluation
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
6 pages
TP 2
Pas encore d'évaluation
TP 2
3 pages
Examen SE
Pas encore d'évaluation
Examen SE
2 pages
TD ABR Corrige
Pas encore d'évaluation
TD ABR Corrige
10 pages
TP Word Texte Arabe Complet
Pas encore d'évaluation
TP Word Texte Arabe Complet
3 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
7 pages
Cours C Debutant Fonctions Tableaux
Pas encore d'évaluation
Cours C Debutant Fonctions Tableaux
10 pages
Introduction à la POO en C++
Pas encore d'évaluation
Introduction à la POO en C++
109 pages
Correction Exercices Angles Et Parallélisme + Comp 250305 162505
Pas encore d'évaluation
Correction Exercices Angles Et Parallélisme + Comp 250305 162505
6 pages
Certificat Medical Minsantecm V6ol0425017490
Pas encore d'évaluation
Certificat Medical Minsantecm V6ol0425017490
1 page
Mon Cerveau A ENCORE Besoin de Lunettes
100% (3)
Mon Cerveau A ENCORE Besoin de Lunettes
192 pages
Dépannez Votre Circuit de Charge - Mécanique Moto
Pas encore d'évaluation
Dépannez Votre Circuit de Charge - Mécanique Moto
2 pages
(MAQUOI) Analytical Formulation of The New European Buckling Curves
Pas encore d'évaluation
(MAQUOI) Analytical Formulation of The New European Buckling Curves
7 pages
Cours de Planification. Cfora PDF
100% (3)
Cours de Planification. Cfora PDF
12 pages
Les Obstacles A La Croissance
100% (3)
Les Obstacles A La Croissance
10 pages
No28 20 Sept 2022 Sujetexa - Com
Pas encore d'évaluation
No28 20 Sept 2022 Sujetexa - Com
1 page
Effectuer Des Calculs Sur Des Données de Type Heure
Pas encore d'évaluation
Effectuer Des Calculs Sur Des Données de Type Heure
2 pages
Document-Le Cercle Du SIRH - L Etat de L Art Du SIRH
Pas encore d'évaluation
Document-Le Cercle Du SIRH - L Etat de L Art Du SIRH
137 pages
Éducation chrétienne des enfants
Pas encore d'évaluation
Éducation chrétienne des enfants
4 pages
Plaquette IRM de Stress Cardiaque VDEF
Pas encore d'évaluation
Plaquette IRM de Stress Cardiaque VDEF
2 pages
Introduction aux capteurs en automatisation
Pas encore d'évaluation
Introduction aux capteurs en automatisation
11 pages
David Harvey Et La Théorie de La Ville Capitaliste - Louis Gaudreau
Pas encore d'évaluation
David Harvey Et La Théorie de La Ville Capitaliste - Louis Gaudreau
11 pages
Présentation 1
Pas encore d'évaluation
Présentation 1
32 pages
Hopitaux Et Pharmacies (1) - 1
Pas encore d'évaluation
Hopitaux Et Pharmacies (1) - 1
14 pages
Résumé de "Adieu, ma jolie"
Pas encore d'évaluation
Résumé de "Adieu, ma jolie"
14 pages
Info Sequence 4
Pas encore d'évaluation
Info Sequence 4
2 pages
Projet Eps
100% (6)
Projet Eps
3 pages
Les Amortissements Travaux de Fin Dexercice 2 Bac Sciences Economiques PDF
100% (1)
Les Amortissements Travaux de Fin Dexercice 2 Bac Sciences Economiques PDF
8 pages
Comprendre le Planisphère et le Globe
Pas encore d'évaluation
Comprendre le Planisphère et le Globe
3 pages
Visual TOM : Automatisation et Orchestration IT
Pas encore d'évaluation
Visual TOM : Automatisation et Orchestration IT
4 pages
Avantages Et Inconvénients Scikit
Pas encore d'évaluation
Avantages Et Inconvénients Scikit
2 pages
Thème 1 Géographie 5ème. Chapitre 2 - Géo - La Répartition de La Richesse Et de La Pauvreté Dans Le Monde
Pas encore d'évaluation
Thème 1 Géographie 5ème. Chapitre 2 - Géo - La Répartition de La Richesse Et de La Pauvreté Dans Le Monde
2 pages
Droit Des Affaires OHADA
100% (2)
Droit Des Affaires OHADA
3 pages
Exercices de Parasitologie
Pas encore d'évaluation
Exercices de Parasitologie
22 pages
"Foucault Anonimato", de Érik Bordeleau
100% (1)
"Foucault Anonimato", de Érik Bordeleau
28 pages
Système de Santé Du Mali
100% (1)
Système de Santé Du Mali
7 pages
Analyse du FRNG et BFR en finance
Pas encore d'évaluation
Analyse du FRNG et BFR en finance
1 page
Groupe électrogène J88 Diesel 250 kVA
Pas encore d'évaluation
Groupe électrogène J88 Diesel 250 kVA
8 pages