TP N°2: Régression Linéaire: Institut Supérieur: ML D'informatique Ines Bousrih de Mahdia 2024/ 2025

Ce document présente un TP sur la régression linéaire dans le cadre du Machine Learning, incluant des notions clés comme le Dataset, le modèle, la fonction coût et l'algorithme d'apprentissage. Il décrit les étapes pour implémenter un modèle de régression linéaire simple et multiple en Python, en utilisant un jeu de données sur l'évaluation immobilière. Enfin, il propose des exercices pratiques pour appliquer les concepts appris sur d'autres ensembles de données.

Transféré par

raissianouer

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

21 vues4 pages

TP N°2: Régression Linéaire: Institut Supérieur: ML D'informatique Ines Bousrih de Mahdia 2024/ 2025

Transféré par

raissianouer

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Institut Supérieur Matière : ML

d’informatique Responsable : Ines Bousrih

de Mahdia A.U. : 2024/ 2025

TP N°2 : Régression linéaire

Objectifs
• Développer un premier programme de Machine Learning avec la régression linéaire.
I. Les notions clefs du Machine Learning :
1. DataSet
En Machine Learning, tout démarre d’un Dataset qui contient nos données. Le Dataset
contient une variable de sortie et des variables d’entrée au problème que la machine
doit résoudre.
2. Modèle et ses paramètres
A partir de ce Dataset, on crée un modèle, qui n’est autre qu’une fonction
mathématique. Les coefficients de cette fonction sont les paramètres du modèle (Le
modèle de la régression linéaire est ax+b).
3. Fonction Coût
Lorsqu’on teste notre modèle sur le Dataset, celui-ci nous donne des erreurs.
L’ensemble de ces erreurs, c’est ce qu’on appelle la Fonction Coût.
4. Algorithme d’apprentissage
L’idée centrale du Machine Learning, c’est de laisser la machine trouver quels sont les
paramètres de notre modèle qui minimisent la Fonction Coût.

Pour implémenter ces étapes en python, nous devons suivre les étapes suivantes :
1. Charger le jeu de données et diviser en 2
La machine reçoit des données caractérisées par des variables X (appelés features) et
annotées d’une variable y (appelé Label ou target). Diviser le datset en échantillon
d’apprentissage (Utiliser pour la construction du modèle) et échantillon de test (Utilisé
pour l’évaluation du modèle)
Exemple : échantillon d’apprentissage =70% et échantillon de test=30%
2. Sélectionner quel type de modèle
La machine doit apprendre, en précisant les hyperparamètres du modèle
Exemple en python : model = LinearRegression()
model=PolynomialFeatures(…)
model=RandomForestRegressor()
3. Entrainer le modèle
Entrainer le modèle sur les données d’apprentissage ([Link] (Xa, Ya)).
4. Evaluer le modèle
Test de modèle en appliquant le modèle sur l’échantillon de test et vérifier ses
performances ([Link](Xt, Yt)).

1
5. Utilisé le modèle
Utiliser le modèle dans le classement de nouvelles données ([Link](x’)).
II. Régression linéaire simple
On considère l’ensemble des données Real state valuation (
[Link]
uci?resource=download). Ce sont des données pour estimer les prix des maisons (Sindian
Dist., New Taipei City, Taiwan.) en se basant sur 7 caractéristiques :
• Date : la date de transaction (par exemple : 2013.250=2013 March,
2013.500=2013 June, etc.)
• Age : l'âge de la maison en nombre d’années (nombre réel).
• Station : la distance à la station de métro la plus proche (en mètre).
• Stores : nombre des stores près de la maison (nombre entier).
• Latitude : latitude en degré
• Longitude : longitude en degré
• Price : c’est la sortie qui est le prix de la maison par unité (10000 New Taiwan
Dollar/Ping, où Ping est l’unité locale, 1 Ping = 3.3 mètres carrés).
Etape 1 : Importer les librairies
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from [Link] import mean_squared_error , r2_score

Etape 2 : Chargement du Dataset

#lire le fichier excel

data=pd.read_excel("[Link]")
data

Etape 3 : Préparation des données

a. Supprimer les caractéristiques “date” et “no”
#Supprimer la colonne date
[Link](columns=["Date", "No"],inplace=True)

2
b. Transforme la latitude et la longitude en deux valeurs (0 ou 1) en utilisant
la moyenne.

# une fonction pour binariser une colonne

# donnee:le dataframe
# cl: le nom de la colonne
def binariser(donnee,cl):
#Sélectionner la colonne et calculer la moyenne
moy= donnee[cl].mean()
print(moy)
# Remplacer les valeurs supérieures à la moyenne par 1 et le reste par 0
donnee[cl] =(donnee[cl] >moy).astype(float)
# binariser latitude
binariser(data,"Latitude")
# binariser longitude
binariser(data,"Longitude")

c. Séparation des données en entrées et sorties.

Dans ce fichier, les classes (qui sont le résultat attendu) sont dans la dernière
colonne (Price), et les autres caractéristiques (les entrées) sont dans les colonnes
restantes.

# Séparer les données en entrées et sorties

X =[Link][:,:-1] #les caractéristiques (Features)
y =[Link][:,-1] #les résultats (classes, Target)

Etape 4 : Diviser le dataset en 2 échantillons

Séparer les données en deux parties : une pour l’entrainement (on prend 80%) et une pour
le test (on prend 20%)

X_train, X_test, y_train,y_test=train_test_split(X,y,test_size=0.2)

Etape 5 : Entrainer le modèle

Etudier la relation entre le prix et l'âge des maisons. Ainsi, on définit un modèle linéaire
simple en se basant sur la colonne “Age” avec un nouveau régresseur (Linear Regression)
qu’on entraîne en utilisant la méthode fit. Après l’entrainement, on peut récupérer les
poids (coefficients) des caractéristiques. Ainsi, on peut prédire les classes des données de
test avec la méthode predict.
model= LinearRegression()
# Entrainer un modèle de régression linéaire simple(age)
[Link](X_train[["Age"]],y_train)
# Afficher les coefficients
print("Coefficients regression simple: ", model.coef_, " w0= ", model.intercept_)
# Prédire les résultats des échantillons de test
y_pred=[Link](X_test[["Age"]])

3
Etape 6 : Evaluer le modèle
Évaluer le modèle, en calculant :
• L’erreur quadratique moyenne entre les valeurs prédites et les valeurs réelles.
• Le coefficient de détermination (r2_score) dont le meilleur score est 1.

# Evaluation du modèle
print("Régression simple: MSE = ", mean_squared_error(y_test, y_pred))
print("Score R2=",r2_score(y_test,y_pred))

Etape 7 : Affichage du nuage des points

import [Link] as plt

[Link](X_test["Age"],y_test, color="black")
[Link](X_test["Age"],y_pred, color='r')
[Link](["linéaire"])
[Link]("Age")
[Link]("prix")
[Link]()
[Link]()

III. Régression linéaire multiple

# Regression linéaire multiple

modelRegMulti=LinearRegression()
[Link](X_train, y_train)
print("Coefficients régression multiple: ",modelRegMulti.coef_," w0= ",
modelRegMulti.intercept_)
yl_predm =[Link](X_test)
print("Régression multiple:MSE= ",mean_squared_error(y_test,yl_predm))
print("Score R2m:",r2_score(y_test, yl_predm))

Matrice de corrélation
Une matrice de corrélation est simplement un tableau contenant les coefficients de
corrélation pour différentes variables. La matrice montre comment toutes les paires de
valeurs possibles dans un tableau sont liées les unes aux autres.

import seaborn as sns

df_corr = [Link]()
ax = [Link](df_corr,cmap = 'coolwarm')

IV. Exercice :
1. Appliquer le modèle de régression linéaire simple sur l’ensemble de données Titanic, en
utilisant la colonne "Survived" comme la variable à prédire (Target) et la colonne "Fare"
comme la variable utilisée pour prédire (Feature). Puis évaluer le modèle.
2. Enlever la colonne Name, puis appliquer la régression linéaire multiple et évaluer les
performances du modèle.
4

Vous aimerez peut-être aussi

Machine Learning (ML) : Scikit-Learn
Pas encore d'évaluation
Machine Learning (ML) : Scikit-Learn
7 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
8 pages
TP1 24 25
Pas encore d'évaluation
TP1 24 25
8 pages
TP Poly Regres 24 25
Pas encore d'évaluation
TP Poly Regres 24 25
3 pages
Résumé Du Cours de Machine Learning
Pas encore d'évaluation
Résumé Du Cours de Machine Learning
7 pages
Analyse Prédictive avec Python et Pandas
Pas encore d'évaluation
Analyse Prédictive avec Python et Pandas
5 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
63 pages
tp1 Deepl
Pas encore d'évaluation
tp1 Deepl
5 pages
TP 5 Machine Learning
Pas encore d'évaluation
TP 5 Machine Learning
10 pages
Machine Learning Regularisation L4 LMD
Pas encore d'évaluation
Machine Learning Regularisation L4 LMD
18 pages
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
Pas encore d'évaluation
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
4 pages
Groupe2/4GM: Encadreurs: Date
Pas encore d'évaluation
Groupe2/4GM: Encadreurs: Date
36 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Big Data Et Analyse Prédictive
Pas encore d'évaluation
Big Data Et Analyse Prédictive
44 pages
Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
4 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
TP - 2 - Énoncé - Version 1
Pas encore d'évaluation
TP - 2 - Énoncé - Version 1
3 pages
TP 1 - Initiation À La ML
Pas encore d'évaluation
TP 1 - Initiation À La ML
2 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
Objectifs:: TP3: Régression Linéaire, Multiple Et Polynomiale
Pas encore d'évaluation
Objectifs:: TP3: Régression Linéaire, Multiple Et Polynomiale
2 pages
TP-regression Master QFM 2023
Pas encore d'évaluation
TP-regression Master QFM 2023
13 pages
Abcd
Pas encore d'évaluation
Abcd
7 pages
Cours
Pas encore d'évaluation
Cours
164 pages
TP1 IA L2 RobertYave
Pas encore d'évaluation
TP1 IA L2 RobertYave
26 pages
Voix Off Lab02 Detaillee
Pas encore d'évaluation
Voix Off Lab02 Detaillee
3 pages
TP 2
Pas encore d'évaluation
TP 2
3 pages
ML 1 Itroduction
Pas encore d'évaluation
ML 1 Itroduction
5 pages
Machine Learning Python Guide
100% (1)
Machine Learning Python Guide
6 pages
Résumé Machine Learning&pandas&numpy
Pas encore d'évaluation
Résumé Machine Learning&pandas&numpy
26 pages
Régression Linéaire et Descente de Gradient
Pas encore d'évaluation
Régression Linéaire et Descente de Gradient
43 pages
Progres2019 5
Pas encore d'évaluation
Progres2019 5
44 pages
Testmlann
Pas encore d'évaluation
Testmlann
2 pages
Tp2: Deep Learning: Tensorflow
Pas encore d'évaluation
Tp2: Deep Learning: Tensorflow
9 pages
TP 04 Afd PMC
Pas encore d'évaluation
TP 04 Afd PMC
6 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Projet IA MameCheikhSylla - IbraKoundoul
Pas encore d'évaluation
Projet IA MameCheikhSylla - IbraKoundoul
19 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
Machine Learning
100% (1)
Machine Learning
22 pages
TP3-Aprentissage Supervisé - KNN - Linear Regression
Pas encore d'évaluation
TP3-Aprentissage Supervisé - KNN - Linear Regression
6 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
15 pages
4.évaluez La Performance D'un Modèle Prédictif
Pas encore d'évaluation
4.évaluez La Performance D'un Modèle Prédictif
9 pages
TP3 MLP Part II Régression
Pas encore d'évaluation
TP3 MLP Part II Régression
11 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Algorithme Machine Learng
Pas encore d'évaluation
Algorithme Machine Learng
16 pages
Atelier 4
Pas encore d'évaluation
Atelier 4
12 pages
Machine - Learning - Classification
Pas encore d'évaluation
Machine - Learning - Classification
34 pages
Description TP INF242v2
Pas encore d'évaluation
Description TP INF242v2
4 pages
TD Machine Regression Python
Pas encore d'évaluation
TD Machine Regression Python
3 pages
Exercice en ML
Pas encore d'évaluation
Exercice en ML
1 page
TP 5: Régression Linéaire Avec Knime Oration de Données: Techniques D'expl
Pas encore d'évaluation
TP 5: Régression Linéaire Avec Knime Oration de Données: Techniques D'expl
2 pages
Étude de Cas Linear Regression
Pas encore d'évaluation
Étude de Cas Linear Regression
2 pages
TP 0
Pas encore d'évaluation
TP 0
5 pages
50 Heures de Formation Entre Python Et Intelligence Artificielle
0% (1)
50 Heures de Formation Entre Python Et Intelligence Artificielle
4 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
Résumé Deep Learning
Pas encore d'évaluation
Résumé Deep Learning
15 pages
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
Pas encore d'évaluation
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
6 pages
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
Pas encore d'évaluation
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
8 pages
Cours Virtualisation Avancée
Pas encore d'évaluation
Cours Virtualisation Avancée
110 pages
Chapitre 2 Cryptographie
Pas encore d'évaluation
Chapitre 2 Cryptographie
21 pages
Chapitre 1 Cryptographie
Pas encore d'évaluation
Chapitre 1 Cryptographie
28 pages
Réseaux & Télécoms - Chap1et2
Pas encore d'évaluation
Réseaux & Télécoms - Chap1et2
74 pages
Hyperviseurs : Types et Exemples
Pas encore d'évaluation
Hyperviseurs : Types et Exemples
2 pages
Fiche de TD Analyse Num Polytech de Douala
Pas encore d'évaluation
Fiche de TD Analyse Num Polytech de Douala
8 pages
Exercices d'Algèbre sur les Polynômes
Pas encore d'évaluation
Exercices d'Algèbre sur les Polynômes
2 pages
TP N°1 Complexité
Pas encore d'évaluation
TP N°1 Complexité
10 pages
Probabilités Maths
Pas encore d'évaluation
Probabilités Maths
1 page
Feuille 5 Equations Differentielles 250502 135915
Pas encore d'évaluation
Feuille 5 Equations Differentielles 250502 135915
4 pages
Diagrammes d'Objets Simplifiés
Pas encore d'évaluation
Diagrammes d'Objets Simplifiés
6 pages
Recherche Opérationnelle: Programmation Dynamique
Pas encore d'évaluation
Recherche Opérationnelle: Programmation Dynamique
80 pages
Stratégies IA pour Jeux de Hasard
Pas encore d'évaluation
Stratégies IA pour Jeux de Hasard
24 pages
AD - CH 3
Pas encore d'évaluation
AD - CH 3
29 pages
Recherche Opérationnelle Cours Et TD
Pas encore d'évaluation
Recherche Opérationnelle Cours Et TD
43 pages
093 Bases de Communications Numeriques 1 Onera
Pas encore d'évaluation
093 Bases de Communications Numeriques 1 Onera
357 pages
Correction TD sur les lois discrètes
Pas encore d'évaluation
Correction TD sur les lois discrètes
15 pages
Chap6 SVM
Pas encore d'évaluation
Chap6 SVM
31 pages
Fiche de Travaux Pratiques: Mod Elisation Des S Eries Temporelles Sous R
Pas encore d'évaluation
Fiche de Travaux Pratiques: Mod Elisation Des S Eries Temporelles Sous R
5 pages
Méthodes Numériques en Génie Civil
100% (1)
Méthodes Numériques en Génie Civil
31 pages
Méthodes Numériques pour Mécanique L3
Pas encore d'évaluation
Méthodes Numériques pour Mécanique L3
1 page
Sujet - Principal SE - 2023
Pas encore d'évaluation
Sujet - Principal SE - 2023
2 pages
Informatique 2025 DocReponse
Pas encore d'évaluation
Informatique 2025 DocReponse
12 pages
Informatique Avec Python: Mpsi Pcsi Ptsi MP PC PSI PT TSI TPC Exercices Incontournables
Pas encore d'évaluation
Informatique Avec Python: Mpsi Pcsi Ptsi MP PC PSI PT TSI TPC Exercices Incontournables
30 pages
Ces J1
Pas encore d'évaluation
Ces J1
9 pages
Définition: Catégorie Type Niveau Contexte
Pas encore d'évaluation
Définition: Catégorie Type Niveau Contexte
3 pages
09 Data Scientist Amended
Pas encore d'évaluation
09 Data Scientist Amended
15 pages
Etude de La Synchronisation de Deux Circuits Identiques Generateurs Des Signaux Chaotiques
Pas encore d'évaluation
Etude de La Synchronisation de Deux Circuits Identiques Generateurs Des Signaux Chaotiques
67 pages
Atelier MLP - Overfitting - Dropout
Pas encore d'évaluation
Atelier MLP - Overfitting - Dropout
10 pages
Devoir de Contrôle N°3 - Math - Bac Technique (2009-2010) MR Maatallah Kamel
Pas encore d'évaluation
Devoir de Contrôle N°3 - Math - Bac Technique (2009-2010) MR Maatallah Kamel
1 page
Fractales et Méthodes Numériques
Pas encore d'évaluation
Fractales et Méthodes Numériques
9 pages
Statistiques et Corrélations 4ème
Pas encore d'évaluation
Statistiques et Corrélations 4ème
5 pages
TPCNN
Pas encore d'évaluation
TPCNN
7 pages
Ecoulement de Puissances PDF
100% (3)
Ecoulement de Puissances PDF
26 pages
Cours Ia
100% (2)
Cours Ia
15 pages