0% ont trouvé ce document utile (0 vote)

192 vues11 pages

Régression Linéaire Simple en Python

La régression linéaire simple est un modèle statistique qui prédit une variable dépendante en fonction d'une variable indépendante. Ce document présente une implémentation de la régression linéaire simple en Python, en utilisant un jeu de données sur les salaires et l'expérience des employés, et décrit les étapes de l'importation des bibliothèques, de l'analyse des données, de la formation du modèle et de la visualisation des résultats. Les résultats montrent une relation linéaire entre l'expérience et le salaire, confirmée par des graphiques de distribution et de régression.

Transféré par

Yassine Elhamdouni

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

192 vues11 pages

Régression Linéaire Simple en Python

Transféré par

Yassine Elhamdouni

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

REALISE PAR:

 Anas Roukhmi
 Abdelkarime Rekbi
 Hamza Aouni
 Yasmine El Boukhari

ENCADRÉ PAR:
Pr. MOHAMED IGUERNANE
Qu'est-ce que la régression linéaire simple ?
En statistique, la régression linéaire simple est un modèle de
régression linéaire avec une seule variable explicative. Dans la
régression linéaire simple, nous prédisons les scores sur une variable
en fonction des résultats sur une autre. La variable critère Y est la
variable que nous prédisons. La variable prédictive X est la variable
avec laquelle nous faisons nos prédictions. L'approche de prédiction
est connue sous le nom de régression simple car il n'y a qu'une seule
variable prédictive.

En conséquence, une fonction linéaire qui prédit les valeurs de la

variable dépendante en fonction de la variable indépendante est
découverte pour des points d'échantillonnage bidimensionnels avec
une variable indépendante et une variable dépendante.

Le graphique ci-dessous explique la relation entre le salaire et les

années d'expérience.
Équation : y = mx + c
Ceci est l'équation de la régression linéaire simple où c est
la constante et m est la pente et décrit la relation entre x (variable
indépendante) et y (variable dépendante). Le coefficient peut être
positif ou négatif et représente le degré de changement dans la
variable dépendante pour chaque unité de changement dans la
variable indépendante.

β0 (ordonnée à l'origine) et β1 (pente) sont les coefficients dont les

valeurs représentent la précision des valeurs prédites par rapport aux
valeurs réelles.

Implémentez la régression linéaire simple en

Python
Dans cet exemple, nous utiliserons les données salariales
concernant l'expérience des employés. Dans ce jeu de données, nous
avons deux colonnesAnnées d'expérience et Salaire
Étape 1 : Importez les packages Python
requis
Nous avons besoin de Pandas pour la manipulation des données,
de NumPy pour les calculs mathématiques, et de MatplotLib et
Seaborn pour les [Link] bibliothèques Sklearn sont
utilisées pour les opérations d'apprentissage automatique.

# Import libraries
import pandas as pd
import numpy as np
import [Link] as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from [Link] import random_state
from sklearn.linear_model import LinearRegression

Étape 2 : Charger le jeu de données

Téléchargez le jeu de données, téléchargez-le dans votre carnet de
notes et lisez-le dans le dataframe pandas.

# Get dataset
df_sal = pd.read_csv('/content/Salary_Data.csv')
df_sal.head()
Étape 3 : Analyse des données
Maintenant que nous avons nos données prêtes, analysons et
comprenons leur tendance en détail. Pour ce faire, nous pouvons
d'abord décrire les données ci-dessous -

# Describe data
df_sal.describe()
Ici, nous pouvons voir que les salaires varient de 37731 à 122391
avec une médiane de 65237.

Nous pouvons également visualiser la distribution des données en

utilisant Seaborn distplot.

# Data distribution
[Link]('Salary Distribution Plot')
[Link](df_sal['Salary'])
[Link]()

Un distplot ou graphique de distribution montre la variation dans la

distribution des données. Il représente les données en combinant une
ligne avec un histogramme.
Ensuite, nous vérifions la relation entre le Salaire et l'Expérience –

# Relationship between Salary and Experience

[Link](df_sal['YearsExperience'], df_sal['Salary'], color = 'lightcoral')
[Link]('Salary vs Experience')
[Link]('Years of Experience')
[Link]('Salary')
[Link](False)
[Link]()

Il est maintenant clairement visible que nos données varient de

manière linéaire. Cela signifie qu'un individu reçoit un salaire plus
élevé à mesure qu'il acquiert de l'expérience.
Étape 4 : Diviser le jeu de données en
variables dépendantes/indépendantes
L'expérience (X) est la variable indépendante. Le salaire (y) dépend
de l'expérience.

# Splitting variables
X = df_sal.iloc[:, :1] # independent
y = df_sal.iloc[:, 1:] # dependent

Étape 4 : Diviser les données en ensembles

d'entraînement/test
De plus, divisez vos données en ensembles d'entraînement (80%)
et de test (20%) en utilisant train_test_split.

# Splitting dataset into test/train

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 0)

Étape 5 : Entraîner le modèle de régression

Passez les données X_train et y_train dans le modèle de
régression par [Link] pour entraîner le modèle avec nos
données d'entraînement.

# Regressor model
regressor = LinearRegression()
[Link](X_train, y_train)
Étape 6 : Prédire le résultat
Voici la partie intéressante, lorsque nous sommes tous prêts à
prédire n'importe quelle valeur de y (salaire) en fonction de X
(expérience) avec le modèle formé à l'aide de [Link]

# Prediction result
y_pred_test = [Link](X_test) # predicted value of y_test
y_pred_train = [Link](X_train) # predicted value of y_train

Étape 7 : Tracer les résultats d'entraînement

et de test
Il est temps de tester nos résultats prédits en traçant des
graphiques.

 Tracer les données de l'ensemble d'entraînement par

rapport aux prédictions Tout d'abord, nous traçons le résultat
des ensembles d'entraînement (X_train, y_train) avec X_train et
la valeur prédite de y_train ([Link](X_train)).

[Link](X_train, y_train, color = 'lightcoral')

[Link](X_train, y_pred_train, color = 'firebrick')
[Link]('Salary vs Experience (Training Set)')
[Link]('Years of Experience')
[Link]('Salary')
[Link](['X_train/Pred(y_test)', 'X_train/y_train'], title = 'Sal/Exp', loc='best',
facecolor='white')
[Link](False)
[Link]()
 Tracer les données du jeu de test par rapport aux
prédictions Deuxièmement, nous traçons le résultat des
ensembles de test (X_test, y_test) avec X_train et la valeur
prédite de y_train ([Link](X_train)).
# Prediction on test set
[Link](X_test, y_test, color = 'lightcoral')
[Link](X_train, y_pred_train, color = 'firebrick')
[Link]('Salary vs Experience (Test Set)')
[Link]('Years of Experience')
[Link]('Salary')
[Link](['X_train/Pred(y_test)', 'X_train/y_train'], title = 'Sal/Exp', loc='best',
facecolor='white')
[Link](False)
[Link]()
Nous pouvons voir, dans les deux graphiques, que la ligne de
régression couvre les données d'entraînement et de test.

De plus, vous pouvez tracer les résultats avec la valeur prédite de

y_test ([Link](X_test)), mais la ligne de régression resterait
la même car elle est générée à partir de l'unique équation de
régression linéaire avec les mêmes données d'entraînement.

Si vous vous souvenez du début de cet article, nous avons discuté

de l'équation linéaire y = mx + c, nous pouvons également obtenir
le c (ordonnée à l'origine) et m (pente/coefficient) à partir du modèle
de régression.

# Regressor coefficients and intercept

print(f'Coefficient: {regressor.coef_}')
print(f'Intercept: {regressor.intercept_}')

Vous aimerez peut-être aussi

Régression Linéaire : Prédiction de Salaire
Pas encore d'évaluation
Régression Linéaire : Prédiction de Salaire
5 pages
TP6 Regression Lineairé Simple V2
Pas encore d'évaluation
TP6 Regression Lineairé Simple V2
4 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
TP - 2 - Énoncé - Version 1
Pas encore d'évaluation
TP - 2 - Énoncé - Version 1
3 pages
Regression Lineaire en Python Avec Scikit 1
Pas encore d'évaluation
Regression Lineaire en Python Avec Scikit 1
10 pages
Regression
Pas encore d'évaluation
Regression
20 pages
La Regression
Pas encore d'évaluation
La Regression
3 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
15 pages
Chapitre 4 Regression Generalities
Pas encore d'évaluation
Chapitre 4 Regression Generalities
9 pages
Seance5 Régression Simple
Pas encore d'évaluation
Seance5 Régression Simple
27 pages
Stat
Pas encore d'évaluation
Stat
6 pages
Rapport Regression
Pas encore d'évaluation
Rapport Regression
20 pages
Regression Lineaire Ols
Pas encore d'évaluation
Regression Lineaire Ols
63 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
63 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
4 pages
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
Pas encore d'évaluation
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
4 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
2 - Apprentissage Supervisé
Pas encore d'évaluation
2 - Apprentissage Supervisé
10 pages
Expose de La Regression Lineaire (Koro & Mahamadou) Groupe 1
Pas encore d'évaluation
Expose de La Regression Lineaire (Koro & Mahamadou) Groupe 1
18 pages
Les Types de Regressions
Pas encore d'évaluation
Les Types de Regressions
31 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
90 pages
Régression Linéaire Simple et Modèles Statistiques
100% (1)
Régression Linéaire Simple et Modèles Statistiques
51 pages
Régression Linéaire en Machine Learning
Pas encore d'évaluation
Régression Linéaire en Machine Learning
33 pages
ML-BDIO&MIT Chap II Regression Linéaire
Pas encore d'évaluation
ML-BDIO&MIT Chap II Regression Linéaire
56 pages
Cours Prévision - Master ML 2023
Pas encore d'évaluation
Cours Prévision - Master ML 2023
14 pages
TP Stats-1
Pas encore d'évaluation
TP Stats-1
8 pages
Régression Linéaire Simplifiée
Pas encore d'évaluation
Régression Linéaire Simplifiée
72 pages
TP1 Avec Solution 2
Pas encore d'évaluation
TP1 Avec Solution 2
5 pages
Régression Linéaire : Concepts et Méthodes
Pas encore d'évaluation
Régression Linéaire : Concepts et Méthodes
13 pages
Modèle linéaire en actuariat 2022-2023
Pas encore d'évaluation
Modèle linéaire en actuariat 2022-2023
49 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
20 pages
Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
Régression Linéaire Simple: Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire Simple: Concepts et Estimations
7 pages
Regression Linéaire Simple PDF
Pas encore d'évaluation
Regression Linéaire Simple PDF
7 pages
Régression Linéaire Multiple avec R et Python
Pas encore d'évaluation
Régression Linéaire Multiple avec R et Python
6 pages
Modèles Linéaires 2
Pas encore d'évaluation
Modèles Linéaires 2
88 pages
REGRESSION
Pas encore d'évaluation
REGRESSION
16 pages
Régression Linéaire avec R: Guide Complet
Pas encore d'évaluation
Régression Linéaire avec R: Guide Complet
27 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
183 pages
Modelisation Statistique ENSGMM
Pas encore d'évaluation
Modelisation Statistique ENSGMM
27 pages
Econometrie Regression
Pas encore d'évaluation
Econometrie Regression
181 pages
Chap2 Regression
Pas encore d'évaluation
Chap2 Regression
78 pages
Régression Linéaire: Guide Pratique
Pas encore d'évaluation
Régression Linéaire: Guide Pratique
130 pages
Guide de la Régression Linéaire et Logistique
100% (1)
Guide de la Régression Linéaire et Logistique
4 pages
M13 PDF
Pas encore d'évaluation
M13 PDF
26 pages
Regression HD
Pas encore d'évaluation
Regression HD
64 pages
Sans Titre 38
Pas encore d'évaluation
Sans Titre 38
85 pages
Groupe2/4GM: Encadreurs: Date
Pas encore d'évaluation
Groupe2/4GM: Encadreurs: Date
36 pages
TP 04 Afd PMC
Pas encore d'évaluation
TP 04 Afd PMC
6 pages
TP7 Régression Linéaire Multiple
Pas encore d'évaluation
TP7 Régression Linéaire Multiple
4 pages
Regression
Pas encore d'évaluation
Regression
19 pages
Régression Linéaire Simplifiée
Pas encore d'évaluation
Régression Linéaire Simplifiée
58 pages
08 Ml-Regression
Pas encore d'évaluation
08 Ml-Regression
30 pages
Régression Linéaire Simple Chapitre 1
Pas encore d'évaluation
Régression Linéaire Simple Chapitre 1
3 pages
R Cours7
Pas encore d'évaluation
R Cours7
37 pages
Cours Reg
Pas encore d'évaluation
Cours Reg
34 pages
Chap2 Modèle de Régression Linéaire Simple
Pas encore d'évaluation
Chap2 Modèle de Régression Linéaire Simple
10 pages
POO Projet 2
Pas encore d'évaluation
POO Projet 2
6 pages
Projet de Fin D'études
Pas encore d'évaluation
Projet de Fin D'études
68 pages
Acupuncture SaAm Coréenne - Backup
Pas encore d'évaluation
Acupuncture SaAm Coréenne - Backup
14 pages
Seminaire SolarWorld - COGEPRA 25-04-2015
Pas encore d'évaluation
Seminaire SolarWorld - COGEPRA 25-04-2015
35 pages
Centre Multifonctionel.2
Pas encore d'évaluation
Centre Multifonctionel.2
18 pages
Circuits Combinatoires en Électronique
Pas encore d'évaluation
Circuits Combinatoires en Électronique
10 pages
Upper Body Maison Romane Kov
Pas encore d'évaluation
Upper Body Maison Romane Kov
23 pages
Mer Productions - Legfruits
Pas encore d'évaluation
Mer Productions - Legfruits
2 pages
Best Corporation 2024 Preparation Classes
Pas encore d'évaluation
Best Corporation 2024 Preparation Classes
4 pages
Cours - Meski Samira - Chimie I Chimie II
Pas encore d'évaluation
Cours - Meski Samira - Chimie I Chimie II
186 pages
9782715250932
Pas encore d'évaluation
9782715250932
20 pages
Exposé TICE CRMEF
Pas encore d'évaluation
Exposé TICE CRMEF
16 pages
"Chaux Hydraulique: Histoire et Utilisation"
Pas encore d'évaluation
"Chaux Hydraulique: Histoire et Utilisation"
18 pages
Rapport Stage Tunicotex
Pas encore d'évaluation
Rapport Stage Tunicotex
10 pages
KHPC Newsletter 20 499d7830d8
Pas encore d'évaluation
KHPC Newsletter 20 499d7830d8
2 pages
QCM sur la gestion en éducation physique
Pas encore d'évaluation
QCM sur la gestion en éducation physique
31 pages
LR6 Note - de - Calcul
Pas encore d'évaluation
LR6 Note - de - Calcul
5 pages
Expose Edi224
Pas encore d'évaluation
Expose Edi224
4 pages
Ferrandi - Fruits Noix Idris
100% (6)
Ferrandi - Fruits Noix Idris
307 pages
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
Pas encore d'évaluation
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
3 pages
Présentation Sur La Représentation Salariale Au Maroc
Pas encore d'évaluation
Présentation Sur La Représentation Salariale Au Maroc
8 pages
776-800 7-PDF Wyman W Lai, Luc L Mertens, Meryl S Cohen, Tal Geva Echocardiography
Pas encore d'évaluation
776-800 7-PDF Wyman W Lai, Luc L Mertens, Meryl S Cohen, Tal Geva Echocardiography
25 pages
Poursuite de Gesca Contre Sophie Durocher Pour Atteinte À La Réputation
Pas encore d'évaluation
Poursuite de Gesca Contre Sophie Durocher Pour Atteinte À La Réputation
40 pages
Évaluation Des Préfixes Et Des Suffixes 3e Année
Pas encore d'évaluation
Évaluation Des Préfixes Et Des Suffixes 3e Année
3 pages
Évolution et Défis du Transport Aérien
Pas encore d'évaluation
Évolution et Défis du Transport Aérien
2 pages
Généralité Sur L'usinage
100% (1)
Généralité Sur L'usinage
7 pages
BCH 211 Chromato-1
100% (1)
BCH 211 Chromato-1
6 pages
Charte D
Pas encore d'évaluation
Charte D
4 pages
Fonctions et Variations pour 1ère S
Pas encore d'évaluation
Fonctions et Variations pour 1ère S
10 pages
Exercices Integrale
Pas encore d'évaluation
Exercices Integrale
4 pages