0% ont trouvé ce document utile (0 vote)

85 vues33 pages

Régression Linéaire en Machine Learning

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

85 vues33 pages

Régression Linéaire en Machine Learning

Transféré par

menyar kacem

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 2: REGRESSION LINEAIRE

appliquée au ML
 Apprentissage basé sur une instance Vs.
Apprentissage basé sur un modèle
 Régression linéaire vs Régression logistique
 Modèle de régression linéaire simple
 Moindres carrés ordinaires
 Gradient Descente
 Modèle de régression linéaire multiple

77 Machine Learning avec Python

M.SEKMA
Apprentissage basé sur une instance Vs.
Apprentissage basé sur un modèle
Apprentissage basé sur une instance

78 Machine Learning avec Python

M.SEKMA
Apprentissage basé sur une instance Vs.
Apprentissage basé sur un modèle

79 Machine Learning avec Python

M.SEKMA
Régression linéaire vs Régression
logistique
Régression Linéaire Régression Logistique
• Type de variable dépendante : Continue • Type de variable dépendante : Binaire ou
• Modèle mathématique : Equation nominale
linéaire • Modèle mathématique : Fonction logistique
• Objectif : Prédiction de valeurs (sigmoïde)
numériques. • Objectif : Prédiction de la probabilité
• Sortie du modèle : Valeurs continues d'appartenance à une classe
• Sortie du modèle : Probabilité entre 0 et 1
• Exemple: la prévision des stocks • Exemple: la classification d’images.

80 Machine Learning avec Python

M.SEKMA
Introduction à la Régression Linéaire
 La régression linéaire est une technique d'analyse
statistique qui permet de modéliser la relation entre une
variable dépendante (Y) et une ou plusieurs variables
indépendantes (X).
 Apprentissage basé sur un modèle.

 Elle est basée sur l'hypothèse que la relation entre ces

variables est linéaire, c'est-à-dire qu'elle peut être
approximée par une ligne droite.

81 Machine Learning avec Python

M.SEKMA
Quand Utiliser la Régression Linéaire ?
 La régression linéaire est utilisée pour prédire ou expliquer la valeur d'une
variable dépendante en fonction de variables indépendantes.

Y
Variable
dépendante

X
Variable
82 indépendante
Objectif de la Régression Linéaire

 L'objectif principal de la régression linéaire est de trouver

la meilleure ligne (modèle) qui représente la relation
entre les variables, minimisant ainsi l'erreur de prédiction.

 Cette ligne est appelée "ligne de régression" ou "droite

de régression".

83 Machine Learning avec Python

M.SEKMA
Types de Régression Linéaire
Il existe plusieurs types de régression linéaire,
 La régression linéaire simple (une seule variable indépendante)

 La régression linéaire multiple (plusieurs variables indépendantes).

 D'autres variantes incluent la régression linéaire robuste, la

régression linéaire polynomiale, etc

84 Machine Learning avec Python

M.SEKMA
Régression Linéaire Simple
 La régression linéaire simple est une technique d'analyse
statistique qui modélise la relation entre une variable
dépendante (Y) et une seule variable indépendante (X).
 L'équation de la régression linéaire simple :

Y = α+ βX + ε
 α et β sont les coefficients de régression, ε est l'erreur
résiduelle.

85 Machine Learning avec Python

M.SEKMA
Forme de la Régression Linéaire Simple

 L'objectif est de trouver les meilleurs coefficients (α et β)

pour ajuster la ligne qui minimise l'erreur résiduelle.

Y = α+ βX + ε

 L'erreur résiduelle mesure la différence entre les valeurs

prédites et les valeurs réelles.

86 Machine Learning avec Python

M.SEKMA
Exemple

87 Machine Learning avec Python M.SEKMA

Trouver les Coefficients: méthode des
moindres carrés
 Dans les modèles de régression linéaire les coefficients
sont trouvés en utilisant la méthode des moindres carrés.

 La méthode des moindres carrés est une technique

d'optimisation utilisée pour ajuster un modèle aux
données en minimisant la somme des carrés des écarts
entre les valeurs prédites et les valeurs réelles.

L'équation de la régression linéaire simple :

Y = α+ βX + ε

88 Machine Learning avec Python

M.SEKMA
Rappelons
 Var(X) représente la variance de la variable indépendante
X  mesure la variation de la variable indépendante X en
elle-même

 La covariance mesure comment les deux variables X et Y

varient ensemble,

89 Machine Learning avec Python

M.SEKMA
Trouver les Coefficients: méthode des
moindres carrés
Interprétation des Coefficients:
 α est l'ordonnée à l'origine et représente la valeur de Y
lorsque X est égal à zéro.
 β est la pente de la ligne de régression et indique
comment Y change lorsque X augmente d'une unité.

α β

90 Machine Learning avec Python

M.SEKMA
Méthode des Moindres Carrés
 Le modèle peut servir à prédire Y si on connaît le point x :
Y = α+ βX

 Exemple: Si α = 3 et β = 100 alors pour x = 255 la valeur de Y

donné par le modèle est de Y = 3 + 100 × 255 = 25503

 Dans ce modèle on dit qu’un changement d'une unité dans X est

associé à un changement de 100 unités dans Y, ce qui reflète la pente
de la régression.

91 Machine Learning avec Python

M.SEKMA
Exemple. Méthode des Moindres Carrés
Considérons la relation entre le nombre d'employés d'une usine et le taux d'absentéisme.
 On veut prédire le taux d'absentéisme en fonction de la taille de l'entreprise, mesurée
en termes du nombre d'employés.
 L'objectif est de modéliser ce taux en fonction de la taille de l'entreprise, afin de
déterminer:
1. s'il y a une relation entre les deux,
2. quelle est l'influence de la taille de l'entreprise sur le taux d'absentéisme.

92
Exemple. Méthode des Moindres Carrés
Soit des valeurs suivantes de 7 entreprises :

1- Calculer les moyennes de X et Y

• La moyenne de X noté x̄ =(356+67+25+157+589+557+78)/7 =261,29

• La moyenne ȳ =(5+3+2+4+7+3+8)/7=4,5714
93 Machine Learning avec Python
M.SEKMA
Exemple. Méthode des Moindres Carrés

 2- Covariance de X et Y:
Cov(x,y)

 3- S²x
94 Machine Learning avec Python
M.SEKMA
Exemple. Méthode des Moindres Carrés
 Y = α+ βX

( , )
β= =715,8571/341861,4=2,094010 ≈ 0,002
²

=4,5714-(2,094010 )  261,29=4,0243

L’équation de la régression sera alors: y=4,0243+0,002  X

 Interprétation:
 Une entreprise ayant 200 employés devrait avoir un taux d’absentéisme
de 4,024+0,002  (200)= 4,424

 De plus une augmentation de 100 du nombre des employés augmente de

0,002*100 = 0,2 le taux en %
95 Machine Learning avec Python
M.SEKMA
Exercice
 Dans le but d'expliquer la consommation sur carte de crédit,
des données sur le revenu et sur la dépense sont obtenues :

Le modèle estimer doit permettre d'obtenir les dépenses sur carte de crédit en fonction
des revenus.
La variable dépendante est : y =Dépenses
La variable indépendante est x =Revenu

96 Machine Learning avec Python

M.SEKMA
Optimiser les paramètres du modèle:
Gradient Descent
 Le Gradient Descent (GD) est un algorithme d'optimisation utilisé pour
ajuster les paramètres d'un modèle afin de minimiser une fonction de coût.

 Convergence: le GD assure que l'optimisation converge vers un minimum

local de la fonction de coût,

 Pour rappel, nous souhaitons que la somme des carrés des erreurs soit la plus
petite possible.

97 Machine Learning avec Python

M.SEKMA
Optimiser les paramètres du modèle:
Gradient Descent
 On va non pas prendre la somme mais la moyenne. Cette
moyenne est appelée fonction coût.
 Elle s’écrit de la manière suivante :

J(α,β) β α

98 Machine Learning avec Python

M.SEKMA
Etape de calcule de GD
Cas1: une seul variable a

La machine calcule la dérivée afin de savoir si

elle est à gauche ou à droite du point
minimum.

99 Machine Learning avec Python

M.SEKMA
Etape de calcule de GD
Cas1: une seul variable a

100 Machine Learning avec Python

M.SEKMA
Etape de calcule de GD
 Cas2: Deux variables a et b

L’objectif reste identique, mais l’ajout d’une nouvelle variable, en

l’occurrence b, transforme la fonction coût en un graphique en 3D
dimensions.

101 Machine Learning avec Python

M.SEKMA
Descente de gradient « optimisée »
• Plutôt que proposer aléatoirement à chacune des étapes une nouvelle valeur pour a,
on va soustraire à a un certain pourcentage de la dérivée calculée à l’étape
précédente, pourcentage c’est « learning rate = taux d’apprentissage ».
• La nouvelle valeur de a est calculée de la manière suivante :
« Nouveau a » = « Ancien a » – « learning_rate »× « Dérivée »

102 Machine Learning avec Python

M.SEKMA
REGRESSION LINEAIRE appliquée au ML
Notions traitées dans cette partie:
 Régression linéaire vs Régression logistique
 Modèle de régression linéaire simple
 Moindres carrés ordinaires
 Gradient Descente
 Modèle de régression linéaire multiple

103 Machine Learning avec Python

M.SEKMA
 Modèle de régression linéaire multiple

104 Machine Learning avec Python

M.SEKMA
Modèle de régression linéaire multiple
 Le modèle de régression multiple repose sur les hypothèses
suivantes:
 Il existe une relation linéaire entre les variables dépendantes et les
variables indépendantes

 Les variables indépendantes ne sont pas trop fortement corrélées entre

elles

 les observations sont sélectionnées indépendamment et au hasard dans

la population

 Les résidus doivent être normalement distribués avec une moyenne de 0

et une variance σ
105 Machine Learning avec Python
M.SEKMA
 La régression linéaire multiple s'exprime comme :

106 Machine Learning avec Python

M.SEKMA
Modèle de régression linéaire multiple

107 Machine Learning avec Python

M.SEKMA
Régression Linéaire en Python avec Scikit-
learn

1- Importation des Bibliothèques

import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection
import train_test_split from sklearn.linear_model import LinearRegression from
sklearn.metrics import mean_squared_error

2 - Division des Données

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

3- Création du Modèle
model = LinearRegression()
model.fit(X_train, y_train)

108 Machine Learning avec Python

M.SEKMA
Régression Linéaire en Python avec Scikit-
learn

4- Prédiction
y_pred = model.predict(X_test)

5- Évaluation du Modèle
mse = mean_squared_error(y_test, y_pred)

109 Machine Learning avec Python

M.SEKMA

Vous aimerez peut-être aussi

Rapport Regression
Pas encore d'évaluation
Rapport Regression
20 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
63 pages
Seance5 Régression Simple
Pas encore d'évaluation
Seance5 Régression Simple
27 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
90 pages
Régression Linéaire Simple en Python
Pas encore d'évaluation
Régression Linéaire Simple en Python
11 pages
Régression linéaire simple
Pas encore d'évaluation
Régression linéaire simple
10 pages
Chapitre. Régression Linéaire Simple - 19-20 - Part01
Pas encore d'évaluation
Chapitre. Régression Linéaire Simple - 19-20 - Part01
10 pages
Chapitre 4 Regression Generalities
Pas encore d'évaluation
Chapitre 4 Regression Generalities
9 pages
Lecture2-1 Regression Linéaire Simple
Pas encore d'évaluation
Lecture2-1 Regression Linéaire Simple
42 pages
2 Reg Lin
Pas encore d'évaluation
2 Reg Lin
37 pages
Régression Linéaire: Guide Pratique
Pas encore d'évaluation
Régression Linéaire: Guide Pratique
130 pages
Groupe2/4GM: Encadreurs: Date
Pas encore d'évaluation
Groupe2/4GM: Encadreurs: Date
36 pages
La Regression
Pas encore d'évaluation
La Regression
3 pages
Expose de La Regression Lineaire (Koro & Mahamadou) Groupe 1
Pas encore d'évaluation
Expose de La Regression Lineaire (Koro & Mahamadou) Groupe 1
18 pages
dmING Chap03 Regression
Pas encore d'évaluation
dmING Chap03 Regression
22 pages
Chap2 Regression
Pas encore d'évaluation
Chap2 Regression
78 pages
Résumé Du Cours de Machine Learning
Pas encore d'évaluation
Résumé Du Cours de Machine Learning
7 pages
Ch4-ML-Régression Linéaire
Pas encore d'évaluation
Ch4-ML-Régression Linéaire
44 pages
Regression Lineaire en Python Avec Scikit 1
Pas encore d'évaluation
Regression Lineaire en Python Avec Scikit 1
10 pages
01 RN Modele Lineaire
Pas encore d'évaluation
01 RN Modele Lineaire
37 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
4 pages
Ta - 22 10 2024
Pas encore d'évaluation
Ta - 22 10 2024
98 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
21 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
ML Regression Lineaire
Pas encore d'évaluation
ML Regression Lineaire
45 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
8 pages
Régression linéaire et moindres carrés
100% (1)
Régression linéaire et moindres carrés
9 pages
REGRESSION
Pas encore d'évaluation
REGRESSION
16 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
20 pages
Régression Linéaire : Concepts et Applications
Pas encore d'évaluation
Régression Linéaire : Concepts et Applications
11 pages
Modèle linéaire en actuariat 2022-2023
Pas encore d'évaluation
Modèle linéaire en actuariat 2022-2023
49 pages
ML Regression Lineaire - Version Finale
Pas encore d'évaluation
ML Regression Lineaire - Version Finale
45 pages
Lin Reg
Pas encore d'évaluation
Lin Reg
12 pages
Régression Linéaire et Incertitudes
Pas encore d'évaluation
Régression Linéaire et Incertitudes
4 pages
MachineLearning Merged
Pas encore d'évaluation
MachineLearning Merged
106 pages
Chap 3 Régression
100% (1)
Chap 3 Régression
17 pages
T4 Regression
Pas encore d'évaluation
T4 Regression
28 pages
Régression Linéaire
Pas encore d'évaluation
Régression Linéaire
18 pages
TP 2
Pas encore d'évaluation
TP 2
3 pages
Introduction à la régression linéaire
100% (3)
Introduction à la régression linéaire
42 pages
Régression Linéaire et Logistique expliquées
Pas encore d'évaluation
Régression Linéaire et Logistique expliquées
51 pages
Introduction Au Machine Learning Séance #1
Pas encore d'évaluation
Introduction Au Machine Learning Séance #1
34 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
TP 2 Proba Stats: 1 Jeux de Donn Ees
Pas encore d'évaluation
TP 2 Proba Stats: 1 Jeux de Donn Ees
4 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
39 pages
Big Data Et Analyse Prédictive
Pas encore d'évaluation
Big Data Et Analyse Prédictive
44 pages
Chapitre 2 - R├йgression Lin├йaire
100% (1)
Chapitre 2 - R├йgression Lin├йaire
38 pages
Machine Learning Regression Lineraire
Pas encore d'évaluation
Machine Learning Regression Lineraire
29 pages
RégressionLineaire VF
100% (1)
RégressionLineaire VF
32 pages
Chapitre 2 ML
Pas encore d'évaluation
Chapitre 2 ML
50 pages
Régression Linéaire avec R: Guide Complet
Pas encore d'évaluation
Régression Linéaire avec R: Guide Complet
27 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
21 pages
Modèle de Régression Linéaire en ML
Pas encore d'évaluation
Modèle de Régression Linéaire en ML
21 pages
Regression Lineaire Ols
Pas encore d'évaluation
Regression Lineaire Ols
63 pages
Ta 25 10 2022 - 042314
Pas encore d'évaluation
Ta 25 10 2022 - 042314
57 pages
Régression
Pas encore d'évaluation
Régression
36 pages
1 Importer Les Données 2 Preprocessing + Diviser Les Données 3 Machine Learning + Comparaison
Pas encore d'évaluation
1 Importer Les Données 2 Preprocessing + Diviser Les Données 3 Machine Learning + Comparaison
7 pages
Méthodes de Prévision Quantitatives
Pas encore d'évaluation
Méthodes de Prévision Quantitatives
64 pages
Chapitre 4 MLDS2022
Pas encore d'évaluation
Chapitre 4 MLDS2022
37 pages
TD Statistique
100% (1)
TD Statistique
3 pages
StatDesc Dim (2) Partie2 Allamy
Pas encore d'évaluation
StatDesc Dim (2) Partie2 Allamy
18 pages
Rapport Add
Pas encore d'évaluation
Rapport Add
22 pages
Durbin Watson
Pas encore d'évaluation
Durbin Watson
4 pages
Chapitre Ii Tests D - Hypotheses
Pas encore d'évaluation
Chapitre Ii Tests D - Hypotheses
27 pages
Rapport INFO232 Final
Pas encore d'évaluation
Rapport INFO232 Final
16 pages
Cours Acp
Pas encore d'évaluation
Cours Acp
10 pages
Evaluation Et Séléction Du Modèle 2
Pas encore d'évaluation
Evaluation Et Séléction Du Modèle 2
36 pages
Analyse de l'attente et épidémie
Pas encore d'évaluation
Analyse de l'attente et épidémie
2 pages
COURS ADD Ajustement Linéaire Et Corrélation PDF
Pas encore d'évaluation
COURS ADD Ajustement Linéaire Et Corrélation PDF
16 pages
MTS 445 : Modélisation Stochastique
Pas encore d'évaluation
MTS 445 : Modélisation Stochastique
75 pages
Maîtrise Statistique du Procédé
Pas encore d'évaluation
Maîtrise Statistique du Procédé
5 pages
Test du khi carré : Analyse de fréquences
Pas encore d'évaluation
Test du khi carré : Analyse de fréquences
24 pages
Chap2 Biostat L2-SA
Pas encore d'évaluation
Chap2 Biostat L2-SA
19 pages
Correction TP2 Simule Khadija Achir
Pas encore d'évaluation
Correction TP2 Simule Khadija Achir
4 pages
Régression Linéaire Multiple
Pas encore d'évaluation
Régression Linéaire Multiple
8 pages
Spear Man Test 1
Pas encore d'évaluation
Spear Man Test 1
22 pages
Estimation par intervalle de confiance
Pas encore d'évaluation
Estimation par intervalle de confiance
10 pages
TD 3 Avec Corrigé Final
Pas encore d'évaluation
TD 3 Avec Corrigé Final
6 pages
Serie Sampling French
Pas encore d'évaluation
Serie Sampling French
3 pages
Chapitre 3 Mesures de Dispersion
100% (2)
Chapitre 3 Mesures de Dispersion
11 pages
Chapitre 1 (Tests ANOVA À 1 Facteur
Pas encore d'évaluation
Chapitre 1 (Tests ANOVA À 1 Facteur
23 pages
Exercices de Bac1 - Unilu - 2023-2024
Pas encore d'évaluation
Exercices de Bac1 - Unilu - 2023-2024
25 pages
Moindres Carrés
Pas encore d'évaluation
Moindres Carrés
25 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
14 pages
Analyse Composantes Principales
Pas encore d'évaluation
Analyse Composantes Principales
9 pages
Introduction à l'échantillonnage
Pas encore d'évaluation
Introduction à l'échantillonnage
38 pages
Fiche de TD Pge 3
Pas encore d'évaluation
Fiche de TD Pge 3
15 pages
Série Statistiques
Pas encore d'évaluation
Série Statistiques
2 pages
Corrigé de Lexamen Proba Stat L2 GM
Pas encore d'évaluation
Corrigé de Lexamen Proba Stat L2 GM
5 pages