0% ont trouvé ce document utile (0 vote)

60 vues11 pages

Regression Lineaire Multiple

Le document présente la régression linéaire multiple comme une méthode de machine learning supervisé pour prédire une variable cible à partir de plusieurs variables explicatives. Il décrit les étapes de mise en place d'un modèle, les concepts fondamentaux de la régression, ainsi que des applications dans divers domaines tels que l'éducation et l'immobilier. Enfin, il aborde les métriques d'évaluation du modèle, notamment le RMSE et le coefficient de détermination R².

Transféré par

naryrandriantsoa53

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

60 vues11 pages

Regression Lineaire Multiple

Transféré par

naryrandriantsoa53

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Machine learning

Rakotoarimalala Tsinjo Tony

Cours 4: Régréssion linéaire multiple

Rakotoarimalala Tsinjo Tony Machine learning

Introduction : Machine Learning supervisé et Régression

Exemple : Prédire le score moyen d’un étudiant

Variable Valeur
Genre F
Niveau d’éducation des parents Bachelor’s degree
Cours de préparation Completed
Score moyen (cible) 81.33

Variables explicatives (features) : genre, niveau parental, cours de

préparation
Variable expliquée (target) : score moyen à prédire
La régression linéaire modélise la relation entre ces variables pour faire
des prédictions.
Objectif : prédire une valeur à partir d’exemples connus (apprentissage
supervisé)

Rakotoarimalala Tsinjo Tony Machine learning

Étapes de mise en place d’un modèle supervisé
Déroulement classique pour créer un modèle de machine learning
supervisé :

1 Compréhension du problème Déterminer ce que l’on veut prédire (ex. :

score moyen).
2 Exploration et nettoyage des données Supprimer les valeurs
manquantes, détecter les incohérences, repérer les outliers.
3 Encodage et transformation Convertir les variables catégorielles,
normaliser les variables numériques.
4 Séparation des variables Définir les variables explicatives (X) et la
variable cible (y).
5 Choix et entraînement du modèle Appliquer un algorithme (ex :
régression linéaire) aux données d’entraînement.
6 Évaluation du modèle Mesurer la qualité des prédictions (R2, MAE,
RMSE, etc.).
7 Interprétation et amélioration Analyser les résultats, ajuster les
paramètres, tester d’autres approches.

Rakotoarimalala Tsinjo Tony Machine learning

La régression recouvre plusieurs méthodes d’analyse
statistique permettant d’approcher une variable à partir
d’autres qui lui sont corrélées.
un modèle de régression linéaire est un modèle de régression
qui cherche à établir une relation linéaire entre une variable,
dite expliquée, et une ou plusieurs variables, dites explicatives.
la régression linéaire multiple est une méthode de
régression mathématique étendant la régression linéaire simple
pour décrire les variations d’une variable endogène (expliquée)
associée aux variations de plusieurs variables exogènes
(explicatives).

Rakotoarimalala Tsinjo Tony Machine learning

Exemple pour un cas simple avec une seule variable explicative

en abscisse la variable explicative (on n’a qu’une seule dans cet

exemple), et en ordonnée la variable expliqué
En bleu on a des nuages de points dans le plan
En rouge le modèle de régression linéaire

Rakotoarimalala Tsinjo Tony Machine learning

Contexte et cas d’usage
Pourquoi utiliser une régression linéaire multiple ?

Prédiction de variables quantitatives à partir de plusieurs facteurs

explicatifs.
Modèle interprétable, simple à mettre en œuvre, utilisé dans de nombreux
domaines.
Quelques cas d’application :

Immobilier : prédire le prix d’un logement en fonction de sa surface, son

quartier, le nombre de pièces, etc.
Éducation : expliquer les performances scolaires à partir du nombre
d’heures d’étude, du type d’école, du soutien parental.
Agriculture : estimer le rendement d’un champ selon la pluviométrie, le
type de sol, les engrais utilisés.
Santé : prédire les dépenses médicales en fonction de l’âge, du poids, du
statut fumeur, etc.
Ce type de modèle permet d’extraire des relations utiles pour la prise de
décision.
Rakotoarimalala Tsinjo Tony Machine learning
Idées principales de la régression linéaire multiple

Objectif : Modéliser la relation entre une variable cible y (quantitative) et

plusieurs variables explicatives x1 , x2 , . . . , xp .

Hypothèse fondamentale
La variable y est une combinaison linéaire des variables explicatives :

y = a0 + a1 x1 + a2 x2 + · · · + ap xp + ε

où ε est un bruit aléatoire (erreur).

Idées clés :
Estimer les coefficients (a0 , a1 , . . . , ap ) qui minimisent l’erreur quadratique
moyenne.
Le modèle peut être utilisé pour la prédiction ou l’interprétation des
relations entre variables.
Plus il y a de variables explicatives pertinentes, plus la prédiction peut
être précise — sous réserve d’éviter la colinéarité.

Rakotoarimalala Tsinjo Tony Machine learning

Estimateur de moindre carré

L’estimateur utilisé est donc un estimateur linéaire de la forme

yˆi = â0 + â1 xi,1 + · · · + âp xi,p , i = 1 · · · n

Les résidus estimés ϵ̂i ≡ yi − ŷi sont la différence entre la

valeur de y observée et estimée
L’objectif est de choisir les âi qui minimise la somme des
carrées des résidus
n
X n
X
(â0 , ., âp ) = argmin ϵ̂2i = argmin (yi −â0 −â1 xi,1 −· · ·−âp xi,p )2
i=1 â0 ,.,âp i=1

Les ϵ̂i peuvent être interpréter par la distance de la valeur

réelle et la valeur donnée par le modèle

Rakotoarimalala Tsinjo Tony Machine learning

Estimateur de moindre carré
Pn 2
Minimiser
P S= i=1 ϵ̂i revient à chercher des solutions de
∂( ϵ̂2i )
∂âj = 0 pour j allant de 0 à p
On a pour tout j = 0, · · · , p:
P 2 n
∂( ϵ̂i ) X
=0⇔ xi,j (yi − â0 − â1 xi,1 − · · · − âp xi,p ) = 0
∂âj i=1

Sous forme matricielle

 
 1 1 ··· 1
 ! ! â0  0
 ŷ1 1 x1,1 ··· x1,p 0
x1,1 x2,1 ··· xn,1 â1

 ... −
 . . . .  .  =  .. 

 . . . . . . . .
. . . . . . . . .
. . . .  .  .
 ŷn 1 xn,1 ··· xn,p 0
x1,p x1,p ··· xn,p âp 
| {z } | {z } | {z } | {z }
Y X A
XT
ou encore
X T Y − X Â = 0

Rakotoarimalala Tsinjo Tony Machine learning

Estimateur de moindre carré

Donc il nous suffit de résoudre l’équation suivante sur A

X T Y − X Â = 0

C’est-à-dire
−1
X T Y = X T XA ⇔ A = X T X XTY

Cette dernière suppose que X T X est inversible c’est-à-dire X de

rang p + 1 (pas de colinéarité entre les colonnes (les variables)
de X ). Dans la pratique on supprime tout simplement les colonnes
colinéaires.

Rakotoarimalala Tsinjo Tony Machine learning

Comparer les métriques : RMSE et R 2

RMSE – Root Mean Squared R 2 – Coefficient de détermina-

Error : tion :
Erreur quadratique moyenne qui Proportion de la variance ex-
mesure la dispersion entre les pliquée par le modèle. Variante
valeurs réelles et les prédictions. normalisée de l’erreur quadra-
v tique.
u n
u1 X
(yi − ŷi )2
P
RMSE = t (yi − ŷi )2 R2 = 1 − P
n (yi − ȳ )2
i=1

→ Plus le RMSE est faible, → Plus R 2 est proche de 1,

plus le modèle est précis. meilleure est l’explication.

Rakotoarimalala Tsinjo Tony Machine learning

Vous aimerez peut-être aussi

Chap 3 Regression Multiple
Pas encore d'évaluation
Chap 3 Regression Multiple
38 pages
Econométrie Régression Linéaire Multiple 1
Pas encore d'évaluation
Econométrie Régression Linéaire Multiple 1
19 pages
CM07 RegressionLineaireMultiple
Pas encore d'évaluation
CM07 RegressionLineaireMultiple
26 pages
Modèle de Régression Linéaire
Pas encore d'évaluation
Modèle de Régression Linéaire
34 pages
Régression Linéaire Multiple
Pas encore d'évaluation
Régression Linéaire Multiple
10 pages
Multiples
Pas encore d'évaluation
Multiples
20 pages
Régression Linéaire et Moindres Carrés
Pas encore d'évaluation
Régression Linéaire et Moindres Carrés
53 pages
Modèle de régression linéaire simple
100% (1)
Modèle de régression linéaire simple
69 pages
Régression Linéaire Multiple Simplifiée
Pas encore d'évaluation
Régression Linéaire Multiple Simplifiée
40 pages
Régression Multiple - Partie 1 Et 2
Pas encore d'évaluation
Régression Multiple - Partie 1 Et 2
36 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
9 pages
Modelisation Statistique ENSGMM
Pas encore d'évaluation
Modelisation Statistique ENSGMM
27 pages
Régression multiple : Modèles et Estimations
Pas encore d'évaluation
Régression multiple : Modèles et Estimations
42 pages
Guide sur la régression linéaire
Pas encore d'évaluation
Guide sur la régression linéaire
18 pages
EML ISE2 Chap3
Pas encore d'évaluation
EML ISE2 Chap3
9 pages
QM - Leçon 6-vbb
Pas encore d'évaluation
QM - Leçon 6-vbb
16 pages
Statistique Chap2
Pas encore d'évaluation
Statistique Chap2
36 pages
EMCO Cours
Pas encore d'évaluation
EMCO Cours
67 pages
Estimateur des Moindres Carrés Ordinaires
Pas encore d'évaluation
Estimateur des Moindres Carrés Ordinaires
64 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
17 pages
Régression Linéaire Simple Et Multiple
Pas encore d'évaluation
Régression Linéaire Simple Et Multiple
13 pages
Modèle de régression linéaire multiple
Pas encore d'évaluation
Modèle de régression linéaire multiple
8 pages
Régression Linéaire : Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire : Concepts et Estimations
28 pages
Introduction à la régression linéaire multiple
Pas encore d'évaluation
Introduction à la régression linéaire multiple
20 pages
Modèle de Régression Linéaire en ML
Pas encore d'évaluation
Modèle de Régression Linéaire en ML
21 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
21 pages
Introduction à la régression multiple
100% (2)
Introduction à la régression multiple
60 pages
ML Motivation Reg Et RegLogit French
Pas encore d'évaluation
ML Motivation Reg Et RegLogit French
38 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
39 pages
Econometrie - Chap. 2 Et 3
Pas encore d'évaluation
Econometrie - Chap. 2 Et 3
61 pages
Projet - Régression Linéaire Multiple (MKDiallo - OHaidara - MBKa)
Pas encore d'évaluation
Projet - Régression Linéaire Multiple (MKDiallo - OHaidara - MBKa)
15 pages
Chapitre 2 Régression Linéaire
Pas encore d'évaluation
Chapitre 2 Régression Linéaire
15 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
6 pages
Analyse de la régression linéaire
Pas encore d'évaluation
Analyse de la régression linéaire
31 pages
Modèle de régression linéaire multiple
Pas encore d'évaluation
Modèle de régression linéaire multiple
26 pages
Prévisions Quantitatives : Régression et Moyennes
Pas encore d'évaluation
Prévisions Quantitatives : Régression et Moyennes
64 pages
Modèle linéaire en actuariat 2022-2023
Pas encore d'évaluation
Modèle linéaire en actuariat 2022-2023
49 pages
REGRESSION
Pas encore d'évaluation
REGRESSION
16 pages
Modelisation
Pas encore d'évaluation
Modelisation
24 pages
Introduction à la régression linéaire multiple
Pas encore d'évaluation
Introduction à la régression linéaire multiple
12 pages
Regression Multiple
Pas encore d'évaluation
Regression Multiple
19 pages
Regression Multiple
Pas encore d'évaluation
Regression Multiple
19 pages
Introduction à la régression linéaire simple
Pas encore d'évaluation
Introduction à la régression linéaire simple
34 pages
Régression linéaire et moindres carrés
Pas encore d'évaluation
Régression linéaire et moindres carrés
36 pages
Cours de Régression Linéaire - Rennes 2
100% (1)
Cours de Régression Linéaire - Rennes 2
86 pages
Ch3 PDF
Pas encore d'évaluation
Ch3 PDF
45 pages
Régression Linéaire Multiple en Statistiques
Pas encore d'évaluation
Régression Linéaire Multiple en Statistiques
23 pages
Chapitre. Régression Linéaire Simple - 19-20 - Part01
Pas encore d'évaluation
Chapitre. Régression Linéaire Simple - 19-20 - Part01
10 pages
Régression linéaire simple
Pas encore d'évaluation
Régression linéaire simple
10 pages
2 - Apprentissage Supervisé
Pas encore d'évaluation
2 - Apprentissage Supervisé
10 pages
Introduction à la régression linéaire
100% (3)
Introduction à la régression linéaire
42 pages
5 Regression Lineaire
Pas encore d'évaluation
5 Regression Lineaire
8 pages
Ajustement Linéaire par Moindres Carrés
Pas encore d'évaluation
Ajustement Linéaire par Moindres Carrés
5 pages
Chap2 Regression
Pas encore d'évaluation
Chap2 Regression
78 pages
Chapitre 7-2 Analyse Des Donnees New-Finale 2025
Pas encore d'évaluation
Chapitre 7-2 Analyse Des Donnees New-Finale 2025
77 pages
Prévisions Quantitatives et Régression
100% (6)
Prévisions Quantitatives et Régression
25 pages
Économétrie Financière : Régression Linéaire
Pas encore d'évaluation
Économétrie Financière : Régression Linéaire
121 pages
Cours m1 Econometrie Appliquee Slide34
100% (2)
Cours m1 Econometrie Appliquee Slide34
60 pages
Lexique DELF A2 : Vocabulaire essentiel
100% (2)
Lexique DELF A2 : Vocabulaire essentiel
4 pages
Complement Dvii
Pas encore d'évaluation
Complement Dvii
13 pages
Curricula Du Collège-02 Français
Pas encore d'évaluation
Curricula Du Collège-02 Français
21 pages
MEP - Focus 8 HS - Uk
Pas encore d'évaluation
MEP - Focus 8 HS - Uk
5 pages
Chapitre 1 Chimie Des Solutions SII
Pas encore d'évaluation
Chapitre 1 Chimie Des Solutions SII
4 pages
Support CV Et Lettre de Motivation
Pas encore d'évaluation
Support CV Et Lettre de Motivation
31 pages
Controle Aux Champs 2022
Pas encore d'évaluation
Controle Aux Champs 2022
2 pages
Éducation en Afrique selon Ki-Zerbo
Pas encore d'évaluation
Éducation en Afrique selon Ki-Zerbo
2 pages
Controle Des Infections Edition 2009
Pas encore d'évaluation
Controle Des Infections Edition 2009
79 pages
Sujet - Exam.ac L3!24!25 Corrige
Pas encore d'évaluation
Sujet - Exam.ac L3!24!25 Corrige
9 pages
Rea Jet Up
Pas encore d'évaluation
Rea Jet Up
6 pages
Quiz 1011: Reproduction Asexuée Vs Reproduction Sexuée
Pas encore d'évaluation
Quiz 1011: Reproduction Asexuée Vs Reproduction Sexuée
2 pages
Animaux d'eau douce : diversité et espèces
Pas encore d'évaluation
Animaux d'eau douce : diversité et espèces
8 pages
Test d'évaluation sur le street art
100% (1)
Test d'évaluation sur le street art
5 pages
Tests projectifs et créativité en recherche
Pas encore d'évaluation
Tests projectifs et créativité en recherche
3 pages
Compression des données en téléphonie
Pas encore d'évaluation
Compression des données en téléphonie
33 pages
These ABDERAHIM Awat Atteib
Pas encore d'évaluation
These ABDERAHIM Awat Atteib
159 pages
Structure et fonctions des lysosomes
Pas encore d'évaluation
Structure et fonctions des lysosomes
19 pages
Forme Et Matière
Pas encore d'évaluation
Forme Et Matière
304 pages
Réseaux Téléphoniques et Radio Locaux
Pas encore d'évaluation
Réseaux Téléphoniques et Radio Locaux
25 pages
Exigences légales du Code du travail
Pas encore d'évaluation
Exigences légales du Code du travail
197 pages
Triggers et PL/SQL avancés
Pas encore d'évaluation
Triggers et PL/SQL avancés
30 pages
Deuxième Plan Décennal de l'UA 2024-2033
Pas encore d'évaluation
Deuxième Plan Décennal de l'UA 2024-2033
88 pages
8a. Les Fetes de L'islam
Pas encore d'évaluation
8a. Les Fetes de L'islam
18 pages
Dernier
Pas encore d'évaluation
Dernier
4 pages
710-0058-03-00 Rev 4D Omi HL 40-1800 Ekt Eng-Deu-Fra
Pas encore d'évaluation
710-0058-03-00 Rev 4D Omi HL 40-1800 Ekt Eng-Deu-Fra
34 pages
Liste des candidats admis concours 2024
Pas encore d'évaluation
Liste des candidats admis concours 2024
18 pages
Jeanne d'Arc : Héroïne de France
Pas encore d'évaluation
Jeanne d'Arc : Héroïne de France
7 pages
Lhomme T Rafique
Pas encore d'évaluation
Lhomme T Rafique
224 pages
Instructions Rouleaux Ammann
Pas encore d'évaluation
Instructions Rouleaux Ammann
145 pages