0% ont trouvé ce document utile (0 vote)

43 vues4 pages

TP5 Methodes Inductives - RL

Ce document présente une analyse de données utilisant la régression linéaire multiple pour établir une relation entre des variables quantitatives et une variable qualitative. Il décrit la méthodologie d'estimation des paramètres du modèle, l'application sur un jeu de données concernant les maladies cardiaques, ainsi que le calcul du coefficient de détermination et le test de significativité du modèle. Les résultats montrent une bonne adéquation du modèle avec les données, indiquant une dépendance linéaire entre les variables.

Transféré par

oubaida.kherfane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

43 vues4 pages

TP5 Methodes Inductives - RL

Transféré par

oubaida.kherfane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Institut National des Télécommunications et des Technologies de l'Information et

de la Communication INT-TIC d'Oran Algérie

Analyse de Données
3ème année ingénieur

Fiche de TP N° 5

Méthodes Inductives

Régression Linéaire Multiple

Nous avons vu que l’analyse linéaire discriminante permet, sur la base d’un ensemble de
variables quantitatives, de discriminer au mieux entre les individus appartenant à différentes
classes (modalités différentes de la variable qualitative). Ainsi, il est possible de déterminer (de
prédire) la classe d’un nouvel individu à partir des valeurs des variables quantitatives. Ceci
peut être vu comme sorte de une mise en relation entre l’ensemble des variables quantitatives
d’une part, et la variable qualitative d’autre part.

La régression linéaire multiple permet, quant à elle, de mettre en relation un ensemble (d’où
le mot « multiple ») de variables quantitatives d’une part, et une variable quantitative d’autre
part. Cette dernière est appelée variable expliquée ; les autres variables quantitatives étant
appelées variables explicatives.

La relation entre les variables explicatives et la variable expliquée est donnée par la relation
linéaire suivante :
𝑌 = 𝑋𝛽 + 𝜖

𝑦1 1 𝑥11 … 𝑥1𝑝 𝛽0 𝜀1
𝑦2 1 𝑥21 … 𝑥2𝑝 𝛽 𝜀2
𝑌= ( ) 𝑋= ( ⋱ ) 𝛽 = ( 1) 𝜖= ( )
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑦𝑛 1 𝑥𝑛1 … 𝑥𝑛𝑝 𝛽𝑝 𝜀𝑛

Où :
 𝑦𝑖 : la valeur de la variable expliquée pour l’individu 𝑖.
 𝑥𝑖𝑗 : la valeur de la variable explicative 𝑗 pour l’individu 𝑖.
 𝛽 : vecteur des paramètres du modèle (à estimer).
 𝜖 : erreur générée par le modèle (par la régression).

𝑛 et 𝑝 sont respectivement le nombre d’individus et le nombre de variables explicatives.

Il s’agit donc d’estimer les paramètres 𝛽𝑗 qui minimisent l’erreur de la régression (erreur des
moindres carrés). Sous certaines conditions (𝑛 > 𝑝 + 1 et 𝑟𝑎𝑛𝑔(𝑋) = 𝑝 + 1), l’estimation de 𝛽
est donnée par la formule suivante :

𝛽̂ = (𝑋 𝑇 𝑋)−1 𝑋 𝑇 𝑌

1
Nous allons appliquer ce modèle sur un jeu de données contenant des informations sur les
pourcentages de personnes atteintes de maladies cardiaques dans différentes régions. Le
fichier de données [Link] contient les 3 variables quantitatives suivantes, pour un
échantillon de 498 individus (498 régions) :

biking Pourcentage de personnes qui utilisent le vélo pour aller au travail

smoking Pourcentage de personnes qui fument
[Link] Pourcentage de personnes atteintes de maladies cardiaques

Dans ce cas de figure, nous recherchons à mettre en relation les variables biking et smoking
(les variables explicatives) d’une part, et la variable [Link] (la variable expliquée)
d’autre part.

Les modules utilisés sont les mêmes utilisés dans les TPs précédents : numpy, pandas et
matplotlib.

>>> import numpy as np

>>> import pandas as pd
>>> import [Link] as plt
>>> import os

Importation et préparation des données

>>> [Link]('C:\\...\\...\\DataExamples')
>>> data = pd.read_csv('[Link]', sep=',')

>>> [Link]()
Unnamed: 0 biking smoking [Link]
0 1 30.801246 10.896608 11.769423
1 2 65.129215 2.219563 2.854081
2 3 1.959665 17.588331 17.177803
3 4 44.800196 2.802559 6.816647
4 5 69.428454 15.974505 4.062224

>>> Y = [Link](data['[Link]']) # Extraction de la variable expliquée

# Extraction des variables explicatives

>>> X = [Link]([data['biking'],data['smoking']]).T
>>> X[:5,:]
array([[30.80124571, 10.89660802],
[65.12921517, 2.21956318],
[ 1.95966453, 17.58833051],
[44.80019562, 2.80255888],
[69.42845368, 15.9745046 ]]

>>> n = [Link][0] # Nombre d’individus

>>> n
498
>>> p = [Link][1] # Nombre de variables (explicatives)
>>> p
2

>>> X = [Link](X, 0, [Link](n), axis=1) # Ajout du vecteur colonnes (contenant

>>> X[:5,:] # des 1 partout) à la 1ère position
array([[ 1. , 30.80124571, 10.89660802],
[ 1. , 65.12921517, 2.21956318],
[ 1. , 1.95966453, 17.58833051],
[ 1. , 44.80019562, 2.80255888],
[ 1. , 69.42845368, 15.9745046 ]])

2
Calcul des paramètres du modèle (vecteur 𝜷) et utilisation

Après avoir préparé le vecteur 𝑌 et la matrice 𝑋, il est à présent possible de calculer

l’estimation du vecteur 𝛽. Mais il faut s’assurer avant que la matrice 𝑋 𝑇 𝑋 est inversible
(déterminant différent de 0), et que les deux variables explicatives ne représentent pas la
même information (en d’autres termes, que le rang de la matrice est égal à p=2) :

>>> [Link].matrix_rank(X[:,1:]) # Le rang de la matrice des variables

2 # explicatives est bien égal à p=2

>>> [Link]([Link](X)) # Le déterminant est bien différent de 0

3900114699799.9175

Nous calculons l’estimation du vecteur 𝛽 :

>>> beta = [Link]([Link](X)).dot(X.T).dot(Y)

>>> beta
array([14.98465799, -0.20013305, 0.17833391])

Autrement dit :

[Link] = 14.985 – 0.2 * biking + 0.178 * smoking

𝑌̂ le vecteur estimé (ou l’approximation par la régression) de 𝑌 se calcule ainsi :

𝑌̂ = 𝑋𝛽̂

>>> Ye = [Link](beta) # Ye est le vecteur estimé de Y

Supposons que nous voulions estimer le pourcentage de personnes atteintes de maladies

cardiaques d’une nouvelle région dont on connaît seulement le pourcentage de personnes qui
fument (25% par exemple) et le pourcentage de personnes utilisant le vélo pour aller au travail
(2% par exemple). L’estimation se fait comme suit :

>>> [Link]([1, 2, 25], beta)

19.042739729263246

Le pourcentage de personnes atteintes de maladies cardiaques de cette région serait donc de

19.04%.

Coefficient de détermination

Le coefficient de détermination permet de mesurer la qualité d’ajustement du modèle (la

régression) aux données initiales. Il se repose sur le calcul des statistiques suivantes :

𝑆𝐶𝑇 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 Somme des Carrés Totaux

Traduit la variabilité totale.

𝑆𝐶𝐸 = ∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2 Somme des Carrés Expliqués

Traduit la variabilité expliquée par le modèle.

𝑆𝐶𝑅 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 Sommes des Carrés Résiduels

Traduit la variabilité non expliqué par le modèle

3
Le coefficient de détermination 𝑅 2 est donné par :

𝑆𝐶𝐸
𝑅2 =
𝑆𝐶𝑇

Nous avons un coefficient proche de 1 (donc SCE et proche de SCT), ce qui veut dire la
variabilité expliquée par la régression (le modèle) est proche de la variabilité totale. On en
déduit que la régression s’ajuste bien aux données initiales.

Test de significativité du modèle

L’étude de la régression linéaire est souvent complétée par le test d’hypothèse suivant :

- H0 : 𝛽1 = ⋯ = 𝛽𝑝 = 0 (indépendance linéaire entre Y et X)

- H1 : ∃𝑗 / 𝛽 ≠ 0

La statistique 𝐹 suivante suit une loi de Fisher à (𝑝, 𝑛 − 𝑝 − 1) degrés de liberté:

𝑆𝐶𝐸⁄
𝑝
𝐹=
𝑆𝐶𝑅⁄
(𝑛 − 𝑝 − 1)

R. HACHEMI

Vous aimerez peut-être aussi

Corrigé TD Statistique M1-GEO Rennes 2
Pas encore d'évaluation
Corrigé TD Statistique M1-GEO Rennes 2
21 pages
Cours Logiciel R
Pas encore d'évaluation
Cours Logiciel R
42 pages
Introduction à l'économétrie et variance
Pas encore d'évaluation
Introduction à l'économétrie et variance
19 pages
Partie 2-1 Régression Linéaire Simple
Pas encore d'évaluation
Partie 2-1 Régression Linéaire Simple
25 pages
Introduction à la régression multiple
Pas encore d'évaluation
Introduction à la régression multiple
83 pages
Modèle de régression linéaire expliqué
Pas encore d'évaluation
Modèle de régression linéaire expliqué
2 pages
Support Master 2
Pas encore d'évaluation
Support Master 2
38 pages
Outilsdiag
Pas encore d'évaluation
Outilsdiag
29 pages
Exercices de régression linéaire multiple
Pas encore d'évaluation
Exercices de régression linéaire multiple
15 pages
Régression Linéaire : Concepts et Méthodes
Pas encore d'évaluation
Régression Linéaire : Concepts et Méthodes
13 pages
Corrigé d'Économétrie Avancé
Pas encore d'évaluation
Corrigé d'Économétrie Avancé
15 pages
Statistique Bivariée
Pas encore d'évaluation
Statistique Bivariée
9 pages
Introduction à l'économétrie et régression
100% (1)
Introduction à l'économétrie et régression
39 pages
Régression Non-Paramétrique avec locfit
Pas encore d'évaluation
Régression Non-Paramétrique avec locfit
5 pages
Modèles Linéaires et Moindres Carrés
Pas encore d'évaluation
Modèles Linéaires et Moindres Carrés
20 pages
Techniques Prédictives en Data Mining
Pas encore d'évaluation
Techniques Prédictives en Data Mining
151 pages
Modèle linéaire en actuariat 2022-2023
Pas encore d'évaluation
Modèle linéaire en actuariat 2022-2023
49 pages
Modélisation Linéaire et ANOVA
Pas encore d'évaluation
Modélisation Linéaire et ANOVA
46 pages
Correction Examen S5 2021
Pas encore d'évaluation
Correction Examen S5 2021
3 pages
Devoir À Rendre À M. C Grave
Pas encore d'évaluation
Devoir À Rendre À M. C Grave
5 pages
Plaquette TD 2023 24
Pas encore d'évaluation
Plaquette TD 2023 24
14 pages
Régression Linéaire Simple: Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire Simple: Concepts et Estimations
7 pages
Regression Linéaire Simple PDF
Pas encore d'évaluation
Regression Linéaire Simple PDF
7 pages
Cours Reg
Pas encore d'évaluation
Cours Reg
34 pages
Econometrie Partiel Mai 2023
Pas encore d'évaluation
Econometrie Partiel Mai 2023
11 pages
Analyse de régression et tests statistiques
Pas encore d'évaluation
Analyse de régression et tests statistiques
5 pages
Cours m1 Econometrie Appliquee Slide34
100% (2)
Cours m1 Econometrie Appliquee Slide34
60 pages
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
Pas encore d'évaluation
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
26 pages
Tableau de Regression - Statisitques
Pas encore d'évaluation
Tableau de Regression - Statisitques
3 pages
Modèle de régression multiple en économétrie
Pas encore d'évaluation
Modèle de régression multiple en économétrie
98 pages
Modèle Linéaire en Économétrie
Pas encore d'évaluation
Modèle Linéaire en Économétrie
118 pages
Cours de Statistique Et Econometrie
Pas encore d'évaluation
Cours de Statistique Et Econometrie
118 pages
Introduction à la régression multiple
100% (2)
Introduction à la régression multiple
60 pages
7.cours Regression
Pas encore d'évaluation
7.cours Regression
8 pages
Introduction à la régression linéaire simple
Pas encore d'évaluation
Introduction à la régression linéaire simple
37 pages
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
100% (1)
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
4 pages
Ta 25 10 2022 - 042314
Pas encore d'évaluation
Ta 25 10 2022 - 042314
57 pages
2022 Regression
Pas encore d'évaluation
2022 Regression
4 pages
Modèle de régression linéaire simple
Pas encore d'évaluation
Modèle de régression linéaire simple
11 pages
Analyse des données socio-économiques
Pas encore d'évaluation
Analyse des données socio-économiques
10 pages
CHAPITRE 2 Régression Linéaire Simple Et Multiple
Pas encore d'évaluation
CHAPITRE 2 Régression Linéaire Simple Et Multiple
45 pages
Regression HD
Pas encore d'évaluation
Regression HD
64 pages
Tests de validation et prévisions en régression
Pas encore d'évaluation
Tests de validation et prévisions en régression
21 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
3 pages
Analyse de Régression Multiple et ANOVA
Pas encore d'évaluation
Analyse de Régression Multiple et ANOVA
11 pages
Variance corrigée en économétrie
Pas encore d'évaluation
Variance corrigée en économétrie
7 pages
Modèles Linéaires et Analyse CPU
Pas encore d'évaluation
Modèles Linéaires et Analyse CPU
7 pages
Régression Linéaire Simple et Modèles Statistiques
100% (1)
Régression Linéaire Simple et Modèles Statistiques
51 pages
ST M Modlin Regmult
Pas encore d'évaluation
ST M Modlin Regmult
13 pages
Regression Lineaire Ols
Pas encore d'évaluation
Regression Lineaire Ols
63 pages
Analyse Discrim
Pas encore d'évaluation
Analyse Discrim
13 pages
TP Régression Linéaire : Simulation et Analyse
Pas encore d'évaluation
TP Régression Linéaire : Simulation et Analyse
2 pages
Question de Cours en Analyse Des Donnees S5
Pas encore d'évaluation
Question de Cours en Analyse Des Donnees S5
5 pages
Régression Linéaire : Modèles et Tests
Pas encore d'évaluation
Régression Linéaire : Modèles et Tests
6 pages
Régression linéaire et moindres carrés
100% (1)
Régression linéaire et moindres carrés
9 pages
Introduction à l'économétrie et modèles
Pas encore d'évaluation
Introduction à l'économétrie et modèles
8 pages
Modèle de régression multiple expliqué
Pas encore d'évaluation
Modèle de régression multiple expliqué
17 pages
Estimation et Tests en Régression Eviews
Pas encore d'évaluation
Estimation et Tests en Régression Eviews
4 pages
Leçon 5PF2
Pas encore d'évaluation
Leçon 5PF2
10 pages
S6 Ox-Réd 1BAC Int
Pas encore d'évaluation
S6 Ox-Réd 1BAC Int
6 pages
Audit Des SMQ Et SME ISO 19011
Pas encore d'évaluation
Audit Des SMQ Et SME ISO 19011
97 pages
Transformée de Laplace et Signaux S2
Pas encore d'évaluation
Transformée de Laplace et Signaux S2
3 pages
Soprafeutre Ballast
Pas encore d'évaluation
Soprafeutre Ballast
2 pages
SOCAD313 5 Module 2
Pas encore d'évaluation
SOCAD313 5 Module 2
44 pages
TFC Final 24 Novembre 2022 Sans Images - 075436
100% (2)
TFC Final 24 Novembre 2022 Sans Images - 075436
50 pages
Spells Druide D&D 5e
Pas encore d'évaluation
Spells Druide D&D 5e
20 pages
Étude Pylône Monotube Bordeaux 35m
Pas encore d'évaluation
Étude Pylône Monotube Bordeaux 35m
13 pages
2154 Temps Ecran Habitudes Vie
Pas encore d'évaluation
2154 Temps Ecran Habitudes Vie
8 pages
Convocation Au Contrôle Final: Important
Pas encore d'évaluation
Convocation Au Contrôle Final: Important
1 page
Sujet S - T - A Techno002 (2019)
Pas encore d'évaluation
Sujet S - T - A Techno002 (2019)
8 pages
Théories Modernes de La Gestion
Pas encore d'évaluation
Théories Modernes de La Gestion
1 page
Cours Maintenance Et Sécurité Industrille
0% (1)
Cours Maintenance Et Sécurité Industrille
30 pages
Indices d'appartenance sociale en langage
Pas encore d'évaluation
Indices d'appartenance sociale en langage
1 page
Spectrophotométrie UV
100% (6)
Spectrophotométrie UV
5 pages
Introduction à l'archéologie et ses méthodes
Pas encore d'évaluation
Introduction à l'archéologie et ses méthodes
36 pages
Charte de Kurukan Fuga : Pensée politique africaine
Pas encore d'évaluation
Charte de Kurukan Fuga : Pensée politique africaine
20 pages
Activités 7 Masse Et Taille Dun Atome
Pas encore d'évaluation
Activités 7 Masse Et Taille Dun Atome
5 pages
Exam Micro 2018 2019
Pas encore d'évaluation
Exam Micro 2018 2019
2 pages
Chapitre 6
Pas encore d'évaluation
Chapitre 6
20 pages
Le Deuil Prenatal Chez Des Meres Migrantes
Pas encore d'évaluation
Le Deuil Prenatal Chez Des Meres Migrantes
6 pages
Myismail Net Classes Prepas Mpsi New TMPL Component Print 1 Page
Pas encore d'évaluation
Myismail Net Classes Prepas Mpsi New TMPL Component Print 1 Page
2 pages
Correction de La Série 2 - Les Normes de L'audit Comptable Et Financier - 093156
Pas encore d'évaluation
Correction de La Série 2 - Les Normes de L'audit Comptable Et Financier - 093156
2 pages
Synthèse sur le transport routier
Pas encore d'évaluation
Synthèse sur le transport routier
12 pages
Déterminisation
Pas encore d'évaluation
Déterminisation
22 pages
Sénégal : Engagements Climat 2020
100% (1)
Sénégal : Engagements Climat 2020
67 pages
Le Journal Des Maîtres & Disciples - Hors-Série N°2 (Mai 2011) - L'Illusion Astrale Et Mentale
100% (2)
Le Journal Des Maîtres & Disciples - Hors-Série N°2 (Mai 2011) - L'Illusion Astrale Et Mentale
47 pages
Le Monde Sensoriel Du Cheval
Pas encore d'évaluation
Le Monde Sensoriel Du Cheval
8 pages
Effort Tranchant
Pas encore d'évaluation
Effort Tranchant
6 pages