0% ont trouvé ce document utile (0 vote)

38 vues4 pages

TP 2 Proba Stats: 1 Jeux de Donn Ees

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

38 vues4 pages

TP 2 Proba Stats: 1 Jeux de Donn Ees

Transféré par

Mary Norssine

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP 2 Proba Stats

Novembre 2024

Le but de ce TP est d’explorer les méthodes de régression linéaire.

1 Jeux de Données
Étudions l’ajustement affine, méthode qui consiste à rechercher la droite permettant
d’expliquer le comportement d’une variable statistique y comme étant une fonction affine
d’une autre variable statistique x. Dans ce TP, nous allons considérer les deux ensembles
de jeux de données suivants.

Données 1: Nuage de Points Aléatoires

Fonction utile: [Link]()

Nous souhaitons étudier la relation entre deux variables x et y, où y est défini par une
relation linéaire donnée :

y = α · x + β + ,
où :

• x ∈ [0, 1] est généré aléatoirement,

• α, β ∈ R sont des coefficients fixes (α = 1 et β = 0.3),

• ∈ [0, 0.1] représente un bruit aléatoire ajouté à y.

Objectif: Générer 1000 points aléatoires (x, y), puis estimer les coefficients α et β à
partir des données simulées.

Données 2: Vente de Glaces

Nous souhaitons comprendre la relation entre la quantité de glaces vendues et la température
de midi sur un jour donné. Voici des données prélevées sur 12 jours (tableau 1).
Objectif: Trouver une relation linéaire entre la température t et les ventes de glaces
v. Par exemple, a, b ∈ R, tel que v = f (t) = at + b.

1
Température (°C) Ventes de glaces (€)
14.2 215
16.4 325
11.9 185
15.2 332
18.5 406
22.1 522
19.4 412
25.1 614
23.4 544
18.1 421
22.6 445
17.2 408

Table 1: Données des températures et des ventes de glaces.

2 Méthodes
2.1 Moindres carrés
Soit deux variables aléatoires, une variable à expliquer Y et une variable explicative
X. On dispose de n réalisations de ces variables. Soit le modèle de régression linéaire
yi = axi + b + i . i est le terme d’erreur. On recherche a et b, estimateurs des moindres
carrés ordinaires, les valeurs minimisant l’erreur totale :
n
X n
X
min S(a, b) = 2i = (yi − axi − b)2 .
a,b
i=1 i=1

Les estimateurs sont : P P P

n i x i y i − i xi i yi
â = P 2
P 2
,
n i xi − ( i xi )
P P
i yi xi
b̂ = − â i .
n n
Avec avoir calulé ces paramètres avec les données (training), on peut prédire :

ŷ = f (x) = âx + b̂.

2.2 Méthode d’optimisation

Pour un modèle décrit, on peut trouver ses paramètres comme des estimateurs à l’aide
de méthodes d’optimisation. La fonction coût équivalente à celle des moindres carrés est
donnée par :
n n
1 X 2 1 X
min J(a, b) = i = (axi + b − yi )2 .
a,b 2n i=1 2n i=1
Comme J est une fonction convexe, pour obtenir a et b, il suffit de résoudre l’équation
∇J = 0. Le gradient ∇J est donné par :
n
∂J 1X
= xi (axi + b − yi ),
∂a n i=1

2
n
∂J 1X
= (axi + b − yi ).
∂b n i=1
La méthode du gradient est une méthode itérative. Partant d’un point de départ, par
exemple a0 = b0 = 0, à chaque itération k > 0 on a

∂J(·, ak−1 )
ak = ak−1 − γ , (8)
∂ak−1
Idem pour bk .
γ est le taux d’apprentissage (learning rate). Le choix de la valeur de γ est crucial : elle
peut être constante ou ajustée dynamiquement au cours de l’exécution. Une valeur trop
grande pourrait faire diverger l’algorithme, tandis qu’une valeur trop petite ralentirait sa
convergence. Ici, nous choisirons de garder γ constant, dont la valeur appropriée est à
déterminer.
L’algorithme s’arrête lorsque |J(ak , bk ) − J(ak−1 , bk−1 )| < e−3 .

2.3 Bibliothèque Sklearn

Nous pouvons également utiliser la fonction LinearRegression() définie dans la bib-
liothèque sklearn.
from [Link] model import LinearRegression

3 Qualité des prédictions

3.1 RMSE
Le Root-Mean-Square Error (RMSE) est la racine de l’erreur quadratique moyenne entre
les valeurs observées Y et les valeurs estimées Ŷ :
r Pn
2
i=1 (ŷi − yi )
RMSE = .
n

3.2 Coefficient de détermination

Le coefficient de détermination (R2 ) mesure la qualité de l’ajustement d’un modèle de
régression. Il représente la proportion de la variance des données observées Y qui est
expliquée par le modèle. Sa valeur est comprise entre 0 (aucune variance expliquée) et 1
(ajustement parfait).
Pour calculer R2 , on utilise la formule suivante :
Pn 2
2 i=1 (ŷi − ȳ)
R = Pn 2
i=1 (yi − ȳ)

où : - ŷi sont les valeurs prédites, - yi sont les valeurs observées, - ȳ est la moyenne des
yi .

3
4 Questions
1. Implémentez toutes les méthodes dans section 2 et les mesures d’évaluation dans
section 3.

2. Affichez sur des graphiques les jeux de données (nuage de points généré aléatoirement
et données du tableau 1) et les approximations calculées par chaque modèle.

3. Quel est le modèle le plus précis ?

4. Quelles seront les ventes de glaces estimées pour des températures de 13, 20 et 27
°C ?

5. Supposons que le glacier a vendu 470€ quand la température était à 21°C. Combien
devrait-il faire de ventes pour des températures de 13, 20 et 27 °C ?

Vous aimerez peut-être aussi

TP 2
Pas encore d'évaluation
TP 2
3 pages
Chapitre 4 Regression Generalities
Pas encore d'évaluation
Chapitre 4 Regression Generalities
9 pages
Modélisation et Régression des Données
Pas encore d'évaluation
Modélisation et Régression des Données
11 pages
La Regression
Pas encore d'évaluation
La Regression
3 pages
X, Y X, Y f X ε f x x ε X x, y X Y randn, n rand, n ,: Machine learning ENSA de Khoribga
Pas encore d'évaluation
X, Y X, Y f X ε f x x ε X x, y X Y randn, n rand, n ,: Machine learning ENSA de Khoribga
1 page
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
13 pages
Modélisation Statistique
Pas encore d'évaluation
Modélisation Statistique
22 pages
Modèle de régression linéaire simple
100% (1)
Modèle de régression linéaire simple
69 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
3 pages
Seance5 Régression Simple
Pas encore d'évaluation
Seance5 Régression Simple
27 pages
Régression Linéaire Simple et Modèles Statistiques
100% (1)
Régression Linéaire Simple et Modèles Statistiques
51 pages
Lin Reg
Pas encore d'évaluation
Lin Reg
12 pages
Partie 2-1 Régression Linéaire Simple
Pas encore d'évaluation
Partie 2-1 Régression Linéaire Simple
25 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
19 pages
Régression Linéaire et Moindres Carrés
Pas encore d'évaluation
Régression Linéaire et Moindres Carrés
53 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
4 pages
2 - Apprentissage Supervisé
Pas encore d'évaluation
2 - Apprentissage Supervisé
10 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
39 pages
Groupe2/4GM: Encadreurs: Date
Pas encore d'évaluation
Groupe2/4GM: Encadreurs: Date
36 pages
5 - Moindres Carres
Pas encore d'évaluation
5 - Moindres Carres
36 pages
Chapitre 4 MLDS2022
Pas encore d'évaluation
Chapitre 4 MLDS2022
37 pages
Ta 25 10 2022 - 042314
Pas encore d'évaluation
Ta 25 10 2022 - 042314
57 pages
Data Mining Prediction
Pas encore d'évaluation
Data Mining Prediction
151 pages
6 RegressionLineaireSimple
Pas encore d'évaluation
6 RegressionLineaireSimple
37 pages
Régression Linéaire et Logistique expliquées
Pas encore d'évaluation
Régression Linéaire et Logistique expliquées
51 pages
Régression linéaire et moindres carrés
100% (1)
Régression linéaire et moindres carrés
9 pages
Statistiques et Régressions en Grande Dimension
Pas encore d'évaluation
Statistiques et Régressions en Grande Dimension
29 pages
Régression Linéaire et Applications
Pas encore d'évaluation
Régression Linéaire et Applications
4 pages
REGRESSION
Pas encore d'évaluation
REGRESSION
16 pages
TD1 ML FST
Pas encore d'évaluation
TD1 ML FST
3 pages
Cahier d'Exercices en Économétrie
100% (2)
Cahier d'Exercices en Économétrie
24 pages
7.cours Regression
Pas encore d'évaluation
7.cours Regression
8 pages
Régression linéaire-DERNIERE PARTIE
Pas encore d'évaluation
Régression linéaire-DERNIERE PARTIE
34 pages
Chap2 Regression
Pas encore d'évaluation
Chap2 Regression
78 pages
Chap 3 Régression
100% (1)
Chap 3 Régression
17 pages
Regression Lineaire
Pas encore d'évaluation
Regression Lineaire
6 pages
Série 1 3finance
Pas encore d'évaluation
Série 1 3finance
2 pages
Modèles Linéaires et Moindres Carrés
Pas encore d'évaluation
Modèles Linéaires et Moindres Carrés
20 pages
Ta - 22 10 2024
Pas encore d'évaluation
Ta - 22 10 2024
98 pages
TP Regression
Pas encore d'évaluation
TP Regression
12 pages
Régression Linéaire
100% (1)
Régression Linéaire
86 pages
Exercices Économétrie S6
Pas encore d'évaluation
Exercices Économétrie S6
6 pages
TD1 Add&apprentissage
Pas encore d'évaluation
TD1 Add&apprentissage
3 pages
Regression Lineaire Simple PDF
Pas encore d'évaluation
Regression Lineaire Simple PDF
43 pages
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
Pas encore d'évaluation
Licence Fondamentale Économie Et Gestion (Semestre 6) : Année Universitaire 2023-2024
18 pages
6 RegressionLineaireSimple
Pas encore d'évaluation
6 RegressionLineaireSimple
31 pages
Chapitre 2 ML
Pas encore d'évaluation
Chapitre 2 ML
50 pages
Travaux Pratiques 1
Pas encore d'évaluation
Travaux Pratiques 1
7 pages
1 Updated 12 Regression
Pas encore d'évaluation
1 Updated 12 Regression
45 pages
Corrigé TD Statistique M1-GEO Rennes 2
Pas encore d'évaluation
Corrigé TD Statistique M1-GEO Rennes 2
21 pages
Regression Linéaire Simple PDF
Pas encore d'évaluation
Regression Linéaire Simple PDF
7 pages
Régression Linéaire Simple: Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire Simple: Concepts et Estimations
7 pages
Kempe Ners
Pas encore d'évaluation
Kempe Ners
11 pages
TP 2
Pas encore d'évaluation
TP 2
3 pages
Ch3 Slides
Pas encore d'évaluation
Ch3 Slides
55 pages
Chapitre. Régression Linéaire Simple - 19-20 - Part01
Pas encore d'évaluation
Chapitre. Régression Linéaire Simple - 19-20 - Part01
10 pages
Régression linéaire simple
Pas encore d'évaluation
Régression linéaire simple
10 pages
Corrigé-Type Interrogation L3GL
100% (1)
Corrigé-Type Interrogation L3GL
3 pages
Exercice FOCOV2
Pas encore d'évaluation
Exercice FOCOV2
2 pages
Thiziri Arour - Devoir N2
Pas encore d'évaluation
Thiziri Arour - Devoir N2
1 page
Microsoft Word - correctionTD3Algo1 - 1
Pas encore d'évaluation
Microsoft Word - correctionTD3Algo1 - 1
4 pages
Construction D'image2
Pas encore d'évaluation
Construction D'image2
4 pages
Feuille de Réponses TP 03 (2) - Converti
Pas encore d'évaluation
Feuille de Réponses TP 03 (2) - Converti
2 pages
Algorithme PGCD par Soustraction
Pas encore d'évaluation
Algorithme PGCD par Soustraction
7 pages
Exercice Algorithme Structure Conditionnelle SI Et SI Imbriqué - QCM Algorithme - Examens, Exercices, Astuces Tous Ce Que Vous Voulez
0% (1)
Exercice Algorithme Structure Conditionnelle SI Et SI Imbriqué - QCM Algorithme - Examens, Exercices, Astuces Tous Ce Que Vous Voulez
3 pages
Cours Algo Ch1 Ch2 2021 Cne2
Pas encore d'évaluation
Cours Algo Ch1 Ch2 2021 Cne2
28 pages
Analyse Objet et Modèles Dynamiques
Pas encore d'évaluation
Analyse Objet et Modèles Dynamiques
14 pages
Planification d'un Mini Projet Industriel
Pas encore d'évaluation
Planification d'un Mini Projet Industriel
3 pages
Test de 3ème Année de Base - Caractéristiques de La Lumière
Pas encore d'évaluation
Test de 3ème Année de Base - Caractéristiques de La Lumière
5 pages
Travaux Dirigés sur le Transfert de Chaleur
Pas encore d'évaluation
Travaux Dirigés sur le Transfert de Chaleur
48 pages
Dimensionnement d'une dalle en béton armé
Pas encore d'évaluation
Dimensionnement d'une dalle en béton armé
21 pages
Support Cours N°2 - Théorie Des Organisations - Pr. Yassine Belyagou (FPE - UMI)
Pas encore d'évaluation
Support Cours N°2 - Théorie Des Organisations - Pr. Yassine Belyagou (FPE - UMI)
15 pages
Champ de pesanteur terrestre et gravitation
Pas encore d'évaluation
Champ de pesanteur terrestre et gravitation
12 pages
Cerfa - 13703-09 2
Pas encore d'évaluation
Cerfa - 13703-09 2
14 pages
Créez un Cahier de Charges Efficace
100% (1)
Créez un Cahier de Charges Efficace
2 pages
Cons Meca s3 1er GR 2017 PDF
100% (1)
Cons Meca s3 1er GR 2017 PDF
7 pages
Cours TOPO 102 (LTN Morand)
Pas encore d'évaluation
Cours TOPO 102 (LTN Morand)
50 pages
Produit Scalaire et Calcul Vectoriel
Pas encore d'évaluation
Produit Scalaire et Calcul Vectoriel
26 pages
Évaluer la Secrétaire chez TANJIS
Pas encore d'évaluation
Évaluer la Secrétaire chez TANJIS
4 pages
DR Naziha Benbachir, Langue Et Mobilité Chez L'écrivain Amara Lakhous
Pas encore d'évaluation
DR Naziha Benbachir, Langue Et Mobilité Chez L'écrivain Amara Lakhous
12 pages
Exercices de Génétique Formelle 7D
Pas encore d'évaluation
Exercices de Génétique Formelle 7D
4 pages
Echelle Algoplus
Pas encore d'évaluation
Echelle Algoplus
2 pages
Impacts de l'Étalement Urbain à Sidi Allal
Pas encore d'évaluation
Impacts de l'Étalement Urbain à Sidi Allal
19 pages
00012-TAP Art. OSONGO OKONGAKOYI Marcel
Pas encore d'évaluation
00012-TAP Art. OSONGO OKONGAKOYI Marcel
23 pages
Livret 6 Présenter S-Exprimer Sur Une Oeuvre HIDA Peac-1
Pas encore d'évaluation
Livret 6 Présenter S-Exprimer Sur Une Oeuvre HIDA Peac-1
20 pages
PCT 2nde C 2eme Devoir Du 1er Semestre 2023-2024 Ceg1 Ikpinle
100% (3)
PCT 2nde C 2eme Devoir Du 1er Semestre 2023-2024 Ceg1 Ikpinle
3 pages
Copie de SME
Pas encore d'évaluation
Copie de SME
9 pages
Pedologie SGM
Pas encore d'évaluation
Pedologie SGM
20 pages
GRHH
Pas encore d'évaluation
GRHH
204 pages
Devoir de Synthèse N°1 1er Semestre - Math - 3ème Economie & Gestion (2018-2019) MR Taieb Gharbi
Pas encore d'évaluation
Devoir de Synthèse N°1 1er Semestre - Math - 3ème Economie & Gestion (2018-2019) MR Taieb Gharbi
3 pages
Analyse Des Séries Temporelles
Pas encore d'évaluation
Analyse Des Séries Temporelles
2 pages
Découverte des Éléments Chimiques
100% (1)
Découverte des Éléments Chimiques
2 pages
Chapitre 2 Analyse Fonctionnelle
Pas encore d'évaluation
Chapitre 2 Analyse Fonctionnelle
6 pages
Randonnée Belvédère de las Buitreras
Pas encore d'évaluation
Randonnée Belvédère de las Buitreras
4 pages
COURS IOT SUPTECH - Edited - PPTX - Removed
Pas encore d'évaluation
COURS IOT SUPTECH - Edited - PPTX - Removed
24 pages
Methodes Et Astuces Et Remarques Et Conseils Equation Du Second Degre
Pas encore d'évaluation
Methodes Et Astuces Et Remarques Et Conseils Equation Du Second Degre
1 page
Examen Final - Semaine 8 Mio
Pas encore d'évaluation
Examen Final - Semaine 8 Mio
12 pages

TP 2 Proba Stats: 1 Jeux de Donn Ees

Transféré par

TP 2 Proba Stats: 1 Jeux de Donn Ees

Transféré par

TP 2 Proba Stats

Le but de ce TP est d’explorer les méthodes de régression linéaire.

Données 1: Nuage de Points Aléatoires

• x ∈ [0, 1] est généré aléatoirement,

• α, β ∈ R sont des coefficients fixes (α = 1 et β = 0.3),

•  ∈ [0, 0.1] représente un bruit aléatoire ajouté à y.

Données 2: Vente de Glaces

Table 1: Données des températures et des ventes de glaces.

Les estimateurs sont : P P P

ŷ = f (x) = âx + b̂.

2.2 Méthode d’optimisation

2.3 Bibliothèque Sklearn

3 Qualité des prédictions

3.2 Coefficient de détermination

3. Quel est le modèle le plus précis ?

Vous aimerez peut-être aussi

• ∈ [0, 0.1] représente un bruit aléatoire ajouté à y.