0% ont trouvé ce document utile (0 vote)
71 vues3 pages

TP 2

Ce document présente un TP sur l'utilisation de scikit-learn pour créer un modèle de régression linéaire afin de prédire le prix des pizzas en fonction de leur taille. Il décrit les étapes de génération des données, de création du modèle, et d'évaluation de celui-ci à l'aide de mesures telles que le coefficient de détermination R² et l'erreur quadratique moyenne (MSE). Les exercices incluent la visualisation des données et l'application de la régression linéaire avec des bibliothèques Python comme numpy et matplotlib.

Transféré par

Fatimetou Medvall
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
71 vues3 pages

TP 2

Ce document présente un TP sur l'utilisation de scikit-learn pour créer un modèle de régression linéaire afin de prédire le prix des pizzas en fonction de leur taille. Il décrit les étapes de génération des données, de création du modèle, et d'évaluation de celui-ci à l'aide de mesures telles que le coefficient de détermination R² et l'erreur quadratique moyenne (MSE). Les exercices incluent la visualisation des données et l'application de la régression linéaire avec des bibliothèques Python comme numpy et matplotlib.

Transféré par

Fatimetou Medvall
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP2 : introduction à scikit-learn et à l’apprentissage

automatique

Objectifs
Pour ce TP nous allons apprendre à écrire notre premier modèle : une régression
linéaire. Nous allons l’expérimenter sur un problème jouet afin de suivre pas à pas
la construction et l’évaluation de notre modèle.
Dans le cas d’une régression linéraire on suppose qu’il existe une relation linéaire
entre les données d’entrées et les valeurs à prédire.

Il s’agit de prédire la relation entre le prix d’une pizza et sa taille. Comme spécifié
précédemment, et comme nous avons choisi une régression linéaire, celà signifie que
nous faisons l’hypothèse qu’il existe une relation linaire entre le prix d’une pizza et sa
taille.

Exercice 1 : Création et analyse des données


Nous allons tout d’abord générer un ensemble de points pour l’ensemble d’apprentissage:

Exemple Taille Prix


1 6 7
2 8 9
3 10 13
4 14 17,5
5 18 18

Nous allons pour celà utiliser la bibliothèque numpy :


import numpy as np
Il nous faut ensuite déclarer un tableau numpy contenant les données (tailles des
pizzas) et déclarer un tableau contenant les prix correspondants.

X = np.array([[6], [8], [10], [14], [18]])


y = [7, 9, 13, 17.5, 18]

Nous souhaitons maintenant afficher les données dans un graphe afin d’examiner
s’il existe une relation entre la taille et le prix d’une pizza. Pour cela nous allons utiliser
matplotlib :
import matplotlib.pyplot as plt

1
Il faut maintenant définir le code matplotlib afin d’obtenir ce résultat :

Pizza prices plotted against sizes


25

20
Prices in euros

15

10

0
0 5 10 15 20 25
Sizes in cms

Nous pouvons constater qu’il existe bien une relation, le prix d’une pizza augmente
avec sa taille, ce qui est cohérent avec notre expertise sur le sujet.

Exercice 2: Regression linéaire


Nous allons utiliser la bibliothèque sklearn et en particulier le modèle de régression
linéaire :
from sklearn.linear_model import LinearRegression
Utiliser maintenant les fonctions fit pour l’apprentissage et predict pour prédire
la réponse du modèle sur un exemple. On obtient pour notre régression linéaire :

Pizza prices plotted against sizes


25

20
Prices in euros

15

10

0
0 5 10 15 20 25
Sizes in cms

La régression linéaire permet d’apprendre un modèle de la forme :


y = αx + β

2
Exercice 3: Evaluation du modèle
Il nous faut maintenant évaluer notre modèle. Pour celà nous avons besoin de
calculer deux mesures :

 Détermination R² (souvent appelée le score de régression) : En utilisant la


bibliothèque scikit-learn en Python, on peut calculer le coefficient de
détermination (R²) à l'aide de la méthode score pour les modèles de
régression. Le coefficient de détermination (R²) compare les valeurs prédites
avec les valeurs réelles. Le coefficient de détermination (R²) mesure la
qualité de l'ajustement du modèle aux données, avec des valeurs plus
proches de 1 indiquant un meilleur ajustement.

 MSE, ou l'erreur quadratique moyenne (en anglais, Mean Squared


Error), est une mesure couramment utilisée pour évaluer la précision
d'un modèle de régression par rapport à ses prédictions sur un
ensemble de données.

La formule pour calculer la MSE est la suivante :

En Python, en utilisant scikit-learn, vous pouvez calculer la MSE à


l'aide de la fonction mean_squared_error du module metrics

Vous aimerez peut-être aussi