TP Régression Linéaire avec Scikit-learn

Ce TP se concentre sur la régression linéaire en utilisant un jeu de données contenant treize variables explicatives pour prédire la concentration d'ozone. Les étapes incluent l'exploration des données, l'utilisation de la bibliothèque Scikit-learn pour construire et évaluer le modèle, ainsi que la normalisation des données. Les résultats incluent des métriques de performance et des visualisations des prédictions par rapport aux valeurs réelles.

Transféré par

Dhauha Jouini

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

38 vues2 pages

TP Régression Linéaire avec Scikit-learn

Transféré par

Dhauha Jouini

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP ML - Régression Linéaire

LCS3 - GLSI
1- Exploration des données.
Dans ce TP, nous utiliserons un jeu de données constitué de treize variables explicatives et une
variable à prédire.
Ces observations se trouvent dans le fichier ozone.csv.

Les variables explicatives sont définies comme suit :

- Les variables T9, T12 et T15 correspondent respectivement à des prélèvement de température à
9h, 12h et 15h.
- Les variables Ne9, Ne12 et Ne15 correspondent respectivement à des prélèvements de nébulosité
à 9h, 12h et 15h.
- Les variables Vx9, Vx12 et Vx15 correspondent respectivement à des prélèvements de vent à 9h,
12h et 15h.
- Deux variables qualitatives Vent et Pluie. Ces deux variables ne seront pas utilisées lors de
l’estimation des paramètres du modèle qu’on compte construire. On pourra, tout de même, les
transformer en valeurs numériques.
Par exemple, pour la variable Pluie, la modalité sec peut prendre la valeur 1 et la modalité Pluie on
peut lui attribuer la valeur 2.
De même pour la variable Vent les modalité peuvent être transformées comme suit : Nord=1,
Sud=2, Est=3 et Ouest=4.
- La variable Date correspond aux dates de prélèvements. Cette variable ne sera pas utilisée.
- Enfin, la variable Max03v correspond à la mesure maximum de la concentration d’ozone la veille.

Dans cet exemple, la variable à expliquer (à prédire) est la variable Max03. L’objectif du modèle
que nous allons construire est donc de prédire la valeur que prendra le lendemain la variable
Max03v en fonction des valeurs enregistrées aujourd’hui pour les dix variables prédictives T9, T12,
T15, Ne9, Ne12, Ne15, Vx9, Vx12, Vx15 et Max03.

2- Utilisation de Scikit-learn

La bibliothèque Scikit-learn est une bibliothèque composée de plusieurs modules dédiés à la Data
Science. La mise en œuvre d’un algorithme avec cette bibliothèque peut être synthétisé par les
étapes suivantes :
1. Instanciation d’un algorithme
2. Lancement de la fonction de l’apprentissage
3. Réalisation des prédictions
4. Évaluation des performances

En plus des algorithmes d’apprentissage, Scikit-learn fournit plusieurs modules permettant de

manipuler les données.
3- Construction du modèle.

a- Importation des modules

Pour ce TP, nous aurons besoin de :

- La bibliothèque pandas pour manipuler les données
- importer sqrt de la bibliothèque math nécessaire pour le calcul des métriques
- Importer la bibliothèque matplotlib.pyplot pour dessiner des courbes
- De la bibliothèque scikit-learn nous importerons
- la fonction train_test_split du module sklearn.model_selection (diviser les données en
données d’entraînement et données de test)
- la fonction LinearRegression du module sklearn.linear_model (cette fonction nous
permettra d’instancier l’algorithme de régression linéaire)
- les fonctions mean_squared_error et r2_score du module sklearn.metrics (permettant de
calculer la performance du modèle)
- le module preprocessing (permettant de manipuler les données, dans notre cas la
normalisation de quelques données)

b- Lecture des données dans un Dataframe

• Lire le fichier ozone.csv et afficher ses données

• Isoler la variable à prédire
• Dans le jeu de données restant, garder seulement les 10 données prédictives

c- Normalisation des données

• Afficher les statistiques de la Dataframe comportant les données prédictives. Un

déséquilibre dans les échelles sur lesquels les variables sont définies.
• Procéder à une normalisation des données en utilisant le module preprocessing
• Afficher les stats de la Dataframe après normalisation.

d- Construction d’un modèle linéaire

• Diviser les données en données d’entraînement et données de test (les données de test
représentent 20 % de l’ensemble des données).
• Instancier un algorithme de régression linéaire
• Entraîner le modèle

e- Évaluer le modèle

• appliquer le modèle sur les données de test

• calculer les deux métriques mean_squared_error et r2_score et les afficher
• afficher les coefficients associés aux dix variables prédictives
• afficher la valeur du coefficient a0
• réaliser une courbe affichant les prédictions du modèle et les vrai valeurs de la variable à
prédire des données de test

Vous aimerez peut-être aussi

Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Analyse de données ozone avec R
100% (2)
Analyse de données ozone avec R
4 pages
Régression Linéaire et Analyse Ozone
Pas encore d'évaluation
Régression Linéaire et Analyse Ozone
11 pages
Régression Linéaire avec Scikit-Learn
Pas encore d'évaluation
Régression Linéaire avec Scikit-Learn
4 pages
Régression Linéaire et Polynômiale en Python
Pas encore d'évaluation
Régression Linéaire et Polynômiale en Python
13 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
TP1 Progression Linéaire Simple
Pas encore d'évaluation
TP1 Progression Linéaire Simple
6 pages
TP1 Regression Lineaire
Pas encore d'évaluation
TP1 Regression Lineaire
4 pages
Analyse Prédictive avec Python et Pandas
Pas encore d'évaluation
Analyse Prédictive avec Python et Pandas
5 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
Analyse de régression et distances de Cook
0% (1)
Analyse de régression et distances de Cook
2 pages
TP Régression Linéaire avec Python 2024
Pas encore d'évaluation
TP Régression Linéaire avec Python 2024
8 pages
TP 2
Pas encore d'évaluation
TP 2
3 pages
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
Pas encore d'évaluation
Rapport TP2: DOUMBIA Mohamed Et SIMOES Corentin 06-10-2024
8 pages
Régression Linéaire en Python
Pas encore d'évaluation
Régression Linéaire en Python
2 pages
Machine Learning Regression Lineraire
Pas encore d'évaluation
Machine Learning Regression Lineraire
29 pages
Apprentissage supervisé : Régression et AFD
Pas encore d'évaluation
Apprentissage supervisé : Régression et AFD
6 pages
Régressions linéaires : Salaire et Profit
Pas encore d'évaluation
Régressions linéaires : Salaire et Profit
3 pages
Prévision de l'ozone : Modèles et ROC
Pas encore d'évaluation
Prévision de l'ozone : Modèles et ROC
9 pages
TP1 Regression Logistique
Pas encore d'évaluation
TP1 Regression Logistique
5 pages
Objectifs:: TP3: Régression Linéaire, Multiple Et Polynomiale
Pas encore d'évaluation
Objectifs:: TP3: Régression Linéaire, Multiple Et Polynomiale
2 pages
TP Regression
Pas encore d'évaluation
TP Regression
12 pages
tp1 Deepl
Pas encore d'évaluation
tp1 Deepl
5 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
Modèles de régression et classification ML
Pas encore d'évaluation
Modèles de régression et classification ML
5 pages
Régression Linéaire avec Sklearn en Python
Pas encore d'évaluation
Régression Linéaire avec Sklearn en Python
2 pages
DATA MINING Examen 2020 Corrigé 1
83% (6)
DATA MINING Examen 2020 Corrigé 1
6 pages
TP Régression
Pas encore d'évaluation
TP Régression
6 pages
Régression Linéaire : Étude de Chute et Vagues
Pas encore d'évaluation
Régression Linéaire : Étude de Chute et Vagues
4 pages
Devoir Sur Machine Learning - Université Tunis
Pas encore d'évaluation
Devoir Sur Machine Learning - Université Tunis
4 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
Pollution à l'ozone et régression linéaire
Pas encore d'évaluation
Pollution à l'ozone et régression linéaire
4 pages
Ai TP1 2024
Pas encore d'évaluation
Ai TP1 2024
5 pages
Convexité et Régression en Machine Learning
Pas encore d'évaluation
Convexité et Régression en Machine Learning
2 pages
Big Data Et Analyse Prédictive
Pas encore d'évaluation
Big Data Et Analyse Prédictive
44 pages
Code
Pas encore d'évaluation
Code
4 pages
Modèle de régression linéaire en TP
Pas encore d'évaluation
Modèle de régression linéaire en TP
3 pages
TP 1 - Initiation À La ML
Pas encore d'évaluation
TP 1 - Initiation À La ML
2 pages
Data Mining tp.5 Régression Linéaire Multiple
Pas encore d'évaluation
Data Mining tp.5 Régression Linéaire Multiple
13 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Régression Linéaire Univariée en Python
Pas encore d'évaluation
Régression Linéaire Univariée en Python
5 pages
Régression Linéaire en Python : Guide Pratique
Pas encore d'évaluation
Régression Linéaire en Python : Guide Pratique
4 pages
Travaux Pratiques en Apprentissage Supervisé
Pas encore d'évaluation
Travaux Pratiques en Apprentissage Supervisé
9 pages
TD Machine Regression Python
Pas encore d'évaluation
TD Machine Regression Python
3 pages
Projet Machine Learning : Ozone et Titanic
Pas encore d'évaluation
Projet Machine Learning : Ozone et Titanic
2 pages
TP3-Aprentissage Supervisé - KNN - Linear Regression
Pas encore d'évaluation
TP3-Aprentissage Supervisé - KNN - Linear Regression
6 pages
Rapport Identifecation Naitali
Pas encore d'évaluation
Rapport Identifecation Naitali
11 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
139 pages
TP 2 Proba Stats: 1 Jeux de Donn Ees
Pas encore d'évaluation
TP 2 Proba Stats: 1 Jeux de Donn Ees
4 pages
Optimisation de la Régression Linéaire avec Python
Pas encore d'évaluation
Optimisation de la Régression Linéaire avec Python
36 pages
Classification K-NN avec IRIS et MNIST
Pas encore d'évaluation
Classification K-NN avec IRIS et MNIST
4 pages
Atelier sur la régression en Python
Pas encore d'évaluation
Atelier sur la régression en Python
13 pages
Tp1 RN Regression Lineaire Et Multiple
Pas encore d'évaluation
Tp1 RN Regression Lineaire Et Multiple
5 pages
TP Machine Learning : KNN et Naïve Bayes
Pas encore d'évaluation
TP Machine Learning : KNN et Naïve Bayes
12 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
63 pages
Regression Lineaire en Python Avec Scikit 1
Pas encore d'évaluation
Regression Lineaire en Python Avec Scikit 1
10 pages
Quel Outil de Modélisation Statistique Choisir - XLSTAT Centre D'aide
Pas encore d'évaluation
Quel Outil de Modélisation Statistique Choisir - XLSTAT Centre D'aide
4 pages
Méthodes d'Optimisation en Biophysique
Pas encore d'évaluation
Méthodes d'Optimisation en Biophysique
25 pages
Rôle Des Maths Dans L'intelligence Artificielle
Pas encore d'évaluation
Rôle Des Maths Dans L'intelligence Artificielle
4 pages
Gestion Relation Client: Stratégies Clés
Pas encore d'évaluation
Gestion Relation Client: Stratégies Clés
6 pages
Guide d'analyse de données Epi Info
Pas encore d'évaluation
Guide d'analyse de données Epi Info
21 pages
QCM Statistiques Psychologie Semestre Pair 2021/2022
Pas encore d'évaluation
QCM Statistiques Psychologie Semestre Pair 2021/2022
25 pages
Méthodes quantitatives en sociologie
Pas encore d'évaluation
Méthodes quantitatives en sociologie
15 pages
Data Mining Et Statistique
Pas encore d'évaluation
Data Mining Et Statistique
37 pages
Analyse financière et statistique d'ENERGIE POUR TOUS
Pas encore d'évaluation
Analyse financière et statistique d'ENERGIE POUR TOUS
2 pages
Les Démarches de L'économetrie
Pas encore d'évaluation
Les Démarches de L'économetrie
8 pages
Introduction à la Régression Linéaire
Pas encore d'évaluation
Introduction à la Régression Linéaire
40 pages
Machine Learning en Gestion RH Proactive
Pas encore d'évaluation
Machine Learning en Gestion RH Proactive
17 pages
Module 6
Pas encore d'évaluation
Module 6
26 pages
Etude de La Production de La Biomasse de Saccharomyces Cerevisiae Sur Milieu Optimisé À Base de L'extrait de Dattes Déclassées
Pas encore d'évaluation
Etude de La Production de La Biomasse de Saccharomyces Cerevisiae Sur Milieu Optimisé À Base de L'extrait de Dattes Déclassées
84 pages
Exercices sur les séries statistiques doubles
Pas encore d'évaluation
Exercices sur les séries statistiques doubles
4 pages
Chapitre 2 - Mathematique de AI
Pas encore d'évaluation
Chapitre 2 - Mathematique de AI
59 pages
Multiples
Pas encore d'évaluation
Multiples
20 pages
Prétaitements des spectres : SNV et MSC
Pas encore d'évaluation
Prétaitements des spectres : SNV et MSC
12 pages
Regression Fallacieuse Concept de Cointégration
Pas encore d'évaluation
Regression Fallacieuse Concept de Cointégration
16 pages
Colloque sur Modélisation Stochastique
Pas encore d'évaluation
Colloque sur Modélisation Stochastique
24 pages
Split 3371175431672032122
Pas encore d'évaluation
Split 3371175431672032122
60 pages
Détermination de Limites Acceptables Pour Les Incertitudes Par CIL
Pas encore d'évaluation
Détermination de Limites Acceptables Pour Les Incertitudes Par CIL
15 pages
Programmation des Politiques Financières
Pas encore d'évaluation
Programmation des Politiques Financières
357 pages
TD Cours3 PDF
Pas encore d'évaluation
TD Cours3 PDF
4 pages
Mini Projet
Pas encore d'évaluation
Mini Projet
2 pages