0% ont trouvé ce document utile (0 vote)

64 vues4 pages

Code

Le document présente un code Python pour analyser un dataset de maisons et le dataset MNIST. Il inclut des étapes de visualisation, de régression linéaire, de classification K-NN, et d'évaluation des performances des modèles. Enfin, il propose des améliorations pour optimiser le modèle de prédiction.

Transféré par

9qgjwycs7c

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

64 vues4 pages

Code

Transféré par

9qgjwycs7c

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Code

# On importe les librairies dont on aura besoin pour ce tp

import numpy as np
import pandas as pd
import [Link] as plt

# On charge le dataset
house_data = pd.read_csv('[Link]')

# On affiche le nuage de points dont on dispose

[Link](house_data['surface'], house_data['loyer'], 'ro', markersize=4)
[Link]()

# On décompose le dataset et on le transforme en matrices pour pouvoir effectuer notre

calcul
X = [Link]([[Link](house_data.shape[0]), house_data['surface'].values]).T
y = [Link](house_data['loyer']).T

# On effectue le calcul exact du paramètre theta

theta = [Link]([Link](X)).dot(X.T).dot(y)

print(theta)

[Link]('Surface')
[Link]('Loyer')

[Link](house_data['surface'], house_data['loyer'], 'ro', markersize=4)

# On affiche la droite entre 0 et 250

[Link]([0,250], [[Link](0),[Link](0) + 250 * [Link](1)], linestyle='--',
c='#000000')

[Link]()

# Méthode avec scikit-learn : régression linéaire déjà implémentée

from sklearn import linear_model
regr = linear_model.LinearRegression()
[Link](X, y)
[Link](<des données de test>)
# Effectuer un sampling
sample = [Link](data_size, size=int(data_size*0.1) )
sampled_data = [Link][sample]

# Définition de la proportion du dataset

from sklearn.model_selection import train_test_split
xtrain, xtest, ytrain, ytest = train_test_split(X, y, train_size=0.8)

# Appel du dataset MNIST

from [Link] import fetch_openml
mnist = fetch_openml('mnist_784', version=1)

# Le dataset principal qui contient toutes les images

print ([Link])

# Le vecteur d'annotations associé au dataset (nombre entre 0 et 9)

print ([Link])

# Effectuer un sampling de 5000 données

import numpy as np

sample = [Link](70000, size=5000)

data = [Link][sample]
target = [Link][sample]

# Séparer le jeu de données en training set et testing set

from sklearn.model_selection import train_test_split
# Les images d'exemple "X" et les annotations cibles "y"
xtrain, xtest, ytrain, ytest = train_test_split(data, target, train_size=0.8)

# Créer un premier classifieur 3-NN

from sklearn import neighbors

knn = [Link](n_neighbors=3)
[Link](xtrain, ytrain)

# Tester l’erreur de notre classifieur

error = 1 - [Link](xtest, ytest)
print('Erreur: %f' % error)

# Tester le modèle pour tous les k de 2 à 15, mesurer l’erreur test et afficher la performance
en fonction de k pour trouver le k optimal
errors = []
for k in range(2,15):
knn = [Link](k)
[Link](100*(1 - [Link](xtrain, ytrain).score(xtest, ytest)))
[Link](range(2,15), errors, 'o-')
[Link]()

# On récupère le classifieur le plus performant

knn = [Link](4)
[Link](xtrain, ytrain)

# On récupère les prédictions sur les données test

predicted = [Link](xtest)

# On redimensionne les données sous forme d'images

images = [Link]((-1, 28, 28))

# On sélectionne un echantillon de 12 images au hasard

select = [Link]([Link][0], size=12)

# On affiche les images avec la prédiction associée

fig,ax = [Link](3,4)

for index, value in enumerate(select):

[Link](3,4,index+1)
[Link]('off')
[Link](images[value],cmap=[Link].gray_r,interpolation="nearest")
[Link]('Predicted: {}'.format( predicted[value]) )

[Link]()

# On récupère les données mal prédites

misclass = (ytest != predicted)
misclass_images = images[misclass,:,:]
misclass_predicted = predicted[misclass]

# On sélectionne un échantillon de ces images

select = [Link](misclass_images.shape[0], size=12)

# On affiche les images et les prédictions (erronées) associées à ces images

for index, value in enumerate(select):
[Link](3,4,index+1)
[Link]('off')
[Link](misclass_images[value],cmap=[Link].gray_r,interpolation="nearest")
[Link]('Predicted: {}'.format(misclass_predicted[value]) )

[Link]()

• une séparation en training / testing set ;

• deux propositions d'amélioration du modèle qui obtiennent de meilleures
performances que la "baseline" (la régression linéaire avec une
seule feature) ;
• une sélection d'un modèle final à partir des performances.

Vous aimerez peut-être aussi

TP4 - KNN VF 2022-2023
Pas encore d'évaluation
TP4 - KNN VF 2022-2023
4 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Resume Machine Learning
Pas encore d'évaluation
Resume Machine Learning
2 pages
TD - Tp1 Exercice III Rna
Pas encore d'évaluation
TD - Tp1 Exercice III Rna
7 pages
TD2 KNN Classification
Pas encore d'évaluation
TD2 KNN Classification
12 pages
TP 1
Pas encore d'évaluation
TP 1
18 pages
TP4 ClassificationSupervisée Student
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
11 pages
Tp2: Deep Learning: Tensorflow
Pas encore d'évaluation
Tp2: Deep Learning: Tensorflow
9 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
TPKNN
Pas encore d'évaluation
TPKNN
3 pages
TP RN Centrale Exec
Pas encore d'évaluation
TP RN Centrale Exec
6 pages
Examens1 2016
100% (1)
Examens1 2016
3 pages
Algorithme des k plus proches voisins
Pas encore d'évaluation
Algorithme des k plus proches voisins
5 pages
TP1 24 25
Pas encore d'évaluation
TP1 24 25
8 pages
TP3: Classification avec KNN, SVM et Arbre de Décision
100% (2)
TP3: Classification avec KNN, SVM et Arbre de Décision
16 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Le Code Suivanttes
Pas encore d'évaluation
Le Code Suivanttes
2 pages
TP4 - KNN - EX1 K
Pas encore d'évaluation
TP4 - KNN - EX1 K
4 pages
Résumé Machine Learning&pandas&numpy
Pas encore d'évaluation
Résumé Machine Learning&pandas&numpy
26 pages
Le Code Suivant Charge Vos Images
Pas encore d'évaluation
Le Code Suivant Charge Vos Images
2 pages
TP 04 Afd PMC
Pas encore d'évaluation
TP 04 Afd PMC
6 pages
TP3 Classification
Pas encore d'évaluation
TP3 Classification
4 pages
TP1 Perceptron
Pas encore d'évaluation
TP1 Perceptron
5 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
TP3 MLP Part II Régression
Pas encore d'évaluation
TP3 MLP Part II Régression
11 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
Ex 2
Pas encore d'évaluation
Ex 2
1 page
TP - 2 - Énoncé - Version 1
Pas encore d'évaluation
TP - 2 - Énoncé - Version 1
3 pages
KNN - Jupyter Notebook
Pas encore d'évaluation
KNN - Jupyter Notebook
7 pages
TD1 KNN Classification Algorithmique
Pas encore d'évaluation
TD1 KNN Classification Algorithmique
7 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
TP1 Classification Par Les K Plus Proches Voisins 23 24
Pas encore d'évaluation
TP1 Classification Par Les K Plus Proches Voisins 23 24
4 pages
Progres2019 5
Pas encore d'évaluation
Progres2019 5
44 pages
Méthodes Ensemble
Pas encore d'évaluation
Méthodes Ensemble
7 pages
Méthodes Supervisées : KNN, SVM, Arbres et Forêts
Pas encore d'évaluation
Méthodes Supervisées : KNN, SVM, Arbres et Forêts
4 pages
TP3-Aprentissage Supervisé - KNN - Linear Regression
Pas encore d'évaluation
TP3-Aprentissage Supervisé - KNN - Linear Regression
6 pages
Traitement de données et prédiction de classes
Pas encore d'évaluation
Traitement de données et prédiction de classes
2 pages
TP RN Ensta 2018
Pas encore d'évaluation
TP RN Ensta 2018
20 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
ML 1 Itroduction
Pas encore d'évaluation
ML 1 Itroduction
5 pages
Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
Naive Ba Yes
Pas encore d'évaluation
Naive Ba Yes
2 pages
Voix Off Lab02 Detaillee
Pas encore d'évaluation
Voix Off Lab02 Detaillee
3 pages
TP-regression Master QFM 2023
Pas encore d'évaluation
TP-regression Master QFM 2023
13 pages
2nd Project Notes
Pas encore d'évaluation
2nd Project Notes
5 pages
Prijet Python
Pas encore d'évaluation
Prijet Python
5 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
Pas encore d'évaluation
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
14 pages
TP3 SVM
Pas encore d'évaluation
TP3 SVM
4 pages
TP6 SVM
Pas encore d'évaluation
TP6 SVM
4 pages
TP2 A Rendre
Pas encore d'évaluation
TP2 A Rendre
5 pages
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
Pas encore d'évaluation
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
28 pages
Entraîner Un Modèle CNN Sur MNIST Dans Google Colab
Pas encore d'évaluation
Entraîner Un Modèle CNN Sur MNIST Dans Google Colab
9 pages
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
Pas encore d'évaluation
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
4 pages
TP7 KMeans
Pas encore d'évaluation
TP7 KMeans
4 pages
Analyse SVM, KNN et Régressions sur Données Patients
Pas encore d'évaluation
Analyse SVM, KNN et Régressions sur Données Patients
11 pages
Prova ISD 22
Pas encore d'évaluation
Prova ISD 22
4 pages
Cours 1-2
Pas encore d'évaluation
Cours 1-2
41 pages
Tpe Ged234
Pas encore d'évaluation
Tpe Ged234
7 pages
Regression Logistique Cours Complet
Pas encore d'évaluation
Regression Logistique Cours Complet
4 pages
StatDesc - Beamer 1 35 1 30
Pas encore d'évaluation
StatDesc - Beamer 1 35 1 30
30 pages
5 Les Methodes de Calage
Pas encore d'évaluation
5 Les Methodes de Calage
7 pages
Lassse9 Analyse de Données RL 23
Pas encore d'évaluation
Lassse9 Analyse de Données RL 23
24 pages
Cours de Statistique 2021
Pas encore d'évaluation
Cours de Statistique 2021
8 pages
Sem3 Shallow NN
Pas encore d'évaluation
Sem3 Shallow NN
16 pages
Les Brefs Du Plan #29 - 15 Mai 2024 (Version FR)
Pas encore d'évaluation
Les Brefs Du Plan #29 - 15 Mai 2024 (Version FR)
9 pages
Randomisation
Pas encore d'évaluation
Randomisation
8 pages
Econométrie (M1) - Chapitre 2 (2019-2020)
Pas encore d'évaluation
Econométrie (M1) - Chapitre 2 (2019-2020)
47 pages
Déterminants de l'IDE en Méditerranée
Pas encore d'évaluation
Déterminants de l'IDE en Méditerranée
24 pages
Régression et Analyse Statistique 2024-2025
Pas encore d'évaluation
Régression et Analyse Statistique 2024-2025
3 pages
LBC TC 2
Pas encore d'évaluation
LBC TC 2
56 pages
Université de Saint
Pas encore d'évaluation
Université de Saint
2 pages
Ex1: Le Concours D'accès À Un Établissement de Formation Porte Sur Deux Épreuves
Pas encore d'évaluation
Ex1: Le Concours D'accès À Un Établissement de Formation Porte Sur Deux Épreuves
1 page
Chapitre5 Validation Modele
Pas encore d'évaluation
Chapitre5 Validation Modele
59 pages
Optimisation de la Pêche au Gondouana
Pas encore d'évaluation
Optimisation de la Pêche au Gondouana
6 pages
Économétrie L3 S1 Chapitre 4
Pas encore d'évaluation
Économétrie L3 S1 Chapitre 4
87 pages
Modèles de Régression et Analyse des Données
Pas encore d'évaluation
Modèles de Régression et Analyse des Données
3 pages
Econométrie Régression Linéaire Multiple 1
Pas encore d'évaluation
Econométrie Régression Linéaire Multiple 1
19 pages
Régression Linéaire Simplifiée
Pas encore d'évaluation
Régression Linéaire Simplifiée
72 pages
Effets médiateurs et modérateurs en régression
Pas encore d'évaluation
Effets médiateurs et modérateurs en régression
7 pages
Corrélation et Causalité Décryptées
Pas encore d'évaluation
Corrélation et Causalité Décryptées
23 pages
Introduction À L'économetrie Appliqué
Pas encore d'évaluation
Introduction À L'économetrie Appliqué
367 pages
TD Econometrie L3
Pas encore d'évaluation
TD Econometrie L3
8 pages
TD 2 Econometrie 3IEF 2024-2025
Pas encore d'évaluation
TD 2 Econometrie 3IEF 2024-2025
5 pages
Chapitre I Techniques de Prévision LSG3 %
Pas encore d'évaluation
Chapitre I Techniques de Prévision LSG3 %
25 pages
Banque de Questions en Économétrie pour L3 FASE
Pas encore d'évaluation
Banque de Questions en Économétrie pour L3 FASE
4 pages
MECAM Epreuves-Test Ecrit - Pré Sélection 2013-2021
Pas encore d'évaluation
MECAM Epreuves-Test Ecrit - Pré Sélection 2013-2021
10 pages