0% ont trouvé ce document utile (0 vote)

44 vues2 pages

Resume Machine Learning

Le document présente un code Python pour l'analyse et la visualisation de données, en utilisant des bibliothèques telles que Pandas, Seaborn et Scikit-learn. Il couvre des étapes comme la séparation des données, l'encodage des variables catégorielles, la création de modèles de classification et de régression, ainsi que l'évaluation des performances des modèles. Des visualisations, y compris des histogrammes et des arbres de décision, sont également générées pour faciliter l'interprétation des résultats.

Transféré par

daagi feriel

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

44 vues2 pages

Resume Machine Learning

Transféré par

daagi feriel

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

##Visualisation de données # Séparation des données (feature & target)

import seaborn as sns X = df[['Salary']]

#Analyse de données y = df['YearsExperience']
import pandas as pd # Division en un ensemble d'entrainement et un
from [Link] import MinMaxScaler ensemble de test
#Manipulation des matrices X_train, X_test,y_train,y_test=train_test_split(X,y,test_size
import numpy as np =0.3,random_state=42)
# une classe pour encoder des variables catégorielles #Afficher tout les element (infinite)
from [Link] import OneHotEncoder np.set_printoptions(threshold=[Link])
#Visualisation statique print(one_hot_encoded,type(one_hot_encoded))
import [Link] as plt # Création d'un DataFrame des colonnes encodées
# une classe pour encoder des variables catégorielles encoded_df=[Link](one_hot_encoded,columns=e
from [Link] import LabelEncoder ncoder.get_feature_names_out(['month']))
# Une classe pour transformer des colonnes # Fusionner les colonnes encodées avec le DataFrame
from [Link] import ColumnTransformer original sans la variable 'month'
# pour mettre à l’échelle vos caractéristiques numériques df_encoded = [Link]([[Link]('month', axis=1),
from [Link] import StandardScaler encoded_df], axis=1)
# Importer les metriques #tracer des histogrammes pour les colonnes numériques
from [Link] import accuracy_score, precision_score, for column in [Link][:-1]: # Exclure la colonne
recall_score ,f1_score, confusion_matrix, classification_report 'species'
from sklearn.model_selection import train_test_split [Link](figsize=(8, 4))
from [Link] import KNeighborsClassifier [Link](df[column], kde=True)
from [Link] import DecisionTreeClassifier [Link](f'Histogramme de {column}')
# Charger le dataset Titanic depuis seaborn [Link](column)
titanic = sns.load_dataset('titanic') [Link]('Fréquence')
#Charger le dataset dapre un fichier excel ou csv [Link]()
df=pd.read_csv("[Link]") #Calcule du Moyenne
# Afficher les 5 premières lignes df[colonne].mean()
print([Link]()) #Calcul median
# Afficher les 10 dernières lignes du DataFrame df[colonne].
print([Link](10)) #Calcul des Quartiles
##Afficher les entete des colonnes de dataset Q1 = df[colonne].quantile(0.25)
print([Link]) Q2 = df[colonne].median()
#afficher le type de chaque colonne Q3 = df[colonne].quantile(0.75)
print([Link]) #Calcul du varience
#verifier si le dataset contient des valeur null et compter les df[colonne].var()
[Link]().sum() #Calcul d’ecart type
# le nombre total de valeurs manquantes. Interprétez les résultats. df[colonne].std()
[Link]().sum().sum( # Calcul de l'Étendue Interquartile (IQR)
#pour supprimer les ligne qui contient les valeurs null Q3-Q1
df1 = [Link]() #Définition des limites inférieure et supérieure pour les
#pour supprimer les colonnes qui contient les valeurs null valeurs aberrantes
df=[Link](axis=1) lower_bound = Q1 - 1.5 * IQR
#pour afficher le nombre de ligne et de colonnes(dimension) upper_bound = Q1 + 1.5 * IQR
[Link] ## Filtrage des données pour ne conserver que les
#Afficher les types de colonnes années d'experience qui se trouvent entre les limites
print([Link]) inférieure et supérieure
# Afficher des informations générales data = df[(df['YearsExperience'] >= lower_bound) &
[Link]() (df['YearsExperience'] <= upper_bound)]
# Afficher une description statistique #Détection des valeurs aberrantes
[Link]() for column in [Link][:-1]: # Exclure la colonne
#supprimer une ligne ou bien colonne 'species'
df2 = [Link]('nom du ligne /colonne', axis=1/colonne 0/ligne) [Link](figsize=(8, 4))
#créer un dataframe une partie du dataset contenant les variables [Link](x=df[column])
age et fare [Link](f'Boxplot de {column}')
df3=titanic[['age','fare']] #si characteristique double [[ee]] [Link](column)
#remplacer les valeurs manquantes de la variable age par médiane # statistique data object type object "qualitatif"
median = df3['age'].median() [Link](include=['object'])
df3['age'].fillna(median, inplace=True) # Analyse de la Variable Cible
#importer et instancier MinMaxScaler et appliquer MinMaxScaler df['weather'].value_counts()
scaler = MinMaxScaler() # Supprimez la colonne date
scaler_fit=scaler.fit_transform(df3) del df["date"]
df3_scaled = [Link](scaler_fit) #Encodez la variable weather en valeurs numériques
# Instanciation du One-Hot Encoder le=LabelEncoder()
encoder = OneHotEncoder(sparse_output=False) df["weather_encode"]=le.fit_transform(df["weather"])
# Application du One-Hot Encoding sur la colonne 'month' #matrice de correlation
one_hot_encoded = encoder.fit_transform(df[['month']]) cor=[Link](['weather'],axis=1).corr()
# Affichage de one_hot_encoded et de son type [Link](cor,annot=True)
print(one_hot_encoded,type(one_hot_encoded))
#check for duplicate rows et sum pour voire la somme
# KNeighborsClassifier avec n_neighbors = 5
des ligne dups
KNN = KNeighborsClassifier(n_neighbors=5)
[Link]().sum()
#Les variables de testes pour les arbre random=true
#visualisation des points
X_train,X_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_s
[Link](X_train['Area'], y_train, s=1)#nuage de points#
tate=42)
['Area']si on a plusieur feature dans le X_train
#entrainer ainsi pour les arbres et regression lineare
[Link]('Price vs Area')
[Link](X_train, y_train)
[Link]('Area')
#calculer prediction y_pred
[Link]('Price')
y_pred = [Link](X_test)
#entrener le modele
#score
lr = LinearRegression()
[Link](X_test, y_test)
[Link](X_train, y_train)
# y_test converti en [Link] pour l'affichage
# Afficher les paramètres du modèle donner l'expression
print([Link](y_test))
du polynome h(x)
# Create a confusion matrix
print(lr.intercept_)#valeur du theta zero
import [Link] as plt
print(lr.coef_)#coef de l'equation de regression theta 1,2..
from [Link] import confusion_matrix
#pour tracer la droite on ajoute ses 2 ligne a la partie du
import seaborn as sns
visualisation apres [Link]
# Calcul de la matrice de confusion
y_pred = [Link](X_test)#predire les valeur en utilisant
conf_matrix = confusion_matrix(y_test, y_pred)
le vecteur
# Visualiser la matrice de confusion avec un heatmap
[Link](X_test['Area'], y_pred, color='red')#tracer la
[Link](figsize=(7, 5), dpi=100)
droite
[Link](conf_matrix, annot=True, fmt="d",xticklabels=['Rain',
#pour clalculer l’erreur
'Sun', 'Fog', 'Drizzle', 'Snow'],yticklabels=['Rain', 'Sun', 'Fog', 'Drizzle',
MAE = mean_absolute_error(y_test, y_pred)
'Snow'])
MSE = mean_squared_error(y_test, y_pred)
[Link]('Véritables catégories')#titre pour l’axe des y
RMSE=root_mean_squared_error(y_test, y_pred)#import
[Link]('Prédictions')#titre pour l’axe des x
root_mean_squared_error
[Link]('Matrice de Confusion pour les Prédictions Météo')#titre matrice
r2 = r2_score(y_test, y_pred)
[Link]()#affichage matrice
#Diviser la base de données en deux tableaux Xm
#Affihcer Précision, rappel et F1-score pour KNN
(tableau d'observations) et ym (la variable cible)
print(classification_report(y_test, y_pred))
Xm = [Link][:,0:12]#:pour toute les ligne 0:12 pour
########################################################
les colonnes iloc pour extraire les colonnes sans les
from sklearn.model_selection import GridSearchCV
nommees
param_grid = {'n_neighbors': range(1, 20), 'metric':['euclidean',
ym = boston['MEDV']#derniere colonnes du target
'manhattan', 'minkowski']}
#standardisation
# Application de GridSearchCV avec validation croisée
# Initialize StandardScaler
grid_KNN = GridSearchCV(KNeighborsClassifier(), param_grid, cv=5)
scaler = StandardScaler()#import bilbo
grid_KNN.fit(X_train, y_train)
Xm_train_sc=scaler.fit_transform(Xm_train)
print(grid_KNN.best_params_)
Xm_test_sc = [Link](Xm_test)
# calcul de la nouvelle y_pred
Tracer les valeurs réelles et les prédictions sur
Final_model = KNeighborsClassifier(metric ='manhattan', n_neighbors =
l'ensemble de test
11, weights = 'distance')
# Visualisation
# Performance du modèle optimal
[Link](X_test , y_test, color='blue', label='Valeurs
Final_model = grid_KNN.best_estimator
réelles')
# Meilleur k trouvé
[Link](X_test, y_pred, color='red', label='Ligne de
best_k = grid_KNN.best_params_['n_neighbors']
régression')
#hyperparametre du decisiontree c'est max_depth et l'indice de genie
[Link]('Years of Experience')
plusier indice dont dispo
[Link]('Salary')
model=DecisionTreeClassifier(criterion="gini",max_depth=5)
[Link]('Régression linéaire simple')
#imports des biblo pour visualiser l’arbre
[Link]()
from [Link] import plot_tree
[Link]()
import [Link] as plt
#Tracer l'arbre de décision pour le model: final_model
# Visualisation de l'arbre de décision
[Link](figsize=(12, 8))
[Link](figsize=(50,15), dpi = 200) # Augmenter la taille de la figure
plot_tree(final_model, filled=True,
plot_tree(model,filled=True,feature_names=X_train.columns,#
feature_names=X_train.columns, class_names=['0
feature_names c’est le nom des caractéristiques
(Bénin)', '1 (Malin)'], rounded=True)
class_names=["Classe 0", "Classe 1", "Classe 2", "Classe 3", "Classe
[Link]('Arbre de Décision')
4"], rounded=True,fontsize=14)
[Link]()
# font_sizeAugmenter la taille de la police
# class_name c’est le noms des classes
plt.tight_layout()
[Link]("tree_model.png", dpi = 200)
[Link]() #affichage
#import des metriques pour la regression lineare
from [Link] import mean_absolute_error,
mean_squared_error, r2_score,root_mean_squared_error
#pour le modele du regression lineare
from sklearn.linear_model import LinearRegression

Vous aimerez peut-être aussi

Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Prediction Du Churn Client
Pas encore d'évaluation
Prediction Du Churn Client
29 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
2nd Project Notes
Pas encore d'évaluation
2nd Project Notes
5 pages
Analyse et prédiction du Titanic avec Python
Pas encore d'évaluation
Analyse et prédiction du Titanic avec Python
8 pages
TTT
Pas encore d'évaluation
TTT
5 pages
Code
Pas encore d'évaluation
Code
4 pages
Machine Learning (ML) : Scikit-Learn
Pas encore d'évaluation
Machine Learning (ML) : Scikit-Learn
7 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Analyse des passagers du Titanic en Python
Pas encore d'évaluation
Analyse des passagers du Titanic en Python
3 pages
TD2 KNN Classification
Pas encore d'évaluation
TD2 KNN Classification
12 pages
TP 5 Machine Learning
Pas encore d'évaluation
TP 5 Machine Learning
10 pages
Analyse de Régression Linéaire
Pas encore d'évaluation
Analyse de Régression Linéaire
14 pages
Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
SVM pour classifier fruits et salaires
Pas encore d'évaluation
SVM pour classifier fruits et salaires
4 pages
Atelier sur la régression en Python
Pas encore d'évaluation
Atelier sur la régression en Python
13 pages
RAPPORT Regression
Pas encore d'évaluation
RAPPORT Regression
14 pages
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
Pas encore d'évaluation
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
14 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Classification du Titanic avec Sklearn
Pas encore d'évaluation
Classification du Titanic avec Sklearn
4 pages
Guide Complet sur l'Apprentissage Machine
Pas encore d'évaluation
Guide Complet sur l'Apprentissage Machine
26 pages
Examen M1 : Apprentissage automatique en Python
100% (1)
Examen M1 : Apprentissage automatique en Python
3 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
TP1 Classification Par Les K Plus Proches Voisins 23 24
Pas encore d'évaluation
TP1 Classification Par Les K Plus Proches Voisins 23 24
4 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
Analyse des modèles de classification ML
Pas encore d'évaluation
Analyse des modèles de classification ML
2 pages
K-Means Clustering pour Clients et Revenus
Pas encore d'évaluation
K-Means Clustering pour Clients et Revenus
4 pages
Algorithmes de Clustering Non Supervisé
Pas encore d'évaluation
Algorithmes de Clustering Non Supervisé
10 pages
Classification supervisée en Machine Learning
Pas encore d'évaluation
Classification supervisée en Machine Learning
11 pages
Algorithme K-Nearest Neighbors (KNN) Analyse Et Implémentation
Pas encore d'évaluation
Algorithme K-Nearest Neighbors (KNN) Analyse Et Implémentation
21 pages
TP3 Regression Lineaire Simple
Pas encore d'évaluation
TP3 Regression Lineaire Simple
3 pages
Prédiction de Crédit avec IA
Pas encore d'évaluation
Prédiction de Crédit avec IA
29 pages
TP4: Apprentissage Supervisé en IA
Pas encore d'évaluation
TP4: Apprentissage Supervisé en IA
5 pages
Régression Linéaire avec Scikit-Learn
Pas encore d'évaluation
Régression Linéaire avec Scikit-Learn
4 pages
Algo de Classifications
Pas encore d'évaluation
Algo de Classifications
2 pages
Formation Python Pour La Data Science - 5 - Le Machine Learning
100% (1)
Formation Python Pour La Data Science - 5 - Le Machine Learning
23 pages
TP4 - KNN - EX1 K
Pas encore d'évaluation
TP4 - KNN - EX1 K
4 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
Correction TP3 : Analyse Titanic avec Python
Pas encore d'évaluation
Correction TP3 : Analyse Titanic avec Python
15 pages
Tp2: Deep Learning: Tensorflow
Pas encore d'évaluation
Tp2: Deep Learning: Tensorflow
9 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
03-SVM Avancé - Faire Le Graphique
Pas encore d'évaluation
03-SVM Avancé - Faire Le Graphique
4 pages
Arbre de décision en Data Mining avec Python
100% (1)
Arbre de décision en Data Mining avec Python
6 pages
Introduction à l'apprentissage automatique avec Scikit-Learn
Pas encore d'évaluation
Introduction à l'apprentissage automatique avec Scikit-Learn
44 pages
Guide complet sur la visualisation des données
Pas encore d'évaluation
Guide complet sur la visualisation des données
8 pages
Projet Personnalisé
Pas encore d'évaluation
Projet Personnalisé
27 pages
Atelier 2 Machine Learning
Pas encore d'évaluation
Atelier 2 Machine Learning
5 pages
Traitement de données et prédiction de classes
Pas encore d'évaluation
Traitement de données et prédiction de classes
2 pages
TP2 SVM 2
Pas encore d'évaluation
TP2 SVM 2
3 pages
Analyse SVM, KNN et Régressions sur Données Patients
Pas encore d'évaluation
Analyse SVM, KNN et Régressions sur Données Patients
11 pages
Classification avec KNN et SVM en Python
100% (2)
Classification avec KNN et SVM en Python
16 pages
TD2 ML
Pas encore d'évaluation
TD2 ML
4 pages
Med Yassine Tanabene Rapport TP2
Pas encore d'évaluation
Med Yassine Tanabene Rapport TP2
13 pages
Analyse des performances des clubs EPL
Pas encore d'évaluation
Analyse des performances des clubs EPL
3 pages
Classification SVM sur données pulsar
Pas encore d'évaluation
Classification SVM sur données pulsar
4 pages
Prijet Python
Pas encore d'évaluation
Prijet Python
5 pages
Tutoriel: Analyse Discriminante avec Python
Pas encore d'évaluation
Tutoriel: Analyse Discriminante avec Python
23 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Activité 4 - Interview Utilisateur Avec IA Générative
Pas encore d'évaluation
Activité 4 - Interview Utilisateur Avec IA Générative
3 pages
WorkshopB Fascicule6 Translation Adresses IPv4
Pas encore d'évaluation
WorkshopB Fascicule6 Translation Adresses IPv4
8 pages
WorkshopB Fascicule4 OSPF Point To Point
Pas encore d'évaluation
WorkshopB Fascicule4 OSPF Point To Point
6 pages
Atelier 1
Pas encore d'évaluation
Atelier 1
5 pages
Estimation par intervalle de confiance
100% (1)
Estimation par intervalle de confiance
62 pages
CorrectionMindsExamen ASSEU 2223 S1 3IA
Pas encore d'évaluation
CorrectionMindsExamen ASSEU 2223 S1 3IA
7 pages
Formulairesymfo
Pas encore d'évaluation
Formulairesymfo
2 pages
Estimation de θ : Méthodes et Analyse
Pas encore d'évaluation
Estimation de θ : Méthodes et Analyse
8 pages
Untitled Document
Pas encore d'évaluation
Untitled Document
8 pages
Exercice N°5
Pas encore d'évaluation
Exercice N°5
8 pages
Exercice N°2-Corr
100% (1)
Exercice N°2-Corr
12 pages
Comprendre le Polymorphisme en C++
Pas encore d'évaluation
Comprendre le Polymorphisme en C++
16 pages
Estimation de débits ADSL en Tunisie
Pas encore d'évaluation
Estimation de débits ADSL en Tunisie
6 pages
Tableau des Rôles Alfresco-Share
Pas encore d'évaluation
Tableau des Rôles Alfresco-Share
4 pages
Profil Expert Cloud et DevOps Mayssa NAMSI
Pas encore d'évaluation
Profil Expert Cloud et DevOps Mayssa NAMSI
2 pages
Exemple de Test D'évaluation Finale Du MF
Pas encore d'évaluation
Exemple de Test D'évaluation Finale Du MF
8 pages
Procédure Pénale
Pas encore d'évaluation
Procédure Pénale
5 pages
Fiche H Serrage Des Boulons Précontraints HRC
Pas encore d'évaluation
Fiche H Serrage Des Boulons Précontraints HRC
9 pages
Youssef BDF 45
Pas encore d'évaluation
Youssef BDF 45
56 pages
Benin National Energy Compact Mission 300
Pas encore d'évaluation
Benin National Energy Compact Mission 300
89 pages
Organisation et Déploiement de la Régideso
Pas encore d'évaluation
Organisation et Déploiement de la Régideso
10 pages
Philips AS351 Service Manual, Repair Schematics, Online Download
Pas encore d'évaluation
Philips AS351 Service Manual, Repair Schematics, Online Download
13 pages
2016 Mercedes Benz Sprinter Service Booklet
Pas encore d'évaluation
2016 Mercedes Benz Sprinter Service Booklet
34 pages
Catalogue Informatique et Accessoires
Pas encore d'évaluation
Catalogue Informatique et Accessoires
7 pages
Dossier Technique Doseur Volumétrique SO2
Pas encore d'évaluation
Dossier Technique Doseur Volumétrique SO2
25 pages
IMANEFARRASSCV
Pas encore d'évaluation
IMANEFARRASSCV
1 page
Fiche de Suivi Du Plan D'actions HSE
Pas encore d'évaluation
Fiche de Suivi Du Plan D'actions HSE
1 page
Déclaration des revenus 2023 en Belgique
Pas encore d'évaluation
Déclaration des revenus 2023 en Belgique
2 pages
Communication en Santé
Pas encore d'évaluation
Communication en Santé
66 pages
Fiscalité des produits participatifs au Maroc
Pas encore d'évaluation
Fiscalité des produits participatifs au Maroc
14 pages
Formation en Tourisme Numérique
Pas encore d'évaluation
Formation en Tourisme Numérique
1 page
Livret Master Économie Appliquée 2017-2018
Pas encore d'évaluation
Livret Master Économie Appliquée 2017-2018
56 pages
TD HS (Fiche 1)
Pas encore d'évaluation
TD HS (Fiche 1)
2 pages
Support R
Pas encore d'évaluation
Support R
45 pages
Facture SFR Fibre Starter Juillet 2024
Pas encore d'évaluation
Facture SFR Fibre Starter Juillet 2024
4 pages
Facteur de qualité et résonance RLC
Pas encore d'évaluation
Facteur de qualité et résonance RLC
4 pages
COURS DNS Complet
Pas encore d'évaluation
COURS DNS Complet
21 pages
Audit Comptable: Clients, Immobilisations, Trésorerie et Fournisseurs
Pas encore d'évaluation
Audit Comptable: Clients, Immobilisations, Trésorerie et Fournisseurs
3 pages
Tuyaux Plastiques pour Évacuation des Eaux
Pas encore d'évaluation
Tuyaux Plastiques pour Évacuation des Eaux
88 pages
Les 8 Familles de Pannes Frigorifiques
Pas encore d'évaluation
Les 8 Familles de Pannes Frigorifiques
4 pages
PA2-Préparation À La Certification COFREND Niveau 2 UT - PA Ferreitic Weld - Copie
Pas encore d'évaluation
PA2-Préparation À La Certification COFREND Niveau 2 UT - PA Ferreitic Weld - Copie
1 page
CH 4 Partie3 CodageCanal 2324
Pas encore d'évaluation
CH 4 Partie3 CodageCanal 2324
37 pages
Modele Attest Hebergement PDF
Pas encore d'évaluation
Modele Attest Hebergement PDF
1 page