0% ont trouvé ce document utile (0 vote)

25 vues8 pages

TP1

Ce document présente un TP utilisant des techniques de machine learning pour analyser les données du Titanic. Il inclut le prétraitement des données, la détection d'anomalies avec Isolation Forest, et l'entraînement de modèles de régression logistique et de Random Forest avec optimisation des hyperparamètres. Les performances des modèles sont évaluées à l'aide de la précision et de rapports de classification.

Transféré par

oussamajhimi123

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

25 vues8 pages

TP1

Transféré par

oussamajhimi123

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP1

import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split, GridSearchCV

from [Link] import RandomForestClassifier

from [Link] import StandardScaler

from [Link] import accuracy_score, classification_report

# Monter Google Drive pour accéder aux fichiers

from [Link] import drive

[Link]('/content/drive')

# Charger le fichier Titanic en tant que DataFrame

data = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/[Link]')

print([Link]()) # Afficher les premières lignes du fichier

print([Link]()) # Obtenir des informations générales sur les colonnes et les types de données
TP1

# Vérifier les valeurs manquantes

print([Link]().sum())

# Remplir les valeurs manquantes dans 'Age' avec la médiane

data['Age'].fillna(data['Age'].median(), inplace=True)

# Remplir les valeurs manquantes dans 'Embarked' avec la valeur la plus fréquente (mode)

data['Embarked'].fillna(data['Embarked'].mode()[0], inplace=True)
TP1
# Supprimer les colonnes inutiles

[Link](columns=['Cabin', 'Name', 'Ticket', 'PassengerId'], inplace=True)

# Transformer les variables catégoriques en variables indicatrices

data = pd.get_dummies(data, drop_first=True)

# Vérifier les modifications apportées

[Link]()

# Isolation Forest pour détecter les anomalies

from [Link] import IsolationForest

# Initialiser le modèle Isolation Forest

iso_forest = IsolationForest(contamination=0.05, random_state=42)

# Ajuster le modèle sur les données (en excluant 'Survived' si elle est présente)

X = [Link]('Survived', axis=1, errors='ignore')

iso_forest.fit(X)

# Prédire les anomalies (1 = normal, -1 = anomalie)

TP1
data['anomaly'] = iso_forest.predict(X)

# Compter le nombre d'anomalies détectées

anomalies = data[data['anomaly'] == -1]

print(f"Nombre d'anomalies détectées : {len(anomalies)}")

# Afficher les premières anomalies détectées

[Link]()

# Visualisation des anomalies à l'aide d'un scatter plot

import [Link] as plt

[Link](data['Age'], data['Fare'], color='blue', label='Données normales')

[Link](anomalies['Age'], anomalies['Fare'], color='red', label='Anomalies')

[Link]('Age')

[Link]('Fare')

[Link]()

[Link]()
TP1

# Séparer les données en X (features) et y (cible)

X = [Link]('Survived', axis=1)

y = data['Survived']

# Standardiser les données

scaler = StandardScaler()

X = scaler.fit_transform(X)

# Diviser les données en ensembles d'entraînement et de test

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Initialiser et entraîner un modèle de régression logistique

from sklearn.linear_model import LogisticRegression

model = LogisticRegression(max_iter=200)

[Link](X_train, y_train)
TP1

#[Link](X_train,y_train)

#y_pred=[Link](X_test)

# Prédictions sur l'ensemble de test

y_pred = [Link](X_test)

# Évaluer la performance du modèle

accuracy = accuracy_score(y_test, y_pred)

print(f"Accuracy du modèle : {accuracy * 100:.2f}%")

print("Rapport de classification :\n", classification_report(y_test, y_pred))

print(f'Precision du modele : {accuracy * 100:.2f}%')

print("rapport de classification :\n",classification_report(y_test,y_pred))

TP1

# Définir une grille d'hyperparamètres pour Random Forest

param_grid = {

'n_estimators': [50, 100, 200],

'max_depth': [None, 10, 20, 30],

'min_samples_split': [2, 5, 10]

# Utiliser GridSearchCV pour optimiser les hyperparamètres

grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, scoring='accuracy',

n_jobs=-1)

grid_search.fit(X_train, y_train)

# Afficher les meilleurs hyperparamètres trouvés

print(f"Meilleurs hyperparamètres : {grid_search.best_params_}")

# Prédictions avec le modèle optimisé

y_pred_optimized = grid_search.best_estimator_.predict(X_test)
TP1
# Évaluer la performance du modèle optimisé

accuracy_optimized = accuracy_score(y_test, y_pred_optimized)

print(f"Précision du modèle optimisé : {accuracy_optimized * 100:.2f}%")

print("Rapport de classification après optimisation :\n", classification_report(y_test,

y_pred_optimized))

Vous aimerez peut-être aussi

Resume Machine Learning
Pas encore d'évaluation
Resume Machine Learning
2 pages
Algo de Classifications
Pas encore d'évaluation
Algo de Classifications
2 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Corr TP3
Pas encore d'évaluation
Corr TP3
15 pages
Prediction Du Churn Client
Pas encore d'évaluation
Prediction Du Churn Client
29 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Analyse des passagers du Titanic en Python
Pas encore d'évaluation
Analyse des passagers du Titanic en Python
3 pages
Classification du Titanic avec Sklearn
Pas encore d'évaluation
Classification du Titanic avec Sklearn
4 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Exercice Random Forest Classification Bayesienne
Pas encore d'évaluation
Exercice Random Forest Classification Bayesienne
5 pages
Titanic Machine Learning
Pas encore d'évaluation
Titanic Machine Learning
13 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
Naive Ba Yes
Pas encore d'évaluation
Naive Ba Yes
2 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
Forêt Aléatoire
100% (1)
Forêt Aléatoire
1 page
TP3: Classification avec KNN, SVM et Arbre de Décision
100% (2)
TP3: Classification avec KNN, SVM et Arbre de Décision
16 pages
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
Pas encore d'évaluation
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
6 pages
Titanic Bon
Pas encore d'évaluation
Titanic Bon
29 pages
TP Classification
Pas encore d'évaluation
TP Classification
3 pages
TP-regression Master QFM 2023
Pas encore d'évaluation
TP-regression Master QFM 2023
13 pages
Rapport
Pas encore d'évaluation
Rapport
4 pages
Code
Pas encore d'évaluation
Code
4 pages
TP2 A Rendre
Pas encore d'évaluation
TP2 A Rendre
5 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
Arbre de Décision pour Cyphose et Jeu
Pas encore d'évaluation
Arbre de Décision pour Cyphose et Jeu
9 pages
TP1 Regression Logistique
Pas encore d'évaluation
TP1 Regression Logistique
5 pages
TP1 Progression Linéaire Simple
Pas encore d'évaluation
TP1 Progression Linéaire Simple
6 pages
Architecture CC1
Pas encore d'évaluation
Architecture CC1
2 pages
Atelier 2 Machine Learning
Pas encore d'évaluation
Atelier 2 Machine Learning
5 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
Le Problème de Classification Avec Support Vector Machines (SVM)
Pas encore d'évaluation
Le Problème de Classification Avec Support Vector Machines (SVM)
4 pages
TP 5 Machine Learning
Pas encore d'évaluation
TP 5 Machine Learning
10 pages
TS32Bflexion3p 2025 06 02
Pas encore d'évaluation
TS32Bflexion3p 2025 06 02
2 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
Traitement de données et prédiction de classes
Pas encore d'évaluation
Traitement de données et prédiction de classes
2 pages
Atelier 4
Pas encore d'évaluation
Atelier 4
12 pages
Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
TP4 ClassificationSupervisée Student
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
11 pages
Corr TP2
Pas encore d'évaluation
Corr TP2
19 pages
Configuration Spark pour ML avec PySpark
Pas encore d'évaluation
Configuration Spark pour ML avec PySpark
4 pages
Méthodes Ensemble
Pas encore d'évaluation
Méthodes Ensemble
7 pages
TP4: Apprentissage Supervisé en IA
Pas encore d'évaluation
TP4: Apprentissage Supervisé en IA
5 pages
Résumé Machine Learning&pandas&numpy
Pas encore d'évaluation
Résumé Machine Learning&pandas&numpy
26 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
Metrics Lab
Pas encore d'évaluation
Metrics Lab
4 pages
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
Pas encore d'évaluation
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
24 pages
Projet Python 2
Pas encore d'évaluation
Projet Python 2
4 pages
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
Pas encore d'évaluation
TP5: Régression Linéaire Sur Un Cas Réel Avec Scikit-Learn: Etape 1: Importer Les Librairies
4 pages
Atelier Python IA pour Débutants
Pas encore d'évaluation
Atelier Python IA pour Débutants
3 pages
TP4 - KNN - EX1 K
Pas encore d'évaluation
TP4 - KNN - EX1 K
4 pages
TP 04 Afd PMC
Pas encore d'évaluation
TP 04 Afd PMC
6 pages
TP RN Ensta 2018
Pas encore d'évaluation
TP RN Ensta 2018
20 pages
TP6 SVM
Pas encore d'évaluation
TP6 SVM
4 pages
Prijet Python
Pas encore d'évaluation
Prijet Python
5 pages
Progres2019 5
Pas encore d'évaluation
Progres2019 5
44 pages
Model Progressi
Pas encore d'évaluation
Model Progressi
2 pages
Med Yassine Tanabene Rapport TP2
Pas encore d'évaluation
Med Yassine Tanabene Rapport TP2
13 pages
Rapport de Stage Derniere Vers
Pas encore d'évaluation
Rapport de Stage Derniere Vers
35 pages
FR Manuel
Pas encore d'évaluation
FR Manuel
9 pages
Devoirs Semaine du 11/05 pour Élèves
Pas encore d'évaluation
Devoirs Semaine du 11/05 pour Élèves
8 pages
Dimanche de La Famille
Pas encore d'évaluation
Dimanche de La Famille
5 pages
Chapitre 1 Gestion Des Risques
100% (1)
Chapitre 1 Gestion Des Risques
82 pages
Outils Et Invites d'IA
Pas encore d'évaluation
Outils Et Invites d'IA
94 pages
Spécifications de Tuyauterie à Enveloppe de Vapeur
Pas encore d'évaluation
Spécifications de Tuyauterie à Enveloppe de Vapeur
4 pages
Roald Dalh
Pas encore d'évaluation
Roald Dalh
9 pages
La Réservation Partie 01
Pas encore d'évaluation
La Réservation Partie 01
20 pages
Plan HACCP Mozzarella
Pas encore d'évaluation
Plan HACCP Mozzarella
3 pages
Gestion D'équipes - Principes de Management
Pas encore d'évaluation
Gestion D'équipes - Principes de Management
11 pages
Activite 18.0 Route Par Défaut-1
Pas encore d'évaluation
Activite 18.0 Route Par Défaut-1
4 pages
Devoir - 2 $ 3 S2 SPC 2BAC
Pas encore d'évaluation
Devoir - 2 $ 3 S2 SPC 2BAC
2 pages
Elas 07-08 - Serie 2
Pas encore d'évaluation
Elas 07-08 - Serie 2
2 pages
Introduction aux bétons hydrauliques
Pas encore d'évaluation
Introduction aux bétons hydrauliques
21 pages
Examen Rattrapage: Commande Robots
100% (2)
Examen Rattrapage: Commande Robots
2 pages
Examen de Rattrapage de Mécanique Des Fluides - ICAA1 - 2024
Pas encore d'évaluation
Examen de Rattrapage de Mécanique Des Fluides - ICAA1 - 2024
1 page
Contrat Moudaraba
75% (4)
Contrat Moudaraba
38 pages
Résumé de Cinquième Chapitre Istqb V.04: Gestion Des Tests
Pas encore d'évaluation
Résumé de Cinquième Chapitre Istqb V.04: Gestion Des Tests
10 pages
Chroma TC Our
Pas encore d'évaluation
Chroma TC Our
63 pages
Note D Information Opv Sib
Pas encore d'évaluation
Note D Information Opv Sib
145 pages
Droites Et Systemes
Pas encore d'évaluation
Droites Et Systemes
5 pages
Théories D'échange International
Pas encore d'évaluation
Théories D'échange International
3 pages
Notre Maison
Pas encore d'évaluation
Notre Maison
1 page
Limites Et Asymptotes
100% (1)
Limites Et Asymptotes
9 pages
Publicité Innovante sur Tickets de Caisse
Pas encore d'évaluation
Publicité Innovante sur Tickets de Caisse
9 pages
Contrat Apple Pay Compte 20008320559 Au 2024-06-20
Pas encore d'évaluation
Contrat Apple Pay Compte 20008320559 Au 2024-06-20
11 pages
Répartition Consolidation Et Remediation 6
Pas encore d'évaluation
Répartition Consolidation Et Remediation 6
3 pages
Ilovepdf Merged
Pas encore d'évaluation
Ilovepdf Merged
36 pages
Comment Présenter Une Soutenance Devant Un Jury
100% (1)
Comment Présenter Une Soutenance Devant Un Jury
65 pages