0% ont trouvé ce document utile (0 vote)

58 vues5 pages

TP: Création D'un Pare-Feu Intelligent Objectifs Du TP

Ce TP vise à créer un pare-feu intelligent en utilisant des techniques de prétraitement des données et d'entraînement de modèles de Machine Learning. Les étapes incluent le nettoyage des données, l'encodage des données catégorielles, la normalisation des données, la création de caractéristiques, et l'entraînement d'un modèle pour détecter les connexions malveillantes. Les participants apprendront à gérer les valeurs manquantes, à classifier les ports, et à évaluer les performances du modèle.

Transféré par

hakimazagriri41

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

58 vues5 pages

TP: Création D'un Pare-Feu Intelligent Objectifs Du TP

Transféré par

hakimazagriri41

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP: Création d'un Pare-feu Intelligent

Objectifs du TP

Ce TP a pour but de vous familiariser avec les techniques de prétraitement des

données et l'entraînement d'un modèle de Machine Learning pour créer un pare-feu
intelligent. Vous apprendrez à :

1. Nettoyer les données (gestion des valeurs manquantes, des doublons, et des formats
incorrects).
2. Encoder les données catégorielles (protocoles, types de connexion, etc.).
3. Normaliser les données numériques (ports, durées, bande passante, etc.).
4. Créer des caractéristiques (feature engineering) à partir des adresses IP, des ports, et des
logs réseau.
5. Entraîner et évaluer un modèle de Machine Learning pour détecter les connexions
malveillantes.

Énoncé du TP

Partie 1 : Charger les Données

1. Données Brutes :

Utilisez le jeu de données suivant contenant des informations sur des connexions
réseau :

data = {
"Adresse IP Source": ["[Link]", "[Link]", "[Link]", "[Link]", "[Link]"],
"Port Source": [5000, 80, 5000, 443, 80],
"Adresse IP Destination": ["[Link]", "[Link]", "[Link]", "[Link]",
"[Link]"],
"Port Destination": [80, 5000, 443, 80, 5000],
"Protocole": ["TCP", "HTTP", "TCP", "HTTPS", "HTTP"],
"Durée (s)": [10, 5, 8, 12, 6],
"Paquets": [100, 50, 80, 120, 60],
"Label": ["Normal", "Malveillant", "Normal", "Malveillant", "Normal"]
}

2. Créer un DataFrame :

Chargez les données dans un DataFrame Pandas.

import pandas as pd

# Données brutes
data = {
"Adresse IP Source": ["[Link]", "[Link]", "[Link]", "[Link]", "[Link]"],
"Port Source": [5000, 80, 5000, 443, 80],

Pr. Sara BAGHDADI ENSA KHOURIBGA

"Adresse IP Destination": ["[Link]", "[Link]", "[Link]", "[Link]", "[Link]"],
"Port Destination": [80, 5000, 443, 80, 5000],
"Protocole": ["TCP", "HTTP", "TCP", "HTTPS", "HTTP"],
"Durée (s)": [10, 5, 8, 12, 6],
"Paquets": [100, 50, 80, 120, 60],
"Label": ["Normal", "Malveillant", "Normal", "Malveillant", "Normal"]
}

# Créer un DataFrame
df = [Link](data)

# Afficher les données brutes

print("Données brutes :")
print(df)

Partie 2 : Nettoyage des Données

1. Gestion des Valeurs Manquantes :

Remplissez les valeurs manquantes dans la colonne "Durée (s)" par la moyenne.

# Remplacer les valeurs manquantes dans "Durée (s)" par la moyenne

df["Durée (s)"].fillna(df["Durée (s)"].mean(), inplace=True)

# Afficher les données après imputation

print("\\nDonnées après imputation :")
print(df)

2. Gestion des Doublons :

Supprimez les lignes en double.

# Supprimer les doublons

df.drop_duplicates(inplace=True)

# Afficher les données après suppression des doublons

print("\\nDonnées après suppression des doublons :")
print(df)

Partie 3 : Encodage des Données Catégorielles

1. Encodage One-Hot :

Transformez la colonne "Protocole" en utilisant l'encodage One-Hot.

# Encodage One-Hot pour la colonne "Protocole"

df = pd.get_dummies(df, columns=["Protocole"], prefix="Protocole")

# Afficher les données après encodage One-Hot

print("\\nDonnées après encodage One-Hot :")
print(df)

2. Encodage Label :

Pr. Sara BAGHDADI ENSA KHOURIBGA

Transformez la colonne "Label" en utilisant l'encodage Label (0 pour "Normal", 1 pour "Malveillant").

from [Link] import LabelEncoder

# Initialiser l'encodeur
encoder = LabelEncoder()

# Encodage Label pour la colonne "Label"

df["Label Encodé"] = encoder.fit_transform(df["Label"])

# Afficher les données après encodage Label

print("\\nDonnées après encodage Label :")
print(df)

Partie 4 : Normalisation des Données

1. Normalisation :

Normalisez les colonnes "Durée (s)" et "Paquets" pour les mettre à l'échelle dans l'intervalle [0, 1].

from [Link] import MinMaxScaler

# Initialiser le normaliseur
scaler = MinMaxScaler()

# Normaliser les colonnes "Durée (s)" et "Paquets"

df[["Durée (s)", "Paquets"]] = scaler.fit_transform(df[["Durée (s)", "Paquets"]])

# Afficher les données après normalisation

print("\\nDonnées après normalisation :")
print(df)

Partie 5 : Création de Caractéristiques (Feature Engineering)

1. Extraire des Informations des Adresses IP :

Extrayez les octets des adresses IP source et destination.

# Extraire les octets des adresses IP source

df["Octet1 Source"] = df["Adresse IP Source"].apply(lambda x: int([Link](".")[0]))
df["Octet2 Source"] = df["Adresse IP Source"].apply(lambda x: int([Link](".")[1]))
df["Octet3 Source"] = df["Adresse IP Source"].apply(lambda x: int([Link](".")[2]))
df["Octet4 Source"] = df["Adresse IP Source"].apply(lambda x: int([Link](".")[3]))

# Extraire les octets des adresses IP destination

df["Octet1 Destination"] = df["Adresse IP Destination"].apply(lambda x: int([Link](".")[0]))
df["Octet2 Destination"] = df["Adresse IP Destination"].apply(lambda x: int([Link](".")[1]))
df["Octet3 Destination"] = df["Adresse IP Destination"].apply(lambda x: int([Link](".")[2]))
df["Octet4 Destination"] = df["Adresse IP Destination"].apply(lambda x: int([Link](".")[3]))

# Afficher les données après extraction des octets

print("\\nDonnées après extraction des octets :")
print(df)

2. Créer une Colonne "Type de Port" :

Pr. Sara BAGHDADI ENSA KHOURIBGA

Classez les ports source et destination en "Ports connus" (0-1023), "Ports enregistrés" (1024-49151), et
"Ports dynamiques" (49152-65535).

# Fonction pour classifier les ports

def classifier_port(port):
if 0 <= port <= 1023:
return "Connu"
elif 1024 <= port <= 49151:
return "Enregistré"
else:
return "Dynamique"

# Appliquer la classification aux ports source et destination

df["Type de Port Source"] = df["Port Source"].apply(classifier_port)
df["Type de Port Destination"] = df["Port Destination"].apply(classifier_port)

# Afficher les données après classification des ports

print("\\nDonnées après classification des ports :")
print(df)

Partie 6 : Entraînement d'un Modèle de Machine Learning

1. Séparation des Données :

Divisez les données en ensembles d'entraînement et de test.

from sklearn.model_selection import train_test_split

# Séparer les caractéristiques (X) et la cible (y)

X = [Link](columns=["Label", "Label Encodé", "Adresse IP Source", "Adresse IP Destination"])
y = df["Label Encodé"]

# Diviser les données en ensembles d'entraînement et de test

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Afficher les dimensions des ensembles

print("Dimensions de X_train :", X_train.shape)
print("Dimensions de X_test :", X_test.shape)

2. Choix du Modèle :

Utilisez un modèle de classification, comme un arbre de décision.

from [Link] import DecisionTreeClassifier

# Initialiser le modèle
model = DecisionTreeClassifier(random_state=42)

# Entraîner le modèle
[Link](X_train, y_train)

# Afficher les performances du modèle

print("Score sur l'ensemble d'entraînement :", [Link](X_train, y_train))
print("Score sur l'ensemble de test :", [Link](X_test, y_test))

1. Évaluation du Modèle :

Pr. Sara BAGHDADI ENSA KHOURIBGA

Évaluez les performances du modèle en utilisant des métriques comme la précision, le rappel, et
la matrice de confusion.

from [Link] import classification_report, confusion_matrix

# Faire des prédictions sur l'ensemble de test

y_pred = [Link](X_test)

# Afficher le rapport de classification

print("\\nRapport de classification :")
print(classification_report(y_test, y_pred))

# Afficher la matrice de confusion

print("\\nMatrice de confusion :")
print(confusion_matrix(y_test, y_pred))

Pr. Sara BAGHDADI ENSA KHOURIBGA

Vous aimerez peut-être aussi

Rapport Pare Feu Intelligent
Pas encore d'évaluation
Rapport Pare Feu Intelligent
2 pages
Projet ML
Pas encore d'évaluation
Projet ML
8 pages
1
Pas encore d'évaluation
1
6 pages
Examen NIDS
Pas encore d'évaluation
Examen NIDS
4 pages
Exercices
Pas encore d'évaluation
Exercices
10 pages
Atelier 4
Pas encore d'évaluation
Atelier 4
12 pages
TP1 Compréhension Et Préparation Des Données
Pas encore d'évaluation
TP1 Compréhension Et Préparation Des Données
5 pages
Examen TP Data Science 2024
Pas encore d'évaluation
Examen TP Data Science 2024
4 pages
Prédiction de Crédit avec IA
Pas encore d'évaluation
Prédiction de Crédit avec IA
29 pages
Tp2: Deep Learning: Tensorflow
Pas encore d'évaluation
Tp2: Deep Learning: Tensorflow
9 pages
Ai TP1 2024
Pas encore d'évaluation
Ai TP1 2024
5 pages
Exercices Data Science Complet
Pas encore d'évaluation
Exercices Data Science Complet
2 pages
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
Pas encore d'évaluation
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
28 pages
TP15
Pas encore d'évaluation
TP15
6 pages
TP 1 Spark
Pas encore d'évaluation
TP 1 Spark
3 pages
Support
Pas encore d'évaluation
Support
17 pages
Yango
Pas encore d'évaluation
Yango
44 pages
Opérateurs Python pour Réseaux et Sécurité
Pas encore d'évaluation
Opérateurs Python pour Réseaux et Sécurité
1 page
Yango
Pas encore d'évaluation
Yango
35 pages
Atelier 3
Pas encore d'évaluation
Atelier 3
6 pages
Fiche TP4
Pas encore d'évaluation
Fiche TP4
4 pages
TP 5 2IoT
Pas encore d'évaluation
TP 5 2IoT
3 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
Configuration Spark pour ML avec PySpark
Pas encore d'évaluation
Configuration Spark pour ML avec PySpark
4 pages
SNMP in Action 2
Pas encore d'évaluation
SNMP in Action 2
4 pages
Paragraph
Pas encore d'évaluation
Paragraph
135 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Intro Au Machine Learning
Pas encore d'évaluation
Intro Au Machine Learning
12 pages
Mathématiques pour Machine Learning
Pas encore d'évaluation
Mathématiques pour Machine Learning
6 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
TP Neuralnet Partie1
Pas encore d'évaluation
TP Neuralnet Partie1
4 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
TP1 Classification Par Les K Plus Proches Voisins 23 24
Pas encore d'évaluation
TP1 Classification Par Les K Plus Proches Voisins 23 24
4 pages
Le Machine Learning Avec Python: de La Théorie À La Pratique
0% (1)
Le Machine Learning Avec Python: de La Théorie À La Pratique
25 pages
Classifieur Cancersein
Pas encore d'évaluation
Classifieur Cancersein
5 pages
Perceptron Python : Code et Explications
Pas encore d'évaluation
Perceptron Python : Code et Explications
8 pages
Analyse des passagers du Titanic en Python
Pas encore d'évaluation
Analyse des passagers du Titanic en Python
3 pages
Resumer Cours Chap 5
Pas encore d'évaluation
Resumer Cours Chap 5
3 pages
Cours Prog Sci
Pas encore d'évaluation
Cours Prog Sci
14 pages
TP4 ClassificationSupervisée Student
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
11 pages
TP02
Pas encore d'évaluation
TP02
9 pages
TP RN Ensta 2018
Pas encore d'évaluation
TP RN Ensta 2018
20 pages
Projet IA MameCheikhSylla - IbraKoundoul
Pas encore d'évaluation
Projet IA MameCheikhSylla - IbraKoundoul
19 pages
Science des Données avec Python
Pas encore d'évaluation
Science des Données avec Python
39 pages
Atelier 2 Machine Learning
Pas encore d'évaluation
Atelier 2 Machine Learning
5 pages
TP4 - KNN VF 2022-2023
Pas encore d'évaluation
TP4 - KNN VF 2022-2023
4 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Optimisation Du Code Python 4
Pas encore d'évaluation
Optimisation Du Code Python 4
29 pages
Naive Ba Yes
Pas encore d'évaluation
Naive Ba Yes
2 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
16 pages
TP: Tensorflow Federated: Exercice 1
Pas encore d'évaluation
TP: Tensorflow Federated: Exercice 1
4 pages
Réseaux de neurones CNN avec CIFAR10
Pas encore d'évaluation
Réseaux de neurones CNN avec CIFAR10
11 pages
Le Problème de Classification Avec Support Vector Machines (SVM)
Pas encore d'évaluation
Le Problème de Classification Avec Support Vector Machines (SVM)
4 pages
Arbre de décision en Data Mining avec Python
100% (1)
Arbre de décision en Data Mining avec Python
6 pages
Rapport TP3 - Deep Learning
Pas encore d'évaluation
Rapport TP3 - Deep Learning
8 pages
Tuto 0-2 - Bases de Python
Pas encore d'évaluation
Tuto 0-2 - Bases de Python
12 pages
Ayyy
Pas encore d'évaluation
Ayyy
23 pages
QCM et Test de Connaissances Java
100% (1)
QCM et Test de Connaissances Java
6 pages
Analyse ACP et AFC des données
Pas encore d'évaluation
Analyse ACP et AFC des données
1 page
Streams
100% (1)
Streams
14 pages
Cours Machine Learning ML and Intelligen
Pas encore d'évaluation
Cours Machine Learning ML and Intelligen
19 pages
Rapport Java
Pas encore d'évaluation
Rapport Java
18 pages
Clustering d'Articles avec K-means et BERT
Pas encore d'évaluation
Clustering d'Articles avec K-means et BERT
11 pages
Guide Universitaire Intelligence Artificielle
100% (5)
Guide Universitaire Intelligence Artificielle
46 pages
Détection d'anomalies réseau LTE
Pas encore d'évaluation
Détection d'anomalies réseau LTE
111 pages
Sécurité des Ports sur Commutateurs
Pas encore d'évaluation
Sécurité des Ports sur Commutateurs
20 pages
Searchsca Esv 286f218df0db1919&rlz 1C9BKJA enFR1058FR1058&hl FR&Q Fortnite+pleasant+piazza&uds AMwkrPtd7
Pas encore d'évaluation
Searchsca Esv 286f218df0db1919&rlz 1C9BKJA enFR1058FR1058&hl FR&Q Fortnite+pleasant+piazza&uds AMwkrPtd7
1 page
Présentation de SSN : Sécurité et Infrastructures
Pas encore d'évaluation
Présentation de SSN : Sécurité et Infrastructures
22 pages
Développement Mobile: Chapitre 4: Interface Graphique Avancee
Pas encore d'évaluation
Développement Mobile: Chapitre 4: Interface Graphique Avancee
18 pages
Compte Rendu TP
Pas encore d'évaluation
Compte Rendu TP
13 pages
TP 3 Routage
Pas encore d'évaluation
TP 3 Routage
6 pages
Https WWW - Dmc.com Media DMC Com Patterns PDF Red Floral Duo
100% (1)
Https WWW - Dmc.com Media DMC Com Patterns PDF Red Floral Duo
5 pages
Les Balise HTML5
Pas encore d'évaluation
Les Balise HTML5
9 pages
Expose D'informatique
Pas encore d'évaluation
Expose D'informatique
12 pages
Index Complet Des Balises HTML
Pas encore d'évaluation
Index Complet Des Balises HTML
2 pages
Guide Configuration Réseau Linux
Pas encore d'évaluation
Guide Configuration Réseau Linux
18 pages
15 Commandes Indispensables PowerShell
100% (1)
15 Commandes Indispensables PowerShell
22 pages
Cours D'informatique Bureautique
100% (6)
Cours D'informatique Bureautique
25 pages
Postfix Local
Pas encore d'évaluation
Postfix Local
5 pages
Découvrez Comment Fonctionnent Les Balises de Script Et Document Ready
Pas encore d'évaluation
Découvrez Comment Fonctionnent Les Balises de Script Et Document Ready
16 pages
Examen Blanc - Epreuve
Pas encore d'évaluation
Examen Blanc - Epreuve
2 pages
CV d'Onard Kasele à Bukavu
Pas encore d'évaluation
CV d'Onard Kasele à Bukavu
3 pages
Facture détaillée Bouygues Telecom
Pas encore d'évaluation
Facture détaillée Bouygues Telecom
3 pages
Redessement Application
Pas encore d'évaluation
Redessement Application
15 pages
TP 2 Automne 2019
Pas encore d'évaluation
TP 2 Automne 2019
3 pages
Procédure À Suivre Declaration Etat 9421
Pas encore d'évaluation
Procédure À Suivre Declaration Etat 9421
4 pages
TP03 Java Avancée
Pas encore d'évaluation
TP03 Java Avancée
3 pages
Plugncast-Manual-3 10 47-001A - FR PD
Pas encore d'évaluation
Plugncast-Manual-3 10 47-001A - FR PD
110 pages
Géographie 5ème
Pas encore d'évaluation
Géographie 5ème
20 pages
Outils de communication pour l'E-learning
Pas encore d'évaluation
Outils de communication pour l'E-learning
11 pages
Js Test 8 Solutions
Pas encore d'évaluation
Js Test 8 Solutions
4 pages
Cahier de Réseau-Chapitre 1 - Généralités Sur Les Réseaux Informatiques
Pas encore d'évaluation
Cahier de Réseau-Chapitre 1 - Généralités Sur Les Réseaux Informatiques
15 pages
الأوراد التجانية المباركة - @28.3.2023 PDF
Pas encore d'évaluation
الأوراد التجانية المباركة - @28.3.2023 PDF
6 pages