Module : Machine Learning for Cyber Security
Dernière mise à jour : 01/02/2024
Code HE HNE ECTS
SI-17 21h 10h 3
Responsable Module Jihen Hlel
Enseignants – Intervenants Ahlem Marzouk et Jihen Hlel
Unité pédagogique GL-BD, UP-Math
Unité d’enseignement
Prérequis BD-02 Sys. De Gestion de Bases de Données
MS-39 Calcul scientifique
MS-38 Méthodes numériques pour l'ingénieur
MS-07 Techniques d'estimation pour l'ingénieur
Niveaux et Options 4 -ème NIDS
Objectif du module :
L’objectif de ce cours est de familiariser les étudiants à comprendre, appliquer et évaluer les
modèles du Machine Learning dans le cadre de la Cyber Security.
Mode d’évaluation :
La moyenne de ce module est calculée comme suit :
Moyenne ML = 60% *Examen + 40% * CC
Examen : pratique
CC : Quiz
Acquis d’apprentissage :
A la validation de ce module, l’étudiant sera capable de :
Niveau
Acquis d’apprentissage
d’approfondissement (*)
AA1 Expliquer les concepts clés du ML dans le cadre de la Cyber Security 2
Retenir les principales phases d’un projet machine Learning
AA2 1
1
AA3 Distinguer les différents types d’apprentissage automatique dans le 3
cadre de la Cyber Security
AA4 Identifier les cas d’utilisation de chaque type d’apprentissage dans le 1
cadre de la Cyber Security
AA65 Appliquer les algorithmes de chaque type d’apprentissage dans le 3
cadre de la Cyber Security
AA6 Evaluer la performance des différents algorithmes d’apprentissage. 6
* : (1 : Mémoriser, 2 : Comprendre, 3 : Appliquer, 4 : Analyser, 5 : évaluer, 6 : Créer).
Contenu détaillé :
Chapitre I : Définition des concepts clés
- Comprendre la science des données (DS) et l’Intelligence Artificielle (IA) et leurs relations avec la
Cyber Security
- Identifier la relation entre Machine Learning (ML) et ces concepts de base et la Cyber Security
- Définir les attentes des entreprises du ML et la science des données (DS)
- Comprendre les étapes d’un projet Machine Learning
Situation d’apprentissage Cours intégré
Durée 3h
Rendu Introduction + Méthodes de gestion d’un
Projet Machine Learning
Chapitre II : Préparation des données
- Manipuler les différentes librairies Python destinées à la science des données à
savoir Numpy, scipy, pandas...
- Comprendre les données
- Comprendre et appliquer les différentes activités de la préparation des données (nettoyage,
transformation, sélection des caractéristiques, ingénierie des caractéristiques,..)
Situation d’apprentissage Cours intégré
Durée 3h
Rendu Notebook « Compréhension et
préparation des données »
2
Chapitre III : Modélisation des données : Apprentissage supervisé
- Manipuler des méthodes d’apprentissage supervisé dans le cadre de la Cyber Security
o Méthodes de classification : k-NN, SVM, Arbre de décision.
o Méthodes de régression : Régression Linéaire simple et multiple.
- Evaluer la qualité de la modélisation en utilisant les indicateurs de performances dédiées pour
les méthodes d’apprentissage supervisé.
Situation d’apprentissage Cours intégré
Durée 9h
hRendu Notebook 1 : « KNN for Cyber Security »
Notebook 2 : « SVM for Cyber Security »
Notebook 2 : « Régression Linéaire for Cyber Security
»
Chapitre IV : Modélisation des données : Apprentissage non supervisé
- Manipuler des méthodes d’apprentissage non supervisé dans le cadre de la Cyber Security
Clustering : k-means, et la Classification Ascendante Hiérarchique CAH.
- Evaluer la qualité de la modélisation en utilisant les indicateurs de performances dédiées pour
les méthodes d’apprentissage non supervisé.
Situation d’apprentissage Cours intégré
Durée 6 h
Rendu Notebook 1 : « K-means »
Notebook 2 : « CAH »
Evaluation :
Report/ Présentation TP Project
Homework
Expliquer les concepts clés du machine Learning dans le cadre de
la Cyber Security
X
Retenir les principales phases d’un projet machine Learning
X
3
Distinguer les différents types d’apprentissage automatique
dans le cadre de la Cyber Security
X
Préparer les données pour commander un projet DS en Cyber
Security
X X
Appliquer les algorithmes de chaque type d’apprentissage dans
le cadre de Cyber Security
X X
Evaluer la performance des différents algorithmes
d’apprentissage.
X X
Références :
● Introduction to Statistical Learning, Corrected 7th Printing. Gareth James, Daniela Witten, Trevor Hastie and
Robert Tibshirani, 2013. Springer. Available as PDF: ISLR Seventh [Link]
● Elements of Statistical Learning, 2nd ed. Trevor Hastie, Robert Tibshirani and Jerome Friedman, 2009. Springer.
Available as PDF: ESLII_print12.pdf
● Foundations of Data Science, Avrim Blum, John Hopcroft, and Ravindran Kannan, Thursday 4th January,
2018. Available as PDF: [Link]
● Videos from ISL/ESL. Available online and linked from ISL website. (Links to an external site.)
● A computer (Mac, Linux, or Windows) with an up-to-date operating system and a modern web browser and
your favorite code editor (ViM, emacs, Notepad++,…) and ability to install
Anaconda [Link] (Links to an external site.), to program in Python and R.