République du Cameroun Republic of Cameroon
Paix-Travail-Patrie Peace-Work-Fatherland
------------- -------------
Ministère de l’Enseignement Supérieur Ministry of Higher Education
-------------- -------------
UNIVERSITE DE MAROUA THE UNIVERSITY OF MAROUA
-------------- -------------
FACULTE DES SCIENCES PO Box/PB 814 Maroua FACULTY OF SCIENCE
-------------- http:/[Link] -------------
DEPARTEMENT DE MATHEMATIQUES- decanat@[Link] DEPARTMENT OF MATHEMATICS AND
INFORMATIQUE COMPUTER SCIENCE
SYLLABUS, UE Ingénierie des Données, INF356
1. SIGLE ET TITRE DE LA FORMATION
Institution : Université de Maroua
Intitulé de l'UE : Ingénierie des Données
Code UE : INF356
Niveau d'étude : Troisième année Informatique
Semestre d'enseignement : 06
Crédits alloués : 5
Nombre d’heures : 50h (CM : 25H, TD : 15H, TPE : 10H)
2. ENSEIGNANTS ET COORDONNÉES
Identité : Dr. GAZISSOU BALAMA
Affiliation : Département de Mathématiques-Informatique (FS/Univ-Ndéré)
Contact : Tél : 694101198;
e-mail : gazissoubalraph@[Link]
Disponibilité :
Horaires Lundi Mardi Mercredi Jeudi Vendredi Samedi
7H30-9H30
09H30-11H30
11H30-13H30
14H-16H30
17H-19H30
N.B : Nous aurons besoin d’au moins 50 heures pour ce cours. Le programme s’adaptera à la
disponibilité réelle des salles et charges horaires.
MI-2019-2020 Page 1
3. PRÉ REQUIS.
Les connaissances en programmation et en bases de données étudiées dans les niveaux
inférieurs. Les étudiants doivent fournir le meilleur d'eux même et travailler continûment.
4. DESCRIPTIF ET OBJECTIFS DE LA FORMATION.
Objectif général : Etude des méthodes et techniques de traitement des métadonnées.
Profil : Enseignement destiné aux étudiants de la filière informatique
Contenu :
Ce cours contient 4 parties principales :
- Un chapitre pour introduire les objectifs du cours
- un chapitre sur le Big Data
- un chapitre sur le Data Engineering
- et un chapitre pour introduire le Machine Learning (qui sera certainement approfondi au cycle
master).
Cibles : Enseignement destiné aux Étudiants d’Informatique Licence 3.
Évaluations : Les séances de TD permettront d’évaluer le niveau d’assimilation des
candidats. Un CC de 2 heures comptant pour 20% sera fait à mi-parcours et un examen final
de 3 heures comptant pour 70% sera fait à la fin du semestre. Les candidats auront l’occasion
de s’exercer en TPE pour 10% de la note finale sur des thèmes de réflexions liés au
programme.
5. SCÉNARII D’APPRENTISSAGE
Une formation en présentiel.
Une formation personnelle (auto-formation) dans laquelle chaque apprenant va
travailler de façon autonome, en suivant les consignes et traiter les diverses activités
proposées
Une formation en équipes ou des apprenants forment de petits groupes de travail et
collaborent pour traiter des problèmes proposés dans l’UE. Ils peuvent être encadrés
par un tuteur. Des thèmes de réflexion pour approfondir leurs connaissances seront
donnés à cet effet.
MI-2019-2020 Page 2
6. TABLE DES MATIÈRES
CHAPITRE 1 : Introduction et objectifs du cours « Ingénierie des données »
1- Définitions des termes associés au cours :
Ingénierie
Donnée
BigData
Data architect
ML engineer
Data engineer
Data scientist
Data analyst
Machine Learning
2- Situation du cours ingénierie des données en informatique
Big Data ∈ Data Science ou bien Big Data ∋ Data Science ?
Big Data ∈ Data Ingineering ou bien Big Data ∋ Data Ingineering ?
On ne saurait faire de l’ingénierie des données sans faire allusion au Big Data. Tout comme on ne
saurait faire du Big Data sans parler du Machine Learning.
Nous aurons donc :
- un chapitre sur le Big Data
- un chapitre sur le Data Engineering
- et un chapitre pour introduire le Machine Learning (qui sera certainement approfondi au cycle
master).
MI-2019-2020 Page 3
CHAPITRE 2 : LE BIG DATA OU MEGADONNEES
I- Historique des Bases de Données (BD)
II- Emergence des Big Data
III- Caractérisation des mégadonnées
1- Modèle des 3V étendu aux 5V
2- Mégadonnées et informatique décisionnelle
IV- Quelques domaines d’application des mégadonnées
1- Domaine de la recherche scientifique
2- Domaine de la santé
3- Domaine socio-économique et politique
4- Domaine du transport et de l’énergie
5- Autres domaines
V- Stockage et gestion des mégadonnées
1- Limites des bases de données relationnelles et Cloud Computing
2- Intérêt de MapReduce et de Hadoop
3- Bases de données NoSQL
4- Principaux modèles de bases de données NoSQL
5- Alternatives au NoSQL : bases de données NewSQL
VI- Analyse des mégadonnées
1- Intérêt de l’apprentissage automatique
2- Analyse de mégadonnées stockées
3- Analyse de flots de données
4- Analyse de données
5- Analyse de textes
6- Analyse du Web
CHAPITRE 3 : DATA ENGINIEERING
Ce chapitre sera théorique et pratique
I- MapReduce
II- Base de données NoSQL
1- Contexte d’émergence du NoSQL, classification des solutions
2- Caractéristiques communes, et technologies de HBASE et MongoDB
3- Environnements NoSQL de plus haut niveau
4- Architecture spécifique de Neo4j pour l’analyse de graphes
5- Aspects pratiques d’utilisation de MongoDB
III- HADOOP, HDFS
IV- Cassandra, Spark
MI-2019-2020 Page 4
CHAPITRE 4 : INTRODUCTION AU MACHINE LEARNING
I- Exploration et préparation des données
II- Objectifs et principes du Machine Learning
III- Algorithmes de Machine Learning
BIBLIOGRAPHIE :
1- Laure Soulier, « Introduction BIG DATA », Cours Licence Informatique – Technologies du
Web, Université de Sorbonne, 2016-2017
2- Bernard ESPINASSE, Patrice BELLOT, « Introduction au Big Data -Opportunités, stockage
et analyse des mégadonnées », article, Technologies de l'information | Technologies logicielles
Architectures des systèmes, 10 février 2017.
3- Pierre Nerzic, « Outils pour le BigData » - Université de Rennes, février-mars 2019
Le responsable pédagogique
GAZISSOU BALAMA
LE CHEF DE DEPARTEMENT
MI-2019-2020 Page 5