Bases de Données NoSQL IRM-ISIL-2-1
Projet Bases de Données NoSQL
Le projet est à réaliser en monôme ou en binôme.
Objectifs : Créer et Gérer une base de données avec MongoDB-Cassandra-ElasticSearch
On vous demande de créer un système de monotoring de données, ce système doit permettre
la collecte, le stockage, la recherche et la visualisation des données en utilisant MongoDB
et/ou Cassandra et ElasticSearch.
Les différentes activités du projet sont :
1. Modélisation des données :
✓ Choix des données (2 points)
Le data set world_bank.json contient des informations sur les indicateurs de
développement de différents pays du monde. Voici quelques exemples de données qui
pourraient être collectées à partir de ce data set :
Pays: Nom du pays
Code du pays: Code ISO du pays
Indicateur: Nom de l'indicateur
Valeur: Valeur de l'indicateur
Année: Année de l'indicateur
Unité: Unité de mesure de l'indicateur
✓ Démarche de modélisation (2 points)
Le modèle de données choisi pour ce projet sera un modèle NoSQL, car les données du
data set world_bank.json sont semi-structurées. MongoDB et Cassandra sont deux
options possibles pour le stockage des données.
➔ Nous avos utilisée MongoDB
2. Collecte des données : utilisez Logstash pour collecter des données à partir de MongoDB
ou Cassandra. (4 points)
3. Stockage des données : enregistrez les données collectées dans Elasticsearch. Créez un
index et mapper les champs pour correspondre aux types de données appropriés. (4 points)
Elasticsearch est un moteur de recherche et d'analyse de données distribué. Il peut être utilisé
pour stocker les données collectées par Logstash.
4. Visualisation des données : utilisez Kibana pour créer des visualisations pour les données
stockées dans Elasticsearch.
✓ Choix des filtres (2 points)
Les filtres peuvent être utilisés pour affiner les données qui seront affichées dans les
visualisations. Voici quelques exemples de filtres :
Filtrer par date
Filtrer par type de données
Filtrer par valeur de champ
✓ Création des graphiques (2 points)
Kibana propose une variété de graphiques différents, tels que des histogrammes, des
courbes, des cartes et des diagrammes circulaires. Le choix du graphique dépendra du
type de données que vous souhaitez visualiser.
5. Recherche des données : utilisez Elasticsearch ou MongoDB ou Cassandra pour
effectuer des recherches avancées ( minimum 5 requêtes ) sur les données. (4 points).
La validation des projets est prévue pour le vendredi 10/05/2024
Un compte redu de votre travail doit être déposé sur la plateforme le jour même.
Bon travail