0% ont trouvé ce document utile (0 vote)

42 vues5 pages

Travaux Pratiques Cassandra : Restaurants

Ce document présente un travail pratique sur l'utilisation de Cassandra pour créer une base de données de restaurants et d'inspections. Il décrit les étapes pour lancer Cassandra via Docker, créer un Keyspace et des tables, importer des données à partir de fichiers CSV, et effectuer des requêtes CQL. L'objectif final est de gérer une base de données capable de traiter de grandes volumétries d'informations.

Transféré par

Bob Ayoub

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

42 vues5 pages

Travaux Pratiques Cassandra : Restaurants

Transféré par

Bob Ayoub

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cassandra

Travaux Pratiques
Les exercices qui suivent sont à effectuer sur machine, avec Cassandra.
Après avoir lancé votre machine Cassandra (avec docker), vous pourrez
également interagir en ligne de commande avec cqlsh avec la
commande :

docker run -d --name cassandra-docker -p 9842:9842 cassandra

# Cette commande crée et démarre essentiellement un conteneur à partir de
l'image Cassandra avec le nom "cassandra-docker", et l'héberge sur le port
9842.
docker exec -it cassandra-docker bash
cqlsh
# ceci suppose que cassandra-docker est le nom de votre container
# it pour disposer d'un terminal interactif persistant
# cqlsh pour lancer cette commande au démarrage

L’objectif de ces travaux pratiques est la mise en place d’une base

de données représentant des restaurants, et des inspections de ces
restaurants.
Note
Avant de vous lancer dans le travail proprement dit, vous êtes
invités fortement à prendre le temps d’ouvrir cette archive zip et
d’en examiner le contenu (au moins les en-têtes, pour avoir une
première idée de la structure des données initiales).
Bien entendu, on supppose qu’à terme cette base contiendra tous
les restaurants du monde, et toutes les inspections, ce qui justifie
d’utiliser un système apte à gérer de grosses volumétries.
Partie 1: Approche relationnelle
Nous allons étudier ici la création d’une base de données
(appelée Keyspace), puis son interrogation. Cette première phase
du TP consiste à créer la base comme si elle était relationnelle, et
à effectuer des requêtes simples. Une fois les limites atteintes, nous
utiliserons les spécificités de Cassandra pour aller plus loin.

Création de la base de données

Avant d’interroger la base de données, il nous la créer. Pour
commencer:
CREATE KEYSPACE IF NOT EXISTS resto_NY WITH REPLICATION = { 'class' :
'SimpleStrategy', 'replication_factor': 1};

CASSANDRA TP2 | PR. SAIDA ELMENDILI 1

Nous créons ainsi une base de données resto_NY pour laquelle le
facteur de réplication est mis à 1.
Sous cqlsh, vous pouvez maintenant sélectionner la base de
données pour vos prochaines requêtes.
USE resto_NY;

Tables
Nous pouvons maintenant créer les tables (Column Family pour
Cassandra) Restaurant et Inspection à partir du schéma suivant :
CREATE TABLE Restaurant (
id INT, Name VARCHAR, borough VARCHAR, BuildingNum VARCHAR, Street
VARCHAR,
ZipCode INT, Phone text, CuisineType VARCHAR,
PRIMARY KEY ( id )
) ;

CREATE INDEX fk_Restaurant_cuisine ON Restaurant ( CuisineType ) ;

CREATE TABLE Inspection (

idRestaurant INT, InspectionDate date, ViolationCode VARCHAR,
ViolationDescription VARCHAR, CriticalFlag VARCHAR, Score INT, GRADE
VARCHAR,
PRIMARY KEY ( idRestaurant, InspectionDate )
) ;

CREATE INDEX fk_Inspection_Restaurant ON Inspection ( Grade ) ;

Nous pouvons remarquer que chaque inspection est liée à un

restaurant via l’identifiant de ce dernier.
Pour vérifier si les tables ont bien été créées (sous cqlsh).

DESC Restaurant;
DESC Inspection;

Nous pouvons voir le schéma des deux tables mais également des
informations relatives au stockage dans la base Cassandra.

Import des données

Maintenant, nous pouvons importer les fichiers CSV pour remplir

les Column Family :
1. Décompresser le fichier “[Link]” (il contient
le fichier “[Link]” et
“restaurants_inspections.csv”)

Note

CASSANDRA TP2 | PR. SAIDA ELMENDILI 2

En mode console, sur le répertoire de téléchargement du
fichier [Link], il suffit de mettre la commande :
unzip [Link]

2. Importer un fichier CSV :

▪ Dans votre console (machine locale, pas docker), copier
les fichiers sous « Docker » (container “Cassandra”)
▪ docker cp path-to-file/[Link] docker-
container-ID:/
▪ docker cp path-to-file/restaurants_inspections.csv
docker-container-ID:/

Note
Le chemin « path-to-file » correspond à l’endroit où a été
décompressé le fichier [Link]

Le docker-container-ID peut être récupéré grâce à la

commande « docker ps ».

Le container-ID est : ba1040313a70

Exemple :
docker cp C:/restaurants/[Link]
ba1040313a70:/

docker cp
C:/restaurants/restaurants_inspections.csv
ba1040313a70:/

Note
Les fichiers sont copiés à la racine du container, si vous le
changez il faut l’impacter dans l’instruction précédente.
Vous pouvez vérifier l’existence des fichiers dans le
container avec :
ls /*.csv

Dans la console cqlsh, importer les fichiers “[Link]”

et “restaurants_inspections.csv”

CASSANDRA TP2 | PR. SAIDA ELMENDILI 3

use resto_NY ;
COPY Restaurant (id, name, borough, buildingnum, street,
zipcode, phone, cuisinetype)
FROM '/[Link]' WITH DELIMITER=',';
COPY Inspection (idrestaurant, inspectiondate,
violationcode,
violationdescription, criticalflag,
score, grade)
FROM '/restaurants_inspections.csv' WITH DELIMITER=',';

Pour vérifier le contenu des tables:

SELECT count(*) FROM Restaurant;
SELECT count(*) FROM Inspection;

Interrogation

Les requêtes qui suivent sont à exprimer

avec CQL (pour Cassandra Query Language) qui est fortement
inspirée de SQL.

CASSANDRA TP2 | PR. SAIDA ELMENDILI 4

Requêtes CQL
Pour la suite des exercices, exprimer en CQL les requêtes suivantes
:
1. Liste de tous les restaurants.
2. Liste des noms de restaurants.
3. Nom et quartier (borough) du restaurant N° 41569764.
4. Dates et grades des inspections de ce restaurant.
5. Noms des restaurants de cuisine Française (French).
6. Noms des restaurants situés
dans BROOKLYN (attribut borough).
7. Grades et scores donnés pour une inspection pour le
restaurant n° 41569764 avec un score d’au moins 10.
8. Grades (non nuls) des inspections dont le score est
supérieur à 30.
9. Utilisons les deux indexes
sur Restaurant (borough et cuisineType). Trouvez tous
les noms de restaurants français de Brooklyn.

CASSANDRA TP2 | PR. SAIDA ELMENDILI 5

Vous aimerez peut-être aussi

Cassandra TP15
Pas encore d'évaluation
Cassandra TP15
4 pages
TP 2 Cassandra
Pas encore d'évaluation
TP 2 Cassandra
9 pages
Manipulation des données avec CQL Cassandra
Pas encore d'évaluation
Manipulation des données avec CQL Cassandra
3 pages
Atelier 3 Cassandra
Pas encore d'évaluation
Atelier 3 Cassandra
3 pages
Introduction à Cassandra et CQL
Pas encore d'évaluation
Introduction à Cassandra et CQL
7 pages
Les Bases de Données NoSQL2
Pas encore d'évaluation
Les Bases de Données NoSQL2
10 pages
TD 2023 2024 CM2 Exo1
Pas encore d'évaluation
TD 2023 2024 CM2 Exo1
2 pages
Exercices NoSQL Vs SQL Avec Réponses v2
Pas encore d'évaluation
Exercices NoSQL Vs SQL Avec Réponses v2
16 pages
Guide Complet Apache Cassandra
Pas encore d'évaluation
Guide Complet Apache Cassandra
66 pages
Guide Pratique Cassandra: Installation et CQL
Pas encore d'évaluation
Guide Pratique Cassandra: Installation et CQL
7 pages
Introduction à Cassandra et CQL
Pas encore d'évaluation
Introduction à Cassandra et CQL
8 pages
TP 5
Pas encore d'évaluation
TP 5
3 pages
TP1 PostgreSQL 2020
Pas encore d'évaluation
TP1 PostgreSQL 2020
3 pages
TP N°3 Nosql: Enoncé
Pas encore d'évaluation
TP N°3 Nosql: Enoncé
1 page
TP Noté: Nosql: Exercice 1: Mongodb (Documents)
Pas encore d'évaluation
TP Noté: Nosql: Exercice 1: Mongodb (Documents)
1 page
Chapitre4 P3 NoSQL OrientéColonne Bddav 2025
Pas encore d'évaluation
Chapitre4 P3 NoSQL OrientéColonne Bddav 2025
45 pages
1 ED PolyMarket
Pas encore d'évaluation
1 ED PolyMarket
17 pages
Système de Gestion Bancaire NoSQL
Pas encore d'évaluation
Système de Gestion Bancaire NoSQL
6 pages
TP RestaurantsDB
Pas encore d'évaluation
TP RestaurantsDB
16 pages
Modélisation d'un Système Bancaire NoSQL
Pas encore d'évaluation
Modélisation d'un Système Bancaire NoSQL
11 pages
Création d'une base de données MySQL sur AWS
Pas encore d'évaluation
Création d'une base de données MySQL sur AWS
10 pages
TP sur PostgrelSQL et requêtes SQL
Pas encore d'évaluation
TP sur PostgrelSQL et requêtes SQL
8 pages
Atelier PostgreSQL : Bases de données spatiales
Pas encore d'évaluation
Atelier PostgreSQL : Bases de données spatiales
9 pages
Guide pratique MongoDB : gestion des restaurants
Pas encore d'évaluation
Guide pratique MongoDB : gestion des restaurants
5 pages
Nosql TP2 2021 2022
Pas encore d'évaluation
Nosql TP2 2021 2022
2 pages
Modèle de base de données pour pizzeria
Pas encore d'évaluation
Modèle de base de données pour pizzeria
3 pages
Introduction à MongoDB : Création et Importation
Pas encore d'évaluation
Introduction à MongoDB : Création et Importation
5 pages
Corrections Série Base de Données
Pas encore d'évaluation
Corrections Série Base de Données
4 pages
Cours Cassandra Ifocop
Pas encore d'évaluation
Cours Cassandra Ifocop
74 pages
Gestion - Restaurant Pandas
Pas encore d'évaluation
Gestion - Restaurant Pandas
3 pages
Examen de bases de données - Semestre 1
Pas encore d'évaluation
Examen de bases de données - Semestre 1
2 pages
Requêtes SQL pour Champignons
Pas encore d'évaluation
Requêtes SQL pour Champignons
1 page
TP Pig and Hive
100% (1)
TP Pig and Hive
3 pages
TDTP6 Sujet
Pas encore d'évaluation
TDTP6 Sujet
3 pages
BDD (PostgreSQL + DBeaver)
Pas encore d'évaluation
BDD (PostgreSQL + DBeaver)
15 pages
Exercices pratiques sur MongoDB
Pas encore d'évaluation
Exercices pratiques sur MongoDB
8 pages
Sauvegarde et architecture de Cassandra
Pas encore d'évaluation
Sauvegarde et architecture de Cassandra
35 pages
Apache Cassandra Master Presentation
Pas encore d'évaluation
Apache Cassandra Master Presentation
7 pages
Introduction à Cassandra et CQL
Pas encore d'évaluation
Introduction à Cassandra et CQL
35 pages
tp1 - Installation Postgresql
Pas encore d'évaluation
tp1 - Installation Postgresql
4 pages
Exercices SQL pour Machine à Café
Pas encore d'évaluation
Exercices SQL pour Machine à Café
7 pages
Exercices pratiques MongoDB Restaurants
Pas encore d'évaluation
Exercices pratiques MongoDB Restaurants
13 pages
Exercices Pratiques MongoDB
Pas encore d'évaluation
Exercices Pratiques MongoDB
13 pages
Importation et requêtes MongoDB
Pas encore d'évaluation
Importation et requêtes MongoDB
4 pages
Bases de données : Objets et requêtes SQL
Pas encore d'évaluation
Bases de données : Objets et requêtes SQL
2 pages
Ateliers MongoDB : Agrégation et Mise à Jour
Pas encore d'évaluation
Ateliers MongoDB : Agrégation et Mise à Jour
4 pages
Exercice Chrayah
Pas encore d'évaluation
Exercice Chrayah
4 pages
TP MongoDB
Pas encore d'évaluation
TP MongoDB
7 pages
Conception de BDR pour MIF24
Pas encore d'évaluation
Conception de BDR pour MIF24
4 pages
Base de données pour restaurant à Guercif
Pas encore d'évaluation
Base de données pour restaurant à Guercif
6 pages
Optimisation de la mémoire PostgreSQL
Pas encore d'évaluation
Optimisation de la mémoire PostgreSQL
12 pages
TD 1 SQL
Pas encore d'évaluation
TD 1 SQL
3 pages
Requêtes SQL pour voyages et musées
Pas encore d'évaluation
Requêtes SQL pour voyages et musées
2 pages
Schéma SQL pour base de données touristique
Pas encore d'évaluation
Schéma SQL pour base de données touristique
2 pages
Correction TP Postgres par Kaci Amaouche
Pas encore d'évaluation
Correction TP Postgres par Kaci Amaouche
10 pages
tp2 Nosql
100% (1)
tp2 Nosql
13 pages
Legi 059 0049
Pas encore d'évaluation
Legi 059 0049
12 pages
Cours Complet Sur Les Principes Techniques Des Composants Clés Du Big Data
Pas encore d'évaluation
Cours Complet Sur Les Principes Techniques Des Composants Clés Du Big Data
6 pages
CBD Base de Donnee Merise
Pas encore d'évaluation
CBD Base de Donnee Merise
177 pages
Guide de création d'application C# avec EF
Pas encore d'évaluation
Guide de création d'application C# avec EF
37 pages
Chapitre 4 P2
Pas encore d'évaluation
Chapitre 4 P2
27 pages
Table Space
Pas encore d'évaluation
Table Space
16 pages
Guide Veeam Backup pour Pros
Pas encore d'évaluation
Guide Veeam Backup pour Pros
42 pages
SQL: Tables et Requêtes avec Intégrité Référentielle
Pas encore d'évaluation
SQL: Tables et Requêtes avec Intégrité Référentielle
2 pages
Programmation PL/SQL avancée
Pas encore d'évaluation
Programmation PL/SQL avancée
96 pages
Introduction aux Bases de Données Relationnelles
Pas encore d'évaluation
Introduction aux Bases de Données Relationnelles
120 pages
Gestion NTFS et scripts AD pour utilisateurs
Pas encore d'évaluation
Gestion NTFS et scripts AD pour utilisateurs
8 pages
DS SGBD SMI S5 2018-2019 Session Ordinaire
Pas encore d'évaluation
DS SGBD SMI S5 2018-2019 Session Ordinaire
2 pages
Exercices SQL : Création et Manipulation de Données
Pas encore d'évaluation
Exercices SQL : Création et Manipulation de Données
7 pages
TP1
100% (1)
TP1
3 pages
Commandes SQL pour Manipuler des Données
Pas encore d'évaluation
Commandes SQL pour Manipuler des Données
11 pages
Indexation
Pas encore d'évaluation
Indexation
48 pages
D78846FR20 sg1
Pas encore d'évaluation
D78846FR20 sg1
376 pages
Empaquetage d'une application Java en JAR et EXE
Pas encore d'évaluation
Empaquetage d'une application Java en JAR et EXE
29 pages
Examen Big Data : QCM et Questions clés
Pas encore d'évaluation
Examen Big Data : QCM et Questions clés
5 pages
Administration Avancée des Bases de Données
Pas encore d'évaluation
Administration Avancée des Bases de Données
225 pages
Gestion des utilisateurs et droits BDD
Pas encore d'évaluation
Gestion des utilisateurs et droits BDD
25 pages
Sécurité des Bases de Données SQL 2019
Pas encore d'évaluation
Sécurité des Bases de Données SQL 2019
4 pages
2-Chapitre2 Partie2
Pas encore d'évaluation
2-Chapitre2 Partie2
15 pages
DataMining 1 2
Pas encore d'évaluation
DataMining 1 2
80 pages
Introduction au Data Mining et ses Applications
Pas encore d'évaluation
Introduction au Data Mining et ses Applications
47 pages
Requêtes SQL pour CINEBASE 2023
Pas encore d'évaluation
Requêtes SQL pour CINEBASE 2023
1 page
Gestion Inscriptions Étudiants PL/SQL
Pas encore d'évaluation
Gestion Inscriptions Étudiants PL/SQL
2 pages
TP Sur Les BDD
100% (1)
TP Sur Les BDD
13 pages
Série 2 - Base de Données-Corrigé
Pas encore d'évaluation
Série 2 - Base de Données-Corrigé
5 pages
Intégration J2EE avec MySQL : Exemple Pratique
Pas encore d'évaluation
Intégration J2EE avec MySQL : Exemple Pratique
2 pages