0% ont trouvé ce document utile (0 vote)

171 vues35 pages

Sauvegarde et architecture de Cassandra

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

171 vues35 pages

Sauvegarde et architecture de Cassandra

Transféré par

Haythem Mnasri

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Année Universitaire 2018-

 Introduction
 Caractéristiques
 Concepts clés
 Architecture
 Cassandra Query Language (CQL)
 Références

2
 Inspirée par BigTable de Google.

 Initialement développée par Facebook.

 Reprise par la fondation Apache en 2010.

3
 Orientée colonnes
 Hautement consistante
 Tolérante aux erreurs
 Scalable

4
 Colonne (Column) : triplet contenant un nom, une valeur et un timestamp.

 Ligne (Row) : une ligne est composée d'un ensemble de colonnes. Une ligne est représentée

par une clé et une valeur. Les lignes peuvent être regroupées dans des partitions.

 Famille de colonnes (Column family) : regroupement logique de lignes.

 Keyspace : regroupement de famille de colonnes.

5
Composants
 Noeud(node) : composant de base de Cassandra qui contient les données.

 Data center : ensemble de nœuds.

 Cluster : ensemble de data centers.

 Commit Log : contient toutes les opérations d’écriture (crash recovery).

 Mem-table : après l’écriture des données dans le Commit log, elles sont écrites temporairement
dans la Mem-table.
 SSTable : lorsque Mem-table atteint un certain seuil, les données sont vidées dans un fichier de
disque SSTable

6
Réplication
 Solution pour fournir une sauvegarde lorsqu’un problème se produit.
 Données répliquées pour éviter tout point de défaillance (SPOF).

Facteur de réplication
 Nombre total de réplicas déterminé par le facteur de réplication (Replication Factor).
 Facteur de réplication recommandé = 3.

7
Stratégie de réplication (Replication Strategy).
 Emplacement des réplicas.
 2 types de stratégie : SimpleStrategy et NetworkTopologyStrategy
SimpleStrategy
 Utilisé lorsqu’il n’y a qu’un data center.
 Place le premier réplica sur le nœud sélectionné par le partitionneur
(partitioner). Les réplicas restants sont placés dans le sens des
aiguilles d'une montre.

8
NetworkTopologyStrategy
 Utilisée lorsqu’il y a plus que deux data centers.
 Réplicas définis pour chaque data center séparément.
 Place les réplicas dans le sens des aiguilles d'une montre jusqu'à atteindre
le premier nœud d'un autre rack.
 Place les réplicas sur différents racks.

9
Opérations d’écriture
 Le coordinateur (coordinator) envoie une requête d’écriture aux réplicas.
 Les réplicas reçoivent la requête d’écriture indépendamment de leur niveau de
cohérence (consistency level).
 Consistency level : détermine combien de nœuds répondront à la requête avec un
success acknowledgment.
 Un nœud répond avec un success acknowledgment si les données sont écrites dans le
Commit log et dans la memTable.

10
Opérations d’écriture

1. Lorsque le nœud reçoit une requête d’écriture,

elle est sauvegardée dans le Commit Log.

2. Cassandra écrit les données dans la mem Table.

MemTable stocke temporairement les données en
mémoire. Les données écrites dans la memTable
pour chaque requête d’écriture sont également
écrites dans le Commit log.

3. Lorsque la memTable est saturée, les données

sont vidées dans le fichier de données SSTable.
11
Opérations de lecture

 Le coordinateur (coordinator) envoie une requête de lecture aux réplicas.

 3 types de requêtes de lecture : Direct request, Digest request et Read repair request.

 D’abord, le coordinateur envoie une direct request à l’un des réplicas.

 Ensuite, le coordinateur envoie une digest request au nombre de réplicas spécifié par le
niveau de cohérence et vérifie si les données renvoyées sont des données mises à jour.

 Finalement, le coordinateur envoie une digest request à tous les réplicas restants.

 Si un nœud donne une valeur « périmée », une read repair request en arrière-plan
mettra à jour ces données . Ce processus s'appelle read repair mechanism.

12
Types de données

13
Opérations sur les Keyspaces - Création d’un Keyspace

14
Opérations sur les Keyspaces - Modification d’un Keyspace

15
Opérations sur les Keyspaces - Suppression d’un Keyspace

16
Opérations sur les tables - Création d’une table

17
Opérations sur les tables - Modification d’une table

18
Opérations sur les tables - Suppression d’une table

19
Opérations sur les tables - Table tronquée

20
Opérations sur les données - Ajout de données

21
Opérations sur les données - Interrogation de données

22
Opérations sur les données - Modification de données

23
Opérations sur les données - Suppression de données

24
Opérations sur les Indexes – Création d’un index

25
Opérations sur les Indexes – Suppression d’un index

26
Limites
 Pas d'opérations d’agrégation (min, max, avg,…).
 Pas de “GROUP BY”.
 Pas de “JOIN”.
 Pas de “OR”.
 Pas de filtres sur les colonnes sans la création d’un index.

27
Collections

 BDR : éviter d’utiliser des valeurs multiples dans un même champs.

 Créer une autre table et faire une jointure.

 BDNR : minimiser au maximum les jointures pour faciliter et accélerer la navigation.

 Collections : sets, listes et maps.

28
Collections – Set

 Ensemble non ordonné de valeurs.

 Résoudre le problème de champs multiples, comme les emails par exemple.

29
Opérations sur les collections – Set
 Création de la table « Teacher » avec la colonne « Email » comme collection Set

 Insertion des données dans la collection

30
Collections – List

 Utilisée quand l’ordre d’insertion des éléments compte.

 Utilisée quand la même valeur est insérée plusieurs fois.

31
Opérations sur les collections – List
 Ajout de la colonne « coursenames » de type list à la table « teacher »

 Insertion des données dans la colonne « coursenames »

32
Collections – Map

 Associer deux éléments sous forme de clef/valeur.

33
Opérations sur les collections – Map
 Associer le nom du cours au nom du cours pré-requis.

 Insertion des données

34
 https://www.guru99.com/cassandra-tutorial.html
 https://soat.developpez.com/articles/cassandra/#LIII
 Ploetz, A. et al., Seven NoSQL databases in a week, Packt Publishing, 2018.

Vous aimerez peut-être aussi

Introduction à Cassandra et CQL
Pas encore d'évaluation
Introduction à Cassandra et CQL
35 pages
Chapitre4 P3 NoSQL OrientéColonne Bddav 2025
Pas encore d'évaluation
Chapitre4 P3 NoSQL OrientéColonne Bddav 2025
45 pages
Guide Complet Apache Cassandra
Pas encore d'évaluation
Guide Complet Apache Cassandra
66 pages
Cassandra: Architecture et Stratégies NOSQL
100% (1)
Cassandra: Architecture et Stratégies NOSQL
20 pages
Leçon8 Cassandra
Pas encore d'évaluation
Leçon8 Cassandra
15 pages
Resume Finale
Pas encore d'évaluation
Resume Finale
10 pages
Guide Pratique Cassandra: Installation et CQL
Pas encore d'évaluation
Guide Pratique Cassandra: Installation et CQL
7 pages
SLide1-70 BDD NO SQL-2023
Pas encore d'évaluation
SLide1-70 BDD NO SQL-2023
70 pages
Introduction à Cassandra SGBD Big Data
100% (1)
Introduction à Cassandra SGBD Big Data
26 pages
Introduction - Contexte & Enjeux: Scalables Distribués Structurées Semi-Structurées Non-Structurées
Pas encore d'évaluation
Introduction - Contexte & Enjeux: Scalables Distribués Structurées Semi-Structurées Non-Structurées
16 pages
Résumé Complet - Bases de Données Distribuées
Pas encore d'évaluation
Résumé Complet - Bases de Données Distribuées
10 pages
ECAM NoSQL4MIN Cours3 Slides
Pas encore d'évaluation
ECAM NoSQL4MIN Cours3 Slides
61 pages
Introduction à Cassandra et CQL
Pas encore d'évaluation
Introduction à Cassandra et CQL
8 pages
Introduction à MongoDB et NoSQL
Pas encore d'évaluation
Introduction à MongoDB et NoSQL
17 pages
Introduction Aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction Aux Bases de Données NoSQL
14 pages
Avantages des bases de données NoSQL
Pas encore d'évaluation
Avantages des bases de données NoSQL
5 pages
NoSQL : L'avenir des bases de données
Pas encore d'évaluation
NoSQL : L'avenir des bases de données
26 pages
Bases de données : Relationnelles et NoSQL
Pas encore d'évaluation
Bases de données : Relationnelles et NoSQL
68 pages
Les Bases de Données NoSQL2
Pas encore d'évaluation
Les Bases de Données NoSQL2
10 pages
Support de Cours - BD
Pas encore d'évaluation
Support de Cours - BD
50 pages
Not Only SQL
Pas encore d'évaluation
Not Only SQL
10 pages
Big Data - Section 03
Pas encore d'évaluation
Big Data - Section 03
3 pages
Résumé Optimisation de Requete
Pas encore d'évaluation
Résumé Optimisation de Requete
10 pages
BDD No SQL-2023
Pas encore d'évaluation
BDD No SQL-2023
42 pages
10 Operateurs
Pas encore d'évaluation
10 Operateurs
37 pages
Cours Cassandra Ifocop
Pas encore d'évaluation
Cours Cassandra Ifocop
74 pages
Consistance des données en NoSQL
Pas encore d'évaluation
Consistance des données en NoSQL
73 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
20 pages
Introduction à Cassandra et MongoDB NoSQL
Pas encore d'évaluation
Introduction à Cassandra et MongoDB NoSQL
21 pages
Chapitre 7 - Documents Mongo DB
Pas encore d'évaluation
Chapitre 7 - Documents Mongo DB
23 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
9 pages
Ingénierie - BD MR M1 Cours03 (Partie 1)
Pas encore d'évaluation
Ingénierie - BD MR M1 Cours03 (Partie 1)
36 pages
Introduction au NoSQL et ses types
Pas encore d'évaluation
Introduction au NoSQL et ses types
28 pages
Introduction au NoSQL et ses Avantages
Pas encore d'évaluation
Introduction au NoSQL et ses Avantages
32 pages
Guide complet sur Apache Cassandra
Pas encore d'évaluation
Guide complet sur Apache Cassandra
51 pages
Introduction aux Bases de Données en CPGE
Pas encore d'évaluation
Introduction aux Bases de Données en CPGE
17 pages
Introduction aux bases de données NoSQL
Pas encore d'évaluation
Introduction aux bases de données NoSQL
58 pages
Gérer efficacement une base de données NoSQL
Pas encore d'évaluation
Gérer efficacement une base de données NoSQL
34 pages
BD Nosql Part2
Pas encore d'évaluation
BD Nosql Part2
43 pages
Introduction à HBase et Big Data
Pas encore d'évaluation
Introduction à HBase et Big Data
35 pages
COURSNOSQL
Pas encore d'évaluation
COURSNOSQL
58 pages
Annibal Mysqlcluster
Pas encore d'évaluation
Annibal Mysqlcluster
22 pages
Introduction aux Bases NoSQL
Pas encore d'évaluation
Introduction aux Bases NoSQL
8 pages
ACID et gestion des transactions BDD
Pas encore d'évaluation
ACID et gestion des transactions BDD
2 pages
Chapitre 4 - HBase
Pas encore d'évaluation
Chapitre 4 - HBase
35 pages
Regroupement Travail G4 Donnees NoSQL
Pas encore d'évaluation
Regroupement Travail G4 Donnees NoSQL
16 pages
Structures de données et algorithmes essentiels
Pas encore d'évaluation
Structures de données et algorithmes essentiels
7 pages
1 - Bases de Données - Cours
Pas encore d'évaluation
1 - Bases de Données - Cours
26 pages
Cours MongoDB Par6
Pas encore d'évaluation
Cours MongoDB Par6
8 pages
DM Amphi
Pas encore d'évaluation
DM Amphi
6 pages
Orient DB
Pas encore d'évaluation
Orient DB
27 pages
Introduction aux Bases de Données NoSQL
Pas encore d'évaluation
Introduction aux Bases de Données NoSQL
5 pages
Cours Complet Sur Les Bases de Données NoSQL
Pas encore d'évaluation
Cours Complet Sur Les Bases de Données NoSQL
15 pages
10-Operateurs / Base de Données / SQL
100% (1)
10-Operateurs / Base de Données / SQL
37 pages
Méthodologie de fragmentation de bases de données
Pas encore d'évaluation
Méthodologie de fragmentation de bases de données
8 pages
Aaa) 250220 112732 (1) (Récupération Automatique)
Pas encore d'évaluation
Aaa) 250220 112732 (1) (Récupération Automatique)
7 pages
Exercices NoSQL Vs SQL Avec Réponses v2
Pas encore d'évaluation
Exercices NoSQL Vs SQL Avec Réponses v2
16 pages
Support de Cours BD Plan Chapitre 1 2
Pas encore d'évaluation
Support de Cours BD Plan Chapitre 1 2
12 pages
Chapter 1 Management D'un Projet
Pas encore d'évaluation
Chapter 1 Management D'un Projet
68 pages
Introduction à MongoDB et Modélisation
Pas encore d'évaluation
Introduction à MongoDB et Modélisation
31 pages
Introduction à MongoDB et Modélisation JSON
Pas encore d'évaluation
Introduction à MongoDB et Modélisation JSON
31 pages
MongoDB: Guide CRUD pour Débutants
Pas encore d'évaluation
MongoDB: Guide CRUD pour Débutants
32 pages
Neo4j: Leader des Bases de Données Graphes
Pas encore d'évaluation
Neo4j: Leader des Bases de Données Graphes
17 pages
Guide sur l'indexation dans MongoDB
Pas encore d'évaluation
Guide sur l'indexation dans MongoDB
14 pages
Introduction aux bases de données NoSQL
100% (1)
Introduction aux bases de données NoSQL
46 pages
Fonctions d'Agrégation en MongoDB
Pas encore d'évaluation
Fonctions d'Agrégation en MongoDB
15 pages
Gestion des données et SQL pour Bac Info
100% (2)
Gestion des données et SQL pour Bac Info
10 pages
Formation Aux Logiciels de Gestion Et L'analyse de Bases de Donnees A Ouagadougou
Pas encore d'évaluation
Formation Aux Logiciels de Gestion Et L'analyse de Bases de Donnees A Ouagadougou
2 pages
Introduction à la Méthode MERISE
Pas encore d'évaluation
Introduction à la Méthode MERISE
96 pages
Initiation à la recherche documentaire ULB
Pas encore d'évaluation
Initiation à la recherche documentaire ULB
40 pages
Commandes SQL avec Oracle 11g
Pas encore d'évaluation
Commandes SQL avec Oracle 11g
103 pages
Chapitre 4 PDO 2022
Pas encore d'évaluation
Chapitre 4 PDO 2022
28 pages
QCM JEE - Corrigé
Pas encore d'évaluation
QCM JEE - Corrigé
16 pages
Système de Gestion de Peinture
Pas encore d'évaluation
Système de Gestion de Peinture
68 pages
Epreuve Si Pti
Pas encore d'évaluation
Epreuve Si Pti
5 pages
Introduction au Data Mining et ses Applications
Pas encore d'évaluation
Introduction au Data Mining et ses Applications
43 pages
Chapitre 3: Utiliser L'orientée Objet en PHP
Pas encore d'évaluation
Chapitre 3: Utiliser L'orientée Objet en PHP
42 pages
Examen SGBD : QCM et PL/SQL
Pas encore d'évaluation
Examen SGBD : QCM et PL/SQL
3 pages
Mon Exposé MariaDB YALAWEOGO
Pas encore d'évaluation
Mon Exposé MariaDB YALAWEOGO
11 pages
Guide sur le Dictionnaire de Données Oracle
Pas encore d'évaluation
Guide sur le Dictionnaire de Données Oracle
31 pages
Modèles Entité-Association Université et Services
Pas encore d'évaluation
Modèles Entité-Association Université et Services
4 pages
BI et Big Data : Concepts et Outils
Pas encore d'évaluation
BI et Big Data : Concepts et Outils
30 pages
Bases de données et cache en Node.js
Pas encore d'évaluation
Bases de données et cache en Node.js
9 pages
Examen Nosql SP 1819-1
100% (2)
Examen Nosql SP 1819-1
3 pages
Oracle Database 12c Security
Pas encore d'évaluation
Oracle Database 12c Security
3 pages
Sécurisation Des Bases de Données (POWERPOINT)
Pas encore d'évaluation
Sécurisation Des Bases de Données (POWERPOINT)
30 pages
Introduction à SQL : Création et requêtes
Pas encore d'évaluation
Introduction à SQL : Création et requêtes
43 pages
Chap 3 Operation OLAP
Pas encore d'évaluation
Chap 3 Operation OLAP
45 pages
Conception de Base de Données PharmaLiv
Pas encore d'évaluation
Conception de Base de Données PharmaLiv
5 pages
La Normalisation
Pas encore d'évaluation
La Normalisation
15 pages
Examen Administration Bases de Données Oracle
Pas encore d'évaluation
Examen Administration Bases de Données Oracle
3 pages
Exercice Oracle
Pas encore d'évaluation
Exercice Oracle
2 pages
Méthode Merise pour la conception SI
Pas encore d'évaluation
Méthode Merise pour la conception SI
31 pages
Bases de données avancées avec MySQL
Pas encore d'évaluation
Bases de données avancées avec MySQL
74 pages
Réplication de PostgreSQL : Guide Pratique
Pas encore d'évaluation
Réplication de PostgreSQL : Guide Pratique
2 pages
Sondage sport : problèmes de formatage
Pas encore d'évaluation
Sondage sport : problèmes de formatage
5 pages