Fragmentation

La fragmentation est le processus de décomposition d'une base de données logique en un ensemble de sous-bases de données. La fragmentation permet de stocker les données à proximité de leur lieu d'utilisation et d'exécuter des sous-requêtes en parallèle.

Transféré par

mngkp

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

323 vues27 pages

Fragmentation

Transféré par

mngkp

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Répartition des données

1
Plan
• Stratégies de répartition
• Les types de fragmentation
• Données et fédération

2
Principes
• La fragmentation est le processus de décomposition d'une base de
donnée logique en un ensemble de "sous" bases de données. Cette
décomposition doit être sans perte d'information.
• La fragmentation peut être coûteuse s’il existe des applications qui
possèdent des besoins opposés.
• Les règles de fragmentation
• Les règles à appliquer sont :
• 1. La complétude
– pour toute donnée d’une relation R, il existe un fragment Ri de la relation R
qui possède cette donnée.
• 2. La reconstruction
– pour toute relation décomposée en un ensemble de fragments Ri, il existe
une opération de reconstruction.
– Pour les fragmentations horizontales, l’opération de reconstruction est l’une
union. Pour les fragmentations verticales c’est la jointure.
• 3. La Disjonction 3
Conception d’une base de données
répartie

• La définition du schéma de répartition est une

partie délicate de la phase de conception
d'une BDR
– il n'existe pas de méthode pour trouver la solution
optimale.
– DBA doit prendre des décisions en fonction de
critères techniques et organisationnels
– minimiser le nombre et le temps de transferts
entre sites, le volume de données transférées, les
temps moyens de traitement des requêtes, le
nombre de copies de fragments, etc...
4
Conception de BD répartie
• On ne met en place une BD répartie qu’en cas
de réel besoin
– Démarche de conception délicate
– Gestion complexe
– L’évolution du SI peut invalider la solution retenue…
• Des raisons valables :
– Volumes de données, sites distants, etc.
– Fusions de SI

5
• Conception descendante (top down design)
– On définit un schéma conceptuel global de la base
de données répartie,
– puis on distribue sur les différents sites en des
schémas conceptuels locaux.
• La répartition se fait donc en deux étapes:
– en première étape la fragmentation,
– En deuxième étape l’allocation de ces fragments
aux sites.
• L’approche top down est intéressante quand
on part du néant.
6
• En conception descendante
– Adéquation géographique
– Recherche de performance (I/O, traitements)

7
Migration vers une BD répartie

8
Décomposition

Transaction Distribuée

9
Fragmentation des données
• FRAGMENTATION: Découpage d’une relation R
en fragments R1; R2;… ; Rn

10
Fragmentation Horizontale
– Les tuples sont répartis
– Peut être définie par une sélection
– Fragments disjoints ou non (Duplication partielle)
– Reconstruction par UNION

11
12
Fragmentation Verticale
– Les tuples sont découpés et fragmentés
– Nécessite colonne commune (clé ou unique)
dupliquée

13
Fragmentation verticale
• On projette la table sur des attributs différents
suivant le site.
• Comme frag. horizontale, peut correspondre à
une consolidation ou une recherche de perf.
• La reconstruction des tuples doit être possible
(et validée)
• Forme la plus simple : Décomposition de R
– Identifiant (clef) dans chaque fragment
• Reconstruction par JOINTURE
14
15
Synthèse de la fragmentation

16
Intérêts de la fragmentation
• L’usage : dans le contexte de la répartition des données, il paraît approprié de
travailler sur des sous-ensembles de relations, constituant l’unité de répartition
• L’efficacité : Un stockage des données à proximité du lieu où elles sont le plus
utilisées est essentiel et inversement, les données non nécessaires aux
applications locales ne sont pas emmagasinées inutilement.
• Sous-requêtes en même temps: Lorsque le fragment constitue l’unité de
répartition, une transaction peut être découpée en plusieurs sous-requêtes qui
opèrent sur des fragments. Ceci a pour effet d’accroître le degré de simultanéité,
c'est-à-dire le parallélisme, du point de vue du système dans sa totalité, ce qui
permet aux transactions qui le peuvent, de s’exécuter en parallèle et en toute
sécurité.
• La sécurité: Les données qui ne sont pas indispensables aux applications locales
ne sont pas présentes inutilement à des endroits à la portée des utilisateurs non
17
autorisés
Réseau

18
Mise en pratique de la fragmentation
• Dans les SGBD commerciaux actuels:
– Pas de fragmentation explicite au niveau du
schéma
– Assemblage = création de vue (ou de snapshot)
– Distribution des données :
• Une solution = triggers

19
Mise en oeuvre sous SQL (Assemblage)

• Frag. Horizontale
• CREATE VIEW V1
AS SELECT Table1.cle, Table1.attr1
FROM Table1@site1
UNION
SELECT Table2.cle, Table2.attr1
FROM Table2@site2

20
Mise en œuvre sous SQL (Assemblage)
• Frag. Verticale
• CREATE VIEW V1
AS SELECT Table1.cle, Table1.attr1, Table2.attr2
FROM Table1@site1, Table2@site2
WHERE Table1.cle=Table2.cle
• Remarque :
– l’attribut de fragmentation n’est pas forcément la
clé primaire…
– En frag. verticale, il faut au moins que ce soit une
clé
21
Gestion de l’hétérogénéité
• Hétérogénéité « sans problème »
– SE et réseau : géré par SGBD (si « bon » SGBD)
• Hétérogénéité plus délicate
– SGBD : pb des dialectes de SQL
– passerelles entre SGBD
• Ex : ODBC (au départ sous Windows mais
porté sous d’autres OS)
• Ex : passerelles propriétaires SGBD à SGBD

22
Communication Inter-sites
• Chaque SGBD dispose d’un démon permettant
les connexions distantes, sur un mode client –
serveur Listener (médiateur)
• Chaque SGBD dispose d’une table des BDs
accessibles
– Nom >> doit être unique !!!
– Adresse
– Protocole
• Cette approche permet aussi un équilibrage de
charge transparent…
23
Mise en oeuvre en SQL
(Insertion avec les triggers Oracle)
• CREATE TRIGGER Tr1
INSTEAD OF INSERT on Table
BEGIN
IF :New.cle < 1000 THEN
INSERT INTO Table1@site1(cle,attr1)
VALUES(:New.cle,:New.attr);
ELSE
INSERT INTO Table2@site2(cle,attr2)
VALUES (:New.cle,:New.attr);
END IF;
END; 24
Fédération
– Distribution pré-existante
– Nécessite consolidation, uniformisation («
réconciliation sémantique»)
– Identifier les données semblables
– Accorder leurs types, gérer leur cohérence…
– Interfacer ou adapter les SGBD…
– Ex : fusion, mise en place DW

25
BD fédérée
• Généralement, l’architecture proposée est constituée
de cinq couches ou cinq niveaux d’abstraction :

26
• un schéma local (Local schema) est le schéma
d’une base de données constituant la fédération
;
• un schéma du composant (Component schema)
est dérivé du schéma local par transformation et
il constitue une couche de médiation ;
• un schéma d’export (Export schema) constitue
une sous-partie du schéma du composant. Il
filtre les données accessibles par la fédération.
• Il définit les droits d’accès aux données ;
• le schéma intégré (Integrated schema) compose
un ensemble de schémas d’export. Il définit
comment sont traduites les requêtes effectuées
à son niveau en une multitude de requêtes sur
chaque base de données de la fédération ;
• un schéma externe (External schema) est une
vue du schéma intégré pour un usage particulier
(type d’application, type d’utilisateur…).

Vous aimerez peut-être aussi

Fragmentation et Réplication en BDR
Pas encore d'évaluation
Fragmentation et Réplication en BDR
25 pages
Bases de Donnees Distribuees PDF
Pas encore d'évaluation
Bases de Donnees Distribuees PDF
32 pages
Techniques de Fragmentation Informatique
Pas encore d'évaluation
Techniques de Fragmentation Informatique
40 pages
Spark : Analyse Big Data et RDD
Pas encore d'évaluation
Spark : Analyse Big Data et RDD
42 pages
Examen Ilc Bdda2020 2021
Pas encore d'évaluation
Examen Ilc Bdda2020 2021
2 pages
Spark : RDD et Transformations Optimisées
Pas encore d'évaluation
Spark : RDD et Transformations Optimisées
11 pages
TD Ocl
Pas encore d'évaluation
TD Ocl
2 pages
Cours Hadoop et Big Data
Pas encore d'évaluation
Cours Hadoop et Big Data
105 pages
9 Observateur
Pas encore d'évaluation
9 Observateur
27 pages
Spark-Td 1
Pas encore d'évaluation
Spark-Td 1
3 pages
Compte Rendu TP MongoDB par Hamza
100% (1)
Compte Rendu TP MongoDB par Hamza
36 pages
Introduction à Hadoop et HDFS
Pas encore d'évaluation
Introduction à Hadoop et HDFS
5 pages
QCM Big Data : Testez vos connaissances
Pas encore d'évaluation
QCM Big Data : Testez vos connaissances
2 pages
Base de Données Nosql
Pas encore d'évaluation
Base de Données Nosql
8 pages
QCM sur les Principes SOLID en Programmation
Pas encore d'évaluation
QCM sur les Principes SOLID en Programmation
6 pages
Architecture Cloud et Big Data
Pas encore d'évaluation
Architecture Cloud et Big Data
70 pages
Big Data
Pas encore d'évaluation
Big Data
48 pages
Corrige Ds Big Data
Pas encore d'évaluation
Corrige Ds Big Data
4 pages
Pilote automatique et design patterns en GL
Pas encore d'évaluation
Pilote automatique et design patterns en GL
3 pages
Modélisation UML avec Papyrus sous Eclipse
Pas encore d'évaluation
Modélisation UML avec Papyrus sous Eclipse
4 pages
Bases de Données Réparties : Concepts et Conception
Pas encore d'évaluation
Bases de Données Réparties : Concepts et Conception
23 pages
TP 2 Spark
Pas encore d'évaluation
TP 2 Spark
4 pages
Chapitre3-BasesDeDonnées Nosql
Pas encore d'évaluation
Chapitre3-BasesDeDonnées Nosql
15 pages
TD TCP
Pas encore d'évaluation
TD TCP
4 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
30 pages
TD1 Entrepôts
Pas encore d'évaluation
TD1 Entrepôts
4 pages
Modèle Relationnel Objet
Pas encore d'évaluation
Modèle Relationnel Objet
5 pages
BDR Poly2 2010 PDF
Pas encore d'évaluation
BDR Poly2 2010 PDF
16 pages
Gestion des Transactions Après Panne
Pas encore d'évaluation
Gestion des Transactions Après Panne
3 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
3 pages
(Big Data) CHAP3 - MapReduce
Pas encore d'évaluation
(Big Data) CHAP3 - MapReduce
29 pages
Definitions Des Concepts: W Et X - Y Alors XW - Z C, B D, CD - E, CE - GH, G - A)
Pas encore d'évaluation
Definitions Des Concepts: W Et X - Y Alors XW - Z C, B D, CD - E, CE - GH, G - A)
6 pages
Optimisation et Sécurité des Systèmes
Pas encore d'évaluation
Optimisation et Sécurité des Systèmes
30 pages
CorrectionDevoir 4 SMI4 - 2022
Pas encore d'évaluation
CorrectionDevoir 4 SMI4 - 2022
17 pages
Module BDWEB: Révisions et Modélisation BD
Pas encore d'évaluation
Module BDWEB: Révisions et Modélisation BD
50 pages
Exercices-Entrepot de Donnees
Pas encore d'évaluation
Exercices-Entrepot de Donnees
9 pages
Neo4j: Leader des Bases de Données Graphes
Pas encore d'évaluation
Neo4j: Leader des Bases de Données Graphes
17 pages
Patron de conception Abstract Factory
Pas encore d'évaluation
Patron de conception Abstract Factory
10 pages
TP3 LPEBI Correction
Pas encore d'évaluation
TP3 LPEBI Correction
32 pages
3 OLAP 4p
Pas encore d'évaluation
3 OLAP 4p
12 pages
Diagramme de Clases Vers Schéma Relationnel
Pas encore d'évaluation
Diagramme de Clases Vers Schéma Relationnel
6 pages
Optimisation et Modélisation SAT
Pas encore d'évaluation
Optimisation et Modélisation SAT
2 pages
TP7+8 - Jointures + Sous-Interrogation - Correction
Pas encore d'évaluation
TP7+8 - Jointures + Sous-Interrogation - Correction
2 pages
Classe Et Objet
Pas encore d'évaluation
Classe Et Objet
29 pages
Chapitre2-Optimisation Requêtes SQL
Pas encore d'évaluation
Chapitre2-Optimisation Requêtes SQL
38 pages
TD-Chap3-Ingénierie Des données2023FinalStudents
Pas encore d'évaluation
TD-Chap3-Ingénierie Des données2023FinalStudents
22 pages
Préparation et Transformation de Données pour Analyses Statistiques
100% (1)
Préparation et Transformation de Données pour Analyses Statistiques
2 pages
Mod 1
Pas encore d'évaluation
Mod 1
43 pages
Modélisation Entité-Association: Aéroport, Bibliothèque, Éditeur
Pas encore d'évaluation
Modélisation Entité-Association: Aéroport, Bibliothèque, Éditeur
2 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
43 pages
Modélisation Multidimensionnelle des EDs
Pas encore d'évaluation
Modélisation Multidimensionnelle des EDs
59 pages
Cube OLAP Avec Pentaho
Pas encore d'évaluation
Cube OLAP Avec Pentaho
15 pages
Évolution des Bases de Données Relationnelles
Pas encore d'évaluation
Évolution des Bases de Données Relationnelles
25 pages
Chapitre2 Fragmentation
Pas encore d'évaluation
Chapitre2 Fragmentation
13 pages
Bases de Donnes Réparties
100% (3)
Bases de Donnes Réparties
40 pages
Base de Données Réparties
100% (1)
Base de Données Réparties
64 pages
Introduction aux Bases de Données Réparties
Pas encore d'évaluation
Introduction aux Bases de Données Réparties
48 pages
Argo Blockchain et Bases de Données Réparties
Pas encore d'évaluation
Argo Blockchain et Bases de Données Réparties
104 pages
Cours BDRENSI
100% (1)
Cours BDRENSI
214 pages
Chap 6 - BDDR
100% (1)
Chap 6 - BDDR
47 pages
Malware Lockbit
Pas encore d'évaluation
Malware Lockbit
46 pages
Digika Book 2024
Pas encore d'évaluation
Digika Book 2024
70 pages
Publication Resultat Final Groupe 2-23-05 2025
Pas encore d'évaluation
Publication Resultat Final Groupe 2-23-05 2025
14 pages
Management Des Systèmes D'information
Pas encore d'évaluation
Management Des Systèmes D'information
36 pages
Requêtes
Pas encore d'évaluation
Requêtes
56 pages
SUID, GUID Et Sticky Bit
Pas encore d'évaluation
SUID, GUID Et Sticky Bit
11 pages
Mercia Kouni
Pas encore d'évaluation
Mercia Kouni
1 page
Sequence Sur La Colombie 2015-05-26 20-03-4 685
Pas encore d'évaluation
Sequence Sur La Colombie 2015-05-26 20-03-4 685
23 pages
73-Notice 1
Pas encore d'évaluation
73-Notice 1
48 pages
Document 3 Initiation A La Litterature Francophone Marocaine
Pas encore d'évaluation
Document 3 Initiation A La Litterature Francophone Marocaine
5 pages
Devoir2 3AC OUKKA Sem1
Pas encore d'évaluation
Devoir2 3AC OUKKA Sem1
4 pages
Algo Synthese Finie
Pas encore d'évaluation
Algo Synthese Finie
25 pages
Questionnaire À Remplir FANEPIA
Pas encore d'évaluation
Questionnaire À Remplir FANEPIA
25 pages
AGR - Agent D'entretien Des Parcs Et Jardins
Pas encore d'évaluation
AGR - Agent D'entretien Des Parcs Et Jardins
25 pages
Série Des ExerciceS 1
Pas encore d'évaluation
Série Des ExerciceS 1
4 pages
AB-Module 2et 3-2015-2016
Pas encore d'évaluation
AB-Module 2et 3-2015-2016
14 pages
Adaptation d'Impédances Simplifiée
Pas encore d'évaluation
Adaptation d'Impédances Simplifiée
38 pages
Contacts étudiants PFE en automatisme
Pas encore d'évaluation
Contacts étudiants PFE en automatisme
9 pages
Exercices RC 22
Pas encore d'évaluation
Exercices RC 22
4 pages
Ça, Moi Et Surmoi: Définitions
Pas encore d'évaluation
Ça, Moi Et Surmoi: Définitions
5 pages
Cours UML pour Étudiants en Informatique
Pas encore d'évaluation
Cours UML pour Étudiants en Informatique
55 pages
Rapport Mensuel N°3 BAT PART MARS.2024
Pas encore d'évaluation
Rapport Mensuel N°3 BAT PART MARS.2024
14 pages
Gestion de Parc PERFORM
100% (1)
Gestion de Parc PERFORM
89 pages
Exercices de mathématiques I 2020-2021
Pas encore d'évaluation
Exercices de mathématiques I 2020-2021
3 pages
Arrivage HIGER-shacman 2025
Pas encore d'évaluation
Arrivage HIGER-shacman 2025
3 pages
Grille Observation Classe
100% (1)
Grille Observation Classe
1 page
Docteur Alfred Tomatis Un Passeur de La Voix Divine JW
Pas encore d'évaluation
Docteur Alfred Tomatis Un Passeur de La Voix Divine JW
2 pages
Article 2 L'intelligence Artificielle Chance Ou Danger de L'humanité
Pas encore d'évaluation
Article 2 L'intelligence Artificielle Chance Ou Danger de L'humanité
2 pages
74 Questions Entretien Recrutement
Pas encore d'évaluation
74 Questions Entretien Recrutement
9 pages
Vimec A28
Pas encore d'évaluation
Vimec A28
17 pages
Exercices Corrigés de Statistiques
100% (1)
Exercices Corrigés de Statistiques
39 pages
Flutter Presentation
Pas encore d'évaluation
Flutter Presentation
6 pages
2223 Chap 4 VE
Pas encore d'évaluation
2223 Chap 4 VE
54 pages
Programmation sous Unity Pro
Pas encore d'évaluation
Programmation sous Unity Pro
42 pages
3-Bilan e Puissance
Pas encore d'évaluation
3-Bilan e Puissance
68 pages
S rieTD-3-1
Pas encore d'évaluation
S rieTD-3-1
2 pages