Distributed Database Management Systems

This document discusses centralized versus distributed database management systems (DBMS). It compares parallel and distributed DBMS, focusing on distributed DBMS issues like data organization, query processing, concurrency control, and recovery across multiple autonomous and heterogeneous sites. Horizontal data partitioning schemes like round-robin, hash, and range partitioning are described. Predicate-based partitioning generates fragments using a set of predicates to divide relations across sites. The choice of partitioning attributes and predicates affects performance and workload distribution.

Uploaded by

Samar Ali Nosser

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

83 views3 pages

Distributed Database Management Systems

Uploaded by

Samar Ali Nosser

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Centralized versus distributed DBMS

Centralized
Processor

Distributed Databases
Memory Disk … Disk

CPS 216 Distributed

Processor Processor
Advanced Database Systems
…

Memory Disk Memory Disk

Disk
Disk Disk
Disk
2

Parallel versus distributed DBMS Distributed DBMS issues

• Parallel DBMS • Database management with multiple sites that are
– Fast interconnect possibly autonomous and heterogeneous
– Homogeneous hardware/software – Data organization
– Total control over components – Query processing and optimization
• Distributed DBMS – Concurrency control and recovery
– Geographically distributed
• Disconnected operations possible
– Heterogeneous hardware/software
• Performance, data formats, data processing capabilities
– Autonomy of individual sites 3 4

Data organization Partitioning schemes

A1 A2 A3 A4
• Horizontal t1 …
• Top-down approach t2 … Site 1
t3 … Site 2
– Have a database t4 …
………… … … …
– How to partition and/or replicate it across sites … Site k
…
• Bottom-up approach A1 A2 A3 A4
– Have existing databases at different sites • Vertical t1 …
…
t2
– How to integrate them together and deal with t3 …
t4 …
heterogeneity and autonomy ………… … … …
…
…
• Focus for today
– Data partitioning using a top-down approach • Or hybrid Site 1 Site 2 Site k
5 6

1
Horizontal partitioning schemes Properties of a correct partitioning
• Round-robin partitioning R → { R1, R2, …, Rk }
• Hash partitioning
• Range partitioning • Completeness and reconstructability
• Predicate-based partitioning R = R1 ∪ R2 ∪ … ∪ Rk
• Derived horizontal partitioning
• Disjointness
Ri ∩ Rj = Ø for any i ≠ j

7 8

Round-robin partitioning Hash partitioning

R R0 R1 R2 R R0 R1 R2
t1 t1 t1 hash(k1) = 2 t1
t2 t2 t2 hash(k2) = 0 t2
t3 t3 t3 hash(k3) = 0 t3
t4 t4 t4 hash(k4) = 1 t4
… …

• Evenly distributes data • Evenly distributes data (assuming a good hash function)
• Good for full relation scans • Good for point queries and equijoins on the partitioning
• Not good for range queries attribute
9 • Not good for range queries 10

Range partitioning Predicate-based partitioning

R partitioning vector: <4, 7> R0 R1 R2
t1 k1 = 5 t1
• Fragmentation
t2 k2 = 8 t2
– Decide how to divide a relation horizontally into
t3 k3 = 2 t3
fragments using a set of predicates
t4 k4 = 3 t4
…
• Allocation
• Good for range queries on the partitioning attribute
– Decide which fragments go to which site
• The choice of partitioning vector is important
– Bad vector may result in both data skew and execution skew

11 12

2
Predicate-based fragmentation Example
• Given a relation R and a set of simple predicates • Say queries use simple predicates:
P = { p1, p2, …, pn } A < 10, A > 5, D = ’CS’, D = ’EE’
• Generate minterm predicates • Generate, simplify, and eliminate minterms
A < 10 ∧ A > 5 ∧ D = ’CS’ ∧ D = ’EE’ eliminated
– M = { m | m = ∧ (1 ≤ k ≤ n) pk* }, where pk* is either pk
or ¬pk A < 10 ∧ A ≤ 5 ∧ D = ’CS’ ∧ D ≠ ’EE’ A ≤ 5 ∧ D = ’CS’
…
– Simplify minterms in M and eliminate useless ones
• Final set of fragments
• For each m in M, generate a fragment σm R
σ5 < A < 10 ∧ D = ’CS’ R σ5 < A < 10 ∧ D = ’EE’ R
σA ≤ 5 ∧ D = ’CS’ R σA ≤ 5 ∧ D = ’EE’ R
σA ≥ 10 ∧ D = ’CS’ R σA ≥ 10 ∧ D = ’EE’ R
13 14

Choice of simple predicates Allocation of fragments

• Completeness • Tough optimization problem
– There is an equal probability of access by every – Do we replicate fragments?
application to any two tuples in the same minterm – Where we place each copy of each fragment?
fragment • Metrics: minimize query response time; maximize
• If p is used in fragmentation, then σpR either accesses all throughput; minimize network traffic; …
tuples in a fragment or none in a fragment
• Constraints: available storage, bandwidth, processing
• Minimality
power; response time requirement; …
– If a predicate causes a fragment f to be further
fragmented into fi and fj, there should at least one • Issues: origin of queries; selectivity of fragments; query
application that accesses fi and fj differently processing strategies; consistency enforcement; …
» Use all relevant predicates in frequent queries!
15 16

Distributed Database Design Overview
No ratings yet
Distributed Database Design Overview
51 pages
Distributed Databases Overview
No ratings yet
Distributed Databases Overview
33 pages
Distributed Database Design
No ratings yet
Distributed Database Design
49 pages
Unit 1
No ratings yet
Unit 1
28 pages
Lec3 21 10 16.
No ratings yet
Lec3 21 10 16.
52 pages
Distributed Database Design Concepts
No ratings yet
Distributed Database Design Concepts
73 pages
Distributed Database Design Guide
No ratings yet
Distributed Database Design Guide
52 pages
Distribution Design
No ratings yet
Distribution Design
33 pages
ADB - Unit - II (Chapter-2)
No ratings yet
ADB - Unit - II (Chapter-2)
67 pages
Understanding Distributed Database Fragmentation
No ratings yet
Understanding Distributed Database Fragmentation
19 pages
Enterprise Systems: Distributed Databases and Systems - DT211 4
No ratings yet
Enterprise Systems: Distributed Databases and Systems - DT211 4
25 pages
Distributed Databases: CS347 May 30, 2001
No ratings yet
Distributed Databases: CS347 May 30, 2001
48 pages
Chapter 3 Distributed Database Design
No ratings yet
Chapter 3 Distributed Database Design
34 pages
3 Distribution Design
No ratings yet
3 Distribution Design
65 pages
DDB 05 PDF
No ratings yet
DDB 05 PDF
19 pages
TDD: Topics in Distributed Databases: Parallel Database Management Systems
No ratings yet
TDD: Topics in Distributed Databases: Parallel Database Management Systems
38 pages
2 Distribution Design
No ratings yet
2 Distribution Design
73 pages
8th DD 2023-4 Seg 3
No ratings yet
8th DD 2023-4 Seg 3
11 pages
3distribution Design
No ratings yet
3distribution Design
65 pages
Distributed DBM S
No ratings yet
Distributed DBM S
67 pages
Distributed Database Design
No ratings yet
Distributed Database Design
15 pages
Types of Data Fragmentation in DDB Design
No ratings yet
Types of Data Fragmentation in DDB Design
44 pages
Advanced Distributed Databases
No ratings yet
Advanced Distributed Databases
8 pages
Lecture 2 Distriburted Databases
No ratings yet
Lecture 2 Distriburted Databases
45 pages
Fragmentation and Replication in Databases
No ratings yet
Fragmentation and Replication in Databases
24 pages
2 Distribution Design
No ratings yet
2 Distribution Design
73 pages
DDBS Lecture3
No ratings yet
DDBS Lecture3
33 pages
Parallelism in Database Systems
No ratings yet
Parallelism in Database Systems
42 pages
Distributed Database Fundamentals
No ratings yet
Distributed Database Fundamentals
36 pages
Chapter - 7 Distributed Database System
No ratings yet
Chapter - 7 Distributed Database System
29 pages
Lecture 1 Ho
No ratings yet
Lecture 1 Ho
62 pages
Lecture 1 Ho PDF
No ratings yet
Lecture 1 Ho PDF
62 pages
Distributed Database Systems Guide
No ratings yet
Distributed Database Systems Guide
5 pages
CSE 453 Slide 2
No ratings yet
CSE 453 Slide 2
75 pages
4.1 Lecture 4 Distributed Databases
No ratings yet
4.1 Lecture 4 Distributed Databases
42 pages
3-Distribution Design
No ratings yet
3-Distribution Design
66 pages
Week 12 - Distributed Databases
No ratings yet
Week 12 - Distributed Databases
37 pages
Lec 22
No ratings yet
Lec 22
45 pages
Distributed DB Design
No ratings yet
Distributed DB Design
10 pages
Distributed Database Management Systems
No ratings yet
Distributed Database Management Systems
123 pages
On The Exam We Can Have 1 Cheat Sheet: Blg/Edit?Usp Sharing
No ratings yet
On The Exam We Can Have 1 Cheat Sheet: Blg/Edit?Usp Sharing
40 pages
04 - Distributed DBMSs - Concepts and Design
No ratings yet
04 - Distributed DBMSs - Concepts and Design
72 pages
Chapter 2
No ratings yet
Chapter 2
61 pages
7-Distributed DB
No ratings yet
7-Distributed DB
37 pages
Chapter 6 DDBMS
No ratings yet
Chapter 6 DDBMS
41 pages
2 DistDesign
No ratings yet
2 DistDesign
25 pages
Distrubuted Database Concept
No ratings yet
Distrubuted Database Concept
22 pages
Distributed DB New
No ratings yet
Distributed DB New
44 pages
Distributed Databases: Benefits and Issues To Be Considered
No ratings yet
Distributed Databases: Benefits and Issues To Be Considered
25 pages
Parallel and Distributed Databases Overview
No ratings yet
Parallel and Distributed Databases Overview
23 pages
Parallel & Distributed Databases: C S 5 6 1 - S P R I N G 2 0 1 2 Wpi, Mohamed Eltabakh
No ratings yet
Parallel & Distributed Databases: C S 5 6 1 - S P R I N G 2 0 1 2 Wpi, Mohamed Eltabakh
23 pages
Dist DB
No ratings yet
Dist DB
15 pages
ch6 Distributed Database
No ratings yet
ch6 Distributed Database
35 pages
M.C.a. (Sem - IV) Paper - IV - Adavanced Database Techniques
No ratings yet
M.C.a. (Sem - IV) Paper - IV - Adavanced Database Techniques
114 pages
DBMS-Unit 5
No ratings yet
DBMS-Unit 5
27 pages
SAP HCM Training & Certification
No ratings yet
SAP HCM Training & Certification
9 pages
Schering Bridge
No ratings yet
Schering Bridge
2 pages
Textile Printing Techniques Guide
No ratings yet
Textile Printing Techniques Guide
34 pages
Culture and Clil Worksheets
No ratings yet
Culture and Clil Worksheets
38 pages
Fees Can Be Deposited in Any Punjab National Bank Branch Across India
No ratings yet
Fees Can Be Deposited in Any Punjab National Bank Branch Across India
1 page
Mock
No ratings yet
Mock
19 pages
Bobbin Article
No ratings yet
Bobbin Article
6 pages
T7 B17 FBI 302s of Interest Flight 93 FDR - Entire Contents
No ratings yet
T7 B17 FBI 302s of Interest Flight 93 FDR - Entire Contents
76 pages
Thermal Analysis PDF
No ratings yet
Thermal Analysis PDF
62 pages
Bearing Reliability Improvement-SKF
100% (2)
Bearing Reliability Improvement-SKF
55 pages
Portable Hematology Analyzer Guide
No ratings yet
Portable Hematology Analyzer Guide
3 pages
Lugait Solid Waste Management Analysis
No ratings yet
Lugait Solid Waste Management Analysis
20 pages
Daftar GTK 2
No ratings yet
Daftar GTK 2
43 pages
HADR Db2haicu PDF
100% (1)
HADR Db2haicu PDF
58 pages
Huawei E5172 Default Router Login and Password
0% (1)
Huawei E5172 Default Router Login and Password
2 pages
Sap PP Project Implementatinsteps
100% (2)
Sap PP Project Implementatinsteps
5 pages
SAILOR Fleet One Product Sheet
No ratings yet
SAILOR Fleet One Product Sheet
2 pages
Transformer ANSI Curve Shift 58% PDF
No ratings yet
Transformer ANSI Curve Shift 58% PDF
3 pages
IT in Space Connecting The Cosmos
No ratings yet
IT in Space Connecting The Cosmos
10 pages
SQAP For Metallic Expansion Joints
No ratings yet
SQAP For Metallic Expansion Joints
22 pages
SAN Switch Cheat Sheet
No ratings yet
SAN Switch Cheat Sheet
4 pages
Job Hazard Analysis in Paper Industry
No ratings yet
Job Hazard Analysis in Paper Industry
6 pages
Fighters - 100 Classics in The Evolution of Fighter Aircraft
100% (4)
Fighters - 100 Classics in The Evolution of Fighter Aircraft
139 pages
How To Use Inhaler
No ratings yet
How To Use Inhaler
84 pages
DBMS Faq PDF
100% (1)
DBMS Faq PDF
4 pages
Energy Losses in Pipe Flow Experiments
No ratings yet
Energy Losses in Pipe Flow Experiments
9 pages
S Norris
No ratings yet
S Norris
9 pages
Electronic Commerce 4e - Pete Loshin (2003) PDF
0% (1)
Electronic Commerce 4e - Pete Loshin (2003) PDF
354 pages
Ch. 4-1 Lesson Chart of Accounts1
No ratings yet
Ch. 4-1 Lesson Chart of Accounts1
3 pages
Office Desk and Cabinet Specifications
No ratings yet
Office Desk and Cabinet Specifications
57 pages

Distributed Database Management Systems

Uploaded by

Distributed Database Management Systems

Uploaded by

Centralized versus distributed DBMS

CPS 216 Distributed

Memory Disk Memory Disk

Parallel versus distributed DBMS Distributed DBMS issues

Data organization Partitioning schemes

Round-robin partitioning Hash partitioning

Range partitioning Predicate-based partitioning

Choice of simple predicates Allocation of fragments

You might also like