BD Bench
BD Bench
fr/~donsez/cours
Les Benchmarks
pour les SGBDs
Didier DONSEZ
Université Joseph FOURIER
IMA – IMAG/LSR/ADELE
[Link]@[Link],
[Link]@[Link]
12/01/2006
2
When you can measure what you are speaking about, and
express it in numbers, you know something about it; but
when you cannot measure it, when you cannot express it in
numbers, your knowledge is of a meager and
unsatisfactory kind; it may be the beginning of knowledge,
but you have scarcely in your thoughts advanced to the
state of Science, whatever the matter may be.
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Plan
Benchmark
• Banc de Performances
• Mesurer les performances d’un système (matériel / logiciel) sous une charge
de travail caractérisant une application type.
Cette application peut être définie selon des spécifications écrites par des organismes
compétents
Intérêt
• fournir un indicateur fiable et global de qualité des produits
• comparer les produits entre eux (avant d’acheter)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Wisconsin Benchmark
(University of Wisconsin)
Conditions d ’expérimentation
• Environnement mono-utilisateur
• requête 1 à 1 (batch), buffers mémoire purgés
12/01/2006
7
TPC ([Link] )
Transaction Processing-performance Council
• TPC-R actif
• TPC-W actif
• “The Evolution of TPC Benchmarks: Why TPC-A and TPC-B are Obsolete”, C.
Levine, J. Gray, S. Kiss, W. Kohler, Open OLTP Report, Vol. 4, No 7, Nov.,
1993. pp. 2-14. Standish Group, Yarmouth, MA.
12/01/2006
9
L’article initiateur
• Anon et al,"A Measure of Transaction Processing Power",
Datamation, V.31.7, April 1985, pp. 112-118
TPC/A & B
• OLTP : OnLine Transaction Processing
• Simulation d’Opération de Débit et Crédit
sur des comptes bancaires
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
L’application Datamation 85
Debit-Credit
Transaction •Scan (COBOL)
•Modif 1000 enr seq
Database
•Sort
Duplex Log •Sur 1000000 enr)
TPC/A et TPC/B
Base
• 100 000 comptes client
• 10 terminal ou DAB par agence (branch)
• au moins 1 agence
• un historique de description des transactions
Transaction
• Lire message du terminal (100 octets)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
TPC-A
Account
Account_ID
Branch_ID
Branch_Balance
1:N 1:N
History
Branch Account_ID
Branch_ID Branch_ID
1:N
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Branch_Balance Teller_ID
Amount
Teller 1:N TimeStamp
1:N Teller_ID
Branch_ID
Teller_Balance
12/01/2006
13
TPC/A et TPC/B
Goulots d’étranglement
• compte client : indexation
• historique : fin partagée par tous les trans
Performances
• Travail
• 100 000 instructions, 2-3 IOs disque
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
TPC/C : Order/Entry
• Order-Status
• Delevery
• Stock Level
12/01/2006
18
TPC/C
• Base : ~350 Mo
• 9 tables
Warehouse (1 ligne, 89 octets/ligne)
District (10 lignes, 95 octets/ligne)
Customer (30 000 lignes, 655 octets/ligne)
History (30 000 lignes, 46 octets/ligne)
Order (30 000 lignes, 24 octets/ligne)
New-Order (9 000 lignes, 8 octets/ligne)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
TPC/C
Contraintes
• Temps de réponse pour New Order, Payment, Order-Status
• Batch pour Delevery
• Cohérence pour StockLevel
Mesures
• TPMC : nombre de transactions New Order par minute
12/01/2006
20
1:10
Warehouse District
N N*10
1:100000
History
1:3000
N*30.000
1:1
Stock Customer
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
N*100.000 N*30.000
New_Order
N*9.000 1:0-1
1:1 1:3 1:1
TPC-E : Entreprise
• Customer_Status
édition des paiements effectués par client (groupement par distrinct et par
magasin)
• Customer_Demographics
analyse les activités des clients en fonction de la démographie
12/01/2006
22
Benchmark pour les BD Décisionnelles
(InfoCentre)
Charge de travail
• Data Warehouse & Data Mining
Les benchmarks DW du TPC
• TPC-D : BD Décisionnelles (InfoCentre) Obsolète
• TPC Benchmark H (TPC-H)
ad-hoc, decision support benchmark
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Autre
• The Drill Down Benchmark (VLDB98)
Data Mining (décisionnel)
» performance d ’un SGBD en ‘ backend ’ d ’un outil de Data Mining
12/01/2006
23
SF : Scale Factor
• 1,10,30,100,300,1000,3000,10000
• soient des BDs de 1 Go à 10 To
Modèle de données
SF*200K SF*10K 25
D ’après [Bes97]
12/01/2006
24
8 tables SF*200,000
PARTKEY
SF*800,000
PARTKEY
SF*6,000,000
ORDERKEY
SF*1,500,000
ORDERKEY
TPC H et R
• decision support benchmark
The TPC Benchmark H (TPC-H)
ad-hoc
• suite de requêtes ad-hoc (orienté business) et de modifications
concurrentes
large volumes of data,
queries with high degree of complexity
• Mesure
• TPC-H Composite Query-per-Hour Performance Metric (QphH@Size)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Résultats attendus
Indicateurs
• Performance sur un système donnée
• Nb de Transactions réalisées par seconde
• Coût du système complet (matériel+logiciel+maintenance)
• Prix par 1 tps
But
• Charge de travail variée et plus réaliste
sur une SGBD-OO en client-serveur
• Modélise un environnement CAD/CAM
• (Données et Requêtes)
• Sources et Résultats sur [Link]/007
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Scale Factor
Conditions
• Données déjà cachées en mémoire du client (Hot)
• Données sur les disques du serveur (Cold)
12/01/2006
34
DesignObj
id
type
buildDate
Assembly
Assembly Module
SubAssemb
root part
DesignRoot
Man
AtomicPart CompositePart
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
Traversée de pointeurs
• opération de déréférenciation (coté client)
• Traversée dense / Traversée éparse
Modification
• champs d ’objets indexés ou non
• modification répétées, modifications éparses
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
• Références
• Michael Stonebraker, James Frew, Kenn Gardels, Jeff Meredith: The
Sequoia 2000 Benchmark. SIGMOD Conference 1993: 2-11
• [Link]
12/01/2006
38
Les Benchmarks
pour SGBDs Objet-Relationnel
SGBDs OR et Universels
• Une norme SQL3 et des SGBDs Oracle, Informix, Sybase,
DB2, CA-OpenIngres
Charge de Travail SGBDs OR
• Navigation et Ensembliste (Objet)
• OLTP (Relationnel)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
BUCKY Object-Relational
• Carey et al, 1997, Université de Wisconsin
12/01/2006
39
BUCKY Object-Relational Benchmark
Université de Wisconsin
• Benckmark of Universal or Complex Kuery Interfaces
Objectifs
• mesurer les performances des les fonctionnalités O-R
• ADT
• Fonctions d ’ADT
• Héritage
• Colonnes Multivaluées (SET, MULTISET, LIST)
• Déréférenciation (1 et 2 niveaux)
• pas de navigation (traversée de référence) coté client (OO7)
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
D ’après [Cat97]
12/01/2006
41
Les Benchmarks
pour SGBDs sur le Web
Charge de Travail
• Interrogation d ’une base via des browsers Web
• Transactionnel sur le Web
• Commerce électronique (sécurité, paiement…)
Benchmarks
• WebMark
• orienté requête HTTP/GET sur des documents statiques
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
• SPECWeb
• TPC-W (voir le cours « Benchmarks pour services Web »)
• orienté transactionnel
Orienté Métier
• Sequoia Benchmark
• Système d ’Information Géographique
SGBD spatial
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
12/01/2006
43
Travaux académiques
• XMach-1, Xmark, XOO7, XBench …
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
• Voir [Link]
12/01/2006
44
Des produits
Benchmark Factory
• [Link]
• Outil de test et de construction de benchmark
S3AP, Set-Query, Wisconsin, WebStone, TPC-B, C&D
sont prédéfinis
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
12/01/2006
45
Benchmarks propriétaires
SAP (ERP)
• Metric : SAPs
• [Link]
• [Link]
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
12/01/2006
47
Bibliographie - Livres
55860-415-4, Chapitre ??
Robert Orfali, Dan Harkey, « Client/Server Programming with Java and
Corba », 2ème édition, 1998, Ed Wiley, ISBN 0-471-24578-X.
• voir l ’implantation du TPC/A avec JDBC et Corba dans les chapitres 23 à 25
12/01/2006
48
Bibliographie - Articles
Datamation 85
Bitton, DeWitt, Turbyfill: "Benchmarking database systems - a systematic approach",
Proc. VLDB 1983.
• article décrivant le Wisconsin Benckmark
R. Cattell, J. Skeen, « Object Operation Benchmark », ACM TODS, 17(1), Mars 1992.
Michael J. Carey, David J. DeWitt, Jeffrey F. Naughton, "The OO7 Benchmark",
SIGMOD'93
Michael J. Carey, David J. DeWitt, Chander Kant, and Jeffrey F. Naughton. A status
report on the OO7 OODBMS benchmarking effort. In Proceedings of the ACM OOPSLA
Didier Donsez, 1998-2005, Benchmarks pour SGBDs
WWW
• [Link]
Le site de Jim Gray (le guru du domaine)
• [Link]
Autre
• Benchmarking Club de Paris, [Link]
12/01/2006
50
Benchmarks à tester
[Link]
• propose une approximation du benchmark TPC/W pour
StoredObject (SGBD 100% Java
Rubis, Rubos, … sur [Link]
12/01/2006
51
Cours reliés