Chapitre3: Les bases de données multidimensionnelles
(DATAWAREHOUSE)
Systèmes d’Information de Gestion
Les SI fournissent les données métier.
Les états (Rapports) sont développés à la demande.
Les états fournissent peu de possibilités d’analyse.
Les outils d’aide à la décision DSS donne un accès ad hoc aux données.
Analyser les données à partir des Systèmes Opérationnels
Structures de données complexes.
Systèmes conçus pour un haut niveau de performance et de débit.
Les données ne sont pas présentées à l’utilisateur de manière significative.
Les données sont dispersées.
Les systèmes OLTP (Online transaction processing) ne sont pas adaptés pour
des requêtes intensives.
Extraction des données
Le traitement devait se faire loin des systèmes opérationnels
Les décideurs possèdent dorénavant les données d’analyse
Problèmes avec les extractions des données
Effort dupliqué
Technologies hétérogènes
Pas de métadonnées en commun
Problèmes de qualité de données lors des extractions
Pas de repère de temps en commun Différentes signification des champs
Algorithmes de calcul différents Information manquante
Différents niveaux de granularité Pas de règles de correction des
Différents noms de champs données
Pas de possibilités de drill-down
1
Data Warehousing et Business Intelligence
Avantages des Environnements DataWarehouse
Information contrôlée, fiable et de qualité
Source unique des données
Pas de duplication des efforts
Pas besoin de supporter plusieurs technologies
Pas de disparité des données, de différences de signification
Pas de conflit de période de temps, Pas de confusion d’algorithmes, ou de
restriction de drill-down
Business Intelligence (BI)
“Business intelligence est le processus de transformation
des données en des informations afin d’arriver à la
découverte de la connaissance.” – Gartner Group
L’objectif du BI est de convertir la masse de données en
une valeur métier à travers le reporting analytique
Exigences
Conception efficace des data warehouses
Reporting d’entreprise
Analyses et requêtes (relationnel et multidimensionnel)
Analyses avancées
Intégration avec les portails d’entreprise
Administration simplifiée
Environnement intégré
Data Warehouse
“Un data warehouse est une collection de données orientée sujet, intégrée, non
volatile, et évolutives dans le temps utilisée pour aider à la prise de décisions de
gestion.” W.H. Inmon
Data Warehouse à l’échelle de l’Enterprise
Supporte une implémentation à grande échelle
Couvre tout le métier
Contient les données de tous les sujets
Développé de manière incrémentielle
Une source unique des données à l’échelle de l’entreprise
Comprend des données synchronisées à l’échelle de l’entreprise
Point de distribution unique pour les data marts dépendants
2
orientée sujet
Les données sont classées et
stockées par sujet métier plutôt que
par application
Intégrée
Les données d’un sujet sont définies
et stockées une seule fois
Evolutives
Les données sont stockées comme
une série de clichés (snapshots),
chacun représentant une période du
temps.
non volatile
Les données dans le data warehouse
ne sont ni modifiées ni supprimées.
3
4