FSB – Département Informatique GLSI2 - 2021
Modélisation d’un
Entrepôt de données
Préparé par: Dr. Olfa DRIDI
Stockage
2
2 - 2021
© OD
Stockage
Ø ROLAP : Relational OLAP
Ø MOLAP : Multi-Dimentional OLAP
Ø HOLAP : Hybrid OLAP
3
© OD - 2021
3
Approche ROLAP
Ø Relational OLAP : Stockage de l’entrepôt dans une base de données
relationnelle
• Faits, dimensions ou niveaux hiérarchiques : tables
• Analyse OLAP : requêtes SQL99 (GROUP BY CUBE...)
Ø Avantages
• Facilité et faible coût de mise en œuvre
• Stockage de gros volumes de données
• Evolution facile
Ø Inconvénients
• Performance (jointures)
• Reformatage nécessaire des résultats pour les utilisateurs finaux
4
© OD - 2021
Étoile ROLAP
DIM_PRODUIT(IDproduit, Nom, Type, Gamme, PrixUnitaire,
Couleur)
DIM_LOCALISATION(IDloc, Ville, Région, Pays)
DIM_TEMPS(IDtemps, Jour, Mois, Trimestre, Année)
FAIT_VENTE(IDproduit#, IDloc#, IDtemps#, ChiffreAffaire)
5
© OD - 2021
Flocon ROLAP
H_PRODUIT(IDproduit, Nom, PrixUnitaire, Couleur, #IDtype)
H_TYPE(IDtype, NomType, #Idgamme)
H_GAMME(IDgamme, NomGamme)
H_VILLE(IDville, NomVille, #IDrégion)
H_REGION(IDrégion, NomRégion, #IDpays)
H_PAYS(IDpays, NomPays)
H_JOUR(IDjour, Jour, #IDmois)
H_MOIS(IDmois, Mois, #IDtrim)
H_TRIMESTRE(IDtrim, Trimestre, #IDannée)
H_ANNEE(IDannée, Année)
FAIT_VENTE(#IDproduit, #IDville, #IDjour, Chiffre_affaire)
6
© OD - 2021
MOLAP (Multi-Dimentional OLAP)
Ø OLAP multi-dimentionnel
Ø Données stockées dans une base de données multidimensionnelle
appelée CUBE
Ø Plus de relationnel!
Ø Langage : MDX
Ø Avantages
• Temps de réponse très court (toutes les données et résultats sont
stockés)
Ø Inconvénients
• Coût élevé des licences pour les bases multi-dimentionnelles
• Coût élevé de développement des cubes
• Difficile à mettre en place pour les gros volumes de données, à
cause de tous les résultats précompilés
7
© OD - 2021
7
HOLAP (Hybrid OLAP)
Ø Hybrid OLAP :
• Stockage de l’entrepôt dans une base de données relationnelle
• Stockage des données agrégées dans des cubes MOLAP
Ø Avantages
• Bon compromis coût/performance sur de gros volumes de données
• Exploite les fonctionnalités de SQL
• Cube connecté à l’entrepôt relationnel
Ø Inconvénients
• Difficulté de mise en œuvre
• Pas aussi rapide que MOLAP
• Passage à l’échelle moins facile qu’en ROLAP
8
© OD - 2021
Conception d’un Data
Warehouse
9
9 - 2021
© OD
Phases de construction d’un DW
Ø Il y’a trois parties interdépendante qui relève la construction d’un
Datawarehouse:
Ø L’étude préalable qui va définir les objectifs, la démarche à suivre, le
retour sur investissement,...
Ø L’étude du modèle de données qui représente le DW conceptuellement
et logiquement
Ø L’étude de l’alimentation du Datawarehouse
10
© OD - 2021
10
Étude préalable:
Étude des besoins
Ø Définir les objectifs du DW
Ø Déterminer le contenu du DW et son organisation, d’après:
Les résultats attendus par les utilisateurs,
Les requêtes qu’ils formuleront,
Les projets qui ont été définie
Ø Recenser les données nécessaires à un bon fonctionnement du DW:
Recenser les données disponibles dans les bases de production
Identifier les données supplémentaires requises
Ø Choisir les dimensions
Typiquement: le temps, le client, le produit, le magasin...
Ø Choisir les mesures de fait
De préférences de quantités numériques additives
Ø Choisir la granularité des faits
Niveau de détails des dimensions
11
© OD - 2021
11
Étude préalable:
Coûts de déploiement:
Ø Nécessite des machines puissantes, souvent une machine parallèle
Ø Capacité de stockage très importante (historisation des données)
Evaluer la capacité de stockage
Ø Equipes de maintenance et d’administration
Les coûts des logiciels
Les logiciels d’administration du DW
Les outils ETL (Extract-Transform- Loading)
Les outils d’interrogation et de visualisation Les outils de Datamining
12
© OD - 2021
12
Modélisation
Ø Niveau conceptuel:
Un DW est basé sur une modélisation multidimensionnelle qui
représente les données dans un cube
Un cube permet de voir les données suivant plusieurs dimensions:
Tables de dimensions
La table des faits contient les mesures et les clés des dimensions
Ø Niveau Logique:
Plusieurs schémas types sont proposés pour représenter un DW:
Schéma en étoile;
Schéma en flocon;
13
© OD - 2021
13
Alimentation
Ø L’alimentation est la procédure qui permet de transférer des données du
système opérationnel vers le DW
Ø La conception de cette opération est une tâche complexe
60 à 90 % de la charge totale d’un projet DW
Ø Elle doit être faite en collaboration avec l’administrateur des bases de
productions
Ø Il est nécessaire de déterminer:
Quelles données seront chargées
Les transformations et les vérifications nécessaires
La périodicité et le moment de transferts des données
14
© OD - 2021
14
Merci pour votre attention