0% ont trouvé ce document utile (0 vote)
79 vues15 pages

Chap4 StockageED

Transféré par

Oumaima Bouhani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
79 vues15 pages

Chap4 StockageED

Transféré par

Oumaima Bouhani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

FSB – Département Informatique GLSI2 - 2021

Modélisation d’un
Entrepôt de données
Préparé par: Dr. Olfa DRIDI
Stockage

2
2 - 2021
© OD
Stockage
Ø ROLAP : Relational OLAP
Ø MOLAP : Multi-Dimentional OLAP
Ø HOLAP : Hybrid OLAP

3
© OD - 2021
3
Approche ROLAP
Ø Relational OLAP : Stockage de l’entrepôt dans une base de données
relationnelle
• Faits, dimensions ou niveaux hiérarchiques : tables
• Analyse OLAP : requêtes SQL99 (GROUP BY CUBE...)
Ø Avantages
• Facilité et faible coût de mise en œuvre
• Stockage de gros volumes de données
• Evolution facile
Ø Inconvénients
• Performance (jointures)
• Reformatage nécessaire des résultats pour les utilisateurs finaux

4
© OD - 2021
Étoile ROLAP
DIM_PRODUIT(IDproduit, Nom, Type, Gamme, PrixUnitaire,
Couleur)
DIM_LOCALISATION(IDloc, Ville, Région, Pays)
DIM_TEMPS(IDtemps, Jour, Mois, Trimestre, Année)
FAIT_VENTE(IDproduit#, IDloc#, IDtemps#, ChiffreAffaire)

5
© OD - 2021
Flocon ROLAP
H_PRODUIT(IDproduit, Nom, PrixUnitaire, Couleur, #IDtype)
H_TYPE(IDtype, NomType, #Idgamme)
H_GAMME(IDgamme, NomGamme)

H_VILLE(IDville, NomVille, #IDrégion)


H_REGION(IDrégion, NomRégion, #IDpays)
H_PAYS(IDpays, NomPays)

H_JOUR(IDjour, Jour, #IDmois)


H_MOIS(IDmois, Mois, #IDtrim)
H_TRIMESTRE(IDtrim, Trimestre, #IDannée)
H_ANNEE(IDannée, Année)

FAIT_VENTE(#IDproduit, #IDville, #IDjour, Chiffre_affaire)

6
© OD - 2021
MOLAP (Multi-Dimentional OLAP)
Ø OLAP multi-dimentionnel
Ø Données stockées dans une base de données multidimensionnelle
appelée CUBE
Ø Plus de relationnel!
Ø Langage : MDX
Ø Avantages
• Temps de réponse très court (toutes les données et résultats sont
stockés)
Ø Inconvénients
• Coût élevé des licences pour les bases multi-dimentionnelles
• Coût élevé de développement des cubes
• Difficile à mettre en place pour les gros volumes de données, à
cause de tous les résultats précompilés

7
© OD - 2021
7
HOLAP (Hybrid OLAP)
Ø Hybrid OLAP :
• Stockage de l’entrepôt dans une base de données relationnelle
• Stockage des données agrégées dans des cubes MOLAP
Ø Avantages
• Bon compromis coût/performance sur de gros volumes de données
• Exploite les fonctionnalités de SQL
• Cube connecté à l’entrepôt relationnel
Ø Inconvénients
• Difficulté de mise en œuvre
• Pas aussi rapide que MOLAP
• Passage à l’échelle moins facile qu’en ROLAP

8
© OD - 2021
Conception d’un Data
Warehouse

9
9 - 2021
© OD
Phases de construction d’un DW
Ø Il y’a trois parties interdépendante qui relève la construction d’un
Datawarehouse:
Ø L’étude préalable qui va définir les objectifs, la démarche à suivre, le
retour sur investissement,...
Ø L’étude du modèle de données qui représente le DW conceptuellement
et logiquement
Ø L’étude de l’alimentation du Datawarehouse

10
© OD - 2021
10
Étude préalable:
Étude des besoins
Ø Définir les objectifs du DW
Ø Déterminer le contenu du DW et son organisation, d’après:
Les résultats attendus par les utilisateurs,
Les requêtes qu’ils formuleront,
Les projets qui ont été définie
Ø Recenser les données nécessaires à un bon fonctionnement du DW:
Recenser les données disponibles dans les bases de production
Identifier les données supplémentaires requises
Ø Choisir les dimensions
Typiquement: le temps, le client, le produit, le magasin...
Ø Choisir les mesures de fait
De préférences de quantités numériques additives
Ø Choisir la granularité des faits
Niveau de détails des dimensions

11
© OD - 2021
11
Étude préalable:
Coûts de déploiement:
Ø Nécessite des machines puissantes, souvent une machine parallèle
Ø Capacité de stockage très importante (historisation des données)
Evaluer la capacité de stockage
Ø Equipes de maintenance et d’administration
Les coûts des logiciels
Les logiciels d’administration du DW
Les outils ETL (Extract-Transform- Loading)
Les outils d’interrogation et de visualisation Les outils de Datamining

12
© OD - 2021
12
Modélisation
Ø Niveau conceptuel:
Un DW est basé sur une modélisation multidimensionnelle qui
représente les données dans un cube
Un cube permet de voir les données suivant plusieurs dimensions:
Tables de dimensions
La table des faits contient les mesures et les clés des dimensions
Ø Niveau Logique:
Plusieurs schémas types sont proposés pour représenter un DW:
Schéma en étoile;
Schéma en flocon;

13
© OD - 2021
13
Alimentation
Ø L’alimentation est la procédure qui permet de transférer des données du
système opérationnel vers le DW
Ø La conception de cette opération est une tâche complexe
60 à 90 % de la charge totale d’un projet DW
Ø Elle doit être faite en collaboration avec l’administrateur des bases de
productions
Ø Il est nécessaire de déterminer:
Quelles données seront chargées
Les transformations et les vérifications nécessaires
La périodicité et le moment de transferts des données

14
© OD - 2021
14
Merci pour votre attention

Vous aimerez peut-être aussi