Entrepôts de données
Mohamed El Hacen Mohamed Dyla
1/109
3. Modélisation
Conceptuelle d’un ED
20/109 Entrepôts de données
Définition
Description de la base
multidimensionnelle indépendamment des
choix d’implantation
Les concepts :
* Dimensions et hiérarchies
* Faits et mesures
21/109 Entrepôts de données
Définition
Description de la base
multidimensionnelle indépendamment des
choix d’implantation
Les concepts :
* Dimensions et hiérarchies
* Faits et mesures
21/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (2)
Clé primaire : IDProduit
Paramètres : Nom, Type, Gamme
Attributs faibles : Poids, Couleur
23/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (2)
Hiérarchies multiples dans une dimension
25/109 Entrepôts de données
Fait
Sujet d’analyse
Un fait représente la valeur d’une mesure,
calculée ou mesurée, selon un attribut de
chacune des dimensions
Tables de fait possède les valeurs des
mesures et une clé composée des clés
étrangères des tables de dimension
26/109 Entrepôts de données
Fait
Sujet d’analyse
Un fait représente la valeur d’une mesure,
calculée ou mesurée, selon un attribut de
chacune des dimensions
Tables de fait possède les valeurs des
mesures et une clé composée des clés
étrangères des tables de dimension
26/109 Entrepôts de données
Fait
Sujet d’analyse
Un fait représente la valeur d’une mesure,
calculée ou mesurée, selon un attribut de
chacune des dimensions
Tables de fait possède les valeurs des
mesures et une clé composée des clés
étrangères des tables de dimension
26/109 Entrepôts de données
Mesure
Élément de donnée sur lequel portent les
analyses
Ensemble d’attributs de la table de fait
Exemples
Ventes (chiffre d’affaire, quantités et montants commandés,
volumes des ventes, ...)
Stocks (nombre d’exemplaires d’un produit en stock, ...)
Ressources humaines (nombre de demandes de congés,
nombre de démissions, ...)
27/109 Entrepôts de données
Mesure
Élément de donnée sur lequel portent les
analyses
Ensemble d’attributs de la table de fait
Exemples
Ventes (chiffre d’affaire, quantités et montants commandés,
volumes des ventes, ...)
Stocks (nombre d’exemplaires d’un produit en stock, ...)
Ressources humaines (nombre de demandes de congés,
nombre de démissions, ...)
27/109 Entrepôts de données
Mesure
Élément de donnée sur lequel portent les
analyses
Ensemble d’attributs de la table de fait
Exemples
Ventes (chiffre d’affaire, quantités et montants commandés,
volumes des ventes, ...)
Stocks (nombre d’exemplaires d’un produit en stock, ...)
Ressources humaines (nombre de demandes de congés,
nombre de démissions, ...)
27/109 Entrepôts de données
Exercice
Produit(CODE, Designation, Marque, Nature,
PrixAchat, PrixReventeConseille)
Vente(CODE, NMAG, Quantité, PrixVente)
Magasin(NMAG, Adresse, Ville, Département)
1. Donnez les clés primaires et les clés étrangères ?
2. Quelle est la table de fait ?
28/109 Entrepôts de données
Modèles
Au niveau conceptuel, il existe 3 modèles :
Modèle en étoile
Modèle en flocon de neige
Modèle en constellation
29/109 Entrepôts de données
Modèles
Au niveau conceptuel, il existe 3 modèles :
Modèle en étoile
Modèle en flocon de neige
Modèle en constellation
29/109 Entrepôts de données
Modèles
Au niveau conceptuel, il existe 3 modèles :
Modèle en étoile
Modèle en flocon de neige
Modèle en constellation
29/109 Entrepôts de données
Modèle en étoile (1)
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
30/109 Entrepôts de données
Modèle en étoile (1)
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
30/109 Entrepôts de données
Modèle en étoile (1)
Une table de fait centrale et des dimensions
Les dimensions n’ont pas de liaison entre elles
Avantages
Facilité de navigation
Nombre de jointures limité
Inconvénients
Redondance dans les dimensions
30/109 Entrepôts de données
Modèle en étoile (2)
Table de fait : Vente
Tables de dimension : Temps, Catégorie, Géographie
31/109 Entrepôts de données
Modèle en flocon de neige (1)
Evolution du modèle en étoile avec une
décomposition des dimensions en sous
hiérarchies
Avantages
Formalisation d’une hiérarchie au sein d’une
dimension.
Réduction de la redondance
Inconvénients
Complexité en termes de lisibilité et de gestion.
Navigation coûteuse
32/109 Ines BN SLIMEE Entrepôts de données
Modèle en flocon de neige (1)
Evolution du modèle en étoile avec une
décomposition des dimensions en sous
hiérarchies
Avantages
Formalisation d’une hiérarchie au sein d’une
dimension.
Réduction de la redondance
Inconvénients
Complexité en termes de lisibilité et de gestion.
Navigation coûteuse
32/109 Entrepôts de données
Modèle en flocon de neige (2)
Table de fait : Vente
Tables de dimension : Temps, Catégorie, Géographie
33/109 Ines BEN SLIMEE Entrepôts de données
Modèle en constellation (1)
Fusionne plusieurs modèles en étoile qui
utilisent des dimensions communes
Comprend plusieurs tables de fait et
tables de dimensions communes ou non
34/109 Entrepôts de données
Modèle en constellation (1)
Fusionne plusieurs modèles en étoile qui
utilisent des dimensions communes
Comprend plusieurs tables de fait et
tables de dimensions communes ou non
34/109 Entrepôts de données
Modèle en constellation (2)
Constitué de 2 schémas en étoile :
1 Correspond aux VENTEs effectuées dans les pharmacies
2 Analyse les PRESCRIPTIONs des médecins
Temps et Géographie sont partagées par les faits
35/109 Entrepôts de données
Modèle en constellation (2)
Constitué de 2 schémas en étoile :
1 Correspond aux VENTEs effectuées dans les pharmacies
2 Analyse les PRESCRIPTIONs des médecins
Temps et Géographie sont partagées par les faits
35/109 Entrepôts de données
exemple : Modélisation en Étoile d’un Entrepôt de Données
Une entreprise de vente en ligne souhaite créer un entrepôt de
données pour analyser ses ventes. Les informations suivantes
sont disponibles :
• Chaque vente est associée à un produit, un client et une date.
• Les produits ont un identifiant, un nom, une catégorie et un
prix.
• Les clients ont un identifiant, un nom, une ville et un pays.
• Les dates comprennent le jour, le mois et l’année.
• Chaque vente est caractérisée par une quantité vendue et un
montant total.
1. Construire le modèle en etoile
2. Donner le total des ventes par produit
3. Nombre de ventes par client