Entrepôts de données
DS S4
Mohamed El Hacen Mohamed Dyla
24.02.2025
Cours 2
1/109 Entrepôts de données
2. Entrepôts de données
(ED)
12/109 Entrepôts de données
Définition
"L’entrepôt de données est une collection de
données orientées sujet, intégrées, non
volatiles et historisées, organisées pour le
support d’un processus d’aide à la décision".
13/109 Entrepôts de données
Données orientées sujet
Regroupe les informations des différents métiers
Pas de prise en compte de l’organisation
fonctionnelle des données
14/109 Entrepôts de données
Exemples : Données orientées sujet
l'entrepôt de données pourrait être organisé
autour de sujets comme :
➢ Les ventes (montant des ventes, produits
vendus, etc.)
➢ Les clients (informations démographiques,
historique d'achat, etc.)
➢ Les stocks (niveaux de stock, commandes
fournisseurs, etc.)
14/109 Entrepôts de données
Données intégrées
Normalisation des données
Définition d’un référentiel unique
15/109 Entrepôts de données
Exemple d'intégration des données dans un entrepôt de données
Une entreprise de commerce en ligne possède plusieurs systèmes :
• Base de données des ventes (transactions des clients).
• Système CRM (gestion de la relation client).
• Système de gestion des stocks.
Chaque système a son propre format et ses propres règles. Par
exemple : Dans la base des ventes, les clients sont identifiés par un
ID numérique. Dans le CRM, les clients sont enregistrés avec leur
adresse e-mail. Le stock des produits est suivi par un autre
identifiant unique.
Intégration dans l'entrepôt de données :
• Un client unique est identifié avec un ID commun dans toutes
les bases.
• Les ventes et les interactions client sont reliées à cet ID
unique.
• Les produits vendus sont liés aux données de stock.
15/109 Entrepôts de données
Données non volatiles
Utilisation en interrogation (consultation)
Traçabilité des informations et des décisions
prises
16/109 Entrepôts de données
Données historisées/datées
Les données persistent dans le temps
Mise en place d’un référentiel temps
Permet l’analyser les variations d’une
donnée dans le temps
17/109 Entrepôts de données
Pourquoi pas un SGBD ?
SGBD ED
Utilisateurs Nombreux/employés Peu/analystes
Données Détaillées/atomiques Résumées/agrégées
Orientées application Orientées sujet
Dynamiques Statiques
Accès Peu de données Trop d’informations
(courantes) (historisées)
Objectif Dépend de l’application Prise de décision
Opérations Consultation, mais très Consultation, mise à
souvent mise à jour et jour périodiquement
ajout
SI OLTP : OnLine Tran- OLAP : OnLine Analy-
saction Processing tical Processing
18/109 Entrepôts de données
Datamart
Sous-ensemble d’un entrepôt de données
Destiné à répondre aux besoins d’un secteur ou
d’une fonction particulière de l’entreprise
19/109 Entrepôts de données
3. Modélisation
Conceptuelle d’un ED
20/109 Entrepôts de données
Définition
Description de la base
multidimensionnelle indépendamment des
choix d’implantation
Les concepts :
* Dimensions et hiérarchies
* Faits et mesures
21/109 Entrepôts de données
Définition
Description de la base
multidimensionnelle indépendamment des
choix d’implantation
Les concepts :
* Dimensions et hiérarchies
* Faits et mesures
21/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Entrepôts de données
Dimension (1)
Axes d’analyse (Géographique, temporel,
produits ...)
Chaque dimension comporte un ou plusieurs
attributs
Paramètres : attributs qui définissent les niveaux
hiérarchiques
Attributs faibles : attributs descriptifs
22/109 Ines BEN SLIMENE Entrepôts de données
Dimension (2)
Clé primaire : IDProduit
Paramètres : Nom, Type, Gamme
Attributs faibles : Poids, Couleur
23/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (1)
Les attributs d’une dimension sont organisés
suivant des hiérarchies
Chaque attribut appartient à un niveau
hiérarchique particulier
Exemples
Dimension temps : jour, mois, trimestre, année
Dimension géographie : magasin, ville, région, pays
Dimension produit : numéro, type, gamme, marque
24/109 Entrepôts de données
Hiérarchie (2)
Hiérarchies multiples dans une dimension
25/109 Entrepôts de données
Fait
Sujet d’analyse
Un fait représente la valeur d’une mesure,
calculée ou mesurée, selon un attribut de
chacune des dimensions
Tables de fait possède les valeurs des
mesures et une clé composée des clés
étrangères des tables de dimension
26/109 Entrepôts de données
Mesure
Élément de donnée sur lequel portent les
analyses
Ensemble d’attributs de la table de fait
Exemples
Ventes (chiffre d’affaire, quantités et montants commandés,
volumes des ventes, ...)
Stocks (nombre d’exemplaires d’un produit en stock, ...)
Ressources humaines (nombre de demandes de congés,
nombre de démissions, ...)
27/109 Entrepôts de données