0% ont trouvé ce document utile (0 vote)
169 vues56 pages

Introduction à la Modélisation Dimensionnelle

Le chapitre 4 traite de la modélisation dimensionnelle, une méthode pour concevoir des entrepôts de données en organisant les informations en faits et dimensions pour faciliter l'analyse. Il décrit les principes fondamentaux, les types de mesures dans les tables de faits, et l'importance des tables de dimensions pour fournir un contexte aux données. L'objectif est d'optimiser l'accès et les performances analytiques pour soutenir les décisions stratégiques des entreprises.

Transféré par

ouafi.meryem
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
169 vues56 pages

Introduction à la Modélisation Dimensionnelle

Le chapitre 4 traite de la modélisation dimensionnelle, une méthode pour concevoir des entrepôts de données en organisant les informations en faits et dimensions pour faciliter l'analyse. Il décrit les principes fondamentaux, les types de mesures dans les tables de faits, et l'importance des tables de dimensions pour fournir un contexte aux données. L'objectif est d'optimiser l'accès et les performances analytiques pour soutenir les décisions stratégiques des entreprises.

Transféré par

ouafi.meryem
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 4 : Modélisation Dimensionnelle

Pr. Naoufal EL ALLALI

Département Informatique
Faculté Pluridisciplinaire de Nador (FPN)
Université Mohamed Premier (UMP)

Octobre 15, 2024

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 1 / 56


Introduction à la modélisation dimensionnelle
La modélisation dimensionnelle est une méthode utilisée pour concevoir
des entrepôts de données. Elle organise les informations de manière à
faciliter les analyses et le reporting décisionnel.
Pourquoi cette méthode est-elle nécessaire ?
Dans une entreprise, de nombreuses données sont générées par des
activités comme les ventes, les commandes et les paiements.
Ces données doivent être organisées pour répondre efficacement à des
besoins d’analyse, tels que :
Combien de produits ont été vendus hier ?
Quels produits se vendent le mieux dans une région donnée ?

La modélisation dimensionnelle offre une manière structurée de répondre à


ces questions, en divisant les données en :
Faits : Données quantitatives ou mesurables (par exemple, montant
des ventes, quantité vendue).
Dimensions : Informations qualitatives ou descriptives (par exemple,
produit, région, période).
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 2 / 56
Principes fondamentaux de la modélisation dimensionnelle
La modélisation dimensionnelle repose sur une organisation structurée
des données qui permet une analyse rapide et compréhensible.

Organisation des données :


Les données sont classées en deux catégories :
Faits :
Mesures quantitatives représentant des événements ou des transactions.
Exemple : Montant des ventes, quantité vendue, bénéfices.
Dimensions :
Informations qualitatives donnant un contexte descriptif aux faits.
Exemple : Produit, date, client, localisation.

Analyse multidimensionnelle :
Chaque fait peut être analysé à travers plusieurs dimensions.
Cette structure est adaptée aux systèmes OLAP (Online Analytical
Processing ) qui permettent des analyses sous différents angles (par
produit, période, région, etc.).
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 3 / 56
Exemple concret de modélisation dimensionnelle
Pour comprendre comment les faits et les dimensions interagissent,
considérons une transaction de vente :

1. Les faits :
Quantité vendue : Combien de produits ont été achetés ?
Montant payé : Quel est le total de la transaction ?

2. Les dimensions :
Produit : Nom, catégorie, marque.
Date : Jour, mois, année.
Client : Nom, localisation, type de client.
Région : Ville, région, pays.

Ensemble, ces faits et dimensions permettent de répondre à des questions


telles que :
Quels produits ont généré le plus de revenus le mois dernier ?
Dans quelle région la performance des ventes est-elle la meilleure ?
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 4 / 56
Objectifs de la modélisation dimensionnelle
La modélisation dimensionnelle est conçue pour répondre aux besoins
analytiques des entreprises en organisant les données de manière efficace et
intuitive.
1. Simplifier l’accès aux données :
Organiser les données pour qu’elles soient compréhensibles par des
utilisateurs non techniques.
Réduire la complexité des requêtes analytiques.
2. Supporter les analyses multidimensionnelles :
Permettre d’explorer les données sous différents angles (produit, client,
période, région, etc.).
Faciliter le regroupement et le filtrage des données selon plusieurs
dimensions.
3. Optimiser les performances :
Améliorer la vitesse des analyses et des requêtes, même sur de grands
volumes de données.
Réduire les temps de calcul pour les rapports et tableaux de bord.
Offrir une structure simple et performante qui soutient les décisions
stratégiques des entreprises.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 5 / 56
Relation entre tables de faits et tables de dimensions
Le modèle en étoile est une représentation visuelle de la modélisation
dimensionnelle. Il montre comment les faits sont connectés aux
dimensions.

Produit Temps

Table de faits : Ventes

Client Région

Les tables de dimensions décrivent les mesures stockées dans la


table de faits.
La connexion se fait via des clés étrangères, reliant les faits à leurs
dimensions correspondantes.
Cela permet d’explorer les données sous différents angles, comme :
Quels produits se vendent le mieux par région?
Quelles périodes génèrent le plus de revenus?
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 6 / 56
Table de faits
La table de faits est une table centrale qui regroupe des données
quantitatives ou des mesures numériques liées à des événements ou des
transactions.

Caractéristiques principales :
Contient les mesures analytiques principales que l’on souhaite
examiner (par exemple, chiffre d’affaires, quantité vendue).
Relie plusieurs dimensions via des clés étrangères.
Représente des événements métiers comme des ventes, des
commandes ou des paiements.

Exemples de mesures dans une table de faits :


Montant des ventes : Revenu généré par une transaction.
Quantité vendue : Nombre d’articles achetés.
Coût total : Dépenses associées à un événement.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 7 / 56
Caractéristiques d’une table de faits

La table de faits est une composante essentielle de la modélisation


dimensionnelle, conçue pour centraliser les données quantitatives utilisées
dans l’analyse.

Principales caractéristiques :
Elle stocke des mesures quantitatives liées à des transactions ou des
événements métiers.
Elle est souvent dénormalisée, ce qui facilite les analyses rapides.
Elle contient généralement deux clés étrangères ou plus, utilisées
pour établir des liens avec les tables de dimensions.
Elle comporte un grand volume d’enregistrements, car chaque ligne
correspond à un événement ou une transaction unique.
Les mesures stockées sont souvent numériques et additifs, comme
les montants, les quantités ou les bénéfices.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 8 / 56


Types de mesures dans une table de faits (1/2)

Dans une table de faits, les mesures représentent des données


quantitatives pour l’analyse. Ces mesures se classent en plusieurs types :

1. Mesures additives :
Peuvent être additionnées sur toutes les dimensions.
Exemples : Montant des ventes, quantité vendue.

2. Mesures semi-additives :
Peuvent être additionnées sur certaines dimensions seulement.
Exemples : Stock disponible (additif sur les produits, mais pas sur le
temps).

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 9 / 56


Types de mesures dans une table de faits (2/2)

Les mesures non-additives ne peuvent pas être additionnées directement,


car elles représentent des ratios ou des indicateurs calculés.

3. Mesures non-additives :
Exemples : Taux de conversion, marge bénéficiaire.
Utilisées pour des analyses complexes comme le suivi des
performances.

Pourquoi ces types de mesures sont importants ?


Aident à choisir les bonnes méthodes d’analyse.
Optimisent la compréhension et les décisions stratégiques.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 10 / 56


Types de mesures dans une table de faits
Les mesures dans une table de faits se divisent en trois catégories
principales, selon leur comportement dans les analyses.

Type de Description Exemples


mesure
Additives S’additionnent sur toutes les di- Montant des ventes,
mensions analytiques. Quantité vendue
Semi- S’additionnent sur certaines di- Stock disponible, Solde
additives mensions uniquement, mais pas bancaire
toutes.
Non- Ne peuvent pas être addition- Taux de conversion,
additives nées directement, souvent des Marge bénéficiaire
ratios ou pourcentages.
Pourquoi ces types sont importants ?
Aident à choisir les méthodes analytiques appropriées.
Facilitent une structuration efficace pour l’analyse décisionnelle.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 11 / 56
Exemple : Table de faits avec types de mesures
Prenons l’exemple ci-dessous illustre une table de faits issue d’un système
de gestion des ventes. Elle contient des clés étrangères et des mesures
pour l’analyse.

ID Fait ID Produit ID Temps ID Client Montant Vente (A) Stock Disponible (S) Marge (%)(N)
1 101 20230101 501 500.00 20 25%
2 102 20230102 502 750.00 15 30%
3 103 20230102 503 1200.00 10 22%

Description des mesures :


(A) Additive : Montant Vente – Peut être additionné sur toutes les
dimensions.
(S) Semi-additive : Stock Disponible – Additif sur les produits, mais
pas sur le temps.
(N) Non-additive : Marge (

Cette table montre comment différents types de mesures coexistent dans


une analyse.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 12 / 56
Exemple : Table de faits avec types de mesures
La figure ci-dessous présente les ventes totales, les stocks disponibles, et
les marges (%) pour trois produits différents.

Le produit 102 est le plus rentable grâce à une marge élevée et des
ventes significatives.
Le produit 103 nécessite une attention particulière en raison de sa
faible marge et de son stock limité.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 13 / 56
Exemple : Table de faits avec types de mesures
Interprétation des résultats précédent :
Produit 103 :
Les ventes les plus élevées (1200 € ), mais une marge relativement
faible (22 %).
Stock limité (10 unités), ce qui peut indiquer une potentielle rupture
de stock.
Produit 102 :
Bon équilibre entre les ventes (750 € ) et une marge élevée (30 %).
Stock modéré (15 unités), permettant de répondre à la demande
actuelle.
Produit 101 :
Ventes modestes (500 € ), mais une marge acceptable (25 %).
Stock légèrement supérieur (20 unités), indiquant une rotation plus
lente des produits.
Le produit 102 est le plus rentable grâce à sa marge élevée et à des
ventes significatives.
Le produit 103 nécessite une attention particulière en raison de son
stock limité et de sa faible marge.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 14 / 56
Caractéristiques de la table de faits
Les principales caractéristiques d’une table de faits dans la modélisation
dimensionnelle :
Le tableau des faits comprend les valeurs numériques de ce que nous
mesurons.
Exemple : Une valeur de fait de 20 peut signifier que 20 produits ont
été vendus.
Chaque table de faits comprend les clés des tables de dimensions
associées.
Ces clés sont appelées clés étrangères.
Les tableaux de faits comprennent généralement un petit nombre de
colonnes.
Par rapport aux tableaux de dimensions, les tableaux de faits
comportent un grand nombre de lignes.
Exemple de table de faits :
ID Produit ID Temps ID Client Quantité Montant (€)
101 20230101 501 20 500
102 20230102 502 15 750
103 20230103 503 10 1200

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 15 / 56


Tables de dimensions
Dans un entrepôt de données, les tables dimensionnelles fournissent des
informations descriptives qui permettent de donner un sens aux faits
mesurés.

Caractéristiques principales :
Contexte des faits :
Ces tables contiennent des champs descriptifs (par exemple : produit,
client, date).
Clé primaire unique :
Chaque dimension est identifiée par une clé primaire utilisée pour relier
cette table à la table des faits.
Points d’entrée pour l’analyse :
Définissent les axes d’analyse (thèmes, contexte, etc.).
Les valeurs sont souvent textuelles ou catégoriques.
Composées de colonnes descriptives et contiennent moins de lignes
que les tables de faits.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 16 / 56
Exemple de table de dimensions : Produit

Prenons un exemple de table de dimensions décrivant les produits vendus.

ID Produit Nom Produit Catégorie Marque Prix (€)


101 OrdinateurPortable Informatique HP 1200
102 Smartphone T lphonie Samsung 800
103 Imprimante Informatique Canon 300

Caractéristiques :
ID Produit : Clé primaire pour relier cette table à la table de faits.
Attributs descriptifs : Permettent de regrouper et analyser les ventes
selon les catégories, marques, ou gammes de prix.

Cette table enrichit l’analyse en ajoutant des informations qualitatives.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 17 / 56


Exemple de table de dimensions : Produit

Attributs Exemples
CleProduit 101, 102, 103
NomProduit Ordinateur , Smartphone, Imprimante
Catgorie Informatique, T lphonie
Marque HP, Samsung , Canon
Prix() 1200, 800, 300

Description :
La Clé Produit sert de lien avec la table des faits.
Les attributs descriptifs permettent de regrouper et analyser les
données selon différentes perspectives (catégorie, marque, prix).

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 18 / 56


Tables dimensions
Les tables de dimensions et les tables de faits sont reliées par des clés
pour organiser et analyser les données dans un entrepôt de données.
Caractéristiques principales :
Tables de dimensions :
Décrivent le contexte des faits (ex. : produit, temps, client).
Chaque ligne est identifiée de manière unique par une clé de
substitution.
Tables de faits :
Stockent les mesures ou valeurs numériques à analyser.
Contiennent des clés étrangères pour établir la relation avec les tables
de dimensions.
Clé de substitution et clé étrangère :
La clé de substitution est la clé primaire dans la table de dimensions.
La même clé est placée dans la table de faits comme une clé
étrangère.
Ces clés permettent de relier les deux tables via une jointure,
facilitant l’analyse des données.
Exemple : ALLALI
Pr. N. EL Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 19 / 56
Tables dimensions

Les tables de dimensions et les tables de faits sont reliées par des clés
pour organiser et analyser les données dans un entrepôt de données.

Les tables de dimensions fournissent le contexte (ex. : produit, temps,


client).
La relation est établie grâce à :
Une clé primaire (dans la table de dimensions).
Une clé étrangère correspondante (dans la table de faits).

Utilité :
Permet une analyse multidimensionnelle en regroupant les faits selon
des axes descriptifs (produit, période, client, etc.).
Rend les données facilement exploitables pour la prise de décision.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 20 / 56


Schéma de la relation entre tables
Exemple
Une vente (table de faits) peut être associée à :
Un produit (table de dimensions : Produit).
Une date (table de dimensions : Temps).
Un client (table de dimensions : Client).
Cette relation permet d’analyser les ventes par produit, période ou
client.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 21 / 56


Catégories de tables de dimensions

Les tables de dimensions dans un entrepôt de données peuvent être


classées en trois catégories principales, selon leur utilisation et leur rôle :

1. Dimensions autonomes :
Utilisées dans un seul Data Mart.
Répondent à des besoins spécifiques d’analyse locale.

2. Dimensions partagées :
Utilisées dans plusieurs Data Marts d’un même domaine.
Centralisent les données pour éviter la duplication.

3. Dimensions conformées :
Utilisées uniformément dans plusieurs Data Marts.
Garantissent la cohérence globale des analyses.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 22 / 56


Dimension autonome
Une dimension autonome est une table de dimensions utilisée
exclusivement dans un seul Data Mart. Elle répond à un besoin spécifique
et reste indépendante des autres systèmes.

Caractéristiques principales :
Utilisation locale :
Les données sont pertinentes uniquement pour un type de requête ou
d’analyse spécifique.
Facilité de création :
Facile à identifier et à mettre en place, adaptée aux besoins locaux.
Maintenance complexe :
À long terme, la gestion peut devenir plus difficile en raison de son
isolement.

Exemple :
Une table "Client" utilisée uniquement pour analyser les ventes d’un
magasin spécifique.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 23 / 56
Dimension partagée
Une dimension partagée est utilisée par plusieurs Data Marts au sein
d’un même domaine ou d’une même organisation. Elle centralise les
données tout en permettant des analyses spécifiques.

Caractéristiques principales :
Centralisation :
Les données sont partagées entre plusieurs Data Marts dans un même
domaine (par exemple : ventes, inventaire).
Indépendance des analyses :
Fonctionne de manière autonome avec chaque Data Mart, mais
conserve une source unique.
Simplifie les données :
Évite la duplication des tables pour des usages similaires.

Exemple :
Une table "Produit" partagée entre les départements ventes et
inventaire d’une organisation.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 24 / 56
Dimension conformée
Une dimension conformée est une table de dimensions utilisée de manière
uniforme dans plusieurs Data Marts. Elle garantit une cohérence totale
des analyses à travers toute l’organisation.

Caractéristiques principales :
Standardisée pour être utilisée par tous les Data Marts.
Garantit la cohérence des données et des analyses à l’échelle de
l’entreprise.

Exemple pratique :
Une organisation utilise un modèle global pour ses départements
"Ventes", "Inventaire", et "Logistique".
La table "Temps" est utilisée uniformément pour analyser les données
dans tous les départements.
Attributs : ID Temps, Année, Mois, Jour, Trimestre.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 25 / 56


Étapes d’implémentation d’une table de faits (1 à 3)
Les étapes pour implémenter une table de faits dans un entrepôt de
données sont les suivantes :
1. Identifier le fait à analyser :
Déterminer l’objet principal de l’analyse, comme les ventes ou les
commandes.
2. Identifier les mesures liées au fait :
Choisir les valeurs quantitatives ou métriques à analyser, telles que le
montant des ventes ou la quantité vendue.
3. Déterminer les dimensions nécessaires :
Identifier les dimensions qui décrivent les faits, comme le produit, le
client ou le temps.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 26 / 56


Étapes d’implémentation d’une table de faits (4 et 5)

Après avoir défini les faits, mesures et dimensions, les étapes suivantes
consistent à relier et valider les données.

4. Ajouter des clés de substitution :


Créer des clés uniques dans les tables de dimensions pour établir des
relations avec la table de faits.
Exemple : ID Produit, ID Client, ID Temps.
5. Implémenter le schéma corréspondant (ex : étoile) et vérifier :
Construire le schéma en connectant la table de faits aux tables de
dimensions.
Vérifier que les relations et les données permettent de répondre aux
analyses prévues.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 27 / 56


Étapes d’implémentation d’une table de faits (1 à 3)

Les étapes pour implémenter une table de faits dans un entrepôt de


données sont les suivantes :

1. Identifier le fait à analyser :


Déterminer l’objet principal de l’analyse.
Exemple : Analyse des ventes dans un magasin.
2. Identifier les mesures liées au fait :
Choisir les valeurs quantitatives ou métriques à analyser.
Exemple : Quantité vendue, montant total des ventes.
3. Déterminer les dimensions nécessaires :
Identifier les dimensions qui décrivent les faits.
Exemple : Produit, client, temps.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 28 / 56


Étapes d’implémentation d’une table de faits (4 et 5)
Après avoir défini les faits, mesures et dimensions, les étapes suivantes
consistent à relier et valider les données.

4. Ajouter des clés de substitution :


Créer des clés uniques dans les tables de dimensions pour établir des
relations avec la table de faits.
Exemple :
Table Produit : ID Produit, Nom, Catégorie.
Table Client : ID Client, Nom, Adresse.
Table Temps : ID Temps, Date, Mois, Année.
5. Implémenter le schéma en étoile et vérifier :
Construire le schéma en connectant la table de faits aux tables de
dimensions.
Exemple : La table des faits "Ventes" est reliée aux tables Produit,
Client et Temps via des clés étrangères.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 29 / 56


Introduction à la modélisation des entrepôts de données

La modélisation des entrepôts de données consiste à structurer les


données pour faciliter leur analyse et leur gestion. Elle permet de répondre
aux besoins de reporting et d’analyse décisionnelle.

Les principaux modèles :


Modèle en étoile :
Structure simple où la table de faits est reliée directement aux tables
de dimensions.
Modèle en flocon :
Extension du modèle en étoile où les tables de dimensions sont
normalisées.
Modèle en constellation :
Plusieurs tables de faits reliées à des dimensions partagées.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 30 / 56


Modèle en étoile

Le modèle en étoile est une technique de modélisation utilisée dans les


entrepôts de données.

Caractéristiques principales :
Une table de faits centrale contenant des mesures quantitatives.
Plusieurs tables de dimensions dénormalisées fournissant le contexte
des faits.
Pas de relations entre les tables de dimensions.

Avantages :
Facilité de navigation et de compréhension.
Performances accrues grâce à un nombre limité de jointures.
Gestion efficace des agrégats pour les rapports.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 31 / 56


Structure du modèle en étoile
Le modèle en étoile est structuré autour d’une table de faits centrale
reliée à plusieurs tables de dimensions.
La table de faits contient les mesures principales (quantité, montant,
etc.).
Les tables de dimensions fournissent le contexte analytique des faits
(produit, client, temps).
La table de faits est liée à toutes les tables de dimensions par des
relations de type "one-to-many" (un-à-plusieurs).
Aucune relation directe entre les tables de dimensions.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 32 / 56


Structure du modèle en étoile
l’exemple ci-dessous montre une vue simplifiée de la structure du modèle en
étoile :

Relations :
La table de faits est reliée à chaque table de dimension par une
relation "one-to-many".
Chaque table de dimension agit comme un point de référence pour
analyser les données.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 33 / 56
Relations "one-to-many" dans le modèle en étoile
Les relations dans le modèle en étoile suivent une structure de type
"one-to-many" entre la table de faits et les tables de dimensions :
Chaque dimension (Produit, Client, Temps, Magasin) est unique et
identifiée par une clé primaire.
La table de faits contient des clés étrangères reliant les dimensions
pour analyser les mesures (montant, quantité, etc.).

Exemple : Chaque produit dans la dimension "Produit" peut être associé


à plusieurs ventes dans la table de faits.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 34 / 56
Schéma du modèle en étoile
Exemple :
Table de faits : Ventes (Ventes, Profiles, ID Produit, ID Client, ID
Temps).
Tables de dimensions : Produit, Client, Temps, Magasin.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 35 / 56


Exemple de table de faits dans le modèle en étoile
La table de faits contient les mesures ou métriques principales à analyser :
Exemple : Table de faits des ventes :
Mesures : Montant total des ventes, Quantité vendue.
Clés étrangères : ID Produit, ID Client, ID Temps, ID Magasin.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 36 / 56


Exemple de table de dimensions dans le modèle en étoile
Les tables de dimensions décrivent les mesures contenues dans la table
de faits.
Exemple : Table de dimensions Client :
Clé primaire : ID Client.
Attributs : Nom, Adresse, Ville, Pays, Catégorie client.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 37 / 56


Exemple complet du modèle en étoile
le modèle ci-dessous illustre un modèle en étoile avec une table de faits et
plusieurs tables de dimensions.

Remarque : Les clés primaires dans DateDim sont généralement


construites via des dates numériques, c’est-à-dire que pour 2018-09-13,
notre clé sera 20180913
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 38 / 56
Avantages du modèle en étoile
Le modèle en étoile offre plusieurs bénéfices, en particulier dans les
entrepôts de données :

1. Simplicité :
Structure intuitive et facile à comprendre.
Accessible aux non-techniciens et aux analystes métier.
2. Performances accrues :
Réduit le nombre de jointures nécessaires dans les requêtes SQL.
Améliore la rapidité d’exécution des analyses grâce à sa
dénormalisation.
3. Flexibilité :
Facile à étendre en ajoutant de nouvelles dimensions ou mesures.
Permet de s’adapter aux besoins d’analyse évolutifs.
4. Support pour les analyses multidimensionnelles :
Idéal pour les outils OLAP (Online Analytical Processing ).
Gestion efficace des agrégats, comme les totaux et moyennes.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 39 / 56
Inconvénients du modèle en étoile
Malgré ses nombreux avantages, le modèle en étoile présente certaines
limites :
1. Redondance des données :
Les tables de dimensions ne sont pas normalisées.
Cela peut entraîner une duplication des données.
2. Maintenance plus complexe :
Modifier une dimension peut nécessiter des changements dans
plusieurs endroits.
Plus difficile à gérer dans des environnements où les données changent
fréquemment.
3. Moins adapté pour les bases très complexes :
Pas idéal pour des systèmes nécessitant des relations complexes entre
dimensions.
Les modèles alternatifs comme le flocon sont parfois nécessaires.
4. Taille importante des tables de faits :
Les tables de faits peuvent devenir très volumineuses dans des
systèmes avec beaucoup
Pr. N. EL ALLALI
de transactions.
Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 40 / 56
La modélisation en flocon de neige : Introduction

Le modèle en flocon de neige est une version avancée du schéma en


étoile, dans laquelle les tables de dimensions sont normalisées pour
améliorer l’efficacité.
Caractéristiques :
Dérivé du schéma en étoile : Les tables de dimensions sont divisées
en sous-tables pour représenter différentes hiérarchies.
Réduction de la redondance : La normalisation des tables évite la
duplication des données.
Utilisation : Adapté pour des bases de données contenant des
dimensions volumineuses ou avec de nombreuses hiérarchies.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 41 / 56


La modélisation en flocon de neige : Structure
Le modèle en flocon de neige est une extension du modèle en étoile où
les tables de dimensions sont normalisées.

Caractéristiques principales :
Les tables de dimensions sont décomposées en plusieurs sous-tables,
chacune représentant un niveau hiérarchique.
Cette structure réduit la redondance des données grâce à la
normalisation.
Permet de mieux gérer des tables de dimensions très volumineuses ou
complexes.

Exemple concret : Une dimension "Produit" peut être structurée en :


Table principale : Produit (ID Produit, Nom Produit, Prix).
Sous-table : Catégorie (ID Catégorie, Nom Catégorie).
Sous-sous-table : Type (ID Type, Nom Type).

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 42 / 56


Structure du modèle en flocon
Figure ci-desosus illustre une représentation simplifiée du modèle en flocon
de neige :

La table de faits reste centrale, avec des mesures comme quantités


vendues, montants.
Les tables de dimensions sont reliées à d’autres sous-tables pour
réduire la redondance.
Chaque niveau hiérarchique dans une dimension est représenté par une
table distincte.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 43 / 56
Exemple de modélisation en flocon de neige

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 44 / 56


Explication du modèle en flocon de neige

Description de la structure :
La table de faits (Sales Fact) contient les mesures principales :
ventes, coûts, publicités.
Les tables de dimensions sont normalisées pour réduire la
redondance :
Temps : Inclut des informations hiérarchiques comme année,
trimestre, mois, jour.
Produit : Relié à une ligne et une famille pour décrire les catégories et
les détails du produit.
Magasin : Décomposé en adresse, ville, région, et code postal.

Chaque table de dimension est reliée à la table de faits par des clés
étrangères.
Les sous-tables permettent une organisation hiérarchique des données
(par exemple, Store → Location ).

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 45 / 56


Exemple : Modélisation en étoile
Structure :
Une table de faits (Sales Facts) contient les mesures :
Quantité vendue, montant des ventes, marge.
Les tables de dimensions fournissent un contexte :
Produit : Nom, catégorie, type d’emballage.
Client : Nom, état civil, adresse.
Temps : Année, mois, trimestre.
Représentant des ventes (SalesRep) : Nom, territoire, région.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 46 / 56


Transition vers le schéma en flocon

Le schéma ci-dessous illustre comment un schéma en étoile est transformé


en un schéma en flocon de neige, avec des tables de dimensions
normalisées.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 47 / 56


Pourquoi passer au modèle en flocon de neige ?

Réduction des redondances : Les informations partagées, comme


les catégories ou marques, sont déplacées vers des sous-tables pour
éviter les répétitions.
Cohérence des données : Toute modification dans une sous-table
est automatiquement propagée à toutes les données associées.
Optimisation du stockage : La décomposition des dimensions
permet de réduire l’espace nécessaire pour stocker les données.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 48 / 56


Normalisation et implications dans le modèle en flocon
Principes de la normalisation appliqués :
1ère forme normale (1FN) : Données atomiques (pas de groupes ou
listes dans une cellule).
2ème forme normale (2FN) : Les colonnes dépendent uniquement
de la clé primaire.
3ème forme normale (3FN) : Élimination des dépendances
transitives.

Avantages :
Réduction des duplications.
Organisation hiérarchique claire.
Amélioration de la maintenance des données.
Inconvénients :
Requêtes plus complexes à cause des jointures.
Performances légèrement réduites pour les analyses volumineuses.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 49 / 56
Différences entre les schémas Star et Snowflake : Schéma en
étoile

Schéma en étoile :
La table de faits est reliée directement à plusieurs tables de dimensions.
Toutes les tables de dimensions sont dénormalisées, contenant toutes
les informations nécessaires dans une seule table.
Performances élevées grâce à un faible nombre de jointures dans les
requêtes SQL.
Inconvénient : La redondance
des données est élevée, ce qui peut entraîner une utilisation excessive
de l’espace disque.
Avantages :
Requêtes simples et rapides.
Facilité d’utilisation pour les utilisateurs finaux.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 50 / 56


Différences entre les schémas Star et Snowflake : Schéma en
flocon
Schéma en flocon :
Les tables de dimensions sont normalisées pour éviter la duplication
des données.
Les dimensions principales sont subdivisées en plusieurs sous-tables
connectées par des clés étrangères.
Réduction de la redondance des données, ce qui économise de l’espace
disque.

Inconvénient :
Les requêtes SQL nécessitent davantage de jointures, ce qui peut
réduire les performances.
Avantages :
Structure claire et hiérarchique.
Meilleure cohérence des données.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 51 / 56
La modélisation en constellation (Galaxy)
Définition :
Une constellation de faits relie deux ou plusieurs tables de faits qui
partagent des dimensions communes.
Ce modèle est aussi appelé schéma Galaxy.
Il représente une structure logique complexe d’un entrepôt de données
ou d’un data mart.
Caractéristiques :
Utilise des tables de faits dé-normalisées pour centraliser les
mesures.
Les dimensions sont partagées entre plusieurs tables de faits, assurant
une cohérence dans les données.
Convient aux systèmes multi-sujets, par exemple, ventes et retours.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 52 / 56


Structure du modèle Galaxy (Constellation)

Éléments principaux :
Tables de faits multiples :
Chaque table de faits correspond à un processus ou une activité (ex. :
Ventes, Retours).
Dimensions partagées :
Les dimensions comme Produit, Client, ou Temps sont reliées à
plusieurs tables de faits.
Relations croisées :
Les faits sont connectés aux dimensions par des clés étrangères,
permettant des analyses croisées.
Modèle adapté aux analyses multi-sujets.
Complexité des requêtes plus élevée que le modèle étoile.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 53 / 56


Les relations croisées dans le modèle Galaxy
Définition :
Une relation croisée se produit lorsque plusieurs tables de faits
partagent des dimensions communes.
Ces relations permettent de comparer ou d’analyser plusieurs
processus liés entre eux.

Exemple de relations croisées :


Les tables de faits Ventes et Retours partagent des dimensions
comme :
Produit : Comparez les ventes et retours pour chaque produit.
Temps : Analysez les ventes et retours pour une période donnée.
Client : Identifiez les clients ayant des taux de retour élevés.

Clés étrangères :
Les clés étrangères dans les tables de faits relient ces tables aux
dimensions partagées.
Cela garantit une cohérence dans les analyses croisées.
Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 54 / 56
Exemple : Schéma de constellation (Galaxy)

Un schéma de constellation de faits connecte plusieurs tables de faits


(ventes, expéditions) avec des dimensions communes et spécifiques.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 55 / 56


Avantages et inconvénients du modèle Galaxy

Avantages :
Permet l’analyse de plusieurs processus métiers (ex. : ventes, retours).
Réduction de la redondance grâce aux dimensions partagées.
Modèle extensible et adapté aux environnements complexes.
Cohérence des analyses entre différentes tables de faits.

Inconvénients :
Structure complexe, nécessitant une gestion rigoureuse.
Ralentissement des requêtes en raison des nombreuses jointures.
Dépendances entre les dimensions partagées et les tables de faits.
Maintenance difficile en cas de modification des dimensions.

Pr. N. EL ALLALI Chapitre 4 : Modélisation Dimensionnelle Octobre 15, 2024 56 / 56

Vous aimerez peut-être aussi