0% ont trouvé ce document utile (0 vote)

97 vues5 pages

3-Ed Cours-Architecture Ed

Ce chapitre décrit plusieurs architectures pour les entrepôts de données, notamment les architectures en magasins de données indépendants, en bus de magasins, hub-and-spoke, centralisée et fédérée. Il présente leurs caractéristiques, avantages et limites.

Transféré par

fokom talom gaetan

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

97 vues5 pages

3-Ed Cours-Architecture Ed

Transféré par

fokom talom gaetan

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 3

Architecture d'un entrepôt de

données

3.1 Introduction
La mise en place d'un entrepôt de données est un dé de taille. Il existe plusieurs
façons de penser un entrepôt. Le choix de la bonne architecture se base sur la
combinaison de plusieurs critères : les besoins exprimés en termes d'objectifs, des
utilisateurs cibles, du temps alloué pour la mise en place...etc. Nous retrouvons dans
la littérature 5 diérentes architectures. Deux d'entre elles sont les plus utilisées
dans la pratique. Elles correspondent aux visions des deux fondateurs du domaine
décisionnel : Bill Inmon et Ralph Kimball.
Nous présentons dans ce chapitre les diérentes architectures, leurs caractéristiques,
avantages et limites.
3.2 Magasins de données indépendants
Comme dénit précédemment, un magasin de données peut être vu comme une
sous-partie d'un entrepôt de données répondant à un besoin fonctionnel précis. Dans
une logique de regrouper tous les besoins d'une organisation, ce type d'architecture
propose de regrouper les diérents magasins de données. Ces magasins de données
sont construits de manière indépendante les uns des autres, pouvant utiliser des
sources de données indépendantes. La gure 3.1 illustre l'indépendance de mise en
place de chaque magasin et la possibilité aux diérents utilisateurs d'utiliser les
diérents magasins ensemble.
Datamarts
Sources ETL Restitution Utilisateurs
Indépendants

Source 1 Datamart 1

Source 2 Datamart 2
Silos
de
données

Source 1
Datamart n

Source 3

Figure 3.1: Magasins de données indépendants

13
14 CHAPITRE 3. ARCHITECTURE D'UN ENTREPÔT DE DONNÉES

Avantages et inconvénients
+ Architecture simple et peu coûteuse dans sa mise en place.
+ Fortement orientée sujet.
+ Personnalisation des analyses pour les diérents utilisateurs.
− Certaines données peuvent se retrouver dans diérents magasins, ce qui
implique une répétition de traitements.
− Incohérence et redondances entre les magasins de données.
− Analyse inter-fonctionnelle dicile, voire impossible.

3.3 Architecture en bus de magasins de données

Cette architecture est proposée par R. Kimball. Connue aussi sous le nom
d'approche Bottom-Up, elle propose de construire des magasins de données mais
en utilisant des dimensions conformes. Autrement dit, il s'agit toujours d'une
conception fortement orientée sujet mais pour certaines données, les magasins
utiliseront des dimensions communes. Par exemple, les dimensions temporelle et
géographique. Cela permet de pallier les limites de l'architecture précédente en
éliminant certaines redondances et incohérences au niveau des données.
La gure 3.2 illustre l'architecture. L'ensemble des magasins de données
représentent un entrepôt de données.
Datamarts liés par
Sources ETL dimensions Restitution Utilisateurs
conformes

Source 1

Datamart 1

Source 2
Datamart 2

Datamart n
Source n

Entrepôt de données

Figure 3.2: Architecture en bus de magasins de données

Avantages et inconvénients
+ Architecture incrémentale : Permet de rajouter des magasins au besoin et de
traiter les processus les plus importants en premier.
+ Fortement orientée sujet.
+ Une intégration de données cohérentes grâce aux dimensions conformes.
− Analyse inter-fonctionnelle peu performante impliquant plusieurs magasins.
− Planication de nouveaux magasins complexe car il faudra les intégrer à
l'existant.
3.4. ARCHITECTURE HUB-AND-SPOKE 15
3.4 Architecture Hub-and-Spoke
Proposée par B. Inmon, cette architecture est l'opposée de celle en bus d'un point
de vue approche. Appelée aussi approche Top-Down, elle propose de centraliser
toutes les données en construisant en premier lieu tout l'entrepôt de données ( )
et d'alimenter à partir de ce dernier les diérents magasins ( ).
hub

spokes

La gure 3.3 présente l'architecture. L'entrepôt contiendra les données

atomiques, quant aux magasins, ils contiendront des données agrégées. Les analyses
se font directement sur les magasins.
Sources Entrepôt de Datamarts Restitution Utilisateurs
ETL
données dépendants

Source 1 Datamart 1

Source 2 Datamart 2
Entrepôt de données

Source n Datamart n

Hub Spokes

Figure 3.3: Architecture Hub and Spoke

Avantages et inconvénients
+ Intégration et consolidation complète de toutes les données dans un seul
entrepôt.
+ Approche extensible : Il est plus facile de dénir de nouveaux magasins.

− Analyse inter-fonctionnelle peu performante impliquant plusieurs magasins.

− Temps de mise en place : Construction de tout l'entrepôt avant de créer un
magasin de données.

3.5 Architecture centralisée

Similaire à l'architecture Hub and Spoke, son but est de centraliser toutes les
données dans un seul entrepôt. La diérence réside dans l'inexistence des magasins de
données dans l'architecture centralisée. La gure 3.4 illustre le principe. Les requêtes
analytiques se font directement sur l'entrepôt. Ce dernier contient les données aussi
bien détaillées que résumées.
16 CHAPITRE 3. ARCHITECTURE D'UN ENTREPÔT DE DONNÉES

Sources Entrepôt de Restitution Utilisateurs

ETL
données

Source 1

Source 2
Entrepôt de données

Source n

Figure 3.4: Architecture centralisée

Avantages et inconvénients
+ Les utilisateurs peuvent requêter toutes les données de l'entrepôt.
+ Performance optimale.
− Approche non incrémentale.
− Extensibilité limitée et très coûteuse : Il faudrait repenser toute la conception
de l'entrepôt.
3.6 Architecture fédérée
Cette architecture est utilisée dans le cas où un ou plusieurs entrepôts sont déjà
mis en place, comme dans le cas de fusions de compagnies. Au lieu de reconcevoir un
nouvel entrepôt, l'architecture propose de mettre en place un entrepôt de données
virtuel. Ce dernier représente une vue globale sur les diérents entrepôts existants et
un point d'entrée unique pour les utilisateurs. La gure 3.5 présente l'architecture.
L'intégration de données dans l'entrepôt peut être logique ou physique à l'aide de
métadonnées.
Entrepôts de
Sources ETL Restitution Utilisateurs
données autonomes

Source 1

EDW 1

Source 2
EDW 2

EDW n
Source n

Entrepôt de données virtuel

Figure 3.5: Architecture fédérée

3.7. FACTEURS À CONSIDÉRER POUR LE CHOIX DE L'ARCHITECTURE 17
Avantages et inconvénients
+ Pratique s'il existe au-préalable des entrepôts déjà mis en place.
+ L'intégration virtuelle ne demande que peu de ressources matérielles
additionnelles.
− La gestion de l'intégration est complexe : Il faut prendre en compte la
synchronisation, le parallélisme...
− Performance analytique faible.

3.7 Facteurs à considérer pour le choix de

l'architecture
Comme présenté auparavant, il faut prendre en considération plusieurs critères
pour choisir l'architecture la plus adaptée pour la construction d'un entrepôt de
données. Nous citons dans ce qui suit une liste non exhaustive des paramètres qui
inuencent ce choix :
L'interdépendance informationnelle entre les métiers d'une organisation
(Bonne intégration VS silos de données).
L'urgence d'obtenir une solution fonctionnelle.
Les contraintes sur les ressources (nancières, mains d'÷uvre...).
Le nombre de sources de données.
La quantité de données (Gigaoctets, Téraoctets, Zettaoctets...).
La fréquence de mise à jour de données (Mise à jour hebdomadaire, temps
réel...).
La nature des tâches des utilisateurs naux (rapports simples, fouille de
données).
Le nombre d'utilisateurs.
Les objectifs du projet (stratégique, opérationnel...).
...

Vous aimerez peut-être aussi

Mti820 Acetates Architecturedw 1pp
Pas encore d'évaluation
Mti820 Acetates Architecturedw 1pp
61 pages
Architectures des Entrepôts de Données
Pas encore d'évaluation
Architectures des Entrepôts de Données
28 pages
1 PrincipesDataWarehouse
Pas encore d'évaluation
1 PrincipesDataWarehouse
19 pages
Decisionnel - Conception D - Un Entrepôt de Données
Pas encore d'évaluation
Decisionnel - Conception D - Un Entrepôt de Données
28 pages
Modèle de Documentation de Projet DWH
Pas encore d'évaluation
Modèle de Documentation de Projet DWH
3 pages
Document
Pas encore d'évaluation
Document
4 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
98 pages
Un Entrepôt de Données
Pas encore d'évaluation
Un Entrepôt de Données
10 pages
Seance 8 v3.00
Pas encore d'évaluation
Seance 8 v3.00
37 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
28 pages
BI Chapitre2
Pas encore d'évaluation
BI Chapitre2
38 pages
Les Entrepôts de Données
Pas encore d'évaluation
Les Entrepôts de Données
13 pages
Optimisation des Entrepôts de Données
Pas encore d'évaluation
Optimisation des Entrepôts de Données
3 pages
Chapitre 2 Architecture Des Systèmes À Base D'entrepôt de Données
Pas encore d'évaluation
Chapitre 2 Architecture Des Systèmes À Base D'entrepôt de Données
12 pages
Un Système D'information Opérationnel (SIO) Est Un Système Qui Collecte, Stocke, Traite Et Distribue
0% (1)
Un Système D'information Opérationnel (SIO) Est Un Système Qui Collecte, Stocke, Traite Et Distribue
4 pages
Amélioration de La Qualité de Service D'une Application Android À Base D'un Entrepôt de Données Actif.
Pas encore d'évaluation
Amélioration de La Qualité de Service D'une Application Android À Base D'un Entrepôt de Données Actif.
94 pages
ED 2018 Bio Architectures Et Modèles
Pas encore d'évaluation
ED 2018 Bio Architectures Et Modèles
31 pages
Cours3 DataWarehouse
Pas encore d'évaluation
Cours3 DataWarehouse
36 pages
Cours - Datawarehouse
Pas encore d'évaluation
Cours - Datawarehouse
83 pages
Les Entrepôts de Données
Pas encore d'évaluation
Les Entrepôts de Données
68 pages
Entrepot EMSI
Pas encore d'évaluation
Entrepot EMSI
31 pages
Edcnb SNB
Pas encore d'évaluation
Edcnb SNB
73 pages
Cours Ed1
Pas encore d'évaluation
Cours Ed1
18 pages
Chapitre1 IntroductionSID
Pas encore d'évaluation
Chapitre1 IntroductionSID
29 pages
CM-DW Olap
Pas encore d'évaluation
CM-DW Olap
63 pages
Entrepot EMSI
Pas encore d'évaluation
Entrepot EMSI
43 pages
Introduction aux entrepôts de données
Pas encore d'évaluation
Introduction aux entrepôts de données
54 pages
Cour 2
Pas encore d'évaluation
Cour 2
26 pages
Sequence 2
Pas encore d'évaluation
Sequence 2
27 pages
Approche Top-Down Et Buttom-Up
Pas encore d'évaluation
Approche Top-Down Et Buttom-Up
2 pages
Chapitre I Tndresse
Pas encore d'évaluation
Chapitre I Tndresse
6 pages
chp3 Bi
Pas encore d'évaluation
chp3 Bi
36 pages
Introduction Aux Entrepôts de Donnees
Pas encore d'évaluation
Introduction Aux Entrepôts de Donnees
27 pages
Architectures et Sélection d'Entrepôts de Données
Pas encore d'évaluation
Architectures et Sélection d'Entrepôts de Données
15 pages
Inbound 1707729765403319330
Pas encore d'évaluation
Inbound 1707729765403319330
41 pages
Entrepôt de données NoSQL en cloud
Pas encore d'évaluation
Entrepôt de données NoSQL en cloud
12 pages
Présentation Data Warehousing-2022
Pas encore d'évaluation
Présentation Data Warehousing-2022
71 pages
Entrepôt de Données pour Décideurs
Pas encore d'évaluation
Entrepôt de Données pour Décideurs
71 pages
DAta Warehouse
80% (5)
DAta Warehouse
22 pages
Rapport Eda Pfe
Pas encore d'évaluation
Rapport Eda Pfe
92 pages
Conception Et Réalisation D'une Application Pour La PDF
50% (2)
Conception Et Réalisation D'une Application Pour La PDF
50 pages
DP Handout 04
Pas encore d'évaluation
DP Handout 04
15 pages
Gestion Commandes et Stocks UML
Pas encore d'évaluation
Gestion Commandes et Stocks UML
7 pages
Architecture 3 Tiers
Pas encore d'évaluation
Architecture 3 Tiers
6 pages
Architecture Multi-Tiers Moderne
Pas encore d'évaluation
Architecture Multi-Tiers Moderne
27 pages
Cours Entrepôt de Données
Pas encore d'évaluation
Cours Entrepôt de Données
77 pages
Introduction aux systèmes distribués
Pas encore d'évaluation
Introduction aux systèmes distribués
11 pages
Introduction aux Entrepôts de Données
Pas encore d'évaluation
Introduction aux Entrepôts de Données
59 pages
Technologies de L'information
Pas encore d'évaluation
Technologies de L'information
10 pages
1.3.3. Typologi-WPS Office 3
Pas encore d'évaluation
1.3.3. Typologi-WPS Office 3
5 pages
Chapitre 1 Introduction Aux Entrepôts de Données
Pas encore d'évaluation
Chapitre 1 Introduction Aux Entrepôts de Données
5 pages
Entrepôts de données et Big Data
Pas encore d'évaluation
Entrepôts de données et Big Data
43 pages
Groupe02 Architecture Des Données Artéfacts Corrigé 08-07-2021
Pas encore d'évaluation
Groupe02 Architecture Des Données Artéfacts Corrigé 08-07-2021
38 pages
Chapitre III
Pas encore d'évaluation
Chapitre III
14 pages
Rapport Final Bda
Pas encore d'évaluation
Rapport Final Bda
10 pages
Bi 2023
Pas encore d'évaluation
Bi 2023
90 pages
Conception Dun Outil Decisionnel Pour La Gestion PDF
Pas encore d'évaluation
Conception Dun Outil Decisionnel Pour La Gestion PDF
15 pages
MAE - SI - P2C4 - Support de Cours
Pas encore d'évaluation
MAE - SI - P2C4 - Support de Cours
22 pages
Entrepôts de données et OLAP : Guide complet
Pas encore d'évaluation
Entrepôts de données et OLAP : Guide complet
64 pages
Lecture - Notes - Intro - BI - Chap2
Pas encore d'évaluation
Lecture - Notes - Intro - BI - Chap2
17 pages
Circuits Logiques Programmables en Temps Réel
Pas encore d'évaluation
Circuits Logiques Programmables en Temps Réel
53 pages
Introduction à la Business Intelligence
Pas encore d'évaluation
Introduction à la Business Intelligence
8 pages
Guide Complet sur Power BI
Pas encore d'évaluation
Guide Complet sur Power BI
26 pages
Découverte d'Apache Hadoop
Pas encore d'évaluation
Découverte d'Apache Hadoop
13 pages
Lecture - Notes - Intro - BI - Chap4 - Apache Spark Versus Apache Hadoop
Pas encore d'évaluation
Lecture - Notes - Intro - BI - Chap4 - Apache Spark Versus Apache Hadoop
9 pages
CoursDWH AIR3 Cours2
Pas encore d'évaluation
CoursDWH AIR3 Cours2
143 pages
4-Ed Cours-Conception
Pas encore d'évaluation
4-Ed Cours-Conception
14 pages
1-Ed Cours-Introduction
Pas encore d'évaluation
1-Ed Cours-Introduction
7 pages
Corrigé Épreuve Examen DATAWAREHOUSE
100% (4)
Corrigé Épreuve Examen DATAWAREHOUSE
4 pages
FP Sage 100c Saisie de Caisse Decentralisée
Pas encore d'évaluation
FP Sage 100c Saisie de Caisse Decentralisée
2 pages
Asp Net FR
Pas encore d'évaluation
Asp Net FR
96 pages
Intégration de Données en Entrepôt
Pas encore d'évaluation
Intégration de Données en Entrepôt
8 pages
Supervision Informatique : Concepts et Outils
Pas encore d'évaluation
Supervision Informatique : Concepts et Outils
14 pages
Installation de Skype Entreprise Server
Pas encore d'évaluation
Installation de Skype Entreprise Server
51 pages
Annonce de Recrutement Assistant Trésorier
Pas encore d'évaluation
Annonce de Recrutement Assistant Trésorier
2 pages
Fabrication de briquettes de charbon ménager
Pas encore d'évaluation
Fabrication de briquettes de charbon ménager
18 pages
Installation de Skype Entreprise Server
Pas encore d'évaluation
Installation de Skype Entreprise Server
51 pages
Administrateur Système & Application
Pas encore d'évaluation
Administrateur Système & Application
2 pages
Convocation Reunion
Pas encore d'évaluation
Convocation Reunion
1 page
Calendrier Des Concours D Entrée Dans Le Étalblissements Des Universités D État Du Cameroun Au
Pas encore d'évaluation
Calendrier Des Concours D Entrée Dans Le Étalblissements Des Universités D État Du Cameroun Au
4 pages
Trompete I - Mara Lima
Pas encore d'évaluation
Trompete I - Mara Lima
2 pages
305 TD2
Pas encore d'évaluation
305 TD2
2 pages
Guide de Stage pour Étudiants en Pharmacie
Pas encore d'évaluation
Guide de Stage pour Étudiants en Pharmacie
21 pages
Mukaz Audit
Pas encore d'évaluation
Mukaz Audit
25 pages
Gagner de nouveaux clients efficacement
Pas encore d'évaluation
Gagner de nouveaux clients efficacement
20 pages
CHAPITRE 4CN (Prof)
Pas encore d'évaluation
CHAPITRE 4CN (Prof)
39 pages
ISOMETRIES Série
Pas encore d'évaluation
ISOMETRIES Série
5 pages
Sensibilisation aux enjeux du BIM
Pas encore d'évaluation
Sensibilisation aux enjeux du BIM
1 page
Fiche Formation
Pas encore d'évaluation
Fiche Formation
4 pages
Fête de l'Aïd El Adha et Yennayer
Pas encore d'évaluation
Fête de l'Aïd El Adha et Yennayer
3 pages
SSP 287 AUDI A8 03 - Composants Électriques
Pas encore d'évaluation
SSP 287 AUDI A8 03 - Composants Électriques
96 pages
Mode D'Emploi Succinct Du Programme: Gnuplot 1
Pas encore d'évaluation
Mode D'Emploi Succinct Du Programme: Gnuplot 1
6 pages
Planification Mathématique 1ère Unité 1
Pas encore d'évaluation
Planification Mathématique 1ère Unité 1
5 pages
Mode d'emploi Amplificateur Sony TA-FA1200ES
Pas encore d'évaluation
Mode d'emploi Amplificateur Sony TA-FA1200ES
95 pages
Mat Ifri
Pas encore d'évaluation
Mat Ifri
116 pages
Physiologie de l'érection expliquée
Pas encore d'évaluation
Physiologie de l'érection expliquée
6 pages
TD 4AM Activités Ludiques P2 S2
Pas encore d'évaluation
TD 4AM Activités Ludiques P2 S2
5 pages
Optimisation d'Atelier avec Impact
Pas encore d'évaluation
Optimisation d'Atelier avec Impact
3 pages
Corrigc
Pas encore d'évaluation
Corrigc
12 pages
Activit L Oiseau Blanc 27738
Pas encore d'évaluation
Activit L Oiseau Blanc 27738
2 pages
Plafonds Autoportants Knauf: Fiche Technique
Pas encore d'évaluation
Plafonds Autoportants Knauf: Fiche Technique
76 pages
FRA - A2 - 33 Parler de L'environnement
Pas encore d'évaluation
FRA - A2 - 33 Parler de L'environnement
12 pages
Manuel Utilisateur-Stock
Pas encore d'évaluation
Manuel Utilisateur-Stock
40 pages
Risque Cyclonique Caraïbes
Pas encore d'évaluation
Risque Cyclonique Caraïbes
3 pages
Douane Guinéenne : Histoire et Missions
Pas encore d'évaluation
Douane Guinéenne : Histoire et Missions
22 pages
Figures de style en rap français
100% (1)
Figures de style en rap français
5 pages
Hey Jude - Partituras e Partes
Pas encore d'évaluation
Hey Jude - Partituras e Partes
34 pages
Metier Et Formation ELEQ1
100% (1)
Metier Et Formation ELEQ1
67 pages
Corrigé EDC Barbie
Pas encore d'évaluation
Corrigé EDC Barbie
3 pages
Exercices R pour Statistique & Économétrie
Pas encore d'évaluation
Exercices R pour Statistique & Économétrie
24 pages

3-Ed Cours-Architecture Ed

Transféré par

3-Ed Cours-Architecture Ed

Transféré par

Chapitre 3

Architecture d'un entrepôt de

Figure 3.1: Magasins de données indépendants

3.3 Architecture en bus de magasins de données

Figure 3.2: Architecture en bus de magasins de données

La gure 3.3 présente l'architecture. L'entrepôt contiendra les données

Figure 3.3: Architecture Hub and Spoke

− Analyse inter-fonctionnelle peu performante impliquant plusieurs magasins.

3.5 Architecture centralisée

Sources Entrepôt de Restitution Utilisateurs

Figure 3.4: Architecture centralisée

Entrepôt de données virtuel

Figure 3.5: Architecture fédérée

3.7 Facteurs à considérer pour le choix de

Vous aimerez peut-être aussi

La gure 3.3 présente l'architecture. L'entrepôt contiendra les données