Introduction Aux Entrepôts de Donnees

L'entrepôt de données est un système essentiel pour les entreprises modernes, permettant de collecter, organiser et analyser des informations provenant de divers systèmes pour faciliter la prise de décisions. Développé par Bill Inmon en 1990, il se compose de données thématiques, intégrées et historisées, et utilise des outils comme OLAP et Datamining pour l'analyse. Sa structure, souvent représentée par des schémas en étoile, en flocon ou en constellation, permet d'optimiser l'accès et l'utilisation des données décisionnelles.

Transféré par

elykaneee

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

67 vues27 pages

Introduction Aux Entrepôts de Donnees

Transféré par

elykaneee

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

INTRODUCTION AUX

ENTREPÔT DE DONNÉES
[Link] Faye Diouf
INTRODUCTION
• De nos jours, l’entreprise est un système ouvert sur son environnement au
cœur des systèmes d'informations confrontée à des phénomènes
économiques et sociaux lourd de conséquences.
conséquences Pour faire face aux
nouveaux enjeux, l’entreprise doit collecter, traiter, analyser les informations
de son environnement pour anticiper. Mais cette information produite par
l'entreprise est surabondante, non organisée et éparpillée dans de multiples
systèmes opérationnels hétérogènes et peut provenir de toutes
• les places de marchés (mondialisation des échanges). Il devient
fondamental de rassembler et d’homogénéiser les données afin de
permettre l'analyse des indicateurs pertinents pour faciliter la prise de
décisions:d’où l’importance de l’entrepôt de Données.
DÉFINITION D’ENTREPÔT DE
DONNÉES
• Le concept d’entrepôt de données a été formalisé pour la
première fois en 1990 par Bill Inmon. Il est aussi appelé en
Anglais « Datawarehouse ». Un entrepôt de données est
une collection de données thématiques, intégrées, non
volatiles et historisées pour la prise de décisions (Bill Inmon).
• Il s’agissait de constituer une base de données orientée
sujet, intégrée et contenant des informations historisées, non
volatiles et exclusivement destinées aux processus d’aide à
la décision.
SUCCÈS DU DATAWAREHOUSE
• Les points clefs garantissant le succès d'un entrepôt de données sont
les suivants :
• - Les informations d'un entrepôt de données doivent être accessibles
et fiables (de qualité).
• - La conception d'un entrepôt de données doit répondre à un besoin
de ROI(Return On Investment, retour sur investissement )élevé.
• - La réponse aux demandes très diverses des utilisateurs(décideurs de
l’entreprise).
• - L’entrepôt de données doit évoluer avec les besoins des utilisateurs
et du système d'information.
OUTILS DE CONCEPTION DE
DATAWAREHOUSE
• L’infrastructure technique mise en œuvre est capable d’intégrer,
d’organiser, de stocker et de coordonner de manière intelligible des
données produites au sein du Système d’Information (issues des
applications de production) ou importées depuis l’extérieur du SI
(louées ou achetées) dans lesquelles les utilisateurs finaux puisent des
informations pertinentes à l’aide d’outils de restitution et d’analyse
(OLAP, Datamining ).
• OLAP : On-Line Analytical Processing,
Processing Désigne une catégorie
d'applications et de technologies permettant de collecter, stocker,
traiter et restituer des données multidimensionnelles, à des fins
d'analyse.
• Ex: Oracle Express, SQLServer 7.0, PowerOLAP
• Datamining : Désigne une catégorie d’outils
d’exploitation d’un entrepôt de données
permettant d’effectuer des fouilles " mining " ou
d’extraire des connaissances permettant de faire
apparaître des corrélations jusqu’alors cachées
entre les données.
• Ex: Python, Le langage R, Tanagra, RapidMiner,
WEKA
LES DONNÉES DÉCISIONNELLES
VS
DES DONNÉES OPÉRATIONNELLES
Les données permettant la prise de décisions diffèrent des données
opérationnelles :
DONNÉES DE DATAWAREHOUSE =DONNÉES
ORIENTÉES SUJET

• L’entrepôt de données est organisé autour des sujets majeurs et des

métiers de l'entreprise.
• Les données sont organisées par thème, contrairement aux données
des systèmes de production, organisées par processus fonctionnels.
• L’avantage de cette représentation demeure dans le fait qu'il devient
possible de réaliser des analyses sur des sujets transversaux aux
structures fonctionnelles et organisationnelles de l'entreprise. Et ainsi,
de pouvoir analyser un processus dans le temps à différentes étapes
de sa conception au sein du SI. Cette orientation permet également
de faire des analyses par itération, sujet après sujet.
• L'intégration dans une structure unique est
indispensable pour éviter aux données concernées
par plusieurs sujets d'être dupliquées.
• Dans la pratique il existe également des Datamart
pouvant supporter l'orientation sujet. En effet, un
Datamart ou Magasin de données est petit entrepôt
de données, en général spécialisé dans un domaine
« métier »
MODÉLISATION DE DONNÉES
• La modélisation par sujet
• Un ED est généralement basé sur un SGBD relationnel.
• La modélisation par sujet est une technique de conception logique
qui vise à organiser et classifier les informations des bases légataires en
données classées par sujet fonctionnel. Elle est basée sur la
modélisation " Entité/Relation " et est préliminaire à la modélisation
dimensionnelle.
• Chaque sujet correspond à une table gérée au sein de l’entrepôt. Il
faut isoler les données stratégiques, déterminer les informations de
détails nécessaires (profondeur, granularité) et conserver les
métadonnées.
MODÉLISATION DE DONNÉES
• La modélisation dimensionnelle
• La modélisation dimensionnelle (modèle multidimensionnel) souvent appelée
modélisation OLAP (Codd 1993) se présente comme une alternative au
modèle relationnel. Elle correspond mieux aux besoins du décideur tout en
intégrant la modélisation par sujet.
• C’est une méthode de conception logique qui vise à présenter les données
sous une forme standardisée, intuitive et qui permet des accès hautement
performants. Elle aboutit à présenter les données non plus sous forme de
tables mais de cube7 centré sur une activité. Un cube de dimension n (n > 3)
est aussi dit hyper cube.
• Cette modélisation met en évidence ces 3 éléments: Faits, indicateurs et
dimensions
LA TABLE DE FAITS

Modèle conceptuel d’une table de faits

• Le terme de fait est utilisé pour représenter une mesure économique.
• Pour exemple, lors de la vente de produits sur un marché, on comptabilise
les types de produits vendus, leur quantité et le montant de chaque vente
au jour le jour et ce, pour chaque produit et pour chaque magasin.
• La mesure des quantités et des prix est réalisée à l’intersection de toutes les
dimensions (produit, magasin, temps).
• Le nombre des dimensions détermine la finesse, la granularité de la table et
indique la portée de l’indicateur.
LES INDICATEURS
• Les indicateurs les plus utiles d’une table de faits sont numériques et additifs.
L’additivité des attributs d’une table de faits est cruciale pour les outils
décisionnels. Les utilisateurs demandent rarement l’analyse d’une seule
ligne. Dans notre exemple, constater les ventes de produits sur une année
pour les magasins d’une région demande l'analyse de plusieurs milliers de
lignes à la fois.
• Pour autant, tous les attributs utiles ne sont pas additifs. Certains sont semi
additifs et ne peuvent être additionnés que pour certaines dimensions.
• D’autres sont non additifs et ne peuvent pas être additionnés par
dimensions. Pour cette dernière catégorie, on utilise des fonctions
d'agrégations tel que, le calcul de moyenne, le ratio ou le comptage de
lignes.
LES DIMENSIONS

Modèle Conceptuel de Dimension Produit

LES DIMENSIONS

• Les tables de dimensions sont les entités complémentaires à la

conception de la table de faits. Elles contiennent, autant que
possible, des attributs sous forme de descriptions textuelles permettant
de qualifier ou d’expliquer l’activité.
• Des attributs de dimensions, nombreux, permettent de varier les
possibilités d’analyse (par tranches ou en dés). Ces attributs rendent
utilisables et intelligibles les données de l’entrepôt de données. Ils
établissent, en quelque sorte une interface homme/entrepôt de
données.
• En général, les tables de dimensions tendent à être peu profondes
mais elles sont larges (l'inverse de la table de faits), en d’autres termes
elles ont peu de lignes mais beaucoup de colonnes.
STRUCTURE DU DATAWAREHOUSE
• Au sein du Datawarehouse, les données sont redondantes et
dénormalisées, nous sommes loin de la modélisation en troisième
forme normale (3NF) et pour cause, cela permet de faciliter
l’utilisation et d’améliorer les performances lors de l'analyse des
données.
• Trois types de schémas sont fréquemment rencontré:
1. le schéma en étoile,
2. le schéma en flocon
3. et le schéma en constellation de faits.
LE SCHÉMA EN ÉTOILE

• Dans un schéma en étoile, une table centrale de

faits contenant les faits à analyser, référence les
tables de de dimensions par des clefs étrangères.
Chaque dimension est décrite par une seule table
(feuille de l’arbre de
• tables) dont les attributs représentent les diverses
granularités possibles.
MODELE EN ÉTOILE
EXEMPLE SCHÉMA EN ÉTOILE
LE SCHÉMA EN FLOCON

• Dans un schéma en flocon, cette même table de faits,

référence les tables de dimensions de premier niveau, au
même titre que le schéma en étoile.
• La différence réside dans le fait que les dimensions sont
décrites par une succession de tables (à l’aide de clefs
étrangères) représentant la granularité de l'information. Ce
schéma évite les redondances d’information mais nécessite
des jointures lors des agrégats de ces dimensions.
MODELE EN FLOCON
EXEMPLE SCHÉMA EN FLOCON
LES SCHÉMAS EN CONSTELLATION DE
FAITS
• un schéma en constellation, plusieurs modèles
dimensionnels se partagent les mêmes dimensions,
c'est-à-dire,
dire, les tables de faits ont des tables de
dimensions en commun.
• En effet, les différences entre ces trois modèles sont
faibles et ne peuvent donner lieu à des
comparaisons de performance. Ce sont des
schémas issus de la modélisation dimensionnelle
utilisés par les outils décisionnels.
MODÈLE EN CONSTELLATION
EXEMPLE SCHÉMA EN
CONSTELLATION
CONCLUSION
• L’entrepôt de Données ou Datawarehouse est une base de données
destinée aux décideurs.
• La structure de cette base de données comprend les faits, les indicateurs et
les dimensions. Ces derniers sont représentés, organisés selon divers types de
schémas conventionnels.
• L’entrepôt est obtenu à partir de diverses bases de données de production
de l’entreprise. Des outils performants nous facilitent la construction du
Datawarehouse.
• Actuellement, l’entrepôt de données est devenu l’un des outils fondamental
et incontournable pour les prises de décisions au sein de l’entreprise.

Vous aimerez peut-être aussi

Chapitre1 IntroductionSID
Pas encore d'évaluation
Chapitre1 IntroductionSID
29 pages
Inbound 1707729765403319330
Pas encore d'évaluation
Inbound 1707729765403319330
41 pages
Fondamentaux de l'Entrepôt de Données
Pas encore d'évaluation
Fondamentaux de l'Entrepôt de Données
58 pages
BI Chapitre2
Pas encore d'évaluation
BI Chapitre2
38 pages
Cours de Data Mining à l'Université de Carthage
Pas encore d'évaluation
Cours de Data Mining à l'Université de Carthage
140 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
28 pages
Un Système D'information Opérationnel (SIO) Est Un Système Qui Collecte, Stocke, Traite Et Distribue
0% (1)
Un Système D'information Opérationnel (SIO) Est Un Système Qui Collecte, Stocke, Traite Et Distribue
4 pages
Document
Pas encore d'évaluation
Document
4 pages
Comprendre les entrepôts de données
Pas encore d'évaluation
Comprendre les entrepôts de données
22 pages
Cours Ed1
Pas encore d'évaluation
Cours Ed1
18 pages
Informatique Décisionnelle et ETL
Pas encore d'évaluation
Informatique Décisionnelle et ETL
7 pages
Datawarehousing Cours
Pas encore d'évaluation
Datawarehousing Cours
44 pages
Introduction aux entrepôts de données
Pas encore d'évaluation
Introduction aux entrepôts de données
54 pages
Chapitre 1 DW
Pas encore d'évaluation
Chapitre 1 DW
7 pages
Un Entrepôt de Données
Pas encore d'évaluation
Un Entrepôt de Données
10 pages
Concepts clés de l'informatique décisionnelle
Pas encore d'évaluation
Concepts clés de l'informatique décisionnelle
7 pages
Cours 1
Pas encore d'évaluation
Cours 1
21 pages
Support de Cours L2 LMD
Pas encore d'évaluation
Support de Cours L2 LMD
19 pages
Data Warehouse
100% (1)
Data Warehouse
41 pages
Cours - SID
0% (1)
Cours - SID
98 pages
Les Entrepôts de Données
Pas encore d'évaluation
Les Entrepôts de Données
68 pages
Entrepôts de données et OLAP : Guide complet
Pas encore d'évaluation
Entrepôts de données et OLAP : Guide complet
64 pages
Chapitre 1 Introduction Aux Entrepôts de Données
Pas encore d'évaluation
Chapitre 1 Introduction Aux Entrepôts de Données
5 pages
COURS ED - Chap1 - ADBD - 2022
Pas encore d'évaluation
COURS ED - Chap1 - ADBD - 2022
22 pages
Systèmes décisionnels et données
Pas encore d'évaluation
Systèmes décisionnels et données
28 pages
DAta Warehouse
80% (5)
DAta Warehouse
22 pages
Entrepot de Données Datawarehouse
Pas encore d'évaluation
Entrepot de Données Datawarehouse
64 pages
Cours EDD 240328 115957
Pas encore d'évaluation
Cours EDD 240328 115957
155 pages
Cours UIRAN02 S7 P1
Pas encore d'évaluation
Cours UIRAN02 S7 P1
60 pages
Entrepôts de Données : Concepts et Architecture
Pas encore d'évaluation
Entrepôts de Données : Concepts et Architecture
33 pages
Entrepot EMSI
Pas encore d'évaluation
Entrepot EMSI
31 pages
Partie 1 Et 2
Pas encore d'évaluation
Partie 1 Et 2
31 pages
Entrepôts de Données Décisionnels
Pas encore d'évaluation
Entrepôts de Données Décisionnels
33 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
17 pages
Cours - Datawarehouse
Pas encore d'évaluation
Cours - Datawarehouse
83 pages
chp2 140227090814 Phpapp02
Pas encore d'évaluation
chp2 140227090814 Phpapp02
33 pages
Introduction à l'OLAP en BI
Pas encore d'évaluation
Introduction à l'OLAP en BI
14 pages
Chapitre 2 Séance 2 04-02 ED ISIMA 2024 2025
Pas encore d'évaluation
Chapitre 2 Séance 2 04-02 ED ISIMA 2024 2025
14 pages
Séance 2
Pas encore d'évaluation
Séance 2
33 pages
Conception Dun Outil Decisionnel Pour La Gestion PDF
Pas encore d'évaluation
Conception Dun Outil Decisionnel Pour La Gestion PDF
15 pages
Introduction aux entrepôts de données
Pas encore d'évaluation
Introduction aux entrepôts de données
22 pages
Partie Theorique BI
Pas encore d'évaluation
Partie Theorique BI
7 pages
Chapitre 4 Système Décisionnel Et Entrepôts de Données
Pas encore d'évaluation
Chapitre 4 Système Décisionnel Et Entrepôts de Données
39 pages
ED 2018 Bio Architectures Et Modèles
Pas encore d'évaluation
ED 2018 Bio Architectures Et Modèles
31 pages
BI Classique
Pas encore d'évaluation
BI Classique
143 pages
Cours Datawarehouse BI DW
Pas encore d'évaluation
Cours Datawarehouse BI DW
147 pages
CM3 - Conception D'un Entrepôt de Données (DataWarehouse)
Pas encore d'évaluation
CM3 - Conception D'un Entrepôt de Données (DataWarehouse)
32 pages
Comprendre l'entrepôt de données
Pas encore d'évaluation
Comprendre l'entrepôt de données
30 pages
Introduction aux Data Warehouses
Pas encore d'évaluation
Introduction aux Data Warehouses
37 pages
Decisionnel - Conception D - Un Entrepôt de Données
Pas encore d'évaluation
Decisionnel - Conception D - Un Entrepôt de Données
28 pages
1 PrincipesDataWarehouse
Pas encore d'évaluation
1 PrincipesDataWarehouse
19 pages
Introduction aux Entrepôts de Données
Pas encore d'évaluation
Introduction aux Entrepôts de Données
18 pages
DW Hilal 2019
Pas encore d'évaluation
DW Hilal 2019
96 pages
BI2024 DW Part1
Pas encore d'évaluation
BI2024 DW Part1
29 pages
Cour 2
Pas encore d'évaluation
Cour 2
26 pages
Informatique Décisonnelle
Pas encore d'évaluation
Informatique Décisonnelle
25 pages
Cours DW PDF
Pas encore d'évaluation
Cours DW PDF
77 pages
Architecture et Impact des DataWarehouses
Pas encore d'évaluation
Architecture et Impact des DataWarehouses
30 pages
Distribution Touristique: Fondamentaux et Stratégies
Pas encore d'évaluation
Distribution Touristique: Fondamentaux et Stratégies
42 pages
Mode D'emploi GW Instek GDS-1202B (Français - 17 Des Pages)
Pas encore d'évaluation
Mode D'emploi GW Instek GDS-1202B (Français - 17 Des Pages)
8 pages
CoursPiles Et Files
Pas encore d'évaluation
CoursPiles Et Files
7 pages
RAM (Random Access Memory) : Les Mémoires Vives (RAM)
Pas encore d'évaluation
RAM (Random Access Memory) : Les Mémoires Vives (RAM)
8 pages
Movie Box - Recherche Google
Pas encore d'évaluation
Movie Box - Recherche Google
1 page
Guide Windows Server 2019 et AD
Pas encore d'évaluation
Guide Windows Server 2019 et AD
6 pages
Bioinformatique Structurale sous Linux
Pas encore d'évaluation
Bioinformatique Structurale sous Linux
36 pages
Cours Python NV
Pas encore d'évaluation
Cours Python NV
180 pages
Modèle de Politique Informatique
Pas encore d'évaluation
Modèle de Politique Informatique
8 pages
Produits FR
Pas encore d'évaluation
Produits FR
4 pages
Correstion TD3
Pas encore d'évaluation
Correstion TD3
3 pages
Rapport de Stage chez MARTECH
Pas encore d'évaluation
Rapport de Stage chez MARTECH
17 pages
Correction SI 1 TleD
Pas encore d'évaluation
Correction SI 1 TleD
4 pages
Exercices d'Électronique Numérique
Pas encore d'évaluation
Exercices d'Électronique Numérique
32 pages
Programmez en Oriente Objet en PHP
100% (2)
Programmez en Oriente Objet en PHP
463 pages
Exposé Sur Le Chipset
0% (1)
Exposé Sur Le Chipset
11 pages
Algorithmes de Machine Learning en 2023
100% (1)
Algorithmes de Machine Learning en 2023
52 pages
Memoire Gabin&Freud (1) - 1
Pas encore d'évaluation
Memoire Gabin&Freud (1) - 1
48 pages
CP Logirem - Application Mobile Logirem - Décembre2021 1
Pas encore d'évaluation
CP Logirem - Application Mobile Logirem - Décembre2021 1
2 pages
Presentation Archivage Electronique3
Pas encore d'évaluation
Presentation Archivage Electronique3
89 pages
BUT 1 Plan D'amphi
Pas encore d'évaluation
BUT 1 Plan D'amphi
7 pages
DUT Métiers du Multimédia et Internet
Pas encore d'évaluation
DUT Métiers du Multimédia et Internet
74 pages
0 - Routing Technologies
Pas encore d'évaluation
0 - Routing Technologies
120 pages
Applications Android : Activités et Intents
Pas encore d'évaluation
Applications Android : Activités et Intents
45 pages
Ccnabc Formation Cisco Ccna Certification Fast Track Program 150305152234 Conversion Gate01
Pas encore d'évaluation
Ccnabc Formation Cisco Ccna Certification Fast Track Program 150305152234 Conversion Gate01
2 pages
Cours de Français Niveaux A1 A2
Pas encore d'évaluation
Cours de Français Niveaux A1 A2
12 pages
Cahier Des Charges
Pas encore d'évaluation
Cahier Des Charges
4 pages
EVALUATION N°5 6ème
Pas encore d'évaluation
EVALUATION N°5 6ème
2 pages
035 FAQ WIT Comment-Configurer-L-Envoi-Demails v3.1 FR
Pas encore d'évaluation
035 FAQ WIT Comment-Configurer-L-Envoi-Demails v3.1 FR
14 pages
Plateforme de Rendez-vous Médical
Pas encore d'évaluation
Plateforme de Rendez-vous Médical
102 pages