Introduction à l’entrepôt des
données
Premier
Cour
intro
Yahia
Page | 1
Page | 2
Contents
Le contexte ................................................................................................ 3
Les données utilisables par les d´décideurs .................................................... 3
Introduction ............................................................................................... 3
Raisons d’ˆêtre d’un entrepôt de données ...................................................... 4
C’est quoi un entrepôt de données ? .............................................................. 4
Les 4 caractéristiques des data warehouse ..................................................... 4
Les 4 caractéristiques des data warehouse (2) ................................................ 5
Page | 3
Le contexte
Besoin : prise de décisions stratégiques et tactiques
Pourquoi : besoin de réactivité
Qui : les d´décideurs (non informaticiens)
Comment : répondre aux demandes d’analyse des données,
D´engager des informations qualitatives nouvelles
Les données utilisables par les d´décideurs
Données opérationnelles (de production)
• Bases de données (Oracle, SQL Server)
• Fichiers, . . .
• Paye, gestion des RH, gestion des commandes. . .
Caractéristiques de ces données :
• Distribués: system éparpillés
• Hétérogènes : systèmes et structures de données différents
• Détaillées : organisation des données selon les processus
Fonctionnels, données surabondantes pour l’analyse
• Peu/pas adaptées à l’analyse : les requêtes lourdes peuvent
Bloquer le système transactionnel
• Volatiles : pas d’historisation systématique
Introduction
Pourquoi le data warehouse ?
• Améliorer les performances d´décisionnelles de l’entreprise
Comment ?
• En répondant aux demandes d’analyse des d´décideurs
Exemples
• Clientèle : Qui sont mes clients ? Pourquoi sont-ils mes clients ?,
Page | 4
Comment les conserver ou les faire revenir (préférence d’achat, Habitudes, .
. .) ? Ces clients sont-ils vraiment intéressants pour moi ?
• Marketing, actions commerciales : ou placer ce produit dans les
Rayons ? Comment cibler plus précisément le mailing concernant ce
Produit ?
Raisons d’ˆêtre d’un entrepôt de données
Rassembler les données de l’entreprise dans un même lieu sans
Surcharger les BD (systèmes opérationnels)
Permettre un accès universel `a diverses sources de données et
Assurer la qualité des données
Extraire, filtrer, et intégrer les informations pertinentes, `a
L’avance, pour des requêtes ultérieures
D´engager des connaissances et faire un apprentissage sur
L’entreprise, le marché et l’environnement
C’est quoi un entrepôt de données ?
Industrie (Inman 1992)
• Collection de données orientées sujets
• Consolidées dans une base de données unique
• Non volatiles et historismes variant dans le temps
• Organisées pour le support d’un processus d’aide à la décision
Recherche (Stanford 1995)
• Dispositif de stockage d’informations intégrées de sources
Distribuées, autonomes, hétérogènes
Les 4 caractéristiques des data warehouse
Données orientées sujet
• Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation fonctionnelle des données
Page | 5
Données intégrées
• Normalisation des données
• Définition d’un référentiel unique
Les 4 caractéristiques des data warehouse (2)
Données non volatiles
• Traçabilité des informations et des d´décisions prises
• Copie des données de production
Données datées
• Les données persistent dans le temps
• Mise en place d’un référentiel temps