Cours Entrepôts des données
02
Enseignante: Salma DAMMAK
2 ème année Génie Informatique
Année Universitaire: 2020/2021
Navigation dimensionnelle
Cours entrepôt des données 2
Objectifs du cours
Maitriser la navigation dimensionnelle
Gestion des cubes
Lecture des données avec les différents opérateurs de navigation
Cours entrepôt des données 3
Introduction
Un système OLTP s’appuie sur un SGBDR.
fournit uniquement une vue aplatie et statique des données dans un point de
l’espace temps.
nécessaire pour assurer la performance des transactions opérationnelles
Le système décisionnel OLAP s’appuie sur le Data Warehouse.
Conceptuellement, un Data Warehouse est un modèle multidimensionnel.
Les requêtes décisionnelles sont généralement des requêtes
multidimensionnelles, c’est-à-dire qu’elles croisent les données selon plusieurs
dimensions.
Cours entrepôt des données 4
Introduction
Structure de données qui consiste à stocker les données représentées sous
forme de point dans un espace à plusieurs dimensions a été mise sur pied
• Hyper Cube ou plus conventionnellement un Cube
Un cube OLAP est une structure de données multidimensionnelle stockant les
faits comme des mesures indexées par plusieurs dimensions.
Chaque cellule d’un cube représente la mesure ou valeur quantitative d’un fait sur le
croisement de plusieurs dimensions.
L’intérêt d’un cube OLAP est d’offrir à l’utilisateur la capacité de faire des
analyses multidimensionnelles ou des agrégations par axe de dimension dans
l’espace.
Cours entrepôt des données 5
Introduction
• Un cube OLAP est une méthode de stockage de données sous forme
multidimensionnelle.
• Cette représentation structurelle est prévue à des fins d'analyses et de génération de rapports.
• Les cubes OLAP ont les caractéristiques suivantes :
1- obtention des informations déjà agrégées selon les besoins de l’utilisateur.
2- simplicité et rapidité d’accès
3- capacité à manipuler les données agrégées selon différentes dimensions
4- utilisation des fonctions classiques d’agrégation : min, max, count, sum, avg, mais peut utiliser
des fonctions d’agrégations spécifiques
Cours entrepôt des données 6
Introduction
Cube OLAP
Cours entrepôt des données 7
Navigation dimensionnelle
• Supposons que nous souhaitons calculer la somme des ventes par produit et par
année.
• La représentation de ce tableau sous forme d’une structure multidimensionnelle
fournit le cube OLAP suivant.
Cours entrepôt des données 8
Navigation dimensionnelle
Les ventes de tous les magasins "XXX".
Source : Système décisionnel Par Eddy Meylan (HES)
Cours entrepôt des données 9
Navigation dimensionnelle
Différentes vues d’un cube OLAP des Ventes par magasins, catégories et date
Cours entrepôt des données 10
Navigation dimensionnelle
On s'intéresse aux ventes du magasin COTONA dans la catégorie "vêtements
pour enfants" durant le mois de Février
Cours entrepôt des données 11
Navigation dimensionnelle
Les cubes multidimensionnels disposent de 3 opérateurs multidimensionnels pour leur
exploitation:
Opérateurs liés à la structure : Ces opérateurs de transformation permettent de
changer la représentation du schéma dimensionnel. L’objectif de ces opérateurs est de
manipuler le schéma afin de mieux appréhender les informations.
Opérateurs liés au contenu: Ces opérateurs réalisent le changement des paramètres
d’analyse de la table dimensionnelle en passant par une granularité d’analyse plus ou
moins fine.
Opérateurs entre cubes: Ces opérateurs réalisent des transformations entre deux
cubes ou plus.
Cours entrepôt des données 12
Opérateurs liés à la structure
L’opérateur de rotation (ROTATE/
PIVOT)
Faire pivoter ou réorganiser les
dimensions de l'hypercube.
Il consiste à effectuer une
rotation de l'hypercube afin de
présenter une face différente
Il s'agit donc de modifier une
dimension de lecture.
on est maintenant capable d’obtenir le chiffre d’affaire réalisé par le vendeur Juvénal à l’année 2001.
Cours entrepôt des données 13
Opérateurs liés à la structure
L’opérateur de rotation (ROTATE/ PIVOT)
Cours entrepôt des données 14
Opérateurs liés à la structure
L’opérateur de permutation (SWITCH)
consiste à inter-changer (permuter) la position
des membres d’une dimension.
On a permuté les deux vendeurs Juvénal et Yvan
Cours entrepôt des données 15
Opérateurs liés à la structure
L’opérateur de permutation (SWITCH)
On a permuté les deux régions sud et nord
Cours entrepôt des données 16
Opérateurs liés à la structure
L’opération d’extraction du cube (SLICING/DICING) :
Cette opération consiste à extraire du cube un bloc de données
correspondant à un croisement entre plusieurs dimensions.
Ce bloc permet alors de recalculer plus facilement le cube.
Cours entrepôt des données 17
Opérateurs liés à la structure
SLICE:
consiste à extraire les mesures correspondant à une certaine dimension en
s’appuyant sur un critère de valeur.
Slice (ville= Lyon ou ville =
Toulouse)
VEHICULE.Marque
VEHICULE.Marque
Peugeot Peugeot
Citroën Citroën
Audit 2002 2002
Audit
s
2001
ée
2001
nn
ée
Ford 2000 2000
nn
.A
Ford
1999
.A
PS
1999
las
PS
n
M
se
o rk
n
Lyo
se
Lyo
M
lou
Dal
TE
lou
wY
TE
T ou
T ou
Ne
Agence.Ville Agence.Ville
Par exemple toutes les agences de Lyon ou Toulouse
Cours entrepôt des données 18
Opérateurs liés à la structure
SLICE
Cours entrepôt des données 19
Opérateurs liés à la structure
SLICE
Cours entrepôt des données 20
Opérateurs liés à la structure
DICE
consiste à extraire un bloc de mesures en s’appuyant sur des critères
d’attributs de dimensions.
Cours entrepôt des données 21
Opérateurs liés à la structure
DICE
Cours entrepôt des données 22
Opérateurs liés au contenu
Les opérations agissant sur la granularité d’observation des données
caractérisent la hiérarchie de navigation entre les différents niveaux.
Roll-up ou forage vers le haut
consolider (résumer) les données Passer à un niveau supérieur dans la
hiérarchie d’une dimension.
Roll-up: moins de détails (grain supérieur)
Drill-down ou forage vers le bas
l’inverse du Roll-up descendre dans la hiérarchie d’une dimension.
Drill-down: plus de détails (grain inférieur)
Cours entrepôt des données 23
Opérateurs liés au contenu
Cours entrepôt des données 24
Opérateurs liés au contenu
Cours entrepôt des données 25
Opérateurs entre cube
Jointure
Cours entrepôt des données 26
Opérateurs entre cube
Union
Cours entrepôt des données 27
Exercice:
Indiquer le type d’opérateur utilisé
Cours entrepôt des données 28
Exercice:
Indiquer le type d’opérateur utilisé
Cours entrepôt des données 29
Exercice:
Indiquer le type d’opérateur utilisé
Cours entrepôt des données 30
Exercice 1:
On veut construire un entrepôt de données afin de stocker les informations sur les
consultations d’un pays. On veut notamment connaître le nombre et le montant des
consultations, par rapport à différents critères (personnes, médecins, spécialités, etc). Ces
informations sont stockées dans les relations suivantes :
PERSONNE (id_personne, nom, tel, adresse, sexe)
MEDECIN (id_medecin, tel, adresse, spécialité)
CONSULTATION (id_med, id_pers, date, prix)
1) Faites une représentation du cube OLAP sans tenir compte des hiérarchies (le premier
paramètre de chaque hiérarchie d’une dimension est affiché)
2) A partir de ce cube, indiquez quelles opérations OLAP (roll up, drill down, slice, dice) il
faut appliquer pour obtenir les informations suivantes :
a) Le coût total des consultations par médecin en 2012 et 2013.
b) Le nombre de consultations par jour de la semaine et pour les personnes de ville de
Sousse.
Cours entrepôt des données 31
Exercice 2:
Construire un entrepôt de données afin de stocker les informations sur les ventes d’un produit
dans un magasin. On veut notamment connaître la quantité vendues et le montant des ventes.
Ces relations nous ont été offerts afin de préciser les axes d’analyses :
Magasin (id_mg, LibMg, tel, dépot, Localisation)
Produit (id_produit, libProd, gamme, marque)
1) Faites une représentation du cube OLAP sans tenir compte des hiérarchies (le dernier
paramètre de chaque hiérarchie d’une dimension est affiché)
2) A partir de ce cube, indiquez quelles opérations OLAP (roll up, drill down, slice, dice) il
faut appliquer pour obtenir les informations suivantes :
a) La quantité vendue pour les magasins de localisation sfax et sousse.
b) Le montant des ventes par jour d’année et les magasin « mg1 »
c) La quantité vendue pour l’année 2020 et 2021 et les produit de gamme « G003 ».
d) Les montant des ventes pour magasins appartenant aux dépôts « d1 » et « d3 » et le
premier trimestre de l’année.
Cours entrepôt des données 32