Système d’Information Décisionnels et Big Data
Master: Business Analytics
Chapitre 3: Cube OLAP
Dr. Fatma Siala Kallel
Mr. Bilel Marzouki
2021/2022
Entrepôt de données
• Unentrepôt de données contient des données
nombreuses, homogènes, exploitables, multidimensionnelles et
consolidées.
• Analyser les données d’un entrepôt de données c’est :
Résumer
Observer
Appliquer des formules statistiques
Synthétiser des données selon plusieurs dimensions.
• Comment exploiter ces données à des fins d’analyse ?
€ traditionnellement : les requêtes OLTP sont exécutées
sur les données.
2
Exemples d’analyses d’un entrepôt
3
Exemples d’analyses d’un entrepôt
• Analyse des ventes de divers produits :
SELECT modele, SUM(montant)
FROM ventes, produits
WHERE [Link] = [Link]
GROUP BY modele;
• Les ventes de vis sont plus faibles que prévu... quelles couleurs
sont responsables ?
SELECT couleur, SUM(montant)
FROM ventes, produits
WHERE [Link] = [Link]
AND modele = “vis”
GROUP BY couleur ;
4
Exemples d’analyses d’un entrepôt
• Les ventes de vis sont plus faibles que prévu... quelles années
sont responsables ?
SELECT couleur, annees, SUM(montant)
FROM ventes, produits, temps
WHERE [Link] = [Link]
AND [Link] = [Link]
AND modele = “vis”
GROUP BY couleur, annees ;
• Les ventes de vis sont plus faibles que prévu... Quels trimestres
sont responsables ?
SELECT couleur, trimestre, SUM(montant)
FROM ventes, produits, temps
WHERE [Link] = [Link]
AND [Link] = [Link]
AND modele = “vis”
GROUP BY couleur, trimestre
;
5
Exemples d’analyses d’un entrepôt
• Quels sont les résultats cumulés des vendeurs par mois ?
SELECT vendeur, mois, CSUM(resultat,vendeur,mois) as cumul
FROM (
SELECT vendeur, mois, Sum(montant) as resultat
FROM ventes, produits, temps
WHERE [Link] = [Link]
AND [Link] = [Link]
AND modele = “vis” AND
couleur = “rose”
GROUP BY mois,
vendeurs) ORDER BY mois ;
• Quelle est lʼévolution de la moyenne des ventes pour une fenêtre de 2
jours ?
SELECT date, montant, MAVG(montant,2,date) as moy
FROM ventes, temps
WHERE [Link] = [Link]
AND annee = 2001
ORDER BY date ;
6
Exemples d’analyses d’un entrepôt
• Supporter des opérations “tableur” sur des BD de plusieurs
Go !!!
• Besoins spécifiques :
• langages de manipulation
• organisation des données
• fonctions d'agrégation
• Organisation des données proche des abstractions de l'analyste :
• selon plusieurs dimensions
• selon différents niveaux de détail
• en ensemble
• Donnée = point dans l'espace associé à des valeurs
7
OLAP
• Acronyme : On-line Analytical Processing
• C’est une représentation abstraite d'informations multidimensionnelles
exclusivement numérique. Cette structure est prévue à des fins d'analyses
interactives par une ou plusieurs personnes (souvent ni informaticiens ni
statisticiens) du métier que ces données sont censées représenter.
• Cube OLAP présente les avantages suivants:
Obtenir des informations déjà agrégées selon les besoins d’utilisateur.
Simplicité et rapidité d’accès.
Capacité à manipuler données agrégées selon différentes
les dimensions.
Temps de réponse très court.
Pas de jointure.
8
OLAP
on parle de technologie OLAP mais aussi connu sous le nom de Cube OLAP, ceci
à cause du design de sa structure de donnée comparable à un tableau croisé
dynamique (TCP) mais en bien mieux.
Un cube OLAP est une base de données à plusieurs dimensions, optimisée pour les
applications d'entrepôt de données et de traitement analytique en ligne (OLAP,
OnLine Analytical Processing).
Un cube OLAP est une méthode de stockage de données sous forme
multidimensionnelle, généralement à des fins de génération de rapports.
9
OLAP
10
OLAP versus OLTP
11
OLAP
Un cube OLAP est une représentation abstraite
d'informations multidimensionnelles exclusivement
numérique utilisé par l'approche OLAP (acronyme de
On-line Analytical Processing). Cette structure est
prévue à des fins d'analyses interactives par une ou
plusieurs personnes (souvent ni informaticiens ni
statisticiens) du métier que ces données sont
censées représenter.
12
OLAP
Les cubes OLAP ont les caractéristiques suivantes :
1obtenir des informations déjà agrégées selon les
besoins de l’utilisateur.
2 simplicité et rapidité d’accès
3capacité à manipuler les données agrégées selon
différentes dimensions
4 un cube utilise les fonctions classiques
d’agrégation
: min, max, count, sum, avg, mais peut utiliser
des fonctions d’agrégations spécifiques.
13
Exemple de cube OLAP
nous allons nous intéresser aux ventes de tous les magasins
"XXX".
14
Exemple de cube OLAP
Vue n° 1 : On s'intéresse à toutes les ventes du magasin
d'ANNECY (toutes catégories confondues durant toute l'année)
15
Exemple de cube OLAP
Vue n° 2 : On s'intéresse aux ventes de la catégorie "vêtements pour enfants«
(tous les magasins durant toute l'année)
16
Exemple de cube OLAP
Vue n° 3 : On s'intéresse à toutes les ventes durant le mois de Février
(toutes catégories confondues et dans tous les magasins)
17
Exemple de cube OLAP
Vue n° 4 : On s'intéresse aux ventes du magasin d'ANNECY dans
la catégorie "vêtements pour enfants" durant le mois de Février
18
Opérations OLAP
3 catégories d'opérations élémentaires :
• Restructuration : concerne la représentation, permet un changement de points de
vue selon différentes dimensions : opérations liées à la structure, manipulation et
visualisation du cube :
• Rotate/pivot
• Switch
• Granularité : concerne un changement de niveau de détail : opérations liées au
niveau de granularité des données :
• roll-up
• drill-down
• Ensembliste : concerne l'extraction et l'OLTP classique :
• slice, dice
• Selection
• Projection
• jointure (drill-across)
19
Exemple de cube OLAP
Ces différentes vues correspondent à différentes opérations. Voici la liste
des opérations OLAP :
1 Pivoter (pivot, swap) : interchanger 2 dimensions.
2Forage vers le bas (drill-down) : descendre dans la hiérarchie de la dimension
(Ex. visualiser les ventes par mois au lieu de par année).
3Forage vers le haut (drill-up, roll-up) : remonter dans la hiérarchie de la
dimension (Ex. visualiser les ventes par année au lieu de par mois).
4Forer latéralement (drill-across) : Permet de passer d’un membre de dimension
à un autre (Ex. visualiser les ventes d’ANNECY au lieu de celles de PARIS).
20
Techniques d’implémentation
21
Systèmes ROLAP
Systèmes ROLAP = technologie de stockage relationnelle :
• Le modèle relationnel demande des extensions pour supporter les requêtes
d'analyses multidimensionnelles du niveau d'application
• Le moteur ROLAP traduit dynamiquement le modèle logique de
données multidimensionnel M en modèle de stockage relationnel R (en étoile ou en
flocon).
• Techniquement, le moteur ROLAP transforme une requête multidimensionnelle
requête relationnelle
L'efficacité du résultat de la requête est le facteur dominant pour la performance et
le passage à l'échelle global du système
choix de technique/stratégies d'optimisation spécifiques
22
Techniques d’implémentation
R-OLAP se définit par Relational OLAP. La base ROLAP est en fait une
classique base relationnelle organisée pour fonctionner comme une
base OLAP. Les bases ROLAP sont bien plus lentes et nettement moins
performantes que les bases MOLAP. Mais, immense avantage, elles sont
sans limite de taille.
M-OLAP se définit par Multidimensional OLAP. La base MOLAP est
l'application physique du concept OLAP. Il s'agit réellement d'une structure
multidimensionnelle. Les bases MOLAP sont rapides et performantes. Elles
proposent des fonctionnalités particulièrement évoluées. Les bases de type
MOLAP restent limitées au gigaoctet. C'est de cet fonctionnalité que vient
le Cube OLAP pour sa faculté multi-dimensionnel.
23
Techniques d’implémentation
H-OLAP se définit par Hybrid OLAP. Le modèle HOLAP, propose de
cumuler les avantages des deux modèles précédents. Les données
agrégées sont stockées sous formes multi-dimensionnelles, alors
que les données détaillées sont stockées dans des structures
relationnelles.
D-OLAP se définit par Desktop OLAP. La base DOLAP est une base
OLAP très limitée en taille, hébergée sur le poste client. Elle est
bien entendu très rapide.
24