Développement de Microstrategy au Maroc
Développement de Microstrategy au Maroc
2
Chapitre 1
Business Intelligence
3
Qu’est ce que la Business Intelligence ?
4
Objectif de la Business Intelligence
Pour les entreprises, l'enjeu est important car une prise de décision plus rapide
permet une meilleure réactivité aux évolutions de leur écosystème.
5
Objectif de la Business Intelligence
sur un client
BI
de caisse « bons clients »
6
Architecture Générale des systèmes décisionnels
Restitution
Sources de données Entrepôt de données
• Requêtes
• Analyses
• Tableaux de bord
•…
Data Warehouse
7
Exemples
• Quelle est la qualité de service fournit aux clients ? Quels sont les points
d’améliorations ?
8
Chapitre 2
Architecture du système
d’information décisionnel
9
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
10Datamining
Statistiques
Outil d'alimentation - ETL
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
11Datamining
Statistiques
Outil d'alimentation - ETL
Outils sources : Systèmes transactionnels
13
Données opérationnelles Vs données décisionnelles
14
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
15Datamining
Statistiques
Outil d'alimentation - ETL
ETL : Extract,Transform and Load
ETL est un progiciel voué au transfert de données d’un source quelconque vers une
cible quelconque.
1. Extraction :
2. Transformation :
Les données extraite dans l’ODS ne sont pas exploitables en l’état, des nettoyages,
mapping et transformation s’imposent !
17
ETL : Extract,Transform and Load
2. Transformation (suite) :
18
ETL : Extract,Transform and Load
3. Chargement :
19
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
20Datamining
Statistiques
Outil d'alimentation - ETL
ODS : Operational Data Store
Caractéristiques de l’ODS :
• Données destinées à l’aide à la décision ou au reporting.
• Organisation souvent très proche de celle des bases opérationnelles.
• Répond au besoins de capture d’informations volatiles ou de
synchronisation de flux.
• Peu ou pas d'historique. 21
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
22Datamining
Statistiques
Outil d'alimentation - ETL
Data WareHouse
Le Data Warehouse est basé sur une modélisation dimensionnelle qui facilite
l’analyse selon des axes prédéfinis.
23
Caractéristiques d’un Data WareHouse
Historisés :
• Les données de l’entrepôt varient en fonction du temps. Elles sont des clichés
datés des données des systèmes opérationnels à un instant T.
• L’historisation permet l’analyse des tendances.
• Le rafraichissement des données se fait par une périodicités qui est déterminées
selon les besoins.
Non volatile :
• Les informations sont conservées pendant une certaine durée.
• La même requête avec la même date de référence aura le même résultat à tout
moment. (Conséquence de l’historisation)
• La volumétrie des données est très importante.
25
Architecture Détaillées des systèmes décisionnels
Sources Zone de Consolidation Analyse
travail Stockage Restitution
Bases
externes
Outils d'analyse OLAP
MOLAP, ROLAP, HOLAP
Dictionnaire de données
Référentiel
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
26Datamining
Statistiques
Outil d'alimentation - ETL
DataMart
Le Datamart est ciblé sur un sujet unique et est lié à un métier de l'entreprise
(marketing, finance, DRH, etc), pour répondre à une problématique définie
d’aide à la décision.
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
30Datamining
Statistiques
Outil d'alimentation - ETL
Référentiel & Métadonnées (Data about Data)
Mainframe Métadonnées
Garde la trace des données, de leur origine
et de l'exploitation faite OLAP
E
ERP
T
ODS Consultation/
L Datamart 1 Interrogation
Tableaux de bord
Tableur
Spécifique E Data
E Requêteurs
T Warehouse T
Simulation/
L L Prédiction
Fichiers Plats
Datamart n
32Datamining
Statistiques
Outil d'alimentation - ETL
OLAP (On line Analytical Processing)
Avantages :
• Performances d’accès. (Pré-calcul)
• Règles d’agrégation (même complexes) inclues dans la définition du cube.
• Gestion de la sécurité.
Inconvénients :
• Temps de génération du cube ou de re-calcul lors de l’ajout de nouvelles
données.
• Utilisation avec un outil d’analyse non-propriétaire souvent problématique ou
limitée.
33
OLAP - Exemple
Question : Combien de machines à laver grises ont été vendues à Marjane Californie le
10/04/2016 ?
F – Fast : Les temps de réponses doivent être bon même avec beaucoup de données
(moins de 5 secondes)
A – Analysis : Le système OLAP doit être flexible et offrir une richesse d’analyse.
S – Shared : Le système doit gérer les accès multiples aux données en garantissant la
confidentialité des données..
35
OLTP Vs OLAP
36
OLTP Vs OLAP
37
Outils d’extraction :
Editeurs
Datastage,
PowerMart,
BODI, Genio
Sunopsis, OWB, REQUETEURS
Talend, SSIS Cognos,SSRS
Informatica, SAP BO, SAS,SSRS
Pentaho Microstrategy, Jasper
OLAP
Essbase,
ETL SGBD : Oracle, DB2 Powerplay,
Oracle Olap,
SQLServer, Teradata,
Sybase, SAS, MicroStrategy
sur UNIX, MVS, NT
DATAMINING
SAS, Scénario,
Alice, 4Thought,
Statlab,Seeker
Knowledge
39
Modélisation dimensionnelle
C'est la définition des besoins qui détermine quelles sont les données requises
pour répondre aux besoins d'analyse des utilisateurs. Le résultat de cette analyse
est le modèle dimensionnel.
Le modèle identifie :
• La table de fait avec ses mesures et sa granularité
• Les dimensions associées avec attributs et hiérarchisation.
40
Modélisation relationnelle Vs Modélisation dimensionnelle
41
Schéma relationnel
42
Schéma en étoile
43
Schéma en flocon de neige
44
Schéma en étoile Vs Schéma en flocon de neige
Exécution plus rapide des requêtes Exécution moins rapides des requêtes
dues à la présence de jointure
Nombre de dimension moins important Nombre de requêtes plus important
45
Les dimensions
Les dimensions sont des tables qui constituent les différents Axes
d’analyses. Elle sont composées d’un ensemble attributs, qui peuvent être :
• Des champs textuels
• Des champs discret, ayant un nombre limité de valeur (civilité,
couleur..)
49
SCD – Type 2: Ajout d’une nouvelle ligne
Approche 1 : Date début et la Date fin.
Tables 1 : Avant changement
ID ID Client Date Début Date Fin Nom Ville
1 453 01/01/2014 NULL James New York
54
La table de faits
La table de fait est une table qui contient l’activité de l’entreprise que nous
voulons analyser, par exemple les articles vendus aux clients sur une période
de temps donnée.
C’est une table centrale entourée des différents dimensions, qui constituent
les axes d’analyses.
Elle contient les clés de l’ensemble des dimensions qui lui sont liées ainsi que
d’autres champs appelés les mesures (champs numériques).
Data Warehouse
55
Chapitre 4
Etude de Cas
56
Etude de Cas
57