Université de Tunis
Institut Supérieur de Gestion de Tunis
Module :
Informatique décisionnelle
(Business Intelligence)
Aouatef ROUAHI
[email protected]
ISG – Master en Informatique Appliquée à la Gestion 12/08/2021
12/08/2021
2
Syllabus du cours
Objectifs
Sensibiliser les étudiants à l’importance du décisionnel;
Se familiariser avec les technologies de l'informatique décisionnelle;
Appréhender les enjeux et les problématiques de la gestion et du traitement de
données.
Pré-requis
Algorithmique, Programmation, Statistiques, et Bases de données.
12/08/2021
3
Organisation du cours
Data Warehouse
(10h) : cours 6h, TP 4h;
Rédaction en binôme d'un rapport d'étude.
Analyse de données
(8h) : cours 4h, TP 4h;
Évaluation individuelle écrite 1h.
Data Mining
(8h) : cours 4h, TP 4h;
Évaluation individuelle écrite 1h.
Visualisation de données
(10h): cours 5h, TP 5h;
Projet individuel de programmation.
12/08/2021
4
Data Warehouse
Les Entrepôts de
Données
(Data Warehouse)
Module : Informatique décisionnelle (Business Intelligence)
12/08/2021
5
PLAN Veuillez nous suivre…
Introduction Architecture
Définition DW Préparation
Stockage
Présentation Actualités & Perspectives
Conclusion
Références
Domaines Editeurs
d’application &
Outils
12/08/2021
Cycle Décisionnel
Enjeux et Difficultés
6
Introduction Données de Production VS Données
Décisionnelles
««Une
«La
Une
«Une action
donnéeréalisée
connaissance
information enpar
comme
est un fonction
estélémentunebrut,
définition
des connaissances
information
qui
unen’a pas encore
donnée disponibles.»
comprise.»
été interprété,
interprétée. »
1 1
Donnée mis en contexte.»1
Informatio
n
Connaissan
ce
Décision
1
Bruno Chaudet, « Introduction à la communication organisationnelle »
12/08/2021
Cycle Décisionnel
Enjeux et Problématique
7
Introduction Données de Production VS Données
Décisionnelles
Une pression concurrentielle continue;
Une explosion des données;
Distribuées,
Détaillées,
Hétérogènes.
Comment prendre des décisions
dans un environnement
parfaitement hétérogène?
12/08/2021
Cycle Décisionnel
Enjeux et Difficultés
8
Introduction Données de Production VS Données
Décisionnelles
Informatique de production
Un mode d’exploitation de données tourné vers la saisie, le stockage, la mise à
jour, la sécurité et l’intégrité des données.
l'informatique décisionnelle
Un mode d’exploitation de données visant à fournir à tout utilisateur reconnu et
autorisé, les informations nécessaires à son métier.
Une vision analytique de l'activité de l'entreprise;
Un suivi du fonctionnement de l'entreprise;
Un suivi de la performance de l’entreprise;
Une prédiction des tendances prospectives;
Etc.
12/08/2021
Cycle Décisionnel
Enjeux et Difficultés
9
Introduction Données de Production VS Données
Décisionnelles
Données Opérationnelles Données décisionnelles
Orientées application Orientées activité
Volumes limités Gros volumes
Vue instantanée Vue historisée
Cohérence atomique Cohérence globale
Structure rigide Structure flexible
Usage répété Usage ad-hoc
… …
12/08/2021
Orienté Sujet
Intégré
Non Volatile 10
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
12/08/2021
Orienté Sujet
Intégré
Non Volatile 11
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
Données orientées sujet:
Une vue synthétique permettant de réaliser des analyses transversales aux
structures fonctionnelles et organisationnelles de l'entreprise.
12/08/2021
Orienté Sujet
Intégré
Non Volatile 12
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
Données intégrées:
Un besoin d’ homogénéisation des données hétérogènes afin de parfaire la
cohérence globale de l’entrepôt de données.
12/08/2021
Orienté Sujet
Intégré
Non Volatile 13
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
Données non volatiles:
Seulement les actions d’ajout et de lecture qui sont autorisées et aucune
opération de mise à jour n’est permise.
12/08/2021
Orienté Sujet
Intégré
Non Volatile 14
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
Données historisées:
L'historisation est nécessaire pour suivre dans le temps l'évolution des
différentes valeurs des indicateurs à analyser.
Un référentiel temps doit être associé à toute structure « clé » dans le data
warehouse.
12/08/2021
Orienté Sujet
Intégré
Non Volatile 15
Définition Historisé
Un support du processus d’AAD
«Un entrepôt de données est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
Un support d’un processus d’aide à la décision :
Le data warehouse est un élément essentiel dans le processus d’extraction de
connaissances à partir de données (KDD).
12/08/2021
16
Domaines d’application
Commerce
… Banque
Econométrie Domaines
d’application
Assurance
du Data
Warehousing
Santé
Web
Logistique
12/08/2021
Zone Préparation
Zone Stockage 17
Architecture Zone Présentation
L’acquisition de données;
Le pré-traitement des données ;
L’alimentation de l’entrepôt;
L’analyse de données.
12/08/2021
Zone Préparation
Zone Stockage 18
Architecture Zone Présentation
Donnée Zone de Zone de Zone de Information
Préparation Stockage Présentation
ETL Requêteurs
Extraction
EIS
Transformation
Chargement Data Mining
…
Une zone de préparation:
présentation: une zoneaux
l’accès
stockage: le stockage temporaire de
donnéesdes
permanent stockagedans
contenues
données des le DW à
données
l’aide extraites
d’une
nettoyées. pour
palette deslaoutils
réalisation des dont
d’analyse transformations.
l'information est visualisée à
travers des interfaces interactives.
12/08/2021
Zone Préparation
Zone Stockage 19
Architecture Zone Présentation
ETL : Extract – Transform – Load
Découvrir et extraire les données brutes;
Transformer les données extraites;
Charger les données nettoyées dans l’entrepôt de données.
M, F
1, 0
M, F
Male, Female
TND
USD
EUR EUR
12/08/2021
Zone Préparation
Zone Stockage 20
Architecture Zone Présentation
Modélisation Multidimensionnelle
Une méthode de conception logique qui vise à
présenter les données sous une forme
standardisée intuitive permettant des accès
hautement performants en se basant sur les
notions Fait - Dimension.
12/08/2021
Zone Préparation
Zone Stockage 21
Architecture Zone Présentation
Fait - Dimension:
Une mesure économique (Quantités achetées, montant
des achats, etc.).
La table de faits contient les indicateurs de performances.
Les enregistrements sont identifiés par une clé multiple
composée de la concaténation des clés des tables de
dimensions.
La granularité définit le niveau de détails de la table de
faits = nombre de dimensions liées.
Exemple: une ligne de commande par :
Produit; -
+ client;
+ jour.
+
12/08/2021
Zone Préparation
Zone Stockage 22
Architecture Zone Présentation
Fait - Dimension:
Un axe d’analyse (Client, Produit, Temps, etc.).
La table de dimensions est identifiée par une clé primaire
unique correspondant à l’un des composants de la clé
multiple de la table de faits et un ensemble d’attributs
permettant de décrire les aspects intéressants de cette
dimension.
Une organisation hiérarchique (Temps, Région, etc.).
La granularité d’une dimension = nombre des niveaux hiérarchiques.
Une dimension temps est obligatoire dans tout modèle.
12/08/2021
Zone Préparation
Zone Stockage 23
Architecture Zone Présentation
Le schéma en étoile
12/08/2021
Zone Préparation
Zone Stockage 24
Architecture Zone Présentation
Le schéma en flocon
12/08/2021
Zone Préparation
Zone Stockage 25
Architecture Zone Présentation
Exercice
L’ED doit fournir le CA des ventes d’un produit, par date, client, et vendeur, ainsi
que toutes les sommations possibles de chiffre d’affaires dans une année donnée.
Une vente est caractérisée par: produit, client, vendeur, date, prix de vente.
Produit : code produit, code famille, libellé
Client : code client, type client
Vendeur : code vendeur, nom, code service
Date : jour, semaine, mois
Donner le schéma en étoile, en flocon de cet entrepôt?
12/08/2021
Zone Préparation
Zone Stockage 26
Architecture Zone Présentation
Réponse
Modèle en étoile
12/08/2021
Zone Préparation
Zone Stockage 27
Architecture Zone Présentation
Réponse
Modèle en flocon
12/08/2021
Zone Préparation
Zone Stockage 28
Architecture Zone Présentation
Data Mart
Un data Mart est un sous-ensemble de données extrait du data warehouse et ciblé
sur un sujet unique, destiné à répondre aux besoins d’un secteur ou d’une fonction
particulière de l’entreprise.
Un modèle réduit du data warehouse:
Facilement compréhensible;
Facilement manipulable.
Data Mart
Service Marketing
Data Mart
Service GRH
12/08/2021
Zone Préparation
Zone Stockage 29
Architecture Zone Présentation
Restitution de l’information
« Les données ne naissent pas pertinentes, elles le deviennent».
Requêtes : Donner une réponse à une question plus ou moins complexe (type SQL);
EIS (Executive Information Systems): Outils de visualisation et de navigation dans les
données statistiques avec un interfaçage graphique;
Applications spécialisées (ad-hoc) : Applications développées spécialement pour les
besoins décisionnels de l’entreprise;
Data Mining : Outils et techniques évolués de prédiction, simulation, etc.
12/08/2021
Editeurs 30
Outils et Editeurs Outils
12/08/2021
Editeurs 31
Outils et Editeurs Outils
Préparation Stockage Présentation
Warehouse Manager Oracle, Sybase, Informix, Discoverer (Oracle),
(Prism), Access (SAS), Ingres (CA), DB2 (IBM), ESPERANT (Software
DataStage (VMark), Tandem, Teradata, etc. AG), Explorer (Business
InfoRefiner (Platinum), Objects), etc.
PASSPORT &
NATURAL (Software
AG), etc.
Octopus, Kettle, MySQL, Postgresql, Mondarian, Palo, etc.
CloverETL, etc. Biz gres, etc.
12/08/2021
Actualités 32
Actualités et Perspectives Perspectives
Actualités : l’enquête Decideo sur le décisionnel en entreprise pour l’année
2011
Le nombre d'applications décisionnelles;
Le décisionnel pour métiers.
12/08/2021
Actualités 33
Actualités et perspectives Perspectives
Perspectives : Axes de recherche
Extraction automatique des données;
Auto administration des entrepôts de données;
Le data warehouse distribué;
Entreposage et analyse en ligne de données non-structurées et semi-structurées;
Entreposage et analyse en ligne de données spatiales et spatio-temporelles;
Entreposage et analyse en ligne de données en flots;
Real-time business intelligence;
Sécurité des entrepôts de données;
Gestion et maintenance des entrepôts de données;
Data warehouse et Grid computing;
Data warehouse et Cloud computing.
12/08/2021
34
Conclusion
Un projet du Data Warehousing
Un pari à gagner
Ne pas sous-estimer la complexité d’un projet du Data Warehousing;
La mise en place d’une démarche rigoureuse;
Une équipe compétente et expérimentée;
Des partenaires influents;
La conscience de l’importance du projet.
12/08/2021
35
Travail à faire
Un rapport d’étude d’un entrepôt de données
l'entrepôt de données transport de Rennes Métropole
http://data.keolis-rennes.com/,
la collection des manuscrits numérisées de la Bibliothèque Nationale
de France http://www.bnf.fr/
Etc.
12/08/2021
Livres
WWW 36
Bibliographie Recherche
Bibliographie – Livres
Rob Mattison, «Data Warehousing -Strategies, Technologies and Technics», IEEE
Computer Society, 1996.
J.-M. Franco, «Le Data Warehouse -Le Data Mining», Eyrolles, 1997.
W. H. Inmon, «Managing the Data Warehouse», Wiley, 1997.
Bédard, Y., et al., Data Warehousing for Spatial Data: Research Issues, Proceedings of the
International Symposium: Geomatics in the Era of Radarsat (GER'97), May 25-30, 1997.
Ralph Kimball et al., « The Data Warehouse Lifecycle Toolkit: Expert Methods for
Designing, Developing, and Deploying Data Warehouses », Wiley, 1998.
J.-M. Franco, S. De Lignerolles, «Piloter l'entreprise grâce au data warehouse», Eyrolles,
2000.
12/08/2021
Livres
WWW 37
Bibliographie Recherche
Bibliographie – Livres
W. H. Inmon, «Building the Data Warehouse», Wiley, 2e: 2000.
Ralph Kimball, Richard Merz, «The Data Webhouse Toolkit: Building the Web-Enabled
Data Warehouse», Wiley, 2000.
Ralph Kimball, Margy Ross. «The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling», Vuibert, 2e: 2003.
Laura Reeves, «A Manager's Guide to Data Warehousing», Wiley, 2009.
Robert Laberge, «The Data Warehouse Mentor: Practical Data Warehouse and Business
Intelligence Insights», McGraw-Hill Osborne Media, 2011.
W.H. Inmon, Krish Krishnan, «Building the Unstructured Data Warehouse», Technics
Publications, LLC, 2011.
12/08/2021
Livres
WWW 38
Bibliographie Recherche
Bibliographie – WWW
http://inmoninstitute.com/ : The Inmon Institute
http://www.tdwi.org : The Data Warehousing Institute
http://www.cait.wustl.edu/cait/papers/prism/ : Société Prism Solutions fondée par W.H.
Inmon
http://www.dwinfocenter.org/ : The Data Warehousing Information Center
http://www.olapcouncil.org/ : Outils OLAP
http://www.mediatid.fr/datawarehouse : Forum
http://www.datawarehouse.com/
http://www.datawarehousing.com/
12/08/2021
Livres
WWW 39
Bibliographie Recherche
Bibliographie – Recherche
ACM SIGMOD : The ACM Special Interest Group on Management of Data
http://www.sigmod.org/
VLDB : The International conference on Very Large Data Bases
37th conference: Seattle, Washington, August 29 - September 3, 2011
http://www.vldb.org/
DaWaK : Data Warehousing and Knowledge Discovery
13th International Conference on Data Warehousing and Knowledge
Discovery -DaWaK '11
http://www.dexa.org
12/08/2021
Livres
WWW 40
Bibliographie Recherche
Bibliographie – Recherche
ACM SIG KDD : The ACM Special Interest Group on Knowledge Discovery and Data
Mining
Conférence scientifique spécialisée
http://www.sigkdd.org/
BIDW: Business Intelligence and Data Warehousing
2nd Annual International Conference on BIDW, 27 - 28 June 2011, Singapore
http://www.bizintelligenceconf.org/
Merci Pour
Votre Attention
12/08/2021 41