Institut National des Sciences Appliquées et de Technologie
Business Intelligence
GL5 - 2014-2015
1
Plan
Introduction à l’informatique Décisionnelle
ETL
Data warehouse
OLAP
Introduction au Data Mining
Introduction à quelques solutions :
Business Intelligence
• Crystal Report
• Webi
Qlick View
…
2
Introduction à l’informatique
Décisionnelle
3
Plan
Introduction
A quoi sert un système décisionnel ?
La chaine décisionnelle
Comment construire un système décisionnel ?
Risques et facteurs de succès.
Mode de projet
4
Introduction : Evolution de l’informatique
Années 70 : début de l'informatique de gestion
Entrée de l'informatique de gestion dans les grandes entreprises
Années 80 : informatique opérationnelle centralisée
Arrivée dans beaucoup d'entreprises des bases de données relationnelles, des
progiciels de gestion, des premiers micro-ordinateurs
Années 90 : informatique opérationnelle décentralisée
Apparition des ordinateurs personnels et des réseaux locaux
Années 2000 : l'informatique Décisionnelle
Développement de Systèmes d'Information Décisionnels (orientés décision)
Entrepôt de données : restructurer et exploiter des quantités de données
5
Introduction : Définition
« L’informatique décisionnelle (ou BI pour Business Intelligence)
désigne les moyens, les outils et les méthodes qui permettent de
collecter, consolider, modéliser et restituer les données,
matérielles ou immatérielles, d'une entreprise en vue d'offrir une
aide à la décision et de permettre aux responsables de la stratégie
d'entreprise d’avoir une vue d’ensemble de l’activité traitée. »
Source : wikipédia
6
Evolution de l’informatique dans l’entreprise (1/3)
Les entreprises passent à l’ère de l’information.
Défi: Transformer une partie de leur système
d’information qui avait une vocation de production à un SI
décisionnel dont la vocation de pilotage devient majeure.
7
8
Evolution de l’informatique dans l’entreprise (2/3)
Un système d’information décisionnel (S.I.D) est un
ensemble de données organisé de façon spécifique, approprié
à la prise de décision.
Connaître l’environnement dans lequel on évolue
Finalité d’un système décisionnel: pilotage de l’entreprise
9
Evolution de l’informatique dans l’entreprise (3/3)
S.I.D : Pilotage de l’entreprise
Outil : Data Warehouse ; OLAP
10
Pourquoi construire un système décisionnel?
• Servir une information considérée comme stratégique.
• Quelques constats.
• Principales applications décisionnelles.
• Les besoins justifiant un système décisionnel.
• Principaux défis des projets décisionnels.
11
Servir une information considérée comme
stratégique
• Un des actifs les plus importants des sociétés, c’est leur
capital d’informations qu’elles collectent au jour le jour.
• Généralement, la plupart de ces informations sont
inaccessibles, ou réparties dans une multitude de systèmes.
• Le S.I.D résulte d’un processus qui consiste à extraire les
données à partir des systèmes opérationnels et d’autres
sources externes à l’entreprise, de les transformer en
information de pilotage et de les rendre accessibles aux
utilisateurs.
• La Base Décisionnelle est aujourd’hui reconnu comme un
actif stratégique par beaucoup d’entreprises.
12
Quelques constats
L’information existante est souvent très riche mais il est
difficile d’avoir une vision globale homogène et cohérente des
informations manipulées par l’ensemble des Départements.
Il n’est pas facile d’accéder directement à l’information
nécessaire : il existe plusieurs sources utilisant des supports
différents (papier, base de données, fichiers Excel).
Les données de gestion peuvent avoir des significations
différentes selon l’utilisation qui en est faite, exemples : la
marge, le CA. Mais le reporting de Direction Générale
n’accepte qu’un seul sens à une valeur restituée.
13
Principales applications décisionnelles
• La majorité des SID sont construits dans le but de générer des
revenus supplémentaires en maîtrisant les coûts et en améliorant les
services clients.
• Les deux grandes catégories d’utilisateurs sont les départements
‘Achats-Ventes’ et ‘Finance-Contrôle de Gestion’.
Problématiques métier Achats-Ventes Finance-CDG
Analyse des coûts 85 %
Reporting financier 85 %
Profitabilité clients 81 %
Budget/Planning 80 %
Productivité de la force de ventes 77 %
Fournisseurs-Appros 42 %
14
Les besoins justifiant un système décisionnel (1\3)
Meilleur accès aux données
Amélioration de la qualité des informations
Intégration des données provenant
de systèmes différents
Définition commune des informations
Meilleur accès aux données historiques
15
Les besoins justifiant un système décisionnel (2\3)
Besoin accru de données d’horizons multiples et divers :
réorganisation du S.I → réactivité nécessaire
Les systèmes de gestion sont dédiés aux métiers : tandis que
les systèmes décisionnels sont dédiés au pilotage de l’entreprise
L’entreprise ne doit pas seulement avoir une vue verticale de ses
métiers (Syst. de gestion) mais une vue transversale (Syst.
Décisionnel)
Les données peuvent être supportées par des outils
spécialisées permettant le pilotage de l’entreprise
16
Les besoins justifiant un système décisionnel (3\3)
Passage des données de production aux données décisionnelles
Les bases de production: toutes les sources de données (légales,
juridiques, fiscales, politiques, techniques, marketing…)
Comment organiser ces différentes données dans un ensemble
cohérent afin de procéder à toutes les analyses nécessaires pour
construire les indicateurs indispensables au pilotage de
l’entreprise ?
Par un processus d’entreposage de données :
(Data Warehousing)
17
Principaux défis des projets décisionnels
Compréhension des besoins utilisateurs
Intégrité des données.
Coût des alimentations en données
Définition du périmètre
du projet
Performances du système
Règles de gestion commune
18
A quoi sert un système décisionnel?
Les symptômes bien connus d’un besoin décisionnels:
Pas assez d’informations de synthèse et trop
d’informations de détail
Difficulté de répondre rapidement à une question
immédiate et précise.
Des procédures de travail souvent pénalisées par une
mauvaise communication interne de l’information utile
Un sentiment chronique d’urgence au moment des
reporting périodiques
Des délais de reporting trop longs -Mauvaise réactivité
19
Illustration d’un reporting imprécis
20
En fait, l’important est dans la variation
21
Mais une information peut en cacher une
autre…
22
Architecture Décisionnelle
Planification ETL Stockage Analyses Restitution
La chaine décisionnelle
23
Qu’est ce que l’entreposage
Les différentes étapes :
24
Planification ETL Stockage Analyses Restitution
Pour mettre en place une plate-forme décisionnelle
d'entreprise intégrée, la première étape est donc la
planification de ce projet.
Un tel projet nécessite une administration solide.
Exemple: les ressources humaines.
Un responsable peut voir le salaire des personnes de son équipe
mais pas celui de son chef.
Ceci nécessite l'élaboration d'une stratégie de sécurité rigoureuse
25
Planification ETL Stockage Analyses Restitution
ETL : Extract, Transform, Load
Extraction des données à partir d’une ou plusieurs sources de données
telles que fichier plat, fichier brut, OLE DB (source relationnelles telles
que SQL Server, Access…), Excel… ;
Transformation des données agrégées càd nettoyage des données, règles
d’homogénéisation des données sous formes de métadonnées
Techniques d’alimentation (Load) :
Chargement des données dans la banque de données de destination (ED).
Fréquences de rafraîchissement :
Par des applications sur les sources de données et l’ED
Par des serveurs de réplication du SGBD ou par des outils spécialisés
La phase d’ETL est ici incontournable car elle conditionne et
influence la qualité du projet par la suite.
26
Planification ETL Stockage Analyses Restitution
Il existe de multiples manières de stocker la donnée dans un data Warehouse.
Chacune ayant ses avantages et ses inconvénients.
L'administrateur des bases de données décisionnelles pourra notamment choisir
entre :
DDS (Detail Data Store),
les schémas en étoile,
le schéma en flocon…
27
Planification ETL Stockage Analyses Restitution
Structuration :
Il s’agit de définir la finalité de l’ED:
Cibler l’activité de l’entreprise à piloter;
Déterminer et recenser les données à entreposer;
Définir les aspects techniques de la réalisation;
Modèle de données;
Définir des démarches d’alimentation;
Arrêter des stratégies d’administration;
Définir des espaces d’analyse;
Choisir un mode de restitution …
28
Planification ETL Stockage Analyse Restitution
Phase (transversale) Administration
Elle est constituée de plusieurs tâches pour assurer:
La qualité et la pérennité des données aux différents
applicatifs;
La maintenance;
La gestion de configuration;
Les mises à jour;
L’organisation, l’optimisation du SID;
La mise en sécurité du SID.
29
Planification ETL Stockage Analyse Restitution
L'analyse de données est un regroupant de l'ensemble
des techniques de statistique, d'économétrie, de Data
Mining, et de recherche opérationnelle.
L'analyse de données demande souvent des
compétences statistiques avancées. Néanmoins certaine
solution embarque ces fonctionnalités pré-paramétrés à
des cas de figures bien définies, afin d'offrir leur valeur
ajoutée à des personnes fonctionnelles.
30
Planification ETL Stockage Analyse Restitution
C’est le but du processus d’entreposage des données
Elle conditionne le choix de l’architecture de l’ED et de
sa construction
Elle doit permettre toutes les analyses nécessaires pour
la construction des indicateurs recherchés
31
Planification ETL Stockage Analyse Restitution
OLAP (On Line Analytical Processing) est défini comme étant :
«… le nom donné à l’analyse dynamique requise pour créer,
manipuler, animer et synthétiser l’information par des modèles
d’analyse de données exégétiques, contemplatifs et selon des
formules » (Codd et al, 1993).
En d’autres termes, il s’agit d’applications de modélisation
descriptive et d’analyse exploratoire des données, conçues à des
fins de prise de décision.
32
Planification ETL Stockage Analyse Restitution
OLAP
Les combinaisons possibles des dimensions, avec les mesures qui
en découlent, forment les faits. Il est possible d’appliquer des
fonctions agrégatives (somme, moyenne, médiane, etc.) pour
obtenir les mesures à partir des données transactionnelle ou de
mesures de membres de niveau inférieur.
Ainsi, on peut calculer une valeur pour un fait caractérisé par les
membres d’une dimension du niveau hiérarchique inférieur qui
s’agrègent vers un membre d’un niveau supérieur (ex. la
population du Canada est la somme de la population de chacune
des provinces).
Un jeu de données multidimentionnelles est nommé « cube » ou
« hypercube» l’organisation des faits selon des axes
dimensionnels.
33
Planification ETL Stockage Analyse Restitution
La génération de tableau de bord, est la partie émergée de
l'iceberg : l'informatique décisionnelle. C'est la partie que
voient la plus part des utilisateurs. Ce sont généralement
de jolies interfaces intuitives permettant à un utilisateur
lambda, en fonction de ces droits, de consulter des
rapports, des tableaux de bord, de les annoter, voir de les
créer lui-même .
34
Comment construire un système décisionnel?
35
L’alimentation est la part la plus importante d’un projet
36
Pourquoi les alimentations sont difficiles ?
Sur le plan des données
Définir un langage commun
Localiser les données utiles dans les systèmes sources
Harmoniser les nomenclatures
Sur le plan technique
Les règles d’alimentation changent sans cesse
développements modulaires, auto-documentés, et
traçabilité des données
Temps de chargement compatibles avec la fenêtre
d'exploitation
37
L’administration fonctionnelle du système
38
Risques et facteurs de succès
L’implication des utilisateurs est indispensable
39
Les principaux risques d'un projet décisionnel
Orientation technologique du projet, plutôt qu’utilisateur,
Mise en cause de la fiabilité et/ou cohérence des informations,
Alimentations trop longues et irrégulières,
Outils et architecture technique inadaptés,
Fraîcheur insuffisante des informations,
Pas d’administrateur du système,
Surenchère fonctionnelle concernant les analyses et les outils à
utiliser par rapport aux réels enjeux métiers.
40
Quelques facteurs clefs de succès
Pour la conduite de projet :
Adopter une démarche incrémentale avec des objectifs précis et
quantifiés à l’avance ;
Miser dès le départ sur un socle informatique stable, puis
coordonner des itérations courtes avec des résultats tangibles.
Dans la conception fonctionnelle :
Préférer des états figés mais utiles à des analyses libres mais
compliquées
Raisonner en flux amont-aval et en échanges transverses entre
utilisateurs
41
Quelques facteurs clefs de succès
Dans la mise en œuvre technique :
S’assurer de l’évolutivité de la solution technique
Privilégier les solutions paramétrables par un administrateur
fonctionnel
Insérer dans la recette technique des tests de montée en charge
Pour la prise en compte des impacts organisationnels :
Préparer le changement et l’insérer dans le plan de projet,
Fonder et associer le plus tôt possible le futur administrateur du
système
42
Utilisations du système décisionnel
Mailing
Banque, Assurance
Commerce
Logistique
Santé
Ressources Humaines
Télécommunications : pannes, fraudes, mobiles, ...
43
Le décisionnel en Mode projet
Analyse
Architecture du système
Réalisation du système
Mise en production
Commerce
Logistique
44
Analyse
45
L'architecture du système
46
Architecture technique : les facteurs clés des succès
Bâtir un système techniquement fiable et qui soit
disponible.
Prévoir une architecture ouverte et flexible.
Construire un modèle de données évolutif, pouvant être
complété par la suite.
Attacher une importance capitale aux problèmes de
performance.
47
Architecture technique : les facteurs clés des succès
Ne pas négliger l'exploitation du système.
Prototyper l'intégration du système le plus tôt possible.
Préférer des solutions packagées à des solutions
spécifiques si possible.
Choisir les outils en fonction des besoins et du contexte :
il n'existe pas d'outil universel
Choisir des fournisseurs "solides"
48
La réalisation du système
49
Mise en production
50
Facteurs clé de succès
• Choisir une architecture technique évolutive et des solutions
techniques éprouvées
• Être sélectif dans le choix des données du Data Warehouse
• Préférer (quand c'est possible) les outils du marché aux
solutions spécifiques
• Ne pas prolonger les choix d'outils
• Accorder une attention particulière aux extractions et
transformations de données (metadata, dictionnaire,
administration...)
51
Facteurs clé de succès
• Mettre l'accent sur la transparence et le niveau de confiance
des utilisateurs dans le système.
• Revoir les processus pour tirer le meilleur parti du Data
Warehouse (décentralisation, accès direct à l'information)
• Accorder une importance suffisante à la conduite du
changement (préparation, formation, support ...)
52
Quelques Solutions …
SAP Business Objetcs BI 4.x (Migration de BOs XI Release3 (Univers,
Reporting (Webi, Crystal Report)))
SAP Business Information Warehouse (SAP BW) (son nom a légèrement
changé pour devenir SAP Netweaver BI)
Microsoft Reporting Services
Cognos (Cube + Outil de reporting Power Play) (orienté médical)
QlikView
Hyperion (orienté finance : spécialisé dans la consolidation budgétaire)
SAS (statistiques)
…
53