Partie 1: Introduction au Business Intelligence
Historique de l'aide à la décision
Introduction à l’aide à la décision
Étapes de prise de décision
Processus décisionnel
Définition du Business Intelligence
Pourquoi construire un système décisionnel ?
A qui s'adresse l'informatique décisionnelle ?
Bénéfices pour les entreprises
Métriques d’aide à la décision
Chaîne décisionnelle
Architecture du Business Intelligence
Utilisation des systèmes décisionnels
Influence du cloud computing et Big Data
Métiers du BI
Suites BI Open source
Q&A
Historique de l'aide à la décision
3
Expérience individuelle,
Le savoir,
L'expérience des conseillers,
L'expérience des décideurs, ainsi que sur l'analyse historique.
Historique de l'aide à la décision
4
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des probabilités:
En mathématiques, la théorie des probabilités est l'étude
des phénomènes caractérisés par le hasard et l'incertitude.
Elle forme avec la statistique les deux sciences du
hasard qui sont partie intégrante des mathématiques.
Historique de l'aide à la décision
5
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des graphes (ordonnancement):
La théorie des graphes est la discipline mathématique et
informatique qui étudie les graphes, lesquels sont des
modèles abstraits de dessins de réseaux reliant des objets.
Ces modèles sont constitués par la donnée de « points »,
appelés des sommets, et de « liens » entre ces points ; ces
liens sont souvent symétriques (les graphes sont alors
dits non orientés) et sont appelés des arêtes.
La théorie de l'ordonnancement: l'ordonnancement,
consiste à décider dans quel ordre exécuter les tâches, c'est-
à-dire quelle tâche se fera avant une autre. C'est un domaine
de la recherche opérationnelle.
Historique de l'aide à la décision
6
Au xxe siècle, des outils mathématiques sont introduits:
la théorie des graphes:
Historique de l'aide à la décision
7
Au xxe siècle, des outils mathématiques sont introduits:
la recherche opérationnelle:
Pour résumer, la discipline des méthodes scientifiques,
telles que les mathématiques ou encore
l’informatique utilisables pour élaborer de meilleures
décisions.
Historique de l'aide à la décision
8
Au xxe siècle, des outils mathématiques sont introduits:
les arbres de décisions:
Un arbre de décision est un outil d'aide à
la décision représentant un ensemble de choix sous la
forme graphique d'un arbre.
Les différentes décisions possibles sont situées aux extrémités
des branches (les « feuilles » de l'arbre), et sont atteints en
fonction de décisions prises à chaque étape.
L'arbre de décision est un outil utilisé dans des domaines
variés tels que la sécurité, le data mining (fouille de
données), la médecine, etc. Il a l'avantage d'être lisible et
rapide à exécuter. Il s'agit de plus d'une représentation
calculable automatiquement par des algorithmes
d'apprentissage supervisé.
…
Historique de l'aide à la décision
9
Apparition des systèmes informatiques d'aide à la décision
Systèmes d'Aide à la Décision (DSS):
Les systèmes d’aide à la décision (DSS) sont destinés à faciliter
les prises de décision au niveau de l’entreprise.
Un système d'aide à la décision bien conçu est un logiciel
interactif qui aide les décideurs à dégager des informations utiles
à partir de données brutes, de documents, de connaissances
personnelles et de modèles métier, afin d’identifier et résoudre
des incidents et prendre des décisions.
Business Intelligence (ETL, OLAP, et DW).
Internet,
Big Data, cloud computing, IoT,…
Introduction à l’aide à la décision
10
Exemple:
Un touriste souhaite programmer son prochain déplacement afin de se
rendre sur son lieu de vacances. Le calcul de son itinéraire repose sur
l'analyse de la carte qui lui permet d'envisager les différents trajets
possibles. Et comme il a le choix, il faut aussi qu’il spécifie le critère à
retenir : est-ce le plus rapide qu’il cherche ou celui passant par le plus
de lieux touristiques ?
Cet exemple met en évidence un problème qui consiste à sélectionner
une décision parmi un ensemble de décisions possibles, de manière à
optimiser un certain critère.
Ce type de problème de décision est un problème d'optimisation.
Un problème est une question que l'on se pose.
Analyser le problème, c'est préciser clairement :
ce que l'on veut faire : le type de décision,
ce que l'on peut faire : les décisions possibles,
comment on choisit : le critère de sélection.
Introduction à l’aide à la décision
11
Si on représente :
une décision par " " : représente un chemin,
l'ensemble des décisions possibles par : peut être par
exemple l'ensemble des parcours qui vous intéresse ou
l'ensemble des menus possibles,
le critère par une application qui à une décision associe son
évaluation ( ) :
• ( ) représente la longueur du parcours .
• la forme très générale d'un problème d'optimisation est :
min ( )
∈
Introduction à l’aide à la décision
12
L’aide à la décision est l’ensemble des techniques permettant,
pour une personne donnée, d’opter pour la meilleure prise
de décision possible. L’aide à la décision est principalement
utilisée dans des domaines tels que la finance et la banque,
l’informatique ou la politique.
L'informatique décisionnelle ou Business intelligence (BI)
couvre un ensemble de technologies et d'outils qui permettent de
traiter une somme importante d'informations pour, à la fin du
processus, présenter aux décideurs des indicateurs fiables et
pertinents.
Aide à la Décision: Mise en situation
13
Besoin des entreprises
accéder à toutes les données de l’entreprise
regrouper les informations disséminées
analyser et prendre des décisions rapidement
Exemples d’applications concernées
Grande distribution : marketing, maintenance, …
Bancaire : suivi des clients, gestion de portefeuilles,…
Télécommunications : pannes, fraudes, mobiles, …
Commercial, marketing : amélioration du ciblage et du coût des
campagnes de communication, de recrutement et de fidélisation des clients.
Administration, finances : analyse de la marge et des coûts, contrôle de
gestion et reporting, simulations et prévisions, évaluation budgétaire.
Aide à la Décision: Mise en situation
14
Le chiffre d’affaires (CA) a baissé en octobre. Pour y remédier,
des décisions sont à prendre. Mais pour prendre la bonne décision,
il faut savoir:
Pourquoi le chiffre d’affaires a-t-il baissé?
Comment a-t-il baissé?
Dans quelle gamme de produits ?
Dans quels pays, quelles régions ?
Dans le portefeuille de clientèle de quels commerciaux
Dans quel segment de distribution ?
N’avait-on pas une baisse semblable en octobre chaque année ?
La prise de décision
15
Une décision est le résultat d'un processus comportant le choix
conscient entre plusieurs solutions, en vue d'atteindre un objectif.
L'efficacité des services d'une entreprise dépend de la qualité de
ses décisions.
Améliorer l'habilité à prendre des décisions, c'est faire usage des
ressources dont dispose l'entreprise.
Étapes de prise de décision
Définir le problème
Construire un modèle
Identifier et évaluer les solutions possibles
Comparer, choisir et recommander une solution potentielle au
problème
Processus décisionnel
17
Peut être découpé en cinq étapes
1. Définir le problème
2. Rassembler les faits et données
3. Evaluer et interpréter les faits et données
4. Etablir plusieurs solutions
5. Choisir une solution (décider)
Processus décisionnel de Simon
18
From SHARDA, RAMESH; DELEN, DURSUN; TURBAN, EFRAIM, BUSINESS
INTELLIGENCE AND ANALYTICS: SYSTEMS FOR DECISION SUPPORT, 10th
Edition, © 2015. Used by permission of Pearson Education, Inc., New York, NY.
All Rights Reserved.
Business Intelligence
19
Définition 1:
Terme générique qui englobe les applications, l’infrastructure,
les outils et les meilleures pratiques permettant l’accès et
l’analyse de l’information afin d’améliorer et d’optimiser les
décisions et les performances.
Source : Gartner
Business Intelligence
20
Définition 2:
Un ensemble de solutions informatiques permettant l’analyse des
données de l’entreprise, afin d’en dégager les informations
qualitatives nouvelles qui vont fonder des décisions, qu’elles soient
tactiques ou stratégiques.
Source : Smile (Open Source Solutions)
Business Intelligence
21
Définition 3:
Un ensemble des outils et méthodes informatiques permettant de
prendre des décisions dans de bonnes conditions.
Business Intelligence
22
Définition 4:
L’informatique décisionnelle désigne les moyens, les outils et les méthodes
qui permettent de collecter, consolider, modéliser et restituer les données,
matérielles ou immatérielles, d’une entreprise en vue d’offrir une aide à la
décision et de permettre aux responsables de la stratégie d’entreprise d’avoir
une vue d’ensemble de l’activité traitée.
Ce type d’application utilise en règle générale un entrepôt de données (ou
data warehouse en anglais) pour stocker des données transverses provenant de
plusieurs sources hétérogènes et fait appel à des traitements par lots pour la
collecte de ces informations.
Source: Wikipédia
Business Intelligence
23
Définition 5:
Un SID (système d’information décisionnel) est un système
permettant aux utilisateurs de l’entreprise de disposer d’informations
pertinentes et d’outils d’analyse puissants pour les aider à prendre les
bonnes décisions au bon moment. (Bill Inmon)
Business Intelligence
24
En conclusion:
C’est le processus d’exploitation des données de l’entreprise dirigé
par la technologie dans le but de faciliter la prise de décision.
Pourquoi construire un système décisionnel?
25
Objectifs et enjeux
1. Servir une information considérée comme stratégique.
2. Définir un référentiel.
3. Gagner du temps dans la prise de décision
4. Les besoins justifiant un système décisionnel.
5. Les principaux défis des projets décisionnels.
Pourquoi construire un système décisionnel?
26
1. Servir une information considérée comme stratégique
Un des actifs les plus importants des sociétés, c’est leur capital
d’informations qu’elles collectent au jour le jour.
Généralement, la plupart de ces informations sont inaccessibles, ou
réparties dans une multitude de systèmes.
Le Système d'Information Décisionnel (SID) résulte d’un processus
qui consiste à extraire les données à partir des systèmes opérationnels
et d’autres sources externes à l’entreprise, de les transformer en
information de pilotage et de les rendre accessibles aux utilisateurs.
La Base Décisionnelle est aujourd’hui reconnue comme un actif
stratégique par beaucoup d’entreprises.
Pourquoi construire un système décisionnel?
27
2. Définir un référentiel
L’information existante est souvent très riche mais il est difficile
d’avoir une vision globale homogène et cohérente des
informations manipulées par l’ensemble des départements.
Il n’est pas facile d’accéder directement à l’information
nécessaire : il existe des données multi-sources utilisant des
supports différents (papier, ERP, CRM, base de données, fichiers
Excel,…).
Pourquoi construire un système décisionnel?
28
2. Définir un référentiel
Avoir une définition commune des indicateurs de l’entreprise.
En effet en alignant son organisation autour d’un ensemble
unique et cohérent d’indicateurs clés (KPI) et de mesures, on
définit un référentiel commun d’analyse. Les données de
gestion peuvent avoir des significations différentes selon
l’utilisation qui en est faite, exemples : la marge, le CA. Mais le
reporting de Direction Générale n’accepte qu’un seul sens à une
valeur restituée.
L’objectif est bien de créer une vue unique dans l’entreprise
pour vos données comptables, clients ou de production.
Pourquoi construire un système décisionnel?
29
3. Gagner du temps dans la prise de décision
En définissant un système décisionnel, vous automatisez le
traitement de vos données dans l’entreprise.
Les utilisateurs de la data ne passent plus ainsi leur temps à
créer des tableaux de bords. Ils deviennent plus performant et
plus rapide dans l’analyse et dans la prise de décision.
Nombreux outils de dataviz facilitent le partage de la donnée de
l’entreprise.
Les prises de décisions sont plus rapides et plus éclairées.
Pourquoi construire un système décisionnel?
30
4. Les besoins justifiant un système décisionnel
Meilleur accès aux données
Amélioration de la qualité des informations.
Intégration des données provenant de systèmes différents.
Définition commune des informations.
Meilleur accès aux données historiques.
Donner aux collaborateurs les informations dont ils ont besoin
Pourquoi construire un système décisionnel?
31
5. Les principaux défis d’un système décisionnel
Compréhension des besoins utilisateurs:
Comprendre les besoins des utilisateurs est indispensable pour la réussite d’un
projet.
Les analyser et les décrire n’est pas une tâche aisée, exprimer un concept
capable de satisfaire à ces attentes l’est encore moins.
Intégrité des données, c'est-à-dire la cohérence, la fiabilité, et la
pertinence des données.
Coût des alimentations en données
Pourquoi construire un système décisionnel?
32
5. Les principaux défis d’un système décisionnel.
Définition du périmètre du projet:
Le périmètre du projet correspond à la délimitation précise du projet.
Concernant un projet lié aux Systèmes d’Information (mise en place d'un nouvel
ERP, évolution d'un SI en fonction d'une nouvelle organisation ...), le périmètre
total est l’identification et le recensement des applications/modules impactés
par le projet.
Le projet peut être ensuite subdivisé en sous-projets possédant chacun son propre
périmètre.
Performance du système:
« ... est performance du projet tout ce qui, et seulement ce qui, contribue à
atteindre les objectifs du projet ».
Pour assurer la recherche de performance il faut prendre en compte trois
facteurs qui entrent dans la composition du triangle d'or de la performance :
• L'efficience
• L'efficacité
• La compétence
Pourquoi construire un système décisionnel?
33
5. Les principaux défis d’un système décisionnel.
Règles de gestion commune:
Les règles de gestion (ou règles métiers, ou « business rules » en
anglais) sont des déclarations de haut niveau structurées, qui
permettent de contraindre, contrôler et influencer un aspect
du métier.
Ces règles peuvent diminuer ou augmenter l'impact de risque, et
encore prendre des décisions rationnelles.
Une règle de gestion permet d'influencer une prise de décision.
L'objectif est de disposer de règles claires, c'est-à-dire non
ambiguës et compréhensibles par tous, notamment par les non
informaticiens.
Pourquoi construire un système décisionnel?
34
Le but du BI est d'aider à la prise de décision et de permettre des
analyses précises, complexes et de grandes envergure dans les
entreprises.
Les systèmes décisionnels permettent de générer de la
connaissance à partir des données produites par les systèmes
opérationnels (comme les bases de données relationnelles).
Le BI permet de connaître les tendances des clients pour ainsi
bien anticiper les réactions de ses derniers. Il permet donc de
fidéliser les clients.
A qui s'adresse le Business Intelligence ?
35
La mise en place d’un BI a pour objectif de faciliter le décideur
dans son processus de prise de décision.
L’informatique permet d’accélérer drastiquement le temps de
rassemblement des faits et données et leur interprétation
C’est un ensemble d’outils qui ne remplace en aucun cas le
décideur.
Le BI ne s'adresse ni aux informaticiens ni aux statisticiens.
A qui s'adresse le Business Intelligence ?
36
Le BI s'adresse aux décideurs. Ces derniers utilisent les solutions
de BI pour mieux comprendre le fonctionnement actuel de
l'activité et d'anticiper des actions pour un pilotage éclairé de
l'entreprise.
Le système décisionnel a pour objet d’aider les décideurs à
effectuer des choix pertinents à partir de données historiques.
37
Business Intelligence :
quels bénéfices pour les entreprises ?
Bénéfices pour les entreprises
38
Accélérer et améliorer la prise de décision,
Optimiser les processus internes,
Augmenter l’efficience d’exploitation,
Générer de nouveaux revenus,
Améliorer la satisfaction des clients, des fournisseurs et des employés,
Prendre l’avantage sur la concurrence.
Les systèmes BI aident également les entreprises à identifier les
tendances du marché et à repérer les problèmes qui doivent être résolus.
39
Métriques d’aide à la décision
Concepts clefs
40
Sagesse
Connaissance
Information
Donnée
Concepts clefs : Donnée
41 Donnée
Donnée:
Résultat direct d’une mesure ou d’une observation
Peut être collectée par un outil de mesure, ou être présente
dans une base de données
Ne permet pas de prendre de décision sur une action à lancer
Exemple
Le mois dernier, on a enregistré 1217 incidents au centre de
services
10 nouveaux prestataires ont été employés à la direction
informatique
Concepts clefs : Information
Information
42
Information: Donnée
Donnée à laquelle un sens et une interprétation ont été donnés
Permet au responsable de prendre une décision sur une action
Exemple
Le mois dernier, on a enregistré une augmentation de 240% du
nombre d’incidents par rapport au mois précédent
L’emploi des 10 prestataires est lié à une augmentation
temporaire de la charge de travail
Concepts clefs : Connaissance Connaissance
43 Information
Connaissance: Donnée
Résultat d’une réflexion sur les informations analysées
Se base sur les expériences, les idées, valeurs, avis des
personnes consultées
Exemple
Le gestionnaire de changement peut établir une corrélation
entre l’arrivée des nouveaux prestataires et l’augmentation du
nombre d’incidents en ayant connaissance de certains
éléments
Concepts clefs : Sagesse Sagesse
Connaissance
Information
44
Sagesse: Donnée
État d’esprit général de discernement final sur le contenu et de
jugement de bon sens
Permet de lancer des actions d’adaptation de l’organisation,
des personnes, des processus et outils
Exemple
Le top manager de l’organisation prend des décisions à long
terme et des décisions stratégiques pour l’organisation
informatique.
Illustration d’un reporting imprécis
45
En fait, l’important est dans la variation
46
Mais une information peut en cacher
47
une autre…
48
Chaîne Décisionnelle
La chaîne décisionnelle
49
Les 5 grandes étapes:
Planification Collecte Stockage Distribution Restitution
Planification Planification Collecte Stockage Distribution Restitution
50
Définition de la planification de projet
C’est l’activité qui consiste à déterminer et à ordonnancer les tâches du
projet, à estimer leurs charges et, à déterminer les profils et ressources
nécessaires à leur réalisation.
L’outil requis est le planning.
Les objectifs du planning sont les suivants :
déterminer si les objectifs sont réalisés ou dépassés
suivre et communiquer l’avancement du projet
affecter les ressources aux tâches
Le respect de ce planning décidera de la réussite ou non du projet, de
votre image auprès de votre client, et de la santé financière de votre
société.
Planification Planification Collecte Stockage Distribution Restitution
51
Pour mettre en place une plate-forme décisionnelle d'entreprise
intégrée, la première étape est donc la planification de ce projet.
La planification de projet est une étape clé dans la gestion d’un
projet. C’est le moment crucial où va se décider le découpage et
la répartition des tâches, les besoins en ressources et la date
prévisionnelle de fin.
Un tel projet nécessite une administration solide.
Exemple: les ressources humaines
Un responsable peut voir le salaire des personnes de son équipe.
Mais ne peut pas voir celui de son chef.
Nécessité d'une stratégie de sécurité rigoureuse.
Collecte des données Planification Collecte Stockage Distribution Restitution
52
Sources : les informations utiles aux décideurs peuvent être stockées
sur des sites de natures diverses (sites web, BDR, fichiers, ERP, SAP,
autre système opérationnel). Les langages de codification, les
structures de données sont généralement hétérogènes, ce qui rend
délicate l’extraction des données en vue d’alimenter le data
warehouse (entrepôt de données).
La collecte s’effectue à partir de données appelées : données
sources. Ces données peuvent se présenter sous différents formats.
Il peut s’agir de fichiers "plats" (fichiers CSV avec séparateurs,
fichiers XML, fichiers ASCII...) mais aussi de SGBDs (export de
base MySQL, PostgreSQL, IBM DB2, ORACLE...).
Collecte des données Planification Collecte Stockage Distribution Restitution
53
Ces sources de données sont donc en général hétérogènes c’est
pourquoi il va falloir passer par une phase dites d’intégration pour
pouvoir les manipuler avant de les stocker dans notre système
d’aide à la décision.
La collecte des données est assuré par des outils ETL (Extract,
Transform, Load) permettant de récupérer les données quelque
soient leurs sources et les systèmes qui les supportent.
Collecte des données Planification Collecte Stockage Distribution Restitution
54
ETL Process
ETL : Extract, Transform, Load
ETL est un processus de data warehousing chargé de retirer des données des
systèmes sources et de les placer dans un data warehouse (entrepôt de
données).
ETL implique les trois phases suivantes :
Extraction des données à partir d’une ou plusieurs sources de données hétérogènes
et disparates : fichiers, base de données, applications, …
Transformation des données: il s’agit de donner une présentation homogène et
fiable pour l’analyse à l’aide de nettoyage, alignement, filtrage, calcul, suppression
des doublons,…
Chargement des données dans la banque de données de destination, i.e. data
warehouse.
La phase d’ETL est ici incontournable car elle conditionne et influence la
qualité du projet par la suite.
ETL process Planification Collecte Stockage Distribution Restitution
55
ETL process Planification Collecte Stockage Distribution Restitution
56
ETL tools Planification Collecte Stockage Distribution Restitution
57
Solutions existantes:
Business Intelligence
ETL tools Planification Collecte Stockage Distribution Restitution
58
Solutions existantes open source:
ETL tools Planification Collecte Stockage Distribution Restitution
59
Solutions retenues open source:
Stockage Planification Collecte Stockage Distribution Restitution
60
Cette zone de données est le lieu où les données sont organisées,
stockées et offertes aux requêtes des utilisateurs, aux
programmes de reporting et autres applications d’analyses.
Plusieurs manières de stocker les données dans des bases de
données spécialisées : Data warehouse et Data mart.
Chacune ayant ses avantages et ses inconvénients.
L'administrateur DW pourra notamment choisir entre : DDS
(Dimensional Data Store), les schémas en : étoile, flocon…
Distribution de données Planification Collecte Stockage Distribution Restitution
61
La fonction de diffusion a pour objectif de mettre les données à la
disposition des utilisateurs. Elle permet la gestion de droits d’accès selon
les schémas correspondant au profil ou au métier de chacun.
L’objectif principal de la diffusion est de segmenter les données
collectées en contextes cohérents, simples à utiliser et qui correspondent
à une activité particulière. Chaque contexte peut correspondre à un
Datamart, il est modélisable sous la forme d’un hyper cube et peut être
mis à disposition des utilisateurs via un outil OLAP.
Le mot OLAP (On-Line Analytical Processing), désigne l’ensemble des
technologies permettant le calcul et l’analyse de données commerciales
ou de production, fondée sur des requêtes structurées suivant des critères
combinés, appelés dimensions.
Distribution de données Planification Collecte Stockage Distribution Restitution
62
Les outils OLAP disponibles :
Restitution Planification Collecte Stockage Distribution Restitution
63
La fonction d’exploitation ou de restitution se charge de présenter
les informations aux utilisateurs permettant la mise en place de
tableaux de bord qui présentent les indicateurs clés de gestion.
La génération de tableau de bord, est la partie émergée de l'iceberg :
l'informatique décisionnelle.
Les outils de restitution permettent aux analystes de manipuler les
données contenues dans les entrepôts, éditer des rapports et naviguer
dans les cubes.
C'est la partie que voient la plupart des utilisateurs.
Restitution Planification Collecte Stockage Distribution Restitution
64
Data visualisation/Visualisation de données
Business Intelligence
Restitution Planification Collecte Stockage Distribution Restitution
65
Ce sont généralement de jolies interfaces intuitives permettant à un
utilisateur lambda, en fonction de ses droits, de consulter des rapports,
des tableaux de bord, de les annoter, voire de les créer lui-même.
C’est dans cette phase que les différents outils de restitution vont
intervenir. Nous trouverons des :
outils de requêtage,
outils de reporting,
portails d’accès à des tableaux de bord,
outils de navigation dans des cubes ou hypercubes multidimensionnels,
outils de statistiques,
data mining
Restitution Planification Collecte Stockage Distribution Restitution
66
Outils de restitution