Introduction au BI
Objectifs
● Définir la business intelligence
● Déterminer les différentes étapes dans la mise en place d'un projet B.I
● Examiner le marché de la BI et les outils leaders
● Déterminer les obstacles
Introduction : Qu'est-ce que la BI ?
Avant de comprendre ce qu'est la business intelligence, il faut pouvoir définir ce qu'est
l'intelligence :
L'intelligence c'est la capacité à résoudre des problèmes pour prendre des décisions.
Nous prenons tous des décisions et à toutes occasions ; par exemple, lorsque nous devons nous
rendre à un rendez-vous, nous cherchons toujours à prendre le chemin le plus court afin d'arriver
à l'heure.
Pour prendre de bonnes décisions, nous nous aidons des informations qui sont à notre
disposition.
L'information va apporter des réponses et ainsi nous permettre de prendre des bonnes
décisions.
L’informatique décisionnelle (Business Intelligence) est un ensemble de moyens, méthodes,
outils permettant de collecter, consolider, modéliser, restituer les données matérielles ou
immatérielles d’une entreprise, en vue d’offrir une aide à la décision et de permettre aux
responsables de la stratégie d’entreprise et de son opérationnalisation d’avoir une vue
d’ensemble de l’activité traitée.
Pourquoi utilise t'on la BI ?
Toutes les entreprises accumulent de grandes quantités de données au travers de leurs
systèmes d’informations, mais ces données ne deviennent des informations pertinentes pour les
décideurs que lorsqu’elles permettent de répondre à des questions sur l’entreprise et sur son
évolution. Pour être aidés dans leurs choix, les décideurs ont besoin de mesurer l’activité de
l’entreprise à l’aide d’indicateurs de performance (KPI). Il est donc nécessaire de transformer
la masse de données en provenance des multiples sources opérationnelles en informations
pertinentes pour la prise de décision. On développe des analyses de performances à partir de
données transformées à destinations de Chef des Ventes, de manager sur le terrain.
L’informatique décisionnelle a pour démarche de connaitre, mesurer, prévoir et agir dans le seul
but de définir la stratégie de l’entreprise.
La Business Intelligence c'est répondre à des problématiques en rapport avec l'entreprise.
Généralement, les entreprises se posent des questions telles que:
● Comment se portent les ventes ?
● Quels sont les produits qui se vendent le mieux ?
● Mes employés sont-ils efficaces ?
● Quels sont mes points de vente qui rapportent le plus à ma société ?
● etc...
Pour répondre à ces questions, Ils utilisent des informations sur leurs produits, leurs différents
lieux de ventes, leurs employés et bien d'autres.
Ces données sont très importantes et sont collectés à travers des applications métiers tel que
ERP, CRM, Sage etc... et stockées généralement dans ce que l'on appelle un entrepôt de
données.
Les données présentent dans un entrepôt de données proviennent alors de différentes sources.
L'Objectif de la B.I est d'analyser le passé et d'anticipé le futur ; Pour y arriver, Il faut exploiter les
données et mettre en place un suivi de la performance grâce à des indicateurs de
performance [en anglais : KPI =Key Performance Indicators].
Les KPI vont permettre de me mettre une valeur sur un moteur d'activité (ventes, centre
d'appel,..).
Exemple : la valeur moyenne de ventes, le temps d'attente moyen des appels de service, le
temps de réponse des demandes d'informations, le pourcentage de réussite d'appel d'offres etc..
Ils sont définis à partir de ce que l'on appelle les business drivers.
Les Business drivers sont des pilotes de croissance qui vont permettre l'amélioration des
performances. Il en existe 3 types :
● Stratégique
exemples : part de marché, la force concurrentielle.
● Organisationnel
exemples : formation, développement.
● Opérationnel
exemples: productivité, excellence des produits..
Le driver le plus commun est la rentabilité.
Ce qu'il faut pour faire de la B.I
Pour faire de la B.I en entreprise il faut des bases de données, des gens qualifiés pour modeliser
et extraire de la donnée et de l'argent.
Il faut mettre en place un BICC ( BI Competency Center )
Le BICC est l'ensemble de personnes qui ont pour but de développer les projets BI.
Il est très important de mettre en place ce centre de compétences.
Il aura pour rôle :
● d'identifier les besoins BI
● d'attribuer une équipe au projet BI
● de faire le lien entre l'entreprise et l'IT
● de permettre l'intégration de la B.I dans l'entreprise
● de former les utilisateurs aux outils
● de veiller à ce que la connaissance ne soit pas perdue.
L'équipe B.I est généralement composée :
● d'informaticiens (administrateur système / administrateur sécurité)
● d'analystes métier
● chef de projet
● statisticiens
● consultants
● d'utilisateurs
● ...
Les obstacles
Peu de projets B.I atteignent les objectifs fixés et les raisons sont multiples :
● des problèmes de technologie
● des données de mauvaises qualités
● Des utilisateurs non formés aux outils B.I
● ...
Cependant un projet B.I bien mené permet d'en tirer des bénéfices tel que:
● Proposer une vision unique de données fiables dans l'ensemble des départements d'une
entreprise.
● Faire gagner du temps aux analystes de données
● L'Accéleration de la prise de décision fondée sur des faits
● etc..
Les données traitées
Il y a différents types de données traitées :
● Les données structurées et non structurées
● Les données internes et externes.
Exemple :
● Donnée interne et structurée : ERP
● Donnée externe et structurée : CRM
● Données non structurées : E-mails, Entreprise Compétiteur..
● Données externes : Social media, réputation
Toutes ces données provenant de différentes sources sont rassemblées et traitées.
Les données externes et non structurés sont les plus difficiles à utiliser.
Différents niveaux - CMMI
Il existe plusieurs niveaux de maturité B.I :
● Le Niveau 1 : Initial
- Niveau où les resultats peuvent être imprévisibles
- On n'utilise pas les données exterieures ni non structurées
- Pas de suivi ; rien n'est controlé
- On utilise les fichiers type Excel
- Le retour sur investissement est négatif
● Niveau 2 : Defined
- Planification des activités
- Utilisation de base OLTP,fichier Excel, Access,..
- Suivi des projets
- Retour sur investissement faible
● Niveau 3 : Managed
- Mise en place d'un centre de compétences
- Suivi des projets
- Un retour sur investissement dans les départements ou la B.I est bien acceptée
- Les utilisateurs ne sont pas forcément formés aux outils
● Niveau 4 : Quantitatively managed
- Le centre de competences est établi
- les business drivers et les indicateurs de performances sont multiples
- Les données internes comme externes sont utilisées
- Bon retour sur investissement
● Niveau 5 : Optimizing
- La B.I est acceptée dans tous les départements de l'entreprise
- Les données structurées et non structurées sont utilisées
- Réduction des couts
- Très bon retour sur investissement
La Planification
Avant de se lancer dans l'étape pratique, il faut planifier nos intentions.
Road Map BI
La Road Map est comme une vue d'ensemble des séquences d'activités ; elle permet de définir
le résultat que l'on souhaite obtenir et la manière dont on va l'obtenir.
Ci dessous les différentes étapes d'une Road Map dans la mise en place d'une solution B.I :
1. Justify => Identifier les résultats désirés
2. Plan => Evaluer les données transactionnelles
3. Analyse => Analyser les données transactionnelles et les méta-données
4. Design => Conception de la BDD / Conception du référentiel de méta-données
5. Build => Meta-data Repository / Data mining
6. Deploy => Réalisation
[1]
Une planification va permettre de déterminer également les technos appropriées qui doivent être
utilisés.
BIMM
BIMM => BI Meta Model
C'est un modèle de haut niveau qui va concerner les processus, les gens et les outils impliqués
dans la mise en place d'un projet B.I.
Chaque point du BIMM correspond aux grands problèmes potentiels avec les projets B.I
● Outcomes => Eviter d'acheter des logiciels de BI sans définition du résultat
● Data => Ne pas construire une Data Warehouse sans être conscient des conditions
● Information and Structure => Eviter la collecte de données inutiles
● Knowledge Acquisition => Ne pas acheter des outils que les utilisateurs n'ont pas le
temps d'apprendre à utiliser.
Chaîne Décisionnelle
Le concept de Business Intelligence est un processus composé de trois phases permettant le
passage du monde transactionnel au monde décisionnel.
- ALIMENTATION
- STOCKAGE
- EXPLOITATION
ETL (Phase d’alimentation)
Les données de production (transactionnelles) sont extraites afin d’alimenter un entrepôt de
données. Les sources sont multiples souvent hétérogènes et volumineuses. Elles nécessitent
des retraitements d’uniformisation, de qualification. Ces opérations d’extraction sont réalisées
avec des outils d’ETL (Extract, Transform, Load).
Après l'étape de planification, on rentre dans la partie pratique.
Il va falloir collecter les différentes données dont on a besoin, dans les différents départements
de l'entreprise (R.H, Comptabilité, Commercial,...) ;
Généralement, Les données proviennent de sources différentes (CRM, ERP, Fichier Excel,
fichier texte, base de donnée SQL SERVER,...).
Nous allons collecter ses différentes données brutes dans les différents départements de
l'entreprise (R.H, Comptabilité, commercial ) et les envoyer vers un entrepot de données
intermediaire.
Il ne sagit pour l'instant que d'une copie des données sur une base qui nous servira de nouvelle
source.
Cette étape est importante car travailler a partir des différentes sources entrainerait une
baisse de performance des systemes sources.
Durant cette étape, nous aurons la possibilité d'uniformiser nos données; par exemple, en
effectuant des conversions de type afin d'éviter tout problème technique, gérer l'absence de
valeur,
Afin de pouvoir faire cela, on dispose d'outils ETL.
ETL signifie : Extract Transform Load
Notre entrepot de donnée final n'est pas une simple base de donnée relationnelle ; c'est une
base OLAP (= On Line Analitycal Processing ) ;
C'est à partir de cette base que nous ferons nos analyses et nos restitutions.
Phase de Stockage
Les données extraites et retraitées sont stockées dans un entrepôt de données sous forme de
données détaillées et historisées (datées) et sous la forme de données agrégées. De cet
entrepôt de données sera généré des cubes (structure multidimensionnelle) OLAP (On-line
Analytical Processing) et/ou des Magasins de données (Datamart) permettant des visions
métiers et tranverses des données.
Notre entrepôt de donnée final est très different des bases de données relationnelles habituelles
par sa modélisation ( en étoile, en flocon,..) facilitant l'analyse des données et leurs restitutions.
Il est composé de plusieurs types de tables dont 2 essentiels :
● Les tables de faits
Ces tables vont stocker nos mesures c'est-à-dire les indicateurs de performances
analysés
Par exemples : nombres de commandes, la somme de commandes, le CA (Chiffre
d'affaire), le prix de vente etc...
● Les tables de dimensions
Ces tables contiennent des informations sur les données analysées
Par exemples : marque des produits, la géographie, la date d'achat etc...
Analyse et restitution (Phase d’exploitation)
Les données décisionnelles sont mises à disposition généralement par le biais d’un portail à des
fins d’analyse, de restitution, d’alertes.
Analyse
· Analyse multidimensionnelle permettant une navigation dans les données.
· Datamining permettant de faire des traitements et analyses statistiques afin d’établir des
relations et des comportements types.
· Simulation.
Restitution
· Reporting de masse sous différents formats (Excel, SSRS...)
· Requêtage ad hoc (à la demande) fait de manière autonome par l’utilisateur avec un langage
proche du métier
· Tableau de bord permettant une vue d’ensemble d’indicateurs sous forme de tableaux,
graphes, jauges...
Alertes
· Génération d’alertes sur la base d’indicateurs hors plages normales.
Nous allons pouvoir présenter les données contenues dans notre Datawarehouse de différentes
manières :
● sous forme de graphique
● sous forme de tableaux
● etc...
C'est ce que l'on appelle dans le décisionnel, faire du reporting.
il est aussi possible de faire du reporting sur un cube OLAP.
Un cube OLAP est une structure multidimensionnelle.
Il a pour but de simplifié l'acces aux données agrégées que l'on souhaite analyser. Pour ce faire,
permet de manipuler nos données sous plusieurs axes d'analyse.
il est possible d'utiliser les fonctions d'agrégation telles que min, max, sum, moy etc,..
Ci- dessous, un exemple de représentation de cube OLAP :
Cette image est tirée de l'article " Cube Olap " de Wikipedia
(https://en.wikipedia.org/wiki/OLAP_cube)
N'hésitez pas à le consulter afin d'en apprendre plus sur le fonctionnement de ce cube. ) [2]
Outils B.I
Voici une liste de quelques éditeurs de logiciels de business intelligence :
● SAS
● Oracle
● IBM
● SAP
● Qlik
● Tableau
● Microsoft
Aujourd'hui, SAP, Qlik et Microsoft font partie des leaders dominant l'offre d'outils B.I
Conclusion
C'est la fin de ce cours sur la B.I ; il reste énormement à dire sur l'informatique décisionnelle, sur
son histoire et son fonctionnement mais j'espère que ce premier cours vous aura permis de
comprendre ce qu'est la B.I, la planification d'un projet B.I et les bénéfices possibles pour une
entreprise.
Bonus
Question : Quelle différence entre une base OLTP et un base OLAP ?
Réponses :
OLTP ( = OnLine Analytical Processing) VS OLAP (= OnLine Transaction processing )
Les bases OLTP sont utilisées afin de stocker et faire des opérations telles que la saisie ou la
modification de données provenant des applications métiers.
A contrario, les bases OLAP sont dédiées à l'analyse de ces données.
Généralement, les base OLTP servent de sources aux bases OLAP.