0% ont trouvé ce document utile (0 vote)
102 vues43 pages

1 IntroductionBI

Transféré par

rida friki
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
102 vues43 pages

1 IntroductionBI

Transféré par

rida friki
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté des Sciences

Département d’Informatique

Business Intelligence
(BI)
Master Universitaire Spécialisée :
Ingénierie informatique, Cyber sécurité et Intelligence Artificielle (IICIA)

Pr. EL AZAMI
[email protected]

Pr. EL AZAMI 1
Plan

• Chap 1: Introduction au BI et aux entrepôts de données

• Chap 2: Architecture du DataWarehouse

• Chap 3: Modélisation dimensionnelle

• Chap 4: ETL

• Chap 5: Applications BI

Pr. EL AZAMI 2
Support de cours en ligne

Google Classroom:
Business Intelligence

Utilisez votre compte Gmail


Code d’accès:

4e2zyfj
Pr. EL AZAMI 3
Références

• Efraim Turban, Ramesh Sharda, Dursun Delen, David King (2010).


Business Intelligence: A Managerial Approach, 2nd Edition, Prentice
Hall.
• Gloria J.Miller, Dagmar Brautigam, Stefanie V. Gerlach (2006).
Business Intelligence Competency Centers, Wiley.
• The_Data_Warehouse_Life_Cycle_Toolkit_(Ralph_Kimball)
• Kimball & Caserta -The Data Warehouse ETL Toolkit [Wiley 2004]
• Ralph Kimball, Margy Ross (2002). The Data Warehouse Toolkit: The
Complete Guide to Dimensional Modeling, 2nd Edition, Wiley.

Pr. EL AZAMI 4
Introduction à l’intelligence d’affaires
et aux entrepôts de données
Business Intelligence and Datawarehouse

Pr. EL AZAMI 5
Questions
• Quelles sont vos expériences avec l’intelligence
d’affaires?
• Quelle est selon vous la définition de ce concept?

Pr. EL AZAMI 6
Avant de commencer…
1. Quel est le lien entre les couches et la bière ?

2. Pourquoi les services de Google (Gmail, Calendar,


Groups) sont-ils gratuits ?

Pr. EL AZAMI 7
Le lien entre les couches et la bière
• Observations:
– Les ventes de bières sont particulièrement importantes
les vendredis en début de soirée;
– Les clients qui achètent de la bière durant cette
période ont tendance à acheter également des …
couches !
• Marketing:
– En plaçant ces deux produits près l’un de l’autre,
les épiceries augmentent leurs ventes et leurs
profits (stratégie de vente croisée).

Pr. EL AZAMI 8
Le principe Google:
• Toute information a un prix;
• Google utilise ses services pour acquérir gratuitement de
l’information sur ses usagers:
– Analyse syntaxique des courriels (Gmail);
– Profil et liste des contacts (Google Groups);
– Emploi du temps (Google Calendar);
– etc.
• Cette information est utilisée pour envoyer de la
publicité ciblée aux usagers.

Pr. EL AZAMI 9
Exploitation de l’information
« Les entreprises qui gèrent leurs données comme une
ressource stratégique et investissent dans la qualité de
celles-ci sont en avance sur leurs compétiteurs, au
niveau de la réputation et de profitabilité »
− Sondage PricewaterhouseCoopers Global Data Management (2001)

• Marjane / Carrefour / Moul’Hanout:


– Entreprises qui vendent de la nourriture OU;
– Entreprises qui exploitent des connaissances sur:
• Les préférences des clients;
• La chaîne logistique;
• Le cycle de vie des produits;
• Les informations sur les ventes des compétiteurs.

Pr. EL AZAMI 10
Question
• En quoi l’information diffère-t-elle des ressources
matérielles et humaines?

Pr. EL AZAMI 11
Caractéristiques de l’information [1/2]

• Temporelle:
– La valeur diminue avec le temps;
– Ex: actions en bourse, achats des clients, etc.
• Partageable:
– Peut être copiée et distribuée facilement;
– Ex: réseaux sociaux, le Web, les médias, etc.
• Valeur augmente avec l’usage:
– Ne se dégrade pas comme d’autres ressources (ex:
une voiture);
– Ex: algorithme PageRank de Google.

Pr. EL AZAMI 12
Caractéristiques de l’information [2/2]

• Valeur augmente avec la qualité:


– Une information erronée ou imprécise peut nuire;
– Ex: opérations militaires.
• Valeur augmente avec la fusion:
– Une information peut avoir de la valeur que si elle est combinée
avec d’autres informations;
– Ex: ventes + inventaire = planification.
• Valeur mesurable:
– Historique: combien a couté l’acquisition de cette information ?
– Marché: combien une personne serait-elle prête à payer pour
obtenir cette information;
– Utilité: quelle valeur peut-on espérer obtenir de cette
information ?

Pr. EL AZAMI 13
Question
• Est-ce que stocker beaucoup de données est suffisant
pour aider la prise de décision d’une entreprise?

Pr. EL AZAMI 14
Données vs informations vs connaissances

• Données:
– Collection d’éléments de valeur brute ou de faits servant à
calculer, raisonner et mesurer;
– Peuvent être collectées, stockées ou traitées;
– Ne possèdent pas de contexte ni de sens.
• Informations:
– Proviennent de l’organisation des données, mettant en valeur
les relations entre les différents éléments de ces données;
– Fournissent un contexte et un sens aux données.
• Connaissances:
– Viennent de la compréhension de l’information dans son
contexte;
– Sont utiles au processus de décision.

Pr. EL AZAMI 15
De données à stratégies

• Pyramide d’abstraction:
Intelligence d’affaires (BI):
Ensemble de processus, de technologies
et d’outils servant à transformer:
Connaissances • Les données en informations;
et intelligence
Niveau d’abstraction

• Les informations en connaissances;


• Les connaissances en stratégies
menant à des actions profitables à
Informations l’entreprise.

Données

Taille des données

Pr. EL AZAMI 16
Questions
• Comment le marché d’aujourd’hui diffère-t-il d’il y a 10,
20 ou 30 ans?
• Pourquoi avons-nous besoin de l’intelligence d’affaires
(BI)?

Pr. EL AZAMI 17
Échecs dans les projets
• Taux d’échec de projets:
Catégorie Taux approx.
Film (Hollywood) 60 %
Acquisition / fusion 60 %
TI 70 %
Produit alimentaire 80 %
Produit pharmaceutique 90 %
Source: Slywotzky et Weber (2007). The Upside: The 7 Strategies for Turning Big
Threats into Growth Breakthroughs

• Causes fréquentes d’échecs:


– Considérer trop peu de scénarios / scénarios peu réalistes;
– Être incapable d’anticiper les actions d’un compétiteur;
– Ignorer les changements économiques ou sociaux;
– Prévoir incorrectement la demande.

Pr. EL AZAMI 18
L’environnement d’affaires
• L’environnement d’affaires est en constante évolution et
devient de plus en plus complexe;
• Les entreprises sont sous pression: elles doivent
répondre rapidement aux changements et innover dans
leurs manières d’opérer;
• La prise de décisions stratégiques et opérationnelles
complexes requiert une quantité considérable de
données et de connaissances;
• Les données nécessaires à la prise de décision
proviennent de sources diverses et hétérogènes;
• L’information de ces données doit être traitée très
rapidement.

Pr. EL AZAMI 19
Intelligence d’affaires
• Business intelligence (BI):
– Un ensemble de concepts, de méthodologies et
d’applications pour rassembler, stocker, analyser, et
permettre d’accéder aux données, dans le but d’aider
les utilisateurs d’entreprises dans leur processus de
décision.
• Inclut:
– L’entreposage de données;
– Les requêtes et le reporting;
– L’analyse multidimensionnelle (OLAP);
– L’analyse statistique;
– La prédiction (forecasting);
– Le forage de données (data mining).

Pr. EL AZAMI 20
Pourquoi l’intelligence d’affaires ?
• Profitabilité accrue de l’entreprise;
• Diminution des coûts;
• Meilleure gestion des relations avec le client (CRM);
• Diminution des risques;
• etc.

Pr. EL AZAMI 21
Question
• Qu’est‐ce qu’un entreprôt de données et en quoi cette
technologie diffère-t-elle des bases de données
transactionnelles?

Pr. EL AZAMI 22
OLTP vs OLAP [1/3]
• OnLine Transaction Processing (OLTP):
– Caractérisé par un grand nombre de courtes
transactions faites en‐ligne (ex: INSERT, UPDATE,
DELETE);
– Met l’emphase sur le traitement rapide de requêtes
simples, et sur l’intégrité des données dans un
environnement concurrentiel (c.-à-d.plusieurs requêtes
simultanées).
• OnLine Analytical Processing (OLAP):
– Met l’emphase sur le traitement rapide de requêtes
complexes (multiples tables, agrégation de données,
etc.) ayant pour objectif d’assister dans la prise de
décision.

Pr. EL AZAMI 23
OLTP vs OLAP [2/3]
Critère OLTP OLAP
But Contrôler et exécuter les tâches Assister dans la planification, la
quotidiennes et fondamentales de résolution de problème et la prise
l’entreprise de décision
Types de données Données opérationnelles Données historiques consolidées
(transactions)

Sources de données BD transactionnelles Entrepôts de données ou


magasins de données
Ce que montre les Portrait instantané des processus Vue multidimensionnelle de
données d’affaires de l’entreprise plusieurs activités d’affaires de
l’entreprise
Insertions et mises-à-jour Courtes requêtes d’insertion et de Longs traitements en lot servant à
mise-à-jour lancées par les usagers rafraichir les données
finaux
Requêtes Simples requêtes retournant Requêtes complexes impliquant
quelques enregistrements (lignes) souvent plusieurs tables et faisant
de la BD l’agrégation de valeurs
Temps de réponses Instantané Quelques secondes à 1 minute
max.

Pr. EL AZAMI 24
OLTP vs OLAP [3/3]
Critère OLTP OLAP
Espace requis Relativement petit si les Grand due aux données
données historiques sont historiques et aux données
archivées d’agrégation
Modélisation de la BD Un grand nombre de tables Moins de tables, tables
hautement normalisées typiquement dénormalisées,
schémas en étoile ou flocon
Sauvegarde et récupération Fait de façon régulière, critique Fait de façon irrégulière, peut
pour l’entreprise récupérer des données OLTP

Reporting Routinier et très ciblé Ad hoc, multidimensionnel, à


plus large portée

Ressources requises Simple DBMS relationnel DBMS spécialisé multi-‐‐


processeurs et à grande
capacité
Nombre d’utilisateurs Grand Petit
simultanés

Pr. EL AZAMI 25
Quelques définitions
• Entreposage de données (data warehousing):
– « La copie périodique et coordonnée de données provenant de
diverses sources, internes et externes à l’entreprise, dans un
environnement optimisé pour l’analyse »
• Les entrepôts de données (data warehouse):
– Centralisent les données de l’entreprise;
– Sont contenus dans un environnement bien géré;
– Possèdent un processus cohérent et répétable pour charger les
données provenant des applications de l’entreprise;
– Reposent sur une architecture ouverte et extensible pouvant
accommoder la croissance des données;
– Fournissent des outils permettant aux usagers de transformer
les données en information utile à la prise de décision.

Pr. EL AZAMI 26
Historique des entrepôts de données

1910 1920 … 1970 1980 1990 2000 2010

GIS, réseaux sociaux,


Web sémantique, etc.

Oracle, IBM, Microsoft, SAP, etc.

Naissance de l’entreposage de données;

Dispersion des données causée par les PC;


Première solution Teradata (RDBMS). Bill Inmon
Production de rapports automatisés sur Ralph Kimball
micro-‐‐ordinateurs (pas d’intégration).

Mesures de la performance d’une entreprise et de Arthur Nielsen


l’impact d’une stratégie de marketing.

Naissance de la recherche en marketing. Charles Coolidge Parlin

Pr. EL AZAMI 27
Caractéristiques des entrepôts de données

• Orientés sujet:
– Les données sont organisées par sujet (ex: clients, produits,
ventes, etc.).
• Intégrés:
– Les données, qui proviennent de diverses sources hétérogènes,
sont consolidées et intégrées dans l’entrepôt.
• Historiques:
– Les données ont très souvent une composante temporelle (ex:
date et heure d’une transaction).
• Non‐volatiles:
– Une fois insérées dans l’entrepôt, les données ne sont jamais
modifiées ou effacées; elle sont conservées pour des analyses
futures.

Pr. EL AZAMI 28
Question
• Quels sont les avantages d’utiliser les entrepôts de
données?

Pr. EL AZAMI 29
Bénéfices des entrepôts de données
• Directs:
– Permettent de mener des analyses poussées sur différents sujets
d’affaires;
– Fournissent une vue consolidée des données de l’entreprise (une
seule vérité);
– Procurent de l’information de qualité, plus rapidement;
– Libèrent les ressources (ex: serveurs) dédiées au traitement des
transactions des tâches d’analyse;
– Simplifient l’accès aux données.
• Indirects:
– Améliorent le savoir de l’entreprise;
– Procurent un avantage concurrentiel à l’entreprise;
– Améliorent la satisfaction des clients;
– etc.

Pr. EL AZAMI 30
Bénéfices sociaux des entrepôts de données

• Meilleure communication/coopération entre les


différents intervenants d’une entreprise:
– Normalement très peu d’affinités entre les intervenants du
domaine des TI et ceux du domaine des affaires;
– Un projet d’entreposage de données rapproche ces deux
groupes en leur donnant un objectif commun.
• Meilleure communication/coopération entre les
différentes branches d’une entreprise:
– Permet d’intégrer et de consolider les données des
différentes branches;
– Fournit une plateforme et des outils d’analyse communs.

Pr. EL AZAMI 31
Pr. EL AZAMI 32
Sources de données
• Enterprise resource planning (ERP):
– Gèrent les processus opérationnels d'une entreprise (ex: ressources
humaines, finances, distribution, approvisionnement, etc.).
• Customer relationship management (CRM):
– Gèrent les interactions d’une entreprise avec ses clients (ex:
marketing, ventes, après-vente, assistance technique, etc.).
• Systèmes legacy:
– Matériels et logiciels obsolètes mais difficilement remplaçables.
• Point of sale (POS):
– Matériels et logiciels utilisés dans les caisses de sorties d’un magasin.
• Externes:
– Ex: données concurrentielles achetées, données démographiques.

Pr. EL AZAMI 33
Questions
• À quoi correspond le processus ETL?
• Pourquoi ce processus est-il essentiel à l’entreposage de
données?

Pr. EL AZAMI 34
Intégration des données
• Processus Extract, Tranform, Load (ETL):
1. Extraire les données des sources hétérogènes:
• Identifier les sources utiles;
• Comprendre les schémas.
2. Consolider les données:
• Données redondantes / manquantes;
• Différents noms / types;
• Incohérences.
3. Charger les données intégrées dans l’entrepôt:
• Mode différé (batch);
• Quasi temps-réel.
• Représente la partie la plus complexe de l’entreposage.

Pr. EL AZAMI 35
Les outils d’analyse de données
• Rapports et requêtes simples
– « Dis moi ce qui s’est passé ».
• Analyse d’affaires
– « Dis moi ce qui s’est passé et pourquoi ».
• Tableaux de bord et scorecards
– « Donne moi l’information mais ne me fait pas
travailler pour obtenir les réponses ».
• Forage de données
– « Dis moi quelque chose de nouveau et d’intéressant
sans que j’aille à le demander ».

Pr. EL AZAMI 36
Exemples de tableau de bord [1/3]

Pr. EL AZAMI 37
Exemples de tableau de bord [2/3]

Pr. EL AZAMI 38
Exemples de tableau de bord [3/3]

Pr. EL AZAMI 39
Cas d’étude: Police de Richmond [1/4]

• Objectif:
– Réduire le crime en anticipant les
activités criminelles.
• Données:
– Données actuelles et historiques d’appels
au 911;
– Informations relatives aux événements de
la ville et des régions limitrophes;
– Conditions météorologiques;
– etc.
• Méthode:
– Analyser les interactions entre les
données actuelles et historiques.

Pr. EL AZAMI 40
Cas d’étude: Police de Richmond [2/4]

• Composantes technologiques:
Technologie Composante
Webfocus
(Information Builders) Intégration des données

SPSS (IBM) Analyse prédictive


Correspondance dynamique des informations
ESRI géographiques

• Outil de visualisation:
– Représentation des indicateurs sur la carte graphique de
la ville.

Pr. EL AZAMI 41
Cas d’étude: Police de Richmond [3/4]

Pr. EL AZAMI 42
Cas d’étude: Police de Richmond [4/4]

• Résultats:
– Affectation optimale des ressources
policières;
– Meilleure anticipation des activités
criminelles;
– Le crime a été réduit de 49 %;
– Moins d’appels au 911.

Pr. EL AZAMI 43

Vous aimerez peut-être aussi