0% ont trouvé ce document utile (0 vote)
22 vues8 pages

Cours 02 Module 03 Devoir

Ce document présente deux sources de données, une base de données de vente au détail et un tableau de calcul d'événements spéciaux, pour un fournisseur de salles de sport. Il décrit également les besoins commerciaux d'analyser les ventes de produits, de services et d'événements spéciaux par franchise, produit, service, client et date. L'étudiant doit concevoir un schéma en étoile pour intégrer les sources de données et soutenir l'analyse requise, en identifiant les problèmes d'intégration et en remplissant les tables de l'entrepôt de données avec des exemples.

Transféré par

ScribdTranslations
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
22 vues8 pages

Cours 02 Module 03 Devoir

Ce document présente deux sources de données, une base de données de vente au détail et un tableau de calcul d'événements spéciaux, pour un fournisseur de salles de sport. Il décrit également les besoins commerciaux d'analyser les ventes de produits, de services et d'événements spéciaux par franchise, produit, service, client et date. L'étudiant doit concevoir un schéma en étoile pour intégrer les sources de données et soutenir l'analyse requise, en identifiant les problèmes d'intégration et en remplissant les tables de l'entrepôt de données avec des exemples.

Transféré par

ScribdTranslations
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Mini cas pour l'affectation dans le module 3

L'affectation dans le module 3 vous donne l'occasion d'appliquer la plupart des concepts

du module 3 et certains des concepts du module 2. Puisque l'assignation est basée

étroitement sur les problèmes pratiques dans le module 3, vous devez essayer le mini-étude de cas

pour les problèmes de pratique et, ensuite, examiner les détails de la solution.

Ce mini-étude de cas contient deux sources de données avec des données d'exemple ainsi que

une déclaration des besoins d'affaires. Avec les sources de données et les besoins de

affaires, spécifiera un modèle dimensionnel avec des dimensions, des mesures et un granulat, créera un

conception d'un schéma pour l'entrepôt de données qui intègre les sources de données, identifiera les

problèmes d'intégration dans la conception et remplira les tables du data-warehouse de lignes de

exemple dans les sources de données.

Sources de données
Fitness Unlimited est un fournisseur leader de centres de remise en forme avec une variété de

programmes de conditionnement physique et options d'adhésion. Fitness Unlimited maintient

une base de données de détail pour suivre les ventes de services et de marchandises. Dans le ERD pour le

base de données de vente au détail (Figure 1), une vente comprend un titre (Vente) avec la date de vente et une

collection de marchandises enregistrées dans la relation M-NContains. Les achats de service se

enregistre dans le type d'entité ServPurchase avec des relations de 1-M de ServiceCategory et

Membre. Les services typiques sont des leçons, l'utilisation d'équipements premium et des événements sociaux. La

relationMemTypeOfes optionnelle pour les membres car les membres invités peuvent utiliser

un centre de remise en forme et acheter des produits et services à court terme sans avoir un abonnement

pagée. Les tableaux avec des lignes d'échantillon sont affichés après la figure 1.
19/04/2019 Affectation du module 3 Page 2

Franchise TypeDeMembre
FranchId IdTypeMem
RégionFrançaise NomTypeMém
CodePostalFrançais PrixTypeMem
TypeDeModèleFranchise

TypeDeMémoire

Membre
FranchiseDe IdentifiantMmbr Vente
NomMembre
Catégorie de service MmbrZip Vendu à Identifiant de vente
DateDeVente
ServCatId CourrielMembre
NomDuService DateMembre
PrixServCat
Qté
Contient

Achat de services ServMembre


Marchandise
ServCatOf ServPurchId
Date d'achat de service ID de marchandise
NomDuProduit
Prix des marchandises
TypeDeMarchandise

Figure 1 : ERD pour la base de données Retail Fitness

Franchise
IdentifiantFranchise
F1 Nord-Ouest 98011 Complet
F2 Montagne 80111 Moyen
F3 Central 45236 Limitée

TypeDeMembre
IdTypeMembre
M1 Platine 1 000 $
M2 Or 800 $
M3 Valeur 300 $

Catégorie de service
IdentifiantCatService Prix du Service Cat
SC1 Machine à billes 15 $
SC2 Leçon privée 75 $
SC3 Classe adulte 150 $
SC4 Classe secondaire 125 $
19/04/2019 Attribution du module 3 Page 3

Marchandise
IdProduit PrixMarchandise
MC1 Les balles Wilson $3 Boules
MC2 La raquette Wilson $200 Raquette
MC3 Baskets Adidas 100 $ Chaussures
MC4 La raquette 40 $ Raquette

Membre
IdMmbr FranchId AdresseEmailMembre
1111 Joe 98011 M1 1-févr-2009 F1 joe@[Link]
2222 María 80112 M2 1er janvier 2010 F2 mary@[Link]
3333 Sue 45327 M3 3 mars 2011 F3 sue@[Link]
4444 Jorge 45236 F3 george@[Link]

Vente
IdentifiantDateDeVente
de vente IdMembre
1111 10-févr.-2013 1111
2222 13-févr.-2013 2222
3333 13-févr.-2013 2222
4444 14-Fév-2013 3333

Contient
Identifiant de marchandise Qté
MC1 1111 2
MC2 1111 1
MC4 2222 1
MC3 3333 1
MC4 4444 1

AchatDeService
ServPurchId
1111 13-Fév-2013 1111 SC1
2222 14-févr.-2013 2222 SC2
4444 15-févr-2013 4444 SC3

Les franchises vendent également des événements spéciaux à des entreprises et d'autres organisations.

Étant donné que les promotions et les ventes d'événements spéciaux ne sont pas standard parmi les

Les franchises, les feuilles de calcul sont souvent utilisées pour suivre des événements.

spéciales. La base de données des ventes de franchises n'a jamais été élargie pour accueillir les ventes

d'événements spéciaux. La feuille de travail des événements spéciaux montre un format typique pour le

suivi des ventes d'événements spéciaux par une franchise. La plupart des franchises

ils utilisent une feuille de calcul similaire.


19/04/2019 Attribution du module 3 Page 4

Fiche d'événements spéciaux


Société Nom du client corporate Type d'événement Date de l'événement Montant
Client Et emplacement Code
Id
CC1 First Data, Greenwood Village L-A Social adulte 13-févr-2013 1 000 $
CC2 DU Tennis, Denver L-B Pionnier social 14-févr.-2013 500 $
CC3 École secondaire de Creek L-C Entraînement d'équipe 21-Fév-2013 200 $
Greenwood
Village

Estimations de taille de source de données


Pour calculer la taille des grains, vous devez utiliser ces estimations sur les cardinalités de

les tables et les valeurs uniques de certaines colonnes.

Filiales de franchise : 350

Codes postaux de franchise : 200

Filas de MemberType : 10

Filas de Marchandises : 500

Valeurs de MerchType : 30

Filas de ServCatégorie: 20

Filas de Membres : 50 000

Codes postaux des Membres : 500

Filas de Vente : 150 000 par an

Filas de Contiene : 450 000 par an

Filas de ServicePurchase : 100 000 filas par an

Filas de SpecialEvents de la hoja de travail : 300 par an par franchise avec 200

Franchises utilisant ce tableur

150 clients uniques par feuille d'événement spécial


19/04/2019 Affectation du module 3 Page 5

Besoins d'affaires
L'entrepôt de données doit permettre l'analyse des ventes de marchandises et des achats de

services par franchise, marchandise ou type de service, et client au fil du temps. Pour le

marchandise, le montant des ventes se calcule comme le nombre de fois le prix de vente. Pour les

achats de services, chaque vente d'unités est enregistrée séparément, donc seul le prix

de service au moment de l'achat est enregistré. Pour le client, les ventes de marchandises

doivent être suivies par code postal, date d'adhésion et type de membre. Pour le

franchise, les ventes de marchandises doivent être suivies par région de franchise, code postal

et type de modèle.

Le bureau des ventes corporatives souhaite un haut niveau de flexibilité pour l'analyse de

ventes. Pour l'analyse de l'exploration de données, ils ont besoin de détails par client individuel, produit ou

service, et franchise et date. Pour les applications de rapports typiques, ils ont besoin de détails par

emplacement du client, emplacement de la franchise, et le type de produit ou service, et la semaine.

Problèmes
Vous devez concevoir un schéma en étoile (ou une variation) pour permettre l'analyse des revenus.

Vous devez prêter une attention particulière au grain de la table des faits, la partie principale du diagramme de

schéma en étoile. Dans le cadre de la conception, vous devez identifier toutes les dimensions pertinentes

avec des hiérarchies spécifiées. Dans la documentation, vous devez identifier les problèmes d'intégration.

dans le schéma en étoile et indiquer l'attribution des sources de données dans les tableaux.

Vous devez remplir les tables du data-warehouse en fonction des données des tables

opératives et la feuille de calcul. Il n'est pas nécessaire d'insérer les données dans les tableaux. Vous ne pouvez que

montrer les listes de tableaux dans le document de solution. Les lignes d'échantillon doivent inclure tout

les événements de revenus de l'intervalle du 10 février 2013 au 21 février 2013.


19/04/2019 Affectation du module 3 Page 6

1. Vous devez identifier les dimensions, attribuer des dimensions aux sources de données et spécifier les

hiérarchies de dimensions. Pour chaque dimension, vous devez identifier ses sources de données et les

attributs dans chaque source de données. Pour les dimensions hiérarchiques, vous devez indiquer les niveaux

de large à étroit.

2. Vous devez spécifier les mesures, les sources de données associées et mesurer les propriétés de

agrégation.

3. Identifiez le grain dans votre conception dimensionnelle en utilisant les besoins de l'entreprise comme

guide. Ensuite, vous devez indiquer les exigences de stockage relatives pour le grain

en utilisant les statistiques des sources de données. Avec les estimations de cardinalité

fournies, elle doit déterminer la taille de la table des faits ou la dispersion et, à

continuation, calculer la variable de taille de grain inconnue. Par exemple, cela doit

calculer la dispersion si la taille de la table des faits est donnée.

4. Étendez l'analyse pour concevoir un schéma en étoile (ou une variante) pour permettre l'analyse

d'inventaire. Pour chaque table, vous devez définir le nom de la table, la clé primaire et les

colonnes. Il n'est pas nécessaire d'écrire des instructions CREATE TABLE complètes.

5. Identifiez les problèmes d'intégration possibles dans votre schéma en étoile et indiquez-les

résolutions préférées des problèmes d'intégration. Pour les relations de dimension-

faits incomplets, doit également indiquer si les colonnes d'une table de dimensions

permettent des valeurs nulles.

6. Vous devez remplir les tables du data-warehouse en fonction des données des tables d'exemple et

de la feuille de calcul. Il n'est pas nécessaire d'écrire des instructions INSERT SQL ni d'insérer les

données dans les tables de la base de données. Ne peut afficher que les listes des tables dans son

solution. You must indicate data source assignments in tables. For example, a
19/04/2019 Affectation du module 3 Page 7

L'attribution peut impliquer la génération de nouvelles valeurs de clé primaire pour une table

du data-warehouse ou l'utilisation d'une valeur par défaut pour une valeur manquante.

Qualité de la solution
La qualité est assez subjective dans les conceptions de data-warehouse, mais certains
Les éléments sont moins subjectifs. Je suggère d'aborder ces éléments de qualité dans la partie
adéquate de la solution.

Patron de schéma : doit utiliser un schéma reconnu : schéma en étoile,


constellation ou flocon de neige.

Sélection de la table des faits : vous devez étudier la sélection de la table des faits dans le
solution pour le mini cas de la pratique afin de s'inspirer. Normalement, le tableau des faits
combine une solution à deux niveaux dans un schéma en étoile dans une seule table de faits.
Par exemple, un en-tête de commande et le détail de la commande sont normalement combinés dans
une table de faits qui enregistre les détails de la commande avec des relations de dimension pour
capturer l'en-tête de la commande.

Il manque des données dans les tableaux remplis : vous devez vous assurer que les tableaux remplis incluent
tous les événements de revenus affichés dans les deux sources de données. La meilleure vérification
Le design du schéma consiste à attribuer des lignes d'exemple des sources de données aux données-
entrepôts.

Simplicité : normalement, un schéma de conception de l'entrepôt de données simplifie les


schémas des sources de données sous-jacentes. La simplification peut impliquer la
combinaison de certains éléments de sources de données dans les décisions sur les dimensions et
tables de faits.

Classement
La méthode d'évaluation pour cette assignation est l'évaluation par les pairs. Chaque problème a
un degré égal.

Soumission
Vous devez soumettre 6 documents pour la révision par les pairs pour l'attribution du module 3. Chaque

Le document contient une solution complète au problème. Vous devez le formater.


19/04/2019 Affectation du module 3 Page 8

soigneusement vos documents afin qu'ils puissent être facilement évalués. Veuillez écrire le
numéro du problème en haut de la page.

Vous aimerez peut-être aussi