Administration base de données :
Solutions pour mieux
gérer ”le flux ”
”des données ”
instantané dans notre vie
Mourad NACHAOUI
FST
Béni-Mellal
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 0/1
Sommaire
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 1/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Domaine
ensemble de valeurs atomiques d’un certain type sémantique.
Ex. : NOM VILLE = { Nice, Paris, Rome,Rabat,Marrakech }
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 2/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Domaine
ensemble de valeurs atomiques d’un certain type sémantique.
Ex. : NOM VILLE = { Nice, Paris, Rome,Rabat,Marrakech }
les domaines sont les ensembles de valeurs possibles dans
lesquels sont puisées les données
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 2/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Domaine
ensemble de valeurs atomiques d’un certain type sémantique.
Ex. : NOM VILLE = { Nice, Paris, Rome,Rabat,Marrakech }
les domaines sont les ensembles de valeurs possibles dans
lesquels sont puisées les données
deux ensembles peuvent avoir les mêmes valeurs bien que
sémantiquement distincts
Ex. : NUM ELV = { 1, 2, . . . , 2000 },
NUM ANNEE = { 1, 2, . . . , 2000 }
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 2/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Domaine
ensemble de valeurs atomiques d’un certain type sémantique.
Ex. : NOM VILLE = { Nice, Paris, Rome,Rabat,Marrakech }
les domaines sont les ensembles de valeurs possibles dans
lesquels sont puisées les données
deux ensembles peuvent avoir les mêmes valeurs bien que
sémantiquement distincts
Ex. : NUM ELV = { 1, 2, . . . , 2000 },
NUM ANNEE = { 1, 2, . . . , 2000 }
En bref: Un domaine de valeurs est un ensemble d’instances d’un
type élémentaire.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 2/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Domaine
ensemble de valeurs atomiques d’un certain type sémantique.
Ex. : NOM VILLE = { Nice, Paris, Rome,Rabat,Marrakech }
les domaines sont les ensembles de valeurs possibles dans
lesquels sont puisées les données
deux ensembles peuvent avoir les mêmes valeurs bien que
sémantiquement distincts
Ex. : NUM ELV = { 1, 2, . . . , 2000 },
NUM ANNEE = { 1, 2, . . . , 2000 }
En bref: Un domaine de valeurs est un ensemble d’instances d’un
type élémentaire.
Exemple : les entiers, les réels, les chaı̂nes de caractères, etc.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 2/1
Quelques concepts à connaı̂tre
Quelques concepts à connaı̂tre
Produit cartésien
Ensemble des n-uplets (d1 , d2 , . . . , dn ) où chaque di est un élément du
domaine Di
Ex.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 3/1
Quelques concepts à connaı̂tre
LA RELATION
sous ensemble du produit cartésien de plusieurs domaines
R ⊂ D1 × D2 × . . . × Dn
D1 , D2 , . . . , Dn sont les domaines de R, n est le degré ou l’arité de R
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 4/1
Quelques concepts à connaı̂tre
LA RELATION
Ex.:
Les domaines :
NOM ELV = { Martin, Bernard },
PREN ELV = { Jean, Anne, Maxime},
DATE NAISS = {Date entre 1/1/1990 et 31/12/2020}
NOM SPORT = { judo, tennis, foot }
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 5/1
Quelques concepts à connaı̂tre
LA RELATION
Ex.:
Les domaines :
NOM ELV = { Martin, Bernard },
PREN ELV = { Jean, Anne, Maxime},
DATE NAISS = {Date entre 1/1/1990 et 31/12/2020}
NOM SPORT = { judo, tennis, foot }
La relation ELEVE
ELEVE ⊂ NOM ELV × PREN ELV × DATE NAISS
ELEVE = { (Martin, Jean, 1/1/1992),(Bernard, Anne, 2/2/1994) }
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 5/1
Quelques concepts à connaı̂tre
LA RELATION
Ex.:
Les domaines :
NOM ELV = { Martin, Bernard },
PREN ELV = { Jean, Anne, Maxime},
DATE NAISS = {Date entre 1/1/1990 et 31/12/2020}
NOM SPORT = { judo, tennis, foot }
La relation ELEVE
ELEVE ⊂ NOM ELV × PREN ELV × DATE NAISS
ELEVE = { (Martin, Jean, 1/1/1992),(Bernard, Anne, 2/2/1994) }
La relation INSCRIPT
INSCRIPT ⊂ NOM ELV × NOM SPORT
INSCRIPT = { (Martin, judo), (Martin, foot), (Bernard, judo) }
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 5/1
Quelques concepts à connaı̂tre
LA RELATION
Ex.:
Les domaines :
NOM ELV = { Martin, Bernard },
PREN ELV = { Jean, Anne, Maxime},
DATE NAISS = {Date entre 1/1/1990 et 31/12/2020}
NOM SPORT = { judo, tennis, foot }
La relation ELEVE
ELEVE ⊂ NOM ELV × PREN ELV × DATE NAISS
ELEVE = { (Martin, Jean, 1/1/1992),(Bernard, Anne, 2/2/1994) }
La relation INSCRIPT
INSCRIPT ⊂ NOM ELV × NOM SPORT
INSCRIPT = { (Martin, judo), (Martin, foot), (Bernard, judo) }
Une relation peut simplement être représentée sous forme de table.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 5/1
Quelques concepts à connaı̂tre
LES ATTRIBUTS
Chaque composante d’une relation est un attribut.
Les attributs nomment les colonnes d’une relation. Il servent à la
fois à indiquer le contenu de cette colonne, et à la référencer
quand on effectue des opérations. Un attribut est toujours associé
à un domaine.
Le nom d’un attribut peut apparaı̂tre dans plusieurs schémas de
relations.
Plusieurs attributs peuvent avoir le même domaine
Ex. :
La relation TRAJET : TRAJET ⊂ NOM VILLE × NOM VILLE
Dans laquelle la première composante représente la ville de départ
VD, la deuxième composante la ville d’arrivée VA d’un trajet.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 6/1
Quelques concepts à connaı̂tre
LES N-UPLETS
un élément d’une relation est un n-uplet de valeurs (tuple en anglais)
- un n-uplet représente un fait
Ex.:
”Martin Jean est un élève né le 1 janvier 1992”
” Martin est inscrit au judo ”
Un tuple est donc simplement une ligne dans la représentation d’une
relation sous forme de table. En théorie, on connaı̂t les valeurs de tous
les attributs du tuple.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 7/1
Quelques concepts à connaı̂tre
Définition d’un schéma relationnel
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 8/1
Quelques concepts à connaı̂tre
Définition d’un schéma relationnel
Un des grands avantages du modèle relationnel est sa très
grande simplicité. Il n’existe en effet qu’une seule structure, la
relation. Une relation peut simplement être représentée sous
forme de table.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 8/1
Quelques concepts à connaı̂tre
Définition d’un schéma relationnel
Un des grands avantages du modèle relationnel est sa très
grande simplicité. Il n’existe en effet qu’une seule structure, la
relation. Une relation peut simplement être représentée sous
forme de table.
Une relation a donc un nom et se compose d’un ensemble de
colonnes désignées par un nom d’attribut. Dans chaque colonne
on trouve des valeurs d’un certain domaine (chaı̂nes de
caractères, nombres). Enfin on constate que chaque ligne (ou
tuple) correspond à une entité.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 8/1
Quelques concepts à connaı̂tre
Définition d’un schéma relationnel
Un des grands avantages du modèle relationnel est sa très
grande simplicité. Il n’existe en effet qu’une seule structure, la
relation. Une relation peut simplement être représentée sous
forme de table.
Une relation a donc un nom et se compose d’un ensemble de
colonnes désignées par un nom d’attribut. Dans chaque colonne
on trouve des valeurs d’un certain domaine (chaı̂nes de
caractères, nombres). Enfin on constate que chaque ligne (ou
tuple) correspond à une entité.
Un schéma relationnel est constitué d’un ensemble de schémas
de relations qui décrivent, à l’aide des éléments présentés
informellement ci-dessus (domaines, attributs, noms de relation)
le contenu d’une relation.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 8/1
Quelques concepts à connaı̂tre
LE SCHÉMA D’UNE RELATION
Le schéma d’une relation est défini par :
le nom de la relation
la liste de ses attributs
Donc un schéma de relation est simplement un nom suivi de la liste
des attributs, chaque attribut étant associé à son domaine.
on note :
R(A1 , A2 , ..., An )
Ex.:
ELEVE (NOM, PRENOM, NAISS)
INSCRIPT (NOM ELV, SPORT)
TRAJET (VD, VA)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 9/1
Quelques concepts à connaı̂tre
Clé primaire
attribut(s) permittant d’identifier d’une manière unique chaque tuple
(identifiant par exemple)
Clé externe (ou étrangère)
attribut(s) permittant de pointer vers un tuple d’une autre table
(identifiant d’un étudiant dans une table de notes par exemple)
valeur nulle
non présence de l’information (représenté par NULL). A ne pas
confondre avec la valeur 0.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 10 / 1
Quelques concepts à connaı̂tre
Instance d’une relation
La définition d’une relation (Instance d’une relation) comme un
ensemble (au sens mathématique) a quelques conséquences
importantes :
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 11 / 1
Quelques concepts à connaı̂tre
Instance d’une relation
La définition d’une relation (Instance d’une relation) comme un
ensemble (au sens mathématique) a quelques conséquences
importantes :
l’ordre des lignes n’a pas d’importance car il n’y a pas d’ordre
dans un ensemble ;
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 11 / 1
Quelques concepts à connaı̂tre
Instance d’une relation
La définition d’une relation (Instance d’une relation) comme un
ensemble (au sens mathématique) a quelques conséquences
importantes :
l’ordre des lignes n’a pas d’importance car il n’y a pas d’ordre
dans un ensemble ;
on ne peut pas trouver deux fois la même ligne car il n’y a pas de
doublons dans un ensemble ;
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 11 / 1
Quelques concepts à connaı̂tre
Instance d’une relation
La définition d’une relation (Instance d’une relation) comme un
ensemble (au sens mathématique) a quelques conséquences
importantes :
l’ordre des lignes n’a pas d’importance car il n’y a pas d’ordre
dans un ensemble ;
on ne peut pas trouver deux fois la même ligne car il n’y a pas de
doublons dans un ensemble ;
il n’y a pas de case vide dans la table, donc toutes les valeurs de
tous les attributs sont toujours connues ;
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 11 / 1
Quelques concepts à connaı̂tre
Eléments du modèle relationnel
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 12 / 1
Quelques concepts à connaı̂tre
Règles d’intérités structurelles
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 13 / 1
Quelques concepts à connaı̂tre
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 14 / 1
Quelques concepts à connaı̂tre
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 15 / 1
Dépendance fonctionnelle
Dépendance fonctionnelle (DF)
Soit R(A1 , A2 , . . . , An ) un schéma de relation, et X et Y des
sous-ensembles de A1 , A2 , . . . , An
On dit que X détermine Y ou que Y dépend fonctionnellement de
X si, et seulement si, des valeurs identiques de X impliquent des
valeurs identiques de Y
On le note : X −→ Y
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 16 / 1
Dépendance fonctionnelle
DF se traduit en termes mathématiques de la manière suivante :
Soit Cx un ensemble de champs (x1 , x2 , x3 ) et Cy un ensemble de
champs (y1 , y2 , y3 ) d’une relation
R(d1 , d2 , x1 , x2 , x3 , u1 , u2 , u3 , y1 , y2 , y3 ).
Supposons que l’on considère des valeurs (x1,i , x2,i , x3,i ) et
(x1,j , x2,j , x3,j ) telles que l’on ait
R(d1,i , d2,i , x1,i , x2,i , x3,i , u1,i , u2,i , u3,i , y1,i , y2,i , y3,i )
et
R(d1,j , d2,j , x1,j , x2,j , x3,j , u1,j , u2,j , u3,j , y1,j , y2,j , y3,j ).
On dit que Cy dépend fonctionnellement de Cx lorsque pour tout i et j
si (x1,i , x2,i , x3,i ) est égal à (x1,j , x2,j , x3,j ) alors (y1,i , y2,i , y3,i ) est égal à
(y1,j , y2,j , y3,j ).
Les dépendances fonctionnelles expriment la relation de hiérarchie qui
existe entre les champs.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 17 / 1
Dépendance fonctionnelle
On considère l’exemple de table suivant, qui correspond à la relation
Lecteur (Numero carte, Nom, Age, Ville, Etablissement). Cet exemple
modélise les lecteurs d’une bibliothèque.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 18 / 1
Dépendance fonctionnelle
Si l’on examine les données, on remarque qu’il ne peut y avoir de
dépendances fonctionnelles entre les couples de champs (Ville,
Etablissement) et les champs (Nom, Age).
Il existe un enregistrement (‘Laurence’, ‘34’) pour lequel les
valeurs des champs (Nom, Age) correspondent à deux valeurs
différentes de (Ville, Etablissement).
En revanche, on sait que, dans la réalité, un établissement est
situé dans une ville et une seule (on le suppose pour cet
exemple).
Cela signifie qu’il existe une relation de dépendance entre les
champs ‘Etablissement’ et ‘Ville’.
Le contenu des champs ‘Ville’ et ‘Etablissement’ des
enregistrements de notre relation se conforment à cette relation
de dépendance.
A une valeur donnée de ‘Etablissement’ correspond bien une
valeur unique de ‘Ville’.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 19 / 1
Dépendance fonctionnelle
La valeur du champ ‘Numero carte’ est unique pour chacune des
personnes. On constate que ses valeurs sont identifiantes pour
tous les autres champs de la relation.
Chaque champ dépend fonctionnellement du champ ‘Numero
carte’. Ses valeurs sont uniques et jamais vides : c’est une clé
candidate.
Dans cet exemple, c’est la seule clé possible car les autres
champs n’ont jamais de valeur unique. Le champ’ ‘Numero carte’
est choisi comme clé primaire de la relation.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 20 / 1
Dépendance fonctionnelle
Exempe 2
PRODUIT (no prod, nom, prixUHT)
no prod −→ (nom, prixUHT)
NOTE (no contrôle, no élève, note)
(no contrôle, no élève) → note
LES DÉPENDANCES :
Liaisons de un à plusieurs exprimées par des attributs particuliers:
clés étrangères ou clés secondaires Les contraintes de référence
ont un impact important pour les opérations de mises à jour, elles
permettent d’éviter les anomalies de mises à jour
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 21 / 1
Dépendance fonctionnelle
Exemple :
CLIENT (no client, nom, adresse)
ACHAT (no produit, no client, date, qte)
Clé étrangère no client dans ACHAT
insertion tuple no client = X dans ACHAT
vérification si X existe dans CLIENT
suppression tuple no client = X dans CLIENT
soit interdire si X existe dans ACHAT
soit supprimer en cascade tuple X dans ACHAT
soit modifier en cascade X = NULL dans ACHAT
modification tuple no client = X en X’ dans CLIENT
soit interdire si X existe dans ACHAT
soit modifier en cascade X en X’ dans ACHAT
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 22 / 1
Dépendance fonctionnelle
Propriétés
Dépendances triviales (réflexivité)
A→A
A, B → A
Augmentation
A → B ⇒ A, C → B
Transitivité
A → B et B → C ⇒ A → C
Dépendance fonctionnelle élémentaire
Une DF élémentaire est une DF de la forme X → A
où A est un attribut unique n’appartenant pas à X
et où il n’existe pas X’ inclus au sens strict dans X
(i.e. X 0 ⊂ X ) tel que X 0 → A
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 23 / 1
Dépendance fonctionnelle
cru, client → type ⇒ est une DF,
mais n’est pas élémentaire : cru → type
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 24 / 1
Normalisation
La théorie de la normalisation
elle met en évidence les relations ”indésirables”
elle définit les critères des relations ”désirables” appelées formes
normales
Propriétés indésirables des relations
Redondances
Valeurs NULL
elle définit le processus de normalisation permettant de
décomposer une relation non normalisée en un ensemble
équivalent de relations normalisées
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 25 / 1
Normalisation
Fromes normales
Quatre formes normales essentielles
1FN, 2FN, 3FN et BCNF.
Définissent la façon d’utiliser les entités, les attributs ou certaines
contraintes sur les dépendances.
Pour les modèles complexes : 4FN, 5FN, 6FN, FNDC
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 26 / 1
Normalisation
Fromes normales
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 27 / 1
Normalisation
La décomposition
Objectif:
décomposer les relations du schéma relationnel sans perte
d’informations
obtenir des relations canoniques ou de base du monde réel
aboutir au schéma relationnel normalisé
Le schéma de départ est le schéma universel de la base
Par raffinement successifs ont obtient des sous relations sans
perte d’informations et qui ne seront pas affectées lors des mises
à jour (non redondance)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 28 / 1
Normalisation
Fromes normales
Notion intuitive de FN
une ” bonne relation ” peut être considérée comme une fonction de la
clé primaire vers les attributs restants
1ère Forme Normale 1FN
Une relation est en 1FN si, et seulement si, tout attribut contient une
valeur atomique (non multiple, non composée).
Contre-exemple
ELEVE (no elv, nom, prenom, liste notes) Un attribut ne peut pas
être un ensemble de valeurs
Normalisation par décomposition
ELEVE (no elv, nom, prenom)
NOTE (no elv, no matiere, note)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 29 / 1
Normalisation
2ème Forme Normale 2FN
Une relation est en 2FN si
elle est en 1FN
si tout attribut n’appartenant pas à la clé ne dépend pas d’une
partie de la clé
C’est la phase d’identification des clés
Cette étape évite certaines redondances
Tout attribut doit dépendre fonctionnellement de la totalité de la clé
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 30 / 1
Normalisation
2ème Forme Normale 2FN
Une relation est en 2FN si
elle est en 1FN
si tout attribut n’appartenant pas à la clé ne dépend pas d’une
partie de la clé
C’est la phase d’identification des clés
Cette étape évite certaines redondances
Tout attribut doit dépendre fonctionnellement de la totalité de la clé
Contre-exemple : une relation en 1FN qui n’est pas en 2FN
COMMANDE (date, no cli, no pro, qte, prixUHT) elle n’est pas en
2FN car la clé = (date, no cli,no pro), et le prixUHT ne dépend que
de no pro
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 30 / 1
Normalisation
2ème Forme Normale 2FN
Une relation est en 2FN si
elle est en 1FN
si tout attribut n’appartenant pas à la clé ne dépend pas d’une
partie de la clé
C’est la phase d’identification des clés
Cette étape évite certaines redondances
Tout attribut doit dépendre fonctionnellement de la totalité de la clé
Contre-exemple : une relation en 1FN qui n’est pas en 2FN
COMMANDE (date, no cli, no pro, qte, prixUHT) elle n’est pas en
2FN car la clé = (date, no cli,no pro), et le prixUHT ne dépend que
de no pro
Normalisation par décomposition
COMMANDE (date, no cli, no pro, qte)
PRODUIT (no pro, prixUHT)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 30 / 1
Normalisation
Relation non en 2FN
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 31 / 1
Normalisation
Relation non en 2FN
MCD non en 2FN
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 31 / 1
Normalisation
3ème Forme Normale 3FN
La troisième forme normale recherche également la redondance
d’information dans une relation.
On cherche s’il existe une dépendance entre deux champs qui ne
font pas partie d’une clé.
Si c’est le cas, on se trouve dans la situation où un champ dépend
d’un autre champ qui dépend lui même d’une clé.
La clé considérée peut être primaire ou secondaire.
La troisième forme normale interdit donc les dépendances
fonctionnelles dites ”transitives” entre les champs.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 32 / 1
Normalisation
3ème Forme Normale 3FN
Une relation est en 3FN si
elle est en 2FN
si tout attribut n’appartenant pas à la clé ne dépend pas d’un
attribut non clé
Ceci correspond à la non transitivité des D.F. ce qui évite les
redondances.
En 3FN une relation préserve les D.F. et est sans perte.
Contre-exemple : une relation en 2FN qui n’est pas en 3FN
VOITURE (matricule, marque, modèle, puissance)
on vérifie qu’elle est en 2FN ; elle n’est pas en 3FN car la
clé = matricule, et la puissance dépend de (marque, modèle)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 33 / 1
Normalisation
Normalisation par décomposition
VOITURE (matricule, marque, modèle)
MODELE (marque, modèle, puissance)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 34 / 1
Normalisation
Normalisation par décomposition
VOITURE (matricule, marque, modèle)
MODELE (marque, modèle, puissance)
Relation en 2FN non 3FN avec sa normalisation
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 34 / 1
Normalisation
Normalisation par décomposition
VOITURE (matricule, marque, modèle)
MODELE (marque, modèle, puissance)
Relation en 2FN non 3FN avec sa normalisation
Relation non en 3FN
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 34 / 1
Normalisation
Insuffisance de la 3e forme normale
Relation VINS(CRU, PAYS, REGION)
Chenas France Beaujolais
Juliénas France Beaujolais
Chablis France Bourgogne
Chablis USA Californie
avec les DF suivantes :
région → pays; cru, pays → région
VINS est en 3FN, pourtant il y a des redondances
(ici on peut régler cela avec la 3FN Boyce Codd Kent)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 35 / 1
Normalisation
Forme normale de Boyce-Codd (BCNF)
Une relation est en BCNF si, et seulement si
elle est en 3FN
et si les seules dépendances fonctionnelles élémentaires sont
celles dans lesquelles une clé détermine un attribut.
BCNF signifie que l’on ne peut pas avoir un attribut (ou groupe
d’attributs) déterminant un autre attribut et distinct de la clé
Ceci évite les redondances dans l’extension de larelation: mêmes
valeurs pour certains attributs de nuplets différents
BCNF est plus fin que FN3 : BCNF ⇒ FN3
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 36 / 1
Normalisation
Contre-exemple
une relation en 3FN qui n’est pas BCNF
CODEPOSTAL (ville, rue, cp)
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 37 / 1
Normalisation
La forme normale de Boyce-Codd est la forme idéale relativement aux
dépendances fonctionnelles, mais malheureusement elle peut ne pas
préserver les dépendances fonctionnelles.
Décomposition
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 38 / 1
Définition de Big-Data
Alors c’est quoi le Big-Data ?
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 39 / 1
Définition de Big-Data
Tantative de définition de big-data
Littéralement, ces termes signifient mégadonnées, grosses
données ou encore données massives.
Ils désignent un ensemble très volumineux de données qu’aucun
outil classique de gestion de base de données ou de gestion de
l’information ne peut vraiment travailler.
En effet, nous générons environ 2,5 trillions d’octets de données
tous les jours.
Ce sont les informations provenant de partout : messages que
nous nous envoyons, vidéos que nous publions, informations
climatiques, signaux GPS, enregistrements transactionnels
d’achats en ligne et bien d’autres encore.
Ces données sont baptisées Big Data ou volumes massifs de
données.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 40 / 1
Définition de Big-Data
Tantative de définition de big-data
Les géants du Web, au premier rang desquels Yahoo (mais aussi
Facebook et Google), ont été les tous premiers à déployer ce type
de technologie.
Cependant, aucune définition précise ou universelle ne peut être
donnée au Big Data.
Etant un objet complexe polymorphe, sa définition varie selon les
communautés qui s’y intéressent en tant qu’usager ou fournisseur
de services.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 41 / 1
Définition de Big-Data
Big Data : l’analyse de données en masse
Inventé par les géants du web, le Big Data se présente comme
une solution créée pour permettre à tout le monde d’accéder en
temps réel à des bases de données géantes.
Il vise à proposer un choix aux solutions classiques de bases de
données et d’analyse (plateforme de Business Intelligence en
serveur SQL. . . ).
Selon le Gartner, ce concept regroupe une famille d’outils qui
répondent à une triple problématique dite règle des 3V.
Ainsi, il s’agit d’un Volume de données considérable à traiter, une
grande Variété d’informations (venant de diverses sources,
non-structurées, organisées,Open. . . ), et un certain niveau de
Vélocité à atteindre, autrement dit de fréquence de création,
collecte et partage de ces données.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 42 / 1
Définition de Big-Data
En bref
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 43 / 1
Définition de Big-Data
3V de Big-Data
Afin de mieux cerner les caractéristiques du big data, des spécialistes
d’IBM ont proposé trois propriétés qui les caractérisent à des degrés
divers, Il s’agit du volume, de la variété et de la vélocité. On les appelle
communément le 3V.
Volume, Vitesse et Variété.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 44 / 1
Définition de Big-Data
Volume
la quantitée de données augmente ! 1 péta-octets toutes les 15
secondes !
est-ce que ça va continuer ?
oui ! l’industrie est prête (disques de 10 To, bandes de 185 To en
2020, etc.)
un obstacle ?
l’énergie ! Actuellement l’industrie de l’information consomme
entre 5 et 10% de l’énergie mondiale
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 45 / 1
Définition de Big-Data
Vélocité
Vitesse de création, collecte et partage des données
La vitesse est la rapidité à laquelle les données affluent. C’est-à-dire la
fréquence à laquelle elles sont générées, capturées et partagées.
Avec les nouvelles technologies les données sont générées toujours
plus rapidement et dans des temps beaucoup plus courts. Les
entreprises sont obligées de les collecter et de les partager en temps
réel mais le cycle de génération de nouvelles données se renouvelle
très vite, rendant rapidement les informations obsolètes.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 46 / 1
Définition de Big-Data
Variété
Seulement 20% des données sont structurées puis stockées dans
des tables de base de données relationnelle similaire à celles
utilisées en gestion comptabilisée.
Les 80% qui restent sont non-structurées. Cela peut être des
images, des vidéos, des textes, des voix, et bien d’autres encore.
..
La technologie Big Data, permet de faire l’analyse, la
comparaison, la reconnaissance, le classement des données de
différents types comme des conversations ou messages sur les
réseaux sociaux, des photos sur différents sites etc.
Ce sont les différents éléments qui constituent la variété offerte
par le Big Data.
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 47 / 1
Définition de Big-Data
Certains auteurs ou éditeurs de logiciels ont voulu ajouter d’autres ”V”
aux trois proposés par Gartner, pour mettre en avant d’autres défis
posés par le Big Data :
Véracité. La variété des sources et la complexité des traitements
peuvent poser des problèmes en ce qui concerne l’évaluation de
la qualité des données (et, in fine, la qualité des analyses faites à
partir d’elles). La problématique de la Data Quality est
structurante dans n’importe quel projet Big Data.
Variabilité. La variabilité des données entraı̂ne une variation de
leur qualité. Le fait que les données évoluent dans le temps peut
entraı̂ner une dégradation de leur qualité. Dans un système Big
Data, il est important d’avoir à disposition des outils permettant
d’identifier, de traiter et de filtrer les données de faible qualité pour
en optimiser l’utilisabilité.
Valeur. Le défi ultime du Big Data est de créer de la valeur. Or,
parfois, les systèmes et les procédures en place sont si
complexes qu’il devient difficile d’extraire de la valeur des données
à disposition (d’en dégager des insights). La valeur rappelle la
finalit
Mourad é business
NACHAOUI (FSTBM) de tout projet Big Data.
FST-Béni-Mellal 48 / 1
Définition de Big-Data
En résumé
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 49 / 1
Définition de Big-Data
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 50 / 1
Définition de Big-Data
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 51 / 1
Défis Big-Data
Les défis du Big Data
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 52 / 1
Défis Big-Data
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 53 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 54 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 55 / 1
Stockage classique
Accès aux données
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 56 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 57 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 58 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 59 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 60 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 61 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 62 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 63 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 64 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 65 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 66 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 67 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 68 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 69 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 70 / 1
Stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 71 / 1
Limite de stockage classique
Limites des systèmes classiques
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 72 / 1
Limite de stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 73 / 1
Limite de stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 74 / 1
Limite de stockage classique
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 75 / 1
Des architectures réparties
La solution: Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 76 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 77 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 78 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 79 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 80 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 81 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 82 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 83 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 84 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 85 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 86 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 87 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 88 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 89 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 90 / 1
Des architectures réparties
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 91 / 1
Typologie NoSQL
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 92 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 93 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 94 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 95 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 96 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 97 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 98 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 99 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 100 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 101 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 102 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 103 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 104 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 105 / 1
Typologie NoSQL
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 106 / 1
Mape-Reduce
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 107 / 1
Mape-Reduce
Idée générale: Envoyer le calcul vers la donnée
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 108 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 109 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 110 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 111 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 112 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 113 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 114 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 115 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 116 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 117 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 118 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 119 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 120 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 121 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 122 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 123 / 1
Mape-Reduce
Mourad NACHAOUI (FSTBM) FST-Béni-Mellal 124 / 1