Présentation des bases de données
Présentation des bases de données
1. Définition : Les bases de données géographiques sont les outils opérationnels qui
permettent d'organiser et de gérer l'information géographique sous forme numérique.
Ce sont des ensembles structurés de fichiers décrivant les objets ou phénomènes localisés
sur la Terre (avec leurs attributs = caractéristiques et leurs relations nécessaires à la
modélisation de l'espace géographique).
Ainsi un SIG peut fournir une aide décisionnelle ou de simples cartes en rapport
avec de nombreux domaines tels que :
- Marketing : localisation des clients.
- Planification urbaine : voirie, cadastre.
- Assurances – protection civile : gestion et prévention des risques
- Tourisme : itinéraires touristiques
- Transport : itinéraires en temps réel
- Géologie : étude des sols et prospection
Ces ensembles sont munis d'un système de gestion permettant :
- de les tenir à jour,
- de les archiver
- et de les diffuser. (distribuer)
Les bases de données constituent le socle sur lequel s'appuient les systèmes
d'information géographique, qui analysent et exploitent les données pour en tirer des
informations utiles à la décision.
Qu'est-ce qu'une base de données ?
Une base de données (en anglais database) est une "structure de données permettant de
recevoir, de stocker et de fournir à la demande des données à de multiples utilisateurs
indépendants" (définition AFNOR-ISO, dictionnaire de l'informatique, 1989).
2. Les composantes de l’information géographique :
L’information géographique :
Selon Philippe Quodverte, une information géographique est ≪ la représentation d'un
objet ou d'un phénomène réel, localisé dans l'espace à un moment donné ≫. Ceci
signifie qu’un SIG stocke, traite et restitue des informations localisées, c’est-à-dire des
données spatiales ou spatio-temporelles si elles sont référencées dans le temps.
L’information géographique sur un objet géographique se décompose généralement
dans les SIG selon trois composantes : géométrique, sémantique et topologique :
- La composante géométrique
- La composante sémantique
- La composante topologique
1
Présentation des bases de données
A. La composante géométrique :
Elle correspond à la représentation de l’emprise el liaison au sol de l’information
géographique. Elle décrit :
− la localisation de l’information, sous forme de coordonnées (x,y,(z)),
par rapport à un système de référence (cf. figure A.1.9),
− la morphologie de cette emprise, sa forme. Elle comprend des paramètres tels que la surface, le
périmètre, etc.
Fig.1. la composante attributaire et graphique (entité) d’un objet géographique
Fig.2. Source de l’information géographique
Il existe deux modes de représentations informatiques pour implémenter la composante
géométrique sous forme de données :
2
Présentation des bases de données
- le mode raster (ou matriciel)
- et le mode vecteur.
Les modes de représentation (matriciel ou raster):
a) Le mode raster, aussi appelé matriciel, décompose l’image sous forme :
- d’une matrice
- ou d’une grille et associe une valeur à chaque carré élémentaire − pixel (fig. A.1.10).
Cette valeur peut être :
- un niveau de gris,
- une couleur (comme dans les ortho photographies aériennes ou satellitaires, les cartes
scannées).
- Elle peut aussi correspondre à une radiométrie en infrarouge ou radar ou encore à toute
autre valeur comme une altitude ou un nombre d’habitants (on appellera ici ces images :
des images sémantiques) (fig. 3) :
Figure 3. Exemples d’images raster
3
Présentation des bases de données
b) Le mode vecteur :
le mode raster utilise une grille pour décomposer la représentation en cellules
élémentaires. Il se fonde sur trois éléments géométriques :
- le point,
- la polyligne
- et le polygone (fig. 4).
Figure 4. Les élémentaires géométriques du mode vecteur
4
Présentation des bases de données
c) Avantages respectifs de chaque mode de représentation
Mode vecteur
- Volume de stockage compac
- Structure de données complexe
- Mise en oeuvre facile de la topologie
- « Saisie » possible des objets
- Ne contient que les informations spécifiées
- Collecte des informations de mise à jour
- Croisement thématique plus complexe
Mode raster
- Volume de stockage important
- Structure de données simple
- Mise en œuvre difficile de la topologie
- On ne «saisit » que des pixels
- Exhaustivité des photographies raster
- Rapidité de la mise à jour
- Croisement thématique simple
B. La composante sémantique
5
Présentation des bases de données
La composante sémantique regroupe toutes les informations descriptives thématiques codées
sous forme de caractères :
- (ex. : nombre de bâtiments,
- sens de circulation,
- taux de pollution, nom, etc.),
- mais aussi d’images (ex. : photo de la façade),
- de sons,
- de films.
La composante géométrique et la composante sémantique associées à chaque information
géographique n’ont pas toutes la même importance relative.
- Il existe en effet des informations géographiques essentiellement sémantiques. Dans ce
cas, la composante géométrique se réduit à un point tandis que la composante
sémantique comporte un très grand nombre d’informations (par exemple, dans les DDE
(Directions Départementales de l’Equipement) l’application-SIG gère les accidents sous
forme de ponctuels associés à près de 300 attributs).
- A l’inverse certaines données sont essentiellement géométriques et contiennent peu
d’informations sémantiques
C. La composante topologique
La composante géométrique est une information de positionnement absolu lié à un
référentiel.
alors que la composante topologique est une information sur le positionnement relatif
des objets entre eux.
- Elle regroupe les informations topologiques qui sont, par définition mathématique, des
« informations constantes par homéomorphisme qui entrent dans une analyse spatiale »
- elle porte sur la géométrie, mais ne concerne que les propriétés comme :
- l’intersection,
- l’inclusion,
- la connexion.
Suivant les bases de données et les logiciels de SIG, cette composante, fondamentale pour
toutes les applications de diffusion et de propagation.
6
Présentation des bases de données
Figure 5. Cycle des différents usages des SIG.
3. Modélisation :
Qu'est-ce que le modèle d'une base de données géographiques?
La réalité d'un territoire peut être représentée (on dit aussi "modélisée") par une base de
données géographiques décrivant tous les objets ou phénomènes présents sur ce
territoire, ainsi que les relations entre ces objets.
Ce modèle de la réalité est en fait une schématisation du monde réel, dont la complexité
est trop grande pour être tout entière représentée par une ou même plusieurs bases de
données géographiques. De plus, comme pour les cartes, la description des objets dans
les bases de données est étroitement liée à l'échelle de représentation à laquelle on
travaille.
4. Catégories descriptives de l’information géographique
Toute base de données représente une modélisation particulière de la réalité, et donc
une généralisation plus ou moins poussée de celle-ci. Comment décrire les objets localisés
sous forme numérique ?
De même que sur une carte, interviennent trois catégories de descripteurs :
- la nature et les attributs de l'objet,
- la localisation
- et la forme de l'objet et les relations de construction
a- la nature et les attributs de l'objet (la sémantique), comme ceux qui sont définis dans la
légende et les écritures de la carte, mais qui peuvent être beaucoup plus complets et précis,
b- la localisation (x y z)
c- et la forme de l'objet (la géométrie), pour laquelle on définit trois formes principales de
représentation :
7
Présentation des bases de données
- point,
- ligne
- et surface,
Pour être plus précis, on distingue trois types de relations entre objets :
- Les relations spatiales
- Les relations de composition :
- Les relations sémantiques : lexicologies
i. Les relations spatiales : Les plus évidentes (certaines) sur une carte, comme :
- deux bâtiments voisins (adjacence),
- ou deux routes qui s'intersectent (connectivité),
- ou une ouverture incluse dans une forêt ;
On les appelle aussi relations topologiques (logique de l'espace), les termes utilisés pour les
formes graphiques élémentaires dans la théorie des graphes étant : polygones (ou faces,
pour les surfaces), arcs (limites des polygones) et nœuds (extrémités des arcs).
ii. Les relations de composition :
La plupart des objets, relativement complexes, sont en fait constitués d'objets plus
simples, comme on le voit souvent sur une carte.
8
Présentation des bases de données
Par exemple, un aéroport est composé de pistes, de bâtiments, d'espaces en herbe
(végétation) etc.
Ces relations de composition décrivent l'appartenance d'un objet à un autre objet. Les
objets dits "élémentaires" sont ceux qui se construisent directement avec leurs
formes géométriques (relations de construction) ; cette notion dépend de l'échelle à
laquelle on travaille :
iii. Les relations sémantiques : lexicologies
Les relations sémantiques décrivent toutes les autres sortes possibles de relations
logiques entre objets : elles portent généralement sur la fonction ou les attributs des
objets.
Exemples :
- tel cours d'eau est affluent de tel autre,
- tel bâtiment appartient à tel propriétaire,
- telle route franchit telle voie ferrée, etc..
Ces relations peuvent être aussi nombreuses et détaillées.
5. Comment interroge-t-on une base de données géographique ?
Requête :
Toutes les questions que l'on peut poser à une carte doivent pouvoir être traitées de même
à l'aide d'une base de données géographique.
De plus, celle-ci peut répondre à des questions beaucoup plus complexes, grâce à la
richesse des attributs et à la souplesse des relations entre objets, notamment sémantiques
et topologiques.
Exemples, en allant du plus simple au plus compliqué :
Où se trouve la commune Texenna ?
Où se trouvent tous les bâtiments de la commune de Texenna ?
Quels sont les bâtiments situés à moins d'1 km de la mosquée de Texenna ?
Quels sont les bâtiments de plus de 2 étages et situés à moins d'1 km de la mosquée ?
Quels sont les bâtiments de plus de 2 étages, situés à moins d'1 km de la mosquée,
construits depuis plus de 10 ans et comprenant une cour intérieure ?
9
Présentation des bases de données
On distingue les requêtes attributaires (qui portent sur les attributs des objets) et les requêtes
spatiales (qui portent sur les relations de construction ou topologiques), ces dernières étant
propres à l'information géographique et exigeant des développements spécifiques.
- Select par attribut
- Select par entité
6. Comment gère-t-on une base de données ?
Gestion
Une base de données doit pouvoir être gérée automatiquement, c'est-à-dire modifiée en
fonction des mises à jour successives des données, résultant des changements continus qui
interviennent dans la vie courante :
Aménagement, Géorisque, construction, urbanisation, sècheresse, etc.
Il faut, non seulement, modifier, ajouter ou supprimer des objets, mais mettre à jour
toutes leurs relations mutuelles.
Les systèmes de gestion de bases de données (SGBD) doivent assurer les fonctions suivantes :
a) manipulation des données : recherche, modification, insertion ou suppression de données.
La sélection des données doit pouvoir se faire soit selon un critère géographique (la zone
d'intérêt), soit selon un critère thématique (les thèmes choisis),
b) maintien de l'intégrité des données,
c) respect du secret des données : suivant les cas, les données appartiennent à des utilisateurs
différents, qui n'ont pas tous les mêmes droits d'accès,
d) coïncidence d'accès : plusieurs utilisateurs doivent pouvoir accéder aux données en même
temps. Les mises à jour sont sériées de façon à assurer en permanence la cohérence de la
base,
e) sécurité de fonctionnement : le SGBD doit assurer la sauvegarde des données en cas de
panne (matériel ou logiciel).
7. Le concept de SIG :
Un système regroupant :
une problématique (décrire, stocker, comparer, comprendre, communiquer, simuler..)
10
Présentation des bases de données
du matériel (ordinateurs, périphériques, réseaux…)
des logiciels (logiciels SIG du marché, développements professionnels spécialisés)
des données (génériques, spécifiques)
du savoir-faire et des hommes
décider, prévoir, simuler = Outil d’aide à la décision :
les informations sont stockées de façon claire et définitive
organiser des connaissances thématiques
gérer le partage de l’information
gérer une multiplicité d'informations attributaires sur des objets
comprendre les phénomènes, prévoir les risques (simulations)
établir des cartographies rapides
localiser dans l'espace et dans le temps
réagir rapidement après des évènements ayant un impact sur le territoire
calculer des coûts ou des bénéfices
associer un plus grand nombre de partenaires aux choix d’aménagement
Généralement, les utilisateurs des SIG font plutôt :
- de la gestion
- de l’aménagement
- de la recherche
11
Présentation des bases de données
Bibliographie :
- Patricia Bordin : Méthode d’observation multi-niveaux pour le suivi de phénomènes géographiques
avec un SIG : thèse de doctorat : Université de Marne-La-Vallée, décembre 2006, Laboratoire
COGIT
- David GADIOU, 2012 : SIG et représentation de données complexes, Centre régional associe de
Poitou-Charentes, CNAM - ENG111 :
- [Link]
Dr : Hamadou Noureddine
12