XML
Origine de XML
Standard Generalized Markup
Language ( Spare les donnes
la structure des donnes et la
mise en forme )
Hyper Text Markup Language
( Mlange les donnes et la mise
en forme )
eXtensible Markup Language
( Spare les donnes la structure
des donnes et la mise en
forme )
Les systmes dinformations et XML
XML
XML est un langage dchange de donnes structurs
entre applications de diffrents systmes dinformations.
Les donnes dun fichier XML sont organise dune
manire hirarchique.
(Documents XML Dynamiques) : Les donnes dun fichier
XML peuvent provenir des bases de donnes.
( Documents XML Statiques ) : Les fichiers XML sont
galement utiliss en tant que fichiers de configuration
dune application.
Pour lire un fichier XML, une application doit utiliser un
parseur XML.
Un parseur XML est une API qui permet de parcourir un
fichier XML en vue den extraire des donnes prcises.
4
XML
Le parseur XML permet de crer une structure
hirarchique contenant les donnes contenues
dans le document XML.
Il existe deux types de parseurs XML:
DOM (Document Object Model) : permet daccder et
dagir dune manire directe sur le contenu et la
structure de larbre XML.
SAX (Simple API for XML) : permet de ragir sur le
contenu et la structure dune document XML pendant
une lecture squentielle.
Correspondance entre XML et Bases
de donnes relationnelles
Structure dun document XML
Un document XML se compose de 3 fichiers :
Le
fichier XML stocke les donnes du document sous forme
dun arbre.
DTD ( Data Type Definition ) ou Schmas XML dfinit la
structure du fichier XML.
La feuille de style dfinit la mise en forme des donnes de la
feuille
xml
7
Exemple
Intrts
Sparation stricte entre contenu et
prsentation
Simplicit, universalit et extensibilit
Format texte avec gestion des caractres
spciaux
Structuration forte
Modles de documents (DTD et Schmas
XML)
Format libre
Sparation stricte entre contenu et
prsentation
Un mme contenu peut tre rendu de faons trs
diffrentes.
Un ouvrage peut, par exemple, se prsenter
comme :
un livre imprim .
une collections de pages WEB.
Le contenu est constitu, au dpart, de textes et
d'illustrations mais aussi de liens entre ces
lments.
Un des premiers principes de XML est d'organiser le
contenu
de
manire
indpendante
de
la
prsentation
10
Syntaxe de XML
Le langage XML est un format orient texte.
Un document XML est une suite de caractres
respectant quelques rgles.
Ces informations sont stockes dans un fichier.
Ces fichiers sont gnralement manipuls par
des logiciel utilisant un codage des caractres.
Ce codage prcise comment traduire chaque
caractre en une suite d'octets.
Les diffrents codages possibles et leurs
incidences seront abordes dans la suite de ce
cours.
11
Exemple
<?xml version="1.0" encoding="iso-8859-1"?>
<!-- Time-stamp: "bibliography.xml 3 Mar 2008
16:24:04" -->
<!DOCTYPE bibliography SYSTEM
"bibliography.dtd" >
<bibliography>
<book key="Michard01" lang="fr">
<title>XML langage et
applications</title>
<author>Alain Michard</author>
<year>2001</year>
<publisher>Eyrolles</publisher>
<isbn>2-212-09206-7</isbn>
<url>http://www.editionseyrolles/livres/michard/</url>
</book>
...
</bibliography>
12
1. Entte XML avec la version 1.0 et l'encodage
iso-8859-1 des caractres.
2. Commentaire dlimit par les chanes de
caractres <!-- et -->.
3. Dclaration de DTD externe dans le fichier
bibliography.dtd.
4. Balise
ouvrante
de
l'lment
racine
bibliography
5. Balise ouvrante de l'lment book avec deux
attributs de noms key et lang et de valeurs
Michard01 et fr
6. Balise
fermante
de
l'lment
racine
bibliography
Caractres
La norme utilise recense tous les caractres
des langues connues et tous les symboles
utiliss dans les diffrentes disciplines.
Ces caractres peuvent tre:
13
Caractres spciaux:
Caractres d'espacement
Jetons (tokens) et noms XML
Syntaxe et structure
Pour qu'un document XML soir correct, il
doit d'abord tre bien form et, ensuite,
tre valide.
La diffrence essentielle avec les langages
naturels est que la grammaire d'XML n'est
pas fige.
Composition globale d'un document:
14
Prologue
Le prologue contient:
l'entte XML qui prcise entre autre la version de
XML et le codage du fichier.
la dclaration du type du document (DTD) qui
dfinit la structure du document.
Exemple:
15
Entte XML
L'entte XML a la forme gnrale suivante:
<?xml version="..." encoding="..." standalone="..."?>
L'attribut version prcise la version d'XML utilise:
L'attribut encoding prcise le codage des caractres
utilis dans le fichier.
Valeurs possibles : 1.0 /1.1
les valeurs possibles sont US-ASCII, ISO-8859-1, UTF-8, et
UTF-16 (minuscules ou majiscules ).
L'attribut standalone prcise si le fichier est autonome,
c'est--dire s'il existe des dclarations externes qui
affectent le document.
Les valeurs possibles sont : no/yes
16
Corps du document
Le corps du document est constitu de son
contenu qui est organis de faon hirarchique
L'unit de cette organisation est l'lment.
Chaque lment peut contenir du texte simple,
comme un fichier, d'autres lments, comme
un rpertoire, ou encore un mlange des deux.
Elment:
17
Attributs
Les balises ouvrantes peuvent contenir des attributs
associs des valeurs.
L'association de la valeur comme syntaxe
attribute='value' (ou la forme attribute="value") o
attribute et value sont respectivement le nom et la
valeur de l'attribut.
Chaque balise ouvrante peut contenir zro, une ou
plusieurs associations de valeurs des attributs
comme dans les exemples gnriques suivants.
Exemples
18
<tag attribute="value"> ... </tag>
<tag attribute1="value1" attribute2="value2">
</tag>
...
Attributs particuliers
Attribut xml:lang
Attribut xml:space
Attribut xml:base
19
Document XML bien form
Un document bien form doit obir aux rgles
suivantes:
20
Possder une seule racine
Tous ces lments doivent tre ferms
Les lments contenus et contenant doivent tre
imbriqus.
La valeurs des attributs s'crit entre guillemet
Exercices
Document
<?xml version="1.0" ?>
<formation> Master</formation>
<dure>1755 heures</dure>
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure> 1755 heures</dure>
</formation>
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755">
</formation>
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755" />
21
</formation>
Bien
form
Mal
form
Exercices
Document
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755" />
<module id="100">
<sequence id="525">
</module>
</sequence>
</formation>
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755" />
<module id="100">
<sequence id="110></sequence>
</module>
</formation>
22
Bien
form
Mal
form
Exercices
Document
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755" />
<module id="100"></module>
<module id="110"></module>
</formation>
<?xml version="1.0" ?>
<formation>
<nom>Master</nom>
<dure valeur="1755" />
<module id="100"></module>
<module id="110"></module>
</formation>
23
Bien
form
Mal
form