1
Sommaire partie
Introduction
Différences entre le HTML et le XML
Structure générale d'un document XML
Les éléments de base : Balises et Attributs
2
Introduction
Familles des langages de balisage: SGML, HTML, XML.
SGML (Standard Generalized Markup Language, langage de balisage standard généralisé), premier
essai pour structurer un document électronique.
• Difficile d’apprentissage
• Complexe d’emploi
HTML (HyperText Markup Language) : langage prédominant pour structurer les pages web. Dérive du
SGML
• Mélange le fond et la présentation (la forme) i.e. la sémantique du contenu est perdue.
XML (eXtensible Markup Language, Langage de balises extensibles), dérive du SGML et répond a un
besoin fondamental a savoir :
• Séparation stricte entre contenu et présentation
• Simplicité, et extensibilité 3
Le XML et le HTML sont deux langages distincts!
SGML
1986
HTML XML
1991 1998
Le XML décrit, structure, échange des données tandis que le Html ne fait qu'afficher des données.
Le XML est extensible et permet de créer ses propres balises en fonction des données traitées. En
Html, les balises sont prédéfinies et donc figées. (XML est un générateur de langages)
Objectif principal
HTML se concentre sur l'affichage des données.
XML se concentre sur le transport des informations.
le XML n'est pas le successeur du Html. Le XML n'est pas le remplaçant du Html. 4
Structure générale d'un document XML
La structure globale d'un document XML est immuable (reste identique). Elle comprend toujours les
constituants suivants.
• permet d'indiquer la version de la norme XML utilisée pour créer le
document (cette indication est obligatoire).
• le jeu de caractères utilisé dans le document (encodage)
Prologue
<?xml version="numéro de version" encoding="encodage des caractères"?>
<?xml version="1.0" encoding="UTF-8"?>
<name>
<lettre>
Arbre des Eléments Contenu de l’elément name
Contenu du <expéditeur>moi</expéditeur>
document
</name> </lettre>
5
Les éléments de base : Balises et Attributs
Les Balises : On distingues 2 types , balises paires et balises unique
<balise> je suis le contenu </balise>
Une balise par paires peut contenir une valeur simple comme par exemple une chaîne de caractères, un nombre
entier, un nombre décimal, etc.
<balise1>Ceci est une chaîne de caractères</balise1>
<balise2>10</balise2>
Une balise par paires peut également contenir une autre balise. On parle alors d’arborescence
<balise1>
<balise2>10</balise2>
</balise1>
<balise1>
Ceci est une chaîne de caractères
une balise par paires peut contenir un <balise2>10</balise2>
mélange de valeurs simples et de balises 7.5
</balise1>
6
Les éléments de base : Balises et Attributs
Toute balise ouverte doit être fermée avant la fermeture de sa balise "père". Autrement dit, les
balises doivent être fermées dans l'ordre inverse de leur ordre d'ouverture.
En XML il est interdit de chevaucher les balises
<balise1><balise2>Ceci est une chaîne de caractères</balise1></balise2>
<message>
<contenu>mon message</contenu>
</message>
incorrect correct
<message> <message>
<contenu> <contenu>
</message> </contenu>
</contenu> </message>
7
Les éléments de base : Balises et Attributs
Les attributs :Un attribut peut se décrire comme une option ou une donnée cachée.
<xxxxx attribut1=’1’>
<prix devise="dinar">
Une balise peut contenir 0 ou plusieurs attributs.
<xxxxx attribut1=’1’ attribut2=’2’>
<prix devise= "dinar" moyen_paiement="chèque"> </prix>
La valeur d’un attribut doit impérativement être délimitée par des guillemets, simples ou doubles.
Dans une balise, un attribut ne peut-être présent qu’une seule fois.
<!-- Ceci est un commentaire ! -->
8
Exemple de fichier XML : un courriel
<?xml version="1.0" encoding="ISO-8859-1"?>
Date: Mar, 28 Oct 2003 [Link] +0100
<email>
(CET)
<entête>
<date type="JJMMAAAA">28102003</date>
De : Smail <smail@[Link]> <heure type="24" local="(GMT+01 :00)">[Link]</heure>
A : Walid walid@[Link] <expéditeur>
<adresse mail="smail@[Link]">Smail</adresse>
Sujet: Mariage </expéditeur>
<récepteur>
<adresse mail="walid@[Link]">Walid</adresse>
Salut,
</récepteur>
Pourrais-tu me rappeler la date de ton <sujet>Mariage</sujet>
anniversaire ? </entête>
A très bientôt, <corps>
Smail <salutation>Salut,</salutation>
<paragraphe>Pourrais-tu me rappeler quelle est la date de ton anniversaire?</paragraphe>
<politesse>A très bientôt,</politesse>
<signature>Smail</signature>
</corps>
</email>
9
Quel intérêt à utiliser XML ?
Vous aurez remarqué que notre exemple ci-dessus est humainement compréhensible.
Grâce aux balises, l'ordinateur est également capable d'en traiter le contenu (et de bien séparer les
informations).
C'est un des avantages du XML: c'est l'un des rares formats qui peut être à la fois lu par un humain
et par un ordinateur.
10