R DF
Baseman 1
Sommaire
Présentations
(RDF/XML, N3,
Modèle De Déclarations N-triples..)
Sous Forme De Graphe
Proposition
Des Littéraux
Utilisation Des URI
& Espace De Noms F
A Typage Des Données
E
Introduction
B D
C Atelier
Introduction
Baseman
Web Sémantique
o Le Web Sémantique « le Web de données » est une extension du Web classique.
o A été inventé par Tim Berners-Lee, co-inventeur du Web et directeur du W3C.
o Facilitant l’automatisation du traitement des connaissances disponibles.
Le Web sémantique est une extension du Web actuel dans
lequel l'information est munie d'une signification bien
définie permettant aux ordinateurs et aux personnes de
mieux travailler en coopération
(T. Berners-Lee, J. Hendler et [Link], Scientific American 2001)
Web Sémantique
Une architecture en couches commune recommandée par le W3C
o La pile des standards est classé en cinq grandes familles:
Interaction
Confiance
Requêtes Raisonnement
Représentation
RDF ‘‘Ressource Description Framework’’
o RDF étant un modèle de données sous forme de graphe
o Propose une interopérabilité entre applications qui partagent des informations sur le Web.
o Le but de RDF est de fournir un cadre de description de données contenues dans des
ressources du Web (principalement des pages Web), sans préjuger à priori sur des domaines
d’applications particuliers, ni sur la sémantique de ces domaines.
o RDF signifie :
• Ressource (Resource): Tout ce qui peut avoir un identifiant unique (URI), par
exemple pages, des lieux, des gens, des chiens, des produits ...
• Description (Description): attributs, les caractéristiques et les relations des
ressources.
• Cadre (Framework): modèle, les langages et les syntaxes pour ces descriptions.
RDF ‘‘Ressource Description Framework’’
Pour faire quoi ?
01 Amélioration de la découverte de ressources sur
le Web.
02 Etablir des catalogues de ressources.
03 Développement d'agents intelligents.
04 Spécifier la sémantique des données d'un
document XML.
Modèle De Déclarations
Sous Forme De Graphe
Baseman
RDF ‘‘Ressource Description Framework’’
Modèle de déclarations
Une déclaration RDF est un triplet ( Sujet, Prédicat, Objet ):
o Un sujet (ressource) : C’est un objet du domaine nommé par un identifiant (URI ou
ressource anonyme)
o Un prédicat (Propriété ) : C’est une relation binaire sur le domaine entre un sujet et
un objet nommé par un identifiant qui est une URI.
o Un objet (valeur) : C’est la valeur du prédicat pour le sujet. Il s’agit soit une
ressource (définie par une URI), soit une ressource anonyme, soit un littéral (chaîne
de caractères ou nombre …)
Prédicat
Sujet Objet
Objet
RDF ‘‘Ressource Description Framework’’
Modèle de déclarations
Exemple 1 :
(Tour Eiffel, est crée, 1887) ; (Tour Eiffel, est située, Paris)
Tour est située
Paris
Eiffel
1887
Utilisation Des URI
&
Espace De Noms
Baseman
RDF ‘‘Ressource Description Framework’’
Utilisation des URI
une URI (Uniform Resource Identifier) : Chaîne de caractère identifiant de façon
unique une ressource ou un concept sur le Web
les URL (Uniform Resource Locator) : URI permettant en plus de localiser (d’accéder) à
la ressource : ftp, mailto, gopher…
Un IRI (Internationalized Resource Identifier) : Fournissent un identifiant pour une
ressource sans implication sur leur localisation ni la manière d’y accéder. La notion d’IRI
est une généralisation des URI qui permet d’utiliser des caractères non-ASCII dans les
chaînes de caractères des IRI.
RDF ‘‘Ressource Description Framework’’
Utilisation des URI
Une URI représente un objet unique et une URL un document Web.
On peut citer les trois façons de représenter une personne sur le Web :
• La personne elle-même : [Link] ;
• Le document RDF de cette personne : [Link] ;
• Le document HTML de cette personne : [Link]
URI
Ressources non accessibles sur le Web
URL
Ressources accessibles sur le Web
RDF ‘‘Ressource Description Framework’’
Utilisation des URI
Exemple de la Tour Eiffel
[Link]
Paris
• ([Link]
[Link] [Link]
[Link] ;
• ([Link]
[Link]
[Link]
/Eiffel_Tower
1887).
[Link]
1887
RDF ‘‘Ressource Description Framework’’
Les préfixes / Espace de Noms
Les préfixes (Name Space)
o L'utilisation des « Name Space » dans les déclarations permet:
Le développement et l'utilisation de vocabulaires partagés sur le Web
Les personnes peuvent découvrir et commencer à utiliser des vocabulaires déjà
utilisés par d'autres
Une compréhension commune des concepts
o « Name Space » est identifié de manière unique par une URI.
RDF ‘‘Ressource Description Framework’’
Les préfixes / Espace de Noms
Exemple
Si le préfixe «dbpedia» est affecté a l’URI «[Link]
Si le préfixe «dbpedia-pays » est affecté a l’URI «[Link]
Si le préfixe «bpedia-date» est affecté a l’URI «[Link]
Alors les URIs seront remplacées par des noms qualifiés (QName) correspondants
dbpedia-pays:location
Dbpedia:Eiffel_
Dbpedia:Paris 1887
Tower
dbpedia-date:startDate
Typage des données
&
Littéraux
Baseman
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Les types de données sont utilisés avec les littéraux RDF pour représenter des valeurs telles
que des chaînes, des nombres et des dates.
Espace lexical
Un type de données se compose d’un : Espace de valeurs
Mappage lexical-à-valeur
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
L' espace lexical d'un type de données est un ensemble de chaînes Unicode.
Le mappage lexical en valeur d'un type de données est un ensemble de paires dont :
Le premier élément appartient à l' espace lexical .
Le deuxième élément appartient à l' espace de valeur du type de données.
Chaque membre de l'espace lexical est associé à exactement une valeur et
constitue une représentation lexicale de cette valeur.
Le mappage peut être vu comme une fonction de l'espace lexical à l'espace de
valeur.
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Exemple :
Le type de donnée qui se trouve dans XML schéma xsd:boolean ou chaque membre de
l’espace de valeurs a deux représentation lexicales est définit comme suit:
Espace lexical: { ‘true’ , ’false’ , ‘1’ , ‘0’ }
Espace de valeur: {vrai ,Faux}
Mappage lexical à la valeur: {< ‘true’ : vrai > ,<‘false’ : faux>,<‘1’ : vrai>,<‘0’ : faux>}
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Les littéraux peuvent être définit par ce type de données xsd:boolean comme suit:
Littéral Valeur
<“ true”, xsd:boolean> vrai
<“ false”, xsd:boolean> faux
<“ 1”, xsd:boolean> vrai
<“ 0”, xsd:boolean> faux
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Les types de données intégrés
Typeau
De schéma
Données XML : Espace De Valeur (informatif)
xsd:boolean Valeur booléenne
avec true ou 1 pour vrai et false ou 0 pour faux
xsd:byte Nombre entier signé sur 8 bits
xsd:unsignedByte Nombre entier non signé sur 8 bits
xsd:short Nombre entier signé sur 16 bits
Types Numériques xsd:int Nombre entier signé sur 32 bits
xsd:long Nombre entier signé sur 64 bits. Ce type dérive du
type xsd:integer.
xsd:integer Nombre entier sans limite de précision. Ce type n'est
pas primitif et dérive du type xsd:decimal.
xsd:float Nombre flottant sur 32 bits conforme à la
norme IEEE 754
xsd:double Nombre flottant sur 64 bits conforme à la
norme IEEE 754
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Type De Données Espace De Valeur (informatif)
xsd:string Chaîne de caractères composée de caractères Unicode
xsd:normalizedString Chaîne de caractères normalisée, c'est-à-dire ne contenant
pas de tabulation, de saut de ligne ou de retour chariot
xsd:token Chaîne de caractères normalisée (comme ci-dessus) et ne
Types Pour Les contenant pas en outre des espaces en début ou en fin ou
Chaînes Et Les des espaces consécutifs
Noms xsd:NCName Nom non qualifié, c'est-à-dire sans caractère ':'
xsd:QName Nom qualifié
xsd:base64Binary Données binaires représentées par une chaîne au format
Base 64.
xsd:hexBinary Données binaires représentées par une chaîne au format
Hex.
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Type De Données Espace De Valeur (informatif)
xsd:time Heure au format hh:mm:ss
xsd:date Date au format YYYY-MM-DD
xsd:dateTime Date et heure au format YYYY-
Types Pour Les Dates Et Les MM-DDThh:mm:ss comme 2008-
Heures 01-16T[Link]
xsd:gMonth Mois du calendrier grégorien au
format MM comme 01 pour
janvier.
xsd:gYear Année du calendrier grégorien au
format YYYY comme 2011
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Littéral:
La cible du graphe RDF peut être une ressource identifiées par un IRI ou un littéral qui
est une simple valeur (un nombre, une date, ...)
Prédicat
ressource ressource
littéral
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Littéral:
Un littéral consiste en deux ou trois éléments :
1. Une forme lexicale : une chaine de caractères Unicode.
2. Un IRI pour le type de données : ça permet de savoir comment interpréter la
chaine de caractère.
3. Quand le type de données est « rdf:langString » on associe un tag de langage au
littéral
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Littéral:
Si on ne donne pas d’IRI de typage, alors le type par défaut est xsd:string, sauf s’il y a un
tag de langage (le type est alors rdf:langString).
“1990-07-04“^^xsd:date
“La Joconde“ @fr
Une fois interprétés , ces éléments permettent d’associer une valeur à la forme syntaxique
du littéral
RDF ‘‘Ressource Description Framework’’
Typage des données & Littéraux
Les littéraux typés
• Un littéral typé RDF est formé en couplant une chaîne à une référence URI qui
identifie un type de données particulier.
• RDF repose sur les types de données de XML Schéma
• La syntaxe utilisée pour typer les littéraux en RDF est: rdf:datatype ="label"
Déclarations
<dbpedia-date:startDate rdf:datatype="&xsd;integer">1887</dbpedia-date:startDate>
<dbpedia-date:startDate
rdf:datatype="[Link]
RDF ‘‘Ressource Description Framework’’
Identification des nœuds anonymes vides
Un nœud anonyme représente, dans un graphe RDF, une ressource anonyme ou,
plus simplement, une URI qui n'existe pas ou qui n'a pas d'identification.
Il est parfois nécessaire de se référer à un nœud anonyme dans le même graphe à
plusieurs endroits, tels qu'en position de sujet et d'objet de plusieurs triplets RDF.
Auquel cas, on peut donner un identificateur de nœud anonyme (blank node
identifier) au nœud anonyme pour l'identifier dans le document.
Exemple : Une page Web a un créateur dont la valeur est Berners-Lee
créateur
Berners-Lee
Syntaxe XML/RDF
Baseman
RDF ‘‘Ressource Description Framework’’
Syntaxe XML/RDF
RDF/XML est une syntaxe définie par le W3C, pour exprimer (sérialiser) un graphique
RDF comme un document XML. RDF/XML est parfois appelé de manière trompeuse
simplement RDF parce qu'il a été introduit parmi les autres spécifications du W3C
définissant RDF et qu'il a été historiquement le premier format standard de sérialisation
RDF du W3C.
RDF ‘‘Ressource Description Framework’’
Syntaxe XML/RDF
o L’élément rdf:RDF est l'élément racine d'un document RDF. Il définit le document
XML comme document RDF. Il contient également les déclarations d’espaces de noms
o L’ élément rdf:Description élément central en RDF/XML car il permet d’écrire des
triplets .
o L’ élément rdf:Description contient l’URI du sujet dans l’attribut rdf:about.
o Les attributs
About : pour se référer à une URI d'une ressource existante.
Id : pour spécifier la création d'une nouvelle ressource.
Le cas où l’objet est une ressource
Dbpedia:Paris
<rdf:Description
rdf:about="[Link]
dbpedia-pays:location
<dbpedia-pays:location
rdf:resource="[Link]
Dbpedia:Eiffel </rdf:Description>
_Tower
Le cas où l’objet est un littéral
dbpedia-date:startDate
<rdf:Description
rdf:about="[Link]
1887 <dbpedia-date:startDate>1887</dbpedia-date:startDate>
</rdf:Description>
RDF ‘‘Ressource Description Framework’’
Syntaxe XML/RDF
o L' espace de noms xmlns: rdf spécifie que les éléments avec le préfixe rdf proviennent de
l'espace de noms "[Link]
o rdf:parseType="Resource" : on ne peut l'utiliser que lorsque le nœud vide est l'objet
d'un triplet RDF
o rdf:datatype ="label" est utilisé pour typer les valeurs littérales. RDF repose sur les types
de données de XML Schéma
Quelques préfixes normalisés :
rdf: adresse URI d'espace de noms : [Link]
xsd: adresse URI d'espace de noms : [Link]
RDF ‘‘Ressource Description Framework’’
Syntaxe XML/RDF
Identification des nœuds anonymes vides
Si l’élément rdf:Description ne contient aucun attribut alors il s’agit d’un nœud vide
On utilise un identificateur de nœud anonyme pour remplacer rdf:about="référence
URI RDF" par rdf:nodeID="identificateur de nœud anonyme".
Syntaxe N3 ,Trutle et N-triples
Baseman
RDF ‘‘Ressource Description Framework’’
NOTION N3
o Le langage N3 développé par Tim Berners Lee
Syntaxe non XML
Vise une manipulation humaine
o Permet l’utilisation des préfixes
o La ressource non abrégée doit être entre < >
RDF ‘‘Ressource Description Framework’’
NOTION N3
Exemple:
Supposons que nous voulions décrire une personne qui s’appelle Michel Gagnon, qui
travaille au département d’informatique de l’université dont la page personnelle se
trouve à l’URL suivante :
[Link]
RDF ‘‘Ressource Description Framework’’
NOTION N3
Supposons donc que les quatre entités de notre description sont désignées de la manière
suivante :
la personne décrite : [Link]
le nom de la personne : "Michel Gagnon"
le lieu de travail : [Link]
la page personnelle : [Link]
RDF ‘‘Ressource Description Framework’’
NOTION N3
Représentant les relations entre ces entités dont le rôle est d’établir un lien entre deux
autres entités
Michel Gagnon
[Link]
[Link]
fs#MichelGagnon
[Link] [Link]
[Link] [Link]
[Link]/[Link] cabulary#dgi
RDF ‘‘Ressource Description Framework’’
NOTION N3
Michel Gagnon local:dgi
• On utilise l’alias local pour le préfixe
[Link]
• Et l’alias prof pour le préfixe Prof:MichelGagnon
[Link]
local :hasHomePage
[Link]
[Link]/[Link]
RDF ‘‘Ressource Description Framework’’
Syntaxe Turtle
o La syntaxe Turtle permet de représenter un graphe RDF de manière flexible et lisible.
o Elle permet de définir et d’utiliser des préfixes.
o Lorsque qu’une ressource est désignée par une URI dans une forme non abrégée, on
la met entre crochets < >. Si on utilise un préfixe, on omet les crochets.
RDF ‘‘Ressource Description Framework’’
Syntaxe Turtle
@prefix local: [Link]
@prefix prof: [Link]
prof: MichelGagnon local : hasHomePage.
< [Link] >.
prof: MichelGagnon local : hasName "Michel Gagnon".
prof: MichelGagnon local : worksAt local : dgi.
RDF ‘‘Ressource Description Framework’’
Syntaxe Turtle
@prefix local: [Link]
@prefix prof: [Link]
prof: MichelGagnon
[ ] local : hasHomePage < [Link] >;
local : hasName "Michel Gagnon " ;
local : worksAt local : dgi.
prof: MichelGagnon
[local : hasHomePage < [Link] >;
local : hasName "Michel Gagnon " ;
local : worksAt local : dgi ].
RDF ‘‘Ressource Description Framework’’
Syntaxe N-Triples
N-Triples est un sous-ensemble de Turtle facile à analyser et à générer par les logiciels.
Chaque ligne représente un triplet qui est une séquence de termes RDF représentant
le sujet, le prédicat et l'objet d'un RDF Triple.
Si le sujet, le prédicat ou l’objet est une URI, on le représente en mettant entre
crochets <> , s’ils sont des nœuds vides, on utilise la forme _:nom.
N-Triples est souvent utilisé pour échanger de grandes quantités de données RDF et
pour traiter de grands graphes RDF avec des outils de traitement de texte ligne-à-ligne.
RDF ‘‘Ressource Description Framework’’
Syntaxe N-Triples
L'instruction triple la plus simple est une séquence de termes (sujet, prédicat, objet),
séparés par des espaces et terminés par ' .' après chaque triple.
Exemple
<[Link] <[Link]
<[Link] > .
<[Link] <[Link] >
<[Link] .
<[Link] <[Link] "MichelGagnon".
RDF ‘‘Ressource Description Framework’’
Syntaxe N-Triples
Les nœuds vierges RDF dans N-Triples sont exprimés comme _:suit, suivis d'une
étiquette de nœud vierge qui est une série de caractères de nom.
Exemple :
Si le nœud dénoté par l’URI http: //[Link]/Profs#MichelGagnon était un nœud
vide, on aurait la présentation suivante :
_:p234 <[Link] <[Link] > .
_:p234 <[Link] > <[Link] .
_:p234 <[Link] "Michel Gagnon" .
RDF ‘‘Ressource Description Framework’’
Conteneurs RDF
• Un conteneur est une ressource qui contient des choses (objets).
• Les Objets contenues s'appellent des membres.
• RDF définit trois types de conteneurs : Bag, Seq et Alt
• Pour dire qu’une ressource est un conteneur :
Préciser le rdf:type de la ressource : Bag, Seq ou Alt
Décrire les membres du conteneur à l’aide du prédicat rdf:_i (i étant
un entier supérieur à 0)
RDF ‘‘Ressource Description Framework’’
Conteneurs RDF
L'élément <rdf: Bag>
Représente un groupe de ressources ou littéraux, comprenant éventuellement des
membres en double, où l'ordre des membres n'a aucune importance
L'élément <rdf: Seq>
Représente un groupe de ressources ou littéraux, pouvant contenir plusieurs fois les
mêmes valeurs, dans un ordre particulier.
L'élément <rdf: Alt>
Représente un groupe de ressources ou littéraux qui sont des alternatives. (l'utilisateur
ne peut sélectionner qu'une seule des valeurs).
RDF ‘‘Ressource Description Framework’’
Conteneurs RDF
Exemple Bag
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="[Link]
<rdf:Bag rdf:about="Fruits">
<rdf:li rdf:resource="Banane"/>
<rdf:li rdf:resource="Orange"/>
<rdf:li rdf:resource="Fraise"/>
</rdf:Bag>
</rdf:RDF>
Atelier
Baseman
Atelier
Soit la situation suivante :
La cathédrale d’Amos se situe en Abitibi et a été conçue par l’architecte Aristide
Beaugrand Champagne (1876-1950). La construction débute en 1922 et est
complétée en 1925. En 1954, elle est pourvue d’un orgue de Casavant et Frères.
Aristide Beaugrand
Abitibi Champagne
1876
1950
1922
Cathédrale
d’Amos
1925
1954
pourvue d’un
Orgue de Casavant et Frères