0% ont trouvé ce document utile (0 vote)
163 vues28 pages

Charte Numerisation

Transféré par

Meriem Bentazir
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
163 vues28 pages

Charte Numerisation

Transféré par

Meriem Bentazir
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Bibliothèque nationale de France

CHARTE DE NUMERISATION

Documents iconograhiques

Documents imprimés

Presse

Prises de vue

Indexation

Livraisons

Contrôles qualité

Bibliothèque nationale
de France

Direction des Services et des Réseaux Février 2009


Département de la Conservation référence : BnF-ADM-2008-068449-01
Service numérisation
SOMMAIRE

1. RECOMMANDATIONS DE PRISE DE VUE ................................................................. 4


1.1 NUMERISATION DES DOCUMENTS ICONOGRAPHIQUES ...............................................................4
1.1.1 Choix de la profondeur d’acquisition (couleur, niveau de gris, noir et blanc)................................ 4
1.1.2 Choix des résolutions et des mires ...................................................................................... 5
1.1.2.1 Résolutions ................................................................................................................................... 5
1.1.2.2 Mires et profils ICC ...................................................................................................................... 5
1.1.3 Définition de l’organisation des prises de vues...................................................................... 5
1.2 IDENTIFICATION DES IMAGES ....................................................................................................6
1.3 NUMERISATION DES IMPRIMES ET DE LA PRESSE ........................................................................7
1.3.1 Choix de traitement couleurs, niveaux de gris, noir et blanc. .................................................... 7
1.3.2 Résolution et format....................................................................................................... 8
1.3.3 Utilisation de mires de couleur .......................................................................................... 8
1.3.4 Règles de prise de vue ..................................................................................................... 8
2. IDENTIFICATION DES DOCUMENTS ET ORGANISATION DES METADONNEES ...... 9
2.1 IDENTIFICATION DES ORIGINAUX LORS DES TRANSFERTS ...........................................................9
2.2 IDENTIFICATION DES DOCUMENTS NUMERIQUES .......................................................................9
2.3 METADONNEES INTERNES DES IMAGES ......................................................................................9
2.4 FICHIER DE METADONNEES REFNUM ......................................................................................10
2.4.1 Structure générale du fichier refNum : ...............................................................................10
3. LIVRAISONS ............................................................................................................13
4. CONTROLES ET CONFORMITE DE LA PRODUCTION SOUS-TRAITEE ....................13
4.1 DESCRIPTION DES PHASES DE MISE EN PLACE ET TESTS, ET GALOP D’ESSAI................................15
4.2 GESTION DE LA QUALITE EN PHASE DE PRODUCTION COURANTE ..............................................15
4.2.1 Audits et suivi des indicateurs de production ..........................................................15
4.2.2 Contrôles des livraisons ..........................................................................................15
4.3 NIVEAUX DE QUALITE EXIGES PAR LA BNF ...............................................................................16
Erreurs majeures..............................................................................................................................16
Erreurs mineures .............................................................................................................................17
5. ANNEXES ................................................................................................................18
5.1 DESCRIPTION DES FORMATS DE FICHIER TIFF.........................................................................18
5.2 REGLES A APPLIQUER POUR ETABLIR LA TABLE DE CORRESPONDANCE .......................................21
6. STRUCTURE DETAILLEE DU FICHIER REFNUM .....................................................24

2
PREAMBULE

Les documents conservés dans les collections de la BnF relèvent du patrimoine national et à ce titre
doivent être sauvegardés, certains d’entre eux sont rares ou précieux. Ils présentent des
caractéristiques physiques très diverses, tant en termes de dimensions et de présentation que de tenue
mécanique et d’état de conservation.
Cette diversité a des effets sur le type de projet à mettre en place et sur l’ensemble de la chaîne de
production (choix des matériels, de la résolution, des formats, des règles d’indexation, etc).

La réalisation d’un programme de numérisation implique la mise en place d’une chaîne de production
assurant les prestations suivantes :
- numérisation en noir et blanc, et/ou niveaux de gris et/ou en couleurs
- identification des images
- création du fichier de métadonnées identifiant chaque document et chaque image
- enregistrement des données images et des fichiers associés en vue de leur livraison
- Contrôle qualité

Le présent document fixe les choix et règles techniques essentiels de numérisation appliqués par la
BnF.
Il est rédigé et mis à jour par le Service Numérisation du Département de la Conservation (Direction
des Services et des Réseaux) et destiné à tout établissement et tout individu souhaitant mieux
connaître les spécifications techniques de la BnF.

Note : ne couvrant pas tous les points techniques d’une action de numérisation, cette charte ne peut se
substituer à un cahier des clauses techniques particulières (CCTP) dans une procédure d’appel d’offres
ou à une procédure technique d’un marché. Cette charte n’a aucune valeur contractuelle : seuls font foi
les documents composant un appel d’offres. Les recommandations qu’elle préconise ne sont
applicables qu’à la numérisation en mode image des documents iconographiques et imprimés
(monographies, périodiques, et presse). Elles sont extraites des spécifications utilisées dans les
marchés de numérisation ainsi que des documents internes de la BnF. D’autres documents disponibles
sur le site internet de la BnF concernent les traitements spécifiques d’OCR et de conversion des tables
des matières.

Cette charte indique les :


- règles de prise de vue selon les caractéristiques des documents
- paramètres de numérisation et formats des images TIFF
- métadonnées associées, constitution des documents numériques
- règles et structure de livraisons
- modalités de suivi de la qualité appliquées par la BnF

Les spécifications suivantes ont été établies en tenant compte des contraintes de numérisation, de
l’état actuel de la normalisation, de la nécessité d’assurer un archivage à long terme des documents
numériques, sans ignorer les contraintes économiques induites. Ces règles participent donc à une
conservation à long terme des données numériques archivées.

3
1. RECOMMANDATIONS DE PRISE DE VUE

Les choix de résolution de la BnF appliqués à chaque type de document ont été faits selon l’état de l’art,
la nécessité de pérenniser les documents numériques et l’accès aux données, ainsi que les coûts
induits.

Il en résulte la répartition générale suivante :

Iconographie (dont Presse Imprimés


manuscrits)
Résolution 400 à 600 dpi 400 dpi 400 dpi

Format d’archivage TIFF v6 non compressé TIFF v6 non compressé TIFF v6 compression UIT
groupe 4
Post traitements Redressement Recadrage sans Recadrage sans tronquer
Recadrage sans tronquer tronquer d’informations d’informations
d’informations

1.1 Numérisation des documents iconographiques

Cette filière comprend tous les documents iconographiques au sens propre du terme (estampes, cartes,
photographies, maquettes, etc.), les manuscrits et certains imprimés exceptionnels (voir §1.2).

1.1.1 Choix de la profondeur d’acquisition (couleur, niveau de gris, noir et blanc)

La numérisation en couleur répond à des attentes de plus en plus fortes des usagers, mais présente
plusieurs contraintes significatives :
- le poids d’un fichier couleur est 3 fois plus important qu’en niveaux de gris
- les matériels de numérisation couleurs sont plus chers que ceux permettant de faire uniquement de la
numérisation en noir et blanc et niveaux de gris.

Les règles suivantes appliquées par la BnF peuvent éclairer les décisions à prendre lors de l’instruction
d’un projet de numérisation :

- Les documents iconographiques sont numérisés en couleur, même si l’original est


monochrome, sauf si le résultat obtenu n’est plus conforme au document original : exemple des
positifs de projection noir et blanc qui, numérisés en couleur, prennent une teinte sépia que l’on
ne retrouve pas sur l’original

- Les manuscrits sont numérisés en couleurs ou niveaux de gris, sauf les manuscrits de réserve
qui sont faits en couleurs. Pour les autres manuscrits, la couleur est choisie si le document
présente des illustrations ou des écritures couleurs ne pouvant pas être dégradées en niveaux
de gris sans perte de lisibilité et de conformité à l’original. Il n’y a également pas de
systématisme à faire une couverture complète en couleurs : si quelques folios seulement
nécessitent la couleur, le reste du manuscrit peut être traité en niveaux de gris.

4
1.1.2 Choix des résolutions et des mires
1.1.2.1 Résolutions

Les modalités d’application des résolutions sont les suivantes :

Format Résolution cas Cas d’exception


général
≤ A6 400 dpi et 600 dpi Résolution courante à 400 dpi et à 600dpi si
le document présente des variations
Documents
importantes de format, d’informations
opaques
(enluminures, toponymes, etc), ou des
objets associés (écrin, coffret, etc)
< A6 600 dpi
Reproductions (ex : 400 ou 600 dpi Mêmes recommandations que pour les
microfilms, sur l’échelle 1 de opaques
microfiches) l’original
Originaux Test préalable Cette recommandation donne en général de
Documents transparents (plaques pour définir la bons résultats puisqu’elle s’appuie sur un
transparents de verre, résolution agrandissement de 8 d’un négatif photo.
autochromes…) et adaptée Une diapositive 24X36 devrait être
reproductions dont Règle : 1000 numérisée à 2400 X 3600. Sa limite sera la
l’échelle de réduction points au cm capacité des numériseurs qui ne permettront
est inconnue pas toujours d’utiliser des résolutions aussi
élevées ainsi que les capacités d’archivage
de la bibliothèque

1.1.2.2 Mires et profils ICC

Le profil ICC Adobe 98 inscrit dans tous les fichiers est nécessaire mais doit être complété par une mire
de couleur.

La mire numérisée tous les matins avant début de la production est insérée pour un document dans son
intégralité, pas pour chaque vue de ce document.
Si le document doit être traité sur plusieurs jours, le photographe s’assurera que les conditions
d’éclairage et de prises de vues sont homogènes pour l’ensemble des jours et il choisira la mire du jour
où le plus grand nombre de prises de vues aura été réalisé.
Cette mire du jour implique une homogénéité des conditions de prises de vues sur la journée. En cas
de changement dans les réglages pouvant entraîner une modification du rendu coloré, une nouvelle
mire sera produite.

La Mini charte Color Checker est retenue. Elle sera numérisée dans les mêmes conditions que les
documents reproduits et sera réduite en 600X800 pixels.

1.1.3 Définition de l’organisation des prises de vues

Les règles de numérisation de la BnF répondent au principe du respect strict de l’original :

1) Matériel
Selon les cas, un plateau aspirant ou une glace sont utilisés pour maintenir les documents à traiter et
assurer une numérisation optimum. Leur utilisation est faite en adoptant toutes les précautions d’usage,
en particulier pour la glace de sorte à ce que la pression excercée soit parfaitement mesurée et adaptée
à la structure et resistance physique du document. D’autres dispositifs adaptés pourront être utilisés
dans le même respect des documents à traiter.

2) Manipulations
On optimise la numérisation du document en fonction des contraintes du matériel afin d’alléger et de
sécuriser les manipulations sur les documents. Il se peut par conséquent que l’acquisition ne soit pas

5
systématiquement effectuée dans le sens de l’original, mais la conformité doit être rétablie pour l’image
de livraison.
Lorsque toutes les pages de l’original ne sont pas dans le même sens, leurs présentations seront
respectées à la numérisation. L’application de consultation devra donc permettre d’effectuer les
rotations nécessaires à l’affichage du document dans le sens de la lecture.

3) Respect strict de l’original


La numérisation s’attache à reproduire au plus près le document original sans chercher à l’améliorer.
Les réglages sont optimisés au moment de la numérisation : pas de retouche en post-production.

4) Cadrage et nombre de prises de vues


Documents type manuscrits ou imprimés de réserve numérisés en couverture complète : prise de vue
en une page image sauf si l’image occupe les 2 pages (la prise de vue correspond alors à la double
page).
On numérise l’intégralité du document du plat supérieur au plat inférieur en incluant les pages vierges.
Si la séquence de pages blanches n’entrant pas dans la pagination ou non paginées est élevée, le
nombre de prise de vues de ces pages poura être réduit à 2 (par exemple cahiers de manuscrits où
seules les premières pages sont écrites). On pourra ainsi recréer un fac-simile sans avoir à ressortir
l’original.

Pour tous les documents reliés et pièces, on numérise l’intégralité de la page pour montrer que rien
n’a été coupé à la prise de vues : cadrer au bord extérieur de la page et mordre dans le fond de cahier.
De plus pour les documents montés, on cadre sur le document original en incluant la légende ou la cote
inscrite éventuellement sous l’image.

5) Vues de détail
Les documents seront numérisés pleine page sans vue de détail sauf exception dûment justifiée. La
qualité de la résolution permettra à la consultation de zoomer dans le document.

6) Résolution
Toutes les images d’un même document auront la même résolution, sauf exception, en particulier :
- les cartes de grands formats qui font l’objet d’une vue globale à une résolution inférieure puis
de vues de détails à des résolutions de 300 dpi. Les modalités spécifiques de prises de vues et
d’indexation sont établies pour chaque projet après expertise ;
- Les ensembles iconographiques pour lesquels on numérise des images et des objets de taille
différente (type daguerréotype dans son coffret) ;
- Les ouvrages dont certaines pages nécessitent une résolution supérieure (miniature de petite
dimension) ou avec prise de vues objet.

7) Cache
La prise de vue doit permettre de cadrer de façon à isoler la page de son contexte mais sans couper
d’information.
Un cache devra systématiquement être utilisé pour toutes les pages présentant des lacunes, des trous
ou déchirures ou pour aténuer les écritures parasites dues à la transparence éventuelle du papier.
L’utilisation du cache peut être lourde en manipulation et coûteuse. Par conséquent son utilisation sera
laissée à l’entière appréciation du photographe dès lors que la règle énoncée ci-dessus est respectée.

1.2 Identification des images


Les images de chaque document numérisé sont identifiées par un numéro de page attribué en
séquence continue (1 à n) selon leur ordre dans le document original, et indépendamment de la
pagination réelle ou d’une quelconque numérotation portée sur l’ouvrage. Cette identification permet
d'établir la table de correspondance entre le rang de numérisation de chaque page et sa pagination
réelle dans l’ouvrage.

Les informations de cette table sont à saisir dans le fichier XML refNum.

Certaines prises de vues liées aux éléments de reliure ont des intitulés stricts :
Plat supérieur
Contre plat sup.
Contre plat inf.
Plat inférieur
Page de garde recto

6
Page de garde verso
Il peut y avoir 2 rectos ou versos on nommera la page 28 V bis par exemple
Tranche supérieure
Tranche inférieure
Gouttière
Dos

La mire est la dernière image du document et aura pour identifiant celui du document. Elle n’est pas
référencée dans la table de correspondance du fichier refNum.
Remarque : ainsi 2 fichiers portent le même identifiant, celui du Refnum qui a une extension .xml et
celui de la mire avec une extension .tif.

Les images concernant la reliure seront fournies dans l’ordre suivant :


Plat supérieur
Contre plat sup.
Corps du document
Contre plat inf.
Plat inférieur
Tranche supérieure
Tranche inférieure
Gouttière
Dos
Mire

1.3 Numérisation des imprimés et de la presse

On entend par imprimés les documents monographies et périodiques.


Cependant il semble important de distinguer 2 catégories de monographies :

- les imprimés « courants » : sont candidats à l’océrisation et à l’identification des éléments peritextuels
type tables des matières.

- les imprimés « exceptionnels » : regroupent les imprimés de réserve, fonds anciens, documents
exceptionnels par leur contenu ou leur rareté. Ces documents présentent des caractéristiques telles
que la restitution la plus fidèle possible du document original est une priorité. A priori tous les imprimés
de la Réserve, (imprimés et collections spécialisées) entrent dans cette catégorie.

Les recommandations ci-dessous valent également pour les fascicules de presse, sauf mention
particulière.

Selon le type de projet, les images fournies doivent permettre d'obtenir une qualité de conversion OCR
maximale. Dans ce but il faut :
- respecter la tolérance d'inclinaison indiquée, au chapitre 4.2.2. « Contrôles des livraisons » ;
- aplanir le plus possible les pages, si besoin avec une vitre en veillant à ne pas détériorer
l'ouvrage ;
- éviter au maximum les courbures des lignes de texte ;
- appliquer à bon escient le mode de codage.

1.3.1 Choix de traitement couleurs, niveaux de gris, noir et blanc.

- Les imprimés exceptionnels sont numérisés en niveaux de gris sauf exception nécessitant de la
couleur partiellement ou totalement.

- Les imprimés courants sont numérisés majoritairement en niveaux de gris sauf certaines pages
nécessitant un traitement couleurs ou demi-teintes : certaines illustrations nécessitent une
numérisation en noir et blanc pour un meilleur rendu (par exemples les gravures au trait). Les
pages seront numérisées en couleurs si c’est indispensable à la compréhension du document
(planches de dessins de couleurs, typographie de plusieurs couleurs, etc.). Une exception
cependant vaut pour des imprimés entièrement en couleurs (par exemple des catalogues d’art).

7
Pour chaque projet la BnF fournit un référentiel sur l’utilisation du niveau de gris et du noir et
blanc pour les illustrations, rédigé par le service numérisation

- La presse est systématiquement numérisée en niveaux de gris sauf exception nécessitant de la


couleur.

1.3.2 Résolution et format

Le format utilisé est le TIFF V6 monopage UIT G4 en 1bit pour le noir et blanc, TIFF V6 monopage non
compressé 24 bits pour les documents intégralement en couleur ou 8 bits pour le niveau de gris.
La résolution est 400 dpi.

1.3.3 Utilisation de mires de couleur

Il est décidé de ne pas insérer de mire couleur à la fin des documents mixtes et de la presse présentant
de la couleur. En revanche les imprimés exceptionnels numérisés entièrement en couleur comporteront
une mire selon les règles indiquées au §1.1.2.2. Mires et profils ICC.

1.3.4 Règles de prise de vue

1) Matériel
Toutes les précautions nécessaires doivent être prises pour manipuler les documents sans dommage.
Selon les cas, un plateau aspirant ou une glace pourront être utilisés en adoptant toutes les précautions
d’usage, en particulier pour la glace de sorte à ce que la pression excercée soit parfaitement mesurée
et adaptée à la structure et resistance physique du document. D’autres dispositifs adaptés pourront être
utilisés le cas échéant dans le même respect des documents à traiter.

2) Manipulations
On optimise la numérisation du document en fonction des contraintes du matériel afin d’alléger et de
sécuriser les manipulations sur les documents. Si l’acquisition n’est pas systématiquement effectuée
dans le sens du document, il doit être rétabli pour l’image de livraison. C’est l’application de consultation
qui remettra toutes les images dans le sens de la lecture (même les images orientées dans un autre
sens dans l’original). Lorsque toutes les pages de l’original ne sont pas dans le même sens, leurs
présentations seront respectées à la numérisation. L’application de consultation devra donc permettre
d’effectuer les rotations nécessaires à l’affichage du document dans le sens de la lecture.

Remarque : lorsque les pages sont converties par OCR et fournies également au format Alto (voir
charte de conversion OCR sur le site de la BnF) pour une publication en superposé des images et du
texte l’application n’est pas toujours capable de recalculer les coordonnées lors de la rotation de
l’image. Des consignes précises seront données à chaque début de projet afin de préciser si les images
dovient être fournies dans le sens de lecture ou en conformité avec l’original

3) Respect de l’original
La numérisation s’attache à reproduire au plus près le document original. Les réglages sont optimisés
au moment de la numérisation. Les images ne devront donc pas être nettoyées des particularités
figurant sur l’original (rousseurs, transparences éventuelles, etc). Le seuil de binarisation sera finement
ajusté durant la phase de test et surveillé tout au long de la production, il doit permettre d’obtenir le
meilleur résultat possible en vue de la conversion OCR.

4) Cadrage et nombre de prises de vue


Le corps de l’ouvrage est numérisé dans son intégralité de la première page à la dernière en incluant
les pages vierges foliotées ou non entrant dans la pagination ou non.

On numérise en une page image. Les images occupant deux pages sont numérisées en une seule vue.

Les éléments de la reliure ne sont numérisés que s’ils contiennent des indications éditoriales (titre,
auteur, date, etc.) des armoiries ou des illustrations.

8
Le cadrage est effectué en recadrant chaque page le long du bord extérieur des marges de manière à
montrer l’intégralité de la page. On évitera de garder un liséré noir autour de la page. Lorsque la marge
côté reliure est inexistante ou que des lignes de texte paraissent coupées le cadrage se fera au niveau
du fond de cahier, de façon à montrer que la numérisation n’a pas tronqué d’informations. Sinon le
cadrage ne prendra pas le fond de cahier.
Une exception est faite pour la presse où les images brutes de numérisation feront l’objet d’un
détourage garantissant une marge suffisante autour de la partie texte de manière à éliminer les bords
d’image et de page inutiles. Il est demandé que l’image utile ainsi générée soit d’un format constant
pour tous les fascicules de taille identique..

2. IDENTIFICATION DES DOCUMENTS ET ORGANISATION DES METADONNEES

2.1 Identification des originaux lors des transferts

Chaque document original à reproduire doit être identifié dans un bordereau destiné à l’atelier ou au
prestataire, afin de sanctionner le transfert de responsabilité et de permettre le suivi du projet. Ce
bordereau mentionne les éléments d’identification nécessaires et suffisants.

Au retour, le prestataire doit fournir un bordereau de retour listant les documents remis à la BnF. Ce
bordereau signale également les documents qu’il n’aura pas pu numériser et la raison.

2.2 Identification des documents numériques

Chaque document numérique doit avoir un numéro d’identification unique attribué par l’établissement.
Le document numérique doit également être identifié comme tel dans le catalogue.

La création d’un document numérique est déterminée selon les règles suivantes :

- Etablir pour chaque ouvrage original reçu le nombre de document(s) numérique(s) à créer (1 ou n)
¾ Monographies : le découpage se fera pour l’essentiel un pour un.
¾ Périodiques : l’objet peut regrouper plusieurs fascicules. Le découpage donnera lieu à autant
de documents numériques que de fascicules.

Le découpage en document(s) numérique(s) est tributaire du type de document original et de sa


pagination, afin de permettre une bonne gestion de la granularité d’informations. Les règles sont
transmises par la BnF aux prestataires.
Voir aussi le § Granularité du document numérique sur le site web .

- Décrire les exemplaires numériques selon les règles de catalogage de la BnF. Les éléments
d’idientification à vérifer ou à compléter sont :
- Date(s) d’édition(s), ou tranche de date pour les périodiques
- Données de volumaison
- Attribution d’un n° d’identification électronique, à partir d’une tranche de n° fournie par la BnF.

Ces éléments sont à renseigner dans le fichier refNum de métadonnées selon les règles du schéma.

2.3 Métadonnées internes des images

Les métadonnées décrivant chaque image sont indispensables à l’archivage à long terme des
documents numériques.
Le standard TIFF version 6 permet l’insertion de plusieurs métadonnées. Les règles d’indexation de la
BnF pour chaque type d’image (noir et blanc, niveau de gris, couleur) figurent en annexe.

9
2.4 Fichier de métadonnées refNum

Le prestataire s’appuie sur des fichiers électroniques fournis par la BnF pour produire le fichier refNum
et ajoute des données de production. Les données fournies par la BnF ne doivent pas être retouchées.

Dans la grande majorité des cas, il suffit d’associer l’image à son refNum, soit par lot en respectant les
séquences de numérisation soit à la pièce.
Cependant dans quelques cas, des prises de vues complémentaires (par exemple, numérisation en
plusieurs parties pour des documents de grande taille, verso, coffret ouvert, etc) auront été demandées
par la BnF où se seront avérées indispensables lors de la prise de vue. Dans ce cas le titulaire
intégrera les légendes correspondant à ces prises de vues dans le refNum. Les intitulés lui auront, été
fournis au préalable par la BnF via le bon d’accompagnement du document pour les légendes
spécifiques ou via le lexique des légendes et foliotations pour les cas généraux.
Dans d’autres cas, il sera demandé au titulaire de saisir une légende et de l’intégrer dans le refNum de
l’image associée. Cette légende sera en général inscrite sur l’image qu’il aura numérisée (à son recto
ou à son verso)

La correspondance établie entre le rang de numérisation de chaque page et sa pagination réelle dans
l’ouvrage (voir §1.2. Identification des images) est complétée par l’indication du type de page selon les
besoins, par exemple : T (pour table des matières), I (pour index), P (pour page de titre) et par le type
de pagination, par exemple : A (pour chiffres arabes) R (pour chiffres romains). (Voir le détail des
règles de la table de correspondance et les éléments du fichier refNum en annexe).

Le schéma refNum.xsd est publié sur le site de la BnF à l’adresse : http://bibnum.bnf.fr/refNum.


Ce fichier comprend :
- les références bibliographiques du document numérisé,
- les données de production,
- les informations sur la structure de ce document.

2.4.1 Structure générale du fichier refNum :

Bibliographie

10
Production

11
Structure

12
3. LIVRAISONS

Une livraison comprend :


• Des documents numériques, chaque document numérique empaqueté dans un fichier unique,
• Le bordereau de livraison,
• Des fichiers de suivi destinés à accompagner le processus de livraison.

Schéma général de l’enregistrement d’un document numérique :

PPP_AAMMJJ_livr.xml
Livraison (bordereau de livraison)
X1234567.xml
(fichier refnum)

Répertoire
de livraison T1234567.xml
(fichier TDM)

Répertoire
PPP_1234567.tar document T0000000 .tif
(fichiers d’empaquetage) 1234567 Répertoire T (image.tif)

PPP_1234567.emp Répertoire X
(fichiers de suivi) X0000000.xml
(Alto)

Pour chaque document plusieurs fichiers sont placés dans le répertoire de livraison :
- PPP_AAMMJJ_liv.xml : bordereau de livraison
- PPP_ NNNNNNN.tar : empaquetage du répertoire contenant le document numérique livré.
- PPP_ NNNNNNN.emp : fichier de suivi de la livraison, contenant notamment l’empreinte du
fichier PPP_ NNNNNNN.tar et un indicateur précisant s’il s’agit d’une livraison initiale (création)
ou d’une nouvelle livraison (modification) de ce document.

PPP = 3 caractères d’identification du prestataire


NNNNNNN = numéro d’ordre unique de 7 caractères numériques identique au N° d’identification de
l’exemplaire numérique créé (numéro complété à gauche par des zéros).

On notera dans ce schema de livraison que tous les fichiers d’un même document sont fournis dans le
répertoire document et pas dans des livraisons séparées. La structure est la même s’il n’y a que la
prestation de numérisation à fournir, le fichier TDM et le répertoire X étant alors absents.

4. CONTROLES ET CONFORMITE DE LA PRODUCTION SOUS-TRAITEE

Cette rubrique ne développe que les contrôles effectués sur la production des prestataires quel que
soit le type de projet, sachant que la numérisation interne fait aussi l’objet de multiples contrôles.

La démarche de gestion et de suivi de la qualité s’appuye sur trois axes :


- des contrôles techniques sur la structure de chaque livraison dès réception
- un contrôle visuel des documents numériques en ligne par échantillonnage

13
- un suivi de toute la chaîne de production, par des audits réguliers chez les prestataires, et par
l’étude d’indicateurs de production qu’ils fournissent.

Le titulaire est tenu d’assurer la qualité des prestations fournies : il mettra en place les outils et
procédures lui permettant d’évaluer la qualité de ses prestations et produira les justificatifs permettant
à la BnF de donner son accord sur la validation ou le rejet des livraisons.
Ces contrôles porteront sur chaque prestation, sachant que la qualité d’un type de prestation est
tributaire de la qualité des autres types.

Le titulaire veillera à restituer les documents dans l’état où il les a reçus. Les informations contenues
dans le bordereau d’enlèvement et concernant l’état physique des objets remis font foi. Au départ de la
BnF, des bordereaux électroniques et papier sont édités, listant les documents à traiter et attestant leur
prise en charge par le prestataire.

Les marchés de numérisation sont conduits généralement selon le phasage ci-dessous, adapté
néanmoins au type de prestation. Au minimum, tout marché comprend une phase de test, dont la
validation conditionne le passage en phase de production courante intégrant la gestion des rejets au
contrôle qualité.

Déroulement type (modèle du marché de dématérialisation des imprimés) :

Etape Actions Résultats


Soumission de l’offre Le candidat fournit avec son offre un
« Mémoire sur l’Assurance Qualité »
(MAQ) détaillant les modalités de
gestion de la qualité qu’il a mis en place
et les indicateurs et points de contrôle
prévus pour l’atteinte du/des niveau(x)
de qualité requis par la BnF
Notification du Après la notification du marché et avant la version MAQ_N
marché mise en place des premiers tests, le MAQ
fourni avec la proposition du candidat est
éventuellement révisé.
Mise en place, étape Le MAQ_N correspondant au marché notifié version PAQ_V0
« test » sert au démarrage des processus de accord pour passer à l’étape suivante
préparation, de fabrication et de contrôle
dans une étape de « test » qui débouche
sur la mise en place effective de ces
processus. En prenant en compte les
enseignements tirés de cette étape, le
MAQ_N est la base de la rédaction d’une
version « bêta » de du Plan Assurance
Qualité (PAQ).
Mise en place, étape Le démarrage effectif des processus de version PAQ_V1
« galop d’essai » préparation, de fabrication et de contrôle se accord pour passer en production
fait avec un pilotage renforcé sur la base du courante
document PAQ_V0. Cette version est
révisée selon les résultats de l’étape
« galop d’essai » pour obtenir le document
contractuel qui fera référence pour la
gestion de la production.
Production courante Le pilotage de la production se fait dans le Emissions des bons de commande B2-
cadre du document PAQ validé. BN
Audit et / ou Contrôle Possibilité de réviser le document PAQ version PAQ_Vn
renforcé

14
4.1 Description des phases de mise en place et tests, et galop d’essai

Les phases de mise en place et de test permettent d’affiner les indicateurs et les procédures, de mettre
au point le calendrier final à partir du planning et des délais de réalisation de chaque prestation
proposés dans l’offre, d’organiser les chaînes de production, de faire les tests correspondant à chaque
prestation et de paramétrer les outils, d’ajuster les indicateurs. La validation des tests conditionne le
lancement du galop d’essai.

Pour le galop d’essai le prestataire aura terminé l’ensemble de sa mise en place, en matériel et en
personnel. Tous les processus sont déployés dans l’environnement de production, néanmoins les
opérations peuvent être annulées et refaites.
Les prestations font l’objet d’un contrôle renforcé sur la base de la version « bêta » du PAQ, qui peut
être amendée. La validation du galop d’essai conditionne le passage en production courante.

Les documents composant l’offre doivent fournir des propositions et des descriptions pour chaque
phase et l’apport de la BnF nécessaire pour leur bonne réalisation (ressources, personnes, etc.).
En cas de non satisfaction de la BnF au terme de chaque phase prévue dans le planning, la BnF peut
retarder le passage à la phase suivante.

L’organisation, la durée et le suivi financier de ces phases sont ajustés au type de marché.

4.2 Gestion de la qualité en phase de production courante

4.2.1 Audits et suivi des indicateurs de production


Les audits se déroulent dans les locaux du prestataire et avec sa collaboration active. Les audits
concernent l’ensemble de ce qui est mis en place par le prestataire pour accomplir les prestations du
marché (chaînes de production, outils d’évaluation et de correction de la qualité…). Chaque audit
consiste à s’assurer que les processus de fabrication et de contrôle respectent les référentiels et les
objectifs convenus entre le prestataire et la BnF (PAQ, normes applicables, rapports de production,
etc.), et que les préconisations des audits précédents ont été bien prises en compte. Un audit peut être
global ou ciblé, s’inscrire dans le planning ou être mené de manière impomptue.
Chaque rapport d’audit est un document à valeur contractuelle qui complète le PAQ.

En cas de manquement grave aux respects des dispositions applicables dans le cadre du marché la
BnF peut suspendre la production.

Les indicateurs de production et de contrôle doivent représenter une image conforme et réaliste de la
production pour une période donnée. Ils doivent permettre d’apprécier le(s) contexte(s) de production
du prestataire, le bon fonctionnement des processus de fabrication, de retraitement des rejets et
d’anticiper toute dérive.
Il incombe au titulaire de mettre en place un processus de contrôle de sa production qui lui permette
d’obtenir un niveau de qualité correspondant au moins à la qualité exigée par la BnF ; des indicateurs
permettant à la BnF de vérifier la validité des processus de contrôle qualité des prestations devront être
fournis.

Le titulaire devra informer la BnF de tout fait susceptible d’affecter la gestion du marché.

Les indicateurs proposés dans le MAQ sont affinés et complétés dans les documents contractuels
successifs. La liste des indicateurs peut évoluer en cours de production selon les besoins et d’un
commun accord entre la BnF et le titulaire.

4.2.2 Contrôles des livraisons


Le CCTP et le CCAP définissent les normes applicables et les niveaux de qualité selon les prestations, les
critères et les modalités de contrôle, les modalités de retraitement et de relivraison des rejets, les délais, ainsi
que l’impact administratif et financier des validations.

15
A la fin du contrôle de chaque livraison un bordereau de contrôle comprenant les résultats est envoyé au
prestataire.

Contrôles techniques
D'une manière générale, les contrôles effectués à réception de chaque fourniture portent sur :
- la conformité aux normes et schémas de la BnF
- la complétude et l'organisation de la livraison
- le format et la structure des données
- la cohérence des données entre elles

Les contrôles pourront être croisés.

Cette liste n’est pas exhaustive.

Contrôles visuels
Ils ont lieu pour les documents validés aux contrôles techniques, selon des modalités précises définies
dans l’appel d’offres.

Ces contrôles adaptés à chaque projet concernent par exemple :


- Contenu et cohérence des données d’exemplaires ainsi que la cohérence du découpage des
objets en documents numériques (si cette prestatation est demandée)
- Qualité intrinsèque des images et leur présentation,
- Dérive entre l’objet d'origine et sa représentation numérisée
- Respect des règles de pagination,
- Respect des données fournies et cohérence entre les images et les références,
- Cohérence des métadonnées et des fichiers
- Complétude des pages ou images (par rapport à la numérotation des pages originales
numérisées)
- Troncature ou non de l’information,
- Erreur de saisie de la table de correspondance,
- Lisibilité du texte ou rendu des photographies
- Redressement des images : un travers supérieur à 1°3 sera cause de rejet de l’image
- …

Cette liste n’est pas exhaustive.

Les réfections devront être traitées et relivrées sans retarder la production courante et dans les délais
prévus au planning.
Les modalités précises de relivraison, ainsi que les modalités d’admission des prestations sont définies
dans les documents d’appel d’offres.

4.3 Niveaux de qualité exigés par la BnF

Le fichier de métadonnées doit être strictement conforme au schéma fourni « RefNum» : fichiers XML
valide.

L’unité de contrôle correspond au document numérique.

Le niveau de qualité acceptable est fixé à 0,1% pour les erreurs majeures et de 1,0% pour les erreurs
mineures.

• Erreurs majeures
- Incohérence entre les images et les références,
- Page(s) ou image(s) manquante(s),
- Troncature de l’information,
- Erreur de saisie de la table de correspondance (erreur de pagination, signalisation
manquante ou erronée des tables des matières, des index et des logos, etc.),
- Polarité inversée.

16
• Erreurs mineures
- Lisibilité du texte ou rendu des photographies insuffisant dû à un manque d’optimisation des
réglages du numériseur,
- Travers supérieurs à + ou – 1°30’,
- Échelle de restitution incorrecte par rapport au document original ou changement d’échelle
au sein d’un même ouvrage non justifié,
- Mode de traitement inapproprié à l’image,
- Présence d’altérations et ou d’élément(s) étranger(s)sur l’image (pixellisation, traits de
saturation, marges noires, etc.),
- Altération des données de références fournies et mauvais renseignement des champs
modifiables dans les fichiers,
Absence de commentaires ou choix de commentaires inappropriés sur l’état du document
ou de la page concernés.
- Confusion entre la signalisation d’un index et d’une TdM et inversement,

17
5. ANNEXES

5.1 Description des formats de fichier TIFF

Format de fichier image TIFF V6 monopage – Noir et blanc

Le fichier TIFF se décompose comme suit :


Un header ;
L’IFD d’une image du document numérisé (Image File Directory contenant des informations sur
l’image) ;
L’image du document numérisé.
Le header du fichier TIFF est composé comme suit :
Byte order : 4949
Version : 42
Offset first IFD : 8
Le fichier TIFF comporte les tags cités dans le tableau ci-dessous.

Tag Description Type N Valeur


254 NewSubfileType long 1 0
256 ImageWidth short ou long 1 voir commentaires
(recommandé)
257 ImageLength short ou long 1 voir commentaires
(recommandé)
258 BitPerSample short 1 1
259 Compression short 1 4
262 PhotometricInterpretation short 1 0 ou 1
266 FillOrder short 1 1
272 Model ASCII 2 aa
273 StripOffsets short ou long 1 yyy (long recommandé)
277 SamplesPerPixel short 1 1
278 RowsPerStrip short ou long 1 nnnn (long recommandé)
279 StripByteCounts short ou long 1 zzz (short recommandé)
282 Xresolution rationnal 1 résolution réelle
283 Yresolution rationnal 1 résolution réelle
296 ResolutionUnit short 1 2
305 Software ASCII
306 DateTime ASCII 20 yyyy :mm :dd hh :mm :ss
315 Artist ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »
33432 Copyright ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »

Remarques

254 : remplace le 255 (TIFF 5) dans la version TIFF 6.0. valeur 0 dans le cas général.
256/257 : "long" recommandé. nnnn = nombre de pixels et de lignes de l’image intégrée dans le format
ISO A immédiatement supérieur.
259 : compression UIT Gr4.
262 : La valeur 0 (WhiteisZero) implique d'avoir une présentation unique d’aspect positif du fichier
image stocké, que l'image d'origine soit d'aspect positif ou négatif (cas des microformes).
272 : références du scanner utilisé : 1c pour le type d'appareil, 1c pour l’appareil. Ce champ permet de
connaître la provenance précise de la production.
279 : "short" recommandé ; zzz = taille en octets image.
282 et 283 : la résolution réelle est exprimée par rapport au document original.
284 (Planar configuration) : ne doit pas figurer
296 : valeur par défaut (en accord avec 282/283).
305 : la valeur doit comporter le nom du logiciel de traitement d’image ou du pilote de scan utilisé.
315 et 33432 : xxxxxx = identifiant BnF

18
Format de fichier image TIFF V6 monopage - Niveaux de gris

Le fichier TIFF se décompose comme suit :


Un header ;
L’IFD d’une image du document numérisé (Image File Directory contenant des informations sur
l’image);
L’image du document numérisé.

Le header du fichier TIFF est composé comme suit :


Byte order : 4949
Version : 42
Offset first IFD : 8
Le fichier TIFF comporte les tags cités dans le tableau ci-dessous.

Tag Description Type N Valeur


254 NewSubfileType long 1 0
256 ImageWidth short ou long 1 voir commentaires
(recommandé)
257 ImageLength short ou long 1 voir commentaires
(recommandé)
258 BitPerSample short 1 8
259 Compression short 1 1
262 PhotometricInterpretation short 1 0 ou 1
266 FillOrder short 1 1
272 Model ASCII 2 aa
273 StripOffsets short ou long 1 yyy (long recommandé)
277 SamplesPerPixel short 1 1
278 RowsPerStrip short ou long 1 nnnn (long recommandé)
279 StripByteCounts short ou long 1 zzz (short recommandé)
282 Xresolution rationnal 1 résolution réelle
283 Yresolution rationnal 1 résolution réelle
296 ResolutionUnit short 1 2
305 Software ASCII
306 DateTime ASCII 20 yyyy :mm :dd hh :mm :ss
315 Artist ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »
33432 Copyright ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »

Remarques

254 : remplace le 255 (TIFF 5) dans la version TIFF 6.0. Valeur 0 dans le cas général.
256/257 : "long" recommandé. nnnn = nombre de pixels et de lignes de l’image scannée et détourée
259 : pas de compression.
262 : La valeur 0 (WhiteisZero) implique d'avoir une présentation unique d’aspect positif du fichier
image stocké, que l'image d'origine soit d'aspect positif ou négatif (cas des microformes).
272 : références du scanner utilisé : 1c pour le type d'appareil, 1c pour l’appareil. Ce champ permet de
connaître la provenance précise de la production.
279 : "short" recommandé ; zzz = taille en octets image.
282 et 283 : la résolution réelle est exprimée par rapport au document original.
284 (Planar configuration) : ne doit pas figurer
296 : valeur par défaut (en accord avec 282/283).
305 : la valeur doit comporter le nom du logiciel de traitement d’image ou du pilote de scan utilisé.
315 et 33432 : xxxxxx = identifiant BnF

19
Format de fichier image TIFF V6 monopage – Couleurs

Le fichier TIFF se décompose comme suit :


Un header ;
L’IFD d’une image du document numérisé (Image File Directory contenant des informations sur
l’image);
L’image du document numérisé.
Le header du fichier TIFF est composé comme suit :
Byte order : 4949
Version : 42
Offset first IFD : 8
Le fichier TIFF comporte les tags cités dans le tableau ci-dessous.

Tag Description Type N Valeur


254 NewSubfileType long 1 0
256 ImageWidth short ou long 1 voir commentaires
(recommandé)
257 ImageLength short ou long 1 voir commentaires
(recommandé)
258 BitPerSample short 1 8 (,8,8)
259 Compression short 1 1
262 PhotometricInterpretation short 1 2
266 FillOrder short 1 1
272 Model ASCII 2 aa
273 StripOffsets short ou long 1 yyy (long recommandé)
277 SamplesPerPixel short 1 3
278 RowsPerStrip short ou long 1 nnnn (long recommandé)
279 StripByteCounts short ou long 1 zzz (short recommandé)
282 Xresolution rationnal 1 résolution réelle
283 Yresolution rationnal 1 résolution réelle
284 PlanarConfiguration short 1 1
296 ResolutionUnit short 1 2
305 Software ASCII
306 DateTime ASCII 20 yyyy :mm :dd hh :mm :ss
315 Artist ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »
33432 Copyright ASCII 50 « Bibliothèque nationale de
France – cote : Nxxxxxx »
34675 ICCprofile undefined

Remarques

254 : remplace le 255 (TIFF 5) dans la version TIFF 6.0. valeur 0 dans le cas général.
256/257 : "long" recommandé . nnnn = nombre de pixels et de lignes de l’image scannée et détourée
259 : pas de compression.
272 : références du scanner utilisé : 1c pour le type d'appareil, 1c pour l’appareil. Ce champ permet de
connaître la provenance précise de la production. En cas de défaut de qualité, il permet de déterminer
le matériel qui est en cause.
279 : "short" recommandé ; zzz = taille en octets image.
282 et 283 : la résolution réelle est exprimée par rapport au document original.
296 : valeur par défaut (en accord avec 282/283).
315 et 33432 : xxxxxx = identifiant BnF
305 : la valeur doit comporter le nom du logiciel de traitement d’image ou du pilote de scan utilisé.
34675 : Profil ICC retenu : Adobe 98

20
5.2 Règles à appliquer pour établir la table de correspondance

3.2.1. Structure de l’ouvrage


La pagination des ouvrages peut être fortement hétérogène en fonction de :
• la succession de types de pagination différents,
• la pagination des rectos seuls,
• les hors-texte non paginés,
• une double pagination,
• les dépliants, etc.

Le « typePagination » sera

N pour les pages non paginées, A pour les chiffres arabes,


R pour les chiffres romains, F pour les folios,
X pour les autres cas.

Le « typePage » sera

T pour les pages de tables des matières,


I pour les pages d’index,
L pour les pages contenant un logo,
P pour les pages de titre,
E pour la première page imprimée (en l’absence de page de titre)
N pour toutes les autres pages.

Règle générale relative à l’utilisation des attributs dans la pagination des documents

Une table de correspondance entre le rang de numérisation de chaque vue et sa pagination réelle dans
le document doit être établie. La pagination réelle ou rétablie doit figurer dans l'attribut
« numeroPage », le type de pagination retenu doit figurer dans l’attribut « typePagination » .

Lorsque le type pagination retenu est « typePagination » : N (pour non paginée), A (pour arabe), R
(pour romain), X (autre pagination), le numéro de page ne pourra être que numérique.
Il sera alors soit celui inscrit sur les pages du document quand il est en chiffre arabe soit celui traduit en
chiffres arabes dans le cas d’une numération romaine.

L’utilisation d’une chaîne de caractères non numérique dans l’attribut « numeroPage », n’est permise
que pour un type de page particulier qui est réservé seulement au « typePagination » F(pour folio), afin
de pouvoir transcrire une numérotation particulière ou nommer précisément les diverses parties de
l’ouvrage (ex : les plats, les pages de gardes, etc..).

3.2.2. Édition incohérente


Dans une édition normale, l’ordre des pages suit le texte, même s’il y a plusieurs types de pagination.
Il peut arriver que l’on trouve les cas suivants :
• s’il n’y a aucune suite cohérente dans le texte (interruptions, mélanges de pages), retourner le
document en anomalie ;
• si le texte se suit correctement mais que les numéros de pages sont dans le désordre, les
numériser telles quelles et ajouter en commentaire - Conforme original : page(s) décalée(s) /
intervertie(s) ou pagination erronée / décalée ;
• si une partie des pages est en double (texte identique), que la pagination soit répétée ou
continue, supprimer les pages en double et l’indiquer en commentaire ;

21
• si une pagination est en double mais que le texte se suit correctement (contenu non doublé),
les numériser telles quelles et ajouter en commentaire Conforme original : page(s) décalée(s) /
intervertie(s) ou pagination erronée / décalée.

Si la pagination est de type dédoublée, c'est-à-dire comportant en plus du chiffre une lettre ou
des signes : pages spéciales du type : 16-16bis-16ter-16quat -16quint-17 ou 16-16a-16b-16c-
16d-17 ou 16-16*-16**-16***-16****-17 ajouter en commentaire - Conforme original : pagination
dédoublée.

3.2.3. Pages de titre


La page de titre se trouve au début de l’exemplaire numérique à traiter, c’est toujours une page
impaire qui comporte en général la cote de la bibliothèque. Elle contient les informations
éditoriales de l’ouvrage : titre, auteur(s), éditeur, date de publication, et éventuellement la
mention de collection. Sur certains ouvrages la date peut ne pas y figurer mais elle se trouve en
général au verso avec le copyright.
Les pages en regard de la page de titre ou avant peuvent contenir des informations
complémentaires. On typera P la page la plus complète.
Lorsque l’on rencontre un objet qui contient plusieurs monographies (recueil d’éditeur ou recueil
factice) on peut trouver une page de titre pour chacune on les typera toutes P.
Pour les fascicules de périodiques la page de titre peut-être très succincte ou inexistante, si la
couverture comporte les informations éditoriales les plus complètes c’est elle qui sera typée P.
Si aucune page de titre ne peut être trouvée, il faut typer la première page imprimée en utilisant
la valeur E (cela permet d’éviter l’affichage d’une page blanche lors de la consultation du
document).

3.2.4. Notion de « Table des matières » et d’« Index »


Certains ouvrages possèdent des tables des matières ou un sommaire, ou des index se rapportant aux
illustrations, auteurs, etc.

Sont considérées comme tables des matières (TDM) les pages dont les libellés renseignent
une pagination qui suit le déroulement séquentiel de l’ouvrage du début à la fin.
Sont considérées comme index les pages dont les libellés renseignent une pagination qui ne
suit pas le déroulement séquentiel de l’ouvrage mais un autre ordre, le plus souvent
alphabétique (index d’auteurs, de titres ou de sujets), voire suivant une sélection de mot clés
sans classement alphabétique ou suivant l'ordre alphabétique de rubriques thématiques avec
éventuellement des sous rubriques, puis éventuellement un sous classement par auteurs ou
titre.
Dans les deux cas, les entrées doivent renvoyer vers une page de l'ouvrage (sinon la page
sera typée comme une page normale).
L’intitulé « table des matières » peut figurer en-tête d’un index.
Ne pas confondre avec une table des matières ou un index les pages d’errata et de notes —
notes correspondant à des appels de notes contenus dans l’ouvrage et regroupées
ensemble (en principe sous l’intitulé « Notes »), ainsi que les pages de références
bibliographiques (généralement intitulées « Bibliographie »).

Tables des matières ou index intermédiaires


Certains ouvrages subdivisés en plusieurs parties possèdent, en plus de la table des matières
générale, des tables ou des index supplémentaires ou intermédiaires, c’est-à-dire disposés à l’intérieur
de certaines grandes parties (cas des ouvrages scientifiques par ex : tables ou index pour un article
particulier).

22
Il est nécessaire d’avoir un référencement complet de toutes ces tables ou index si leurs contenus sont
complémentaires et non repris dans la table des matières ou index général de l’ouvrage, afin de
pouvoir retrouver les informations que contient ce type de document.
Les pages de ces différentes tables ou index seront typées T ou I.
Si l’intégralité de leurs contenus est reprise dans la table des matières ou index général de l’ouvrage,
les typer comme des pages normales.

Tables des matières doubles


Lorsque deux tables des matières figurent dans un même ouvrage, les pages de la table la plus
détaillée seront typées T, les pages de l’autre table typées comme des pages normales.
Si la table la plus complète ne comporte pas de renvoi vers les pages de l’ouvrage, ne pas la typer T ;
en revanche, si la table la moins détaillée en comporte, c’est elle qui sera typée T.
Cette règle vaut aussi pour les index, qui seront typés I.

Table des matières cumulatives


La table des matières à gérer avec le document numérique correspond à l’unité numérique créée..
On peut avoir une table des matières par fascicule ou tome, et une table des matières
cumulative.

Si chaque fascicule/tome constitue une unité numérique indépendante, typer sa table des matières T,
les pages de la table cumulative étant considérées comme des pages normales.

Dans le cas où plusieurs fascicules/tomes constituent une seule unité numérique, c’est la table des
matières cumulative qui est typée T, les pages des tables des matières individuelles étant typées
comme des pages normales.
Exception : si le contenu des tables individuelles n’est pas repris dans la table cumulative, typer leurs
pages en T à condition qu’elles pointent vers les pages de l’ouvrage (on aura dans ce cas deux tables
des matières différentes).
Ces règles valent aussi pour les index, qui seront typés I.

Table des matières ou index associé à une page de titre


Dans le cas où une page de TDM ou d’Index serait aussi une page de titre la priorité sera donnée au
référencement de la table ou de l’index au détriment de la page de titre.

Gravures et illustrations
Les tables de gravures et illustrations dont les entrées pointent vers une page de l’ouvrage seront
typées T ou I à condition que les entrées comportent l’intitulé ou le titre de la gravure (type T) ou un
mot clé représentant le contenu de la gravure (type I).

Des exemples concrets et des référentiels sont fournis avec les procédures de travail au début du
projet et avant la phase de test.

23
6. Structure détaillée du fichier refNum

Les éléments ajoutés dans la dernière version du schéma, ne sont pas détaillés ici, il s’agit de :
- référence (n° de la notice bibliographique récupéré à partir du bordereau de traitement aller)
- objetAssocié (décrit les objets associés au document numérique. Un objet associé est un
fichier (par exemple résultat OCR : ALTO ou saisie de table des matières TDM) lié au
document principal sans lequel il ne peut être pertinent
- historique (permet de décrire l'historique des traitements qui ont touché le document
numérique).
- texte : décrit les données et les références des fichiers résultats de transcription d'un texte
en mode texte structuré. Il s'agit d'un fichier au format XML, HTML ou XHTML.
ƒ L'attribut nomTexte contient le nom du fichier texte structuré. Il est unique pour
le document.
ƒ L'attribut typeFichier contient le type de fichier (format XML, HTML ou
XHTML).
ƒ L'attribut supportOrigine contient le type de support qui a été numérisé.
ƒ L'attribut traitement contient des informations sur le type de traitement
effectué : AUTO pour automatique (OCR par exemple) ou MANU pour
manuelle (videocodage par exemple).
L’élément texte est regroupé avec l’élément image dans un groupe ObjetDonnee, lui-
même inclus dans la vue objet.

<document>
Cardinalité 1 (pour le prestataire)
Format
Attributs identifiant : typeNumFixe8 (obligatoire)
numper : integer (optionnel)
Contenu <refNum>
dans
Contient <bibliographie>, <production>, <structure>
La valeur de l’attribut "identifiant" correspond à la valeur du champ n°1 du bordereau électronique.
La valeur de l'attribut "numper" correspond à la valeur du champ n° 11 du bordereau électronique. Cet
attribut n’est pas requis si la valeur du champ n°11 du bordereau électronique est nulle.

<bibliographie>
Cardinalité 1
Format
Attributs
Contenu <document>
dans
Contient <genre>, <titre>, <auteur>, <description>, <editeur>, <dateEdition>, <tomaison>,
<nombrePages>
Les informations contenues dans cet élément sont fournies par la BnF avec le bordereau électronique.
Elles ne doivent pas être modifiées.

<genre>
Cardinalité 1
Format liste de valeurs : MONOGRAPHIE , PERIODIQUE ou LOT
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur transcrite du champ n°3 du bordereau électronique.

<titre>
Cardinalité 1
Format longueur 300 caractères, string
Attributs

24
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°4 du bordereau électronique.

<auteur>
Cardinalité 0 ou 1
Format longueur 300 caractères, string
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°5 du bordereau électronique.
Cet élément n’est pas requis si la valeur du champ n°5 du bordereau électronique est nulle.

<description>
Cardinalité 0 ou 1
Format longueur 3000 caractères, string
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°16 du bordereau électronique.
Cet élément n’est pas requis si la valeur du champ n°16 du bordereau électronique est nulle.

<editeur>
Cardinalité 0 ou 1
Format longueur 100 caractères, string
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°6 du bordereau électronique.
Cet élément n’est pas requis si la valeur du champ n°6 du bordereau électronique est nulle.

<dateEdition>
Cardinalité 0 ou 1
Format longueur 50 caractères, string
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°7 du bordereau électronique.
Cet élément n’est pas requis si la valeur du champ n°7 du bordereau électronique est nulle.

< tomaison>
Cardinalité 0à3
Format
Attributs
Contenu <bibliographie>
dans
Contient <type>, <valeur>
Cet élément est répété autant de fois qu’il y a d’informations décrites dans les champs n°8, n°9, n°10,
n°13, n°14 et n°15 du bordereau électronique.

25
<type>
Cardinalité 1
Format longueur 20, string
Attributs
Contenu < tomaison>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°8, n°9, n°10 du bordereau électronique.

<valeur>
Cardinalité 1
Format longueur 20, string
Attributs
Contenu < tomaison>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ , n°13, n°14 et n°15 du bordereau
électronique.

<nombrePages>
Cardinalité 1
Format PositiveInteger ou string = « sans objet »
Attributs
Contenu <bibliographie>
dans
Contient PCDATA
La valeur de cet élément correspond à la valeur du champ n°12 du bordereau électronique.

<production>
Cardinalité 1
Format
Attributs
Contenu <document>
dans
Contient <dateNumerisation>, <nombreVueObjets>, <nombreImages>, <identifiantSupport>
Les informations contenues dans cet élément sont issues des données de production.

<dateNumérisation>
Cardinalité 1
Format Date(AAAA-MM-JJ)
Attributs
Contenu <production>
dans
Contient PCDATA
La valeur de cet élément correspond à la date de numérisation du document et non à la date
d'enregistrement sur le support.

< nombreVueObjets>
Cardinalité 1
Format positiveInteger
Attributs
Contenu <production>
dans
Contient PCDATA
La valeur de cet élément correspond aux nombres d’éléments <vueObjet>.

<nombreImages>
Cardinalité 1
Format positiveInteger
Attributs

26
Contenu <production>
dans
Contient PCDATA
La valeur de cet élément correspond aux nombres d’éléments <image>. Il correspond au nombre
d'images numérisées de l’ouvrage.

<identifiantSupport>
Cardinalité 1
Format typeNumFixe8
Attributs Ordre : positiveInteger
Contenu <production>
dans
Contient PCDATA
La valeur de cet élément correspond au nom du fichier d’identification du « lot répertoire ».

<structure>
Cardinalité 1
Format
Attributs
Contenu <document>
dans
Contient <commentaire>, <vueObjet>
Les informations contenues dans cet élément sont issues des données de production.

<commentaire>
Cardinalité 0àn
Format String (300 caractères maximum)
Attributs Type : INSTNUM (pour les instructions de numérisation), REJPREST (pour les rejets
prestataires), PRODUCT (pour contrainte de production), CONTROL (pour le résultat
du contrôle), USAGER (pour les usagers)
Date : AAAA-MM-JJTHH :MM :SS
Contenu <structure>, < vueObjet>, <image>
dans
Contient PCDATA
Cet élément permet d'informer l'ensemble des intervenants de la chaîne de numérisation de toute
instruction, contrainte, anomalie constatées. Cet élément est répété autant de fois qu'il y a
d'informations à renseigner.
S'il est rattaché à l'élément <structure>, l'information concerne le document dans sa totalité (par
exemple : pagination incohérente, ouvrage incomplet, etc.).
S'il est rattaché à l'élément <vueObjet>, le commentaire concerne la vue numérisée (par exemple :
densité hétérogène, rayures, taches).
S'il est rattaché à l'élément <image>, le commentaire concerne l'image numérique (par exemple :
changement d'échelle).

<vueObjet >
Cardinalité 1àn
Format
Attributs ordre : positiveInteger
numeroPage : string (20 caractères maximum)
typePagination : N (pour non paginée), A (pour arabe), R (pour romain), F (pour folio),
X (autre pagination)
typePage : N (sans type), T (pour table des matières), I (pour index), L (pour logo), P
(pour page de titre)
Contenu <structure>
dans
Contient <commentaire>, <image>
Les "vue objet" sont numérotées en séquences continues (1 à n). Ce numéro figure dans l'attribut
"ordre".
Généralement une "vue objet" correspond à une image numérique. Pour certains documents dont les
caractéristiques graphiques ou le format impliquent une numérisation en plusieurs parties, la "vue
objet" correspond à plusieurs images numériques.

27
Une table de correspondance entre le rang de numérisation de chaque vue et sa pagination réelle dans
le document est établie. La pagination réelle figure dans l'attribut "numeroPage". Le numéro de page
est soit celui inscrit sur les pages du document (traduit en chiffres arabes si nécessaire), soit calculé
pour les groupes de pages non numérotées (de 1 à P, où P est le nombre de pages du groupe).
Le type de pagination figure dans l'attribut "typePagination" ;
Le type de page est le code représentant la typologie de la page. Il figure sur l'attribut "typePage".
Le mémoire méthodologique précisera les règles d’utilisation de ces attributs.

<image>
Cardinalité 0àn
Format
Attributs nomImage : typeNumFixe8
typeFichier : TIF ou JPG
supportOrigine
traitement : MANU (manuel) ou AUTO (automatique)
cadrage : vueObjet ou detailObjet
Contenu <vueObjet>
dans
Contient <commentaire>, <legende>
Les images numérisées sont identifiées par un numéro relatif à leur ordre de numérisation. Elles sont
numérotées en séquences continues (1 à n). Ce numéro figure dans l'attribut "nomImage".
Les images sont numérisées en noir et blanc, en niveau de gris ou en couleur. Le type de l'image
numérisée figure dans l'attribut "typeFichier".
Le type d'objet numérisé figure dans l'attribut "supportOrigine" (cf. description sur l'annexe 1).
L'information concernant le champ effectif de numérisation (page entière ou partie de la page) figure
dans l'attribut "cadrage".

<legende>
Cardinalité 0 ou 1
Format longueur 3000, string
Attributs
Contenu <image>
dans
Contient PCDATA
Cet élément est sans objet dans le cadre de la prestation faisant l’objet du présent marché.

28

Vous aimerez peut-être aussi