Compte rendu de la formation Transkribus
« Transcription, annotation, reconnaissance d’écriture manuscrite, prise en main »
INRIA – Paris
15 février 2018
Formation organisée et menée par Charles Riondet (Ingénieur de recherche – INRIA)
Organisée sur une matinée, la formation pour l’utilisation de Transkribus a rassemblé les membres du projet Time-US. Elle s’est articulée autour de deux moments : la présentation de Transkribus et une première prise en main du logiciel par les participants.
Présentation de Transkribus
Transkribus a été développé dans le cadre du projet européen READ (Recognition and Enrichment of Archival Documents), dont l’enjeu est de rendre plus accessibles d’importants corpus d’archives. Le logiciel de transcription automatique Transkribus permet la reconnaissance de l’écriture manuscrite tout alphabet confondu, des structures de mise en page, et des documents écrits à plusieurs main. Il permet également l’annotation d’archives.
Fonctionnement de Transkribus
La reconnaissance du texte se fait ligne par ligne, et non par caractères. Pour une retranscription automatique, il est nécessaire d’entraîner les algorithmes. A cette fin, Transkribus est efficient pour la retranscription d’un grand nombre de documents ayant une structure et une écriture similaires. Pour entraîner le logiciel, il est nécessaire de disposer d’une transcription d’au minimum 50 pages, ou 1000 lignes complètes.
Pour exemple, les porteurs du projet « Transcribe Bentham » ont entrepris la transcription, avec l’aide du logiciel, des manuscrits écrits par Bentham et ses secrétaires. Environ 900 pages ont été retranscrites, ce qui a permis d’entraîner un modèle efficace (un taux d’erreurs compris entre 5 à 10%).
Transkribus fonctionne aussi sur des tapuscrits, et requiert un entraînement plus limité du logiciel. Les résultats de la transcription automatique comprennent un taux d’erreurs moindre, entre 1 à 2%.
Une fois les archives transcrites, il est possible d’exporter les documents en plusieurs formats, dont .pdf, et .xml permettant l’encodage des textes.
Utilisation de Transkribus
Pour commencer la retranscription via Transkribus, il est indispensable de créer un compte personnel https://transkribus.eu/Transkribus/ ou de se connecter à l’adresse suivante https://transkribus.eu/read
Pour apprendre à utiliser Transkribus, se référer à :
https://learn.transkribus.eu
Les archives transcrites dans le cadre du projet Time-Us seront bientôt disponibles sur le wiki: http://timeusage.paris.inria.fr/mediawiki/index.php/Accueil
OpenEdition vous propose de citer ce billet de la manière suivante :
timeus (22 février 2018). Compte rendu de la formation au logiciel Transkribus (INRIA). TIME-US. Consulté le 5 avril 2026 à l’adresse https://doi.org/10.58079/urgp
Bonjour, j’ai réalisé une version française du guide Comment utiliser Transkribus en 10 étapes. Voici le lien : http://regis-schlagdenhauffen.eu/2018/01/comment-utiliser-transkribus-en-10-etapes/
Merci pour le lien!
merci infiniment pour ce riche lien 😉