AKHBARIYYUN – Une socio-historiographie numérique des premiers siècles de l’Islam
Ce billet présente brièvement un des projets-cœurs du consortium distam+.
Résumé
Ce projet porté par Noëmie Lucas à l’Ifpo Beyrouth porte sur les pratiques de transmission de l’histoire, à partir d’une étude des acteurs de cette transmission (akhbāriyyūn). Ces derniers sont présents dans les sources narratives arabes car le matériel historique est très souvent présenté sous la forme : chaîne de garants de la transmission (isnād) et récit historique (matn). Les deux forment le khabar, et ce projet s’intéresse à l’analyse des pratiques de sa fabrication à l’aide d’analyses computationnelles sur un large corpus.
Les historiens des premiers siècles de l’Islam (8-10e siècles) travaillent en effet à partir d’un corpus en majorité constitué de sources narratives. Si, depuis plusieurs décennies, nous avons assisté à un essor de l’étude des sources matérielles, en particulier documentaires, il n’en demeure pas moins que les sources narratives restent prédominantes dans le travail de l’historien. Ces sources narratives sont aussi les plus questionnées quant à leur authenticité, en particulier depuis les années 1970 et le courant sceptique. Ce matériel littéraire partage un certain nombre de caractéristiques. Les ouvrages narratifs ont notamment en commun d’être composés d’un matériel historique qui, lorsqu’il porte sur les 7e-8e siècles, a été transmis par un groupe limité de personnes, les akhbāriyyūn. Ces savants, qui se sont occupés de collecter, d’organiser et de transmettre des anecdotes qu’ils considéraient comme d’une valeur historique, sont l’objet de ce projet. Leurs noms sont connus, les contours de leurs vies sont en partie esquissés. Quant à leurs ouvrages, ils sont majoritairement perdus. Avec ce projet, il s’agit d’étudier la genèse de l’historiographie arabe du point de vue socio-historique.
AKHBARIYYUN se concentre sur les transmetteurs qui ont vécu aux 8e et 9e siècles et qui ont transmis sur ces mêmes siècles. Le corpus de textes considérés a été produit entre les 9e et 12e siècles. Il comprend des sources narratives historiques (histoires annalistiques, histoires universelles), des dictionnaires biographiques et des sources littéraires souvent désignées sous le terme d’adab. Il s’agit également, dans le cadre de ce projet, de repenser le degré réel de différenciation de ces genres lorsqu’ils sont examinés à l’aune de l’information historique (khabar). La prise en compte d’ouvrages rédigés par des auteurs tant musulmans que non musulmans permettra par ailleurs de remettre en question l’idée de l’externalité de l’historiographie arabe non musulmane. Cette riche tradition littéraire offre non seulement une très grande quantité de manuscrits, dont beaucoup ont été numérisés, mais également de vastes corpus accessibles en ligne.
Questions et Approches
Alors que l’analyse textuelle des textes arabes classiques avec le machine learning et les différentes approches et méthodes computationnelles peine encore à être prise en main aisément par la communauté scientifique, le contexte récent (la mise à disposition d’immenses corpus en ligne) et extrêmement récent (les progrès rapides de l’intelligence artificielle générative) offre des possibilités uniques de développement de modèles permettant d’une part de tester les paradigmes existants sur l’histoire de la transmission et, d’autre part, de tester de nouvelles questions qui ne pouvaient jusqu’alors être traitées à grande échelle.
Le projet est divisé en plusieurs questions de recherche qui peuvent être résumées de la manière suivante :
- Qu’est-ce qu’une analyse synchronique des chaînes de transmission nous apprend sur les transmetteurs et sur leurs pratiques de transmission ? (origine géographique de la transmission, mode de la transmission, autorités historiographiques et transmetteurs à la marge, contemporanéité de la transmission, intersection des transmission).
- Que peut-on savoir des pratiques de la transmission et de la composition à partir de l’analyse des relations entre les récits et les chaînes de transmission ? (séquences historiographiques, actualisation des récits, états de la langue, distinctions génériques)
Pour y répondre, trois étapes sont envisagées :
- la structuration/annotation des textes pour l’étude
- des tests d’application de modèles existants ou adaptables pour certaines questions (ex: extraction des noms des transmetteurs dans les chaînes de garants)
- le développement de modèles spécifiques (ex: topic modeling pour la question des séquences historiographico-thématiques)

Objectifs
Apports scientifiques:
- Améliorer nos connaissances sur les transmetteurs des 8e et 9e siècles, un groupe étudié jusqu’alors à la marge par les chercheurs travaillant sur l’écriture de l’histoire islamique.
- Mettre en évidence les pratiques de transmission et de composition du matériel historique par les transmetteurs.
- Repenser les relations entre écriture de l’histoire et vérité dans les premiers siècles de l’Islam en participant à une meilleure compréhension du “régime de vérité” islamique médiévale.
Innovation:
- Tests de paradigmes académiques et scientifiques ancrés sur l’historiographie islamique
- Publication de jeux de données annotés dans des standards réutilisables
- Tests d’annotation et d’extraction avec les outils d’IA générative (évaluation de la précision et du gain de temps notamment). Réflexion globale sur le « transfer learning »
- Développement de modèles inédits pour les textes arabes classiques
Jeux de données:
- Données textuelles : sources narratives composées en arabe entre les 9e et 12e siècles: histoires universelles, dictionnaires biographiques, recueils littéraires, compendium de droit et recueils de traditions. Disponible en ligne dans des formats type .txt qui peuvent être déjà en partie annotés (mARkdown) ou qui ne le sont pas. Voir notamment OpenITI corpus ;
- Éditions de texte disponible au format PDF à extraire par ATR
- Manuscrits numérisés, extraction du texte par ATR
Domaines dans distam+ :
- acquisition, modélisation et partage
- philologie multimodale
Mots clefs :
textes, fouille, TAL, historiographie, transmission, citation, annotation
Personne référente et institution de rattachement :
Noëmie Lucas (Ifpo Beyrouth, UMIFRE 6 – MEAE CNRS – UAR 3135)
Bannière: Extrait du Taʾrīkh d’al-Ṭabarī (m. 923), exemple d’un isnād. BnF, Arabe 1467. L’image a été retravaillée avec un modèle d’intelligence artificielle et générée par lui selon les prompts fournis.
OpenEdition vous propose de citer ce billet de la manière suivante :
nlucas (26 mars 2026). AKHBARIYYUN – Une socio-historiographie numérique des premiers siècles de l’Islam. Carnet hypothèses du consortium Huma-Num distam+ (DIgital STudies Africa, Asia, Middle East). Consulté le 4 mai 2026 à l’adresse https://doi.org/10.58079/15y3x

