0% ont trouvé ce document utile (0 vote)
28 vues15 pages

Gefen - Les Enjeux Épistémologiques Des Humanités Numériques

Transféré par

sdgssdg
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
28 vues15 pages

Gefen - Les Enjeux Épistémologiques Des Humanités Numériques

Transféré par

sdgssdg
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Socio

La nouvelle revue des sciences sociales


4 | 2015
Le tournant numérique… et après ?

Les enjeux épistémologiques des humanités


numériques
The epistemological issues posed by the digital humanities

Alexandre Gefen

Édition électronique
URL : https://journals.openedition.org/socio/1296
DOI : 10.4000/socio.1296
ISSN : 2425-2158

Éditeur
Les éditions de la Maison des sciences de l’Homme

Édition imprimée
Date de publication : 25 avril 2015
Pagination : 61-74
ISBN : 978-2-7351-2035-2
ISSN : 2266-3134

Ce document vous est offert par Université libre de Bruxelles - ULB

Référence électronique
Alexandre Gefen, « Les enjeux épistémologiques des humanités numériques », Socio [En ligne], 4 |
2015, mis en ligne le 28 mai 2015, consulté le 26 septembre 2023. URL : http://
journals.openedition.org/socio/1296 ; DOI : https://doi.org/10.4000/socio.1296

Creative Commons - Attribution - Pas d'Utilisation Commerciale - Pas de Modification 4.0 International
- CC BY-NC-ND 4.0
https://creativecommons.org/licenses/by-nc-nd/4.0/
DOSSIER

Les enjeux
épistémologiques
des humanités
numériques
Alexandre GEFEN

On assiste aujourd’hui à un tournant informationnel et computationnel


du travail scientiique. En sciences dures (sciences du vivant, physique des
particules, sciences de l’Univers, chimie quantique, études de population,
etc.), de nombreuses recherches produisent désormais des volumes consi-
dérables de données hétérogènes (big data), nécessitant le développement
de nouvelles méthodes d’extraction et de traitement de l’information : la
production massive de données par des expériences, des capteurs ou des
populations s’offre à une approche empirique des faits où l’on peut extraire
les phénomènes par des méthodes algorithmiques à partir des masses de
données en limitant l’interférence des présupposés. Parallèlement, en
sciences de la culture, l’apport des bibliothèques en ligne et des moteurs de
recherche conduit à la redécouverte de vastes corpus anciens et encourage
de nombreuses initiatives d’analyse et d’exploitation. Je voudrais montrer,

Socio • 04 • mars 2015 • p. 61-74 61


DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

en prenant l’exemple de la critique littéraire, que, dans les sciences sociales,


l’extraction de connaissances, le repérage et l’agrégation de faits culturels,
la visualisation et la navigation à l’intérieur de corpus textuels plus ou
moins massifs sont également des instruments nouveaux de connaissance
et de perception. Ces big data ou long data de la culture, produits par un
tournant informationnel du savoir, font de l’historien ou du théoricien de
la littérature un data scientist comme un autre. Les méthodes critiques qui
les accompagnent ont des enjeux épistémologiques, institutionnels et péda-
gogiques considérables. Dans ce qu’on appelle désormais les « humanités
numériques 1 », la lecture à distance (distant reading) de corpus constitués
par des cartes et graphes offre « une forme spéciique de savoir » (Moretti,
2005 : 1) permettant de découvrir des régularités autant que des nouveautés
irrégulières (Goodwin et Holbo, 2011 ; Jockers, 2013). De même, la lecture
numérique de corpus plus étroits ou d’œuvres uniques considérées comme
des bases de données de faits linguistiques et critiques (close reading) propose
une « herméneutique intégrative », caractérisée par une désessentialisation
du texte, désormais dénudé dans sa texture et placé au centre d’un empire
hypertextuel et de systèmes variationnels qui le décentrent (Viprey, 2005 ;
Mayaffre, 2007). D’où l’apparition d’un paradigme méthodologique et épis-
témologique qu’il importe de saisir dans toute sa puissante heuristique,
sans se laisser entraîner par l’idée naïve d’une production transparente
de savoirs par moissonnage du big data des corpus, masse de données qui
restent des artéfacts muets en l’absence d’une herméneutique spéciique.

La construction des corpus


« Le diable est dans les détails », dit un vieil adage : pour mieux comprendre
les enjeux épistémologiques de ces nouvelles formes critiques, il importe de
préciser les opérations et les méthodes concrètes mises en œuvre au cœur
des humanités numériques. L’épistémologie disciplinaire est indissociable
des pratiques et des usages concrets, tant techniques que sociologiques :

1. Sur la déinition du champ, voir Landow (2006), Bartscherer et Coover (2011),


Mounier (2012), Gold (2012), Berry (2012). Sur les débats récents, voir Doueihi (2011),
Mayer-Schönberger (2011), Morozov (2011), Simone (2012).

62
Les enjeux épistémologiques des humanités numériques

structures des équipes académiques, souvent bouleversées par l’émergence


de nouveaux acteurs et l’interdisciplinarité, place des informaticiens, rôle
des contributeurs anonymes ou du moins externes lorsque les projets
intègrent du crowdsourcing 2 , etc. Coproduits par des ingénieurs et des
chercheurs dans une logique souvent bottom-up (c’est-à-dire partant des
besoins concrets et des possibilités techniques), gouvernés par les invi-
tations et les interdictions propres aux outils techniques autant que par
des programmes de recherche disciplinaire intellectuellement maîtrisés,
profondément affectés par les campagnes patrimoniales de numérisation
et par les modalités juridiques d’exploitation des données, les méthodes
et les savoirs des humanités numériques sont indissociables des normes,
des algorithmes et des corpus qu’ils déploient 3 .
Quelles sont, justement, les opérations que présuppose la « philologie
numérique 4 » lorsqu’elle constitue des corpus ? Il faut rappeler que, pour
l’analyse numérique du long data de l’histoire culturelle, la première étape
consiste en la numérisation ou l’agrégation de textes en corpus, puis en leur
saisie, leur conversion et leur équipement en métadonnées (métadonnées
bibliographiques ou, plus inement, utiles à leur classement). Ces opérations
sont loin d’être transparentes, pour de multiples raisons. En premier lieu,
les acteurs des humanités numériques dépendent dans une large mesure
des politiques de numérisation de masse, celles des bibliothèques en par-
ticulier ; or ces dernières sont elles-mêmes contraintes par l’état physique
des documents et par la possibilité d’équiper un nombre considérable de
textes en métadonnées pertinentes : le problème est particulièrement
sensible pour les périodiques, dont l’exploitation productive suppose

2. On nomme crowdsourcing au sens large les formes de participation ouvertes par


l’Internet 2.0, centré sur l’interaction et la contribution des internautes (forums de dis-
cussion, science citoyenne, démocratie participative, écriture collaborative, inancement
collectif, journalisme amateur, etc.).
3. Je ne peux ici que souscrire aux afirmations d’Éric Guichard pour qui « le couple
{système de signes + support}, que les qualitativistes décrivent comme technique et
sans intérêt, conditionne partiellement l’exercice de la pensée, et montre les limites des
représentations qui la prétendent spirituelle et immatérielle : l’obligation de compter et
de trier, la combinatoire sont parfois vecteurs ou les aiguillons de la conceptualisation »
(Guichard, 2013).
4. Sur ce terme, voir Rastier (2001 : 73-98), Mayaffre (2002).

63
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

un découpage par articles et par auteurs. Deux autres facteurs s’opposent


à l’idée d’une analyse strictement empirique : d’une part, il est dificile
d’identiier de manière automatique ou manuelle, au sein des textes, des
informations d’indexation signiiantes (en particulier ce qu’on appelle
les « entités nommées », noms, dates et lieux), alors même que ce balisage
constitue un préalable nécessaire à certains types d’études (de réception,
par exemple) ; d’autre part, pour les textes anciens, les informations de
tirage et de diffusion sont rares, ce qui rend assez peu iable la mesure de
leur représentativité. En somme, dans l’anarchie des corpus numériques
des bibliothèques, le rêve d’exhaustivité d’une bibliothèque de Babel est
aussi éloigné de sa réalisation que l’avènement espéré par Tim Berners-Lee
d’un web sémantique (Berners-Lee, Hendler et Lassila, 2001) à l’intérieur
d’Internet. Ainsi, souvent, le travail sur le big data doit se faire par bricolage,
à partir de corpus partiellement représentatifs et partiellement organisés,
imposant des biais considérables à toute analyse quantitative et requérant
des chercheurs une conscience méthodologique aguerrie. L’interrogation,
très impressionnante, du Google Ngram Viewer 5 ne saurait dispenser « de
réléchir aux questions d’échantillonnage, de représentativité, d’homo-
généité du corpus, des conditions dans lesquelles les données sont produites,
agrégées ou combinées », comme le rappelle Michel Wieviorka (2013 : 26),
en particulier lorsqu’il s’agit de fouiller des données ouvertes, mais dont
les standards de constitution ne sont pas clairement connus – ce qui est
précisément le cas de Google Books sur lequel s’appuient les expériences
de « culturonomique » (quantiication des tendances culturelles) les plus
simples et les plus spectaculaires.
Par ailleurs, ni la conversion numérique des textes, ni leur modélisa-
tion structurelle par des normes 6 visant à les abstraire selon des règles
générales en séparant contenu textuel originel, présentation originelle
(découpage textuel, typographie, mise en page, etc.) et présentation inale

5. <https://books.google.com/ngrams>, application qui permet la comparaison sous


forme de diagramme du nombre d’occurrences d’un nom, d’une phrase dans un corpus
donné et une période déinie.
6. Notamment la Text Encoding Initiative (TEI), standard de fait en numérisation
patrimoniale littéraire utilisant la norme XML. Pour une présentation, voir Romary et
Hudrisier (sans date).

64
Les enjeux épistémologiques des humanités numériques

sur ordinateur ou tablette, ne sont transparentes : convertir des récits en


des bases de données, passer de la narration ou de la diction à de l’infor-
mation, c’est identiier des noms et des concepts signiiants, transposer
des typographies et des mises en pages, annoter un texte « à l’ancienne »
ou avec des outils collaboratifs innovants 7, démembrer une structure en
repérant l’énonciation éditoriale et les enjeux esthétiques des supports.
Il s’agit de déterminer ce qui relève du texte ou du paratexte, d’identiier
des structures, de choisir les normes orthographiques, en faisant à chaque
fois le distinguo entre information signiiante et information négligeable :
on choisira, par exemple, pour un texte classique de conserver ou non les
« privilèges d’impression », les formes de ponctuation et de typographie
d’époque, les informations spatiales de mise en forme des pages, les données
concernant la matérialité du texte ; on considérera ou non les « tomes »,
« livres » ou « parties » comme relevant d’un même ichier, etc. S’il existe
des outils de détection automatique des structures et de rapprochement
des termes sémantiques par association à des bases de données externes,
et s’il est envisageable de s’appuyer par exemple sur des cartes de mots-clés
signiiants, générés par des algorithmes, toutes ces opérations relèvent d’une
lourde ingénierie des connaissances. Elles présupposent des modélisations
plus ou moins normatives. Les processus de sélection et de structuration
des entités des textes impliquent donc des sémantiques – si ce n’est des
ontologies –, qu’elles soient explicites et gérées par les outils des arbres ad
hoc, ou implicites et apportées par la tradition.
Ainsi, la standardisation et la modélisation égalisatrice par les normes
ouvertes, « démocratiques » et générales du web et la délégation de certaines
opérations de sémantisation à des algorithmes de classement empiriques et
transversaux ne sauraient faire oublier à quel point les sémantiques restent
indissociables de savoirs disciplinaires et d’une tradition interprétative
sans laquelle ni l’établissement ni l’interprétation des œuvres ne font sens.
Il n’y a donc pas une œuvre numérisée mais des standards et des degrés
d’encodage et de sémantisation : entre un texte numérisé en « texte pur »,

7. Sur la problématique de l’annotation, voir Bassez (2006), Chatelain (1999), ainsi


que les travaux classiques et importants signalés par Jajah (2012a, 2012b, 2013a,
2013b, 2013c), McNamee (1992), Jackson (2001), Slights (2001), Wolfe et Neuwirth
(2001), Sherman (2009).

65
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

comme on en trouve encore sur le site du projet Gutenberg (la première


des bibliothèques numériques proposant en libre accès des ouvrages libres
de droits), et un texte sur lequel le moindre détail aura été encodé, de la
couleur de l’encre à la signiication d’une référence permettant de lier un
texte à un autre, c’est par un facteur cinquante qu’auront été multipliés
le temps de travail, la taille du ichier et la densité informationnelle
exploitable (rendant au passage le ichier inal XML quasi illisible avant sa
transformation pour afichage en HTML). Le degré de détail pouvant être
atteint par une transcription numérique est extrêmement variable et la
transcription dans la norme TEI génère sa propre « TEIlogie 8 », ses règles
et ses débats, ses normes et ses bons usages, extension numérique de la
philologie classique et des problématiques des éditions papier, en circonve-
nant des impossibilités propres à ces dernières (pensons, par exemple, à
la possibilité d’encoder deux transcriptions ou deux interprétations d’un
même passage) grâce à la maîtrise d’un langage d’encodage, à un travail
philologique et herméneutique lourd, et au déploiement d’outils logiciels
de transcription et d’afichage complexes. Car les modalités d’afichage
d’un texte sont aussi riches que les possibilités logicielles des interfaces et
évoluent avec elles, permettant des formes de navigation et de reconstruc-
tion du texte modulable selon le projet et les besoins du lecteur : dans une
édition du Grand Cyrus de Madeleine de Scudéry 9, nous avons ainsi proposé
un texte « à la carte », que le lecteur peut aficher soit dans sa typographie
et sa mise en page ancienne, soit dans une version modernisée, soit encore
dans une version « philologique » mettant en regard la reproduction de la
page originelle et sa transcription ; une œuvre dont la lecture peut passer
par une structure de résumé dépliable et une aide sous la forme de bulles
documentaires, aussi bien que par une présentation continue sans para-
graphes, respectant la densité et la compacité des in-folio d’époque : s’il
existe des heuristiques plus ou moins fécondes de lecture numérique du
texte, et si la dénudation des textes dans un format standardisé permet des

8. Voir les débats sur la liste TEI-L : <http://listserv.brown.edu/archives/cgi-bin/


wa?A0=TEI-L>.
9. <http://www.artamene.org>.

66
Les enjeux épistémologiques des humanités numériques

opérations de comparaison et d’exploitation ininies et non prédéterminées,


aucune ne possède un caractère universel et obvie.
L’« herméneutique intégrative » permise par le numérique ne consi-
dère donc le texte littéraire comme un objet informationnel ordinaire et
empirique analysable par une machine qu’au prix d’une sélection a priori
délicate (possibilité de l’agrégation dans un corpus d’une version parti-
culière) et d’une décomposition structurelle et sémantique très complexe.
Les méthodes permettant de faire de l’œuvre littéraire un ensemble de faits
textuels ordinaires, examinables empiriquement dans leur connexion
à d’autres faits textuels ou références, et susceptibles de comparaisons,
supposent donc le recours à un savoir philologique et historique ancien
avant toute expérimentation, et exposent donc tout savoir empirique aux
aléas des conditions de sa constitution.

Les enjeux de l’analyse quantitative


Loin de se satisfaire de concordanciers, ou tables lexicales de concor-
dances, les opérations de fouilles textuelles approfondies, qui permettent
par exemple de dégager des thématiques, supposent ce qu’on appelle la
« lemmatisation », c’est-à-dire le regroupement des différentes formes d’un
mot, et ne font qu’ouvrir le travail interprétatif : comment par exemple
interpréter des statistiques sur la « colocation » fréquente ou au contraire
très rare de deux mots, concepts ou noms propres, et développer une
intelligence de linguistique de corpus, sans recourir à des expériences
conigurées par une intuition et un savoir disciplinaire ? Certes, un texte
individuel peut ainsi être visualisé comme un nuage de mots, ou, après
traitement par lemmatisation et neutralisation des mots grammaticaux,
comme un nuage de concepts ; des comparaisons peuvent être faites par des
recours à des formes stylistiques ou grammaticales, et un certain nombre
de « découvertes » inattendues peuvent être espérées de telles visualisa-
tions. Pourtant, la lexicométrie et l’analyse sémantique et thématique
ne peuvent répondre qu’à des questions posées selon des problématiques
critiques nécessairement exogènes, car, avant même toute interprétation,
les modalités de visualisation permettant de rendre interprétables des
résultats supposent des choix mathématiques pour produire des graphes
simplement afichables et lisibles.

67
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

Le passage au big data permet-il de faire un vrai saut épistémologique


dans lequel la part des présuppositions et des a priori laisserait vraiment
place à des résultats empiriques ? Les expériences faites par Franco Moretti
proposent de construire « une forme spéciique de savoir », où, par exemple,
« le genre devient un spectre à bande large, dont aucun texte singulier ne
pourra jamais représenter la multiplicité interne » dans le cadre d’une
« conception matérialiste de la forme » (Moretti, 2005 : 91) proposant des
objectivations scientiiques par l’établissement de « cartes », de « graphes »,
d’« arbres » opérant à distance des textes. Mais les résultats mathématiques
ne sont rien sans des représentations et la production de graphes et de
formes. D’où un premier saut, consistant à passer à des résultats visuali-
sables : « la quantiication pose le problème, la forme apporte la solution »,
écrit Moretti (2005 : 58) pour expliquer le passage à des représentations
unidimensionnelles déployant, en regard de la chronologie, les possibles
formels des œuvres littéraires du xixe siècle qui constituent son corpus et
son objet. Par ailleurs, loin d’être neutres, les résultats de cette tentative de
retrouver une sorte d’universel du roman sont nourris de sous-entendus
interprétatifs liés à une conception héritée de Lukács – historiciste, si ce
n’est évolutionniste – de la « vie » des formes et des productions culturelles
(Escola, 2008). Ce passage du descriptif au narratif est donc un retour à
un grand récit interprétatif, dans lequel les écarts constatés (apparition
de tel ou tel sous-genre) et les luctuations sont moins considérés comme
des possibles non réalisés que comme des indices de surdétermination
historique inéluctable, dans laquelle les chefs-d’œuvre reconnus restent
des points d’inlexion et de référence fondamentale.
Le geste épistémologique le plus fort des travaux de Moretti est d’avoir
tenté d’objectiver, pour les abstraire, les différentes variables déinissant les
œuvres littéraires (genres, formes, etc.) ain de permettre des changements
d’échelle d’analyse. L’accroissement numérique des corpus et surtout cet
« aplatissement » des textes littéraires dans l’espace numérique selon des
normes propres aux besoins généraux de cohérence et d’indexation du web
et selon des sémantiques globales offrent des perspectives particulièrement
intéressantes : ils permettent d’interroger des corpus qui ne hiérarchisent
pas a priori les entités informationnelles, en sorte que peuvent émerger
par un rapport concret au « terrain » des entités « authentiquement empi-
riques, à jamais éloignées de la simple illustration de concepts pré-donnés »

68
Les enjeux épistémologiques des humanités numériques

(Monnin, 2012 10). Ainsi les modes de sémantisation généraux déployés pour
les textes littéraires, comme les corpus élargis par rapport aux déinitions
restrictives du champ littéraire et critique et qui contiennent autant des
grandes œuvres canoniques peuvent proposer des rapprochements origi-
naux et conduire à des constats à mille lieues des présupposés de départ.
La recherche plein texte permet déjà des recontextualisations lexicales
ou conceptuelles parfois inattendues, et les opérations de rapprochement
textuel automatisé font émerger des accointances lexicales ou des réécri-
tures (voire des reprises non assumées) entre des passages parfois de prime
abord éloignés, sans connaissance au départ des sources et des modes de
transmission intertextuelle, nous exposant à bien des surprises. Par-delà le
« formalisme quantitatif » développé à Stanford par Franco Moretti (analyse
de mots grammaticaux et de traits formels/énonciatifs), d’autres méthodes
de data mining (fouille de données) offrent des perspectives intéressantes :
sans que le point de départ soit un texte particulier, il est ainsi possible
de cartographier les afinités entre différents textes selon une requête
particulière ; il est également envisageable d’effectuer des classiications
automatiques de documents selon des méthodes de classiication bayésienne
ou selon celle des « k plus proches voisins », algorithmes permettant de
déterminer empiriquement des communautés de vocabulaire. Au contraire,
il est possible de proposer des analyses contrastives entre des corpus prédé-
inis. Des expériences de classiication thématique ou stylistique et surtout
d’interrogation des classiications admises extrêmement variées peuvent
alors être tentées, et des modes de représentation originaux proposés. Qu’il
s’agisse de suivre sur la longue durée l’évolution d’un concept (en comparant
le lexique des « voisins distributionnels » autour des termes et noms propres
pivots), d’une forme ou d’un champ à l’aide de diagrammes 11, d’entraîner une
machine à découvrir des œuvres cachées dans une production éditoriale

10. Alexandre Monnin s’appuie sur Tristan Garcia (2011) du côté de la métaphysique et
sur Bruno Latour du côté de la sociologie.
11. Voir le travail de Mark Algee-‐Hewitt, « Mapping the sublime: A computer‐assisted
reading of eighteenth‐century aesthetics », engagé à partir de sa thèse (Algee-Hewitt,
2008) : l’usage de diagrammes de Voronoï a permis la découverte des multiples groupes
sémantiques qui ont établi des distinctions plus claires entre les sublimes « théologique »,
« naturel » et les versions « esthétiques » du sublime.

69
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

qui n’a pas été étiquetée comme littéraire, de s’interroger sur les conditions
de réception d’une œuvre en comparant des catalogues et des canons, ou
de se laisser surprendre en essayant de regarder les corrélations possibles
entre métadonnées et formes textuelles, on peut produire toute une série
d’expériences d’imagerie littéraire. Les possibilités expérimentales per-
mises par l’agrégation de données hétérogènes sont ininiment variées et
vont des cartes géolocalisant des métadonnées géographiques, des cartes
des réseaux relationnels (entre personnages, auteurs, etc.) à la fouille des
réseaux sociaux permettant d’interroger les modalités de construction de
l’auctorialité (c’est-à-dire l’autorité juridique et symbolique de l’écrivain) et
de la valeur, la sociologie (vériier par exemple les hypothèses de la socio-
logie bourdieusienne des champs) aussi bien que l’histoire des poétiques
(en produisant une histoire objectivée de l’évolution des styles) ou la théorie
littéraire (en la confrontant aux formulations variables de ses concepts et
de l’idée même de littérature).

Conclusion
L’émergence des humanités numériques va de pair avec une perte d’insu-
larité disciplinaire et géographique, et l’accès permis par les bases de
données numériques au contexte culturel et aux détails d’une aventure
littéraire offre le projet d’une lecture active de l’œuvre et d’une forme
novatrice d’appropriation de la critique, foncièrement interdisciplinaire
et désormais ouverte au débat et à l’intelligence collective. Les humani-
tés numériques sont favorisées et favorisent en retour l’émergence d’une
épistémologie empirique et décentrée, indissociable d’une approche
pragmatique, interdisciplinaire, décloisonnée des faits culturels. Celle-
ci ambitionne de se couper de catégories préconstruites et des schémas
préfabriqués au proit d’une ontologie centrée sur leurs objets et d’une
heuristique computationnelle et comme autonomisée (Ramsay, 2011).
Ce tournant épistémologique conduit à la production de logiques moins
essentialistes, ou critiques, que descriptives, transactionnelles et expéri-
mentales. Cette épistémologie consonne avec d’autres courants majeurs
contemporains : la sociologie contemporaine de Latour ou de Goffmann
centrée sur les usages, qui reconnaît l’autonomie des acteurs et des objets
dans une « ontologie plate » ; les philosophies wittgensteiniennes des

70
Les enjeux épistémologiques des humanités numériques

pratiques ordinaires comme la « philosophie expérimentale » et les modèles


matérialistes produits par les sciences cognitives (Harman, 2009 ; Smith,
2011 ; Halpin et Monnin, 2012). Ce qu’Eileen Joy nomme les « object-oriented
reading modes », propres au tour informationnel et computationnel des huma-
nités numériques (Joy, 2011), s’accompagne ainsi d’une interdisciplinarité
nouvelle, notamment avec les data sciences (sciences des données), comme
d’un tournant descriptif, désessentialisant et interrogeant les frontières
mêmes de la littérature, dont les concepts sont censés être décrochés des
hiérarchies héritées et des pièges des méthodes hypothético-déductives.
Plus encore que la sociologie ou l’anthropologie culturelle, les humanités
numériques font du texte littéraire, pour le meilleur ou pour le pire, un
discours parmi d’autres, connecté à d’autres, et dont les nœuds relèvent
non d’un système de valeurs mais d’une « ontologie plate ».
Loin d’être mécanique et purement quantitative, la deuxième génération
des travaux des humanités numériques est « qualitative, interprétative,
émotive, générative », comme l’écrivent les auteurs du Digital Humanities
Manifesto 2.0 (Schnapp et Presner, 2009 ; voir Berry, 2011). L’analyse des
discours et de leurs situations d’énonciation concrètes permettrait, par
exemple, de circonvenir les téléologies du « littéraire », si prégnantes lorsque
l’on fait, en l’anthropomorphisant, une histoire de la littérature et de son
autonomisation supposée au xixe siècle : d’autres canons, d’autres regrou-
pements, d’autres logiques seraient discernables si l’on disposait de corpus
sufisamment larges et bien édités pour voir se transformer les genres et
les valeurs littéraires dans l’espace large des savoirs et des représentations.
Émergeraient alors, par les expériences de fouille des textes, des cohérences ou
des signaux étranges permettant de brasser à nouveaux frais des structures
consacrées, de faire apparaître des pans oubliés de la littérature, de signaler
des cas atypiques posant à l’interprétation de nouvelles questions… Nous
voilà loin du risque d’un nouveau scientisme où la littérature – ses noms,
ses champs, ses valeurs –, à l’état de données, serait réduite à une curieuse
activité humaine statistique qui se mesure sans se lire, se dessine sans
s’interpréter, se dévoile sans avoir besoin de se laisser raconter.

Ce travail a bénéicié d’une aide d’État gérée par l’Agence nationale de la recherche
dans le cadre des investissements d’avenir portant la référence ANR-11-IDEX-0004-02.

71
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

Références ESCOLA, Marc, 2008,


« Voir de loin. Extension du domaine
bibliographiques de l’histoire littéraire », Acta fabula,
vol. 9, no 6, « Essais critiques », juin.
ALGEE-HEWITT, Mark, 2008, Consultable en ligne : <http://www.
« The afterlife of the sublime: Toward fabula.org/revue/document4291.php>.
a new history of aesthetics in the long
eighteenth century », Dissertation, GARCIA, Tristan, 2011,
New York University. Forme et objet : un traité des choses,
Paris, Presses universitaires de France.
BARTSCHERER, Thomas
et COOVER, Roderick (dir.), 2011, GOLD, Matthew K. (dir.), 2012,
Switching Codes: Thinking Through Digital Debates in the Digital Humanities,
Technology in the Humanities and the Minneapolis, University of Minnesota Press.
Arts, Chicago, University of Chicago Press. GOODWIN, Jonathan
BASSEZ, Danielle, 2006, et HOLBO, John (dir.), 2011,
Écrits dans les marges : de la pratique Reading Graphs, Maps, and Trees:
du gribouillage comme art gourmand Responses to Franco Moretti, Anderson,
de la lecture, Le Chambon-sur-Lignon, Parlor Press. Consultable en ligne :
Cheyne. <http://www.parlorpress.com/pdf/
ReadingMapsGraphsTrees.pdf>.
BERNERS-LEE, Tim, HENDLER, James
et LASSILA, Ora, 2001, GUICHARD, Éric, 2013,
« The semantic Web », Scientiic « L’internet et les épistémologies des
American (en ligne), mis en ligne sciences humaines et sociales », Équipe
le 17 mai 2001. Consultable en ligne : Réseaux, Savoirs et Territoires, ENS
<http://www.cs.umd.edu/~golbeck/ (en ligne), février. Consultable en ligne :
LBSC690/SemanticWeb.html>. <http://barthes.ens.fr/articles/Guichard-
RSL.html>.
BERRY, David M., 2011,
« The computational turn: Thinking HALPIN, Harry
about the digital humanities », Culture et MONNIN, Alexandre (dir.), 2012,
Machine, vol. 12 (en ligne). Consultable « Philoweb: Toward a philosophy
en ligne : <http://www.culturemachine. of the Web », numéro spécial de
net/index.php/cm/article/ Metaphilosophy, vol. 43, no 4, juillet,
viewArticle/440>. p. 361-532.

– (dir.), 2012, Understanding Digital HARMAN, Graham, 2009,


Humanities, Handmills (Basingstoke, Prince of Networks: Bruno Latour and
Hampshire), New York, Palgrave Metaphysics, Melbourne, Re.press.
Macmillan. JACKSON, H. J., 2001,
CHATELAIN, Jean-Marc (dir.), 1999, Marginalia: Readers Writing in Books,
Le Livre annoté : de l’Antiquité à New Haven et Londres, Yale University
Stendhal, Revue de la Bibliothèque Press.
nationale de France, no 2, Paris, BnF. JAJAH, Marc, 2012a,
DOUEIHI, Milad, 2011, « Les 4 royaumes de l’annotation
Pour un humanisme numérique, Paris, (1500-2012) », Marginalia – Savoir(s)
Éditions du Seuil. d’annotateurs, mis en ligne le 13 avril.

72
Les enjeux épistémologiques des humanités numériques

Consultable en ligne : <http://marginalia. et Informatique, numéro spécial,


hypotheses.org/18186>. 2002, p. 1-11. Consultable en ligne :
<http://halshs.archives-ouvertes.fr/
–, 2012b, « Bienfaits et méfaits des
hal-00586512/>.
annotations partagées », Marginalia –
Savoir(s) d’annotateurs, mis en ligne le –, 2007, « Philologie et/ou
10 mai . Consultable en ligne : <http:// herméneutique numérique :
marginalia.hypotheses.org/18467>. nouveaux concepts pour de nouvelles
pratiques ? », in Michel Ballabriga et
–, 2013a, « Annotated books online :
François Rastier (dir.), Corpus en Lettres
découvrir les annotations des premiers
et Sciences sociales. Des documents
siècles de l’imprimerie », Marginalia –
numériques à l’interprétation, actes
Savoir(s) d’annotateurs, mis en ligne
du XXVIIe colloque d’Albi, « Langages et
le 31 janvier. Consultable en ligne :
signiication », publiés par Carine Duteil-
<http://marginalia.hypotheses.org/
Mougel et Baptiste Foulquié, Toulouse,
page/2>.
Presses universitaires du Mirail.
–, 2013b, « La lumière de l’annotation : Consultable en ligne : <http://www.
pour une esthétique de la pénombre dans revue-texto.net/Parutions/Livres-E/Albi-
les espaces numériques », Marginalia 2006/Mayaffre.pdf>.
– Savoir(s) d’annotateurs, mis en ligne
MAYER-SCHÖNBERGER, Viktor, 2011,
le 7 mai. Consultable en ligne : <http://
Delete: The Virtue of Forgetting in
marginalia.hypotheses.org/23140>.
the Digital Age, Princeton, Princeton
–, 2013c, « Rhétorique des marginalia University Press.
imprimées », Marginalia – Savoir(s)
MCNAMEE, Kathleen, 1992,
d’annotateurs, mis en ligne le 2 juillet.
Sigla and Select Marginalia in Greek
Consultable en ligne : <http://marginalia.
Literari Papyri, Bruxelles, Fondation
hypotheses.org/23646>.
égyptologique Reine Élisabeth.
JOCKERS, Matthew L., 2013,
MONNIN, Alexandre, 2012,
Macroanalysis: Digital Methods and
« L’ingénierie philosophique comme
Literary History, Urbana, University of
design ontologique : retour sur
Illinois Press.
l’émergence de la “ressource” »,
JOY, Eileen, 2011, Réel-virtuel : enjeux du numérique,
« Swedish Twitter university lecture: no 3, « Archéologie des nouvelles
Eileen (again) on object-oriented reading technologies », avril. Consultable en
modes ». Consultable en ligne : <http:// ligne : <http://reelvirtuel.univ-paris1.fr/
punctumbooks.com/blog/swedish-twitter- index.php?/revue-en-ligne/3-monnin/>.
university-lecture-eileen-again-on-object-
MORETTI, Franco, 2005,
oriented-reading-modes/>.
Graphs, Maps, Trees: Abstract Models for
L ANDOW, George P., 2006, a Literary History, Londres et New York,
Hypertext 3.0: Critical Theory and New Verso.
Media in an Era of Globalization, Baltimore,
MOROZOV, Evgeny, 2011,
Johns Hopkins University Press.
The Net Delusion: The Dark Side
MAYAFFRE, Damon, 2002, of Internet Freedom, New York,
« L’Herméneutique numérique », PublicAffairs.
L’Astrolabe. Recherche littéraire

73
DOSSIER LE TOURNANT NUMÉRIQUE… ET APRÈS ?

MOUNIER, Pierre (dir.), 2012, VIPREY, Jean-Marie, 2005,


Read/write book 2 : une introduction « Philologie numérique et herméneutique
aux humanités numériques, Marseille, intégrative », in Jean-Michel Adam et
OpenEdition Press. Consultable en Ute Heidmann (dir.), Sciences du texte
ligne : <http://books.openedition.org/ et analyse de discours : enjeux d’une
oep/226>>. interdisciplinarité, Genève, Slatkine
érudition, p. 51-68.
R AMSAY, Stephen, 2011,
Reading Machines: Toward WIEVIORKA, Michel, 2013,
an Algorithmic Criticism, Urbana, L’Impératif numérique, ou La nouvelle
University of Illinois Press. ère des sciences humaines et sociales ?,
Paris, CNRS éditions.
R ASTIER, François, 2001,
Arts et sciences du texte, Paris, WOLFE, Joanna
Presses universitaires de France. et NEUWIRTH, Christine M., 2001,
« From the margins to the center:
ROMARY, Laurent
The future of annotation », Journal of
et H UDRISIER, Henri, sans date,
Business and Technical Communication,
« Ingénierie linguistique – les ressources
vol. 15, no 3, p. 333-371.
linguistiques : TEI – Text encoding
initiative ». Consultable en ligne : <http://
www.culture.gouv.fr/culture/dglf/rifal/
tei.htm>.
SCHNAPP, Jeffrey
et PRESNER, Todd, 2009,
The Digital Humanities Manifesto 2.0.
Consultable en ligne : <http://www.
humanitiesblast.com/manifesto/
Manifesto_V2.pdf>.
SHERMAN, William H., 2009,
Used Books: Marking Readers in
Renaissance England, Philadelphia,
University of Pennsylvania Press.
SIMONE, Raffaele, 2012,
Pris dans la toile : l’esprit aux temps
du web, traduit de l’italien par Gérald
Larché, Paris, Gallimard.
SLIGHTS, William W. E., 2001,
Managing Readers: Printed Marginalia in
English Renaissance Books, Ann Arbor,
University of Michigan Press.
SMITH, Brian Cantwell, 2011,
On the Origin of Objects, Cambridge et
Londres, The MIT Press.

Vous aimerez peut-être aussi