Michaël Bourgatte et Anatole Grimaldi participeront au colloque Méthodes pour les sciences sociales et les humanités organisé au Campus Condorcet du 9 au 10 juillet 2026. Ce colloque est une nouvelle conférence annuelle, dont l’objectif est de créer un forum de discussion académique centré autour des enjeux méthodologiques et regroupant l’ensemble des disciplines des SHS. Il a été créé à l’initiative d’Huma-Num.
Notre proposition de communication porte sur l’axe “Données vidéo en ligne et réseaux d’analyse”.
Voici le résumé de cette proposition :
Dans un contexte récent de croissance exponentielle des recherches en SHS sur des corpus audiovisuels, la question des moyens et des outils d’analyse des données vidéo s’est posée avec force au sein de la communauté des chercheur·ses réuni·es au sein du consortium Huma-num Canevas, de l’ERC Stage, des ANR STREAMédia, Tractive et Numalyse ou encore des projets comme Millenium ou Moebius ou Premiere (Bourgatte et al., 2025). Ainsi, plusieurs solutions sont d’ores et déjà été proposées pour archiver ou analyser les vidéos, tandis que d’autres restent à venir, en particulier autour de l’usage des IA. En effet, l’analyse des contenus audiovisuels a longtemps été réduite à la seule perspective du “close viewing”, c’est-à-dire de l’analyse qualitative sur des corpus réduits ; mais elle est désormais à l’aube d’une nouvelle approche : celle du “distant viewing” impliquant l’emploi de technologies d’analyse automatisée pour travailler sur des corpus massifs (Arnold, Tilton, 2023).
La plupart des données vidéo produites ou analysées par les chercheur·ses sont hébergées sur YouTube qui occupe une position monopolistique depuis plus de 20 ans (Assilaméhou-Kunz, Rebillard, 2022), même si le format vidéo a été renouvelé par d’autres services comme TikTok ou Instagram. Mais l’accélération de la circulation de ces contenus soulève pour les chercheur·ses deux principales difficultés qui se situent 1) au niveau de l’archive de la vidéo et 2) de la possibilité de l’analyser tout en respectant la dynamique de science ouverte et de FAIRisation des données.
1) PeerTube, une technologie française développée par l’association Framasoft, favorise l’archivage de vidéos sur des serveurs en propre tout en maintenant une interconnexion entre l’ensemble des serveurs pour que les chercheur·ses puissent partager leurs corpus (Tessier, 2025). PeerTube est aussi équipé d’une technologie de synchronisation permettant de copier et d’archiver des vidéos YouTube en embarquant l’ensemble des métadonnées ; il est également possible de déposer ses données une à une sur son serveur.
2) L’étape de l’analyse implique ensuite d’utiliser un outil d’annotation audiovisuelle. Les outils développés (Advene, Lignes de Temps, Dicto) présentent deux limites principales : d’une part ils sont peu adaptés à l’analyse de corpus multimodaux, d’autre part ils ne respectent pas toujours les principes de la science ouverte et de la FAIRisation. À la faveur de financements nationaux (labellisation Huma-Num) et européens (financement EOSC-OSCARS), le consortium Canevas a développé l’outil Celluloid permettant d’archiver et d’analyser des corpus audiovisuels numériques ou numérisés, en étant interconnecté à PeerTube (Bourgatte & Tessier, 2018). Il propose deux méthodes distinctes pour analyser des vidéos. La première est à l’initiative de l’usager : il peut décider de la durée de ses annotations, des formes qu’il souhaite identifier, et un bloc-note sous la vidéo lui permet de dissocier le texte de la matière filmique. La seconde est automatisée : l’IA permet d’opérer une segmentation de la vidéo par plan et l’audio de la vidéo est retranscrit automatiquement sous la vidéo. De cette façon, cet outil renouvelle les méthodes d’étude de corpus audiovisuels en permettant d’intégrer pleinement la multimodalité, ainsi que la plurisémioticité des vidéos dans le champ de la recherche.
Deux terrains engagés récemment, d’une part, sur un corpus de vidéos issues de médias français de réinformation d’extrême droite sur YouTube (VA Plus, Boulevard Voltaire et Frontières), et d’autre part, sur un corpus de vidéos militantes publiées, là encore, sur YouTube par l’ONG B’Tselem, permettent d’identifier des signifiants clés (Burgess, 2008) qui portent la trace d’une idéologie militante. L’objectif de cette communication sera de présenter une analyse qualitative et quantitative de ces corpus de recherche pour croiser des matériaux hétérogènes mais solidement arrimés à une méthodologie commune de fouille des images.
Références :
Arnold, T., & Tilton, L. (2023). Distant Viewing : Computational Exploration of Digital Images. MIT Press.
Assilaméhou-Kunz, Y., Assilaméhou-Kunz, Y., Rebillard, F., & Rebillard, F. (2022). La machine YouTube : Contradictions d’une plateforme d’expression. C&F éditions.
Bourgatte, M., Boutin, P., Chantraine, C., & Tessier, L. (2025). Des corpus audiovisuels en sciences humaines et sociales. MkF éditions.
Bourgatte, M. & Tessier, L. (2018). Chapitre 1. Les outils d’annotation vidéo pour la recherche. Dans É. Cavalié, F. Clavert, O. Legendre, & D. Martin (dir.), Expérimenter les humanités numériques : Des outils individuels aux projets collectifs
Burgess, J. (2008). “All Your Chocolate Rain Are Belong to Us’?”. Dans. Lovink. G., Niederer. S. (dir.). Video Vortex Reader. Responses to YouTube (p. 101-110). Institute of Network Cultures.
Ginzburg, C. (1989). Traces. Racines d’un paradigme indiciaire. In C. Ginzburg, Mythes, emblèmes, traces. Morphologie de l’histoire (p. 139‑180). Flammarion.
Tessier, L. (2025). Dégoogliser l’éducation ?: Les cas de PeerTube et Celluloid en tant qu’alternatives à YouTube. Réseaux, 254(6), 219‑235. https://doi.org/10.3917/res.254.0219
OpenEdition vous propose de citer ce billet de la manière suivante :
Anatole Grimaldi (27 mars 2026). Colloque MeSSH 2026. Consortium Huma-Num CANEVAS. Consulté le 7 mai 2026 à l’adresse https://doi.org/10.58079/15yfr
