Ressources numériques en sciences humaines et sociales OpenEdition Nos plateformes OpenEdition Books OpenEdition Journals Hypothèses Calenda Bibliothèques OpenEdition Freemium Suivez-nous

TIPS-IA

Rendre la transcription automatisée plus efficace et mieux utilisée en SHS

Porteur·ses et affiliations

Groupe de travail thématique TIPS-IA :Transcription Interface Pipeline Synergie – Intelligence Artificielle ( https://mate-shs.cnrs.fr/les-groupes/groupes-thematiques/tips-ia/ ) coordonné par Max Beligné, Ingénieur de recherche, Plateforme Universitaire de Données, MSH-Alpes, UGA

Partenaires : – IR* Progedo
                     – IR* Huma-Num


Contexte et problématique

La transcription automatisée (speech to text) est de plus en plus utilisée, notamment depuis la diffusion du modèle Whisper d’OpenAI (https://openai.com/fr-FR/index/whisper/). Cet essor s’accompagne de plusieurs difficultés :


Objectifs, méthodologies et livrables

Notre projet répond à ces différents points :

  • Le premier objectif est de réaliser un benchmark de quelques nouveaux modèles dans une perspective d’intégration à des outils de transcription en production. En effet, il existe déjà des benchmarks standards mais il est nécessaire de tester les modèles dans des conditions proches des situations réelles (audio possiblement bruité, de tailles variables, dans des langues multiples… ) avant d’envisager de les utiliser vraiment dans des services en production. Si ce benchmark met en avant des résultats intéressants, de premières intégrations seront réalisées et testées dans le service grenoblois Tadddam. Ces évolutions seront partagées notamment via le groupe de travail TIPS-IA et l’IR* Huma-Num.
  • Pour la correction et l’intégration de l’étape de pseudonymisation/anonymisation, un travail a commencé avec Alex Alber (sociologue à l’Université de Tours) à travers un outil intitulé Whispurge ( https://sonal-info.com/whispurge.html ). Ce travail sera poursuivi avec la volonté qu’il puisse être intégré également dans d’autres outils. Un travail de communication sera effectué autour de ces nouvelles possibilités techniques. Une attention particulière sera apportée aux retours des utilisateurs pour faire évoluer cet outillage.
  • Au niveau de la communication et notamment de la formation des Master, une première étape sera réalisée à l’université Grenoble Alpes. L’objectif est d’éprouver un support pédagogique qui pourra ensuite être diffusé et réutilisé pour faire une promotion plus large des bonnes pratiques en matière de transcription automatisée.


OpenEdition vous propose de citer ce billet de la manière suivante :
GisUrfist (2 février 2026). TIPS-IA. GIS Réseau Urfist. Consulté le 8 mai 2026 à l’adresse https://doi.org/10.58079/15lou


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This site uses Akismet to reduce spam. Learn how your comment data is processed.