Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.1 Introduction
La parole est un moyen de transmettre nos pensées, nos émotions et nos sentiments. Elle est
aussi une image sur notre santé et elle peut être porteuse d’informations sur notre situation
sociale. D’autre part, la voix est le support acoustique de la parole. Une altération ou une lésion
de la voix peut donner lieu à des conséquences négatives sur notre vie quotidienne et nécessite
la consultation d’un spécialiste de la voix [Boudjerda, 2018].
Dans ce chapitre, nous présentons un état de l’art complet sur les outils numériques d’analyse
de la voix et des pathologies vocales. Nous commencerons par une description de l’anatomie et
du mécanisme de production de la voix, suivie d’une classification des principales pathologies
vocales. Ensuite, nous explorerons les méthodes d’évaluation utilisées (perceptives et
instrumentales), les logiciels disponibles (commerciaux, open-source, mobiles), leurs
fonctionnalités, ainsi que leurs limites. Enfin, une section est consacrée à la base de données
Saarbruecken Voice Database (SVD), largement utilisée pour l’entraînement et la validation
des systèmes d’analyse vocale.
I.2 Anatomie du système phonatoire
L’appareil phonatoire comporte trois parties : l’appareil respiratoire, l’ensemble laryngé et
les cavités supra-glottiques.
Figure I.1 – L’appareil phonatoire [FLE Nantes, 2022].
3
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.2.1 L'ensemble sous-glottique
Il fournit l'air nécessaire à la production des sons. L’air sort des poumons et passe par la
trachée et le son se produit au moment de l'expiration [Haddadi, 2022].
1.2.2 L’ensemble laryngé (larynx)
Le larynx comprend les cordes vocales (deux bandes de tissu élastiques). Elles sont formées
d’une paire de muscles situés de chaque côté de l’ouverture de la trachée. Le larynx est l'organe
le plus important de l'appareil phonatoire Les cordes vocales laissent paraître une ouverture
c'est la glotte (partie centrale du larynx). Si les cordes vocales sont ouvertes on entend un son
non- voisé ou sourd comme [P] par exemple, mais si elles se rapprochent et vibrent on aura un
son voisé ou sonore comme [b] [Haddadi, 2022].
Figure I.2 – La zone laryngée [Taoufik, 2020].
I.2.3 L’ensemble supra-glottique ou cavités supra-glottiques
Il joue le rôle de résonateur et où se produisent la plupart des bruits utilisés dans la parole.
Les organes vocaux sont les parties du corps impliquées dans la production de la parole [Segui
et al, 2000].
a. Le pharynx (ou cavité pharyngale) : Le pharynx est l'espace où les voies digestives croisent
les voies respiratoires (carrefour entre les voies respiratoires et le tube digestif)
4
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
Figure I.3 – L’anatomie du pharynx [Madhero88, 2010].
b. La cavité buccale : En ce qui concerne la mâchoire supérieure, il existe une structure appelée
"voûte palatine" située au niveau du palais. Cette voûte palatine peut être divisée en trois parties
distinctes : les alvéoles, qui représentent la partie interne de la gencive, le palais dur au milieu,
et à l'arrière se trouve le palais mou, également connu sous le nom de "voile du palais".
En ce qui concerne la mâchoire inférieure, c'est la langue qui est responsable des
mouvements.
On peut distinguer la pointe de la langue, également appelée "apex", ainsi que le dos de la
langue. Les lèvres et les dents jouent également un rôle dans la production des sons.
c. Les fosses nasales ou cavités nasales : Ce sont les deux cavités du nez séparées par une
cloison cartilagineuse [Haddadi, 2022].
Figure I.4 – Anatomie de la cavité nasale [Royer, P., 2014].
5
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.2.4 Mécanisme de production de la parole
La communication verbale implique des fluctuations de pression de l'air générées par le
système articulatoire. L'air est comprimé dans les poumons grâce au diaphragme. Il atteint
ensuite les cordes vocales, qui peuvent être écartées pour permettre le passage libre de l'air,
produisant ainsi des bruits. Si les cordes vocales sont fermées, la pression de l'air les met en
vibration, créant ainsi des sons périodiques.
Les sons, qu'ils soient vibrants ou non, traversent ensuite le conduit vocal, qui est façonné
par la position des articulateurs tels que la langue, la mâchoire, les lèvres et le palais mou. La
forme du conduit vocal détermine le timbre des différents sons de la parole. Le conduit vocal
agit comme un filtre pour les différentes sources de production de la parole, telles que les
vibrations des cordes vocales ou les turbulences créées par le passage de l'air à travers les
constrictions du conduit vocal. Le son résultant peut être classé comme voisé ou non voisé en
fonction de la vibration ou de l'absence de vibration des cordes vocales.
I.2.5 Pathologies vocales
Les pathologies vocales désignent l’ensemble des troubles affectant la qualité, la fréquence,
l’intensité ou la stabilité de la voix, dus à des altérations de l’appareil phonatoire. Ces troubles
peuvent être temporaires ou chroniques, bénins ou graves, et ils compromettent la capacité à
produire une voix normale, impactant ainsi la communication et la qualité de vie. On distingue
plusieurs grands types de pathologies vocales :
a. Laryngites chroniques : La dysphonie, définie comme une modification anormale de la
voix, peut être l’unique symptôme révélateur d’inflammations chroniques du larynx. Ces
laryngites durables touchent les cordes vocales et sont fréquemment favorisées par des facteurs
tels que le tabagisme prolongé ou les infections des voies respiratoires supérieures, comme la
sinusite chronique [Reyt, 2002].
b. Cancer du larynx : Ces tumeurs sont souvent associées à une exposition prolongée au tabac.
Environ la moitié des patients diagnostiqués présentent une survie à 5 ans, tous stades
confondus. Un diagnostic précoce, initié dès les premiers signes de dysphonie, peut permettre
des traitements conservateurs plus efficaces et améliorer considérablement le pronostic
fonctionnel et vital [Tran, 1998].
Figure I.5 – Cancer du larynx [Schiff, 2022].
6
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
c. Nodules : Fréquents chez les enfants et les femmes, en particulier chez les chanteuses
utilisant fréquemment des registres aigus, les nodules résultent d’un usage excessif ou inadapté
du larynx. La prise en charge dépend de la taille, de la chronicité des lésions et des troubles
vocaux associés, et peut inclure un suivi orthophonique ou une intervention chirurgicale.
Figure I.6 – Nodules bilatéraux [Yanagisawa, 2023].
d. Polypes : Les polypes sont des excroissances muqueuses, souvent unilatérales, se distinguant
des nodules par leur forme et leur diversité. Ils résultent d’un excès de liquide sous-muqueux
lié à une irritation chronique, une allergie ou une laryngite inflammatoire partiellement résolue.
Un enrouement peut persister. Un diagnostic précis repose sur une évaluation histologique, en
complément de l’analyse acoustique [Teston, 2004].
Figure I.7 – Polype chordale [Yanagisawa, 2023].
7
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.3 Méthodes d’évaluation de la voix
I.3.1 Évaluation perceptive
L’évaluation perceptive de la voix représente la méthode traditionnelle, mais également
fondamentale, pour apprécier la qualité vocale. Elle repose sur l’écoute attentive et le jugement
subjectif d’experts phoniatres ou orthophonistes spécialement formés, qui analysent différents
paramètres de la voix tels que le timbre, la rugosité, le souffle ou encore l’instabilité. Ces
évaluations sont généralement réalisées à l’aide d’échelles perceptives standardisées, telles que
le protocole GRBAS (Grade, Roughness, Breathiness, Asthenia, Strain), proposé par Hirano en
1981 [Hirano, M. 1981], ou la VAS (Visual Analogue Scale).
Ces outils permettent d’obtenir une estimation qualitative du trouble vocal, bien que cette
approche reste sensible à la variabilité inter- et intra-évaluateurs.
I.3.1.1 Échelle GRBAS
Est l'une des plus utilisées internationalement. Elle évalue cinq paramètres sur une échelle
de 0 à 3 (0 = normal, 3 = sévère) [Hirano, M. 1981] :
• G (Grade) : degré global de dysphonie
• R (Roughness) : raucité/irrégularité de la vibration des cordes vocales
• B (Breathiness) : souffle/fuite d'air audible pendant la phonation
• A (Asthenia) : faiblesse/manque de puissance vocale
• S (Strain) : tension/effort vocal excessif
I.3.1.2 Échelle CAPE-V (Consensus Auditory-Perceptual Evaluation of Voice)
Utilise une échelle visuelle analogique pour évaluer six paramètres : sévérité globale, raucité,
souffle, tension, hauteur, intensité, avec possibilité d'ajouter des paramètres supplémentaires
[Kempster et al., 2009].
I.3.2 Évaluation instrumentale
L’évaluation instrumentale de la voix vient en complément de l’approche perceptive en
apportant des mesures objectives, reproductibles et quantifiables des paramètres vocaux.
Elle repose sur l’analyse acoustique, aérodynamique ou électroglottographique du signal
vocal, permettant de caractériser finement des aspects tels que la fréquence fondamentale (F0),
le jitter, le shimmer, ou encore le rapport signal/bruit harmonique (HNR). Ces indicateurs,
souvent appelés biomarqueurs acoustiques, offrent une appréciation chiffrée des altérations
vocales, parfois imperceptibles à l’oreille humaine, et sont essentiels pour le suivi longitudinal
de pathologies vocales ou l’évaluation de l’efficacité des traitements.
Les outils utilisés pour ce type d’analyse incluent des logiciels spécialisés comme Praat,
MDVP (KayPENTAX), ou encore des indices synthétiques comme l’AVQI (Acoustic Voice
Quality Index), reconnu pour sa validité clinique [Maryn et al., 2010] [Maryn & Weenink,
2015].
8
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.3.2.1 Analyse acoustique
Utilise des logiciels spécialisés (Praat, CSL, MDVP) pour mesurer :
• Paramètres de fréquence : F0 (fréquence fondamentale), jitter (perturbation de fréquence)
• Paramètres d'amplitude : shimmer (perturbation d'amplitude), HNR (rapport
harmoniques/bruit).
• Mesures spectrales : LTAS (spectre moyen à long terme), MFCC (coefficients cepstraux).
• Indices composites: DSI (Dysphonia Severity Index), AVQI (Acoustic Voice Quality Index),
CPP (Cepstral Peak Prominence).
I.3.2.2 Analyse visuelle
Permet l'observation directe des cordes vocales et de leur fonctionnement :
• Vidéolaryngoscopie : observation du mouvement des cordes vocales
• Stroboscopie : évaluation de l'ondulation muqueuse et de la symétrie vibratoire
• Kymographie : représentation graphique du mouvement cordal dans le temps
Autres mesures instrumentales incluent l'aérodynamique (mesure du débit d'air, pressions
sous-glottiques) et l'électroglottographie (EGG) qui évalue le contact des cordes vocales
pendant la phonation.
L'approche multiparamétrique, combinant évaluations perceptive et instrumentale, offre une
vision complète et fiable de la fonction vocale, essentielle tant pour le diagnostic que pour le
suivi thérapeutique des pathologies vocales [Boersma, P, & Weenink, D. 2021].
I.3.4 Mécanisme de production de la parole
La communication verbale implique des fluctuations de pression de l'air générées par le
système articulatoire. L'air est comprimé dans les poumons grâce au diaphragme. Il atteint
ensuite les cordes vocales, qui peuvent être écartées pour permettre le passage libre de l'air,
produisant ainsi des bruits. Si les cordes vocales sont fermées, la pression de l'air les met en
vibration, créant ainsi des sons périodiques.
Les sons, qu'ils soient vibrants ou non, traversent ensuite le conduit vocal, qui est façonné
par la position des articulateurs tels que la langue, la mâchoire, les lèvres et le palais mou. La
forme du conduit vocal détermine le timbre des différents sons de la parole. Le conduit vocal
agit comme un filtre pour les différentes sources de production de la parole, telles que les
vibrations des cordes vocales ou les turbulences créées par le passage de l'air à travers les
constrictions du conduit vocal. Le son résultant peut être classé comme voisé ou non voisé en
fonction de la vibration ou de l'absence de vibration des cordes vocales.
9
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.4 Revue des logiciels et outils existants
L'analyse vocale s'appuie aujourd'hui sur une variété d'outils informatiques permettant
l'évaluation objective des paramètres acoustiques de la voix. Cette revue présente les principales
solutions disponibles, classées selon leur modèle de distribution et d'accessibilité.
I.4.1 Logiciels commerciaux
Les solutions commerciales offrent généralement des environnements intégrés avec des
fonctionnalités avancées et un support technique dédié.
I.4.1.1 Multi-Dimensional Voice Program (MDVP)
Fait partie de la suite Computerized Speech Lab (CSL) développée par KayPENTAX (Patel
et al, 2018). Ce logiciel de référence dans le milieu clinique permet l'extraction de plus de 30
paramètres acoustiques (jitter, shimmer, HNR, etc.) et propose des représentations normatives
pour l'interprétation des résultats. Son utilisation est largement documentée dans la littérature
scientifique, notamment pour l'évaluation des dysphonies [Bielamowicz et al, 1996].
Figure I.8 – Fenêtre d'analyse du logiciel MDVP [Ferrero, F. E, Pelamatti, G, & Vagges, K.
1985].
I.4.1.2 Computerized Speech Lab (CSL)
Le système CSL (Computerized Speech Lab) se distingue par sa grande compatibilité avec
une gamme complète de modules logiciels spécialisés, ce qui en fait une plateforme intégrée et
polyvalente pour l’analyse vocale clinique et expérimentale. Il est notamment compatible avec
des outils d’analyse acoustique tels que MDVP (Multi-Dimensional Voice Program), Real-
Time Pitch et Real-Time Spectrogram, qui permettent une évaluation fine et instantanée des
paramètres vocaux. Il prend également en charge des modules cliniques avancés comme
iCAPE-V et ADSV (Analysis of Dysphonia in Speech and Voice), conçus pour une évaluation
10
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
perceptive standardisée. Le CSL peut être utilisé conjointement avec des outils d’évaluation
neuromotrice (Motor Speech Profile), de feedback auditif, ou encore des programmes
pédagogiques comme Voice Games et Sona-Match, destinés à la rééducation vocale. Enfin, il
est aussi compatible avec des dispositifs physiologiques tels que le 6600 Phonatory
Aerodynamic System (PAS), permettant d’effectuer des mesures aérodynamiques précises.
Cette interopérabilité rend le CSL particulièrement adapté aux environnements cliniques
multidisciplinaires et à la recherche en phoniatrie [Roy et al, 2013].
Figure I.9 – Exemple d’utilisation du système CSL et de ses modules logiciels compatibles
pour l’analyse vocale clinique [Pentax Medical. 2023].
I.4.1.3 LingWAVES
Développé par WEVOSYS est un système d'évaluation vocale clinique qui combine analyse
acoustique et mesures aérodynamiques. Il propose des protocoles standardisés pour l'évaluation
du Voice Handicap Index (VHI) et inclut des modules spécifiques pour la rééducation vocale
avec biofeedback visuel [Uloza et al, 2017].
I.4.1.4 Dr. Speech
Offre plusieurs modules d'analyse vocale, dont Voice Assessment, Scope et Spectra. Ce
logiciel est particulièrement utilisé en milieu clinique pour sa facilité d'utilisation et ses rapports
automatisés [Madill & McCabe, 2011].
I.4.2 Applications mobiles et solutions web
L'émergence des technologies mobiles et du cloud a favorisé le développement de solutions
plus accessibles et portables.
I.4.2.1 VocaliD
Propose une plateforme web d'analyse vocale et de création de voix synthétiques
personnalisées. Initialement conçue pour les personnes ayant perdu leur voix, cette technologie
11
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
s'appuie sur l'intelligence artificielle pour analyser les caractéristiques vocales et créer des
banques de voix [Yamagishi et al, 2020].
I.4.2.2 Voice Analyst
Est une application mobile disponible sur iOS et Android qui permet l'analyse en temps réel de
paramètres vocaux fondamentaux comme la fréquence fondamentale, l'intensité et le temps
maximal de phonation. Son accessibilité en fait un outil apprécié pour le suivi quotidien des
patients [Mat Baki et al, 2015].
I.4.2.3 Voiceable
Offre une solution web d'évaluation et de suivi vocal destinée aux orthophonistes et leurs
patients. La plateforme permet l'enregistrement, l'analyse et le partage sécurisé des données
vocales, facilitant ainsi le suivi thérapeutique à distance [Van Stan et al, 2017].
I.4.2.4 VOCALAB
Développé par Gerip est un logiciel d'évaluation et de rééducation vocale disponible en
version desktop et web. Il propose des modules d'analyse acoustique et des exercices interactifs
pour la rééducation des troubles vocaux [Sicard et al, 2016].
I.4.3 Outils open-source
Les solutions open-source offrent une grande flexibilité et sont particulièrement prisées dans
le milieu de la recherche.
I.4.3.1 Praat
Développé par Boersma et Weenink (2021) à l'Université d'Amsterdam est devenu l'outil de
référence en phonétique acoustique. Ce logiciel gratuit et open-source permet l'analyse, la
synthèse et la manipulation de signaux vocaux. Sa flexibilité et son langage de script intégré en
font un outil particulièrement adapté à la recherche, mais aussi à l'usage clinique grâce à des
interfaces simplifiées développées par la communauté.
I.4.3.2 Parselmouth
Est une bibliothèque Python qui encapsule les fonctionnalités de Praat, permettant ainsi
d'intégrer l'analyse vocale dans des workflows de traitement de données plus complexes [Jadoul
et al, 2018]. Cette approche programmatique facilite l'automatisation des analyses et
l'intégration avec d'autres outils d'intelligence artificielle.
I.4.3.3 openSMILE (Speech & Music Interpretation by Large Space Extraction)
Est un outil d'extraction de caractéristiques audio développé par Eyben et al. (2010).
Particulièrement puissant pour l'extraction massive de paramètres acoustiques (plus de 6000
features), il est largement utilisé dans les applications de reconnaissance des émotions et de
classification vocale.
I.4.3.4 [Link]
Est une bibliothèque JavaScript permettant la visualisation et l'analyse de formes d'onde
audio directement dans le navigateur web. Son architecture modulaire facilite l'intégration dans
des applications web d'analyse vocale [Kinnunen & Li, 2010].
12
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.4.3.5 WORLD
Est un algorithme open-source de manipulation vocale qui permet l'extraction précise de la
fréquence fondamentale, des caractéristiques spectrales et de l'apériodicité. Particulièrement
efficace pour la synthèse et la transformation vocale, il est souvent utilisé dans les applications
de recherche sur la qualité vocale [Morise et al, 2016].
I.4.3 Caractéristiques des différents logiciels d'exploration et de rééducation
vocale
Fonctionnalités Paramètres Gratuit /
Logiciel Types
principals mesurés Payant
Fréquence
Analyse vocale,
Dr. Speech fondamentale,
Exploration, feedback visuel,
(Tiger temps maximal Payant
Rééducation exercices
Electronics) phonatoire,
thérapeutiques
étendue vocale
Visualisation en Hauteur tonale,
Visi-Pitch Exploration, temps réel, intensité, Payant (avec
(KayPENTAX) Rééducation exercices guidés, qualité vocale, matériel)
biofeedback stabilité
Analyse spectrale, Spectre
visualisation harmonique,
Exploration,
Vocevista d'harmoniques, formants, Payant
Pédagogie
spectrogramme en transitions
temps réel vocales
Maintien de
Exercices
hauteur,
interactifs,
contrôle
Speech Studio Rééducation progression par Payant
respiratoire,
niveaux,
coordination
biofeedback
phonatoire
Pression sous-
Analyse
glottique, débit
aérodynamique,
d’air, efficacité
mesures Payant
EVA (SQ-Lab) Exploration glottique,
physiologiques, (clinique)
coordination
acquisition
pneumo-
multiparamétrique
phonique
Cibles
Modélisation
acoustiques,
neurale, feedback
Rééducation, feedbacks Gratuit
DIVA sensorimoteur,
Recherche auditifs, (recherche)
paradigmes
paramètres
d’apprentissage
articulatoires
Tableau I.1 – Logiciels d’analyse, d’exploration et de rééducation vocale : types,
fonctionnalités, paramètres mesurés et accessibilité.
13
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.5 Limites des solutions existantes
Malgré les avancées significatives dans le domaine de l’analyse vocale, les outils actuels
présentent plusieurs limites qui freinent leur adoption dans la pratique clinique courante ou dans
le cadre du suivi personnel à domicile.
I.5.1 Accessibilité, coût et complexité d’usage
Les logiciels professionnels comme MDVP ou CSL sont performants, mais leur coût élevé
et leur dépendance à des matériels spécifiques les rendent difficilement accessibles, en
particulier dans les structures médicales aux ressources limitées ou dans les pays en
développement. De plus, leur interface utilisateur est souvent complexe, nécessitant une
formation préalable pour une utilisation efficace. Même des outils comme Praat, bien qu’open-
source, requièrent une maîtrise technique pour l’écriture de scripts, ce qui peut décourager les
cliniciens peu familiers avec les environnements de programmation.
I.5.2 Faible personnalisation et expérience utilisateur limitée
Nombre de ces logiciels ne sont pas conçus pour s’adapter aux besoins spécifiques des
patients ou des orthophonistes. Les options de personnalisation sont limitées, les interfaces
souvent peu intuitives, et la gestion des données patient reste sommaire. Il n’existe
généralement pas de fonctionnalités de suivi longitudinal, de génération de rapports automatisés
ou de visualisation simplifiée des progrès vocaux.
I.5.3 Manque de solutions intégrées au suivi à distance et à la téléconsultation
Dans un contexte où la médecine à distance prend de l’ampleur, notamment depuis la
pandémie de COVID-19, peu de solutions offrent une réelle compatibilité avec les pratiques de
téléconsultation. Les applications mobiles restent majoritairement orientées vers l’auto-
surveillance basique sans interconnexion avec les professionnels de santé. Les fonctionnalités
de partage sécurisé de données, d’analyse à distance ou de rétroaction en temps réel sont
souvent absentes. Il devient donc essentiel de concevoir des outils adaptés au suivi vocal
continu, accessibles depuis des plateformes variées (desktop, web, mobile) et respectueux des
exigences de confidentialité médicale.
I.6 Base de données vocales « Saarbruecken Voice Database » (SVD)
La base de données vocales allemande « Saarbruecken Voice Database » (SVD) est une
collection d’enregistrements vocaux de plus de 2000 personnes. Cette base de données a été
récemment créée librement et est gratuitement disponible en ligne.
Une session d’enregistrement contient les enregistrements suivants :
• Les voyelles /a/, /i/ et /u/ produit à un ton normal, haut et bas, bas-haut, haut-bas.
• Une phrase en allemand « Guten Morgen, wie geht es Ihnen ? » qui signifie « Bonjour,
comment vas-tu ? ».
Le signal vocal et le signal EGG (L’ElectroGlottoGraphe) de tous les enregistrements sont
stockés pour chaque cas dans un fichier séparé.
14
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
La durée des voyelles varie entre 0,5 et 4 secondes. La Fréquence d’échantillonnage des
enregistrements est de 50 kHz et leur résolution est de 16 bits. Environ 71 pathologies
différentes sont incluses dans cette base de données [David et al, 2012].
Les principales pathologies vocales présentes dans la base de données SVD sont listées dans le
tableau I.3.
Dysphonie hyperfonctionnelle, dysphonie
Luxation de l’aryténoide.
psychogène.
Luxation de l’aryténoide, dysphonie
Nodules des cordes vocales.
hyperfonctionnelle.
Balbutiement. Nodules et polype des cordes vocales.
Cordectomie. Laryngite.
Kyste. aryngite, leucoplasie des cordes vocales.
Dysarthrie. Laryngite, œdème de Reinke.
Dysodie. Leucoplasie des cordes vocales.
Dysodie, dysphonie hyperfonctionnelle. Puberphonie.
Névralgie du nerf laryngé supérieur, dysphonie
Dysodie, pachydermie de contact.
psychogène.
Dysodie, sigmatisme. Phonasthénie.
Dysphonie. Encombrement ou Tachyphémie.
Dysphonie, laryngite, vox sénile. Dysphonie psychogène.
Dysphonie, œdème de Reinke. Œdème de Reinke.
Laryngectomie partielle frontolatérale. Paralysie des cordes vocales.
Dysphonie fonctionnelle. Rhinolalie ouverte.
Voix grave. Rhinolalie mixte.
Dysphonie hyperfonctionnelle. Dysphonie spasmodique.
Dysphonie hyperfonctionnelle, pachydermie de
Polype des cordes vocales.
contact.
Dysphonie hyperfonctionnelle, nodules de phonation.
Tableau I.2 – Principales pathologies vocales présentes dans la base de données SVD [Bendia
et al, 2023].
15
Chapitre I : Revue des outils numériques pour l’analyse de la voix et des pathologies vocales
I.7 Conclusion
Ce chapitre a permis de dresser un panorama détaillé des fondements physiologiques de la
production vocale, des différentes pathologies associées et des outils actuels disponibles pour
leur évaluation. Il en ressort que, malgré l’abondance de logiciels spécialisés, les solutions
existantes présentent encore de nombreuses limites : coût élevé, faible personnalisation,
interfaces complexes, ou encore inadaptation aux usages de la télémédecine.
En parallèle, des approches alternatives, comme les outils open-source (Praat, openSMILE)
et les applications mobiles, offrent des perspectives intéressantes, mais nécessitent souvent des
compétences techniques pour leur exploitation efficace. Par ailleurs, la disponibilité de bases
de données comme la SVD ouvre de nouvelles voies pour la recherche et le développement de
systèmes d’analyse automatisée.
Ces constats soulignent l’intérêt de développer des solutions plus accessibles, modulaires et
adaptées aux besoins des utilisateurs qu’ils soient cliniciens, chercheurs ou patients. Le chapitre
suivant portera ainsi sur les biomarqueurs acoustiques, indicateurs quantitatifs essentiels pour
le diagnostic et le suivi des troubles vocaux à travers les outils numériques.
16