Il 0% ha trovato utile questo documento (0 voti)
2K visualizzazioni675 pagine

Disfonie PDF

Caricato da

Francesco Lanza
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
2K visualizzazioni675 pagine

Disfonie PDF

Caricato da

Francesco Lanza
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd

SOCIETÀ ITALIANA

DI OTORINOLARINGOLOGIA
E CHIRURGIA CERVICO-FACCIALE
Presidente: prof. D. Passàli

LXXXIX CONGRESSO NAZIONALE


San Benedetto del Tronto, 22-25 Maggio 2002

RELAZIONE UFFICIALE

LE DISFONIE: FISIOPATOLOGIA,
CLINICA ED ASPETTI MEDICO-LEGALI
di
DELFO CASOLINO

PACINIeditore
M E D I C I N A
Relatore:
DELFO CASOLINO

Correlatori: Collaboratori: E. LUCCHINI


M. ACCORDI L. ABENANTE M. MANGIALAIO
G. BERGAMINI A. AMADUCCI L. MASTROROBERTO
A. CAMAIONI A.R. ANTONELLI C. MENSI
G. CANTARELLA C. BALZANELLI C. MIANI
A. CICOGNANI S. BARBIERI A. NAPOLETANO
E. CUNSOLO A. BASSETTI F. OTTAVIANI
M. DE BENEDETTO M. BERLUCCHI T. PAZZAIA
E. DE CAMPORA A. CAMPIONI A. PENNACCHI
W. DE COLLE A. CAROGGIO C. PIAZZA
M. FORINI G. CENACCHI F. PIERI
P. FORMIGONI R. CONSALICI M. REBECCHI
F. LANDUZZI L. DE CAMPORA M. ROSSINI
P. LAUDADIO G. DENARO M.G. RUGIU
M. LIMARZI B. FARABOLLINI A. SCARAMOZZINO
M.P. LUPPI V. FOIS A. SCHINDLER
M. MAGNANI P. FORMIGONI I. SERAFINI
V. MALLARDI R. FÜSTÖS E. SPINELLI
G. MIGLIORI A. GHIDINI G. SPRIANO
P. MONTESI R. GHIRARDO D. TASSONE
P. MOSCHI M. GIUDICE F. TESSERIN
G. PERETTI F. INGRAVALLO C. VITI
M. PIEMONTE F. LOVADINA B. ZECCHINI
L. PRESUTTI
M. RADICI
A. RICCI MACCARINI
G. RIZZOTTO
R. ROSELLI
M. RUSSOLO
O. SCHINDLER
F. SGRIGNANI
F. STOMEO
G. VILLARI

I disegni sono stati realizzati da R. Füstös


Indice

INDICE

Presentazione
D. Casolino .............................................................................................................. pag. 7

Abstract .................................................................................................................. » 11

Premesse Generali
O. Schindler, D. Casolino ........................................................................................ » 13

I. Filogenesi ed embriogenesi della laringe


1. Filogenesi degli organi fonatori e della fonazione
(O. Schindler, F. Ottaviani, A. Schindler) ................................................ » 21
2. Note di embriogenesi della laringe
(P. Montesi, C. Viti, A. Campioni) ............................................................ » 26

II. Fisiologia della fonazione


1. Caratteristiche acustiche del suono glottico
(W. De Colle) ............................................................................................ » 35
2. Anatomo-fisiologia dell’apparato pneumo-fonatorio
(G. Bergamini, R. Füstös, D. Casolino) .................................................... » 46
3. La fisiologia cellulare delle corde vocali
(E. Cunsolo, D. Casolino, G. Cenacchi) .................................................. » 64
4. Anatomofisiologia dell’apparato di risonanza e di articolazione
(M. Accordi, W. De Colle) ........................................................................ » 83

III. Inquadramento delle disfonie


(G. Bergamini, D. Casolino, O. Schindler) .................................................... » 97

IV. Indagini clinico-strumentali nelle disfonie


1. L’anamnesi e l’esame obiettivo laringeo
(M. Accordi, F. Tesserin) .......................................................................... » 117
2. La valutazione percettiva della voce
(A. Ricci Maccarini, F. Ottaviani, A. Schindler, D. Casolino).................. » 125
3. La laringostroboscopia
(D. Casolino, A. Ricci Maccarini, M. Magnani) ...................................... » 134
4. La videokimografia
(G. Peretti, C. Piazza, M. Giudice, C. Balzanelli, C. Mensi, M. Rossini) » 144
5. L’esame spettroacustico della voce
(A. Ricci Maccarini, W. De Colle, E. Lucchini, D. Casolino) .................. » 150
6. L’esame spettroacustico «ambulatoriale»
(G. Migliori) .............................................................................................. » 183
7. L’elettroglottografia e gli indici aerodinamici
(G. Bergamini, A. Ghidini)........................................................................ » 187
8. L’elettromiografia laringea
(M. Radici, L. de Campora) ...................................................................... » 192

V. Le disfonie disfunzionali
1. (O. Schindler, M. Limarzi)........................................................................ » 201
4 Indice

2. Le disfonie psicogene
(P. Formigoni, B. Zecchini, E. Spinelli, A. Caroggio) .............................. pag. 221
3. Il parere dello psicologo in tema di disfonie psicogene
(F. Sgrignani) ............................................................................................ » 232
4. Il «Vocal Cord dysfunction»
(M. Forini, B. Farabollini, A. Pennacchi, A. Napoletano) ........................ » 245

VI. Le disfonie organiche


1. Laringiti acute e croniche
(M. De Benedetto) .................................................................................... » 265
2. Lesioni cordali congenite
(D. Casolino, F. Pieri, G. Denaro, A. Ricci Maccarini) ............................ » 277
3. Lesioni cordali acquisite benigne
(D. Casolino, M. Magnani, M. Rebecchi, A. Ricci Maccarini) ................ » 297
3 bis. Il problema delle cicatrici cordali
(D. Casolino, M. Magnani, M. Rebecchi, A. Ricci Maccarini) ................ » 313
4. La papillomatosi laringea
(P. Laudadio, E. Cunsolo, R. Consalici).................................................... » 323
5. Le disfonie da reflusso gastro-esofageo
(G. Villari, V. Fois, L. de Campora, A. Scaramozzino) ............................ » 339
5 bis. Il trattamento logopedico del granuloma laringeo posteriore
(M.P. Luppi, G. Bergamini) ...................................................................... » 351
6. Lesioni cordali precancerose
(G. Peretti, C. Piazza, M. Berlucchi, M. Giudice, M. Rossini,
A.R. Antonelli) .......................................................................................... » 357
7. Neoplasie laringee maligne
(G. Rizzotto, R. Ghirardo, T. Pazzaia, M. Mangialaio, F. Lovadina,
W. De Colle, I. Serafini)............................................................................ » 366
8. I traumi della laringe
(L. Presutti, E. Cunsolo, R. Consalici) ...................................................... » 379
9. Alterazioni ormonali, alterazioni da farmaci e amiloidosi della laringe
(A. Camaioni, P. Montesi, D. Tassone, C. Viti) ........................................ » 403
10. La conversione andro-ginoide
(M. Russolo, M. Accordi, G. Bergamini, D. Casolino) ............................ » 414
10 bis. La fonochirurgica nell’ambito della conversione andro-ginoide:
note medico-legali
(F. Landuzzi, M. Limarzi, F. Ingravallo) .................................................. » 426
11. Alterazioni del mantice polmonare e del «vocal tract»
(P. Moschi, L. Abenante) .......................................................................... » 435
11 bis. Le alterazioni dell’apparato risuonatore nasale - il ruolo della
chirurgia funzionale
(F. Stomeo) ................................................................................................ » 440
11 ter. Il problema della insufficienza velo-faringea
(M. Accordi, S. Agnelli)............................................................................ » 444
12. Esiti di chirurgia oncologica delle VADS
(E. de Campora, M. Radici) ...................................................................... » 449
13. Disturbi neurologici e muscolari della laringe
(M. Piemonte, M.G. Rugiu, C. Miani) ...................................................... » 468
13 bis. Iniezioni ed impianti intracordali
(G. Bergamini) .......................................................................................... » 493
13 ter. La tiroplastica di medializzazione cordale
(M. Magnani, M. Accordi, D. Casolino, A. Ricci Maccarini) .................. » 501
Indice 5

14. Le turbe fono deglutitorie nella patologia della base cranica


(R. Roselli, G. Spriano) ............................................................................ pag. 516
15. Le distonie laringee
(G. Cantarella, S. Barbieri) ...................................................................... » 533
16. Le disfonie centrali
(O. Schindler, A. Ricci Maccarini)............................................................ » 544

VII. Il problema delle «unità di misura» e della valutazione della voce


(A. Ricci Maccarini, D. Casolino, O. Schindler) ............................................ » 559

VIII. Aspetti medico-legali delle disfonie


1 Note introduttive sul valore della comunicazione verbale
(A. Cicognani, F. Ingravallo) .................................................................... » 579
2 Metodologia medico-legale nella valutazione delle disfonie
(A. Cicognani, F. Ingravallo, F. Landuzzi, M. Limarzi, V. Mallardi) ...... » 583
3 La valutazione delle disfonie in responsabilità civile
(A. Cicognani, F. Ingravallo, F. Landuzzi)................................................ » 591
4 La valutazione delle disfonie nell’ambito assicurativo privato
(A. Cicognani, F. Ingravallo, L. Landuzzi, L. Mastroroberto) .................. » 611
5 La valutazione delle disfonie in ambito penalistico
(A. Cicognani, F. Ingravallo, F. Landuzzi, M. Limarzi) .......................... » 621
6 La valutazione delle disfonie in relazione alla invalidità
(M. Limarzi, F. Landuzzi, F. Ingravallo, A. Amaducci) ............................ » 627
7 La valutazione della disfonia nell’ambito del decreto legislativo
23 febbraio 2001, n. 38 e del decreto ministeriale 12 luglio 2000
(C.D. danno biologico INAIL): inquadramento ed aspetti critici
(V. Mallardi) .............................................................................................. » 653

IX. Piccolo dizionario dei termini tecnici e degli acronimi


A cura di: D. Casolino, O. Schindler, F. Pieri, A. Bassetti.............................. » 675
B
Presentazione 7

PRESENTAZIONE

Se si guarda il mondo animale e se in questo si pone attenzione particolare ai


mammiferi più evoluti, si può concludere che la laringe, sostanzialmente, è uno sfin-
tere respiratorio con funzioni accessorie.
Al contrario, nell'homo sapiens, è quanto mai arduo attribuire un ordine gerar-
chico di valori alla funzione respiratoria ed alla voce (globalmente intesa come pa-
rola). Mentre la prima funzione è certamente indispensabile e vitale, pur nondime-
no la seconda lo è altrettanto nel caratterizzare la vita intellettuale e relazionale (i
sentimenti e l'anima) della specie umana, connotandola come fenomeno unico e pre-
dominante nel mondo biologico.
Tanto importante è la voce che il sintomo disfonia assume in conseguenza spes-
sore e peso così rilevanti da meritare una trattatistica dedicata.
L'argomento mantiene vivissima la sua attualità. Oggi non meno di ieri: ne so-
no prova diretta la continuativa ed autorevole produzione scientifica italiana e stra-
niera e la vivacità, nonché la capacità di aggregare e comunicare delle molte società
scientifiche che raggruppano i cultori dell’argomento.
Per la verità le recenti evoluzioni della laringologia, orientata prevalentemente
in senso oncologico; della foniatria, maggiormente indirizzata verso gli aspetti di fi-
siologia e di dinamica della fonazione; della logopedia, maggiormente attenta alla
rieducazione non invasiva dei disturbi fonatori hanno nel tempo contribuito, certo in
modo afinalistico, a individuare nicchie di eccellenza professionali non sempre tra
loro comunicanti, anzi in qualche modo disgreganti.
Al contrario, l’orientamento ad un punto di vista più ampio (genericamente spe-
cialistico) stimola certamente gli interessi per aspetti talora sottovalutati, talaltra
emergenti; contribuisce a riaprire il dibattito riguardo a problematiche non risolte;
incoraggia la ricerca di nuove modalità di diagnosi e di trattamento; agisce da pro-
pellente per arrivare a selezionare parametri di giudizio ampiamente diffusi e con-
divisibili.
Lo spirito di una riconsiderazione della disfonia leggibile a maglie molto larghe
e che non trascuri le specificità professionali è l’obiettivo (forse eccessivamente am-
bizioso rispetto al prodotto) col quale ho proposto questo tema di relazione prima al
direttivo AOOI ed in seguito a quello SIO.
In buona sostanza ho cercato di utilizzare il sintomo disfonia come collante uti-
le a valutare le problematiche della voce in modo da orientarle alla comprensione ed
agli interessi dei fruitori di questa specifica pubblicazione: gli otorinolaringoiatri.
Ed anzi, ho voluto cogliere l’occasione per rivisitare anche argomenti abituali
della laringologia, talora con criterio prevalentemente od esclusivamente compilati-
vo, nell’intento di assolvere a quegli obblighi didattici e divulgativi che suggerisce
il nostro Statuto.
La relazione ripercorre con cadenze classiche gli argomenti della filogenesi, del-
la fisiologia, dell’inquadramento tassonomico delle patologie, delle indagini stru-
8 Presentazione

mentali (e del problema delle unità di misura), della clinica delle varie patologie, per
terminare poi con gli aspetti medico-legali.
Nonostante l’apparente banalità di questa sequenza, si è cercato di far emergere
quelle problematiche che, nel tempo, sono state oggetto di molte pagine critiche (co-
me le iniezioni intracordali) e di conflitti metodologici (come la valutazione percet-
tiva della voce) e quegli elementi di novità che, superata la fase sperimentale e dia-
lettica, si vanno consolidando nella pratica quotidiana (come la tiroplastica di I tipo).
Così è fuor di dubbio che costituiscono argomento di interesse non secondario
gli aggiornamenti in tema di microfisiologia delle corde vocali: una morfologia so-
stanzialmente semplice dell’organo vibrante (e del vocal tract) nasconde in realtà le
potenzialità di uno strumento eccezionalmente complicato, nel quale le caratteristi-
che meccaniche e biochimiche dell’epitelio e della sottomucosa giocano un ruolo
che sembra sempre più importante nella fine (non casuale) regolazione della vibra-
zione cordale (e delle sue anomalie); ne consegue una diversa, più cauta, considera-
zione degli approcci terapeutici.
Altrettanto ricca di implicazioni e di innovazione è la tecnologia di rilevazione
dei numerosi parametri fonatori (non tutti indifferentemente impiegabili nella prati-
ca clinica): spettrogramma, fonetogramma ed altre misure elettroacustiche, parame-
tri aerodinamici ed elettromiografici, aprono orizzonti di insospettabile ampiezza
nella ricerca sulla voce e nella valutazione delle disfonie.
Paradossalmente però la tecnologia non riesce a superare il limite biologico poi-
ché il più sensibile ed affidabile giudice della voce è senza alcun dubbio l’udito. Re-
sta quindi aperta la ricerca di un ragionevole (ma non immediato) compromesso tra
le indagini oggettive e soggettive.
Non meno significativo è il cambiamento che implica la capillare diffusione del-
le fibre ottiche e della videoregistrazione (analogica o digitale che sia) della obiet-
tività endoscopica: è opportuno ammettere che, superati gli ostacoli economici (or-
mai queste attrezzature hanno costi accessibili ai più), nessun centro, e segnata-
mente quelli pubblici, dovrebbe essere privo di questa tecnologia.
Tra i vari quadri patologici presi in considerazione, alcuni meritano menzione
particolare vuoi per gli elementi di novità, come il vocal cord dysfunction; vuoi per
il diverso credito che hanno acquisito, come le lesioni cordali congenite o la pato-
logia cicatriziale secondaria.
In altre circostanze sono addirittura i mass-media a far riflettere su sintomato-
logia e patologia correlata: è il caso della cosiddetta «malattia della marcia indietro»
o reflusso gastro-esofageo. Una patologia che colpisce il 20% della popolazione
(con ricadute tutt’altro che trascurabili nel nostro ambito specialistico) e che ha
stretti legami col modello di vita occidentale (ed in particolare con stress ed ali-
mentazione eccessiva e sbagliata).
Altre situazioni hanno mutato radicalmente tipo di approccio rispetto al passato:
la possibilità concreta di modificare la voce ha consolidato e diffuso provvedimenti
rimediativi quali la iniezione intracordale e le tiroplastiche (particolarmente efficaci
nelle monoplegie laringee), ma nello stesso tempo ha stimolato considerazioni etiche
e sul consenso più attente e rispettose sia di fronte a procedure finalizzate (come nel
caso della conversione andro-ginoide) sia negli esiti della chirurgia oncologica della
laringe e delle VADS (talora inevitabilmente devastanti per la parola).
Presentazione 9

Il capitolo sugli aspetti medico-legali apre spazi sino ad ora scarsamente fre-
quentati e tuttavia oggetto di forte interesse da parte dei professionisti otorinolarin-
goiatri.
Infatti sono state considerate le ripercussioni delle disfonie sulla integrità indi-
viduale così come variamente tutelate in sede civilistica, assicurativa privata e pub-
blica, penale, prendendo da tali ambiti lo spunto per definire nel modo più chiaro e
sintetico possibile, i tratti peculiari degli specifici criteri valutativi.
Non si sono volutamente considerati gli aspetti particolari della disfonia conse-
guente ad errore professionale, peraltro inquadrabili in alcuni dei siffatti ambiti, in
considerazione sia della volontà, nella Relazione, di privilegiare gli aspetti pratici,
sia per le caratteristiche dell'argomento, il quale da solo richiederebbe una ampia
trattatistica.
In questa prospettiva la risposta ai quesiti «quando» (range di normalità) e
«quanto» (entità della patologia) non può far astrazione dalla conoscenza della cri-
teriologia medico-legale nei vari ambiti di valutazione così da operare nel pieno ri-
spetto degli obblighi giuridici, del diritto del cittadino alla salute e dei doveri deon-
tologici della professione medica.
Il testo si completa infine con un glossario di circa 250 tra termini tecnici ed
acronimi che il redattore ha voluto raccolti per tentare di ridurre al minimo la "ba-
bele delle lingue" e per mantenere fede all'impegno di presentare un contributo uti-
lizzabile da un pubblico il più vasto possibile.
Per concludere, credo che valga la pena di rimarcare, che la Relazione ufficiale,
per il Coordinatore ed i Collaboratori, è un’occasione unica e particolare per rinsalda-
re non solo impegni professionali ma anche vincoli di amicizia e di reciproca fiducia.
Ed è proprio sulla base di questi sentimenti e per la stima per le qualità di espe-
rienza, cultura, capacità comunicativa dei Colleghi, che ho ritenuto di poter affron-
tare un tema di così ampia portata, certamente al di fuori delle mie specifiche qua-
lità e delle mie risorse personali e di gruppo. Evidentemente, se l’obiettivo di una
informazione aggiornata e dai contenuti facilmente traducibili in azione professio-
nale è stato raggiunto anche solo parzialmente, il merito è di tutti i Collaboratori.
A questi Colleghi indirizzo il mio più sincero e riconoscente ringraziamento.
Un grazie particolare sento poi di doverlo rivolgere alle assemblee dei soci
AOOI e SIO che hanno privilegiato la scelta di questo tema di relazione.
Mi piace anche ricordare, con senso vivissimo di gratitudine, alcuni autorevoli
maestri: Dino Felisati, Piero Miani, Giorgio Sperati ed alcuni amici sinceri e stima-
tissimi: Michele De Benedetto, Enrico de Campora, Pasquale Laudadio, Italo Sera-
fini, i quali mi hanno sostenuto ed incoraggiato quando ho azzardato la proposta di
questa Relazione al Congresso SIO di Cagliari ed in seguito mi hanno facilitato il
compito in modo determinante con i loro preziosi suggerimenti.
Da ultimo è con particolare e vivissima gratitudine che l’intero gruppo di lavo-
ro ringrazia la logopedista, sig.na Emanuela Lucchini, esperta e paziente assembla-
trice dei nostri contributi.

Febbraio 2002
Delfo Casolino
B
Abstract 11
12 Abstract
Premesse generali 13

PREMESSE GENERALI

O. Schindler, D. Casolino

Le disfonie sono qualsiasi alterazione qualitativa o quantitativa della voce par-


lata, cantata (disodie) o gridata, tale da determinare sensazione di malessere, sgra-
devolezza o turba estetica, incapacità totale o parziale a svolgere le performance vo-
cali comuni o professionali.
Possono essere distinte in:
• mancanza totale o afonia;
• mancanza parziale o ipostenia fonatoria o voce con insufficiente intensità o
portanza (distanza utile per inviare un messaggio utile recepibile dal destina-
tario in determinate condizioni acustiche ambientali);
• aggiunta alla normale qualità di suono di componenti di rumore (che talora
possono abolire completamente la componente di suono) o voce rauca;
• forme miste.
La prevalenza di disfonie è di difficile determinazione in rapporto ai differenti
criteri tassonomici e di cut-off; tale presenza potrebbe essere valutata in un range dal
10 al 50%, in aumento specie nella popolazione infantile.
La voce (e il processo che la produce di fonazione o di vociferazione) è varia-
mente definibile ma rappresenta comunque una sonorità prodotta direttamente o in-
direttamente dal corpo umano con valenza informativa o comunicativa.
In questo scritto la considereremo solo come:
1. il suono prodotto dall’attività fonatoria delle corde vocali;
2. il suono e/o il rumore prodotto dalla rima glottica (comprese la false corde)
oppure dal vocal tract (o cavità comprendenti la faringe, la cavità orale e le
fosse nasali); tale seconda definizione è particolarmente importante per com-
prendere le voci rauche, le voci erigmofoniche o da fistola o da protesi tra-
cheo-ipofaringea.
Non va peraltro dimenticato specie per intendere e progettare vicarianze della
voce come precedentemente definita, che la voce in senso lato può essere intesa co-
me:
3. sonorità prodotta da qualsiasi parte del corpo (es. battere le mani);
4. sonorità prodotta dall’interazione del corpo con l’ambiente (es. bussando o
picchiando con i piedi);
5. sonorità prodotta dal corpo mediante protesi (es. campanelli, strumenti musi-
cali, comunicatori informatici sonori).

U.O.A. D.U. Audiologia-Foniatria, Azienda Ospedaliera «S. Giovanni Battista» Università di Torino
14 O. Schindler

Il fine ultimo dell’otorinolaringoiatra è quello di conservare, potenziare o ri-


pristinare la voce come definita nel punto 1, ma ciò è sovente difficile o impossibi-
le, per cui fa parte della professionalità ORL progettare la rimediazione della disfo-
nia facendo riferimento alle definizioni 2, 3, 4 e 5.
La voce va tenuta distinta da altre abilità comunicative normalmente ad essa as-
sociate, e in particolare da:
• la parola o speech, cioè la facoltà da parte del vocal tract (e in particolare
della cavità buccale) di produrre in proprio o di modificare sonorità prodotte
altrove (corde vocali, protesi fonatorie, vibratori laringei) in modo da creare,
mediante l’articolazione verbale, i fonemi di una determinata lingua (ad es.,
i 28 fonemi della lingua italiana); parlare con voce afona, sussurrata o con vi-
bratore laringeo sono altrettanti esempi di articolazione dei fonemi senza il
suono laringeo; in assenza di voce (definizione 1) il vocal tract non è in gra-
do di produrre le consonanti sonore (es. b, d, v, gh, g che pertanto vengono
prodotte come p, t, k, f, c) e neppure variazioni melodiche quali si hanno per
esempio nelle interrogazioni;
• l’espressione linguistica o language, cioè la facoltà di produrre enunciati
linguistici; questi possono essere prodotti oltre che vocalmente (cioè con la
voce) anche alfabeticamente (per iscritto o altrimenti per esempio con gli al-
fabeti Morse, Braille, muto o con la dattilologia) o testualmente (con le lin-
gue segniche dei sordi).
Non va dimenticato come i messaggi siano pronunciabili anche con la comuni-
cazione non verbale o non linguistica (es. con la postura, la mimica e il mimo).
La voce, che compare soltanto con i mammiferi (in quanto gli altri vertebrati o
invertebrati non possiedono il laringe), ha determinati finalità, scopi o connotazio-
ni di interlocuzione, alcuni presenti in ogni homo sapiens e altri presenti solo in al-
cuni individui o particolarmente dotati o che non si trovano in certe fasce di età o in
assenza di determinate patologie.
Tali condizioni generali e particolari potrebbero essere le seguenti (e ovviamen-
te possono andare perse nei soggetti disfonici):
• l’esistenza del vociferante: chi sono, dove sono, chi sono per sesso, età e ta-
lora persona (ognuno di noi ha un repertorio di 50-80 persone che vengono
riconosciute dalla loro voce) qual è il mio stato di salute, ecc.;
• l’umore o i sentimenti del vociferante la collera, la paura, la felicità, l’a-
more, la sorpresa, il disgusto, la tristezza;
• la produzione di messaggi non verbali come l’urlo, il richiamo, la richiesta
d’aiuto, la minaccia, la corte, il canto;
• la produzione di messaggi verbali;
• il guadagnarsi la vita mediante la voce: i professionisti vocali, ovverosia le
persone che senza voce non possono più esercitare la professione preceden-
temente svolta in modo piano e ordinario;
• l’eccellenza fonatoria di alcuni «atleti» quali i cantanti, gli attori, i retori (es.
politici, sindacalisti, predicatori, avvocati).
La voce è funzione complessa che basicamente è da riportarsi a un rumore pa-
rassita nato da uno sfintere (glottico) posto su un punto critico delle strutture pre-
Premesse generali 15

poste alla ventilazione respiratoria. Lo sfintere laringeo (o glottico) consente prin-


cipalmente:
• la regolazione dell’impedenza articolatoria;
• la chiusura valvolare plurifunzionale impedente l’ingresso e l’aspirazione di
sostanze non desiderate e pericolose, e segnatamente gli alimenti (ma anche
i corpi estranei e i rigurgiti); tale chiusura, finemente regolata a livello ner-
voso centrale, consente l’incrociamento tra vie ventilatorie e vie digestive,
pur avendo strutture comuni;
• la creazione di aria compressa espiratoria, specie a fini detersivi delle vie re-
spiratorie superiori, medie e inferiori (meccanismi della tosse, dello starnuto,
del «raschiamento», dell’escrezione delle vie ventilatorie, del «soffiamento
del naso», dello sputo); la pressione sottoglottica associata alla vociferazione
con fine regolazione centrale determina la coordinazione pneumofonica;
• la chiusura in apnea inspiratoria della glottide, che permette una fissazione e
una rigidità toracica favorevoli al buon funzionamento della muscolatura to-
raco-brachiale (sollevamento di pesi, lancio di oggetti, trazioni);
• la chiusura in apnea inspiratoria della glottide con successivi tentativi di espi-
razione a glottide chiusa, che può determinare la messa in funzione del tor-
chio addominale (defecazione, parto, ecc.).
In sintesi la voce (definizione 1 e 2) è in rapporto con i seguenti 7 fattori (Fig. 1):

}
Fig. 1.
(da L. Rammage, M. Morrison, H.
Nichol, modificata).
16 O. Schindler

• il mantice respiratorio (strutture pleuro- e bronco-polmonari, muscolature


cervicali, toraciche, diaframmatiche, addominali e altre) che consente la crea-
zione di un flusso espiratorio con una pressione sottoglottica variabile, re-
sponsabili principale dei parametri livello sonoro e intensità e conseguente-
mente della portanza della voce (la voce viene prodotta ordinariamente solo
in espirazione, tuttavia è possibile anche una vociferazione inspiratoria);
• lo sfintere glottico con struttura cruciale nelle corde vocali (ma anche nella
restante muscolatura laringea intrinseca, per esempio per il cambiamento del
registro vocale), la cui vibrazione regolare determina la sonorità periodica,
regolare, coerente o suono la cui frequenza (fondamentale o prima armonica
o Fo) è in rapporto fondamentalmente alla lunghezza, alla tensione e alla
massa delle corde stesse;
• le cavità di risonanza e articolazione o tratto vocale o vocal tract, che con-
sentono la creazione di sonorità (soprattutto rumori, per esempio le conso-
nanti, ma anche suoni come il fischio) e specificamente delle variazioni di ri-
sonanza, responsabili delle variazioni di timbro ma anche delle intensità dei
suoni laringei, mediante il differente posizionamento delle strutture muscola-
ri delle labbra, della lingua e del velo contro strutture ossee dei denti, del pa-
lato duro e di altre parti del vocal tract; tale abilità viene denominata artico-
lazione fonetica. Anche altre strutture intervengono nel meccanismo (musco-
li oro-faringei, masticatori, mimici, della colonna cervicale, della parte ante-
riore del collo, ecc.). Negli ultimi tempi è stata data una attenzione particola-
re e preminente a questo fattore, ponendo anche l’accento sui nessi con la de-
glutizione;
• il sistema nervoso centrale con stazioni regolatorie differenti:
a) a livello bulbare in rapporto ad aspetti prevalentemente respiratori;
b) a livello mesencefalico, di encefalico e limbico per la coordinazione pneu-
mofonica, per l’eliminazione di alcune motilità di vociferazioni parassite,
per gli automatismi e alcuni stereotipi vocali, per il rapporto con umori e
sentimenti;
c) a livello corticale per la volitività e gli aspetti educativi, culturali e crea-
tivi;
• il sistema uditivo sia a livello periferico timpanico e cocleare (per il control-
lo feed-back prevalentemente dell’intensità della voce) sia a livello della via
e dei nuclei centrali responsabili della percezione uditiva (per il controllo
feed-back prevalentemente dell’altezza-frequenza-intonazione e dello spet-
tro-timbro-colore della voce). Va ricordato come alcune tecniche educative e
riabilitative della voce si avvalgano dell’educazione della percezione uditiva;
• l’educazione genitoriale e del gruppo culturale dei appartenenza o edu-
cazioni specifiche (es. del canto) che forgeranno per imitazione e creazione
di un modello ideale un determinato assetto vocale parzialmente o totalmen-
te reversibile dopo l’età di 10-18 anni;
• fattori miscellanei, quali le posture, la costellazione ormonale e altri aspetti
costituzionali oltre che ovviamente le differenti patologie non laringee o del
vocal tract.
Premesse generali 17

Fra questi fattori si tende sempre a dare maggiore importanza alle caratteristi-
che acustiche dell’ambiente dove viene effettuata la vociferazione, con riguardo
particolare al rumore di fondo (e all’inquinamento acustico) e conseguentemente al
rapporto segnale/rumore, dove per «segnale» s’intende il segnale acustico della vo-
ce di un determinato individuo, mentre per «rumore» si intende ogni altra vocifera-
zione contemporanea, e pertanto concorrente, e rispettivamente qualsiasi altro se-
gnale acustico nonché ovviamente il rumore di fondo (compreso il riverbero ecces-
sivo della propria voce).
B
I. FILOGENESI ED EMBRIOGENESI DELLA LARINGE

I
B
Filogenesi degli organi fonatori e della fonazione 21

I.1. FILOGENESI DEGLI ORGANI FONATORI E DELLA FONAZIONE

O. Schindler, F. Ottaviani*, A. Schindler*

INTRODUZIONE

La descrizione dell’evoluzione della fonazione presuppone una definizione di


quest’ultima. La voce può infatti essere considerata in senso stretto come il suono
prodotto dalla laringe, ma può anche comprendere le sonorità prodotte dal vocal
tract e in senso lato le sonorità prodotte dal corpo 3. Evidentemente l’origine e quin-
di la trattazione della filogenesi della fonazione sarà diversa a seconda di quale di
queste definizioni si prenda in considerazione. Se consideriamo la voce nella sua ac-
cezione più allargata, la telecomunicazione per via acustica inizia con gli inverte-
brati artropodi 8; tuttavia nella nostra disamina considereremo la fonazione nella sua
accezione più ristretta di sonorità prodotte dal sistema laringeo e dal vocal tract.
Prima di addentrarci nella trattazione della filogenesi della fonazione è necessa-
rio premettere alcune considerazioni: 1) se i segnali acustici emessi dagli animali
hanno giocato un ruolo per migliorare la loro condizione di vita, questi animali han-
no dovuto adattare il loro organo emittente alle caratteristiche ambientali. Così per
es. in una foresta tropicale la riflessione delle foglie permette la propagazione uni-
camente delle onde sonore la cui lunghezza è sufficiente per non essere arrestata dal
fogliame 2; 2) non è possibile analizzare l’evoluzione degli organi fonatori, senza
considerare contemporaneamente il ruolo degli organi recettori, con particolare at-
tenzione all’organo uditivo; 3) l’acquisizione di possibilità vocali sempre più raffi-
nate è in relazione a una regolazione nervosa via via più complessa 5.

FILOGENESI DEGLI ORGANI FONATORI

I primi abbozzi dell’organo laringe compaiono circa 350 milioni di anni or so-
no con i Coanoitti, pesci polmonati abitanti in acque dolci, calde, basse e povere di
ossigeno; queste creature disponevano di due sistemi respiratori: uno branchiale e
uno polmonare 12. Nelle condizioni ambientali descritte l’esistenza di un sistema re-
spiratorio alternativo a quello branchiale costituiva un indubbio vantaggio per la so-
pravvivenza. Tuttavia la respirazione polmonare in assenza di una pompa aspirante,

U.O.A. D.U. Audiologia-Foniatria, Azienda Ospedaliera «S. Giovanni Battista» Università di Torino
*
IV Clinica Otorinolaringoiatrica, Azienda Ospedaliera, Polo Universitario «L. Sacco», Università di
Milano

I.
1
22 O. Schindler et al.

era assicurata da un sistema a spinta e da una valvola – l’abbozzo laringeo – che im-
pediva la fuoriuscita dell’aria; la stessa valvola aveva la funzione di protezione del-
le vie aeree nelle fasi in cui i Coanoitti erano immersi in acqua e respiravano attra-
verso la via branchiale. La nascita della laringe è quindi legata tanto alla funzione
respiratoria quanto a quella sfinterica protettiva.
Con la comparsa degli anfibi scompare il sistema branchiale e la laringe assume
una struttura rigida fibrosa, corredata di un potente muscolo dilatatore, oltre che di
un costrittore situati in sede posteriore. È così consentita un’apertura permanente
durante la vita sulla terra ferma, e una chiusura ermetica durante la vita acquatica.
I rettili sono i primi vertebrati terrestri a respirare unicamente aria. La laringe si
posiziona posteriormente alla base della lingua ed è fusa all’osso ioide. La musco-
latura laringea è formata da due muscoli dilatatori e due muscoli costrittori. Nei ret-
tili compare anche la muscolatura laringea estrinseca.
Con gli uccelli nasce l’omeotermia e quindi l’alta richiesta energetica e la ne-
cessità di una ventilazione molto efficiente. La laringe è di tipo rettiliano, priva di
corde vocali e con le cartilagini aritenoidi unite fra loro. L’organo fonatorio non è la
laringe, ma la siringe, un sistema muscolare complesso situato alla biforcazione tra-
cheale e innervato dal XII nervo cranico (Fig. 1). La trachea si unisce all’estremità

Fig. 1.
Rappresentazione schematica della siringe
(S), dei suoi rapporti con trachea e laringe e
della relativa innervazione ad opera dei ner-
vi cranici, indicati con i numeri romani (da
Purves e Litchman 10, modificata).
Filogenesi degli organi fonatori e della fonazione 23

Fig. 2.
Schema che evidenzia la diversa distanza tra palato molle ed epiglottide nelle scimmie antropomorfe e
nell’uomo.

superiore della siringe, mentre i bronchi si uniscono alla sua estremità inferiore. Al
di sotto della connessione fra siringe e bronchi si trovano una serie di anelli cartila-
ginei a forma di C; attraverso questi anelli si situano membrane vibranti – le mem-
brane timpaniformi – destra e sinistra, anatomicamente separate e dotate di inner-
vazione propria.
Nei marsupiati la cartilagine tiroidea si stacca dall’osso ioide. Le cartilagini ti-
roide e cricoide rimangono fuse fra loro, così come le aritenoidi.
Nei mammiferi la laringe assume aspetti e posizioni variabili. In tutti i casi,
però, l’osso ioide, le cartilagini tiroide, cricoide e aritenoide sono indipendenti fra
loro e mobili le une rispetto alle altre. Nei mammiferi la laringe ha anche la funzio-
ne di aumentare la pressione intratoracica e di stabilizzazione del torace 6. Nella
maggior parte dei mammiferi la laringe è situata a livello rinofaringeo con sovrap-
posizione fra epiglottide e velo palatino, condizione che evitando l’incrociamento
fra vie aeree e vie digestive, consente la funzioni respiratoria, olfattoria e deglutito-
ria contemporanee. Nelle scimmie antropomorfe la cartilagine tiroidea si trova a li-
vello della IV vertebra cervicale, mentre nell’Homo sapiens sapiens è situata a li-
vello della V-VI vertebra cervicale 7 (Fig. 2).
Se è nota la differenza di posizione laringea e quindi di lunghezza del vocal tract
fra la specie umana ed altre specie animali (Fig. 3), non è facile determinare quale
fosse la situazione nelle varie specie ominidi, anche se il ritrovamento di un osso
ioide di Homo Neanderthalensis 1, ha fatto supporre una posizione laringea relati-
vamente bassa in questa specie 9.

I.
1
24 O. Schindler et al.

Fig. 3.
Illustrazione dei rapporti tra vocal-tract ed estremità cefalica nel pitone, nella scimmia cappuccino, nel-
l’orangotango e nell’uomo; si noti il progressivo aumento del grado di curvatura tra laringe e cavità oro-
faringea (da Hauser 5, modificata).

FILOGENESI DELLA FONAZIONE

L’evoluzione degli organi fonatori è cosa ben diversa dall’evoluzione della fona-
zione, che cercheremo ora di delineare nei suoi tratti principali. Nel corso della filo-
genesi ogni gruppo zoologico è stato portatore di una innovazione: gli insetti Ortot-
teri e Emitteri hanno introdotto caratteristiche acustiche quali la ripetizione, la di-
scontinuità, la sequenza, il motivo regolare e irregolare. Agli anfibi si deve l’intro-
duzione di spettri acustici con zone di concentrazione energetica, ossia le formanti 4.
Gli uccelli, infine, hanno apportato la linea melodica. Solo con la nostra specie si ha
tuttavia l’articolazione verbale.
È interessante notare alcune caratteristiche del comportamento acustico nelle
varie specie. Nei pesci polmonati la presenza di uno sfintere similaringeo ha proba-
bilmente consentito la produzione di sonorità parassite; per quanto ci è dato sapere
queste non avevano tuttavia significato comunicativo. Diversa è la situazione degli
anfibi; infatti questi sono in grado di produrre sonorità con caratteristiche specie-
specifiche. Le sonorità prodotte hanno valore comunicativo, ma il loro utilizzo è li-
mitato a un periodo ristretto dell’anno, quello degli amori, in cui le sonorità prodot-
te hanno funzione di segnale di avvertimento e di richiamo.
Filogenesi degli organi fonatori e della fonazione 25

Con gli uccelli si assiste alla nascita vera della fonazione. L’omeotermia rende
necessaria una ventilazione efficace e continua, cui si associa un fenomeno parassi-
ta ugualmente continuo: la fonazione. Queste specie inoltre da un punto di vista acu-
stico sono in grado di produrre linee melodiche con significative modificazione di
risonanza. Da un punto di vista percettivo gli uccelli sono le prime specie in grado
di percepire le frequenze acute. Le indagini neurofisiologiche hanno mostrato cor-
relazioni evidenti fra vie percettive e vie fonatorie, confermando l’importante ruolo
comunicativo e di sopravvivenza della fonazione.
Con la primatazione si afferma la cultura di gruppo e quindi la possibilità di tra-
smissione non genetica di informazioni, compresi i comportamenti acustici. All’o-
minazione è da collegare il pieno uso di protesi, cioè di dispositivi in grado di mo-
dificare le abilità fonatorie dell’individuo; questo fatto permette di ovviare alle va-
rie caratteristiche acustiche ambientali senza modificare necessariamente le caratte-
ristiche degli organi fonatori, contrariamente a quanto era avvenuto fino a quel mo-
mento.
Con l’Homo sapiens sapiens aumentano notevolmente le dimensioni e le relati-
ve funzioni telencefaliche, con sofisticazione notevole delle abilità di simbolizza-
zione; parallelamente cresce a dismisura la varietà di produzioni vocali. È così con-
sentita la produzione di un numero di sonorità con tratti distintivi propri – che pren-
dono il nome di fonemi nel parlato e di odemi nel cantato – specifici per ogni grup-
po culturale ma tuttavia infinitamente minore del corpus totale fonematico ed ode-
matico assoluto dell’umanità 10. In altri termini l’uomo moderno è in grado di pro-
durre un numero altissimo di sonorità parlate e cantate; tuttavia solo una parte di
queste è utilizzato in un determinato ambito culturale. Così per esempio la cultura
occidentale utilizza odemi completamente differenti da quanto faccia la cultura
orientale, nonostante l’abilità di produrre un tipo o l’altro di odemi sia la stessa per
ogni soggetto della nostra specie.

BIBLIOGRAFIA
1
Arensburg B, Tillier AM, Vandermeersch B, Duday H, Schepartz LA, Rak Y. A middle palaeolithic
human hyoid bone. Nature 1989;338:758-60.
2
Chappuis C. Un exemple de l’influence du milieu sur les emissions vocales de chants en foret equa-
toriale. In: Chappuis C, ed. La Terre et la Vie. Paris: Masson 1971.
3
Giordano C, Righini G, Schindler O. Biologia della musica. Torino: ed. Omega 1999:111-23.
4
Halliday T. The senses and communication. Berlin: Springer-Verlag 1998.
5
Hauser MD. The evolution of communication. Cambridge: MIT press 1996.
6
Kelemen G. Acoustic behaviour of animals. Amsterdam: Elsevier publishing co. 1963.
7
Lenneberg EH. Fondamenti biologici del linguaggio. Torino: Ed. Boringhieri 1971.
8
Leroy Y. L’evolution du monde sonore animal. In: Sons et musique. Paris: Bibliotheque pour la
science 1980.
9
Marshall JC. The descent of the larynx. Nature 1989;338:702-3.
10
Purves D, Litchman JW. Principles of neural development. Sunderland MA: Sinauer 1985:340.
11
Schindler O, Schindler A, Utari C, Vernero I. Filogenesi della voce e del canto. In: Fussi F, ed. La
voce del cantante. Saggi di Foniatria Artistica. Torino: Ed. Omega 2000. P.
12
Viti C, Montesi P, Damiani V. Filogenesi ed ontogenesi delle prime vie aereo-digestive. In: Ca-
maioni A, ed. I meccanismi di difesa non immunologica delle prime vie aero-digestive. XVII Gior-
nate Italiane di Otoneurologia. Palermo: 31 Marzo 2001.

I.
1
26 P. Montesi et al.

I.2. NOTE DI EMBRIOGENESI DELLA LARINGE

P. Montesi, C. Viti, A. Camaioni

Lo studio fondamentale dello sviluppo embriologico della laringe considerato


ancora oggi come il più completo risale al 1907 9.
La vita prenatale viene suddivisa in due periodi: il periodo embrionale, che
comprende le prime 8 settimane, a sua volta ripartito in 23 fasi evolutive, i partico-
lari sono già stati descritti in modo assai esaustivo da O’Rahilly e Muller 7 ed il suc-
cessivo periodo fetale.

PERIODO EMBRIONALE

Alla 3a settimana, quando l’embrione ha una lunghezza di soli 3 mm (fase 10),


è possibile distinguere una cresta (esterna) e un solco faringeo mediano (interno)
che comprende quello laringotracheale. L’abbozzo laringeo quindi si forma nel cam-
po mesobranchiale, in un territorio verso il quale tendono a convergere gli archi che
si sviluppano nelle pareti laterali della faringe. Questa vicinanza, come vedremo,
rende ancora oggi difficile stabilire l’esatta origine degli elementi «mediani» in re-
lazione agli archi branchiali veri e propri (Fig. 1).

Fig. 1.
Visione posteriore del rapporto tra cam-
po mesobranchiale ed archi branchiali
(da Souliè e Bardier 9, modificata).

Unità Operativa ORL, Ospedale «Belcolle», Viterbo


Note di embriogenesi della laringe 27

In pochi giorni compare la «gemma polmonare» che si presenta come un di-


verticolo respiratorio che protrude dal tubo digerente. Il mesenchima e l’epitelio
compresi tra gli abbozzi respiratorio e digerente definiscono il setto tracheoesofa-
geo.
Ben presto, fin dalla fase 13, si riconoscono le gemme polmonari bilateralmen-
te mentre la trachea diventa visibile nei campioni più avanzati. Il punto di biforca-
zione della trachea inizia presto a scendere in senso caudale.
A circa 32 o 33 giorni (fasi 14 e 15), il laringe comincia la propria differenzia-
zione. Le pareti epiteliali laterali si sovrappongono sul piano mediano, formando la
lamina epiteliale. Questa si presenta come una superficie bilaminare situata tra le
creste aritenoidi; durante questa fase il lume faringeo posto dietro le creste aritenoi-
dee è ancora comunicante con la trachea mediante il dotto o canale faringoinfra-
glottico.
La prominenza ipofaringea descritta da alcuni come prominenza ipobranchiale
in questa fase non presenta l’epiglottide che sarà identificabile solo qualche tempo
dopo. Alla 5a settimana nel mesenchima comincia ad essere identificabile l’abbozzo
dell’osso ioide e a 6 settimane la cartilagine cricoidea può apparire con un unico
centro cricoideo cartilagineo, o eventualmente con due centri posti bilateralmente.
Alla 6a settimana, corrispondente alla fase 17 la laringe è chiaramente definibi-
le. La parte frontale della lamina epiteliale può essere considerata come la parte ve-
stibolare della laringe. Assai presto, espansioni laterali di questa porzione formano
la fessura coronale o trasversa corrispondente al vestibolo embrionale. In questa
fase la cavità laringea assume, in sezione trasversale, una forma a T, ma la fessura
coronale corrisponde solamente a una porzione del vestibolo adulto dal momento
che questo comprende anche la fessura mediana (Fig. 2). Caratteristica è la tenden-
za del vestibolo e della trachea a comunicare tra loro mediante il dotto o canale ve-
stibolo-infraglottico.
Durante la 6a settimana (fase 18) i muscoli laringei iniziano a svilupparsi, ma la
presenza o meno fin dall’inizio di uno o due sfinteri comuni è sempre controversa.

Fig. 2.
Veduta dorsale della laringe prenatale (8a-10a-18a sett.) (da Souliè e Bardier 9, modificata).

I.
2
28 P. Montesi et al.

L’abbozzo dello ioide subisce un processo di condrificazione e iniziano a compari-


re gli abbozzi delle lamine tiroidi. Alla 7a settimana il dotto faringo-infraglottico,
nella maggior parte degli embrioni, è ampiamente, se non completamente aperto ed
è visibile il dotto vestibolo-infraglottico. I ventricoli della laringe compaiono ini-
zialmente come gemme epiteliali protrudenti lateralmente. I foglietti destro e sini-
stro della lamina epiteliale tendono a separarsi sebbene in genere, al termine del pe-
riodo embrionale (fase 23), persistono ancora aree di fusione sia rostralmente che
caudalmente. Pertanto, il lume faringeo continua nella cavità infraglottica e quindi
nella trachea. Nei ventricoli inizia la cavitazione.
Alla fine del periodo embrionale (fase 23), la cartilagine ioide è formata dal cor-
po e dai corni maggiori; i corni minori sono noduli distinti separati dai processi sti-
loide.
Le lamine cartilaginee tiroidee, che possono mostrare un forame, vengono uni-
ficate a partire dalla superficie interna da parte del mesenchima.
Sempre in questa fase la cartilagine cricoide si presenta già come un anello con-
tinuo che comprende un arco e una lamina.
Ciascuna cartilagine aritenoide è caratterizzata da un processo muscolare carti-
lagineo e da un processo vocale mesenchimale.
La maggior parte dei muscoli laringei maggiori, non ancora striati, sono già pre-
senti in questa epoca (sebbene) e la loro innervazione segue rigidamente lo schema
dell’adulto. Le fibre motorie penetrano nei muscoli. Il muscolo vocale inizia a dif-
ferenziarsi.
In questo momento la cavità laringea assumendo, come detto, una configura-
zione come nell’adulto, comprende il vestibolo, i ventricoli e la cavità infraglottica.
I ventricoli non sono allo stesso livello di quella che sarà la glottide dal momento
che questa è localizzata più caudalmente. L’innervazione sensitiva è in avanzata
evoluzione ma pur essendo presenti i recettori a livello della mucosa faringo-larin-
gea, la maggior parte delle fibre non raggiunge ancora l’epitelio.
Come dicevamo il sistema branchiale sembra prendere parte alla formazione
della laringe ma è molto problematico riconoscere le strutture che derivano da com-
ponenti branchiali. Gli archi branchiali, secondo la maggior parte degli embriologi,
sono 6 e già a 28 giorni (embrione umano di 4-6 mm) si possono riconoscere 4 ar-
chi e 4 tasche. Tutti gli autori sono concordi nella identificazione delle strutture pro-
venienti dai primi tre archi, ma esistono tuttora molte divergenze nella descrizione
dello sviluppo delle condensazioni mesenchimali del IV, V e VI arco ed in partico-
lare di quelle in relazione allo sviluppo della laringe.
Le conclusioni cui sono giunti vari autori non solo riguardo gli archi branchiali
cui attribuire le singole cartilagini laringee sono assai divergenti, ed anche la dupli-
cità o unicità degli abbozzi cartilaginei è tutt’altro che univocamente definita 1.
La vascolarizzazione della laringe deriva dall’arteria del III arco branchiale (ar-
teria laringea superiore) e da quella del IV arco branchiale (arteria laringea inferio-
re). Alla vascolarizzazione della laringe non partecipano l’arteria del V e del VI ar-
co.
Il nervo della laringe (nervo vago) si considera derivato dalla fusione del IV, V
e VI arco branchiale (alcuni considerano il laringeo superiore con il nervo del IV ar-
co e il laringeo inferiore con quello del VI arco branchiale).
Note di embriogenesi della laringe 29

PERIODO FETALE

Terminato il periodo embrionale, fino alla fine del I trimestre della vita prena-
tale la laringe aumenta di dimensioni da 3 a 7 mm circa. Le lamine tiroidee conti-
nuano la loro fusione e si sviluppa la lamina cricotiroidea. In una fase precoce,
quando il feto raggiunge i 33 mm circa di lunghezza i legamenti vocali iniziano a
formarsi: i ventricoli e la glottide diventano sempre più evidenti tanto che i ventri-
coli presentano già i rispettivi sacculi. Le articolazioni cricoaritenoidee prima e
quelle cricotiroidee poi completano il loro processo di maturazione.
Raggiunti i 90 mm, la cavità laringea ha conseguito la sua forma adulta 9.
Durante il II trimestre, il laringe aumenta ulteriormente di lunghezza passando
da 8 a 15 mm circa. La cartilagine tiroidea si presenta come una struttura unica. Ini-
zia la condrificazione dell’epiglottide e la ossificazione dello ioide. Le articolazio-
ni acquisiscono i legamenti e le ghiandole iniziano a svilupparsi. In questo periodo
si riscontra la presenza di fibre elastiche nell’epiglottide 8.
Durante il III trimestre, le dimensioni del laringe aumentano ulteriormente da 15
a 20 mm circa, e la apertura della glottide raggiunge i 5 mm di diametro. La larin-
ge, a partire dalla vita embrionale e fetale fino alla maturità compie una lenta di-
scesa e questo è stato valutato considerando la variazione di alcuni punti di riferi-
mento (punta dell’epiglottide, osso ioide e bordo inferiore della cricoide) rispetto ai
livelli vertebrali. Questa discesa è ancor più evidente se si considera che durante il
suo accrescimento all’interno della laringe di assiste ad un aumento della distanza
tra loro di questi punti di riferimento (Fig. 3).

Fig. 3.
Rappresentazione schematica della «discesa» della laringe rispetto ai segmenti scheletrici durante la
crescita; si noti anche l’aumento della distanza tra i vari componenti della laringe.

I.
2
30 P. Montesi et al.

Anche durante il periodo fetale si assiste alla discesa dell’epiglottide da una po-
sizione cervicale alta ad una posizione più bassa rispetto alle altre strutture della via
aerea superiore che prosegue nelle successive fasi di sviluppo portando alla interru-
zione così della continuità della stessa via aerea 2 5 6.
Studi anatomici hanno documentato che alla 21a settimana l’epiglottide è suffi-
cientemente sviluppata e si situa in prossimità del palato molle. Tra la 23a e la 25a
settimana l’epiglottide e il palato molle si sovrappongono permettendo così l’inse-
rimento della laringe nel rinofaringe.
Studi ecografici della regione nell’utero hanno confermato la posizione alta e in-
tranarinale della laringe durante i movimenti di deglutizione del feto, suggerendo
che la distinzione tra via respiratoria e deglutitoria potrebbe essere costituita in epo-
ca prenatale 10. Questa posizione alta della laringe persiste nel periodo perinatale e
nella prima infanzia.
La laringe dei bambini rimane alta nel collo fino a 1,5-2 anni di età. Dal terzo
anno di vita la posizione della laringe diviene significativamente più bassa. Al set-
timo anno di età la laringe si trova in corrispondenza tra il bordo superiore di C3 e
il bordo inferiore di C5 mentre nell’adulto la posizione della laringe è ancora più
bassa (tra il margine inferiore di C3/margine superiore di C4 fino al margine supe-
riore di C7). La lingua conseguentemente, con il segmento posteriore, inferiormen-
te al forame cieco, assume una posizione più bassa nel collo formando la parete an-
teriore della faringe.
È interessante notare come lo sviluppo della laringe richiami l’evoluzione filo-
genetica così come i piccoli umani conservino un aspetto mammifero di base. La
successiva discesa nel corso dello sviluppo della laringe altera in modo considere-
vole tale configurazione.
Gli uomini adulti perdono la netta separazione tra il tratto digerente e quello re-
spiratorio ma ottengono un aumento della regione sopralaringea della faringe che
permette la produzione di vari suoni del parlato umano. Questo rappresenta un re-
gresso dal punto di vista del ruolo laringeo di protezione della via aerea superiore e
richiede l’attraversamento della via aerea superiore e dei sistemi digerenti, ma per-
mette una migliore fonazione e dunque è un compromesso tra le funzioni del larin-
ge.

BIBLIOGRAFIA
1
Carlon G. Il carcinoma della laringe: dalla patologia alla clinica. Piccin Nuova Libraria 1990.
2
Crelin ES. Development of the upper respiratory system. Ciba Clin Symp 1976;28:3-26.
3
Friedland DR, Eden AR, Laitman JT. Motoneuron cell death in the nucleus ambiguous and hypo-
glossal nucleus: implications for sudden infant death syndrome (SIDS). Assn Res Otolaryngol Ab-
st 1994;16:164.
4
Kirchner JA. The vertrebate larynx: adaptation and aberrations. Laryngoscope 1993;103:1197-
201.
5
Laitman JT, Reidenberg JS. Specializations of the human upper respiratory and upper digestive sy-
stems as seen through comparative and developmental anatomy. Disphagia 1993;8:318-25.
6
Negus VE. The Comparative Anatomy and Physiology of the Larynx. London: Heinemann 1949.
Note di embriogenesi della laringe 31

7
O’Rahilly R, Muller F. Developmental stages in Human embryos, includine a Revision of Streeter’s
«Horizona» and a survey of the Carnegie Collection. Washington DC: Carnegie Institution of Wa-
shington 1987.
8
Patzelt V. Uber die menschliche Epiglottis und die Entwicklung des Epithels in den Nachbargebie-
ten. Z Anat Entw 1924;70:1-178.
9
Soulié A, Bardier F. Recherches sur le developpement du larynx chez l’homme. J Anat Physiol
1907;43:137-240.
10
Wolfson VP, Laitman JT. Ultrasound investigation of fetal human upper respiratory anatomy. Anat
Rec 1990;227:363-72.

I.
2
B
II. FISIOLOGIA DELLA FONAZIONE

II
B
Caratteristiche acustiche del suono glottico 35

II.1. CARATTERISTICHE ACUSTICHE DEL SUONO GLOTTICO

W. De Colle

INTRODUZIONE

Nel corso della fonazione l’energia aerodinamica generata dal sistema respira-
torio è trasformata a livello laringeo in energia acustica; la laringe dunque, grazie
alla ritmica apertura e chiusura glottica, funziona come un trasduttore di energia ed
il flusso aereo continuo proveniente dalla trachea, viene modulato in un alternarsi di
compressione (zone a maggior pressione) e rarefazione (zone a minor pressione) del
sistema elastico aereo (segnale acustico glottico o laringeo). Tale energia acustica,
ulteriormente modificata dalle strutture sovraglottiche (condotto vocale), è irradiata
a livello delle labbra e viene definita VOCE.
La voce dunque, ed in accordo con la teoria acustica di Fant 3 e Flanagan 9, è il
risultato di una modificazione da parte di un filtro complesso e variabile nel tempo
di un segnale prodotto da una sorgente (teoria della sorgente-filtro). Il meccanismo
fisiologico che porta all’origine del segnale a livello della sorgente è inteso come
fonazione, mentre la modificazione dello stesso da parte del filtro come articolazio-
ne-risonanza (1). Il caso più semplice è la produzione dei suoni vocalici in cui la
sorgente è costituita dalle corde vocali, mentre il filtro è riferito alle strutture sovra-
glottiche. È a questa modalità di produzione che ci riferiremo anche se, oltre alla
sorgente glottica, il condotto vocale può essere eccitato da altri tipi di sorgente, a se-
de faringo-laringea od orale (pensiamo alla voce erigmofonica del laringectomizza-
to totale in cui la mancanza delle corde vocali è sostituita da uno sfintere faringo-
esofageo vibrante in modo più o meno periodico, o alla produzione di sonorità con-
sonantiche orali continue o transitorie) (per maggiori dettagli si veda più avanti il
capitolo relativo all’anatomo-fisiologia dell’apparato di risonanza e articolazione).
I fattori che influenzano le modalità di vibrazione cordale e quindi del suono
glottico sono numerosi, e solo in parte conosciuti, comprendendo fattori sottoglotti-
ci (pressione sottoglottica), glottici (proprietà biomeccaniche delle corde vocali) e
sovraglottici (resistenza sovraglottica e risonanza) 13. Tutti questi fattori di input so-
no stati variamente combinati e relazionati in numerosi modelli teorici al fine di
spiegare, in modo esauriente e plausibile, sia l’oscillazione delle corde vocali sia al-
cune particolari caratteristiche dell’output acustico fonatorio 17 22. Alcuni Autori 11

Centro Medico-Chirurgico di Foniatria, Padova

(1) Si può intendere l’articolazione come i diversi atteggiamenti assunti dagli organi articolatori al fi-
ne di produrre una particolare e determinata risonanza.

II.
1
36 W. De Colle

hanno prospettato che la vibrazione glottica avvenga, almeno in particolari condi-


zioni, secondo un modello non-lineare in grado di giustificare alcune irregolarità del
segnale acustico (ad esempio oscillazioni non periodiche) senza far ricorso a fattori
perturbativi casuali esterni al sistema.
La stessa relazione fra atteggiamento glottico e segnale risultante può essere non
lineare, per cui un piccolo cambiamento dell’assetto glottico può determinare note-
voli variazioni nel segnale acustico di output 14.

METODICHE DI STUDIO DEL SEGNALE GLOTTICO

La maggior parte delle metodiche di studio forniscono informazioni indirette


sulle caratteristiche del suono glottico. Infatti una reale valutazione dello stesso ne-
cessiterebbe di microfoni miniaturizzati introdotti a livello del vestibolo laringeo ed
in grado di raccogliere l’onda di pressione acustica. Tuttavia registrazioni strobo-
scopiche e/o cinematografiche ultrarapide sincrone a quelle metodiche, nonché l’u-
tilizzo dei dati ottenuti per la realizzazione di modelli laringei sperimentali, hanno
dimostrato la loro affidabilità nel fornire un forma d’onda molto simile al segnale
glottico reale. Fra le metodiche utilizzate ricordiamo:
Elettroglottografia (EGG): misura le modificazioni di impedenza elettrica al va-
riare del grado di contatto/affrontamento delle corde vocali nel corso della fonazio-
ne. Attraverso due elettrodi a placca applicati simmetricamente sul collo, a livello
della cartilagine tiroidea, è inviato un segnale elettrico alternato a bassa tensione ed
elevata frequenza. L’impedenza elettrica fra i due elettrodi è funzione della recipro-
ca posizione delle strutture anatomiche della laringe, ed in particolare delle corde
vocali. In corrispondenza dell’apertura glottica la corrente elettrica incontrerà la
massima resistenza al suo passaggio e si avrà dunque la massima impedenza (o mi-
nima ammettenza); a glottide chiusa invece la corrente elettrica incontrerà la mini-
ma resistenza (minima impedenza ovvero massima ammettenza). Il tracciato (elet-
troglottogramma) (Fig. 1) ha una forma para-triangolare in cui sono state indivi-
duate varie fasi che consentono il calcolo di diversi quozienti (per maggior dettagli
si veda 5). L’onda elettroglottografica è dunque in diretta relazione con la vibrazio-
ne delle corde vocali e può essere assunta come segnale glottico (con le limitazioni
espresse sotto).
Fotoelettroglottografia (FGG): metodica in grado di monitorare mediante un fo-
tosensore i cambiamenti di transilluminazione transglottica durante la vibrazione
cordale. Il fotosensore può essere applicato all’esterno, al di sotto della posizione
delle corde vocali, o all’interno a livello del vestibolo laringeo. La fonte luminosa
viceversa, e rispettivamente, va posizionata all’interno o all’esterno. Il segnale lu-
minoso è trasdotto in segnale elettrico, eventualmente digitalizzato mediante com-
puter, e rappresentato su display. La sua forma è molto simile a quella dell’elettro-
glottogramma e consente di quantificare i tempi di apertura e chiusura glottica e la
velocità delle fasi di apertura e chiusura; FGG ed EGG sono dunque metodiche
complementari. Esiste inoltre un’ottima e significativa correlazione fra ampiezza fo-
toelettroglottografica ed area glottica misurata mediante laringostroboscopia 10.
Metodiche di filtraggio inverso: sono le metodiche di analisi in grado di stima-
Caratteristiche acustiche del suono glottico 37

Fig. 1.
Tipico tracciato elettroglottografico; le frecce indicano le fasi di chiusura della glottide.

re la funzione di trasferimento del filtro sovraglottico; applicando l’inverso di que-


sto filtro al segnale registrato a livello orale, è possibile eliminare l’effetto di riso-
nanza del vocal tract ripristinando l’originario segnale glottico (vedi anche 1, pag.
71). Il segnale orale può essere di tipo acustico (pressione acustica, cioè voce) op-
pure di tipo aerodinamico in termini di portata glottica, cioè di quantità di flusso ae-
reo che passa attraverso la glottide vibrante in un secondo (Litri/sec). La metodica
in questo caso è definita flussoglottografia (FFG; in inglese Flow glottography –
FLOG) ed il segnale risultante (flussoglottogramma) è il segnale glottico più reali-
stico in quanto se moltiplicato per l’impedenza acustica di radiazione alle labbra for-
nisce il segnale in termini di pressione acustica, che è il vero veicolo della comuni-
cazione verbale.
Un interessante confronto fra alcune di queste metodiche si può trovare nel la-
voro di Holmber et al. 12.

ACUSTICA DEL SEGNALE GLOTTICO

In condizioni di normale affrontamento ed oscillazione delle corde vocali il se-


gnale glottico generato è un suono complesso quasi periodico. In quanto complesso
esso è la somma algebrica di una serie di segnali sinusoidali, denominati compo-
nenti o parziali, ciascuno con una determinata frequenza, ampiezza e fase (serie o
integrale di Fourier). Il termine «quasi» sta invece ad indicare che frequenza ed am-
piezza del suono glottico possono modificarsi nel tempo. In condizioni di normalità
queste variazioni sono molto lente per cui se consideriamo un breve intervallo tem-
porale il segnale può essere considerato periodico (analisi spettrale a breve termine)
4
. In questo breve tempuscolo quindi il segnale glottico, periodico, ha una suo Pe-
riodo Fondamentale T (e quindi una sua Frequenza Fondamentale fo = 1/T) e le
componenti o parziali sono definite armoniche in quanto hanno frequenza multiplo
intero della Fondamentale fo.

II.
1
38 W. De Colle

Nel caso di incompleto affrontamento e/o di irregolare vibrazione delle corde


vocali, il segnale generato sarà in parte o totalmente aperiodico; in altre parole in as-
sociazione alla componente periodica ci sarà del rumore, o il segnale sarà comple-
tamente costituito da rumore. In quest’ultimo caso esso sarà definito complesso ape-
riodico ed avrà infinite componenti sinusoidali che però non saranno armoniche in
quanto le loro frequenze non sono multipli interi di una fondamentale 1.
Abbiamo già sottolineato che il segnale acustico laringeo non è ancora voce;
questa si forma grazie all’azione di filtraggio operata sul segnale sorgente da quel
filtro complesso e variabile nel tempo che è il tratto vocale sopraglottico. L’azione
di filtro (o di risonanza) consente al segnale glottico l’acquisizione di contenuti
informativi. Confrontando le caratteristiche del suono glottico e del segnale irradia-
to a livello delle labbra (segnale microfonico), e nel caso della formazione dei suo-
ni vocalici, si osserva che:
• il segnale glottico ha una forma d’onda relativamente semplice rispetto al se-
gnale microfonico;
• nell’emissione dei diversi segnali complessi vocalici il segnale glottico si
mantiene, con una certa approssimazione, simile a fronte di una notevole va-
riazione del segnale verbale.
Ciò è visualizzato in Figura 2 in cui si riporta il segnale «glottico» e quello mi-
crofonico sincrono delle cinque vocali fondamentali italiane. Precisiamo che la forma
d’onda definita come segnale glottico è in realtà il tracciato elettroglottografico e non
la reale variazione di pressione acustica laringea (ed è per questo che usiamo le « »).
Tuttavia come già espresso sopra possiamo assumere l’EGG come segnale glot-
tico con alcune precisazioni. Nella nostra rappresentazione elettroglottografica il
picco del tracciato (identificato con le frecce in Figura 1) rappresenta la fase di chiu-
sura della glottide con minima impedenza al passaggio della corrente elettrica, ma
con massima impedenza al passaggio del flusso aereo; nel segnale acustico corri-
spondente avremo dunque una fase di rarefazione che graficamente si traduce in una
valle. Viceversa la valle nel segnale EGG corrisponde all’apertura glottica (massi-
ma impedenza al passaggio di corrente elettrica) e quindi al passaggio di aria, ad un
aumento della pressione (condensazione), ed alla formazione di un picco nella gra-
ficazione acustica.
Nell’analisi acustica del suono glottico, oltre alla forma d’onda, è utile conside-
rare la rappresentazione spettrale (spettro di potenza e/o spettrogramma) che con-
sente l’analisi dei due parametri fondamentali del segnale: frequenza ed ampiezza
delle componenti.

Parametro frequenza
La frequenza di apertura e chiusura glottica (cioè il numero di cicli glottici al se-
condo) rappresenta la frequenza del segnale complesso quasi periodico glottico,
cioè la sua frequenza fondamentale (fo). Dal punto di vista fisiologico il valore del-
la frequenza del segnale dipende dai numerosi fattori di input (sottoglottici, glottici
e sovraglottici), a sua volta dipendenti da fattori costituzionali, di età, sesso, tipo di
attività vocale 19 20. Le variazioni di fo tuttavia oscillano attorno ad un valore medio
definito frequenza fondamentale modale; il suo valore va dai 225 ai 440 Hz nei bam-
Caratteristiche acustiche del suono glottico 39

Fig. 2.
Segnale EGG («glottico») e segnale microfonico sincrono delle cinque vocali fondamentali italiane (ve-
di testo) (da De Colle, modificata).

bini, da 175 a 245 Hz nelle femmine adulte e da 105 a 160 Hz nei maschi adulti. Il
range frequenziale compreso fra il suono più grave ed il suono più acuto definisce
l’estensione vocale del soggetto (Tab. I).
Nella Figura seguente (Fig. 3) sono rappresentati 50 msec di forma d’onda del
segnale «glottico» (vocale [a]) e lo spettro di potenza corrispondente, di un maschio
e di una femmina.
Nel maschio la forma d’onda comprende in 50 msec circa 6 cicli glottici e dun-
que con un Periodo Fondamentale T di circa 8,3 msec corrispondente ad una fo di
circa 120 Hz. Nella femmina invece abbiamo in 50 msec 11 cicli con un T circa di
4,5 msec corrispondente ad una fo di circa 220 Hz. Nelle finestre riportanti gli spet-
tri di potenza, le frecce indicano la prima armonica o Frequenza Fondamentale. Le
armoniche di frequenza multipla intera sono rappresentate dai picchi successivi; si
osserva come nel maschio le armoniche siano meno distanziate fra loro rispetto a
quelle del soggetto femminile, e ciò per la minor frequenza nel maschio.

II.
1
40 W. De Colle

Tab. I.
Variazioni della fondamentale laringea in relazione all’età e sesso (in Hz) 23.

Età Femmine Maschi

Alla nascita 440-590 440-590

3 anni 255-360 255-360

8 anni 215-300 210-295

12 anni 200-280 195-275

15 anni 185-260 135-205

Adulti 175-245 105-160

Fig. 3.
Forma d’onda del segnale «glottico» e spettro di potenza corrispondente di un maschio e di una fem-
mina (vocale [a]).

Naturalmente la periodicità del segnale glottico si mantiene invariata nel segna-


le verbale corrispondente in quanto il filtro sovraglottico modifica esclusivamente
l’ampiezza e la fase delle armoniche, ma non la loro frequenza.
Per quanto riguarda le variazioni di fo queste possono avvenire a breve o a lun-
go termine e sono definite perturbazioni; entro determinati limiti ed in associazione
Caratteristiche acustiche del suono glottico 41

alle perturbazioni di ampiezza, esse contribuiscono a conferire naturalezza al parla-


to umano. Le perturbazioni a breve termine, denominate anche jitter, sono rilevabi-
li entro pochi cicli di vibrazione (talvolta anche fra un ciclo e quello immediata-
mente successivo) e possono essere dell’ordine di ± 25 Hz 15. Quelle a lungo termi-
ne si instaurano in un tempo più lungo, comprendente più cicli vibratori, assumono
talvolta un andamento periodico, e sono denominate modulazioni o tremore vocale
(fisiologico o meno).
Secondo Titze 18 21 le perturbazioni sono dovute a diversi fattori fra cui irregola-
rità dei potenziali di azione dei muscoli respiratori e laringei con conseguente flut-
tuazione delle forze muscolari e della conformazione laringea, disomogeneità strut-
turali e/o cinematiche della mucosa cordale, movimenti casuali del muco sulle cor-
de vocali, instabilità o turbolenza del flusso aereo emergente dalla glottide, instabi-
lità dell’accoppiamento biomeccanico ed acustico fra sorgente sonora e filtro (con-
dotto vocale) e tra sorgente e trachea (mantice polmonare) nella fase di apertura del-
le corde vocali.
Un’altra interessante modificazione del normale pattern frequenziale glottico è
la presenza di diplofonia. È caratterizzata da un suono complesso laringeo cui si so-
vrappone un altro suono complesso con frequenza fondamentale sottoarmonica di
quella; i rapporti armonici possono essere di una ottava (cioè la seconda fondamen-
tale è metà della prima) e allora si parla di diplofonia di 1° grado, o di una ottava ed
una quinta (la seconda fondamentale è 1/3 rispetto alla prima) e allora si parla di di-
plofonia di 2° grado. È un fenomeno esclusivamente glottico e si differenzia da un
altro definito bitonalità in cui vi è la presenza di due suoni con fondamentali non
necessariamente in rapporto armonico fra loro; il primo suono ha origine glottica
mentre il secondo è prodotto da un’altra sorgente laringea (tipicamente dalle false
corde) 6.
La diplofonia compare in molte patologie laringee (neoformazioni glottiche, pa-
ralisi, disfonia disfunzionale); talvolta può essere prodotta volontariamente con fi-
nalità artistiche o distintive segmentali, come in alcuni dialetti cinesi (Rose, 1988
citato da 17). È sempre associata ad una alterazione della vibrazione cordale con mo-
vimenti multifasici di apertura e chiusura glottica o per diverse frequenze di vibra-
zione delle due corde. Gli impulsi glottici si presentano variamente alterati con
aspetti anch’essi multifasici o con alternanza di impulsi a maggior e minore am-
piezza, ma senza alcun pattern tipico 2. In Figura 4 si riporta a sinistra lo spettro-
gramma e a destra lo spettro di potenza, processato in corrispondenza del cursore,
del segnale «glottico» di un soggetto di sesso maschile affetto da paralisi ricorren-
ziale sinistra. Si rileva chiaramente la presenza di diplofonia con armoniche (a1, a2,
a3, a4, ecc.) di frequenza multiplo di 92 Hz circa (a1 è la prima armonica o fonda-
mentale) e le sottoarmoniche (indicate con s1, s2, s3, s4, ecc.) con frequenza multi-
plo di 46 Hz circa, cioè della metà della fondamentale (diplofonia di 1° grado).
In Figura 5 dello stesso segnale sono riportati lo spettrogramma e la porzione di
forma d’onda corrispondente all’intervallo marcato a sinistra con i cursori e che
comprende una parte con diplofonia (1), una senza (2) ed una ancora con diplofonia
(3). Si rilevano le successive modificazioni della forma d’onda che sono maggior-
mente evidenziate in Figura 6. Il patter glottico diplofonico è rappresentato dall’al-
ternarsi di impulsi a maggiore e minore ampiezza.

II.
1
42 W. De Colle

Fig. 4.
Spettrogramma e spettro di potenza del segnale «glottico» di un soggetto maschio affetto da paralisi ri-
correnziale sinistra (vedi testo).

Fig. 5.
A sinistra spettrogramma, come in Figura 4, con cursori che identificano un intervallo comprendente
una parte di vocalizzo con diplofonia, una parte senza ed ancora una parte con diplofonia. Lo stesso in-
tervallo è riportato a destra come forma d’onda in cui le diverse porzioni sono indicate rispettivamen-
te con 1, 2 e 3.

Parametro ampiezza
L’ampiezza del segnale laringeo dipende, come la frequenza, da fattori sotto-
glottici, glottici e sovraglottici. La pressione sottoglottica è il fattore ritenuto più im-
portante, con valori tuttavia strettamente legati al grado di adduzione cordale, alla
lunghezza ed alla rigidità delle corde vocali 8. Il tratto vocale sopraglottico può a sua
volta influenzare le modalità di vibrazione laringea.
L’ampiezza di un segnale complesso, come quello glottico e verbale, può esse-
Caratteristiche acustiche del suono glottico 43

Fig. 6.
In dettaglio le modificazioni della forma d’onda del segnale «glottico» diplofonico in 1 e 3, normale in
2 (vedi anche testo).

re valutata mediante tre metodi di misura: ampiezza di picco, ampiezza di picco-


picco ed ampiezza efficace (in inglese RMS amplitude ovvero «root mean squared
amplitude» o radice quadrata della media dei quadrati delle ampiezze istantanee).
Nel caso di un segnale sinusoidale esiste una corrispondenza matematica fra le tre
metodiche di misurazione, ma non nel caso di un segnale complesso per la sua irre-
golarità ed asimmetria rispetto al tempo e/o alla frequenza 7. Considerando inoltre
che il tratto vocale sopraglottico modifica fase ed ampiezza delle armoniche del se-
gnale glottico, risulta problematico stabilire una precisa relazione fra ampiezza del
segnale glottico e l’intensità, generalmente intesa, della voce.
Certo è che il segnale glottico si presenta con un inviluppo spettrale monotona-
mente discendente senza minimi o massimi apprezzabili; vale a dire che l’ampiezza
delle componenti armoniche diminuisce man mano che aumenta la frequenza. Me-
diamente la diminuzione di ampiezza è di 12 dB per ogni raddoppio della frequen-
za (cioè per ogni ottava). La massima energia del segnale glottico si situa dunque al-
le basse frequenze. Il valore di 12 dB/ottava è un valore medio e teorico; infatti il
reale impulso glottico non ha una pendenza così regolare e soprattutto varia in rela-
zione al tipo di fonazione. Nella fonazione rilassata gli impulsi glottici assumono
una forma parasinusoidale con prima armonica di ampiezza relativamente maggio-
re rispetto alle altre componenti. In tal caso la pendenza dello spettro arriva anche
fino a 18 dB/ottava. Un comportamento simile si ha in presenza di incompleta chiu-
sura glottica con aumento dell’ampiezza della prima armonica e riduzione dell’am-
piezza delle componenti alle alte frequenze. In caso di fonazione vigorosa, con bru-
sca riduzione del flusso aereo a livello glottico, lo spettro presenta una maggior am-
piezza delle componenti ad alta frequenza e la pendenza potrà arrivare anche a 6/9
dB/ottava (Fig. 7). Le relazioni fra le diverse armoniche o fra le diverse regioni for-
mantiche nel segnale vocale, potrebbero essere utilizzate per stabilire una correla-
zione fra dati acustici e modalità di funzionamento glottico 12 16.
Bisogna sottolineare che questa diminuzione di energia nel segnale laringeo è in

II.
1
44 W. De Colle

Fig. 7.
Diverse pendenze dello spettro
del segnale glottico.

parte compensata dall’effetto di radiazione del segnale a livello delle labbra in cui
si ha un aumento di 6 dB/ottava.
La forma dell’inviluppo spettrale del segnale glottico dipende dunque dal tipo
di fonazione (intensità, frequenza fondamentale, registro vocale), ma anche dalle ca-
ratteristiche individuali del soggetto. Nella produzione della voce il filtro sovra-
glottico agisce su questo suono sorgente che ne rappresenta il primum movens. Sen-
za di esso il tratto vocale potrebbe produrre rumori, carichi di significato, ma privi
di quelle modulazioni sovrasegmentali che tanta importanza hanno nella comunica-
zione umana.

BIBLIOGRAFIA
1
De Colle W. Voce & Computer – Analisi acustica digitale del segnale verbale (Il sistema CSL-
MDVP). Torino: Ed. Omega 2001.
2
Dejonckere PH, Lebacq J. An analysis of the diplophonia phenomenon. Speech Communication
1983;2:47-56.
3
Fant G. Acoustic theory of speech production. L’Aia: Ed. Mouton 1960.
4
Ferrero FE, Magno Caldognetto E. Elementi di fonetica acustica. Trattato di Foniatria e Logope-
dia a cura di Croatto L., Padova: Ed. La Garangola 1986;vol.3:155-96.
5
Ferrero FE. L’elettroglottografia. Trattato di Foniatria e Logopedia a cura di Croatto L. Padova:
Ediz. La Garangola 1988;vol.4:109-62.
6
Ferrero FE, Ricci Maccarini A, Tisato G. I suoni multifonici nella voce umana. Atti XIX Convegno
Nazionale Associazione Italiana di Acustica. Napoli, 10-12 Aprile 1991.
Caratteristiche acustiche del suono glottico 45

7
Ferrero FE, Accordi M, Accordi D, de Filippis C, Staffieri A. Semeiologia avanzata della funzione
vocale. Acta Phon Lat 1998;20:35-58.
8
Finnegan EM, Luschei ES, Hoffman HT. Modulations in respiratory and laryngeal activity asso-
ciated with changes in vocal intensity during speech. J Speech Lang Hearing Res 2000;43:934-50.
9
Flanagan JL. Speech analysis synthesis and perception. Berlin-Heidelberg-New York: Springer-
Verlag 1965.
10
Habermann W, Jiang J, Lin E, Hanson DG. Correlation between glottal area and photoglotto-
graphic signal in normal subjects. Acta otolaryngol 2000;120:778-82.
11
Herzel H, Berry D, Titze RI, Saleh M. Analysis of vocal disorders with methods from nonlinear dy-
namics. J Speech Hearing Res 1994;37:1008-19.
12
Holmberg EB, Hillman RE, Perkel JS, Guiod PC, Goldman SL. Comparison among aerodinamic,
electroglottographic, and acoustic spectral measures of female voice. J Speech Hearing Res
1995;38:1212-23.
13
Jiang J, Lin E, Hanson DG. Vocal fold phisiology. Otolaryngol Clin North Am 2000;33:4.
14
Johnson K. Acoustic and Auditory Phonetics. Cambridge Mass. USA: Blackwell Publishers 1997.
15
Lieberman P. Perturbations in vocal pitch. JASA 1961;33:597-603.
16
Pickett JM. The spectra of vowel. The Sounds of Speech Communications 1980;4:57-8.
17
Smith ME, Berke GS, Gerrat BR, Kreiman J. Laryngeal paralyses: theoretical considerations and
effects on laryngeal vibration. J Speech Hearing Res 1992;35:545-54.
18
Titze IR, Horii, Scherer RC. Some technical considerations in voice perturbation measurements,
JSHR 1987;30:252-60.
19
Titze IR (1). On the relation between subglottal pressure and fundamental frequency in phonation.
J Acoustic Soc Am 1989;85(2):901-90.
20
Titze IR (2). Physiologic and acoustic differences between male and female voice. J Acoustic Soc
Am 1989;85(4):1699-707.
21
Titze IR. A model for neurologic sources of aperiodicity in vocal fold vibration. J Speech Hearing
Res 1991;34:460-72.
22
Titze IR. Current topics in voice production mechanisms. Acta Otolaryngol (Stockh)
1993;113:421-7.
23
Wilson DK. Voice problems of children. Baltimore: Williams & Wilkins 1987.

II.
1
46 G. Bergamini et al.

II.2. ANATOMO-FISIOLOGIA DELL’APPARATO


PNEUMO-FONATORIO

G. Bergamini*, R. Füstös**, D. Casolino***

Durante la fonazione le corde vocali agiscono come trasduttori che convertono


le forze aerodinamiche generate dal mantice polmonare in energia acustica 19.
L’apparato respiratorio 5 25 29 23 è un insieme di organi deputati innanzitutto agli
scambi gassosi fra l’aria atmosferica ed il sangue e, secondariamente, a produrre un
flusso aereo necessario all’espletamento di numerose funzioni quali: la fonazione,
la tosse e l’espettorazione, il raschio, lo starnuto, il soffio, il fischio.
Le parti che compongono questo apparato sono: la gabbia toracica, costituita
da una porzione scheletrica e da una muscolare, le vie aerofore ed il polmone.
Lo scheletro toracico è formato posteriormente dalle 12 vertebre dorsali, ante-
riormente dallo sterno, lateralmente dalle coste. Esse si uniscono al rachide me-
diante le due faccette articolari vertebrali che prendono rapporto con le superfici ar-
ticolari di due vertebre adiacenti e mediante la faccetta della tuberosità che si arti-
cola con la faccia articolare costale dell’apofisi trasversa. Anteriormente le prime
sette coste (coste vere), con l’interposizione di un segmento cartilagineo, si unisco-
no individualmente allo sterno; l’VIII, la IX e la X (false coste) confluiscono su una
parte cartilaginea comune che a sua volta si articola con lo sterno; le ultime due (co-
ste fluttuanti) si prolungano anteriormente con una cartilagine che resta libera. Le
coste sono inclinate dall’alto al basso sia da dietro in avanti sia dall’interno all’e-
sterno. Lo sterno, appiattito in senso antero-posteriore, è costituito da tre parti: il
manubrio che presenta lateralmente le faccette articolari per le clavicola, il corpo
con le superfici articolari per le coste, l’appendice xifoide cartilaginea, all’estremità
inferiore, che in certi casi, specie nelle femmine, può essere assente. Il manubrio ed
il corpo formano un angolo aperto posteriormente (angolo di Louis) che può modi-
ficarsi nel corso dei movimenti respiratori. Il torace nel suo insieme ha una forma
troncoconica con un apertura craniale ellittica rivolta in alto e in avanti ed una cau-
dale la cui parte anteriore è ad angolo acuto con apice sul processo xifoideo e i lati
costituiti dalla VII, VIII, IX e X cartilagine costale. Sono possibili due modalità di
movimento toracico che possono talvolta essere congiunte. L’elevazione-abbassa-
mento, che è in genere più pronunciato nella parte alta del torace, corrisponde ad un
movimento costale cosiddetto «a leva di pompa» (Fig. 1a) che si verifica a livello

*
Servizio di Clinica ORL, Dipartimento di patologia neuro-psico-sensoriale, Università di Modena
**
U.O. di ORL, Ospedale Generale Regionale, Bolzano
***
U.O. di ORL, Ospedale «M. Bufalini», Cesena
Anatomo-fisiologia dell’apparato pneumo-fonatorio 47

Fig. 1.
Schema che dimostra gli spostamenti delle coste e dello sterno nell’inspirazione. In a, movimento a
«leva di pompa» della parte alta del torace (che si innalza). In b, movimento a «manico di secchio»
della parte bassa del torace (che si dilata).

delle articolazioni costo-vertebrali e costo-trasversarie secondo un asse orizzontale


trasversale; la dilatazione-restringimento, tipico della parte bassa del torace, si rea-
lizza prevalentemente per il movimento costale «a manico di secchio» (Fig. 1b) lun-
go un asse orizzontale antero-posteriore passante per i punti articolatori anteriori e
posteriori.
Se questi movimenti sono combinati lo sterno si sposta parallelamente a se stes-
so nei due sensi durante la respirazione, se prevale il movimento di elevazione-ab-
bassamento la parte inferiore dello sterno funge da centro di basculamento e si spo-
sta esclusivamente la parte superiore (Fig. 2a), in caso contrario il movimento si ve-
rifica inferiormente (Fig. 2b). Anche la colonna vertebrale ha una incidenza nella re-
spirazione perché l’estensione separa le costole a ventaglio e facilita l’inspirazione
mentre la flessione facilita un’espirazione forzata.
Questa attività dinamica, variamente combinata, dipende dalla contrazione dei
muscoli respiratori e dalla elasticità del parenchima polmonare.
I muscoli respiratori vengono generalmente suddivisi in tre gruppi: inspiratori
principali (diaframma e muscoli intercostali esterni), inspiratori secondari (scaleni,
sternocleidomastoideo, piccolo e grande dentato, piccolo e grande pettorale) ed
espiratori (intercostali interni, muscoli addominali).
Il diaframma è un muscolo piatto cupuliforme che separa la cavità toracica da

II.
2
48 G. Bergamini et al.

Fig. 2.
Schema che mostra il movimento dello sterno nella respirazione (da Leuche 23, modificata).

quella addominale ed è costituito da una porzione muscolare periferica con fasci che
convergono verso la parte centrale aponevrotica la quale ha una forma grossolana-
mente a trifoglio. Ha inserzioni posteriori a livello delle prime vertebre lombari, in-
serzioni costali sulla faccia mediale ed i margini superiori delle ultime sei coste, una
inserzione sternale sulla faccia posteriore dell’appendice xifoidea. Presenta diversi
orifizi attraverso i quali passano dal torace all’addome l’esofago, strutture vascola-
ri (aorta, vena cava inferiore, vene azygos ed emiazygos, vasi toracici interni), il
dotto toracico e strutture nervose (catene del simpatico, vago, nervi grandi e picco-
li splancnici). È il muscolo respiratorio principale che contraendosi durante l’inspi-
razione si appiattisce vincendo la pressione positiva addominale; si verifica inoltre
Anatomo-fisiologia dell’apparato pneumo-fonatorio 49

una elevazione delle coste inferiori per accorciamento delle fibre muscolari che si
inseriscono a questo livello.
I muscoli intercostali esterni iniziano posteriormente a livello delle articolazio-
ni costo-trasversarie ed anteriormente arrivano in prossimità del punto di passaggio
fra porzione ossea e cartilaginea delle coste con inserzioni sul bordo inferiore della
costa soprastate e sul bordo superiore della sottostante. Hanno direzione obliqua
dall’alto in basso e dall’indietro in avanti e determinano un innalzamento delle co-
ste.
I muscoli scaleni (anteriore, medio, posteriore) si inseriscono sui processi tra-
sversi delle vertebre cervicali ed inferiormente sulla prima e seconda costa con azio-
ne di innalzamento inspiratorio esclusivamente con la modalità a leva di pompa.
Lo sterno-cleido-mastoideo, con inserzioni in alto sull’apofisi mastoidea ed in
basso sullo sterno e sulla clavicola, oltre ad una azione di flessione e rotazione del
capo interviene come elevatore del torace nella inspirazione forzata.
Il piccolo dentato si inserisce in alto sull’apice dei processi spinosi dell’ultima
vertebra cervicale e delle prime tre vertebre toraciche ed in basso sulla faccia ester-
na della II, III, IV, V costa che vengono quindi innalzate quando si contrae.
Il grande dentato che si inserisce sulla faccia esterna delle prime nove-dieci co-
ste e sul margine vertebrale della scapola ha anch’esso un’azione di innalzamento
delle coste.
Il grande pettorale è un voluminoso muscolo triangolare situato nella parte an-
teriore del torace dove si inserisce medialmente a varie strutture (due terzi anteriori
della clavicola, faccia anteriore dello sterno, faccia anteriore delle prime sei cartila-
gini costali, aponeurosi del retto addominale) e lateralmente al solco bicipitale del-
l’omero. Se il punto di inserzione fissa è in questa sede determina un innalzamento
delle coste.
Il muscolo piccolo pettorale, situato al di sotto del grande pettorale, prende ori-
gine sulla faccia esterna della III, IV, V costa e sale per inserirsi sul margine media-
le del processo coracoideo della scapola con azione di innalzamento delle coste.
Gli intercostali interni con un decorso dall’alto al basso e dall’avanti all’indie-
tro si inseriscono sulla faccia interna e sul bordo inferiore della costa sovrastante e
sul margine superiore della sottostante ed hanno un’azione di abbassamento delle
coste con meccanismo a «leva di pompa» e quindi sono implicati soprattutto nella
fase espiratoria quando la respirazione è di tipo costale superiore.
I muscoli addominali (trasverso, piccolo obliquo, grande obliquo) quando si
contraggono provocano un restringimento della parete addominale con conseguen-
te pressione sui visceri addominali, che sospingono il diaframma verso l’alto, ed ab-
bassamento degli archi costali inferiori; hanno un’azione determinante soprattutto
nell’ambito dell’antagonismo addomino-diaframmatico nella voce proiettata e nel
canto. Il grande retto, invece, abbassa il torace con meccanismo a «leva di pompa»
ed è flessore del tronco: interviene soprattutto nella voce di pericolo e nelle condi-
zioni di sforzo vocale.
Le vie aerofore iniziano con le narici e le labbra e sono costituite dalle cavità
nasali ed orali (una inspirazione orale si verifica non raramente mentre parliamo),
dal faringe, dalla laringe in atteggiamento respiratorio, dalla trachea e dai bronchi
fino alle più piccole diramazioni. Il rivestimento mucoso è costituito da un epitelio

II.
2
50 G. Bergamini et al.

pseudostratificato di cellule cilindriche ciliate con alcune cellule caliciformi ad


esclusione del piano glottico dove troviamo epitelio pavimentoso e delle ultime ter-
minazioni bronchiali dove non sono più evidenti le ciglia e l’epitelio diventa cubi-
co. Un’altra caratteristica importante delle vie aeree è lo scheletro cartilagineo che
ne consente la pervietà e che scompare solo nelle diramazioni bronchiali più perife-
riche quando il diametro si riduce ad un millimetro. La resistenza che esse offrono
al passaggio dell’aria sono ripartite nei vari segmenti: 10% a livello delle piccole vie
aeree, 15% a livello di trachea e bronchi, 25% a livello glottico, 50% a livello del
naso o della bocca.
I polmoni sono gli organi nei quali avviene lo scambio gassoso fra l’aria ed il
sangue che vi giunge attraverso l’arteria polmonare. Hanno uno stroma connettiva-
le-elastico e sono avvolti nel foglietto viscerale pleurico. Sono costituiti da tre lobi
a destra e due a sinistra. Ogni lobo si divide in subunità: segmenti, lobuli, acini, al-
veoli.
Essi sono soggetti a movimenti di espansione attiva in fase inspiratoria per con-
sentire l’ingresso dell’aria negli alveoli e ciò si verifica soprattutto per azione del
diaframma. La successiva riduzione volumetrica, presupposto per l’espulsione del-
l’aria con il suo contenuto in anidride carbonica, è un movimento prevalentemente
passivo che si realizza per azione della retrazione elastica del polmone (dipende dal-
la presenza di fibre elastiche nell’interstizio e dalla tensione superficiale degli al-
veoli) e della gabbia toracica. Nella espirazione forzata entrano in attività anche i
muscoli intercostali interni ed i muscoli addominali che si contraggono energica-
mente e bruscamente in quelle situazioni in cui è necessaria una elevata pressione
espulsiva.
I volumi di aria mobilizzati variano in rapporto all’entità e al tipo di attivazione
muscolare (Fig. 3).

VC: volume corrente (500 cc) CI: capacità inspiratoria (3500 cc)
VRI: volume di riserva inspiratoria (3000 cc) CRF: capacità residua funzionale (2400 cc)
VRE: volume di riserva espiratoria (1200 cc) CV: capacità vitale (4700 cc)
VR: volume residuo (1200 cc) CPT: capacità polmonare totale

(da Cornut, modificata) Fig. 3.


Anatomo-fisiologia dell’apparato pneumo-fonatorio 51

Nella respirazione tranquilla si utilizzano fra i 400 e i 500 cc di aria (volume


corrente) con una azione inspiratoria prevalentemente diaframmatica solo in parte
coadiuvata dagli intercostali esterni e con una espirazione esclusivamente passiva
dopo la quale rimangono nel polmone circa 2400 cc di aria (capacità residua fun-
zionale). Una attivazione forzata di tutti i muscoli espiratori e la flessione del tron-
co e delle braccia consentono l’espulsione dal polmone di altri 1200 cc (volume di
riserva espiratoria); rimarranno nel polmone altri 1200 cc (volume residuo) non al-
trimenti mobilizzabili. Se dopo una inspirazione a riposo si esegue una inspirazione
forzata, attivando completamente il diaframma, i muscoli intercostali esterni e i mu-
scoli inspiratori secondari, si introducono circa 3000 cc di aria (volume di riserva
inspiratoria). L’aria che può essere mobilizzata con una espirazione forzata che con-
segua ad una inspirazione profonda corrisponde alla somma fra il volume di riserva
inspiratoria, il volume corrente ed il volume di riserva espiratoria e viene definita
capacità vitale.
Durante la fonazione l’attività respiratoria deve continuare a garantire l’emato-
si pur adattandosi alle esigenze della produzione vocale. In una respirazione calma
il ritmo respiratorio è regolare perché i vari cicli hanno durata pressoché uguale ed
il tempo inspiratorio è di poco più lungo della espirazione. In fonazione, invece,
l’inspirazione si accorcia e l’espirazione fonatoria aumenta considerevolmente con
eventuali pause corrispondenti alle esitazioni che normalmente si verificano nella
parola spontanea. I volumi di aria mobilizzati sono maggiori rispetto ad una respi-
razione tranquilla e variano in rapporto al tipo di prestazione vocale; le pressioni in-
spiratorie ma soprattutto espiratorie (la fonazione avviene a glottide chiusa) sono
molto aumentate e richiedono sempre una attivazione muscolare; sono, inoltre, ne-
cessari dei fini adattamenti muscolari per il mantenimento di pressioni adeguate al-
le caratteristiche acustiche della emissione vocale. La pressione sottoglottica varia
dai 2-5 cm d’acqua nella conversazione ai 10-20 nella voce proiettata, raggiungen-
do nel canto valori molto più elevati (fino a 50-60 cm).
Il tipo di respirazione è molto importante nella produzione vocale. Il respiro to-
racico superiore che si realizza soprattutto con movimenti costali a «leva di pompa»
è facilmente induttore di disfunzionalità nei pazienti che utilizzano spesso la voce
direttiva o proiettata perché oltre a mobilizzare quantità limitate di aria non permet-
te una regolazione del flusso espiratorio; esso viene quindi delegato alla laringe che
deve assumere il doppio ruolo di rubinetto e di vibratore.
Nella respirazione toraco-addominale il movimento costale a «manico di sec-
chio» e l’abbassamento del diaframma consentono rifornimenti di aria adeguati a
qualsiasi esigenza vocale; inoltre mediante l’antagonismo addomino-diaframmatico
(gli addominali spingono ed il diaframma mantiene una contrazione tonica) si ottie-
ne un dosaggio preciso del flusso espiratorio e delle pressioni sottoglottiche secon-
do la necessità della voce. In certi casi può risultare efficace la respirazione verte-
brale che si realizza con una brusca flessione del rachide; viene impiegata fisiologi-
camente nella voce di insistenza o di pericolo ma se utilizzata in modo prolungato
innesca un circolo vizioso di sforzo vocale con conseguente disfunzionalità.
Il generatore del suono vocale è il laringe 20 22 2 11 24 23 7 29 3 19.
Il laringe è un organo impari e mediano, localizzato nella regione anteriore del
collo ad un livello compreso tra la III e la VI vertebra cervicale nell’adulto. Esso co-

II.
2
52 G. Bergamini et al.

munica superiormente con l’ipo-faringe e caudalmente con la trachea. Gli elementi


anatomici costitutivi sono: le cartilagini, i legamenti e le membrane aponeurotiche,
i muscoli, i vasi, i nervi, il rivestimento mucoso.
Lo scheletro laringeo è costituito da cinque cartilagini principali di cui tre im-
pari e mediane (tiroide, cricoide, epiglottide) e due pari e laterali (aritenoidi); inol-
tre possono essere presenti alcune piccole cartilagini accessorie (corniculate, cu-
neiformi, sesamoidi).
La tiroide, la cricoide e gran parte delle aritenoidi sono costituite da cartilagine
di tipo ialino; l’epiglottide, l’apice ed il processo vocale delle aritenoidi sono inve-
ce formate da cartilagine di tipo elastico. Dall’età di 20 anni inizia un processo di
calcificazione delle cartilagini ialine, specialmente nell’uomo, che si completa ver-
so i 50-60 anni.
La cartilagine tiroide ha la forma di uno scudo ed è costituita dall’unione di due
lamine quadrangolari alle cui estremità postero-superiori e postero-inferiori sono si-
tuate due coppie di prominenze (dette rispettivamente corna superiori o grandi cor-
ni ed inferiori o piccoli corni). L’unione di queste due lamine cartilaginee dà origi-
ne superiormente all’incisura tiroidea ed anteriormente ad un angolo diedro di circa
90° la cui prominenza anteriore è particolarmente accentuata nell’uomo (pomo di
Adamo). Sulla faccia esterna di ciascuna lamina quadrilatera è presente una cresta
obliqua che ha direzione infero-anteriore per l’inserzione dei muscoli sterno-tiroi-
deo e tiro-ioideo.
La cartilagine cricoide ha la forma di un anello con castone posteriore. Essa for-
ma l’unico anello cartilagineo completo delle vie aeree, costituisce buona parte del-
la regione posteriore ed inferiore del laringe e ne rappresenta la regione di confine
inferiore con la trachea. A livello del castone cricoideo si reperta una cresta media-
na verticale, che dà inserzione al legamento sospensore dell’esofago, e che lo divi-
de in due aree concave, punto fisso di origine per i muscoli cricoaritenoidei poste-
riori. A livello della congiunzione tra il castone e l’anello può essere rinvenuta in
circa il 20% dei casi una piccola faccetta articolare per il corno inferiore della car-
tilagine tiroide (articolazione crico-tiroidea). L’arco anteriore presenta nella sua por-
zione mediana una piccola sporgenza, il tubercolo cricoideo, ai lati del quale si in-
seriscono i muscoli crico-tiroidei. A livello della porzione superiore del castone cri-
coideo è ben evidente bilateralmente la faccetta articolare per la cartilagine arite-
noide (articolazione crico-aritenoidea).
Le cartilagini aritenoidi, che hanno un ruolo fisiologicamente rilevante, contri-
buiscono a formare il margine posteriore dell’aditus laringeo; esse hanno una forma
grosso modo piramidale con una base concava, sulla quale si reperta una faccetta ar-
ticolare liscia per la cricoide, e tre superfici: mediale, posteriore ed antero-laterale
con una depressione inferiore (fossetta emisferica) nella quale si inseriscono le fibre
del muscolo tiro-aritenoideo. Essa presenta anteriormente un processo detto proces-
so vocale, su cui si inserisce il legamento vocale, ed uno lateralmente, detto proces-
so muscolare, che dà inserzione ai mm. crico-aritenoidei posteriore e laterale.
L’epiglottide è una sottile lamina di cartilagine elastica ricoperta da mucosa; es-
sa ha la forma di una foglia, la cui parte inferiore ne rappresenta il «picciuolo», det-
to petiolo dell’epiglottide. Quest’ultimo si continua con il legamento tiro-epiglotti-
co che rappresenta l’ancoraggio dell’epiglottide all’angolo diedro della cartilagine
Anatomo-fisiologia dell’apparato pneumo-fonatorio 53

tiroidea. L’epiglottide presenta una faccia laringea ed una faccia linguale; il suo
margine libero rappresenta il confine anteriore dell’aditus laringeo ed il suo bascu-
lamento in senso antero-posteriore concorre a modificarne la pervietà dell’aditus
contribuendo alla protezione delle vie aeree durante la deglutizione.
La connessione degli elementi cartilaginei fra di loro e con le strutture vicinio-
ri si realizza mediante membrane e legamenti ed attraverso l’apparato muscolare.
La membrana tiro-ioidea è tesa fra il bordo superiore della cartilagine tiroidea e
l’osso ioide ed è rinforzata nella zona centrale dal legamento tiro-ioideo mediano ed
ai due lati dai legamenti tiro-ioidei laterali che vanno dal corno superiore della car-
tilagine tiroidea all’estremità del grande corno dell’osso ioide. La membrana crico-
tiroidea si inserisce sul bordo inferiore della cartilagine tiroidea e sul bordo supe-
riore dell’anello cricoideo con un rinforzo anteriore (legamento crico-tiroideo me-
diano). La membrana crico-tracheale unisce il bordo inferiore della cricoide al pri-
mo anello tracheale. La membrana elastica della laringe costituisce lo strato profon-
do del chorion mucoso; presenta tre rinforzi: i legamenti ariteno-epiglottici che dai
bordi laterali dell’epiglottide raggiungono il bordo anteriore dell’aritenoide, i lega-
menti tiro-aritenoidei superiori che si inseriscono anteriormente nell’angolo diedro
della tiroide e percorrendo le false corde raggiungono la fossetta emisferica dell’a-
ritenoide, i legamenti vocali che si inseriscono in avanti sotto i precedenti e rag-
giungono posteriormente l’apofisi vocale dell’aritenoide. La parte inferiore della
membrana elastica che è in continuità con il legamento vocale forma il cono elasti-
co che si inserisce sul bordo superiore della cartilagine cricoide. Altri legamenti so-
no: i glosso-epiglottici ed i faringo-epiglottici, che si trovano all’interno delle pliche
omonime; il legamento crico-corniculato che dal bordo superiore del castone cri-
coideo sale verticalmente fra le due aritenoidi dividendosi per raggiungere le carti-
lagini corniculate.
I muscoli del laringe si dividono in due gruppi: muscoli intrinseci e muscoli
estrinseci.
I muscoli intrinseci sono così definiti perché hanno entrambe le inserzioni sul
laringe; la loro azione consente i diversi movimenti alle cartilagini. La muscolatura
intrinseca può essere classificata in base al ruolo funzionale, in tre gruppi: dilatato-
ri (crico-aritenoidei posteriori), tensori della corda vocale (crico-tiroidei), costritto-
ri (crico-aritenoidei laterali, inter-aritenoideo, tiro-aritenoidei superiori e inferiori).
Il crico-aritenoideo posteriore (CAP) origina dalla depressione della faccia po-
steriore della cricoide e le sue fibre si dirigono supero-esternamente convergendo in
un tendine il quale si inserisce sulla apofisi muscolare dell’aritenoide. La sua azio-
ne è quella di attirare verso il basso e posteriormente le apofisi muscolari determi-
nando lo spostamento verso l’alto e lateralmente delle apofisi vocali e, di conse-
guenza, l’apertura della glottide.
Il muscolo crico-aritenoideo laterale (CAL) prende origine dalla porzione late-
rale del bordo superiore dell’arco cricoideo, si dirige in direzione postero-superiore
fino a raggiungere la sua inserzione sull’apofisi muscolare dell’aritenoide omolate-
rale.
La sua azione è antagonista a quella del crico-aritenoideo posteriore perché por-
tando in avanti il processo muscolare fa ruotare medialmente l’apofisi muscolare in-
ducendo quindi la medializzazione della corda vocale che vi prende inserzione.

II.
2
54 G. Bergamini et al.

In realtà l’antagonismo funzionale assoluto di questi due muscoli è puramente


teorico. Infatti quando la contrazione del CAL trova una opposizione attiva da par-
te del CAP si realizza uno scivolamento laterale dell’aritenoide che non può ruota-
re sul suo asse: la glottide assume la configurazione di apertura normale, con il pro-
cesso vocale in asse con il bordo cordale, tipica della respirazione tranquilla (Fig.
4); se la contrazione del CAP è prevalente su quella del CAL lo spostamento latera-
le si associa alla rotazione dell’aritenoide sul suo asse verticale e allo spostamento
del processo vocale verso l’esterno: la glottide ha una forma pentagonale caratteri-
stica della inspirazione forzata (Fig. 5); l’azione esclusiva del CAL, associata a
quella degli interaritenoidei, determina la posizione adduttoria tipica della fonazio-
ne (Fig. 6), se permane un certo grado di contrazione del CAP si mantiene in fona-
zione una piccola insufficienza glottica posteriore (triangolo posteriore) (Fig. 7).

Fig. 4. Fig. 5.

Fig. 6. Fig. 7.
Anatomo-fisiologia dell’apparato pneumo-fonatorio 55

Il muscolo inter-aritenoideo (IA) è impari, mediano, simmetrico e riceve conse-


guentemente un’innervazione ricorrenziale bilaterale. Esso è formato da due fasci:
uno più spesso e profondo (m. IA trasverso), le cui fibre parallele e trasversali de-
corrono tra i margini mediali delle cartilagini aritenoidi, ed uno più superficiale a
decorso obliquo (m. IA obliquo) le cui fibre si portano, dall’apofisi muscolare del-
l’aritenoide verso l’alto e medialmente fino all’apice dell’aritenoide controlaterale.
Alcune di queste fibre si continuano con il m. ari-epiglottico e concorrono ad ab-
bassare l’epiglottide. La principale azione dell’IA è quella di avvicinare le aritenoi-
di.
Il muscolo crico-tiroideo (CT), situato nella pozione antero-inferiore del larin-
ge, prende origine dalla faccia anteriore della cartilagine cricoide, esternamente al
tubercolo cricoideo, ha una forma triangolare ad apice inferiore e le sue fibre si di-
rigono verso l’alto e lateralmente. Nella sua compagine si distinguono un fascio in-
terno ed uno esterno, di cui alcune fibre si confondono con i fasci del m. costrittore
inferiore del faringe continuandosi con esso ed andando così a costituire il m. crico-
faringeo. La sua inserzione craniale è situata prevalentemente a livello del bordo in-
feriore della cartilagine tiroide ed in piccola parte sulla sua faccia anteriore e su
quella posteriore. La contrazione di questo muscolo determina un avvicinamento
dell’arco cricoideo e della cartilagine tiroidea con un effetto indiretto di spostamen-
to posteriore dell’aritenoide; ciò determina uno stiramento dei muscoli tiro-arite-
noidei (Fig. 8).
Il muscolo tiro-aritenoideo (TA) consta di diverse componenti funzionali e pos-
siede, forse per tale ragione, la più fitta rete anastomotica nervosa di tutta la mu-
scolatura intrinseca laringea. Il TA ha origine a livello della superficie interna della
cartilagine tiroide, quasi sulla linea mediana, e si dirige posteriormente per inserir-
si sull’aritenoide. Una prima componente è il muscolo tiro-aritenoideo superiore che
dalla parte superiore dell’angolo diedro tiroideo si dirige in basso ed indietro per
prendere inserzione sulla faccia anteriore dell’apofisi muscolare dell’aritenoide. Le
sue fibre superiori possono estendersi fino alla plica ari-epiglottica a formare il mu-

Fig. 8.

II.
2
56 G. Bergamini et al.

scolo tiro-epiglottico ed un variabile contingente di fibre può essere rinvenuto li-


vello della compagine della corda vocale falsa (muscolo ventricolare). Una seconda
componente è il muscolo tiro-aritenoideo inferiore che dalla sua inserzione anterio-
re si dirige posteriormente per dividersi in due strati; le fibre dello strato esterno di-
vergono a ventaglio per terminare dal basso verso l’alto sul bordo esterno dell’ari-
tenoide, nella plica ari-epiglottica, sul bordo laterale dell’epiglottide ed hanno una
funzione sfinterica; lo strato interno costituisce il muscolo vocale e le sue fibre, de-
correndo parallelamente e lateralmente al ligamento vocale, si inseriscono poste-
riormente sul versante esterno dell’apofisi vocale e sulla fossetta emisferica della
faccia antero-esterna dell’aritenoide. La trazione esercitata dal muscolo assieme al
ligamento vocale in direzione posteriore, determina sulla superficie anteriore della
cartilagine tiroide, nel corso del suo accrescimento, una piccola depressione, detta
punto di Gurr, importante repere anatomo-chirurgico 3. Ha una funzione prevalente-
mente fonatoria, pur contribuendo, per la sua azione di trazione anteriore sull’arite-
noide, all’azione sfinterica.
I muscoli laringei estrinseci sono i tiro-ioidei e gli sterno-tiroidei che si inseri-
scono sulla cresta obliqua della cartilagine tiroide e rispettivamente all’osso ioide ed
allo sterno consentendo le escursioni verticali della laringe e contribuendo alla sua
stabilizzazione insieme agli altri muscoli sottoioidei ed ai muscoli sopraioidei.
L’irrorazione è garantita dalle arterie laringea superiore ed inferiore, rami della
tiroidea superiore, branca della carotide esterna, e dall’arteria laringea postero-infe-
riore, ramo dell’arteria tiroidea inferiore, branca della succlavia. Il sistema venoso,
anche per quanto riguarda il decorso, è sovrapponibile al sistema arterioso. Sono
presenti due reti linfatiche (sopraglottica e sottoglottica) completamente separate
l’una dall’altra, i cui collettori, satelliti del sistema artero-venoso, convergono nei
linfonodi perigiugulari e, per quanto riguarda la sottoglottide, periricorrenziali.
Il laringe è innervato da due nervi per ogni lato, entrambi originati dal vago, il
laringeo superiore (misto) ed il ricorrente (motorio).
L’area corticale per i muscoli laringei corrisponde alla parta più bassa e laterale
della corteccia motoria mentre i motoneuroni periferici hanno origine dal nucleo
ambiguo e dal nucleo retrofacciale. Il nucleo ambiguo, di forma allungata, è loca-
lizzato nella parte laterale della sostanza reticolare del tronco cerebrale e ospita nel-
la sua porzione dorsale i neuroni per la muscolatura adduttoria più grandi rispetto a
quelli della porzione ventrale, che sono destinati al CAP. Il rapporto numerico tra
queste due popolazioni neuronali è di circa 4/1. Il nucleo retrofacciale contiene pe-
rifericamente i neuroni destinati al CT e centralmente quelli per il CAP. Pertanto il
CT ed il CAP sono innervati da entrambi i nuclei mentre la muscolatura adduttoria
ha esclusiva innervazione a partire dal nucleo ambiguo; inoltre l’innervazione mo-
toria laringea è esclusivamente ipsilaterale infatti non vi è alcuna via crociata a par-
tenza da tali nuclei 10. Le fibre motrici si congiungono e rimangono raggruppate in
seno al nervo vago che emerge a livello del solco laterale del bulbo; esse occupano
una posizione anteriore nella parte superiore del nervo e raggiungono una posizio-
ne mediale procedendo caudalmente. Le fibre adduttorie e quelle abduttorie sareb-
bero disperse in modo casuale a livello della porzione motoria del nervo vago e suc-
cessivamente del ricorrente; studi nel gatto suggerirebbero che tali fibre si separano
soltanto qualche centimetro prima della penetrazione nel laringe 9. Alla sua emer-
Anatomo-fisiologia dell’apparato pneumo-fonatorio 57

genza dalla faccia antero-laterale del bulbo, il vago si dirige verso il forame giugu-
lare (foro lacero posteriore), in cui decorre accostato al IX e all’XI nervo cranico ed
alla vena giugulare interna; fuoriuscito dalla base cranica esso si espande in due
gangli esclusivamente sensitivi: uno superiore di circa 4 mm di diametro, detto gan-
glio giugulare, ed uno inferiore, di forma allungata (circa 25 mm di lunghezza) chia-
mato ganglio plessiforme dal quale emerge il nervo laringeo superiore. Esso rag-
giunge il muscolo costrittore del faringe e a livello dell’osso ioide si divide in una
branca interna sensitiva, la quale perfora la membrana tiro-ioidea e penetra nel la-
ringe, ed una branca esterna con fibre miste. Quest’ultima decorre verso il basso sul-
la faccia esterna del fascio tiroideo del m. costrittore inferiore, innervando i due ca-
pi del m. CT, per poi perforare la membrana cricotiroidea, penetrando il laringe e
fornendo innervazione sensitiva alla zona anteriore della regione sottoglottica 13.
Dopo l’emergenza del laringeo superiore a sinistra il vago prosegue in basso,
posteriormente all’arteria carotide comune, fino ad incrociare la faccia anteriore del-
l’aorta; a questo livello emerge il nervo laringeo inferiore o ricorrente, il quale va a
circondare inferiormente quest’ultima arteria procedendo postero-medialmente per
poi decorrere verso l’alto nel solco tracheo-esofageo. Nel suo decorso verticale ver-
so l’alto passa dietro al lobo sinistro della ghiandola tiroide, sotto il bordo del mu-
scolo costrittore inferiore, posteriormente all’articolazione crico-tiroidea per poi pe-
netrare nel laringe tra l’ala della cartilagine tiroide ed il castone cricoideo e distri-
buirsi ai muscoli intrinseci ad eccezione del CT. Prima di penetrare nella laringe un
piccolo ramo lascia il ricorrente per anastomizzarsi con il ramo interno del laringeo
superiore dando origine all’ansa di Galeno. A destra il n. vago decorre lungo il mar-
gine postero-laterale della carotide comune fino ad incrociare la superficie anterio-
re della arteria succlavia destra dopo la sua emergenza dal tronco brachio-cefalico;
a questo livello nasce il ricorrente di destra che subito si ripiega verso l’alto circon-
dando inferiormente l’arteria succlavia e con una direzione da laterale a mediale e
dall’avanti all’indietro risale fino a raggiungere il solco tracheo-esofageo di destra;
esso passa dietro al lobo destro della ghiandola tiroide con un decorso più obliquo
in direzione mediale rispetto al n. ricorrente di sinistra. La successiva penetrazione
e distribuzione intralaringea del nervo è analoga al suo omologo controlaterale 13.
Non è infrequente (dal 35 all’80% dei casi) che il nervo subisca una suddivisione a
livello extralaringeo, emettendo da due fino ad otto branche 30 26. In alcuni casi (0,5-
1% a destra e 0,04% a sinistra) il nervo laringeo inferiore non è ricorrente ed emer-
ge a livello cervicale: si stacca dal vago all’altezza della parte media del lobo tiroi-
deo sulla cui faccia profonda decorre per raggiungere la laringe 28.
La mucosa della laringe è costituita da due tipi di epitelio: un epitelio cilindrico
cigliato pseudostratificato con interposte cellule caliciformi di tipo respiratorio ed
un epitelio pavimentoso stratificato non cheratinizzato che ricopre le zone sottopo-
ste a maggiori stimolazioni fisiche (il bordo libero e le parti attigue sulla faccia su-
periore e sulla faccia inferiore delle corde vocali; la faccia linguale, il bordo libero
e la parte inferiore della faccia laringea dell’epiglottide; i bordi delle pliche ari-epi-
glottiche. L’epitelio appoggia su una membrana basale e presenta al di sotto un cho-
rion con ghiandole sierose e mucose. A livello della corda vocale il chorion (lamina
propria) presenta uno strato superficiale costituito da pochi fibroblasti, fibre lasse
soprattutto di tipo elastico ed abbondante sostanza fondamentale (spazio di Reinke),

II.
2
58 G. Bergamini et al.

uno strato intermedio costituito principalmente di fibre elastiche che presenta due
ispessimenti (macula flava anteriore e macula flava posteriore) in prossimità della
commessura e dell’apofisi vocale, uno strato profondo con molte fibre collagene e
numerosi fibroblasti. Hirano 15 16 classifica da un punto di vista meccanico gli ele-
menti strutturali di una corda vocale in tre parti: il «cover» costituito dall’epitelio e
dallo strato superficiale della lamina propria che per la sua lassità e viscosità è fa-
cilmente sollevabile in pliche e consente l’ondulazione della mucosa, il «transition»
costituito dallo strato intermedio e profondo della lamina propria che rappresenta lo
strato di scorrimento, il «body» rappresentato dal muscolo vocale che è la struttura
rigida in grado di modificare le sue caratteristiche biomeccaniche con la contrazio-
ne.
La laringe può essere divisa in tre livelli: sopraglottico, glottico, sottoglottico.
La sopraglottide comunica con il faringe attraverso l’adito laringeo, orientato in sen-
so postero-superiore, che ha forma grossolanamente ovale con i margini costituiti
dal bordo libero dell’epiglottide, dalle pliche ari-epiglottiche, dal cappuccio arite-
noideo e dall’incisura interaritenoidea. La faccia anteriore è costituita dall’epiglot-
tide, le pareti laterali presentano due rilievi (false corde) e due concavità (ventrico-
li di Morgagni), la faccia posteriore corrisponde alla faccia laringea delle aritenoidi
ed al solco interaritenoideo. Il piano glottico è costituito da uno spazio triangolare
ad apice anteriore (commessura anteriore), che in fonazione diventa virtuale, deli-
mitato dalle corde vocali vere. La sottoglottide, a forma ad imbuto rovesciato, si al-
larga progressivamente in senso cranio-caudale per continuarsi con la trachea.
La laringe svolge tre ruoli fondamentali: la respirazione, la protezione delle vie
aeree e la fonazione. L’attività sfinterica è sicuramente la principale perché da essa
sono derivate, oltre alle funzioni inerenti alla protezione delle vie aeree, alcuni ri-
flessi come lo starnuto, la tosse il singhiozzo, il pianto, il riso ed alcuni atti fisiolo-
gici (defecazione, minzione, sollevamento di pesi) che richiedono un aumento del-
la pressione intratoracica; la fonazione è anch’essa correlata alla funzione sfinterica
rappresentandone la evoluzione filogeneticamente più recente.
La respirazione consta di due fasi nel corso delle quali le corde vocali sono più
o meno abdotte per l’azione del muscolo cricoaritenoideo posteriore. L’attività di ta-
le muscolo è strettamente legata a quella diaframmatica, infatti esso si attiva ad ogni
inspirazione, da 40 a 100 msec prima rispetto all’attivazione inspiratoria del dia-
framma 8. Vi è talvolta una sinergia funzionale con altri muscoli intrinseci ed in par-
ticolare con il crico-aritenoideo laterale che concorre a modificare la morfologia
della glottide intercartilaginea ed il crico-tiroideo che attivandosi durante l’inspira-
zione contribuisce ad aumentare lo spazio respiratorio. Nel corso della fase espira-
toria, la posizione delle corde vocali può variare secondo le esigenze della respira-
zione; una posizione relativamente addotta provoca un aumento della pressione al-
veolare polmonare, con un conseguente miglioramento degli scambi gassosi. Un
particolare atto respiratorio la cui fisiologia non è ancora completamente nota è lo
sbadiglio caratterizzato da una inspirazione lenta e profonda a bocca aperta che si
realizza a corde vocali completamente abdotte.
La protezione delle vie aeree può realizzarsi con un laringospasmo riflesso evo-
cato dalla improvvisa stimolazione della mucosa del vestibolo laringeo da parte di
corpi estranei o vapori irritanti, alimenti accidentalmente inalati, materiale da re-
Anatomo-fisiologia dell’apparato pneumo-fonatorio 59

flusso gastro-esofageo o nel corso della deglutizione attraverso una coordinata se-
quenza motoria caratterizzata da uno spostamento della laringe verso l’alto e verso
l’avanti e da una contrazione sequenziale dal basso verso l’alto delle corde vocali,
delle bande ventricolari, delle aritenoidi e delle pliche ari-epiglottiche. Oltre ad una
chiusura sfinterica ciò determina per l’abbassamento dell’epiglottide e l’amplia-
mento dei seni piriformi una facilitazione della progressione del bolo verso la boc-
ca dell’esofago.
La tosse 4 35 è un importante meccanismo riflesso finalizzato a rimuovere dal-
l’albero tracheo-bronchiale secrezioni patologiche o materiali accidentalmente ina-
lati. È caratterizzato da tre fasi: inspiratoria, compressiva, ed espulsiva. Il volume di
aria inspirata è notevole nelle tossi di origine bronchiale perché una iperdistensione
polmonare comporta un’apertura di tutte le unità bronco-alveolari, un migliore ri-
torno elastico del polmone, una attivazione della muscolatura espiratoria; in segui-
to a stimolazione meccanica laringea i volumi espiratori sono bassi o addirittura
manca la fase inspiratoria per prevenire o limitare la inalazione di materiale estra-
neo. La fase compressiva si realizza per la chiusura della glottide che consente per
il ritorno elastico del polmone e/o la energica e rapida contrazione dei muscoli espi-
ratori un notevole aumento della pressione intratoracica. La chiusura della glottide
può non essere completa ed in ogni caso non è essenziale ai fini di una tosse effica-
ce come dimostra il fatto che questa è possibile anche nei laringectomizzati nei qua-
li l’aumento della pressione intratoracica si realizza esclusivamente attraverso le
modificazioni della dinamica espiratoria. La fase espulsiva si verifica per una rapi-
da abduzione attiva delle corde vocali che ha luogo dopo circa 2 decimi di secondo
dalla sua chiusura. e che determina la fuoriuscita dell’aria in modo esplosivo a for-
te velocità.
Lo starnuto è un meccanismo analogo nel quale il riflesso è innescato da una
stimolazione trigeminale e la fase espulsiva si verifica attraverso le fosse nasali.
Il singhiozzo è invece caratterizzato da una contrazione spasmodica ripetitiva
dei muscoli inspiratori ed in particolar modo del diaframma a cui si associa una bru-
sca parziale chiusura della glottide per cui l’aria passando attraverso una brusca fes-
sura dà luogo ad un rumore caratteristico.
Il riso ed il pianto sono anch’essi dei singolari comportamenti respiratori inse-
riti nell’ambito di atti motoriamente complessi in cui la espirazione e la inspirazio-
ne sono intercise da contrazioni glottiche che interrompono bruscamente e momen-
taneamente il flusso aereo e si associano a particolari emissioni sonore.
Numerose teorie hanno tentato di spiegare il modo con cui la vibrazione corda-
le si realizza ed i meccanismi attraverso i quali può essere controllata e modificata
(Fig. 9).
Sommersa dalle critiche, soprattutto perché incompatibile con certi principi di
neurofisiologia, la teoria di Husson 18 che, basandosi sulle concezioni di anatomia
microscopica del muscolo vocale di Goerttler, identificava la vibrazione cordale co-
me un fenomeno attivo, le attuali teorie scaturiscono dagli studi di cinematografia
ultrarapida e di elettromiografia secondo i quali la ritmica apertura della rima glot-
tica è un fenomeno eminentemente passivo. Gli attuali punti di vista 19 convergono
su una teoria mioelastica-aerodinamica che è andata completandosi nel corso degli
anni dopo l’ipotesi iniziale del 1898 di Ewald con il contributo di Gremy 12, Van Den

II.
2
60 G. Bergamini et al.

Fig. 9.

Berg 33 34, Vallencien 32, Perello 27, Lafon e Cornut 21, Hirano 14, Dejonckere 6. La
componente mioelastica è l’insieme delle forze di natura muscolare ed elastica, le-
gate alla funzione della muscolatura intrinseca e alle caratteristiche strutturali della
corda vocale, che tendono ad addurre le corde vocali e che integrandosi in modo
coordinato con la pressione sottoglottica sono alla base del ritmico scostamento del
bordo cordale. L’energia aerodinamica è generata dal mantice polmonare che in fa-
se espiratoria a glottide chiusa dà origine nella regione sottoglottica ad una pressio-
ne in grado di vincere le forze di adduzione con conseguente apertura della glottide.
A causa della fuga d’aria si verifica una rapida diminuzione della pressione sotto-
glottica con conseguente nuovo prevalere delle forze mioelastiche di adduzione. Il
flusso d’aria attraverso la sottile fessura glottica determina, per effetto Bernoulli,
una retro-aspirazione che dà origine ad un’onda mucosa che si propaga dalla faccia
inferiore della corda vocale fino al ventricolo e contemporaneamente contribuisce
alla chiusura della glottide. L’insieme di questi eventi costituisce il ciclo vibratorio
che si ripete mediamente 110 volte in un secondo nell’uomo e 200 volte nella don-
na; la frequenza dei cicli vibratori è correlata all’altezza tonale del suono emesso
che può variare considerevolmente per una complessa interazione di forze.
Numerosi fattori strutturali e funzionali spesso intercorrelati influenzano le ca-
ratteristiche acustiche del prodotto vocale: la pressione sottoglottica e sovraglottica,
la pressione vibratoria di soglia (la minima pressione in grado di innescare il ciclo
vibratorio) e la resistenza glottica; la lunghezza, il volume e la massa vibrante del-
la corda vocale; la pressione, l’entità e la durata dell’accollamento dei bordi corda-
li; la viscosità dello strato superficiale della lamina propria, il tono e la tensione pas-
siva del muscolo vocale.
I tre principali parametri acustici della voce sono l’intensità, l’altezza tonale ed
il timbro.
L’intensità è l’ampiezza della variazione di pressione periodica dell’onda sono-
ra. Essa dipende soprattutto dalla pressione sottoglottica che non sia però controbi-
Anatomo-fisiologia dell’apparato pneumo-fonatorio 61

lanciata da una eccessiva contrazione delle strutture glottiche. Secondo Husson 17


questa pressione equivale a 10 cm d’acqua nella conversazione calma (30 dB) ed au-
menta progressivamente in rapporto al tipo ed all’intensità della emissione vocale
per raggiungere valori di 160 cm di acqua nella voce proiettata ad 80 dB ed addirit-
tura 360 cm nel canto tenorile al massimo della sua potenza (120 dB). Per ottenere
un rapporto ottimale fra pressione sottoglottica ed intensità della voce è opportuno
un adeguato affrontamento ed una bassa viscosità del «cover» che si traducono in
un’ampia escursione del labbro vocale.
L’altezza tonale è la frequenza delle variazioni di pressione dell’onda sonora
nell’unità di tempo. Dipende innanzitutto da un fattore strutturale, cioè la lunghez-
za e la massa delle corde vocali; la voce di un bambino che ha pliche vocali sottili
e corte (dai 5 mm alla nascita ai 12 mm in età prepuberale) è più acuta di quella di
una donna le cui corde misurano da 14 e i 18 mm mentre la voce di un uomo, le cui
pliche misurano da 18 a 25 mm, è più grave. Essa è inoltre in rapporto diretto con
la tensione della corda vocale che consegue alla contrazione del muscolo crico-ti-
roideo e che si traduce, peraltro, in un allungamento e può essere influenzata dalla
contrazione del tiro-aritenoideo che determina un accorciamento ed un aumento del-
la massa. Soprattutto alle basse frequenze di fonazione l’incremento della pressione
sottoglottica ha spesso un effetto sulla frequenza fondamentale determinando con-
temporaneamente un aumento di intensità e di frequenza. La voce umana è in grado
di esprimersi con un’ampia gamma tonale: nella voce parlata 22 la variazione fre-
quenziale normalmente è compresa fra la1 e re2 nell’uomo, la2 e re3 nelle donne,
re3 e la3 nei bambini (Tab. I).

Tab. I.
Frequenza delle note in Hz nelle varie ottave per la3 = 440 Hz 1.

Ottave → 1 2 3 4 5

Note

do 65,41 130,81 261,63 523,25 1046,5


do # 69,30 138,59 277,18 554,36 1108,7
re 73,42 146,83 293,67 587,33 1174,7
re # 77,78 155,56 311,13 622,26 1244,5
mi 82,41 164,81 329,63 559,26 1318,5
fa 87,31 174,61 349,23 698,46 1396,9
fa # 92,50 185 369,99 739,99 1480
sol 98 196 392 783,99 1568
sol # 103,83 207,65 415,30 830,61 1661,2
la 110 220 440 880 1760
la # 116,54 233,08 466,16 932,32 1864,6
si 123,47 246,94 493,88 987,76 1975,5

II.
2
62 G. Bergamini et al.

Viene definita estensione l’insieme delle frequenze che un individuo riesce a


produrre (2-3 ottave) e tessitura l’escursione frequenziale della voce cantata i cui li-
miti variano in rapporto al tipo di registro con cui la voce viene prodotta. Non esi-
ste una chiara ed unanime definizione di «registro»; la più semplice 31 è che il regi-
stro è una serie di frequenze che sono percepite come prodotte con la stessa moda-
lità ed hanno quindi la stessa qualità acustica: ogni registro quindi si identifica sul-
la base di caratteristiche percettive, acustiche e fisiologiche; non vi è, inoltre, iden-
tità di vedute sul numero dei registri ed anche la terminologia utilizzata è spesso
confusa. La maggioranza degli Autori distingue tre registri (di petto, misto e di te-
sta) con una ulteriore possibile semplificazione che li riduce a due principali: di pet-
to a cui corrisponde un atteggiamento morfo-funzionale laringeo con pliche vocali
spesse e di testa in cui le corde vocali sono assottigliate); sono però possibili altri
due registri molto poco utilizzati: lo «Strohbass» registro particolarmente grave, con
cui si possono produrre note al di sotto del fa1, usato in certi canti corali dell’est eu-
ropeo in cui partecipa alla vibrazione anche l’apofisi vocale e il «Whistle register»
o registro di fischio con il quale, attraverso un meccanismo comparabile a quello del
flauto (in assenza di vibrazione cordale) che si può ottenere con un particolare at-
teggiamento della glottide posteriore, alcune voci femminili e infantili possono pro-
durre suoni anche al di sopra di mi5.
Sulla base della tessitura considerata nell’insieme dei registri che ciascuna cate-
goria riesce ad utilizzare le voci vengono classificate in sei classi 1: tre per gli uomi-
ni (basso da mi1 a mi3, baritono da la1 a sol#3, tenore da2 a do 4) e tre per le donne
(contralto da sol#2 a fa4, mezzosoprano da la#2 a la#4, soprano da do3 a do5).

BIBLIOGRAFIA
1
Amy de la Breteque B. Le Chant: Contraintes & Liberté. Courlay: J.M. Fuzeau S.A. 1991.
2
Basterra J, Dilly PN, Chumbley CC, Pellin A. Glands in the human vocal cord. Rev Laryngol
1988;109:477-80.
3
Berkowith BKB, Hickey SA, Moxham BJ. Anatomy of the larynx. In: Ferlito A, ed. Diseases of the
Larynx. London: Arnold 2000:25-44.
4
Bianco S, Robuschi M. Meccanica della tosse. In: Braga PC, Allegra L, eds. La Tosse. New York:
Raven Press, Ltd 1988:3-31.
5
Cornut G. Fisiologia dell’apparato respiratorio. In: Croatto L, ed. Trattato di Foniatria e Logope-
dia. Volume I: Anatomia e fisiologia degli organi della comunicazione. Padova: La Garangola
1985:21-46.
6
Dejonckère PH. Physiologie phonatoire du larynx: le concept oscilloimpédantiel. Rev Laryng
1987;108:365-8.
7
Fried MP. The Larynx: a multidisciplinary approach. Second Edition. St. Louis: Mosby-Year Book,
Inc 1996.
8
Fried MP, Laureano AM. Neurologic disorders of the larynx. In: Ferlito A, ed. Diseases of the
Larynx. London: Arnold 2000:353-61.
9
Gacek RR, Lyon MJ. Fiber components of the recurrent laryngeal nerve in the cat. Ann Otol
1976;85:460-71.
10
Gacek RR, Malgren LT, Lyon MJ. Localisation of adductor and abductor motor nerve fibers to the
larynx. Ann Otol 1977;86:770-6.
11
Gacek RR, Malmgren LT. Laryngeal Motor Innervation-Central. In: Blitzer A, Brin MF, Sasaki
Anatomo-fisiologia dell’apparato pneumo-fonatorio 63

CT, Fahn S, Harris KS, eds. Neurologic Disorders of the Larynx. New York: Thieme Medical Pu-
blishers, Inc 1992:29-35.
12
Gremy F. Considerations sur l’énergie mécanique du larynx durant la phonation. J Phisiol
1960;52:555-67.
13
Hartl DM, Brasnu D. Les paralysies récurrentielles: connaisances actuelles et traitements. Ann
Otolaryngol Chir Cervicofac 2000;117:60-84.
14
Hirano M. Structure and vibratory pattern of the vocald folds. In: Sawashima N, Cooper FS, eds.
Dynamic Aspects of Speech Production. Tokio: University of Tokio Press 1977:13-27.
15
Hirano M. Outline of Voice Production and Its Examination. In: Hirano M, ed. Clinical examina-
tion of voice. Vienna: Springer-Verlag 1981:1-10.
16
Hirano M. Surgical anatomy and physiology of the vocal folds. In: Gould WJ, Sataloff RT, Spiegel
JR, eds. Voice Surgery. St. Louis: Mosby-Year Book 1993:135-58.
17
Husson R. Ètude des phénomènes physiologique et acoustiques fondamentaux de la voix chantée.
Paris: Thèse de la Faculté des Sciences 1950.
18
Husson R. Physiologie de la phonation. Paris: Masson 1962.
19
Jiang J, Lin E, Hanson DG. Vocal Fold Physiology. In: Rosen CA, Murry T. The Otolaryngologic
Clinics of North America. Voice Disorders and Phonosurgery I. Philadelphia: W.B. Saunders Co.
2000:699-718.
20
Krmpotic-Nemanic J. Cenni di embriologia e anatomia del sistema vibratorio. In: Croatto L, ed.
Trattato di Foniatria e Logopedia. Volume I: Anatomia e fisiologia degli organi della comunica-
zione. Padova: La Garangola 1985:47-71.
21
Lafon JC, Cornut G. Ètude de la formation impulsionnelle de la voix et de la parole. Folia Pho-
niatrica 1960;12: 176-181.
22
Lafon J-C, Faure M-A. Fisiologia del sistema vibratorio. In: Croatto L, ed. Trattato di Foniatria e
Logopedia. Volume I: Anatomia e fisiologia degli organi della comunicazione. Padova: La Garan-
gola 1985:73-97.
23
Le Huche F, Allali A. La voce. Volume I: anatomia e fisiologia degli organi della voce e della pa-
rola. Seconda Edizione. Milano: Masson 1993.
24
Malmgren LT, Gacek RR. Periferal Motor Innervation of the Larynx. In: Blitzer A, Brin MF, Sa-
saki CT, Fahn S, Harris KS, eds. Neurologic Disorders of the Larynx. New York: Thieme Medical
Publishers Inc. 1992:36-44.
25
Munari FP, Fabretto DA. Anatomia dell’apparato respiratorio. In: Croatto L, ed. Trattato di Fo-
niatria e Logopedia. Volume I: Anatomia e fisiologia degli organi della comunicazione. Padova: La
Garangola 1985:3-19.
26
Nemiroff PM, Katz AD. Extralaryngeal division of the recurrent laryngeal nerve. Am J Surg
1982;144:466-9.
27
Perello J. La théorie muco-ondulatoire de la phonation. Ann Oto-Larynx 1962;79:722-5.
28
Piazza C, Nicolai P, Antonelli AR. La patologia iatrogenica nella chirurgia del collo. In: Balli R,
ed. La patologia iatrogenica in O.R.L. Torino: Edizioni Minerva Medica 1998:125-66.
29
Sataloff RT. Clinical Anatomy and Physiology of the Voice. In: Professional Voice. The Science and
Art of Clinical Care. Second Edition. San Diego-London: Singular Publishing Group Inc.
1997:111-30.
30
Schweizer V, Dörfl J. The anatomy of the inferior laryngeal nerve. Clin Otolaryngol 1977;22:362-
9.
31
Sundberg J. The Science of the Singing Voice. DeKalb: Northern Illinois University Press 1987.
32
Vallancien B. Étude physiologique de la phonation. G.M. de France 1971;78:4537-8.
33
Van Den Berg J. Sur lès théories myoélastique et neurochronaxique de la phonation. Rev Laryngol
1954;75:492-512.
34
Van Den Berg J, Tan TS. Donnés nouvelles sur la fonction laryngée. J F O.R.L. 1959;8:103-8.
35
Widdicombe J.G. Fisiologia della tosse. In: Braga PC, Allegra L, eds. La Tosse. New York: Raven
Press, Ltd. 1988:3-31.

II.
2
64 E. Cunsolo et al.

II.3. LA FISIOLOGIA CELLULARE DELLE CORDE VOCALI

E. Cunsolo*, D. Casolino**, G. Cenacchi***

«the core biologic processes affecting vocal folds are cellular»


Steven Gray, 2000

La fisiologia laringea studia la dinamica funzionale dell’organo e dei meccani-


smi di controllo che ne consentono le tre fondamentali azioni: respirazione, fona-
zione e deglutizione.
Lo studio della fonazione richiede competenze multidisciplinare che, nel tempo,
hanno portato all’acquisizione di un vasto corpo dottrinale, relativo alla processa-
zione del segnale vocale ed all’analisi acustica della voce.
Negli anni più recenti, la definizione della funzione fonatoria ha approfondito
l’analisi degli aspetti morfologici, strutturali ed ultrastrutturali, e biochimici delle
corde vocali. Si è aperto così un filone di ricerca, tuttora in fase di sviluppo, che ha
lo scopo di precisare gli intimi rapporti forma-funzione di queste strutture iper-spe-
cializzate, che possono considerarsi un vero e proprio «organo nell’organo».
Le corde vocali hanno una struttura istologica complessa. Sono, infatti, presen-
ti tutte le varianti istologiche dei tessuti: epiteliale, connettivale, muscolare e ner-
voso. La fisiologia cellulare più recente ha focalizzato il proprio interesse sulle pe-
culiarità dell’epitelio e della lamina propria e della membrana basale che fa da in-
terfaccia tra i due tessuti. Esamineremo la fisiologia cellulare cordale, secondo un
criterio anatomico, dalla superficie alla profondità: epitelio, membrana basale, la-
mina propria.

EPITELIO CORDALE

La porzione membranosa delle corde vocali è rivestita da epitelio squamoso


stratificato. Una piccola striscia di epitelio ciliato pseudo-stratificato può essere pre-
sente occasionalmente nella commessura anteriore, mentre la commessura posterio-

*
U.O. ORL Ospedale «C.A. Pizzardi», Bologna
**
U.O. ORL Ospedale «Bufalini», Cesena
***
Anatomia ed Istologia Patologica, Policlinico «S. Orsola», Bologna
La fisiologia cellulare delle corde vocali 65

re si caratterizza per la regolare presenza di tal epitelio. Questa differente distribu-


zione dell’epitelio nell’ambito glottico risponde a precise esigenze funzionali. La
glottide membranosa è, infatti, dotata del rivestimento epiteliale maggiormente spe-
cializzato nella resistenza meccanica, mentre a livello commessurale è presente l’e-
pitelio più efficace nella gestione della Clearance Muco-Ciliare (CMC).
Le cellule dell’epitelio stratificato cordale hanno necessità fisiologiche diverse
rispetto a quelle dell’epidermide. Devono, infatti, resistere ad intense sollecitazioni
vibratorie e devono essere ottimizzate per un ambiente mucoso. Per rispondere a ta-
li esigenze, le cellule epiteliali cordali sono prive dello strato corneo superficiale e
si mantengono metabolicamente attive anche nei piani più superficiali, sino alla lo-
ro desquamazione nel lume aereo. Gli elementi cellulari mostrano, inoltre, un cito-
scheletro particolarmente sviluppato, con un efficace sistema di desmosomi, che ga-
rantisce coerenza tra le cellule anche sotto forti sollecitazioni vibratorie. Sono tut-
tora in corso ricerche per verificare se l’attività metabolica mantenuta nelle cellule
degli strati superficiali, biologicamente «più vecchie», sia anche in relazione ad un
controllo sul trasporto attivo dell’acqua.
Gli studi di microscopia elettronica hanno evidenziato un aspetto a microcreste
della superficie di rivestimento dell’epitelio squamoso, presente già nelle cellule di
ricambio, immediatamente sottostanti a quelle in via di desquamazione 12. Queste,
prima di staccarsi definitivamente, presentano una fase di fluttuazione, nella quale
rimangono legate alle cellule più giovani mediante ponti che si distaccano dalla
sommità delle creste di queste ultime. Vi sono numerose ipotesi circa il significato
funzionale delle microcreste: maggiore aderenza del muco, maggior assorbimento
dell’acqua mediante aumento della area d’interfaccia. La superficie frastagliata del-
le corde vocali può essere paragonata al battistrada di un pneumatico, con la fun-
zione di aumentare la trazione del flusso aereo fonatorio sulle corde vocali, ottimiz-
zandone così la vibrazione (Fig. 1).
Nella glottide umana la funzione della Clearance Muco Ciliare (CMC) riguarda
fondamentalmente l’epitelio cilindrico ciliato della commessura posteriore. Nel-
l’uomo sono molto evidenti le vie della CMC nella trachea, dirette in alto, con ver-
so antero-posteriore atto a raggiungere la regione commessurale posteriore (Fig. 2).
Lo scopo di questo disposizione è quello di orientare i flussi di muco delle vie
respiratorie inferiori verso l’ipofaringe, destinandolo alla deglutizione. Ciò potreb-
be spiegare l’elettiva localizzazione alla glottide posteriore di malattie delle basse
vie respiratorie, come nel caso della TBC laringea.
Fukuda 6 ha condotto studi comparativi sui flussi della CMC laringo-tracheale
nel cane e nell’uomo. Nei modelli canini si è riusciti ad identificare delle vere e pro-
prie correnti di CMC cordale, dirette in senso antero-posteriore (Fig. 3).
Queste osservazioni non si sono ripetute nelle laringi umane. Nell’uomo man-
ca, infatti, una vera e propria CMC glottica. La notevole efficacia e velocità della
CMC tracheale e sottoglottica, che riescono a sospingere un film mucoso molto flui-
do sull’epitelio squamoso glottico, e la superficie frastagliata di quest’ultimo sono,
tuttavia, in grado di garantire un’ottimale lubrificazione ed umidificazione cordali.
Le differenze di CMC tra la glottide del cane e quella umana rispondono, verosi-
milmente ad esigenze funzionali differenti. L’assenza di un vero e proprio mantello
mucoso, nell’uomo, può rendere più fine e modulabile la vibrazione cordale. Le due

II.
3
66 E. Cunsolo et al.

Fig. 1.
Superficie a battistrada dell’epitelio cordale. La microscopia
elettronica evidenzia cellule epiteliali che protrudono nel lu-
me; le cellule sono di forma poligonale-ovalare con scarsi mi-
crovilli superficiali; intercellulari di tipo desmosomiale. Non
sono presenti ciglia. Si osserva un elemento a citoplasma for-
temente elettrondenso verosimilmente in degenerazione.

Fig. 2.
CMC tracheale e sottoglottica nell’uomo (Da Gray 12, modificata).
La fisiologia cellulare delle corde vocali 67

Fig. 3.
Membrana basale cordale (Da Gray 12, modificata).

tipologie d’epitelio esprimono così un notevole sinergismo funzionale nell’ottimiz-


zare la vibrazione fonatoria.

MEMBRANA BASALE

Oltre a quanto già esposto, il rivestimento epiteliale glottico ha la funzione di


conferire forma e consistenza alla lamina propria. Lo strato epiteliale è, infatti, un
tessuto prevalentemente cellulare, con le cellule mantenute in coesione dai desmo-
somi, che va a ricoprire la lamina propria, tessuto essenzialmente non cellulare e
perciò tendenzialmente amorfo. Ad ottimizzare questa giunzione, resa assai com-
plessa dalle intense vibrazioni alle quali è sottoposta, è chiamata una struttura d’in-
terfaccia altamente specializzata, qual è la membrana basale (MB). Questa deve as-
solvere essenzialmente a due compiti: contribuire a mantenere la coesione tra le cel-
lule basali dell’epitelio squamoso ed assicurare queste ultime alle masse proteiche
extracellulari presenti nella lamina propria. Dal punto di vista ultrastrutturale la
Membrana Basale può essere distinta in tre zone (Lamina Lucida, Lamina Densa ed
Area Sottobasale), alle quali corrispondono costituzione biochimica e ruoli funzio-
nali differenti 8. La vera struttura portante della MB è la Lamina Densa, costituita da
proteine laminari. L’ultrastruttura ad essa sovrapposta (Lamina Lucida) è specializ-
zata nell’assicurare la coerenza dell’epitelio vibrante, mentre quella ad essa sotto-

II.
3
68 E. Cunsolo et al.

posta (Area Sottobasale) deve assolvere alla necessità di garantire l’ancoraggio con
la lamina propria.
La Lamina Lucida offre appoggio alle cellule basali dell’epitelio squamoso ed è
attraversata da strutture fibrillari, definite Filamenti d’Ancoraggio, essenzialmente
costituite da collagene tipo IV, che «ancorano» gli emidesmosomi delle cellule epi-
teliali alla Lamina Densa. Da questa si distaccano le Fibre d’Ancoraggio, costituite
da collagene tipo VII che agganciano, con veri e propri loops, tale struttura agli stra-
ti superficiali della lamina propria (Fig. 4).

Fig. 4.
Costituenti della membrana basale cordale (Da Gray 12, modificata).

Il numero delle Fibre d’Ancoraggio (densità di popolazione delle Fibre d’An-


coraggio) è geneticamente determinato. Normalmente vi sono 80-120 Fibre d’An-
coraggio per unità d’area di membrana basale 9. Nei pazienti eterozigoti, per una va-
riante recessiva del gene che codifica per queste proteine, la densità di popolazione
scende a 40-60 fibre d’ancoraggio/unità. Negli omozigoti per il gene recessivo, le
fibre d’ancoraggio sono invece completamente assenti, come si riscontra nell’epi-
dermolisi bullosa 36. La regolazione genica della densità di popolazione delle Fibre
d’Ancoraggio apre suggestivi spunti interpretativi sulla predisposizione genetica ad
alcune patologie delle corde vocali. Una bassa densità di popolazione di Fibre d’An-
coraggio potrebbe predisporre ad una maggiore suscettibilità alla formazione dei no-
duli cordali 7.

LAMINA PROPRIA

Le proprietà viscoelastiche della Lamina Propria (LP) della mucosa delle corde
vocali umani sono essenziali per la vibrazione cordale e dipendono essenzialmente
dalla sua matrice extracellulare.
La definizione delle caratteristiche morfo-funzionali della LP si deve fonda-
mentalmente agli studi di Hirano. Quest’autore accoppiò le osservazioni istologiche
sulla LP 22 23 alla «cover-body theory» della fonazione 25. La LP delle corde vocali è
La fisiologia cellulare delle corde vocali 69

Fig. 5.
I tre strati della lamina propia.

suddivisa in tre strati, secondo un criterio isto-morfologico basato sul diverso con-
tenuto d’elastina e fibre collagene: strato Superficiale della Lamina Propria (SSLP),
Strato Intermedio o Medio della Lamina Propria (SMLP) e Strato Profondo della
Lamina Propria (SPLP) (Figg. 5, 6, 7).
Sezione sagittale di laringe comprendente corde vocali vere e false; con la co-
lorazione per le fibre elastiche (Fig. 6) e reticolari (Fig. 7) si dimostra la ricchezza
di tessuto connettivo ed elastico della sottomucosa, particolarmente nelle corde vo-
cali vere.
Lo SSLP è un tessuto lasso, con poche fibre collagene ed elastiche. Lo SMLP
ha un elevato contenuto di fibre elastiche, mentre nello SPLP prevalgono le fibre
collagene. Lo SSLP definisce lo Spazio di Reinke (SR), mentre SMLP e SPLP nel
loro insieme formano il Legamento Vocale. Questa suddivisione istologica della LP
ben si accorda con la «cover-body theory» della fonazione, che prevede una porzio-
ne più superficiale di tessuti (cover) che scivoli, con ampia libertà di movimento in
tutte le direzioni, rispetto ad un corpo (body) tissutale profondo e rigido. Si viene
così a definire il substrato morfologico sul quale prende corpo l’onda mucosa. La
cover delle corde vocali è costituita dall’insieme Epitelio-MB-SSLP, mentre il body
è rappresentato dall’unità SPLP-Muscolo Vocale. Lo SMLP, dal punto di vista fun-
zionale, si può considerare come uno strato di transizione. Nella cover-body theory
viene individuata un’altra importante struttura: il legamento vocale, che risulta dal-
l’unione tra SMLP e SPLP. Questo è costituito da fibre collagene ed elastiche con
disposizione longitudinale, parallela alle fibre del muscolo vocale. Il ruolo funzio-
nale di questa struttura è di distribuire uniformemente, tra i vari strati muscolari, la
tensione derivante dalla contrazione muscolare e di garantire, nello stesso tempo,
una stabilità geometrica del muscolo vocale durante la vibrazione fonatoria.
Secondo Hirano, si viene pertanto a delineare una struttura delle corde vocali a

II.
3
70 E. Cunsolo et al.

Figg. 6, 7.
Sezione sagittale di laringe comprendente corde vocali vere e false; con la colorazione per le fibre ela-
stiche (Fig. 6) e reticolari (Fig. 7) si dimostra la ricchezza di tressuto connettivo ed elastico della sotto-
mucosa, particolarmente nelle corde vocali vere.

cinque strati istologici (epitelio, SSLP, SMLP, SPLM e Muscolo Vocale) e tre strati
biomeccanici (cover, strato transizionale e body), con rispettivi coefficienti di rigidità
di uno, otto e dieci. Tale organizzazione anatomo-strutturale non è però ugualmente
rappresentata lungo tutta l’estensione delle corde vocali e nelle diverse età della vita
24
. La LP presenta, infatti, differenze strutturali topografiche nelle diverse sezioni del-
le corde vocali e va incontro a modificazioni morfologiche al variare dell’età.
Alle due estremità delle corde vocali la LP s’ispessisce e forma anteriormente la
macula flava anteriore, sulla quale s’inserisce il tendine commisurale anteriore, e
posteriormente la macula flava posteriore, connessa all’apofisi vocale. Queste due
strutture funzionano come dissipatori della vibrazione cordale. Nel neonato non si
riconoscono i tre strati della LP e non esistono le macule flave ed il legamento vo-
cale. Questo comincia ad individualizzarsi tra il primo ed il quarto anno di vita,
mentre la tristratificazione della LP si rende completamente evidente alla pubertà.
Nell’anziano la LP perde il contenuto di fibre elastiche dello SMLP, mentre le fibre
collagene s’ispessiscono e si disorganizzano 28.

Ultrastruttura e biochimica funzionali della LP


Gli attuali studi sulla LP hanno spostato l’interesse dai dati istologici, desumi-
bili dagli studi con microscopio ottico, a quelli ultrastrutturali, mediante microsco-
pia elettronica, ed a quelli biochimici.
La LP è attualmente suddivisa secondo i suoi due componenti fondamentali: cel-
lule della LP e Matrice Extra-Cellulare della LP 12. Questa suddivisione non va in-
tesa in senso netto, ma come l’una l’espressione dell’altra. Le attività metaboliche
La fisiologia cellulare delle corde vocali 71

delle cellule determineranno, infatti, le caratteristiche della matrice extra-cellulare.


Queste condizioneranno, a loro volta, le proprietà dell’oscillazione cordale che,
chiudendo il cerchio, andrà ad esercitare un’influenza sull’attività di sintesi cellula-
re. Harris 21 e Margolis 30 hanno stabilito che forze fisiche possono modificare l’e-
spressione genica cellulare. Le differenti condizioni fisiche, alle quali sono sottopo-
ste le cellule degli strati superficiali e profondi della LP possono, pertanto, esercita-
re una differente spinta differenziativa, determinando la sintesi di matrici extracel-
lulari «strato-dipendenti».

Cellule della Lamina Propria delle Corde Vocali


Nella lamina propria sono presenti diversi tipi cellulari: fibroblasti, miofibro-
blasti, macrofagi ed altri cito-tipi, quali le cellule stellate. I fibroblasti sono le cel-
lule che sintetizzano i costituenti della lamina propria, assicurando il turn-over del-
la matrice extracellulare. Sono rappresentati in uguale misura in tutti gli strati della
lamina propria. Hirano, Sato e Nakashima 27 hanno però individuato sottopopola-
zioni di fibroblasti, con diversa distribuzione topografica in ambito cordale e con
varie specializzazioni funzionali. I fibroblasti presenti nelle macule flave hanno for-
ma a stella e mostrano un’intensa attività di sintesi di fibre collagene ed elastiche.
Nel bambino sono deputate alla costituzione del legamento vocale, mentre nell’a-
dulto ne regolano il metabolismo. Sato 34 ha ulteriormente definito il ruolo di que-
ste cellule della macula flava. Per la loro morfologia a stella, sono ora definite «cel-
lule stellate delle corde vocali». Mostrano un’intensa sintesi di collagene (tipo III)
e di fibre reticolari, nonché d’altri costituenti della matrice extracellulare: fibre ela-
stiche e proteoglicani (acido ialuronico). Queste cellule presentano anche gocce li-
pidiche nel citoplasma, verosimilmente rappresentate da vitamina A. È perciò pos-
sibile che tali elementi cellulari rivestano un ruolo fondamentale nella definizione
della matrice extracellulare della LP e perciò delle proprietà viscoelastiche dell’in-
tera corda vocale.
I fibroblasti presenti nello SR hanno forma ovalare ed esibiscono una scarsa at-
tività di sintesi proteica. Rappresentano il pool cellulare dal quale si differenziano i
miofibroblasti, con finalità riparative.
I Macrofagi sono cellule della flogosi. Catten 1 ha descritto, in circa 1/3 delle
corde vocali normali, una discreta concentrazione di macrofagi immediatamente al
disotto della MB e negli strati superficiali dello SSLP. Tale osservazione dimostra
l’esistenza di un modesto stato flogistico sottoepiteliale, a seguito di insulti infetti-
vi, da inalazione o da microtraumi vocali.
I Miofibroblasti sono fibroblasti, che si sono differenziati in cellule con capacità
riparative, nei confronti della matrice extra-cellulare 5. La loro presenza è pressoché
costante negli stessi strati superficiali dove si riscontrano i macrofagi. L’esistenza di
queste due popolazioni cellulari da un lato dimostra un persistente stato flogistico
sotto-epiteliale, dall’altro testimonia una spiccata capacità riparatrice tessutale, che
consente la restitutio ad integrum anatomo-funzionale di microlesioni cordali, nel-
l’arco di 36-48 ore.

II.
3
72 E. Cunsolo et al.

Matrice extracellulare della Lamina Propria delle corde vocali


Gli elementi della matrice extracellulare possono essere suddivisi secondo le lo-
ro caratteristiche istochimiche in: proteine fibrose (fibre collagene e fibre elastiche),
proteine interstiziali (glicoproteine e glicosaminoglicani o proteoglicani) ed altre
molecole interstiziali: carboidrati, lipidi 11. Queste molecole sono definite «intersti-
ziali» in quanto occupano gli spazi, gli «interstizi», tra le proteine fibrose 32.
In maniera schematica, è possibile attribuire a ciascuno dei componenti della
matrice extracellulare un preminente ruolo funzionale.
Le fibre collagene assicurano l’impalcatura strutturale delle corde vocali, alle
quali conferiscono anche le proprietà di resistenza allo stiramento.
Le fibre elastiche conferiscono elasticità alle corde vocali. Questa definisce la
capacità di un tessuto di poter subire una deformazione e di riacquistare la forma
originale, una volta cessata la causa deformante (Fig. 8).
Le proteine interstiziali condizionano numerose caratteristiche delle corde vo-
cali, quali la viscosità, il volume, il contenuto d’acqua, la dimensione e la densità
delle fibre collagene.

Proteine Fibrose delle corde vocali


Le proteine strutturali (collagene ed elastine) sono riconoscibili già istologica-
mente e sono, come già visto, alla base della classificazione di Hirano.

Fig. 8.
Matrice extracellulare della lamina propria: proteine fibrose (da Gray 11, modificata).
La fisiologia cellulare delle corde vocali 73

Collagene
Il collagene presente nella LP è di tipo I, II e III 8, mentre i tipi IV e VII sono
localizzati nella MB 7. Gli studi sulla distribuzione dei diversi tipi di collagene nel-
la LP cordale normale sono ostacolati dal suo rapido deterioramento antigenico po-
st-mortem. Le fibre collagene sono orientate in senso antero-posteriore, parallela-
mente ai fasci del muscolo cordale. Quest’orientamento spaziale ottimizza il loro
ruolo funzionale, che è quello di resistere allo stiramento. Hammond 19 ha studiato
le variazioni della distribuzione delle fibre collagene della LP in funzione dell’età e
del sesso. In tutti i casi considerati si è confermata la prevalente localizzazione del
collagene negli strati profondi della LP. Non sono emerse differenze statisticamen-
te correlate all’età, mentre nella popolazione maschile il collagene è presente in
quantità statisticamente superiore rispetto alle donne. Nelle corde vocali il collage-
ne è presente anche sotto forma di fibre reticolari. Nel 1998 Sato 33 ha evidenziato
l’importanza funzionale della struttura tridimensionale (3-D) delle fibre reticolari
delle corde vocali. Queste sono costituite da sottili fibre collagene tipo III e forma-
no un reticolo tridimensionale particolarmente evidente negli strati più superficiali
della LP, a livello del margine libero delle corde vocali. Le fibre collagene reticola-
ri sono molto sottili (40 nm) e formano una rete a larghe maglie nella quale sono di-
sposte le fibre elastiche, le glicoproteine ed i proteoglicani. Rappresentano così un
elemento chiave nella stabilità strutturale delle corde vocali e nella definizione del-
le loro proprietà viscoelastiche.

Elastine
Nella LP l’elastina è presente secondo tre forme: elaunin, oxytalan e fibre d’e-
lastina 18. Solo quest’ultima forma si evidenzia con i coloranti per l’elastina usati per
l’esame istologico. La Microscopia ottica comporta perciò una sottovalutazione del
reale contenuto dell’elastina nella LP. Hammond et al. 18 hanno mostrato variazioni
significative del contenuto di elastina con l’età, ma non con il sesso. Nel bambino
vi è un contenuto d’elastina pari al 23% di quella che si riscontra nell’adulto, men-
tre nell’anziano si registra una vera e propria impennata, con una quantità dell’87%
superiore a quella misurata nell’adulto. A tutte le età l’elastina si concentra preva-
lentemente nello SMLP, con il diametro delle singole fibre che aumenta proporzio-
nalmente con l’età.

Ruolo biomeccanico delle proteine fibrose


Dal punto di vista biomeccanico vi è un sinergismo d’azione tra le fibre colla-
gene e le fibre elastiche. L’elastina, in vitro, può subire un allungamento fino a 5
volte rispetto alla dimensione originaria, senza subire alterazioni della sua elasticità.
L’interazione con le fibre collagene limita queste proprietà elastiche, consentendo
un ritorno elastico delle corde vocali solo per stiramenti fino al doppio della lun-
ghezza originaria 8. Le proprietà biomeccaniche che l’interazione tra le proteine fi-
brose conferiscono alle corde vocali sono ben evidenti nei diagrammi forza/tensio-
ne. Una forza applicata secondo il maggior asse di una corda vocale ne produce l’al-
lungamento e genera una tensione secondo una risposta non lineare. La curva sfor-
zo/tensione che si otterrà avrà un andamento bimodale. La prima fase della risposta

II.
3
74 E. Cunsolo et al.

Fig. 9.
Curva sforzo/tensione del legamento cordale umano (da Gray 13, modificata).

mostrerà un incremento lineare della tensione, quale espressione delle proprietà ela-
stiche dell’elastina. Raggiunto un valore di tensione critico («break-point») si regi-
strerà un’impennata della curva sforzo/tensione, dovuta alla marcata resistenza allo
stiramento, propria delle fibre collagene (Fig. 9) 13.

Proteine interstiziali delle corde vocali


Le proteine interstiziali comprendono i Proteoglicani e le Glicoproteine. I Pro-
teoglicani (PG) presentano un core proteico che, mediante proteine «d’aggancio»
(linkage proteins), si lega ad altri core proteici oppure a carboidrati o a lipidi. Tale
conformazione molecolare conferisce ai PG numerose e peculiari proprietà biologi-
che. Queste, in parte, esprimono le attività biochimiche delle differenti catene lega-
te al core proteico, in parte derivano dalla capacità di alcuni PG a formare enormi
aggregati macromolecolari, a struttura ripetitiva, avvolti a spirale, molto idratati e
con caratteristiche ideali per il riempimento di spazi tessutali e l’assorbimento di
traumi meccanici. I PG possono essere distinti in due grandi gruppi: proteoglicani a
grande catena (Aggregani, Versicani ed Acido Ialuronico) e proteoglicani a piccola
catena (Decorina, Biglicano, Fibromodulina) 29.
I proteoglicani a larga catena sono ampiamente diffusi nell’organismo, dove
esercitano compiti d’alta specializzazione. Gli aggregani, principali costituenti del-
le cartilagini, assorbono traumi meccanici; l’acido ialuronico regola viscosità e mo-
vimento di fluidi (es. fluido sinoviale) e riempie spazi specializzati (es. umor vi-
treo). È perciò verosimile che tali macromolecole mostrino il loro ampio repertorio
funzionale anche a livello delle corde vocali.
La fisiologia cellulare delle corde vocali 75

Fig. 10.
Matrice extracellulare della lamina propria.
Proteine Fibrose + Acido Ialuronico (da Gray 11, modificata).

L’Acido Ialuronico (AI) rappresenta il PG a grande catena maggiormente rap-


presentato e funzionalmente più importante delle corde vocali. Ha un ruolo essen-
zialmente biomeccanico, legato alla disposizione tridimensionale delle sue macro-
molecole. L’AI cordale forma enormi aggregati macromolecolari, avvolti in larghe
maglie, con conformazione porosa. All’interno dei pori dell’AI sono contenute le
proteine fibrose, elastiche e collagene, con disposizione longitudinale ed addensate
a formare strutture fascicolate, simil-legamentose (Fig. 10).
L’AI assume così caratteristiche ideali nell’ammortizzare il trauma vibratorio
cordale ed è fondamentale nel determinare la massa e la viscosità delle corde voca-
li. Questo PG si concentra nello SMLP ed è massimamente rappresentato sulla fac-
cia inferiore delle corde vocali (infrafold area). Hammond 17 ha condotto ricerche
sulla distribuzione dell’AI nei due sessi, con risultati contrastanti. È, infatti, emerso
che il contenuto cordale di AI nelle donne mediamente sia solo un terzo rispetto a
quello dosabile negli uomini. Non vi è, tuttavia, una differenza statisticamente si-
gnificativa di AI nei due sessi, poiché vi sono donne con quantità di AI cordale tal-
mente elevato da influenzare i risultati statistici complessivi. L’importante ruolo

II.
3
76 E. Cunsolo et al.

biomeccanico dell’AI della LP propria cordale è stato sperimentalmente verificato


paragonando le proprietà reologiche di preparati di corde vocali dapprima con tutto
il loro contenuto di AI e successivamente private di tale costituente, degradato en-
zimaticamente mediante una ialuronidasi testicolare bovina 11 3.
Tra i PG a piccola catena della LP cordale, i più importanti sono la Decorina, il
Biglicano e la Fibromodulina. Questi PG hanno un core proteico ricco in leucina,
hanno dimensione molecolari modeste ed assumono disposizione spaziale compat-
ta. Hanno la caratteristica comune di legarsi al collagene tipo I, in siti diversi se-
condo i vari PG, andando ad esercitare un’azione di regolazione sulle proprietà di
assemblaggio delle fibre collagene.
La Decorina si localizza selettivamente nello SSLP (Fig. 11).
In presenza di questo PG le fibre collagene tendono ad essere più piccole e più
sottili. Si è perciò ipotizzato che la scarsa densità di collagene in questo strato del-
la LP sia da mettere in relazione proprio all’azione della Decorina. È inoltre possi-
bile che questo PG svolga una funzione di regolazione su quei processi riparativi
tessutali che si verificano pressoché costantemente in sede sotto-epiteliale. Diverse

Fig. 11.
Matrice extracellulare della lamina propria.
Proteine Fibrose + Acido Ialuronico + Decorina (da Gray 11, modificata).
La fisiologia cellulare delle corde vocali 77

Fig. 12.
Matrice extracellulare della lamina propria.
Proteine Fibrose + Acido Ialuronico + Decorina + Fibromodulina (da Gray 11, modificata).

evidenze sperimentali hanno, infatti, dimostrato che la Decorina previene l’evolu-


zione in fibrosi, a seguito dell’attivazione fibroblastica. È, pertanto, del tutto vero-
simile che la Decorina eserciti tale funzione anche nei confronti del trauma chirur-
gico, scongiurando l’evoluzione cicatriziale post-operatoria dello SSLP 11.
Il Biglicano è un altro PG a piccola catena che ha un rapporto di proporzionalità
inversa rispetto alla Decorina. La sua funzione è, infatti, diametralmente opposta, fa-
vorendo l’assemblaggio di grandi molecole di collagene. Si riscontra in elevate con-
centrazioni nelle cicatrici immature o ipertrofiche 35. Per tale motivo, non sorprende
come le locazioni elettive del Biglicano siano negli strati profondi della LP.
La Fibromodulina ha una costituzione biochimica simile alla Decorina, ma svol-
ge un ruolo funzionale differente (Fig. 12).
La Fibromodulina si concentra nello SMLP e qui si associa intimamente alle
proteine fibrose che formano il legamento vocale 32. La funzione di questo PG è
quella di «lubrificare» le fibre collagene ed elastiche del legamento vocale. Anche
questo PG, similmente all’AI, ha elettiva concentrazione nell’infrafold area, zona
critica nell’innesco della vibrazione cordale.

II.
3
78 E. Cunsolo et al.

La Fibronectina rappresenta la più importante glicoproteine della LP delle cor-


de vocali. È distribuita ubiquitariamente nei diversi strati della LP e sembra avere
un ruolo nella coesione tra le proteine fibrillari e nei processi riparativi tissutali 14.
La Fibronectina è stata ritrovata in elevate concentrazioni nei noduli cordali 4.

Ruolo biomeccanico delle proteine interstiziali


Per comprendere il ruolo biomeccanico delle proteine interstiziali bisogna in-
trodurre due concetti di biofisica della fonazione. Si tratta dei concetti di «Soglia di
pressione fonatoria» e di «Energia dissipata per la fonazione». Per Soglia di pres-
sione fonatoria si intende quel valore di minima pressione sottoglottica necessario a
produrre la vibrazione cordale. È una grandezza misurabile, espressa dall’equazio-
ne PdF = VDW/T, dove V esprime la velocità dell’onda mucosa, D è il coefficiente
d’idratazione tissutale (proporzionale alla viscosità tissutale), W è l’ampiezza glot-
tica pre-fonatoria e T è lo spessore delle corde vocali 38. Questi fattori definiscono
lo «sforzo» necessario affinché abbia inizio la fonazione. L’Energia dissipata per la
fonazione misura, invece, la quantità di energia necessaria al mantenimento della vi-
brazione cordale. Anche in questo caso è una grandezza misurabile, definita dall’e-
quazione E = (LT/D) ηω2ξ2, dove L, T e D sono rispettivamente lunghezza, spesso-
re e profondità delle corde vocali, η è la viscosità tissutale, ω è la frequenza ango-
lare e ξ è l’ampiezza della vibrazione 37. Ai fini della presente trattazione, occorre
sottolineare l’importanza della viscosità cordale quale fattore determinante nel con-
dizionare lo «sforzo» necessario sia per l’avvio della fonazione, sia per il manteni-
mento della stessa. La viscosità delle corde vocali varia, secondo una scala logarit-
mica, in funzione della frequenza di vibrazione. A 10 Hz la viscosità delle corde vo-
cali si attesta a 1-3 Pa/s (pascal/sec), valore sovrapponibile a quello del grasso ad-
dominale 39. Gli studi del gruppo di Gray, dell’Università dello Utah, pubblicati nel
1999 hanno confermato il ruolo cardine dell’AI nell’ottimizzare la viscosità corda-
le 11. Lo stesso gruppo di ricercatori, in un successivo studio del 2001 3, ha meglio
definito le proprietà reologiche cordali, ricorrendo a misurazioni più rigorose, se-
condo criteri dell’ingegneria reologica. Oltre alla viscosità (η), è stato definito e mi-
surato il modulo di scorrimento elastico (G’). Questa grandezza condiziona l’elasti-
cità tissutale ed è determinante nel controllo della frequenza fondamentale (F0). La
digestione enzimatica dell’AI con ialuronidasi testicolare, comporta un aumento di
circa il 70% della viscosità ed una riduzione del 35% del modulo di scorrimento ela-
stico, rispetto alle condizioni di base. Il risultato è pertanto quello di una cover più
rigida e molto meno»scorrevole». Questi dati rendono, inoltre, ragione dell’elettiva
concentrazione dell’acido ialuronico nell’infrafold area. Questa corrisponde alla re-
gione dove ha inizio l’onda mucosa (upheaval). L’AI si concentra, perciò, nella se-
de dove può esplicare nel modo migliore il suo effetto di facilitazione nella genesi
dell’onda mucosa.

Glicidi e Lipidi
Nella matrice extracellulare della LP delle corde vocali sono presenti anche ma-
cromolecole di natura non proteica, quali carboidrati e lipidi. Il loro ruolo funzio-
nale al momento non è però ben delineato, anche per la non antigenicità di tali so-
La fisiologia cellulare delle corde vocali 79

stanze che ne rende difficoltoso lo studio. Tale difficoltà metodologica non deve
però portare a sottovalutarne il ruolo funzionale, che si ritiene importante soprattut-
to per i lipidi. Chan e Titze 2 hanno, infatti, dimostrato che il tessuto adiposo ha
uguale viscosità rispetto alle corde vocali.

Considerazioni conclusive sulla biomeccanica della LP


La LP presenta struttura e funzioni complesse. Ciò non deve meravigliare, con-
siderando la quantità di suoni generati da un «semplice paio» di corde vocali. Que-
sta considerazione è ancora più evidente, considerando la varietà di forme e dimen-
sioni degli strumenti musicali, necessaria perché essi producano suoni differenti 26.
L’eccezionale versatilità funzionale delle corde vocali è, in larga misura, legata alle
proprietà biomeccaniche della matrice extra-cellulare della LP. Queste sono il risul-
tato del doppio livello d’interazione che si stabilisce tra i suoi costituenti molecola-
ri.
Il primo avviene tra gli elementi di una stessa famiglia molecolare: elastina e
collagene, tra le proteine fibrose; AI, decorina/biglicano e fibromodulina, tra le pro-
teine interstiziali.
Il secondo si stabilisce tra le due famiglie molecolari principali: quella delle pro-
teine fibrose, responsabili della risposta tensile delle corde vocali, e quella delle pro-
teine interstiziali, che invece determinano le proprietà di scorrimento visco-elastico
cordale. Le proteine fibrose consentono un’enorme dinamica vocale, grazie alle lo-
ro proprietà di generare, con facilità e grande modulabilità, tensione cordale. Le pro-
teine interstiziali promuovono, invece, un ottimo «rendimento fonatorio», con una
minima dispersione d’energia grazie ad un’ottimale viscosità ed elasticità tissutale.
Nella LP si costituisce, in definitiva, un mirabile esempio di compromesso funzio-
nale tra due caratteristiche (rigidità e cedevolezza) tra loro opposte.

Regolazione della matrice extracellulare


La distribuzione e le percentuali relative delle proteine fibrose ed interstiziali
sono regolate dai fibroblasti ed obbediscono a tre principali variabili: profondità
dello strato della lamina propria, sesso ed età. Particolarmente importanti a tal pro-
posito sono i lavori di Hammond, che mostrano come l’elastina sia condizionata
dall’età e non dal sesso 18 e viceversa per le fibre collagene 19 e per l’acido ialuroni-
co 17. Si è supposto che le differenti sollecitazioni fisiche alle quali sono sottoposte
i fibroblasti alle varie profondità degli strati della LP influenzino diverse espressio-
ni geniche e pertanto le varie composizioni della matrice extracellulare.
I fibroblasti della matrice extracellulare esercitano un continuo controllo sulla
composizione quali-quantitativa della matrice extracellulare (turn-over/regolazione
della matrice extracellulare). Quest’attività di controllo si esercita mediante una mo-
dulazione dell’attività di specifici enzimi e dei loro inibitori tessutali. I fibroblasti
producono tre principali enzimi, classificati come Metalloproteinasi, che si distin-
guono in: Collagenasi, che degrada il collageno tipo I e tipo III; Gelatinasi, che di-
strugge il collageno tipo VII e l’Elastasi, specifico per l’elastina. L’organismo, a sua
volta, produce Inibitori Tessutali delle Metalloproteinasi (TIMPS) 31. Il controllo
della matrice extracellulare è, in definitiva, il risultato dell’interazione tra 3 variabi-

II.
3
80 E. Cunsolo et al.

li: sintesi proteica, degradazione enzimatica ed inibizione enzimatica. Da studi con-


dotti sugli animali si è reso evidente come queste attività risentano in misura diffe-
rente dell’invecchiamento. Con l’età si ha una significativa riduzione della sintesi di
collagene e delle rispettive collagenasi, mentre non varia la produzione delle rispet-
tive TIMPS. Ciò significa una riduzione del turn-over e perciò la presenza di fibre
collagene mediamente più «vecchie». A livello biochimico l’invecchiamento di una
proteina di collagene si traduce nel fenomeno dl «cross-linking». Questo consiste
nella formazione di legami chimici tra parti della molecola, che normalmente ne so-
no sprovvisti. La conseguenza è una modificazione della struttura molecolare e per-
tanto delle sue caratteristiche meccaniche. In ultima analisi ciò si traduce in una ri-
dotta elasticità dell’elastina ed in un aumento di rigidità del collagene 11.

Fisiologia cellulare delle corde vocali: implicazioni cliniche


La fisiologia cellulare delle corde vocali ha due essenziali campi d’interesse cli-
nico. Da un lato, consente l’interpretazione delle patologie cordali, dall’altro per-
mette di esplorare possibili applicazioni delle conoscenze di fisiopatologia moleco-
lare nel trattamento delle disfonie.
Sulla base delle attuali conoscenze della fisiologia cellulare delle corde vocali
si è tentata un’interpretazione fisiopatologica relative alle tre principali patologie
benigne delle corde vocali: noduli, polipi ed edema di Reinke. In tutte queste pato-
logia l’alterazione cellulare riguarda gli strati più superficiali delle corde vocali. La
patogenesi dei noduli cordali è ben definita. Rappresentano la conseguenza di
un’eccessiva vibrazione cordale, localizzata all’interfaccia membrana basale/SSLP.
A questo livello si verifica una disorganizzazione ultrastrutturale delle Fibre d’An-
coraggio, con aumento del collageno tipo IV e della Fibronectina. Queste modifica-
zioni, verosimilmente, conseguono a ripetuti tentativi rigenerativi da parte dei mec-
canismi d’autoriparazione cordali, che però sono quantitativamente inadeguati al-
l’entità della causa lesiva 4 10.
Il secondo aspetto d’interesse clinico delle fisiologia cellulare delle corde voca-
li viene sviluppato indagando possibili applicazioni terapeutiche di costituenti della
LP. In quest’ottica, sono stati condotti numerosi studi sull’utilizzo dell’AI come bio-
materiale, in vitro ed in vivo. Questi ultimi sono di maggior impatto clinico e si ri-
feriscono all’impiego dell’AI per iniezioni intracordali. La finalità terapeutica di ta-
le procedura è quella di restituire un’ottimale viscosità cordale ed un’adeguata on-
da mucosa alle corde vocali irrigidite da fibrosi cicatriziale. Hallen 15 ha iniettato AI
nelle corde vocali di coniglio, constatandone il rapidissimo riassorbimento, nel giro
di soli 3-5 giorni. Gli studi successivi sono stati ripetuti con AI modificato (Hylan
B gel), con buoni risultati ad un anno dall’iniezione 16. Devono ancora essere me-
glio chiarite le interazioni che si stabiliscono tra l’AI iniettato e gli altri costituenti
della matrice extracellulare. Hallen ha documentato l’induzione della sintesi di col-
lagene, alla presenza intracordale dell’AI. Recenti studi di Hertergard 20 riportano ri-
sultati incoraggianti per un possibile utilizzo clinico dell’AI modificato. L’Hylan B
gel intracordale nel coniglio produce modificazioni tissutali, che però mantengono
bassa la viscosità della LP.
La fisiologia cellulare delle corde vocali 81

CONCLUSIONI

Lo studio della fisiologia cellulare delle corde vocali delinea una nuova dimen-
sione per la comprensione della fisiopatologia della fonazione. È auspicabile un
sempre maggior sviluppo di quest’area di ricerca in quanto le conoscenze che ne de-
rivano non si limitano ad un ambito puramente speculativo, ma tendono a proporre
applicazioni cliniche in campo riabilitativo, medico e chirurgico.

BIBLIOGRAFIA
1
Catten M, Gray SD, Hammond TH. An analysis of cellular location and concentration in vocal fold
lamina propria. Otolaryngol Head Neck Surg 1998118:663-9.
2
Chan RW, Gray SD, Titze IR. Viscosities of injectible biomaterials in vocal fold augmentation sur-
gery. Laryngoscope 1998;108:725-31.
3
Chan RW, Gray SD, Titze IR. The importance of hyaluronic acid in vocal fold biomechanics. Oto-
laryngol Head Neck Surg 2001;124:607-14.
4
Courey MS, Shohet JA, Scott MA, Ossof RH. Immunohistochemical characterization of benign
laryngeal lesions. Ann Otol Rhinol Laryngol 1996;105:525-31.
5
Darby I, Skalli O, Gabbiani G. Alpha-smooth muscle action is transiently expressed by myofibro-
blasts durino experimental wound healing. Lab Invest 1990;63:21-9.
6
Fukuda H, Kawaida M, Tatchara T. A new concept of lubrificating mechanism of the larynx. In:
Fujimura O, ed. Vocal physiology: voice production, mechanisms of the larynx. New York, NY: Ra-
ven Press 1988:83-92.
7
Gray SD. Basement membrane zone injury in vocal fold nodules. In: Gauffin J, Hammarberg B,
eds. Vocal fold physiology conference. San Diego: Singular Publishing Group 1991:21-8.
8
Gray SD, Hirano M, Sato K. Molecular and cellular structure of vocal fold tissue. In: Titze IR, ed.
Vocal fold physiology: frontiers in basic science. San Diego: Singular Publishing Group 1993:1-34.
9
Gray SD, Pignatari SN, Harding P. Morphologic ultrastructure of anchoring fibers in normal vo-
cal fold basement membrane zone. J Voice 1994;8:48-52.
10
Gray SD, Hammond EH, Hanson D. Benign pathologic response of the larynx. Ann Otol Rhinol
Laryngol 1995;104:8-13.
11
Gray SD, Titze IR, Chan R, Hammond TH. Vocal fold proteoglycans and their influence on bio-
mechanics. Laryngoscope 1999;109:845-54.
12
Gray SD. Cellular physiology of the vocal folds. Otolaryngol Clin North Am 2000;33:679-97.
13
Gray Sd, Titze IR, Alipour F, Hammond TH. Biomechanical and histologic observation of vocal
fold fibrous proteins. Ann Otol Rhinol Laryngol 2000;109:77-85.
14
Grinnel F. Fibronectin and wound healing. J Biochem 1984;25:107-16.
15
Hallen L, Dahlqvist A, Laurent C. Dextranomeres in hyaluronan (DiHA): a promising substance in
treating vocal cord insufficiency. Laryngoscope 1998;108:393-7.
16
Hallen L, Johansson C, Laurent C. Cross-linked hyaluronan (Hylan B Gel): a new injectable re-
medy for treatment of vocal fold insufficiency, an animal study. Acta Otolaryngol (Stockh)
1999;119:107-11.
17
Hammond TH, Zhou R, Hammond E, Pawlak A, Gray SD. The intermediate layer: a morphologic
study of the elastin and hyaluronic acid constituents of normal human vocal folds. J Voice
1997;11:59-66.
18
Hammond TH, Gray Sd, Butler JE, Zhou R, Hammond E. A study of age and gender related ela-
stin distribution changes in human vocal folds. Otolaryngol Head Neck Surg 1998;119:314-22.
19
Hammond TH, Gray SD, Butler JE. Age and gender-related collagen distribution in human vocal
folds. Ann Otol Rhinol Laryngol 2000;109:913-20.
20
Hertegard S, Laurent C, Borzacchiello S. Viscoelastic properties of rabbits’vocal folds after aug-
mentation. Otolayngol Head Neck Surg 2000;123:P74-5.

II.
3
82 E. Cunsolo et al.

21
Harris RC, Haralson MA, Badr KF. Continuous stretch-relaxation in culture alters rat mesangial
cell morphology, growth characteristics and metabolic activity. Lab Invest 1992;66:548-54.
22
Hirano M. Phonosurgery: basic and clinical investigations. Otol Fukuoka 1975;21:239-42.
23
Hirano M. Structure of the vocal fold in normal and disease states. Anatomical and physical study.
ASHA Rep 1981;11:11-30.
24
Hirano M, Kurita S, Nakashima T. Growth, development and aging of human vocal folds. In: Bless
DM, Abbs JH, eds. Vocal fold physiology. San Diego: College Hill Press 1983:22-43.
25
Hirano M, Kakita Y. Cover-body theory of vocal fold vibration. In: Daniloff RG, ed. Speech scien-
ce. San Diego: College Hill Press 1985:1-46.
26
Hirano M. The Paul Moore lecture. Vocal mechanisms in singing: laryngological and phoniatric
aspects. J Voice 1988;2:51-69.
27
Hirano M, Sato K, Nakashima T. Fibroblasts in human vocal fold mucosa. Acta Otolaryngol
(Stockh) 1999;119:271-6.
28
Lacau St Guily J, Roubeau B. Voies nerveuses et physiologie de la phonation. Encycl Med Chir
Oto-rhino-laryngologie, 20-632-A-10. Paris: Editions techniques 1994.
29
Lander AD. Proteoglicans. In: Kreis T, Vale R, eds. Guidebook to the extracellular matrix and
adhesion proteins. New York: Oxford University Press 1993:12-6.
30
Margolis LB. Induction of cell processes by local force. J Cell Sci 1991;98:369-73.
31
Murphy G, Docherty AJP. The matrix metalloproteinases and their inhibitors. Am J Respir Cell
Mol Biol 1992;7:120-5.
32
Pawlak AS, Hammond T, Hammond E, Gry SD. Immunocytochemical study of proteoglycans in vo-
cal folds. Ann Otol Rhinol Laryngol 1996;105:6-11.
33
Sato K. Reticular fibers in the vocal fold mucosa. Ann Otol Rhinol Laryngol 1998;107:1023-8.
34
Sato K, Hirano M, Nakashima T. Stellate cells in the human vocal fold. Ann Otol Laryngol
2001;110:319-25.
35
Scott PG, Dodd CM, Terdget EE, Gharhary A, Rathemtulla F. Immunohistochemical localization
of the proteoglycans decorin, biglycan and versican and transforming growth factor-beta in human
post burn hypertrophic mature scars.Histopathology 1995;26:523-31.
36
Tidman MJ, Eady RAJ. Evaluation of anchoring fibrils and other components of the dermal-epi-
dermal junction in dystrophic epidermolysis bullosa by a quantitative ultrastructural technique. J
Invest Dermatol 1985;84:374-7.
37
Titze IR. Heat generation of the vocal fold and possible effect on vocal endurance. In: Lawrence
V, ed. Transcripts of the 10th symposium care of the professional voice. Philadelphia: Voice Foun-
dation 1982:52-9.
38
Titze IR. The physics of small amplitude oscillation of the vocal folds. J Acoust Soc Am
1988;83:1536-52.
39
Zhu WB, Mow VC. Viscometric properties of proteoglycan solutions at physiologic concentra-
tions. In: Mow VC, Ratcliffe A, Woo S, eds. Biomechanics of diarthrodial joints. New York: Sprin-
ger-Verlag 1990:313-44.
Anatomofisiologia dell’apparato di risonanza e di articolazione 83

II.4. ANATOMOFISIOLOGIA DELL’APPARATO DI RISONANZA E DI


ARTICOLAZIONE

M. Accordi, W. De Colle

L’apparato di articolazione e risonanza è costituito da quell’insieme di strutture


e cavità poste al di sopra delle corde vocali che, nella loro diversa e variabile confor-
mazione, determinano una modificazione spettrale del suono originatosi da una sor-
gente (risonanza) e/o sono esse stesse sorgente di suoni (più precisamente rumori)
come si verifica nella produzione delle consonanti (articolazione). Le stesse struttu-
re anatomiche dunque possono operare in modo passivo modificando un suono pro-
dotto, nel caso specifico della voce, dalla sorgente glottidea (vocali), o in modo at-
tivo generando rumori (consonanti) che a loro volta possono essere modificati nel
loro contenuto spettrale. Le due funzioni quindi agiscono in modo sinergico e/o se-
quenziale consentendo ad un generico segnale acustico l’acquisizione di contenuti
informativi (fonemi).
A brevi cenni di anatomia, invitando i lettori a maggiori approfondimenti in te-
sti specializzati 6 9 10, seguirà più esaurientemente la tematica relativa alla funzione
di risonanza del tratto vocale sopraglottico.

ANATOMIA

L’apparato di risonanza e articolazione o tratto vocale sopraglottico comprende


le cavità e strutture anatomiche che si estendono dalle corde vocali escluse alle lab-
bra con inserimento in parallelo del naso ed annessi. È costituito dunque dal ventri-
colo di Morgagni, le corde false, il vestibolo laringeo, la faringe (distinta in ipofa-
ringe, orofaringe e rinofaringe), la cavità orale, le cavità nasali ed i seni paranasali
(Fig. 1).
Il ventricolo laringeo o del Morgagni è un diverticolo disposto orizzontal-
mente, delimitato inferiormente dalla corda vocale vera e superiormente dalla plica
ventricolare o corda vocale falsa. Lateralmente si insinua fino al legamento elastico
ed al muscolo tiro-aritenoideo, mentre anteriormente presenta un’appendice più o
meno estesa che può ritenersi omologa ai sacchi laringei di alcune scimmie. Lo spa-
zio ventricolare, virtuale a riposo, si modifica nel corso dei diversi tipi di fonazione
(frequenza di emissione, presenza di voce vibrata, variazioni di intensità) e secondo

Centro Medico-Chirurgico di Foniatria, Padova

II.
4
84 M. Accordi et al.

Fig. 1.
Apparato di risonanza e articolazione.

Van den Berg 11 funge da filtro passa-basso nei confronti del suono sorgente larin-
geo.
La corda vocale falsa, estesa dall’angolo diedro della cartilagine tiroidea alla
cartilagine aritenoide, è una plica mucosa formata da connettivo lasso e pochissime
fibre muscolari; il suo margine libero con l’analogo controlaterale delimita la rima
del vestibolo.
Il vestibolo laringeo è delimitato anteriormente dalla faccia posteriore dell’epi-
glottide, lateralmente dalla faccia mediale delle pliche ari-epiglottiche e posterior-
mente dalla faccia anteriore della piega interaritenoidea.

Faringe
È un canale muscolo-membranoso, impari e mediano, che si estende dalla base
cranica, in alto, alla trachea ed esofago in basso. Posto al davanti dei corpi vertebrali
cervicali, da cui è separato dalla fascia prevertebrale e da sottile tessuto connettivo
lasso, abbraccia nella sua porzione inferiore la laringe, comunica in avanti con le
fosse nasali attraverso le coane e con la cavità orale mediante l’istmo delle fauci, e
lateralmente, attraverso la tuba di Eustachio, con la cavità del timpano. È costituita
da tre strati: mucosa, lamina fibroelastica e tonaca muscolare. In particolare la to-
naca muscolare è formata da sei muscoli per ogni lato, distinti in intrinseci ed estrin-
seci. I muscoli intrinseci, o costrittori in quanto hanno la funzione di ridurre il cali-
bro faringeo con azione sfinterico-peristaltica, sono rappresentati dal costrittore su-
periore, medio ed inferiore. I muscoli estrinseci agiscono invece da elevatori della
faringe aumentandone i diametri (muscoli elevatori). Sono costituiti dal muscolo sti-
lofaringeo, salpingofaringeo e palatofaringeo.
La faringe ha una lunghezza di 12-14 cm ed è suddivisa in:
– Rinofaringe o epifaringe (4-5 cm): estendendosi dalla base del cranio al mar-
gine inferiore del palato molle, ricca di tessuto linfatico, soprattutto nel bam-
Anatomofisiologia dell’apparato di risonanza e di articolazione 85

bino (tonsilla faringea), comunica in avanti con le fosse nasali attraverso le


coane e lateralmente, mediante l’ostio tubarico e la tuba di Eustachio, con la
cassa timpanica. Il palato molle (o velo palatino) è l’unica parete molle e mo-
bile del rinofaringe. Come struttura muscolo-membranosa che prolunga indie-
tro la volta palatina, consta di due pilastri per parte che si riuniscono a livello
dell’ugola: i pilastri anteriori (o palatoglossi) che dalla base dell’ugola si por-
tano alla base della lingua, e i pilastri posteriori (o palatofaringei) che sempre
dalla base dell’ugola si tendono fino alle pareti laterali della faringe. Fra i due
pilastri si circoscrive la fossa tonsillare che accoglie la tonsilla palatina. Lo
spazio delimitato dai due pilastri anteriore e posteriore di un lato ed i corri-
spettivi dell’altro lato è definito istmo delle fauci, comunicazione fra cavità
orale e porzione media della faringe (orofaringe). Il velo palatino, con la com-
partecipazione dei muscoli delle pareti laterali e raramente posteriori del rino-
faringe (muscolo costrittore superiore), costituisce un’unità anatomo-funziona-
le (sfintere velofaringeo) preposta alla chiusura della comunicazione fra oro e
rinofaringe. È formato da due lamine elastiche (aponeurosi palatine) che ante-
riormente prendono inserzione sul bordo libero della lamine orizzontali del-
l’osso palatino, da quattro muscoli pari e da uno impari (muscolo dell’ugola).
Il muscolo dell’ugola (o m. azigos o m. palato-stafilino) prende inserzione sul
bordo posteriore dell’aponeurosi fibrosa; contraendosi accorcia brevemente l’ugola,
ma è di scarso significato nell’occlusione velofaringea.
I muscoli pari sono rappresentati da:
• Muscoli elevatori del velo palatino: si inseriscono in alto sulla piramide del
temporale, anteriormente all’ingresso del canale carotideo. Portandosi in bas-
so e medialmente si inseriscono sulla faccia posteriore dell’aponeurosi palati-
na; nella loro azione elevano e spostano posteriormente il velo e, prendendo
punto fisso in basso, durante la deglutizione, aprono l’orificio tubarico.
• Muscoli tensori del velo palatino: originano dalla spina angolare dello sfenoi-
de, dalla fossa scafoidea e dalla porzione cartilaginea della tuba. Le fibre mu-
scolari si continuano con un tendine che riflettendosi a livello dell’uncino pte-
rigoideo si dispone orizzontalmente per distribuirsi infine sul terzo superiore
del velo. I muscoli hanno la funzione di tendere ed elevare il palato molle e,
con i loro fasci mediali, dilatare la tuba uditiva.
• Muscoli palatoglossi: sono contenuti negli omologhi pilastri prendendo origi-
ne in alto nell’aponeurosi palatina, ed in basso sul setto e margini linguali.
Benché potenzialmente in grado di abbassare il palato molle, non sembra ab-
biano una importante azione nei movimenti velari.
• Muscoli palatofaringei: contenuti nei pilastri posteriori originano in alto, ol-
tre che dall’aponeurosi palatina, dalla porzione mediale della tuba uditiva e
dall’uncino pterigoideo, ed in basso si inseriscono sulle pareti laterali e po-
steriori della faringe. Nella loro azione avvicinano i pilastri posteriori, re-
stringendo l’istmo delle fauci, innalzano la faringe, allargano la tuba uditiva
ed, unitamente al muscolo elevatore del velo, restringono in senso antero-po-
steriore lo sfintere velo-faringeo.
La normale funzionalità dello sfintere velofaringeo, in cui il velo palatino rap-
presenta l’elemento più importante per la sua notevole mobilità, è essenziale nel

II.
4
86 M. Accordi et al.

permettere alcuni atti fisiologici quali la deglutizione, la suzione, la respirazione, il


soffio, lo sbadiglio, l’apertura della tuba uditiva, ed in particolare l’articolazione-ri-
sonanza come vedremo di seguito.
– Orofaringe o mesofaringe (4 cm): o porzione media della faringe, è delimita-
ta in alto dalla superficie inferiore del velo palatino ed in basso da un piano
orizzontale che passa per l’osso ioide. Corrisponde all’istmo delle fauci e mo-
stra in avanti la base linguale, lateralmente la piega del pilastro palatino po-
steriore con annessa fossa tonsillare e tonsilla palatina, mentre posteriormen-
te corrisponde alla fascia cervicale profonda a livello della II e III vertebra
cervicale. Nell’orofaringe è localizzato gran parte dell’anello linfatico di Wal-
deyer costituito dalla tonsilla linguale, palatine, tubariche e posteriormente
dalla tonsilla faringea.
– Ipofaringe (5 cm): corrisponde ai corpi della III, IV, V e VI vertebra cervica-
le quindi dal margine superiore dell’epiglottide al margine inferiore della car-
tilagine cricoidea. In avanti presenta in alto l’epiglottide, in mezzo l’aditus la-
ringeo (delimitato da epiglottide, pliche ariepiglottiche, aritenoidi e plica in-
teraritenoidea) e posteriormente la faccia posteriore delle cartilagini aritenoi-
dee e cricoidea e i muscoli interaritenoidei. Ai lati dell’aditus laringeo si ap-
profondano le docce faringolaringee o seni piriformi che abbracciano la prima
parte della laringe e nel cui fondo è reperibile il nervo laringeo superiore.

Cavità nasali e seni paranasali


Le cavità nasali comprendono il vestibolo nasale e le fosse o cavità nasali pro-
priamente dette.
Il vestibolo del naso è limitato lateralmente dalla cartilagine alare, medialmen-
te dalla cartilagine del setto ed inferiormente dal ramo mediale della cartilagine ala-
re. Si apre all’esterno attraverso le narici e posteriormente, mediante un orificio a
triangolo allungato, comunica con la fossa nasale.
Le fosse nasali si presentano come due canali lunghi e stretti che in avanti si
aprono nel vestibolo ed indietro, attraverso le coane, nel rinofaringe. La loro parete
mediale è formata dal setto nasale, lamina osseo cartilaginea liscia formata nella sua
parte supero-posteriore dalla lamina perpendicolare dell’etmoide, in quella infero-
posteriore dall’osso vomere, e nella sua parte anteriore dalla cartilagine quadrango-
lare. Il pavimento è costituito dal processo palatino del mascellare e dal processo
orizzontale dell’osso palatino posteriormente. La parete superiore o volta, proce-
dendo dall’avanti all’indietro, risulta formata dalle due cartilagini laterali che me-
dialmente si congiungono con la quadrangolare, dalle ossa proprie del naso, dalla
spina nasale del frontale, dalla lamina cribrosa dell’etmoide e dalla faccia anteriore
ed inferiore del corpo sfenoidale. La parete laterale infine corrisponde, in senso an-
tero-posteriore, alla parete mediale dei seni mascellari, alle masse laterali dell’et-
moide ed all’osso palatino. In essa si ritrovano i tre cornetti o turbinati che circon-
dano i rispettivi meati. Il turbinato medio e superiore appartengono all’etmoide,
mentre l’inferiore è una struttura a se stante.
I seni paranasali sono cavità pari indovate nella compagine di alcune ossa del
cranio:
Anatomofisiologia dell’apparato di risonanza e di articolazione 87

• seno frontale: è situato nella parte inferiore dell’osso frontale; di volume va-
riabile, ma in media di 4,5 cm3, comunica con il meato medio attraverso il ca-
nale fronto-nasale;
• seno mascellare: grossa cavità scavata nell’osso mascellare con un volume
medio 11-12 cm3; comunica con la fossa nasale nel meato medio mediante il
canale mascellare;
• cellule etmoidali: piccole cavità in numero medio di 7-9 situate nelle masse
laterali dell’etmoide; sono distinte in un gruppo anteriore ed uno posteriore e
si aprono con numerosi piccoli orifici rispettivamente nel meato medio ed in
quello superiore;
• seno sfenoidale: cavità a forma di cubo delimitata dalla controlaterale da un
sottile setto osseo, si situa nel corpo dello sfenoide. Ha una capacità media di
5-6 cm ed è in rapporto anteriormente con le fosse nasali, posteriormente con
la base cranica, superiormente con l’ipofisi e fossa cranica media, inferior-
mente con il rinofaringe. Anteriormente è in comunicazione con l’estremo po-
steriore della volta della cavità nasale.

Cavità orale
È una cavità ovoidale a maggior asse antero-posteriore delimitata da sei pareti.
• Parete anteriore: costituita dal labbro superiore ed inferiore che delimitano la
rima orale. I numerosi muscoli che costituiscono il loro strato muscolare (or-
bicolare della bocca, compressore delle labbra, m. quadrato del labbro supe-
riore ed inferiore, m. incisivo del labbro superiore ed inferiore, m. canino del
labbro superiore, m. buccinatore, m. zigomatico, m. triangolare, m. risorio),
conferiscono alle labbra una ricca mobilità di fondamentale importanza nella
masticazione, fonazione, mimica, articolazione.
• Parete superiore: è costituita dal palato duro formato dai processi palatini dei
mascellari e dai processi orizzontali delle ossa palatine; anteriormente e late-
ralmente da entrambi i lati è delimitato dall’arcata alveolo-dentaria superiore.
• Parete posteriore: costituita dal velo palatino.
• Parete inferiore: o pavimento della bocca, è costituita dal piano muscolare dei
muscoli sottolinguali e sottomandibolari, ed in particolare al muscolo milo-
ioideo. Delimitata in avanti e lateralmente dal corpo della mandibola e poste-
riormente dall’osso ioide, divide la cavità orale dalla regione sopraioidea.
• Pareti laterali: sono costituite dalle guance limitate internamente dal fornice
vestibolare in cui la mucosa si continua con quella gengivo-alveolare, poste-
riormente dal pilastro palato-glosso ed anteriormente si continuano con le lab-
bra.
Le arcate alveolo-dentarie, a forma di ferro di cavallo, una superiore ed una in-
feriore, sono formate dai processi alveolari del mascellare e della mandibola, e dai
denti. Esse suddividono il cavo orale in due compartimenti: il vestibolo, più esterno
e stretto, e la cavità orale propriamente detta, più interna ed ampia. I due comparti-
menti comunicano attraverso gli spazi retrodentali situati posteriormente all’ultimo
dente.
Il vestibolo è uno spazio praticamente virtuale che termina con il fornice vesti-

II.
4
88 M. Accordi et al.

bolare; sulla linea mediana presenta due frenuli, superiore ed inferiore, che unisco-
no ciascun labbro alle arcate dentarie.

Lingua
Organo muscolare ricoperto da mucosa, dotato di notevole mobilità e quindi va-
lidamente adibito alle funzioni di presa degli alimenti, masticazione, formazione del
bolo alimentare, deglutizione ed articolazione; inoltre è sede dell’organo del gusto.
Ha forma di cono e comprende una parte anteriore o corpo ed una posteriore o ra-
dice (o base lingua); il limite fra le due porzioni è indicato da un solco a forma di V
aperto in avanti (solco terminale).
Il corpo linguale si dispone orizzontalmente ad occupare completamente la ca-
vità orale. Si distingue una superficie superiore (dorso della lingua) ed una inferio-
re che prende contatto con il pavimento orale. Il dorso linguale sulla linea mediana
presenta un solco, più o meno evidente, che divide la lingua in due metà e termina
posteriormente, all’apice del solco terminale, in una fossetta (forame cieco o foro di
Morgagni), vestigia dello sbocco del dotto tireo-glosso. Ricordiamo inoltre, sulla
superficie superiore, la presenza delle papille gustative (circumvallate, foliate, fun-
giformi e filiformi), sede di boccioli gustativi.
La faccia inferiore poggia sul pavimento orale cui è ancorata da una plica mu-
cosa (frenulo della lingua).
La base o radice della lingua si dispone invece verticalmente, dietro il V lin-
guale, e presenta una sola faccia libera, quella supero-posteriore o faringea. Poste-
riormente dalla radice si dipartono tre pliche che la uniscono all’epiglottide (pliche
glosso-epiglottiche); le pliche circoscrivono le due vallecole glosso-epiglottiche.
Tale connessione obbliga l’epiglottide a seguire la radice linguale nei suoi movi-
menti, come ad esempio nella deglutizione in cui la spinta indietro della lingua con-
tribuisce all’abbassamento dell’epiglottide verso l’adito laringeo.
La lingua è un potente organo muscolare, dotato di estrema mobilità e della pos-
sibilità di assumere diverse forme conservando il medesimo volume. Alcuni Autori
contano nella lingua ben 21 muscoli distinti in estrinseci ed intrinseci. Rimandiamo
ai testi già citati per chi volesse approfondire la fine anatomia degli stessi, limitan-
doci in tal sede alla sola nomenclatura.
I muscoli estrinseci (in numero di 17: 8 pari ed 1 impari) hanno fasci che rag-
giungono la lingua partendo da strutture viciniori: genio-glosso, io-glosso, condro-
glosso, stilo-glosso, palato-glosso, faringo-glosso, amigdalo-glosso, longitudinale
superiore (impari e mediano), longitudinale inferiore.
I muscoli intrinseci corrono nel corpo linguale senza particolari inserzioni ester-
ne alla lingua; sono in numero di 4 (2 muscoli pari): trasverso e verticale.

FISIOLOGIA

Sono già state ricordate alcune funzioni del tratto vocale sopraglottico, quali la
funzione respiratoria, alimentare (comprensiva della suzione, masticazione e deglu-
tizione), la funzione olfattiva e gustativa, di depurazione, riscaldamento ed umidifi-
Anatomofisiologia dell’apparato di risonanza e di articolazione 89

cazione dell’aria inspiratoria, la funzione mimica. Nell’ambito della comunicazione


verbale il vocal tract è invece preposto alle due funzioni di articolazione e risonan-
za. L’articolazione è la produzione attiva di un segnale acustico complesso aperio-
dico (rumore) grazie ai diversi ostacoli che l’aria espirata incontra nel suo passag-
gio attraverso le cavità sovraglottiche variamente conformate all’uopo. Questi ru-
mori possono sostituirsi (consonanti sorde) o sommarsi ad un suono complesso pe-
riodico generato a livello glottideo (consonanti sonore). La risonanza invece è inte-
sa come modificazione delle caratteristiche spettrali di un segnale acustico com-
plesso (periodico o aperiodico) generato da una sorgente e l’esempio più semplice è
costituito dalla produzione delle vocali. Potremmo schematicamente considerare
che l’articolazione sta alla parola come la risonanza alla voce, ma le due funzioni si
integrano a vicenda consentendo ad un suono l’acquisizione di contenuti informati-
vi. Un esempio è fornito dalla produzione della consonante nasale [n] in cui oltre ad
una vibrazione delle corde vocali (consonante sonora), gli organi articolatori si di-
spongono in modo da determinare una occlusione (articolazione alveolare o denta-
le) (consonante occlusiva), con abbassamento del velo palatino per cui l’aria sono-
rizzata fuoriesce dalle cavità nasali conferendo al prodotto acustico una risonanza
nasale 7.
Tralasciando le problematiche relative al luogo e modo di produzione delle con-
sonanti, argomento di studio della fonetica articolatoria, ci rivolgiamo in particola-
re alla produzione della voce e quindi alle modalità di risonanza del tratto vocale.
Il segnale acustico prodotto dalla vibrazione cordale (segnale glottico o segnale
sorgente) è un suono complesso quasi periodico caratterizzato dunque da una fre-
quenza fondamentale (fo), responsabile della percezione dell’altezza, e da una serie
di componenti o armoniche di frequenza multiplo intero della fondamentale. Ad una
rappresentazione spettrale (spettro di potenza con in ascissa la frequenza ed in ordi-
nata l’intensità o energia) il segnale glottico si presenta con una serie di picchi, cor-
rispondenti alle armoniche, che diminuiscono progressivamente in altezza, cioè di
intensità, all’aumentare della frequenza. La diminuzione di intensità è di circa 12 dB
per ogni raddoppio della frequenza (12 dB/oct) 3. Nell’emissione delle diverse vo-
cali queste caratteristiche si mantengono, con una certa approssimazione, simili.
Lo spettro di potenza del segnale verbale corrispondente (cioè del segnale regi-
strato a livello delle labbra) si presenta invece con gli stessi picchi armonici, ma la
cui intensità è variabile in relazione a diverse zone frequenziali ed alla diversa vo-
cale emessa. In Figura 2 sono riportati gli spettri del segnale glottico e verbale cor-
rispondente della vocale [a].
Le zone frequenziali a maggior energia sono le Formanti indicate progressiva-
mente con F1, F2, F3, F4, ecc. Le Formanti, definite in termini di frequenza, ampiez-
za e larghezza di banda (1), rappresentano le caratteristiche di risonanza del con-
dotto vocale 2.
Sono queste zone a massima energia che conferiscono all’indistinto segnale

(1) La larghezza di banda è definita come l’intervallo frequenziale che include la frequenza della for-
mante e quelle frequenze in cui si ha una attenuazione di 3 dB rispetto al massimo di intensità. La lar-
ghezza di banda è tanto maggiore quanto più alta è la frequenza della formante.

II.
4
90 M. Accordi et al.

Fig. 2.
Spettro di potenza del segnale glottico (a sinistra) e del corrispondente segnale verbale (a destra).

glottico un contenuto informativo. Nelle figure 3 e 4 si riportano rispettivamente


l’inviluppo spettrale, ottenuto con metodica LPC, con indicate le formanti delle 5
vocali fondamentali italiane di un maschio adulto, e lo spettrogramma a finestra cor-
ta corrispondente, con sovrapposti le tracce delle frequenze formantiche 1.
Se percettivamente il segnale glottico si presenta come prodotto acustico del tut-
to indistinto, il segnale verbale, con le sue zone frequenziali a diversa energia, e per
la relazione fra esse, è riconosciuto come suono distintivo, a contenuto comunicati-
vo. E ciò avviene non solo per segnali complessi periodici, ma anche aperiodici co-
me nel caso della voce sussurrata o della voce alaringea del laringectomizzato tota-

Fig. 3.
Inviluppo delle cinque vocali fondamentali italiane.
Anatomofisiologia dell’apparato di risonanza e di articolazione 91

Fig. 4.
Spettrogramma a finestra corta con sovrapposto l’andamento temporale delle frequenze formantiche
delle cinque vocali fondamentali italiane.

le. Non è superfluo tuttavia precisare che nella risonanza l’apparato funziona sem-
pre in modo passivo limitandosi alla modificazione di un segnale sorgente che an-
che nel caso del laringectomizzato totale origina da uno sfintere vibrante in modo
più o meno periodico (neoglottide).
Il condotto vocale è un particolare tipo di risuonatore (o filtro), chiuso da un la-
to (a livello della glottide) ed aperto dall’altro (a livello di labbra e/o narici); grazie
alla notevole mobilità di alcune sue componenti (labbra, mandibola, lingua, velo pa-
latino), la sua lunghezza e volume sono estremamente variabili e quindi è in grado
di modificare le proprie frequenze di risonanza.
Nel caso più semplice e nella produzione di una vocale neutra in cui il condot-
to vocale è considerato privo di costrizioni, lo stesso può essere approssimato ad un
singolo tubo di sezione uniforme chiuso da un lato ed aperto dall’altro. Se la lun-
ghezza del tubo è di 17,5 cm (dimensioni del condotto vocale di un maschio adul-
to), le frequenze formantiche possono essere teoricamente calcolate con semplici
formule matematiche che forniscono i seguenti risultati:
F1 = 500 Hz
F2 = 1500 Hz
F3 = 2500 Hz
cioè le frequenze di risonanza sono multipli dispari (interi) della prima risonan-
za (F1) e le stesse sono inversamente proporzionali alla lunghezza del tubo: ad un
vocal tract di lunghezza minore le formanti avranno frequenza maggiore; è per que-

II.
4
92 M. Accordi et al.

sto che i bambini presentano formanti a frequenza maggiore rispetto agli adulti 4.
Nella realtà il condotto vocale presenta nelle sue variabili conformazioni diversi re-
stringimenti e quindi nel modello è necessario considerare più tubi in successione
che variamente contribuiscono alla risonanza complessiva. Nel caso poi di suoni na-
salizzati (consonanti nasali, vocali nasalizzate di particolari lingue o per effetti coar-
ticolatori, nasalizzazione di tutti i fonemi per insufficienza dello sfintere velofarin-
geo), il segnale sorgente è contemporaneamente irradiato attraverso la cavità orale
e nasale, per cui un tubo (nasale) è posto in parallelo a quello faringo-orale con con-
seguenze risonantiche particolari.
In tal caso una prima ed importante caratteristica è la riduzione dell’intensità del
segnale verbale rispetto a quello non nasalizzato. Ciò è da un lato dovuto al maggior
volume di aria e della maggior superficie del vocal tract con maggior assorbimento
dell’energia del segnale acustico, e dall’altro al fenomeno dell’antirisonanza. Se la
risonanza enfatizza alcune componenti con formazione a livello spettrale di picchi,
l’antirisonanza le de-enfatizza configurando nello spettro una valle o antiformante.
Risonanza (formanti) ed antirisonanza (antiformanti) variamente interferiscono ar-
rivando anche ad uno loro mutua cancellazione con inviluppi spettrali difficilmente
standardizzabili.
Un’altra conseguenza è la modificazione delle frequenze formantiche e la com-
parsa di nuove formanti; Ferrero 3 confrontando l’inviluppo spettrale di una vocale
nasale con quello della corrispondente orale rileva:
• presenza di una prima formante FN1 (formante nasale) a frequenza di circa
250 Hz;
• tendenza di F1 (formante orale) ad un valore frequenziale medio di 500 Hz con
sua significativa riduzione di ampiezza;
• comparsa di una seconda formante nasale (FN2) a circa 1000 Hz;
• non modificazioni di F2;
• comparsa di una terza formante nasale (FN3) verso i 2000 Hz;
• lieve spostamento di F3 ed F4 verso le alte frequenze.
Kent et al. 5 riportano invece la presenza di una formante nasale a bassa fre-
quenza, fra 250 e 500 Hz per un maschio adulto, un lieve aumento della frequenza
di F1, un abbassamento delle frequenze di F2 ed F3 e la presenza di una o più an-
tiformanti.
La configurazione assunta dal condotto vocale nell’emissione di diversi segnali
verbali è stata studiata in passato mediante stratigrafie in proiezione sagittale me-
diana e trasversa antero-posteriore. Attualmente sono utilizzate metodiche radiolo-
giche ad alta risoluzione (TAC, RMN) che consentono una rappresentazione tridi-
mensionale del tratto vocale sovraglottico. I dati ricavati dallo studio delle confor-
mazioni dell’apparato di articolazione e risonanza nelle diverse produzioni verbali,
sono utilizzati in particolare nella verifica della validità della teoria della produzio-
ne e trasmissione dei segnali vocali e nello studio della correlazione fra misure del
vocal tract e prodotti acustici 8.
Se in passato tali studi erano effettuati mediante la realizzazione di circuiti elet-
trici analoghi in cui invece di un’onda sonora si utilizzava un segnale elettrico 3, ora
le possibilità offerte dalla digitalizzazione dei segnali consente l’implementazione
di algoritmi che emulano sia la sorgente glottica che la funzione di filtraggio del vo-
Anatomofisiologia dell’apparato di risonanza e di articolazione 93

cal tract. In altre parole è possibile costruire la funzione di trasferimento del filtro
sovraglottico in modo più preciso verificando in tempo reale le modifiche dell’out-
put al variare dell’input e dei parametri del filtro stesso. L’applicazione pratica dei
risultati di questi studi non può altro che favorire la diagnostica strumentale in sog-
getti con disturbi di articolazione e/o risonanza.

BIBLIOGRAFIA
1
De Colle W, Ricci-Maccarini A. Acoustic analysis by Kay CSL 4300 in voice assessment. Work-
shop, 6° Symposium International Association of Phonosargeons, Venezia-Abano Terme, 19-22 Ot-
tobre 2000.
2
De Colle W. Voce & Computer – Analisi acustica digitale del segnale verbale (Il sistema CSL-
MDVP). Torino: Ediz. Omega 2001.
3
Ferrero FE, Genre A, Boe LJ, Contini M. Nozioni di fonetica acustica. Torino: Ediz. Omega 1979.
4
Johnson K. Acoustic and Auditory Phonetics. Cambridge, Mass. – USA: Blackwell Publishers
1997.
5
Kent D, Read C. The acoustic analysis of speech. San Diego: Singular Publishing Group 1992.
6
Lambertini G, Fumagalli Z, Fusaroli P, Nesci E, Pasqualino A. Anatomia umana. Padova: Ediz.
Piccin 1978.
7
Mioni AM. Fonetica articolatoria: descrizione e trascrizione degli atteggiamenti articolatori. In:
Croatto L, (a cura di). Trattato di Foniatria e Logopedia. Padova: Ediz. La Garangola 1986;vol.3.
8
Moore CA. The correspondence of vocal tract resonance with volumes obtained from magnetic re-
sonance images. J Speech Hearing Res 1992;35:1009-23.
9
Munari FP, Fabretto DA. Anatomia dell’apparato di articolazione e risonanza. In: Croatto L, (a cu-
ra di). Trattato di Foniatria e Logopedia. Padova: Ediz. La Garangola 1985;Vol.1.
10
Pernkopf E. Atlante di anatomia sistematica e topografica dell’uomo. Padova: Ediz. Piccin 1963.
11
Van den Berg JW. On the role of the laryngeal ventricle in voice production. Folia Phoniat
1955;7:57.

II.
4
B
III. INQUADRAMENTO DELLE DISFONIE

III
B
Inquadramento delle disfonie 97

III. INQUADRAMENTO DELLE DISFONIE

G. Bergamini*, D. Casolino**, O. Schindler***

INTRODUZIONE

La disfonia è una alterazione qualitativa e/o quantitativa della voce parlata che
consegue ad una modificazione strutturale e/o funzionale di uno o più organi coin-
volti nella sua produzione o ad una inadeguatezza delle relazioni dinamiche fra le
diverse componenti dell’apparato pneumo-fonatorio 33 30 31.
La complessità sintomatologica, che rende sicuramente più adeguata la defini-
zione di «sindrome disfonica» 29 31, è caratterizzata da segni oggettivi, di tipo acu-
stico (alterazioni di intensità, frequenza, timbro, tessitura), clinico (ispettivi; endo-
scopici: morfologici e dinamici), e/o soggettivi, di tipo fisico (fonastenia, parestesie
faringo-laringee), psicologico (sensazione di sgradevolezza od inadeguatezza della
propria voce), saltuariamente o costantemente presenti, in tutte o solo in particolari
situazioni comunicative.
Come già riportato in altro capitolo le strutture anatomiche essenziali per gene-
rare il prodotto acustico vocale (suono periodico complesso) sono: il mantice pol-
monare che genera la corrente aerea espiratoria e deve fornire flussi e pressioni ade-
guati, la laringe che attraverso la vibrazione (componente bio-meccanica) e l’ondu-
lazione della mucosa (effetto Bernoulli) genera l’energia sonora, le cavità sopra-
glottiche che modificando volumi, forma e caratteristiche di risonanza delle pareti
sono in grado di influenzare la distribuzione dell’energia nello spettro vocale. Su
questi effettori periferici il sistema nervoso con diversi livelli di coinvolgimento in
rapporto ai vari aspetti della produzione vocale esercita una funzione di program-
mazione, attivazione e controllo.
Qualsiasi alterazione anatomica o funzionale di questi molteplici distretti deter-
mina un disordine vocale.
A tuttora non esistono razionali classificazioni ed elencazioni dei quadri clinici
di disfonie 2 7 1b.
Il progetto di un catalogo nosologico deve preliminarmente affrontare il proble-
ma semantico per identificare una corretta denominazione per ciascuna entità pato-
logica, utilizzando una terminologia comprensibile e condivisibile da tutti gli ope-
ratori coinvolti nella gestione di un paziente disfonico.

*
Servizio di Clinica ORL, Dipartimento di patologia neuro-psico-sensoriale, Università di Modena
**
U.O. di Orl, Ospedale «M. Bufalini», Cesena
***
U.O.A. D.U. Audiologia-Foniatria, Azienda Ospedaliera «S. Giovanni Battista», Università di Torino

III
98 G. Bergamini et al.

È inoltre necessario definire le modalità per il riconoscimento e la diagnosi dei


vari tipi di disturbo vocale utilizzando indagini il più possibile obiettive e tecnolo-
gie non eccessivamente sofisticate e quindi disponibili dalla maggioranza degli ad-
detti ai lavori. Fra i numerosi strumenti a disposizione segnaliamo come essenziali:
anamnesi e valutazione delle modalità e del contesto d’uso della voce, videostrobo-
laringoscopia con registrazione delle immagini utilizzando fibroscopi rigidi (otti-
male definizione delle lesioni organiche) e flessibili (indispensabili per cogliere gli
atteggiamenti muscolo-tensivi della laringe ed eventuali disturbi deglutitori asso-
ciati alla disfonia), analisi elettroacustica (M.D.V.P., fonetogramma), indici aerodi-
namici (T.M.F., Q.F.).
In alcuni casi di immobilità laringea può essere indispensabile, per una diagno-
si differenziale, l’elettromiografia e talvolta per confermare il sospetto di una pato-
logia da reflusso gastro-esofageo una ph-metria ed un’esofagogastroscopia.
Infine una classificazione deve avere una strutturazione che oltre a consentire un
aggiornamento continuo sulla base delle nuove conoscenze abbia concrete valenze
applicative sotto diversi punti di vista: speculativo, diagnostico e terapeutico.
Una prima difficoltà nel progettare un modello classificativo è l’identificazione
delle categorie principali: la classica suddivisione che prevede le disfonie miste ac-
canto alle organiche e alle funzionali (o disfunzionali) non riproduce in modo ade-
guato la realtà delle diverse situazioni cliniche la cui evoluzione comporta presso-
ché costantemente il passaggio da una categoria all’altra con un differente peso del-
le due componenti (organica e disfunzionale) nel quadro sintomatologico dei singo-
li pazienti (Fig. 1).

Fig. 1.
Inquadramento delle disfonie 99

È sicuramente più utile da un punto di vista pratico una classificazione che pre-
veda due «contenitori principali» 16 25: disfonie organiche (sono presenti alterazioni
morfologiche o neuromuscolari di uno o più organi od apparati implicati nella pro-
duzione e nel controllo della voce) e disfonie non organiche o funzionali (assenza di
lesioni e di turbe motorie).
Nel valutare un paziente con una disfonia organica bisognerà porre attenzione
alla componente disfunzionale che, tranne pochi casi diagnosticati in fase di esor-
dio, è sempre presente e condizionerà la pianificazione terapeutica.

DISFONIE ORGANICHE

Nel gruppo delle disfonie organiche 33 30 3 7 8 18 11 6 36 37 21 1 14 24 35 5 34 20 28 15 22 31 10 32 è


opportuno distinguere su base anatomo-funzionale alcune categorie principali
(Tabb. Ia, Ib, II).
1 – Le importanti compromissioni del mantice si ripercuotono sulla funzione
vocale soprattutto in condizioni di particolare impegno (voce proiettata, sovraccari-
co vocale): l’insufficienza respiratoria di tipo restrittivo (esiti di pneumectomia, fi-
brosi polmonare, enfisema polmonare, rigidità senile della gabbia toracica) per la di-
minuzione importante della C.V. con conseguente alterazione dei parametri aerodi-
namici (T.M.F., Q.F.); l’insufficienza respiratoria di tipo ostruttivo (asma bronchia-
le in fase acuta) per la difficoltà a gestire la fase espiratoria ed adeguarla alle esi-
genze dinamiche della fonazione; l’insufficienza respiratoria di tipo misto (asma
bronchiale cronica, B.P.C.O.) per la contemporanea diminuzione della capacità vi-
tale e dei flussi espiratori.
2/I – Le laringiti acute possono essere allergiche, virali, batteriche, micotiche. La
flogosi interessa la mucosa e talvolta il muscolo vocale (specie nelle forme virali).
L’obiettività è caratterizzata da iperemia cordale, talvolta monolaterale (monocordi-
te), con presenza di essudato catarrale più o meno denso (forme crostose) ed even-
tuale modesta insufficienza glottica (miosite). La disfonia è particolarmente impor-
tante fino talvolta all’afonia. I professionisti della voce sono predisposti (i microtrau-
matismi vocali facilitano la localizzazione laringea di flogosi di vicinanza) e possono
più facilmente sviluppare compensi fonatori di tipo muscolo-tensivo presupposto per
una disfunzionalità vocale persistente. Forme particolari sono la laringite acuta mico-
tica (solitamente da candida) in cui la corda appare bianca e può essere difficile la dia-
gnosi differenziale con una lesione leucoplasica e la forma difterica nella quale la di-
sfonia è determinata dalla presenza di pseudomembrane sulle corde vocali.
2/II – Le laringiti croniche aspecifiche, caratterizzate da edema ed iperemia
della mucosa ed ispessimento dell’epitelio con frequente evoluzione verso lesioni
displasiche e/o edema di Rainke, riconoscono fattori patogenetici esogeni (fumo di
tabacco, alcool, fumi e vapori irritanti di vario genere) ed endogeni (abuso vocale,
flogosi croniche discendenti ed ascendenti, situazioni dismetaboliche, reflussi ga-
stroesofagei). Nella laringopatia da reflusso gastro-esofageo accanto ad una disfo-
nia più o meno importante, solitamente più accentuata al mattino, sono presenti al-
tri sintomi soggettivi quali: faringodinia, raschio, bolo, tosse stizzosa diurna e/o not-
turna, asma, spasmi laringei notturni, alitosi. Alla laringoscopia possiamo rilevare

III
100 G. Bergamini et al.

Tab. Ia.

ALTERAZIONI insufficienza respiratoria restrittiva

DEL insufficienza respiratoria ostruttiva

MANTICE POLMONARE insufficienza respiratoria mista

acute

LARINGITI aspecifiche
croniche
specifiche

displasia
epitelio carcinomi
papillomi

edemi di Reinke
polipi
noduli
lamina propria cisti
DISFONIE ALTERAZIONI cicatrici cordali
ANATOMICHE lesioni reattive
ORGANICHE DEL lesioni vascolari
PIANO GLOTTICO solchi

ulcera da contatto
mucosa aritenoidea
granulomi

diaframmi
commessura anteriore
sinechie

ESITI DI
CHIRURGIA
ONCOLOGICA
LARINGEA

DISTURBI anchilosi
DELLA
MOTILITÀ lesioni della via motoria

bulbo-pontini mioclono palato-faringeo

DISTURBI morbo di Parkinson


NEUROLOGICI centrali Corea
lesioni cerebellari
distonie
Inquadramento delle disfonie 101

Tab. Ib.

miastenia
MALATTIE distrofie
MUSCOLARI dermatomiosite
miofibromatosi
tumori muscolari
ematoma intracordale

testosterone
corticosteroidi
antistaminici
FARMACI spasmolitici atropinici
psicofarmaci
vitamina C ad alte dosi
diuretici

ipotiroidismo
ipertiroidismo
iperestrogenismo premestruale
dismenorrea
DISFONIE gravidanza
DISTURBI ORMONALI menopausa - andropausa
ORGANICHE iperpituitarismo
ipogonadismi o iperestrogenismi
prepuberali nel maschio
iperandrogenismo prepuberale
nella femmina
diabete

amiloide
TESAURISMOSI lipidi
mucopolisaccaridi

INAPPROPRIATA
ALTEZZA cambio di sesso
TONALE

ALTERAZIONI DEL
«VOCAL TRACT»

edema ed iperemia del labbro vocale ed un caratteristico quadro di laringite poste-


riore con iperemia e lieve edema dei cappucci aritenoidei e/o iperplasia epiteliale ed
ipercheratosi della mucosa interaritenoidea. Il quadro può complicarsi per la com-
parsa di un ulcera da contatto o un granuloma laringeo posteriore.
2/III – Le laringiti croniche specifiche sono manifestazioni laringee, con ca-
ratteristiche di tipo ulcero-granulomatoso, di malattie sistemiche o di organi di vici-
nanza di origine batterica (tubercolosi, lue, scleroma, lebbra, actinomicosi), fungina
(istoplasmosi, blastomicosi), autoimmune (Wegener) nelle quali la disfonia è in rap-
porto alla sede, volume e caratteristica delle lesioni.

III
102 G. Bergamini et al.

Tab. II.

surmenage vocale

malmenage vocale

PRIMARIE difficoltà nella


discriminazione
tonale

DISFONIE NON imitazione di


ORGANICHE modelli vocali
O
DISFUNZIONALI disturbi da conversione
O vocal cord dysfunction
MUSCOLO-TENSIVE psicogene disturbi della
muta vocale
depressione
SECONDARIE
da compenso
da patologia
organica
audiogene

" utilizzo non corretto comportamenti fono-


del mantice risonanziali inadeguati
MECCANISMI polmonare
#
PATOGENETICI comportamenti
pneumo-fonatori posture scorrette
$ inadeguati

ipercontrazione isometrica
posture ipercontrazione-iperadduzione laterale
laringee contrazione antero-posteriore sopraglottica
patologiche adduzione incompleta
ipotonia dei muscoli tiro-aritenoidei
iperadduzione glottica posteriore

3 – Per i disturbi vocali determinati da alterazioni anatomiche del piano glot-


tico è possibile far riferimento, alla recente classificazione di Rosen e Murry 25; di-
stinguiamo: patologie dell’epitelio, della lamina propria, della mucosa aritenoi-
dea, della commessura anteriore.
3/I – Rientrano nel primo gruppo le displasie, i carcinomi ed i papillomi. Le di-
splasie possono assumere le caratteristiche di lesioni eritrodermiche o leucoplasiche
più o meno rilevate: un’indagine particolarmente utile è la videostrobolaringoscopia
che può mettere in evidenza una riduzione o la scomparsa della ondulazione muco-
sa, espressione di infiltrazione dello spazio di Reinke o del legamento e costituisce
un indice importante per sospettare l’evoluzione verso una lesione cancerosa.
I carcinomi sono responsabili di disfonia quando coinvolgono il piano glottico
Inquadramento delle disfonie 103

o determinano paralisi di una emilaringe; nel caso di tumori sopraglottici l’unico


sintomo vocale, se voluminosi, può essere una modificazioni del timbro. I papillo-
mi, più frequenti nel maschio, possono colpire l’adulto ed il bambino; nel 50% dei
casi l’esordio è a livello glottico e la disfonia è il sintomo di esordio. Poiché la for-
ma infantile ha caratteristiche evolutive con coinvolgimento progressivo di tutta la
laringe e della trachea è opportuno sottoporre tempestivamente a laringoscopia tut-
ti i bambini disfonici anche se questa indagine può presentare qualche difficoltà in
età pediatrica.
3/II – Nelle lesioni della lamina propria la patogenesi della disfonia è duplice:
alterazioni della vibrazione e dell’ondulazione della mucosa e/o insufficienza glot-
tica da precontatto o da concavità del profilo cordale.
In questo gruppo annoveriamo numerosi quadri patologici.
Gli edemi di Reinke (presenza di trasudato più o meno denso che interessa pre-
valentemente la faccia superiore delle corde vocali) determinando un aumento vo-
lumetrico ed una irregolarità del profilo).
I polipi possono essere sessili e peduncolati con morfologia variabile in rappor-
to alle caratteristiche istologiche.
I kissing nodules sono l’espressione organica di una disfunzionalità protratta e
sono passibili di regressione con la sola terapia logopedia se diagnosticati in fase
iniziale.
Le cisti si distinguono, sulla base delle loro caratteristiche istologiche, in mu-
cose o da ritenzione ed epidermoidi, congenite, con un contenuto denso costituito da
detriti epidermici e cristalli di colesterolo.
Le cicatrici cordali, generalmente iatrogeniche anche se non si può escludere
un’altra origine (esiti di processi flogistici dello spazio di Reinke o di una emorra-
gia sottomucosa) possono presentarsi come rigidità più o meno diffuse della muco-
sa, rilevabili alla stroboscopia, o come concavità circoscritte del profilo cordale.
Le lesioni reattive si presentano come edemi fusiformi, pseudocisti e lesioni da
contatto; gli edemi fusiformi sono quasi sempre la conseguenza di una disfunziona-
lità vocale primitiva o secondaria ad una lesione intracordale (cisti o solco stretto);
quando sono simmetrici sono spesso equivalenti, per quanto riguarda l’etiopatoge-
nesi, ai «kissing nodules» e costituiscono in età pediatrica la modalità più frequen-
te di presentazione della laringopatia secondaria alla disfunzionalità vocale (laringi-
te a grano d’orzo). Le lesioni da contatto, caratterizzate da una convessità circo-
scritta del profilo cordale per edema della lamina propria e/o ispessimento dell’epi-
telio, si localizzano controlateralmente ad un polipo o ad una cisti e sono la conse-
guenza del traumatismo cronico sul labbro vocale. L’accumulo circoscritto subepi-
teliale di trasudato sieroso (pseudocisti) è una espressione reattiva determinata da
varie cause di tipo irritativo, microtraumatico (precontatto), disfunzionale o può es-
sere l’esito di una emorragia sottomucosa dopo il riassorbimento della sola parte
corpuscolata.
Le lesioni vascolari sono la conseguenza di abusi vocali e/o sono associate (va-
rici sentinella) a lesioni intracordali occulte; sono state descritte 13 tre varianti
morfologiche: varice (dilatazione venosa più o meno tortuosa), microangioma (per
lo più di aspetto sferico e più o meno rilevato sulla superficie mucosa), reticolo va-
scolare (numerosi capillari dilatati con orientamento irregolare o radiale). Queste le-

III
104 G. Bergamini et al.

sioni predispongono all’emorragia sottomucosa; essa è favorita da flogosi acute la-


ringee o di vicinanza, dalla fase premestruale, dall’assunzione di ASA o anticoagu-
lanti e si verifica nel corso di surmenage vocale, per un’intensa ed improvvisa emis-
sione vocale, per un violento colpo di tosse o starnuto. Si riassorbe solitamente sen-
za reliquati ma talvolta può dare origine ad una pseudocisti, ad un polipo angioma-
toso o ad una cicatrice.
I solchi si localizzano solitamente sul bordo libero delle corde vocali. Si distin-
guono due varianti anatomo-patologiche: il «solco stretto» e la «vergeture» o «sol-
co largo». Il solco stretto, solitamente limitato al terzo medio, è una profonda tasca
nel contesto della lamina propria che secondo l’ipotesi più accreditata si formereb-
be per l’apertura verso la superficie di una cisti epidermoide. Nel caso di doppia fis-
surazione della cisti si forma un ponte mucoso al di sopra del solco. Il solco largo è
una zona di atrofia della lamina propria di diversa entità che si estende per una lun-
ghezza variabile sul bordo libero.
3/III – A livello della mucosa aritenoidea sono rilevabili due tipi di lesione:
l’ulcera da contatto e il granuloma che alcuni AA. considerano fasi evolutive dello
stesso processo. I fattori etiologici (intubazione, reflusso gastro-esofageo, flogosi
discendenti, disfunzionalità vocale) sono spesso concomitanti; la disfonia non sem-
pre è presente ed in ogni caso è di lieve entità.
3/IV – La commessura anteriore può essere sede di diaframmi congeniti o di si-
nechie. L’alterazione del suono laringeo dipende dall’entità dell’insufficienza glot-
tica anteriore e dalla minore lunghezza della porzione vibrante delle corde vocali
(innalzamento della frequenza fondamentale). Un quadro particolare, rilevabile in
circa il 20% dei pazienti con «kissing nodules», è il microdiaframma commisurale
congenito, spesso rilevabile solo in microlaringoscopie diretta, che sembra costitui-
re un fattore predisponente alla formazione dei noduli disfunzionali.
4 – In seguito a chirurgia oncologica laringea la disfonia è inevitabile ma una
corretta e meticolosa tecnica chirurgica può ridurre l’handicap vocale. Negli inter-
venti cosiddetti funzionali viene conservato l’incrocio delle vie aereo-digestive e la
mutilazione è limitata ad una porzione più o meno ampia di laringe. Nella laringec-
tomia sopraglottica la conservazione del piano glottico non determina modificazio-
ni sostanziali della qualità vocale; negli altri interventi, invece, la voce «di com-
pensazione» si realizzerà per nuovi meccanismi sfinterici. Nelle cordectomie il com-
penso ottimale è quello fra corda e neocorda con risultati vocali buoni se la neocor-
da è mobile, di volume adeguato e con profilo rettilineo; altri possibili compensi so-
no: corda-falsa corda, da false corde, sfinterico. Nella laringectomia orizzontale
glottica il compenso si realizza fra le false corde, nella crico-ioido-epiglottopessia
fra aritenoide/i e faccia laringea dell’epiglottide, nelle crico-ioido-pessie fra arite-
noide/i e base linguale. Nella laringectomia totale la separazione completa della via
aerea dalla via digestivadetermina una alterazione anatomo-funzionale più com-
plessa; sono possibili due tipi di voce: una voce di «sostituzione» con mantice eso-
fageo e generatore ipofaringo-esofageo (voce erigmofonica) o artificiale (laringofo-
no) ed una voce «vicariante» dopo riabilitazione chirurgica mediante protesi tra-
cheo-esofagea con mantice polmonare e generatore ipofaringo-esofageo.
5 – Le alterazioni della motilità di una corda vocale dipendono da un’anchilo-
si dell’articolazione crico-aritenoidea o da una lesione del secondo motoneurone
Inquadramento delle disfonie 105

(nucleo ambiguo, nervo vago, nervo ricorrente). Un blocco dell’articolazione può


verificarsi per numerose evenienze: traumi laringei, intubazioni di lunga durata, po-
sizionamento prolungato di sondino naso-gastrico, lussazioni iatrogeniche, immobi-
lizzazione prolungata da paresi, artriti acute batteriche o virali, artrite gottosa, artri-
te reumatoide, malattie del collageno, radioterapia sulla laringe. Le lesioni della via
motoria possono verificarsi a vari livelli e la sintomatologia dipende sostanzial-
mente dalla posizione e dalla tensione della corda vocale, dalla presenza o meno di
atrofia del muscolo vocale.
Una sofferenza corticale o delle vie cortico-bulbari da raramente una paralisi per
la presenza di innervazione ipsi e controlaterale; le lesioni del nucleo ambiguo e del
nervo vago, determinano una immobilità con corda in posizione intermedia-abdotta
ed un disturbo della sensibilità per il contemporaneo coinvolgimento del laringeo
superiore e del ricorrente; nel caso di una lesione del tronco si associa frequente-
mente un disturbo deglutitorio con conseguente «disfonia umida» per il passaggio
del flusso aereo sonorizzato attraverso il ristagno di saliva. I danni ricorrenziali, il
più delle volte complicanza di interventi chirurgici, sono responsabili di una parali-
si con corda in posizione paramediana-intermedia. La posizione della corda vocale,
però, oltre che dal difetto di tensione del muscolo crico-tiroideo dipende dal feno-
meno della sincinesia 12, cioè di quella condizione di anomala ed inappropriata rein-
nervazione laringea che consegue ad un danno ricorrenziale parziale; essa può de-
terminare dissinergia/asincronismo o competizione contrattile della muscolatura la-
ringea intrinseca.
La sincinesia o l’anchilosi, secondaria ad un prolungato periodo di immobilità
da paresi, giustificano inoltre l’assenza di atrofia del muscolo vocale in molti casi di
immobilità cordale da danno ricorrenziale.
6 – La disfonia spasmodica è una distonia laringea che, inizialmente ritenuta
psicogena, rientra nel gruppo dei disturbi neurologici della laringe. È un disturbo
del movimento laringeo azione-indotto che può presentarsi in due forme cliniche:
adduttoria (voce tesa, strozzata, interrotta bruscamente da arresti vocali con netta ri-
duzione dei tratti prosodici; la laringe è normale a riposo ma in fonazione si osser-
va una «danza delle aritenoidi» per incapacità del paziente a controllare il corretto
affrontamento cordale) ed abduttoria (fonazione interrotta da pause di voce soffiata
per brusche abduzioni delle corde vocali). In certi casi può essere difficoltosa la dia-
gnosi differenziale con il tremore essenziale (danno delle vie olivo cerebellari) soli-
tamente caratterizzato da un tremore vocale con frequenza variabile fra i 5 e i 12 c/s
associato però nei casi gravi da arresti ritmici. Nel morbo di Parkinson e nelle sin-
dromi Parkinsoniane (lesione della «substantia nigra» e dei gangli della base) la vo-
ce ha intensità ridotta, monotonia melodica e, a volte, un tremore a bassa frequenza
(l’unico tremore cinetico del parkinsoniano); le corde vocali sono ipotoniche con in-
sufficienza glottica ovalare e ristagno di saliva nei seni piriformi. Nella Corea, l’in-
teressamento dei muscoli respiratori e laringei provoca irregolari fluttuazioni della
Fo ed arresti di voce che rendono la parola a scatti. In laringoscopia si osservano
movimenti irregolari delle corde vocali durante la respirazione. Nel mioclono pala-
to-faringo-laringeo sono presenti movimenti ritmici del palato molle, della musco-
latura faringea e laringea, della lingua, del diaframma, dei bulbi oculari; inoltre si
verificano interruzioni momentanee, ritmiche della fonazione che essendo quasi

III
106 G. Bergamini et al.

sempre di breve durata non vengono avvertite nella conversazione ma solo nella
emissione vocale prolungata. La causa è quasi sempre vascolare con lesioni a cari-
co del tronco. Nelle lesioni cerebellari, caratterizzate da perdita della coordinazio-
ne muscolare (dissinergia) e dell’abilità a controllare l’entità del movimento (di-
smetria), la disfonia, se presente, è caratterizzata da improvviso ed irregolare incre-
mento dell’altezza e/o dell’intensità vocale o da grossolano tremore vocale (disfo-
nia atassica); le corde vocali sono morfologicamente e funzionalmente normali.
7 – Fra le malattie muscolari che colpiscono la laringe e possono determinare
disfonia ricordiamo: la miastenia (malattia autoimmune della giunzione neuromu-
scolare con presenza di anticorpi contro i recettori dell’acetilcolina) nella quale i
primi sintomi sono velari con iperrinofonia e successivamente laringei con voce sof-
fiata, intensità ed altezza tonale ridotte (i disturbi si accentuano con l’uso della vo-
ce); le distrofie muscolari (Duchenne, Erb, Landouzy-Dejerine) responsabili di di-
sfonia per atrofia dei muscoli respiratori e laringei; la dermatomiosite malattia del
collageno con interessamento cutaneo e muscolare nella quale una disfonia di tipo
ipocinetico si associa quasi sempre a disfagia; la miofibromatosi caratterizzata dal-
l’aumento volumetrico di una corda vocale che spesso assume un aspetto bernocco-
luto; i tumori muscolari a localizzazione cordale; l’ematoma intracordale che si ve-
rifica per una rottura di alcune fibre del muscolo vocale a causa di uno sforzo voca-
le particolarmente violento o per un trauma cervicale anteriore (deformazione della
cartilagine tiroide e successivo stiramento del muscolo tiro-aritenoideo nella fase di
ritorno elastico) e che, nel caso di incompleto riassorbimento, può evolvere in una
cicatrice nel contesto del muscolo.
8 – Alcuni farmaci possono interferire sulle caratteristiche della voce. Una pil-
lola anticoncezionale con dosaggio relativamente elevato di progesterone ma so-
prattutto una terapia con testosterone per osteoporosi in menopausa determinano un
aumento della massa del muscolo vocale ed una conseguente androfonia spesso as-
sociata a lieve raucedine. I corticosteroidi per inalazione sono responsabili di xe-
rofonia e dopo terapia protratta di voce soffiata per atrofia della mucosa e del mu-
scolo vocale. Si verifica xerofonia anche con altri farmaci (antistaminici, spasmoli-
tici atropinici, antidepressivi e psicofarmaci in genere, vitamina C in dosi molto ele-
vate, diuretici, ipotensivi con azione parasimpaticomimetica) che determinano co-
me effetto collaterale secchezza delle mucose.
9 – Alcune patologie endocrine o modificazioni fisiopatologiche dell’assetto
ormonale hanno influenza sulle caratteristiche della voce. Nell’ipotiroidismo il
«mixedema» delle corde vocali si associa ad abbassamento della Fo, raucedine, ri-
duzione della componente formantica e della tessitura, fonastenia; nell’ipertiroidi-
smo all’astenia dei muscoli respiratori e fonatori consegue voce soffiata e di inten-
sità ridotta, fonastenia; nelle tireotossicosi può essere presente anche tremore voca-
le.
Nella fase premestruale l’iperestrogenismo determina lieve edema delle corde
vocali e congestione vascolare con abbassamento della Fo, riduzione della tessitura
verso le note acute, voce leggermente rauca, riduzione delle armoniche, fonastenia;
la dismenorrea può rendere difficoltoso, a causa del dolore, l’utilizzo del diafram-
ma e della muscolatura addominale; in gravidanza si verificano: edema delle corde
vocali per ritenzione idrica, ridotta funzione del diaframma e dei muscoli addomi-
Inquadramento delle disfonie 107

nali dal 4° mese, talvolta reflussi gastro-esofagei; in menopausa vi è abbassamento


della Fo, riduzione della tessitura verso le note acute, riduzione della intensità vo-
cale, fonastenia. Tutte queste modificazioni della vita sessuale femminile sono rile-
vanti dal punto di vista sintomatologico soprattutto sulle voci artistiche.
Nell’iperpituitarismo l’aumento del GH oltre ad acromegalia determina ingros-
samento delle cartilagini laringee e delle corde vocali con abbassamento della Fo e
voce rauca.
Negli ipogonadismi nel maschio (castrazione prepuberale, criptorchidismo, S.
di Klinefelter, S. di Fröhlich, sviluppo sessuale ritardato) o negli iperestrogenismi
prepuberali per tumori femminilizzanti del surrene o del testicolo il ridotto svilup-
po della laringe determina persistenza di voce infantile con Fo elevata.
Nell’iperandrogenismo nella femmina per tumori virilizzanti del surrene o del-
l’ovaio in fase prepuberale si verifica una muta vocale eterosessuale più o meno an-
ticipata, dopo la pubertà androfonia.
Nell’andropausa osserviamo innalzamento della fo, riduzione della tessitura
verso le note gravi, riduzione della intensità vocale, fonastenia.
Nel diabete può verificarsi secchezza della mucosa con conseguente xerofonia
(per ridotta ondulazione mucosa) (nei casi con grave neuropatia l’ipotrofia musco-
lare determina insufficienza glottica con voce soffiata, riduzione della tessitura e fo-
nastenia.
10 – Il deposito di amiloide, di lipidi o di mucopolisaccaridi nella laringe può
presentarsi come forma localizzata dando origine ad una neoformazione nodulare
(precontatto) responsabile di insufficienza glottica o come infiltrazione diffusa del-
lo spazio di Rainke (incremento della massa delle corde vocali e rigidità vibratoria)
responsabile di una riduzione di Fo e di voce rauca.
11 – Vi sono, talvolta, situazioni in cui la frequenza fondamentale della voce è
inadeguata al fenotipo sessuale; un’inappropriata altezza tonale su base organica,
escluse le cause ormonali o altre patologie già prese in considerazione (sinechie e
monoplegie nel maschio) si verifica negli individui che si sono sottoposti a cambio
di sesso perché la terapia ormonale postpuberale non modifica lo scheletro laringeo
e di conseguenza la lunghezza delle corde vocali rimane immodificata.
12 – Alcune alterazioni del vocal tract hanno un impatto sulle caratteristiche
timbriche della voce: patologie ostruttive delle fosse nasali, dei seni paranasali e del
rinofaringe determinano una diminuzione delle risonanze nasali (iporinofonia) men-
tre una insufficienza velo-faringea un aumento delle stesse (iperrinofonia); una ri-
duzione del volume aereo delle cavità sopraglottiche per ipertrofia tonsillare,
neoformazioni dell’orofaringe e/o ipofaringe e del vestibolo laringeo influenzano la
componente armonica del prodotto vocale; abbondanti secrezioni catarrali, «verni-
ciando» rino-oro-ipofaringe, modificano le capacità di risonanza delle pareti muco-
se.

DISFONIE DISFUNZIONALI

Le disfonie non organiche o disfunzionali 19 33 30 3 21 35 23 28 27 2 4 26 31 definite nel-


la recente classificazione di Rosen e Murry 14 muscolo-tensive si possono distin-

III
108 G. Bergamini et al.

guere in due gruppi fondamentali: le forme primarie o disfonie da sovraccarico


vocale 31 e le forme secondarie determinate da una situazione patologica preesi-
stente di natura psichica (disfonie psicogene) od organica (Tab. II).
I meccanismi patogenetici che stanno alla base di queste disfonie sono atteggia-
menti posturali patologici della muscolatura laringea intrinseca e/o estrinseca, l’uti-
lizzo non corretto del mantice polmonare, comportamenti pneumo-fonatori e fono-
resonanziali inadeguati, posture scorrette; la identificazione di tutte queste situazio-
ni, peraltro, è essenziale per una corretta ed efficace terapia logopedica.
Si riscontrano sei principali tipi 17 di posture patologiche della muscolatura la-
ringea intrinseca:
I) ipercontrazione globale o isometrica: tutti i muscoli laringei intrinseci sono
ipertonici ma soprattutto il muscolo crico-aritenoideo posteriore che in fo-
nazione dovrebbe essere rilassato con conseguente comparsa del triangolo
posteriore (Fig. 2);
II) ipercontrazione e/o iperadduzione laterale: l’affrontamento glottico è iper-
tonico su tutta la lunghezza della corda con una ipercontrazione e protru-
sione delle bande ventricolari (Fig. 3) che, in certi casi di insufficienza glot-
tica organica, possono giungere a contatto fra loro (Fig. 4);
III) contrazione antero-posteriore della sopraglottide: aumento di tono dei mu-
scoli vocali con basculamento in avanti delle aritenoidi ed indietro dell’epi-
glottide (Fig. 5);
IV) adduzione incompleta in fonazione (Fig. 6);
V) ipotonia dei tiro-aritenoidei (Fig. 7) con conseguente glottide ovalare;
VI) iperadduzione della glottide posteriore (Fig. 8).
La contrattura della muscolatura laringea estrinseca influenza soprattutto la
componente frequenziale della voce: l’ipercontrazione globale determina un blocco
dei meccanismi di escursione verticale della cartilagine tiroidea, l’ipertono isolato
dei muscoli tiro-ioidei innalza la laringe, quella degli sterno-tiroidei la blocca verso
il basso.
Le alterazioni respiratorie possono essere quantitative (respirazione superficia-
le od inadeguata alla situazione fonatoria) e qualitative (respirazione costale supe-
riore che, a differenza della respirazione costo-diaframmatica, non consente un ade-
guato rifornimento volumetrico e delega la regolazione del flusso espiratorio alla la-
ringe con conseguente ipertonicità dei muscoli intrinseci).
L’incoordinazione pneumofonica si verifica con varie modalità: l’inizio della
fonazione non corrisponde all’inizio della fase espiratoria; l’attacco vocale è brusco
e la curva di intensità sale perpendicolarmente; non vi è coordinazione fra pause fo-
natorie e rifornimento d’aria; le pause respiratorie sono insufficienti perché il pa-
ziente ha una eccessiva velocità di eloquio; la fonazione prosegue, senza riforni-
mento di aria, fino alla «voce in apnea».
I principali meccanismi di incoordinazione fono-resonanziale che possono alte-
rare le caratteristiche dinamiche del timbro vocale rendendolo inadeguato al conte-
sto d’uso sono: insufficienza velare, ipertono dei costrittori faringei con diminuzio-
ne del volume dei risuonatori, articolazione a bocca chiusa, escursione inadeguata
della laringe durante la fonazione con voce a frequenza eccessivamente grave od
acuta e/o tessitura vocale limitata.
Inquadramento delle disfonie 109

Fig. 2. Fig. 3.

Fig. 4. Fig. 5.

Fig. 6. Fig. 7.

Fig. 8.

III
110 G. Bergamini et al.

Una postura corporea scorretta si ripercuote principalmente sulla funzionalità


respiratoria: la perdita di verticalità del tronco con accentuazione della cifosi dorsa-
le e comparsa di una lordosi cervicale determina una diminuzione di ampiezza dei
movimenti diaframmatici ed una perdita di appoggio per i muscoli espiratori.
Presupposto per l’insorgenza delle forme primarie sono le numerose situazioni
di «surmenage» e «malmenage» vocale che si verificano per cause ambientali, esi-
genze professionali o, come accade spesso nei bambini, motivi di gioco, per perio-
di molto protratti e per durate quotidiane più o meno lunghe. Il carico vocale supe-
riore alla gestibilità ordinaria (eccessive ore di insegnamento o di uso vocale quoti-
diano, attività lavorativa che richiede il frequente utilizzo della voce in ambienti ru-
morosi, insegnamento in ambiente con rumore vocale di fondo con caratteristiche
frequenziali sovrapponibili a quelle del docente, fonazione durante un’attività fisi-
ca, prestazione artistica senza una corretta tecnica vocale e/o con repertorio inade-
guato, intensità vocale costantemente elevata) viene supportato da compensi fona-
tori che si realizzano per un intervento della muscolatura laringea intrinseca ed
estrinseca. Una tecnica respiratoria non adeguata, atteggiamenti posturali non cor-
retti, esposizione a fattori irritanti o situazioni flogistiche laringee, oltre a favorire
l’insorgere del comportamento muscolo-tensivo diventano poi condizioni che deter-
minano la cronicizzazione e il progressivo aggravamento del disturbo.
Un’altra possibile causa di disfunzionalità primaria è la difficoltà alla discrimi-
nazione tonale o il tentativo di imitare modelli vocali che inducono alcuni individui
ad utilizzare una voce con altezza tonale inappropriata alle caratteristiche anatomi-
che della laringe; più frequentemente si assiste all’utilizzo di una voce eccessiva-
mente grave (sindrome di «Bogart-Bacall» nel maschio, androfonia nella femmina).
Nelle forme secondarie psicogene l’atteggiamento muscolo-tensivo e le even-
tuali alterazioni funzionali del mantice rappresentano una risposta a conflitti psico-
emozionali.
I principali quadri sono: l’afonia-disfonia da conversione, la disfonia della mu-
ta vocale e la disfonia nelle sindromi depressive.
Il disturbo da conversione, che si presenta con netta prevalenza nelle donne, è
uno dei due quadri nei quali nel DSM IV è stata suddivisa la nevrosi isterica ed è un
meccanismo psicodinamico di difesa caratterizzato dallo spostamento inconscio
dell’ansia dalla sfera mentale a quella somatica. I sintomi compaiono di solito in oc-
casione di una situazione conflittuale o di stress e offrono all’individuo il vantaggio
di mantenere il conflitto senza viverlo come sofferenza psichica e la possibilità di
evitare situazioni spiacevoli e/o di attirare l’attenzione delle persone circostanti. Il
disturbo è quasi sempre caratterizzato da afonia, specialmente negli adolescenti, con
insorgenza improvvisa e spesso altrettanto rapida risoluzione spontanea; talvolta
nell’adulto esso si manifesta con una disfonia (voce soffiata o rauca con cadute in
falsetto e interruzioni di sonorità) che può alternarsi a fasi di voce perfettamente
normale e di afonia. Le corde vocali hanno una motilità ed una adduzione perfetta-
mente normale nella tosse o nella risata che risultano acusticamente normali ma pre-
sentano una adduzione incompleta (tipo IV) nel tentativo di fonazione volontaria
che è quindi priva di sonorità.
Un singolare disturbo è il vocal cord dysfunction che presenta come sintomo
principale una adduzione paradossa delle corde vocali in inspirazione e talvolta an-
Inquadramento delle disfonie 111

che in espirazione (forma bifasica) che insorge improvvisamente ed in modo altret-


tanto rapido si risolve. Talvolta si associa a disturbi vocali e/o a segni laringoscopi-
ci in fase critica o intercritica compatibili con un atteggiamento laringeo ipercineti-
co e ciò ne giustifica l’inserimento in un «catalogo» delle disfonie. L’ipotesi pato-
genetica più accreditata è che si tratti di un disturbo da conversione la cui sintoma-
tologia può essere innescata da fattori scatenanti quali: situazioni emozionali stres-
santi, reflusso gastro-esofageo, secrezioni retronasali, esercizio fisico intenso, sti-
moli olfattori, esposizioni a sostanze irritanti.
Nel maschio la muta vocale, nel corso della quale la frequenza fondamentale in
breve tempo si aggrava di circa una ottava per l’accrescimento della laringe, è una
delle modificazioni più rilevanti che si verificano nell’adolescenza. Questo cambia-
mento può generare, nel caso di immaturità ed insicurezza psichica un conflitto in-
nescato dal timore di dover abbandonare altrettanto rapidamente la condizione ras-
sicurante e protetta dell’infanzia per assumere un nuovo ruolo, a cui l’individuo non
si sente ancora pronto, caratterizzato da una maggiore indipendenza ed autonomia.
Spesso il contesto familiare che in modo più o meno manifesto inibisce il processo
di emancipazione caratteristico di questo passaggio dall’età infantile a quella adul-
ta, esercita un ruolo favorente l’insorgenza del disturbo. Nella femmina, in cui l’ag-
gravamento tonale è molto più limitato ed è una delle modificazioni fisiche meno
evidenti, questo tipo di disturbo è rarissimo.
Questa disfonia «di rifugio» si verifica per una inibizione delle modificazioni
frequenziali della voce e si manifesta con varie modalità: la muta con voce di fal-
setto, la muta incompleta, la muta prolungata. Nella muta in falsetto la frequenza
fondamentale è molto elevata (200-250 Hz); la laringe, costantemente innalzata ver-
so l’osso ioide, presenta un iperadduzione glottica specialmente della parte cartila-
ginea (tipo VI) con vibrazione limitata alla porzione anteriore della glottide mem-
branosa. La trazione verso il basso della cartilagine tiroide consente un aggrava-
mento della fondamentale ed il passaggio ad una fonazione con registro modale.
Nella muta incompleta la modificazione frequenziale è parziale, la voce può essere
soffiata o leggermente rauca, instabile e talvolta è presente fonastenia. L’obiettività,
caratterizzata il più delle volte da una insufficienza glottica posteriore (tipo I) o leg-
germente ovalare (tipo V). La diagnosi, non sempre agevole, è in genere orientata
dall’anamnesi che consente di far risalire il disturbo all’epoca della muta vocale ma
richiede una diagnosi differenziale con una disfonia muscolo-tensiva primaria o una
disfonia da « vergeture». La muta si definisce prolungata quando la voce mantiene
le caratteristiche di instabilità con passaggio da note gravi a note acute oltre i limi-
ti di tempo fisiologici.
Nella depressione, specie se di entità medio-grave, la disfonia ha caratteristiche
di tipo «ipocinetico»:la glottide è ovalare (tipo V), la frequenza fondamentale tende
ad innalzarsi nel maschio e ad abbassarsi nella femmina, l’intensità della voce è de-
bole, la prosodia si riduce e la risonanza è talvolta faringea o nasale.
Un particolare tipo di disturbo è costituito dalle disfonie muscolo-tensive se-
condarie ad una laringopatia organica, che sono tentativi spesso inadeguati e a lun-
go andare controproducenti di compensare situazioni di insufficienza glottica e/o di
difetto vibratorio attraverso una iperattivazione muscolare finalizzata a migliorare il
compenso e/o aumentare la pressione sottoglottica; possono inoltre insorgere nel ca-

III
112 G. Bergamini et al.

so di ipoacusia neurosensoriale per il venir meno del controllo audio-fonatorio (for-


me audiogene).

BIBLIOGRAFIA
1
Accordi M, Croatto Accordi D. Modificazioni vocali nella senescenza. Acta Phon Lat 1993;15:78-
83.
2
Accordi M. Disfonie funzionali. In: Motta G, Cesari U, eds. Disfonie e disodie. Milano: Simposi
Scientifici Formenti 1999:61-7.
3
Aronson AE. Clinical Voice Disorders. An Interdisciplinary Approach. New York: Thieme Medical
Publishers 1980.
4
Asprella Limonati G, Minnini G. Il disturbo di voce come sintomo di disagio psichico nell’adole-
scenza. Acta Phon Lat 2000;22:43-60.
5
Bergamini G, Luppi MP, Dallari S, Kokash F, Romani U. La rieducazione logopedia dei granulo-
mi laringei. Acta Otorhinol Ital 1995;15:375-82.
6
Blitzer A, Brin MF, Sasaki CT, Fahan S, Harris KS. Neurologic disorders of the larynx. New York:
Thieme Medical Publishers 1992.
7
Bouchayer M, Cornut G. Les vergetures des cordes vocales. Revue Laryng 1984;105:421-3.
8
Bouchayer M, Cornut G, Witzing E, Loire R, Roch JB, Bastian R. Epidermoid cysts, sulci and mu-
cosal bridges of the true vocal cord. Laryngoscope 1985;95:1087-94.
9
Cesari U, Motta S, Varricchio AM. Classificazione e criteri diagnostici. In: Motta G, Cesari U, eds.
Disfonie e disodie. Milano: Simposi Scientifici Formenti 1999:47-59.
10
François M. Papillomatose Laringée. Encycl Méd Chir Oto-rhino-laryngologie. Paris: Elsevier
2000:20-705-A-10, 8p.
11
Haguenauer JP, Pignat JC. Les laryngites chroniques. Encycl Méd Chir Oto-rhino-laryngologie.
Paris: Elsevier 1989:20-645-C-10, 7p.
12
Hartl DM, Brasnu D. Les paralysies récurrentielles: connaisances actuelles et traitements. Ann
Otolaryngol Chir Cervicofac 2000;117:60-84.
13
Hochman I, Sataloff RT, Hillman RE, Zeitels SM. Ectasias and varices of the vocal fold: clearing
the striking zone. Ann Otol Rhinol Laringol 1999;108:10-6.
14
Lefebre JL, Pignat JC, Chevalier D. Cancer du larynx. Encycl Méd Chir Oto-rhino-laryngologie.
Paris: Elsevier 1993:20-710-A-10, 24p.
15
Mamelle G, Domenge C, Bretagne E. Réinsertion et surveillance médicale du laryngectomisé.
Encycl Méd Chir Oto-rhino-laryngologie. Paris: Elsevier 1998:20-710-A-30, 8p.
16
Milutinovic Z. Classification of Voice Pathology. Folia Phoniatr Logoped 1966;48:301- 8.
17
Morrison MD, Rammage LA. Muscle Misure Voice Disorders: Description and Classification. Ac-
ta Otolaryngol 1993;113:428-34.
18
Ottaviani A. Laringe. In: Alaimo E. Otorinolaringoiatria. Padova: Piccin 1988:497-631.
19
Perello J. Dysphonies fonctionnelles: phonoponose et phononevrose. Folia Phoniat Logoped
1962;14:150-205.
20
Périé S, Moine A, Lucau St Guily J. Tumeurs benignes du larynx. Encycl Méd Chir Oto-rhino-
laryngologie. Paris: Elsevier 1996:20-700-A-10, 6p.
21
Remacle M, Lawson G. Troubles fonctionelle du larynx. Encycl Méd Chir Oto-rhino-laryngologie.
Paris: Elsevier 1994:20-690-A-10, 10p.
22
Remacle M, Lawson G. Paralysies laryngées. Encycl Méd Chir Oto-rhino-laryngologie. Paris: El-
sevier 1998:20-645-A-10, 14p.
23
Robert D, Danoy MC, Thomassin JM. Traumatismes vocaux. Encycl Méd Chir Oto-rhino-laryn-
gologie. Paris: Elsevier 1995:20-720-A-40, 7p.
24
Roch JB, Bouchayer M, Cornut G. Le sulcus des cordes vocales. J.F.O.R.L. 1993;42:138-44.
25
Rosen AC, Murry T. Nomenclature of voice disorders and vocal pathology. In: Rosen AC, Murry
T, eds. The Otolaryngologic Clinics of North America (Voice Disorders and Phonosurgery II). Phi-
ladelphia: W.B. Saunders Co. 2000:1035-46.
Inquadramento delle disfonie 113

26
Salimbeni C, Coscarelli S, Santoro R, Esposito R, Salimbeni N. Voce e linguaggio nella depres-
sione. Acta Phon Lat 2000;22:24-34.
27
Sarfati J. Dysphonie Dysfonctionelles. Encycl Méd Chir Oto-rhino-laryngologie. Paris: Elsevier
1998:20-752-A-15, 10p.
28
Sataloff RT. Professional voice. The Science and Art of Clinical Care. Second Edition San Diego:
Singular Publiscing Group, Inc. 1997.
29
Schindler A, Gilardone M, Spadola Bisetti M, Di Rosa R, Ottaviani F, Schindler O. L’esame obiet-
tivo nella sindrome disfonica. Acta Phon Lat 2000;22:355-63.
30
Schindler O. Afonie e disfonie In: Breviario della patologia della comunicazione. Torino: Edizioni
Omega 1980:51-106.
31
Schindler O, Casolino D, Ricci Maccarini A, Schindler A. Le disfonie. In: Novartis Ed. Review di
Autovalutazione in ORL. Milano: UTET 2000:2/1-14.
32
Schulz P, Dadashi R, Debry C. Laryngites aigües de l’adulte. Encycl Méd Chir Oto-rhino-laryn-
gologie. Paris: Elsevier 2001:20-645-A-10, 4p.
33
Segre R. La comunicazione orale normale e patologica. Torino: Edizioni Medico Scientifiche
1976.
34
Thomassin JM, Epron JP, Robert D. Kystes du larynx et laryngoceles. Encycl Méd Chir Oto-rhino-
laryngologie. Paris: Elsevier 1996:20-695-A-10, 5p.
35
Ursino F. Le disfonie. In: Schindler O, Genovese E, Rossi M, Ursino F, eds. Foniatria. Milano:
Masson 1995:81-155.
36
Zanaret M, Gras R, Bonnefille E. Syphilis laryngée. Encycl Méd Chir Oto-rhino-laryngologie. Pa-
ris: Elsevier 1992:20-646-A-10, 3p.
37
Zanaret M, Giovanni A, Bouquet O. Tubercolose Laryngée. Encycl Méd Chir Oto-rhino-laryngo-
logie. Paris: Elsevier 1992:20-646-B-10, 9p.

III
B
IV. INDAGINI CLINICO-STRUMENTALI NELLE DISFONIE

IV
B
L’anamnesi e l’esame obiettivo laringeo 117

IV.1. L’ANAMNESI E L’ESAME OBIETTIVO LARINGEO

M. Accordi, F. Tesserin

Il primo approccio ad un paziente che presenta una patologia della voce è rap-
presentato dall’anamnesi e dall’esame obiettivo e semeiologico degli organi inte-
ressati nella fonazione.
La raccolta delle notizie anamnestiche avviene, generalmente, al primo incontro
tra il paziente ed il medico ed ha un’importanza basilare sul piano psicologico. Da
esso dipenderà il coinvolgimento del paziente nel suo trattamento e, di conseguen-
za, la riuscita dello stesso. Solo una metodologia corretta, associata alla capacità di
penetrare nella psiche del paziente, renderà possibile la sintesi diagnostica.
Si tratta, in sostanza, di individuare i deficit e le turbe del comportamento fona-
torio, di comprenderne il meccanismo e di apprezzarne i diversi fattori etiologici in
causa, in modo da poter programmare una terapia e stabilire una prognosi.
Essendo i criteri di «normalità della voce» non facilmente oggettivabili, se si
escludono naturalmente alcuni caratteri acustici della stessa, e, variando la qualità
della voce a volte in maniera considerevole a seconda che sia emessa in una o in
un’altra situazione, sarebbe importante non limitarsi all’apprezzamento della sola
voce di conversazione ma esaminarla anche in altre situazioni della vita quotidiana.
L’esame della voce «proiettata» (ed in particolare della voce di richiamo) e della vo-
ce cantata aiuterà senz’altro in questo senso.
È necessario, inoltre, comprendere come il paziente «vive» la sua fonazione e
ciò è possibile solo esaminando il comportamento fonatorio generale del paziente e
l’importanza che egli dà alla sua fonazione nella vita sociale e professionale ed alle
esigenze ed aspettative che ha nei confronti della propria voce.

ANAMNESI

Per anamnesi si intende la raccolta dettagliata a scopo clinico-diagnostico di tut-


te le notizie sulla vita del paziente, nonché dei suoi ascendenti, e su abitudini e pa-
tologie pregresse che possano essere messe in relazione con l’inizio e con il decor-
so della malattia che porta il paziente a richiedere l’aiuto del medico.
Questo, in sede di prima visita, darà solo inizio alla raccolta di informazioni ne-
cessarie ad inquadrare il paziente e la sua patologia. Ulteriori importanti informa-
zioni emergeranno infatti dai colloqui che il paziente avrà con la logopedista duran-

Centro Medico-Chirurgico di Foniatria, Padova

IV.
1
118 M. Accordi et al.

te il periodo di riabilitazione. Con essa infatti si instaura, generalmente, un rappor-


to più confidenziale, che permette di mettere in evidenza particolari che possono ini-
zialmente sfuggire.
Sarà opportuno iniziare con domande che concernono la storia delle turbe pre-
sentate dal paziente quali il motivo della richiesta di visita e trattamento; da quanto
tempo presenta disturbi della voce; se ha già avuto problemi di voce; se la sua voce
è mai stata completamente normale ed in quali circostanze sono iniziati i problemi:
in seguito ad affezioni di interesse ORL, dopo un’influenza o un «colpo di freddo»,
nel corso di un periodo di affaticamento o strapazzo, in seguito a problemi di lavo-
ro o familiari, dopo un intervento chirurgico od un incidente.
Importante sarà sapere come è comparso e come si è evoluto il disturbo: se im-
provvisamente, gradualmente o episodicamente, se è rimasto stabile, se è ingrave-
scente, intermittente o è migliorato 1.
Eventuali trattamenti già seguiti dal paziente andranno annotati: terapia farma-
cologica, interventi chirurgici, trattamenti psicologici, riabilitazione logopedica. Per
ognuno di questi andrà annotato il tipo di trattamento effettuato, quando sono stati
eseguiti, per quanto tempo e con che esito.
Nella donna vanno annotate eventuali terapie ormonali, l’assunzione di anti-
concezionali orali, le caratteristiche del ciclo mestruale e l’eventuale menopausa 2.
Importante sarà evidenziare un’eventuale familiarità per i disturbi della voce,
ponendo l’attenzione su un’eventuale abitudine ad un abuso od un mal uso vocale o
se vi è una familiarità per malformazioni quali ad es. il sulcus vocale.
Particolare cura è necessaria nell’annotare i sintomi soggettivi descritti dal pa-
ziente poiché è alla loro scomparsa che egli percepirà la propria guarigione. Questi
possono essere suddivisi in 2:

A. Sensazioni soggettive concernenti la fonazione


È importante ciò che il paziente pensa della propria voce e delle sue possibilità
vocali. Importante sarà rilevare informazioni concernenti:
• il timbro (voce fioca, rauca, faticosa, sgradevole, «non bella»);
• l’intensità e la resistenza (affaticamento vocale, assenza di potenza, difficoltà
nel parlare con rumore di fondo, al telefono o nel chiamare qualcuno da lon-
tano);
• l’altezza tonale (la voce sembra al paziente troppo acuta, troppo grave, irre-
golare, ha difficoltà nel canto).

B. Sensazioni soggettive rilevate a livello dell’organo vocale


• sensazione di corpo estraneo in gola;
• impressione di carenza d’efficacia (necessità di sforzo);
• pizzicore, irritazione a livello laringeo, parestesie faringo-laringee/dolore;
• dolore o stiramento a livello del collo;
• oppressione respiratoria;
• affaticamento generale durante la fonazione;
• necessità di raschiare spesso;
• nessun sintomo particolare.
L’anamnesi e l’esame obiettivo laringeo 119

Importante è valutare come variano i sintomi riferiti dal paziente:


• con l’uso della voce;
• a seconda dell’ora del giorno;
• in concomitanza con fatti infiammatori delle alte vie aeree (riniti, faringiti, si-
nusiti);
• con il clima o il tempo;
• in condizioni di stress, ansia, preoccupazioni;
• durante la giornata (la voce peggiora – migliora – è stabile).
Altre informazioni importanti riguardano le abitudini di vita, il temperamen-
to ed eventuali patologie non strettamente legate a problemi di voce 2:
• L’uso sociale della voce:
il paziente parla a voce alta – bassa – forte – piano, il suo eloquio è veloce – len-
to, parla a lungo, sussurra – grida.
• L’utilizzo della voce per uso professionale:
che professione svolge, per quante ore lavora al giorno, parla di seguito o con
intervalli, sta in piedi o seduto, grida. Parla a lungo in pubblico o canta a livello di-
lettantistico o professionale. In quest’ultimo caso è importante conoscere il tipo di
repertorio eseguito.
• Notizie sull’ambiente professionale e sociale:
lavora o vive in ambiente fumoso, molto secco, con aria condizionata o con ri-
scaldamento ad aria, con inquinamento chimico, in ambiente rumoroso, polveroso,
in contatto con vapori di sostanze tossiche. Oppure svolge un lavoro particolarmen-
te faticoso
• Abitudini di vita:
Il paziente fuma (quante sigarette al dì), ha smesso (da quanto tempo), consuma
alcool (quantità), caffè, stupefacenti (cocaina), ha difficoltà a riposare (alterazioni
del ritmo sonno-veglia).
• Carattere del paziente:
è ansioso, nervoso, «preoccupato», tranquillo, particolarmente stressato.
• Molte patologie concomitanti possono avere una relazione con i disturbi del-
la voce lamentati dal paziente 2 3:
• Allergie e malattie infiammatorie delle alte vie respiratorie che provocano ir-
ritazione ed alterazioni della secrezione mucosa. La tosse e la necessità di
schiarirsi la voce che ad esse sono spesso associate inoltre, costituiscono un
trauma per le corde vocali;
• malattie polmonari che provochino alterazioni a livello ventilatorio polmona-
re (asma, enfisema, bronchite cronica etc.);
• malattie gastrointestinali ed in particolare il reflusso gastro-esofageo che pro-
voca un’irritazione cronica della mucosa delle aritenoidi fino alla formazione
di granulomi;
• patologie di pertinenza neurologica (miastenia grave, sclerosi multipla, mor-
bo di Parkinson, neoplasie del sistema nervoso centrale, disfonia spasmodica)
e psichiatrica (disfonia isterica);
• patologie di pertinenza endocrinologica o metabolica tali da richiedere tratta-
menti ormonali o anabolizzanti e la cui azione sia netta sulla voce: patologie
della tiroide (in particolare l’ipotiroidismo per le alterazioni che provoca a li-

IV.
1
120 M. Accordi et al.

vello della mucosa – mixedema), turbe ginecologiche (alterazioni ormonali ad


esse correlate, irregolarità del ciclo mestruale, menopausa, gravidanza); ma-
lattie reumatiche; turbe della nutrizione (obesità, diabete);
• malattie ed interventi chirurgici che abbiano lasciato sequele: tiroidectomia ed
altri interventi sul collo, interventi di chirurgia addominale o toracica che pro-
vochino difficoltà respiratoria; l’intubazione specie se prolungata.
• uso di farmaci 3 che possono avere effetti collaterali tali da provocare un peg-
gioramento della voce. Molti di questi sono farmaci che vengono utilizzati per
patologie delle alte vie respiratorie ed agiscono negativamente a livello larin-
geo provocando una riduzione della idratazione e della lubrificazione della mu-
cosa. Tra questi i più usati sono i farmaci antistaminici, che provocano una di-
minuzione delle secrezioni, i simpaticomimetici (decongestionanti) che provo-
cano una riduzione dell’apporto ematico alla mucosa e delle secrezioni. I far-
maci antitussigeni che agiscono a livello centrale, generalmente derivati del-
l’oppio (es. codeina) agiscono ugualmente provocando una sensazione di sec-
chezza a livello del vocal tract; gli antitussigeni ad azione periferica sembrano
invece non avere azioni negative. Altri farmaci che possono provocare un peg-
gioramento della voce sono alcuni antiipertensivi quali i diuretici tiazidici e la
furosemide che provocano una riduzione dell’idratazione, mentre gli ACE-ini-
bitori sembrano non avere questo effetto. Alcuni antiipertensivi tra i cui effetti
collaterali è descritta la comparsa di tosse stizzosa possono invece provocare,
indirettamente un trauma cronico a livello cordale. Farmaci ad azione psico-
tropa possono avere considerevoli effetti sulla voce. Alcuni mediante il già de-
scritto meccanismo della riduzione dell’idratazione, altri provocando occasio-
nalmente tremore a livello muscolare laringeo, altri ancora agendo direttamen-
te a livello del SNC. Gli anticolinergici (utilizzati per ridurre la peristalsi inte-
stinale) provocano ugualmente secchezza della mucosa delle alte vie respirato-
rie, come pure alcune vitamine quali la vitamina C e la vitamina A. Fra i far-
maci che maggiormente influenzano la voce vi sono poi gli ormoni. Nella don-
na l’uso di androgeni per patologie quali ad esempio l’endometriosi e la ma-
stopatia fibrocistica, provocano una mascolinizzazione della voce. Non sono
riportati casi di significative alterazioni della voce provocate dall’uso di con-
traccettivi orali. Nell’uomo l’uso di estrogeni nella terapia di alcuni tumori del-
la prostata provoca una femminilizzazione della voce.
Importante è l’autovalutazione del disturbo vocale:
• come il paziente valuta la propria voce;
• di che entità valuta il suo handicap vocale.
A questo proposito è senz’altro utile sottoporre il paziente ad un questionario
di autovalutazione 4 quale quello proposto da Jacobson et al. nel 1997.
Questo si compone di 30 domande suddivise in tre aree: fisica (P), emotiva (E)
e funzionale (F) e permette una valutazione degli aspetti sui quali il paziente desi-
dera maggiormente un intervento.
L’anamnesi e l’esame obiettivo laringeo 121

ESAME OBIETTIVO

L’esame obiettivo del paziente disfonico comprende, a prescindere dall’utilizzo


di qualsiasi strumento, l’esame di tutti gli organi ed apparati che sono coinvolti nel-
la fonazione e cioè: il sistema respiratorio, le corde vocali ed il vocal-tract oltre che
degli altri distretti di pertinenza otorinolaringoiatrica quali orecchio, naso, cavità
orale e faringea, collo.
Secondo i fondamenti della semeiotica, quattro sono i momenti fondamentali
dell’esame obiettivo: l’ispezione, la palpazione, la percussione e l’auscultazione.
L’ispezione deve iniziare dall’osservazione delle caratteristiche comportamen-
tali (personalità ansiose, depresse, iperattive, spavalde etc.), condizioni psicologiche
che, influenzando l’atteggiamento posturale, sono di conseguenza causa di atteggia-
menti vocali non corretti. Basti pensare alla differenza fra l’aspetto posturale di un
paziente affetto da disfonia ipocinetica rispetto a quello di un paziente con disfonia
ipercinetica.
Alcune caratteristiche fisiche possono poi influenzare la meccanica respiratoria:
la conformazione del torace, l’obesità, la gigantomastia).
Un’otoscopia ed una valutazione audiometrica metteranno in evidenza un’even-
tuale perdita uditiva che può giustificare un uso non appropriato della voce.
L’esplorazione delle cavità nasale e rinofaringea potrà evidenziare un’ostruzio-
ne anteriore o posteriore.
Nell’esame della cavità orale e orofaringea particolare attenzione andrà posta
sulla presenza di una ipertrofia tonsillare e dei tessuti linfatici, su eventuali fatti in-
fiammatori cronici, sulla secrezione salivare (xerostomia), sull’occlusione.
L’esame del collo potrà rivelare la presenza di masse, di cicatrici da pregressi
interventi o traumi, di tensioni muscolari durante l’eloquio spontaneo.
A livello degli organi impegnati nell’articolazione si valuterà la fluidità o rigi-
dità di organi quali le labbra, le guance, la lingua, i muscoli masseteri.
Completa l’ispezione generale del paziente disfonico la valutazione della coor-
dinazione pneumofonoarticolatoria.
La palpazione dell’apparato respiratorio ci permette di valutare la respirazione
nei suoi quattro aspetti: 1) respirazione diaframmatico-addominale, 2) costo-dia-
frammatica, 3) sterno-costale e 4) apicale.
Dalla palpazione dell’oscillatore si potranno ricavare dati così importanti da es-
sere patognomonici di alcune patologie. In particolare la palpazione sarà in grado di
mettere in evidenza la presenza di tensioni muscolari laringee. Si valuterà la mu-
scolatura laringea estrinseca sia in fonazione che a riposo. Partendo dall’alto si va-
luterà la muscolatura sovraioidea (apprezzando la tensione dei mm genioioideo, di-
gastrico e stiloioideo), si esaminerà quindi lo spazio tiroioideo che ci fornirà indi-
cazioni sulla funzionalità del m. cricotiroideo.
È poi possibile valutare il grado di escursione laringea durante la deglutizione e
la mobilità latero-laterale dell’intera laringe.
Di scarsa importanza, nell’esame delle strutture coinvolte nella fonazione, è la
percussione mentre di grande aiuto è l’auscultazione che, poiché valuta il prodot-
to dell’intero sistema vocale, non potrà analizzare separatamente compressore,
oscillatore e risuonatore.

IV.
1
122 M. Accordi et al.

Dal punto di vista terminologico sono in uso diverse definizioni di alterazioni


della voce. Così per RAUCEDINE si intende la percezione legata all’irregolarità del
ciclo vibratorio (per es. nel caso di polipi); con VOCE SOFFIATA viene definita la
voce prodotta da un’incompleta chiusura glottica, mentre per DIPLOFONIA si in-
tende la contemporanea percezione di due altezze tonali. TREMORE e FLUTTER
indicano fluttuazioni regolari della frequenza di vibrazione generalmente dovuti a
disturbi neurologici, mentre nella disfonia spasmodica si hanno alterazioni irregola-
ri della frequenza di vibrazione.
Alcune impressioni percettive sono invece legate ad alterazioni a livello di ri-
suonatore. Alterazioni della risonanza sono più propriamente disturbi di tipo artico-
latorio e non di voce. Essi sono determinati da alterazioni a livello del vocal tract.
Il suono prodotto a livello laringeo può essere assolutamente normale ma la sua per-
cezione, dopo aver interagito con il tratto sovraglottico e le cavità orale rinofaringea
e nasale, risulta anormale.
Si potrà pertanto rilevare la presenza di una voce NASALE che potrà avere le
caratteristiche di una IPERNASALITÀ o di una IPONASALITÀ. L’ipernasalità, più
frequente nei bambini, è causata da un’incompetenza dello sfintere velofaringeo, an-
che conosciuta come insufficienza velofaringea (IVF) ed è caratterizzata dalla pre-
senza di un fuga d’aria nasale durante l’articolazione di alcune consonanti. quali ad
es. «m», «n», «gn», che richiedono per una loro corretta articolazione, la chiusura
dello sfintere velofaringeo. Cause di IVF sono la schisi sottomucosa del velo del pa-
lato, gli esiti di interventi di palatosintesi, la paralisi o l’ipomotilità del velo del pa-
lato, l’intervento di adenoidectomia o adenotonsillectomia qualora preesista una
delle condizioni precedenti. Negli adulti un’IVF è causata principalmente da inter-
venti demolitivi per neoplasie del palato.
L’iponasalità può essere causata da un’ostruzione della cavità nasale sia ante-
riore che posteriore. Nei bambini la causa più frequente è rappresentata dall’iper-
trofia adenoidea. Nell’adulto cause frequenti sono: la deviazione del setto nasale,
l’ipertrofia dei turbinati la poliposi nasale le neoplasie del rinofaringe e delle fosse
nasali, le riniti e le sinusiti.
Altre alterazioni a livello dei risuonatore danno la sensazione di una voce di
FALSA CORDA provocata da un uso fonatorio delle false corde e di voce STROZ-
ZATA da iperfunzione della muscolatura sovraglottica.
Un sistema di semplice applicazione nella valutazione della voce è la scala così
detta GRBAS Hirano, 1981) che prende in esame cinque parametri qualitativi quali:
1. il grado generale di disfonia (G dall’inglese GRADE) cioè il grado di anor-
malità della voce;
2. la raucedine (R da ROUGHNESS) rappresenta l’impressione psicoacustica
dell’irregolarità nella vibrazione delle corde vocali;
3. la voce più o meno soffiata (B da BREATHY) che indica l’estensione di fu-
ga d’aria attraverso la glottide;
4. la voce più o meno astenica (A da ASTHENIC) cioè la debolezza o la man-
canza di forza nella voce che spesso si correla a debole intensità nella sor-
gente glottica e mancanza di armoniche nelle frequenze acute;
5. la voce più o meno strozzata (S da STRAINED) che rappresenta l’impressio-
ne psicoacustica degli stati iperfunzionali di fonazione, caratterizzati da ele-
L’anamnesi e l’esame obiettivo laringeo 123

vata frequenza fondamentale, rumore e ricchezza di armoniche nelle fre-


quenze acute.
Recentemente è stato introdotto un sesto parametro: I dall’inglese INSTABI-
LITY che fornisce indicazioni sulla stabilità nel tempo della funzionalità vocale.
La semplicità e rapidità di applicazione di questo metodo e le sue correlazioni con
indici acustici e stroboscopici, lo rendono uno strumento utile nella pratica quotidiana.
Un altro sistema di semplice applicazione e di estrema utilità è la misurazione
del massimo tempo di fonazione TMF che permette una valutazione quantitativa
anche se molto approssimativa dell’abilità fonatoria.
Infine, un aspetto che può essere valutato percettivamente è l’accoppiamento
compressore-oscillatore, il cosiddetto attacco vocale e cioè il modo in cui iniziano
a vibrare le corde vocali sotto la spinta della corrente aerea polmonare.
Si distinguono sostanzialmente tre tipi di attacco:
1. l’attacco duro: in esso le corde vocali prima si affrontano annullando lo spa-
zio glottico e aumentando così la pressione sottoglottica; solo a questo punto
iniziano i cicli vibratori, il primo dei quali avrà caratteristiche simili allo
scoppio prodotto dalle consonanti occlusive;
2. nell’attacco soffiato le corde vocali sono abdotte e si adducono solo una vol-
ta iniziata l’espirazione. Percettivamente prima del suono laringeo è possibi-
le cogliere un momento di soffiatura;
3. nell’attacco statico le corde vocali si adducono mentre inizia l’espirazione;
percettivamente l’inizio del suono laringeo è istantaneo.
Naturalmente non sarà possibile iniziare alcun trattamento sia esso medico, chi-
rurgico o riabilitativo prima che sia effettuato un accurato esame laringoscopico.
Questo, sia esso eseguito mediante specchietto (laringoscopia indiretta) o me-
diante fibroscopio rigido o flessibile, permette di esaminare:
• le corde vocali vere che appaiono come due nastri di colore bianco perlaceo;
• le corde vocali false, situate a lato delle c.v. vere e su di un piano superiore,
sono normalmente di colore rosato;
• i processi vocali delle cartilagini aritenoidi;
• i legamenti ari-epiglottici;
• i recessi piriformi;
• la pagina laringea dell’epiglottide.
Queste strutture andranno esaminate sia in fonazione che in respirazione.
In fonazione le cv vere appariranno parallele ed accollate (adduzione), le arite-
noidi avvicinate da un movimento di medializzazione e rotazione.
In respirazione le cv vere saranno separate nella loro parte posteriore ed unite a
livello della commissura anteriore (abduzione), le aritenoidi divaricate. La glottide
appare come un triangolo isoscele a base posteriore ed apice anteriore. Nel passag-
gio dalla fonazione alla respirazione e viceversa si apprezzerà la motilità delle cor-
de vocali vere che, normalmente, deve avvenire in modo simmetrico.
La laringoscopia mediante fibroscopio rigido permette l’esecuzione della stro-
boscopia. Questa è di grande utilità poiché con essa è possibile valutare la qualità
dell’avvicinamento delle corde vocali e la localizzazione di eventuali deficit di ac-
collamento; la simmetria o l’assenza dei movimenti vibratori ed ondulatori, l’am-
piezza della vibrazione e la qualità dell’onda mucosa.

IV.
1
124 M. Accordi et al.

BIBLIOGRAFIA
1
Croatto Accordi D, Accordi M. Anamnesi ed esame obiettivo in foniatria. In: Croatto L, (a cura di).
Trattato di foniatria e logopedia. Padova: Ed. La Garangola 1988;9-32.
2
Le Huche F, Allalì A. Patologia vocale: l’esame della voce e del comportamento fonatorio – mo-
dalità d’esame del laringe e del suo comportamento. In: La voce. Ed. Masson 1994;3-35.
3
Rubin JS, Sataloff RT, Korovin GS, Gould WJ Diagnosis and treatment of voice dsorders. New
York-Tokio: Ed. Igaku – Shoin 1995:199-201,237-57.
4
Schindler A, Gilardone M, Spadola Bisetti M, Di Rosa R, Ottaviani F, Schindler O. L’esame obiet-
tivo nella sindrome disfonica. Acta Phon Lat 2000;4:355-63.
La valutazione percettiva della voce 125

IV.2. LA VALUTAZIONE PERCETTIVA DELLA VOCE

A. Ricci Maccarini, F. Ottaviani*, A. Schindler*, D. Casolino

INTRODUZIONE

Come già espresso altrove 4 24 la valutazione clinica della voce si articola in


quattro punti fondamentali: 1) anamnesi ed autovalutazione, 2) valutazione percet-
tiva, 3) valutazione per immagini e 4) analisi elettroacustica. È quindi evidente che
la valutazione percettiva rappresenta un momento che non può essere disatteso e per
il quale si deve disporre di strumenti di sufficiente validità e affidabilità. La valuta-
zione percettiva può essere definita come quell’insieme di procedure che fanno ri-
ferimento alle abilità del clinico indipendentemente da misurazioni strumenta-
li 29. A essa si deve ricorrere ogniqualvolta ci si trovi a valutare la voce di un clien-
te e pertanto deve potersi applicare sia alle condizioni di eufonia (nelle voci parla-
ta, cantata e urlata) sia a quelle di disfonia in tutte le tre categorie prima delineate.
L’utilizzo della valutazione percettiva può essere plurimo: diagnostico; di valuta-
zione; in itinere; come strumento per studi di outcome ed efficacia; come sistema di
comunicazione valida, efficace e ed efficiente fra operatori diversi.
Uno fra i problemi di maggior rilievo nella valutazione percettiva della voce è
la mancanza di una terminologia universalmente accettata. L’origine della attuale
terminologia è da ricondurre ai maestri di eloquenza e di musica che, in assenza di
ausili tecnologici, non potevano far ricorso ad altro che alle proprie abilità uditive;
è così che è nata a una pletora di vocaboli con significato difficile a comprendersi,
ma tuttora utilizzati in ambienti non sanitari. Espressioni quali voce calda, bianca,
scura, brillante, rotonda, coperta, squillante sono di uso corrente, ma il loro valore
semantico è sconosciuto alla maggior parte dei tecnici sanitari 18. Nel tentativo di
fornire una terminologia accettata e condivisibile ed una valutazione descrittiva del-
la voce, sono stati messi a punto protocolli di valutazione come il Buffalo Voice Pro-
file System (BVP), quello della Hammarberg 13, quello di Laver 17 e quello della So-
cietà Giapponese di Foniatria e Logopedia 14. Schemi simili ma di minor diffusione
sono poi quelli elaborati da Wilson 28 e da Wirz 30. La sistematizzazione nella no-
menclatura percettiva è stata da taluni considerata come uno dei maggiori risultati
ottenuti dalla ricerca sulla valutazione clinica della voce 12.

U.O. ORL, Ospedale «M. Bufalini», Cesena


*
IV Clinica Otorinolaringoiatrica, Azienda Ospedaliera, Polo Universitario «L. Sacco», Università di
Milano

IV.
2
126 A. Ricci Maccarini et al.

PROTOCOLLI DI VALUTAZIONE PERCETTIVA

Il Buffalo Voice Profile System (BVP) 28 si propone di fornire criteri e profili su


cui basarsi per valutare i diversi parametri della voce. Dieci sono i profili possibili:
a) profilo di screening vocale, b) profilo di comportamento di gruppo, c) profilo vo-
cale, d) profilo di abuso vocale, e) profilo di ansia vocale, f) profilo sulla risonanza,
g) profilo per le voci di ipoacusici, h) profilo di registrazione vocale, i) profilo di
diagnosi vocale e l) profilo dei progressi del trattamento logopedico.
Il profilo vocale (c) è formato a sua volta da dodici parametri: 1) timbro larin-
geo (soffiato, rauco), 2) altezza tonale (troppo grave, troppo acuta), 3) intensità
(troppo elevata, troppo ridotta), 4) risonanza nasale (ipernasale, iponasale), 5) riso-
nanza orale, 6) supporto respiratorio, 7) muscolatura (tensione elevata o ridotta), 8)
abuso vocale (quantità e grado), 9) frequenza della parola (troppo lenta, troppo ve-
loce), 10) ansietà vocale (quantità e grado), 11) intelligibilità della parola e 12) va-
lutazione complessiva della voce. Per ognuno di questi parametri si fornisce un pun-
teggio di gravità compreso fra 1 (voce nei limiti di norma) e 5 (voce con alterazio-
ne molto grave).
In maniera diversa la Hammarberg 12 13 propone dodici parametri di voci pato-
logiche della comunità linguistica svedese: 1) voce afona, 2) voce soffiata, 3) voce
iperfunzionale, tesa, 4) voce ipofunzionale, lassa, 5) vocal fry, voce gracchiante, 6)
voce rauca, 7) voce con raucedine acuta, 8) voce con rotture, 9) voce diplofonica,
10) registro vocale, 11) altezza tonale e 12) intensità.
L’autrice sottolinea come l’allenamento del clinico a questo tipo di valutazione
sia più efficace se si identificano relazioni fra parametri percettivi e parametrici acu-
stici oggettivi. Nella Tabella I riportiamo le definizioni fornite dall’autrice per ognu-
no dei parametri evidenziati.
Laver 17 cerca di valutare parametri laringei e sopralaringei della qualità vocale.
Lo strumento proposto prende il nome di VPAS (Vocal Profile Analysis Scheme) ed
è diviso in tre sezioni: una prima relativa agli aspetti laringei e sopralaringei, una se-
conda relativa agli aspetti prosodici ed infine una terza sull’organizzazione tempo-
rale.
Nella valutazione laringea e sopralaringea si prendono in considerazione: 1) lo
sfintere labiale (protrusione, apertura, labiodentalizzazione, range di movimento ri-
dotto o eccessivo), 2) i movimenti mandibolari (apertura, chiusura, protrusione, ran-
ge di movimento ridotto o aumentato), 3) l’apice linguale (avanzato, retratto), 4) il
corpo linguale (avanzato, retratto, innalzato, abbassato, range di movimento ridotto
o aumentato), 5) lo sfintere velo-faringeo (nasalizzazione, fuga d’aria nasale udibi-
le, denasalizzazione), 6) la faringe (costrizione), 7) la posizione laringea (innalzata,
abbassata), 8) il tipo di fonazione (rauca, soffiata, gracchiante, in registro pieno, in
registro di falsetto), 9) la tensione sopralaringea (tensione, lassità) e 10) la tensione
laringea (tensione, lassità).
Per quanto riguarda gli aspetti prosodici vengono presi in considerazione: 1)
l’altezza tonale (mediamente acuta o grave, range ridotto o allargato, variabilità al-
ta o bassa); 2) l’intensità (mediamente elevata o abbassata, range ridotto o allarga-
to, variabilità alta o bassa).
La valutazione percettiva della voce 127

Tab. I.
I parametri percettivi vocali individuati dalla Hammarberg e la loro definizione.

Parametri di Definizioni
qualità vocale

Afona/afona La voce è costantemente o in modo intermittente mancante


a intermittenza di fonazione, cioè ci sono momenti di voce sussurrata o di
perdita di voce

Soffiata La voce è prodotta con insufficiente chiusura glottica, le


corde vocali sono in vibrazione, ma in un certo grado
abdotte, cosa che crea un rumore turbolento udibile a
livello glottico

Iperfunzionale/tesa La voce suona strozzata, in relazione a una


compressione/costrizione delle corde vocali e del tubo
laringeo durante la fonazione con insufficiente flusso aereo

Ipofunzionale/lassa Contrariamente a iperfunzionale, è presente un’insufficienza


nella tensione delle corde vocali e nell’attività muscolare
laringea, risultanti in una voce debole

Vocal fry/gracchiante Vibrazione a bassa frequenza aperiodica/periodica, con


corde vocali molto strette fra loro con una sola parte libera di
vibrare; anche noto come registro «pulse»

Rauca Aperiodicità alle basse frequenze, presumibilmente legata a


una qualche forma di vibrazione irregolare delle corde vocali

Scrapiness Aperiodicità alle alte frequenza, presumibilmente legata a


una qualche forma di vibrazione irregolare delle corde vocali

Qualità/altezza La voce fluttua nel tempo per altezza o qualità


vocale instabile

Rotture di voce Rotture intermittenti fra il registro pieno e quello di falsetto

Diplofonie Due altezze tonali possono essere percepite contemporaneamente

Registro pieno/falsetto Modalità fonatoria: il registro pieno è la modalità fonatoria


normale con chiusura glottica in fonazione, rispetto al
falsetto che solitamente è ai livelli maggiori dell’estensione
frequenziale, e risulta in corde vocali allungate e sottili
con piccolo deficit di chiusura glottica

Altezza Il corrispettivo percettivo della frequenza fondamentale

Intensità Il corrispettivo percettivo dell’ampiezza vocale

Infine per gli aspetti temporali si valutano: 1) il supporto respiratorio, 2) la con-


tinuità, 3) la rapidità (veloce o lenta), 4) il ritmo.

IV.
2
128 A. Ricci Maccarini et al.

Tab. II.
Grafico utilizzato per la valutazione percettiva della voce secondo la metodica GIRBAS.

0 1 2 3

G: Grado globale di disfonia

I: grado di Instabilità
della voce

R: grado di voce rauca


(Roughness)

B: grado di voce soffiata


(Breathiness)

A: grado di Astenia
nella voce

S: grado di voce pressata


(Strain)

Legenda: 0: nella norma; 1: alterazione lieve; 2: alterazione moderata; 3: alterazione grave.

Per ognuno dei parametri citati si fornisce un punteggio di grado compreso fra
1 (corrispondente a una situazione di neutralità) e 6 (corrispondente al massimo gra-
do di deviazione dalla normalità).
Lo schema proposto da Laver è apprezzabile soprattutto in quanto permette di
analizzare in modo sistematico gli aspetti di risonanza della voce; tuttavia non è in
grado di fornire una terminologia percettiva delle variazioni timbriche imposte dai
movimenti sovralaringei. Attualmente questa mancanza appare come uno dei pro-
blemi di maggior rilevo nella valutazione percettiva della voce.
La scala GRBAS, proposta dal comitato per la funzione fonatoria della Società
Giapponese di Foniatria e Logopedia, ha trovato larga diffusione grazie all’opera di
divulgazione di Hirano 14.
Con questo metodo vengono valutati cinque parametri qualitativi: grado genera-
le di disfonia (G, dall’inglese grade); raucedine (R, dall’inglese roughness); voce più
o meno soffiata (B, dall’inglese breathy); voce più o meno astenica (A, dall’inglese
asthenic); voce più o meno pressata (S, dall’inglese strained). Recentemente è stato
introdotto da Dejonckere il parametro I, indice di instabilità 5; la scala ha quindi ac-
quisito l’acronimo GIRBAS (Tab. II). Per ogni parametro si fornisce un punteggio in
una scala compresa fra 0 e 3, dove 0 rappresenta la condizione eufonica, mentre 1, 2,
e 3 corrispondono a gradi di devianza rispettivamente lieve, moderato e grave.
Per maggior chiarezza è importante sottolineare che con G si indica il grado
globale di alterazione della voce; I è un indice assai importante soprattutto per la
valutazione diacronica della voce ovvero per il giudizio sulla stabilità nel tempo
della funzionalità vocale; R rappresenta l’impressione psico-acustica dell’irrego-
La valutazione percettiva della voce 129

larità nella vibrazione delle corde vocali e può corrispondere a fluttuazioni irre-
golari della frequenza fondamentale o dell’ampiezza dell’onda sonora; B è il pa-
rametro che indica la presenza di fuga d’aria attraverso la glottide (come si può
verificare per esempio in una paralisi cordale in abduzione); A indica debolezza o
mancanza di forza nella voce e di frequente si correla a debole intensità nella sor-
gente glottica con povertà di armoniche nelle frequenze acute (per una ridotta ve-
locità della fase di adduzione glottica durante il ciclo vibratorio); S rappresenta
l’impressione psico-acustica degli stati iperfunzionali di fonazione, caratterizzati
anche da elevata frequenza fondamentale, rumore e ricchezza di armoniche nelle
frequenze acute.
La definizione dei parametri percettivi utilizzati ed i loro correlati elettroacusti-
ci costituiscono punti di particolare interesse per il clinico 3 6 31:
• il parametro R (voce rauca) viene messo in rapporto soprattutto con la pertur-
bazione della frequenza fondamentale glottica a breve termine (Jitter %); se
l’alterazione vibratoria perdura nel tempo compaiono diplofonie che si evi-
denziano come sub-armoniche nello spettro sonoro;
• il parametro B (voce soffiata) è in rapporto con la perturbazione dell’ampiez-
za dell’onda sonora (Schimmer %) e quindi dell’ampiezza della vibrazione
glottica;
• il grado globale di disfonia G è comparabile al rapporto tra le componenti di
rumore e le componenti armoniche (NHR ovvero noise harmonic ratio).
Dejonckere 6 suggerisce di aggiungere le annotazioni «d» e «t» per indicare la
presenza di diplofonie (d) e di tremore (t) rispettivamente nella casella relativa al
grado di voce rauca (R) e in quella relativa alla voce pressata (S) o astenica (A): ad
es. R3d e S3t o A3t etc.
Confrontando la scala GIRBAS con le altre si può notare quali sono i vantaggi
ed i limiti della metodica; infatti se da un lato si può apprezzare la rapidità di valu-
tazione e la semplicità d’uso, dall’altro si può constatare che le informazioni che si
ottengono sono orientate principalmente alla regolarità e al grado di chiusura glot-
tica, senza prendere in eccessiva considerazione la funzionalità delle strutture so-
vralaringee e gli aspetti temporali della funzione fonatoria quando quest’ultima si
accoppia a quella articolatoria. D’altra parte la scala GIRBAS ha dimostrato una
correlazione sufficientemente attendibile con alcuni parametri acustici 6, una bassa
variabilità intra- e inter-soggettiva ed una discreta capacità di discriminare diverse
tipologie di pazienti 8. Inoltre si è dimostrata la superiorità della valutazione ordi-
nale rispetto a quella visuo-analogica 32. I principali fattori che determinano diffe-
renze fra esperti nell’utilizzo di questa scala, sono rappresentati da voci fortemente
soffiate e fortemente rauche: la prima situazione (marcata Breathiness) rende diffi-
cile il giudizio di R (Roughness) e viceversa la seconda situazione (marcata Rou-
ghness) rende difficile il giudizio di B (marcata Breathiness) 19: anche per soggetti
di lingua italiana si è utilizzata la scala GIRBAS con buone correlazioni fra rileva-
zioni percettive e acustiche 25.
Questi elementi confermano che i vari parametri della scala GIRBAS hanno
un significato sufficientemente preciso, possono essere applicati da professionisti
differenti a numerose tipologie di voci patologiche con un alto grado di affidabi-
lità.

IV.
2
130 A. Ricci Maccarini et al.

DISCUSSIONE

La valutazione percettiva della voce è da considerarsi tuttora l’indagine fonda-


mentale nella valutazione clinico-strumentale della voce e non può essere sostituita
completamente da misure di carattere strumentale 4 16. Tuttavia per essere valida è
necessario che venga eseguita con procedure standard, come quelle descritte sopra.
Inoltre è opportuno che i professionisti che fanno uso di questo genere di sistemi di
valutazione percettivi si sottopongano ad uno specifico training.
Infatti si è potuto verificare che ascoltatori allenati mostrano una maggiore affi-
dabilità di giudizio rispetto a ascoltatori non esperti 11 16.
Anche l’esperienza e il background culturale e professionale svolgono un ruolo
di rilievo: in uno studio sulla valutazione percettiva con la scala GIRBAS 6 sono sta-
ti reclutati Otorinolaringoiatri e Logopedisti con una vasta esperienza sull’argo-
mento ed è stato possibile confermare come l’esperienza influenzi significativa-
mente i risultati 8.
In un’altra recente ricerca 2 è stato anche messo in rilievo come siano necessa-
rie almeno otto ore di allenamento per raggiungere un’affidabilità intersoggettiva
dell’80% utilizzando un sistema di valutazione a 13 dimensioni.
La comunità scientifica ha in buona sostanza evidenziato che esperienza, alle-
namento, lingua parlata dall’ascoltatore, altezza tonale, intensità e contenuto foneti-
co del segnale vocale, costituiscono indici significativi da tenere sempre presenti
nella valutazione percettiva.
L’analisi della letteratura mostra che la scala GIRBAS è attualmente quella di
maggiore diffusione ed è quella sulla quale si sono accumulate il maggior numero
di evidenze cliniche.
Tuttavia se si prendono in considerazione i soggetti reclutati nei diversi studi si
possono segnalare alcune non trascurabili mancanze: in primo luogo sono carenti i
dati sull’applicazione della scala GIRBAS in soggetti con particolari abilità vocali
(attori, cantanti, etc.); in secondo luogo non è stata studiata la valutazione dei diversi
tipi di voce (parlata, cantata e urlata o di registro pieno e di falsetto) sulla scala GIR-
BAS; poi non esistono dati sull’utilizzo della scala GIRBAS nei disturbi della re-
golazione nervosa della fonazione; ed infine gli studi sulla voce non laringea – tra-
cheoesofagea e erigmofonica – fanno riferimento a schemi di valutazione del tutto
diversi 20.
Per quanto riguarda il primo punto riteniamo necessario sottolineare che per
professionisti artistici non cantanti possono derivare indicazioni utili dall’applica-
zione del Voice Profile Analysis Scheme (VPAS).
Per la voce cantata la valutazione percettiva deve ricondursi in prima istanza a
quanto evidenziato per la voce parlata, con attenzione particolare alla presenza di di-
plofonie, rotture di voce, voce soffiata o rauca.
Aspetti più specifici della voce cantata devono ancora trovare una sistematizza-
zione analitica e descrittiva, mentre gli aspetti estetici sono di competenza del mae-
stro di canto o di alcuni foniatri con specifica formazione nel settore.
Il ruolo svolto dai diversi tipi di voce e di registro rappresenta un punto di par-
ticolare interesse per la ricerca dei prossimi anni. Il clinico otorinolaringoiatra deve
tuttavia porre attenzione al fatto che cambi di registro nella voce di conversazione
La valutazione percettiva della voce 131

così come modificazioni qualitative selettive della voce urlata o cantata possono es-
sere i primi segni di uno scompenso del sistema pneumo-fono-articolatorio. In al-
cuni casi queste modificazioni possono essere addirittura i principali indicatori di
una condizione patologica.
È singolare che i più importanti protocolli di valutazione percettiva non ten-
gano alcun conto delle particolari modificazioni che può assumere la voce in con-
dizioni di alterata regolazione neurologica. L’evoluzione della società e la signi-
ficativa modificazione dell’epidemiologia di numerosi quadri patologici, quali i
traumi cranici e le demenze, impongono per il futuro una maggiore attenzione.
Allo stato attuale possiamo affermare che particolare attenzione dovrebbe essere
posta nei confronti della stabilità sia dell’altezza tonale che dell’intensità della
voce.
Con i termini di tremore e flutter indichiamo fluttuazioni regolari delle frequenze
di vibrazione rispettivamente di 0-3 Hz nel primo caso e di 9-15 Hz nel secondo 27. In
molti casi le fluttuazioni della frequenza fondamentale e dell’intensità sono del tutto
irregolari. In generale nei casi di disfonia da alterazione neurologica l’attenzione per-
cettiva del clinico deve rivolgersi agli aspetti temporali e dinamici della fonazione.
Alcune considerazioni finali le merita la valutazione della voce alaringea, in re-
lazione anche all’ampia diffusione che stanno avendo le valvole fonatorie. Ricor-
diamo che in questi casi, così come nelle voci erigmofoniche, non si ha a che fare
con un segnale periodico, ma con un segnale complesso, quasi periodico 21.
Spesso nella valutazione percettiva di queste voci si confondono e si mescolano
pericolosamente le definizioni di voce e di parola. Così per esempio alcuni Autori
hanno introdotto il parametro intelligibilità, che per altro sarebbe di per sé attribui-
bile solo alla parola e non alla voce 1. Nelle voci esofagee e tracheo-esofagee rive-
ste un ruolo centrale la valutazione della durata fonatoria, della raucedine e del gra-
do di voce soffiata; si noti a tal proposito che in questi tipi di voce essendo il grado
di aperiodicità molto alto i valori di R e di B della scala GRBAS si influenzano no-
tevolmente l’uno con l’altro.

CONCLUSIONI

La valutazione percettiva della voce dovrebbe far parte integrante dell’esame


obiettivo eseguito dai diversi professionisti sanitari chiamati a gestire quadri eufo-
nici e disfonici (otorinolaringoiatri, foniatri e logopedisti) e gli esiti di tale valuta-
zione dovrebbero essere riportati nei diari clinici. Perché la valutazione abbia signi-
ficato è necessario ricorrere ai principali sistemi strutturati di analisi ed è richiesto
un minimo di allenamento al loro utilizzo. A seconda del quadro clinico si possono
scegliere schemi di analisi differenti.
La scala GIRBAS appare come uno strumento valido e affidabile, di semplice
e rapida applicazione, utile nella comunicazione tra specialisti. Queste caratteri-
stiche ne rendono assai raccomandabile la diffusione e l’applicazione routinaria
anche nel nostro paese, seguendo le linee guida della European Laryngological
Society 9.

IV.
2
132 A. Ricci Maccarini et al.

BIBLIOGRAFIA
1
Ainsworth WA, Singh W. Perceptual comparison of neoglottal, oesophageal and normal speech.
Folia Phoniatr 1992;44:297-307.
2
Bassich CJ, Ludlow C. The use of perceptual methods by new clinicians for assessing voice qua-
lity. J Speech Hear Res 1986;51:125-33.
3
Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, et al. A basic
protocol for functional assessment of voice pathology, especially for investigating the efficacy of
(phonosurgical) treatments and evaluating new assessment techniques. Eur Arch Otorhinolaryngol
2001;258:77-82.
4
Dejonckere P. Perceptual and laboratory assessment of dysphonia. Otolaryngol Clin North Am
2000;33:731-50.
5
Dejonckere P, Remacle M, Fresnel-Elbaz E, Woisard V, Crevier L, Millet B. Reliability and clini-
cal relevance of perceptual evaluation of pathological voices. Rev Laryngol Otol Rhinol
1998;119:247-8.
6
Dejonckere P, Remacle M, Fresnel-Elbaz E, Woisard V, Crevier-Buchman L, Millet B. Differen-
tiated perceptual evaluation of pathological voice quality: reliability and correlations with acou-
stic measurements. Rev Laryngol Otol Rhinol 1996;3:219-24.
7
Dejonckere P, Obbens C, De Moor G, Wienike G. Perceptual evaluation of dysphonia: reliability
and relevance. Folia Phoniatr Logop 1993;45:76-83.
8
De Bodt MS, Wuyts FL, Van De Heyning PH, Croux C. Test-retest study of the GRBAS scale: the
influence of experienced and professional background on perceptual rating of voice quality. J Voi-
ce 1997;11:74-80.
9
European Laryngological Society (vedi allegato).
10
Ferrero F, Ricci Maccarini A, Tisato G. I suoni multifonici nella voce umana. Atti del XIX Conve-
gno Nazionale dell’Associazione Italiana di Acustica, Napoli, 10-12 Aprile, 1991.
11
Gelfer MP. Perceptual attributes of voice: development and use of rating scales. J Voice
1988;2:320-6.
12
Hammarberg B. Voice research and clinical needs. Folia Phoniatr Logop 2000;52:93-102.
13
Hammarberg B, Fritzell B, Gauffin J, Sundberg J, Wedin L. Perceptual and acoustic correlates of
abnormal voice qualities. Acta Otolaryngol 1980;90:441-51.
14
Hirano M. Psycho-acoustic evaluation of voice. In: Hirano M. Clinical Examination of voice. New
York: Springer-Verlag 1981.
15
Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evluation of voice quality:
review, tutorial, and a framework for future research. J Speech Hear Res 1993;36:21-40.
16
Kreiman J, Gerratt B, Precoda K. Listener experience and perception of voice. J Speech Hear Res
1990;33:103-15.
17
Laver J. The phonetic description of voice quality. London: Cambridge University press 1980.
18
McKinney JC. The diagnosis and correction of vocal faults. Nashville: Genevox Music Group
1994.
19
Millet B, Dejonckere PH. What determines the differences in perceptual rating of dysphonia
between experienced raters? Folia Phoniatr Logop 1998;50:305-10.
20
Nieboer GLJ, De Graaf T, Schutte HK. Esophageal voice quality by means of the semantic diffe-
rential. J Phonet 1988;16:417-36.
21
Qi Y, Weinberg B. Characteristics of voicing source waveforms produced by esophageal and tra-
cheoesophageal speakers. J Speech Hear Res 1995;38:536-48.
22
Revis J, Giovanni A, Wuyts F, Triglia J. Comparison of different voice samples for perceptual
analysis. Folia Phoniatr Logop 1999;51:108-16.
23
Rosen CA, Murry TM. Nomenclature of voice disorders and vocal pathology. Otolaryngol Clin
North Am 2000;33:1035-45.
24
Schindler A, Utari C. Il ruolo dell’autovalutazione. Acta Phoniatrica Latina 2001;23:140-9.
25
Schindler A, Ricci Maccarini A, De Colle W, Ottaviani F. La scala GIRBAS nella valutazione per-
cettiva della voce: uno studio preliminare. Abstract del XXXV Congresso Nazionale della Società
Italiana di Foniatria e Logopedia, Vietri sul Mare, 14-16 Giugno, 2001.
La valutazione percettiva della voce 133

26
Schindler O, Casolino D, Ricci Maccarini A, Schindler A. Le disfonie. Rev Autoval ORL 2000;2:1-
16.
27
Titze I. Summary Statement. Workshop on Acoustic Voice Analysis. Denver (CO), 17-18 Febbraio,
1994.
28
Wilson DK. Voice problem of children. 2nd edition. Baltimore: Williams & Wilkins 1979.
29
Wirz SL, Mackenzie Beck J. Assessment of voice quality: the Vocal Profiles Analysis Scheme. In:
Wirz S, ed. Perceptual Approaches to Communication Disorders. London: Whurr Publisher 1995.
30
Wirz S. Assessing communication skills in diverse client groups: the role of speech and language
therapy. In: Wirz S, ed. Perceptual Approaches to Communication Disorders. London: Whurr Pu-
blisher 1995:1-16.
31
Wolfe V, Fitch J, Martin D. Acoustic Measures of Dysphonic Severity across and within Voice Ty-
pes. Folia Phoniatr Logop 1997;49:292-9.
32
Wuyts F, De Bodt M, Van de Heyning P. Is the reliability of a visual analog scale higher than an
ordinal scale? An experiment with the GRBAS scale for the perceptual evaluation of dysphonia. J
Voice 1999;13:508-17.

IV.
2
134 D. Casolino et al.

IV.3. LA LARINGOSTROBOSCOPIA

D. Casolino, A. Ricci Maccarini, M. Magnani

Il termine «stroboscopia» deriva dal greco «strobos» (ruotare) e «skopeo» (os-


servare).
L’effetto stroboscopico fu descritto per la prima volta da Plateau nel 1829, nel-
la sua tesi in Scienze Fisiche e Matematiche: esso si fonda su un’illusione ottica do-
vuta all’inerzia propria del nostro senso della vista. Secondo la legge di Talbot, ogni
impressione luminosa che colpisce la retina lascia un’immagine positiva della dura-
ta di 0,2 secondi. Una serie di immagini singole, presentate ad intervalli inferiori a
0,2 secondi, apparirà dunque come un’immagine continua.
Movimenti vibratori o rotatori che si susseguono con rapidità tale da non poter
essere percepiti dall’occhio umano, possono essere resi visibili illuminando a rapi-
di tratti le singole fasi di vibrazione e facendo in modo che la durata dei lampi sia
inferiore alla durata del periodo di vibrazione. Quando la frequenza dei lampi coin-
cide esattamente con la frequenza delle vibrazioni dell’oggetto, viene illuminata
sempre la stessa fase vibratoria: l’oggetto, che in realtà vibra, appare ai nostri occhi
immobile (immagine ferma) (Fig. 1). La posizione in cui l’oggetto appare fermo di-
pende dalla fase che viene illuminata.

Fig. 1.
Principio della stroboscopia. Modalità «immagine fissa».

U.O. ORL, Ospedale «M. Bufalini», Cesena


La laringostroboscopia 135

Fig. 2.
Principio della stroboscopia. Modalità «immagine in movimento».

Se la frequenza dei lampi non coincide esattamente con la frequenza di vibrazio-


ne, non viene illuminata ad ogni passaggio la medesima posizione, ma quella imme-
diatamente adiacente. Ciò che si vede in questo caso è un movimento vibratorio ap-
parentemente lento, composto dalle singole fasi di periodi successivi che nel loro in-
sieme riproducono un effetto ottico di continuità (immagine in movimento) (Fig. 2).
In altre parole, la stroboscopia fornisce un’immagine illusoria che si compone
di piccoli frammenti del ciclo vibratorio reale, mentre l’oggetto in esame rimane per
la maggior parte del tempo al buio.
Il primo stroboscopio meccanico era costituito da un disco forato rotante (da cui
il termine «strobos») che interrompeva periodicamente un raggio di luce, essendo
collocato fra una lampada e l’oggetto in esame.
Con questo strumento Harless eseguì i primi esami stroboscopici su laringi
escisse già nel 1852, cioè prima dell’introduzione dello specchietto laringeo da par-
te di Garcia (1854).
Toepler nel 1866 ed Oertel nel 1878 esaminarono la laringe di un essere viven-
te con lo stroboscopio meccanico.
Muschold nel 1898 riuscì a realizzare le prime fotografie stroboscopiche, che
ancor oggi sono oggetto di ammirazione.
Nel 1937 Kallen e Polin produssero il primo stroboscopio completamente elet-
tronico, successivamente perfezionato da Timcke nel 1958, che sfruttava lampi lu-
minosi prodotti da tubi a scarica di gas (neon, xenon).
Allo sviluppo della laringostroboscopia hanno dato contributi determinanti See-
man, che nel 1921 introdusse la stroboscopia nello studio delle patologie della vo-
ce, Luchsinger che con le sue ricerche creò le premesse per un utile impiego prati-
co e particolarmente Schönhärl 13, al quale si deve l’affermazione della stroboscopia
nel campo della laringologia.
Attualmente ulteriori fondamentali contributi si devono alle ricerche di Jurgen
Wendler 14, che utilizza la metodica della «microstroboscopia intraoperatoria» e di

IV.
3
136 D. Casolino et al.

Guy Cornut e di Marc Bouchayer 5 6 i quali hanno introdotto un protocollo diagno-


stico e terapeutico che prevede come prassi costante nella patologia laringea la vi-
deoregistrazione dell’esame stroboscopico e l’analisi alla moviola del ciclo vibrato-
rio glottico.
Più recenti, ma di rilievo non inferiore anche per le possibili evoluzioni, sono le
ricerche di Peak Woo 15 sulla quantificazione delle osservazioni videostroboscopi-
che utilizzando l’elaborazione computerizzata delle immagini delle varie fasi vibra-
torie.
I moderni laringostroboscopi sono tutti caratterizzati dalla regolazione automa-
tica della frequenza, che permette di sincronizzare lo strumento con la frequenza
fondamentale della voce del paziente; quest’ultima è prelevata mediante un mi-
crofono a contatto con la laringe o montato sul laringoscopio.
La regolazione della differenza di fase per l’effetto «slow motion» o per la fis-
sazione nei vari momenti del ciclo vibratorio viene effettuata mediante un pedale
multifunzione.
Di preferenza si usano endoscopi rigidi a quattro ingrandimenti, con fuoco fis-
so o variabile, con angolo di visuale a 90° o 70° ma in alternativa possono essere
utilizzati anche endoscopi flessibili.
Inizialmente questi ultimi venivano impiegati esclusivamente nei soggetti non
collaboranti; l’introduzione di fonti di luce stroboscopiche allo xenon più potenti e
di fibroscopi più luminosi hanno ampliato le indicazioni all’uso della fibro-videola-
ringostroboscopia.
Entrambi gli strumenti presentano vantaggi e svantaggi 4 16.
I telescopi rigidi forniscono immagini di dimensioni superiori e migliore qualità
ma non sempre si ottiene una visione completa della commissura anteriore, la lin-
gua deve essere estrusa e non di rado il paziente presenta riflessi tali da non rende-
re agevole la visione.
I fibroscopi, dal canto loro, forniscono immagini degli atti fonatori più vicine al-
le condizioni fisiologiche, consentono una buona visione dell’intero laringe e di
buona parte della faringe, i riflessi sono nettamente minori.
La qualità delle immagini e la fedeltà dei colori sono però inferiori, le lesioni di
piccole dimensioni non sempre sono ben caratterizzabili e il grandangolo determina
distorsioni delle immagini, che appaiono più globose vicino alla punta e più sfuo-
cate ai bordi.
Nella nostra esperienza gli strumenti flessibili hanno ottenuto un posto di rilie-
vo nella valutazione stroboscopica intraoperatoria nel corso di interventi di tiropla-
stica di medializzazione (tiroplastica di tipo I). In caso di paralisi laringee l’intro-
duzione fino al piano glottico permette di identificare eventuali slivellamenti verso
l’alto o verso il basso della corda indirizzando il chirurgo nella localizzazione della
sede in cui dovrà essere incisa la finestra cartilaginea; inoltre permette di poter iden-
tificare il corretto affrontamento delle corde vocali dopo l’avvenuta medializzazio-
ne, consentendo eventuali correzioni immediate dell’intervento al fine di ottenere il
migliore risultato possibile.
Normalmente l’esame viene videoregistrato, impiegando una microtelecamera
collegata ad un videoregistratore con moviola e visualizzato su monitor ad alta de-
finizione.
La laringostroboscopia 137

Gli stroboscopi di ultima generazione sono inoltre in grado di fornire elementi


di notevole importanza circa le caratteristiche acustiche della voce quali: la fre-
quenza fondamentale, con la nota corrispondente, il livello di intensità sonora in dB,
il Jitter e lo Shimmer, con possibilità di visualizzare contemporaneamente la forma
dell’onda glottografica.
Più di recente l’implementazione con il personal computer ha permesso l’ela-
borazione di software per l’archivio di sequenze di fotogrammi successivi relativi al
ciclo vibratorio glottico con la possibilità di valutazioni qualitative e quantitative
(Fig. 3) e l’archivio di immagini in movimento su CD ROM.

Fig. 3.
La laringostroboscopia.

Tali tipi di attrezzature, che fino a qualche anno fa erano patrimonio di pochi
centri di ricerca a causa degli alti costi di acquisto e manutenzione, sono oggi ac-
cessibili a molti specialisti che si dedicano particolarmente alla laringologia ed alla
foniatria, poiché lo sviluppo tecnologico e la concorrenza tra le ditte produttrici han-
no consentito un ragguardevole abbattimento dell’impegno economico richiesto.
La laringostroboscopia permette di analizzare nei dettagli le caratteristiche fi-
siologiche e patologiche della vibrazione glottica 9 11 12, che si basano fondamental-
mente sulla teoria muco-ondulatoria formulata da Perello.
Le corde vocali hanno 2 tipi di movimenti: quello trasverso del corpo muscola-
re e quello verticale degli strati soprastanti, che è riferibile all’onda mucosa e che è
indicativo dell’elasticità della corda vocale. La stroboscopia consente di osservare
entrambi i movimenti.
Le fasi del ciclo vibratorio sono tre: apertura, avvicinamento e chiusura (Figg.
4 e 5).
Dal rapporto tra la durata delle varie fasi si individuano le modalità di vibrazio-
ne: normale, ipercinetica ed ipocinetica. I parametri da valutare durante la laringo-
stroboscopia, così come raccomandato da Hirano 8 sono:

IV.
3
138 D. Casolino et al.

Fig. 4.
Immagine schematica della vibrazione glottica. Sulla sinistra è raffigurata la corda vocale in sezione,
sulla destra la glottide vista dall’alto (da Schönhärl ed Hirano, modificata).

• simmetria (Figg. 6 e 7);


• periodicità (regolare, irregolare, inconsistente) (Fig. 8);
• chiusura glottica (completa, incompleta: ovalare, a triangolo posteriore o an-
teriore, a clessidra, con precontatti, con solcature) (Figg. 9 e 10);
• ampiezza (Fig. 11);
• progressione dell’onda mucosa (Fig. 3).
In particolare le fasi di chiusura e di apertura devono sempre essere riferite al li-
vello di intensità, all’altezza tonale ed al registro con cui viene prodotta la voce, per
evitare di interpretare come patologica un tipo di vibrazione che in realtà è fisiolo-
gico per quella modalità di produzione vocale (ad esempio, la vibrazione di tipo
«marginale» nel registro di falsetto).
Lo studio della progressione dell’onda mucosa dalla faccia inferiore a quella su-
periore della corda vocale è uno dei momenti fondamentali per l’individuazione di
zone di rigidità della mucosa causata da lesioni cordali congenite o da precancerosi
laringee 8 12.
La laringostroboscopia 139

Fig. 5.
Schema del ciclo vibratorio glottico (da Prytz, modificato).

Fig. 6.
Simmetria glottica.

La videostroboscopia, fornendo immagini delle diverse parti del ciclo vibrato-


rio consente di visualizzare fenomeni non visibili ad occhio nudo quali segmenti
cordali non vibranti, rigidità della mucosa ed il ritorno dell’onda mucosa dopo pa-
ralisi. Infine, come per tutte le metodiche che comportano la visualizzazione e l’ar-
chiviazione delle immagini, anche la videostroboscopia assume un importante ruo-

IV.
3
140 D. Casolino et al.

Fig. 7.
Simmetria glottica.

Fig. 8.
Periodicità glottica.
La laringostroboscopia 141

Precontatto bilaterale Triangolo posteriore

Fig. 9.
Chiusura glottica.

Fig. 10.
Chiusura glottica.

IV.
3
142 D. Casolino et al.

Fig. 11.
Ampiezza glottica.

lo nell’insegnamento della fisiologia e della patologia della vibrazione cordale 4.


L’apporto della laringovideostroboscopia alla diagnosi ed al trattamento della
patologia cordale è stato chiaramente esemplificato nei lavori di Cornut e Bou-
chayer 6.
Su tali basi e attenendosi al protocollo proposto per lo studio della patologia la-
ringea, l’attività del nostro Ambulatorio di Foniatria e Logopedia (nel quale vengo-
no eseguite e registrate oltre 600 laringostroboscopie all’anno per disfonia cronica)
è costantemente archiviato anche con metodo informatico di memorizzazione delle
immagini 1 2 3 7.
L’esperienza così svolta ci ha confermato l’importanza di questa indagine dia-
gnostica:
• nella diagnosi differenziale tra lesioni laringee che presentano morfologia si-
mile, come per esempio tra una cisti mucosa da ritenzione ed un nodulo: in
questo caso la stroboscopia evidenzia la riduzione o l’arresto della vibrazione
mucosa a livello della tumefazione o anche di tutta la corda, nel caso della ci-
sti intracordale;
• nella corretta indicazione alla fonochirurgia, come ad esempio in presenza di
noduli cordali ispessiti, in cui la stroboscopia permette di valutare l’entità del-
l’insufficienza glottica che si viene a creare per il pre-contatto tra i noduli, op-
pure fornendo indicazioni utili per quantificare «l’età» dei noduli stessi: quel-
li recenti sono soffici e scompaiono durante la fase di apertura, mentre quelli
inveterati ed organizzati non scompaiono mai completamente;
• nel porre il sospetto dell’esistenza di una lesione che non è chiaramente evi-
dente anche alla stroboscopia e che andrà ricercata in sede operatoria, come
La laringostroboscopia 143

nel caso della monocordite, in cui una riduzione dell’ondulazione mucosa sul-
la faccia superiore della corda vocale fa sospettare la presenza di una cisti in-
tracordale, o nel caso della glottide ovalare, in cui durante l’analisi della vi-
brazione glottica può evidenziare la presenza di un «sulcus» o di una «verge-
ture», nei quali l’aderenza della lesione al legamento vocale provoca l’arresto
della progressione dell’onda mucosa;
• nell’indicare al chirurgo la zona precisa ove effettuare la cordotomia, come
nel caso delle cicatrici cordali iatrogene in cui si cerchi di liberare la mucosa
dall’adesione al legamento vocale;
• Nelle monoplegie laringee, in cui permette di valutare il grado di insufficien-
za di chiusura della vibrazione glottica e di orientare la diagnosi differenziale
tra paralisi neurogene ed anchilosi crico-aritenoidea: nel primo caso infatti du-
rante la vibrazione stroboscopica la corda è flaccida;
• La laringovideostroboscopia è infine l’esame fondamentale nel follow-up do-
po interventi di fonochirurgia: in particolare dopo interventi di microchirurgia
laringea permette di valutare il ripristino dell’ondulazione mucosa, mentre ne-
gli interventi di iniezione intracordale o di tiroplastica consente di valutare il
miglioramento della competenza glottica.

BIBLIOGRAFIA
1
Atti del Convegno «Giornate di fonochirurgia. Cervia 2-4 maggio 1996.
2
Casolino D, Ricci Maccarini A. Laringostroboscopia. Seminario «Update on phonosurgery», 1996
CRS Amplifon.
3
Casolino D, Ricci Maccarini A, Magnani M. Laringovideostroboscopia e fonochirurgia nelle le-
sioni congenite delle corde vocali. Video.
4
Colton RH, Woo P, Brewer DW, Griffin B, Casper J. Stroboscopic signs associated with benign le-
sions of the vocal folds. J Voice 1995;9:312-25.
5
Cornut G, Bouchayer M. Apport de la vidéo-stroboscopie dans les indications de phonochirurgie.
Acta O.R.L. Belg 1982;40:436-42.
6
Cornut G, Bouchayer M, Parent F. Value of videostroboscopy in indicating phonosurgery. Acta
O.R.L. Belg 1986;40:436-42.
7
Füstös R, Ricci Maccarini A, Magnani M, Radici M. Le indagini clinico-strumentali pre e post-
operatorie. In: Fonochirurgia Endolaringea. Pacini Ed. 1997.
8
Hirano M. Clinical examination of voice. Wien-New York: Springer Verlag 1981:43-54.
9
Kitzing P. Stroboscopy – a pertinent laryngeal examination. J Otolaryngol 1985;14:151-4.
10
Prytz S. Laryngeal Videostroboscopy. Ear Nose Throat J Suppl ENT Technology, September 1987.
11
Sataloff RT. Professional Voice: The Science and Art of Clinical Care. San Diego, CA: Singular Pu-
blishing Group Inc. 1996.
12
Sataloff RT, Spiegel JR, Hawkshaw MJ. Strobovideo laryngoscopy: Result and clinical value. Ann
Otol Rhinol Laryngol 1991;100:725-7.
13
Schönhärl E. Die Stroboskopie in der praktische Laryngologie. Stuttgart: Thieme 1960.
14
Wendler J. Stroboscopia. In: Trattato di Foniatria e Logopedia. Croatto L, (a cura di). Semeiotica
Foniatrica. Padova: Ed. La Garangola 1988;Vol.4:87-98.
15
Woo P. Quantification of Videostroboscopic Findings. Measurements of normal Glottal Cycle.
Laryngoscope 1996;106.
16
Yanagisawa E, Owens TW, Strothers G, Honda K. Videolaryngostroboscopy: A comparision of fi-
beroptic and telescopic documentation. Ann Otolol Rhinol Laryngol 1983;92:430-6.

IV.
3
144 G. Peretti et al.

IV.4. LA VIDEOKIMOGRAFIA

G. Peretti, C. Piazza, M. Giudice, C. Balzanelli, C. Mensi, M. Rossini

Simultaneamente all’affinarsi delle tecniche diagnostiche e terapeutiche in am-


bito foniatrico e fonochirurgico, si è progressivamente reso sempre più necessario il
poter disporre di metodiche di valutazione oggettiva del ciclo vocale e delle sue al-
terazioni, sia patologiche che iatrogene post-trattamento.
La videolaringostroboscopia (VLS), pur essendo oggi considerata un esame di
prima scelta nell’inquadramento diagnostico di numerose patologie funzionali la-
ringee, risulta gravata da alcuni limiti intrinseci che ne condizionano l’applicazione
clinica. L’immagine stroboscopica della vibrazione mucosa della corda vocale è in-
nanzi tutto infatti un’illusione ottica risultante dalla ricostruzione virtuale da parte
dell’occhio umano di fasi contigue di diversi cicli vocali, colti dai flash strobosco-
pici in istanti successivi. Per questo, in condizioni quali un’importante compromis-
sione dell’intensità o un’aperiodicità del segnale vocale emesso, il meccanismo di
illuminazione, regolato sulla frequenza fonatoria, risulta inefficace nella rappresen-
tazione di fasi successive del ciclo vocale. L’immagine che in queste condizioni ne
deriva risulta dunque sovrapponibile a quella ottenuta in una semplice videolarin-
goscopia mediante luce alogena, con assenza di informazioni sulle caratteristiche
della vibrazione mucosa 6 8 10. La valutazione dell’esame VLS risulta inoltre sempre
gravata da un’elevata variabilità intersoggettiva, ampiamente determinata dalla spe-
cifica esperienza svolta dall’operatore nel settore 1. Una quantificazione dei para-
metri di vibrazione mucosale e chiusura glottica al fine di confrontare i dati nel-
l’ambito di una medesima popolazione o di casistiche appartenenti a differenti Isti-
tuti è inoltre difficile e di necessità da ricondursi a sistemi di punteggi più o meno
personalizzati che, introducendo un’ulteriore variabile, complicano maggiormente
l’espressione dei risultati 7.
Per superare questi limiti, la ricerca applicata si è evoluta in due direzioni: la la-
ringoscopia indiretta ad alta velocità e la videochimografia (VCG). Non tratteremo
della prima tecnica in quanto di interesse quasi esclusivamente sperimentale per gli
elevati costi, il notevole ingombro e la scarsa praticità e maneggevolezza della stru-
mentazione necessaria 4 5. La VCG, invece, ideata e descritta per la prima volta nel
1984 da Gall 2 e successivamente sviluppata dalla Scuola Olandese 6 8 10, quantunque
a tutt’oggi poco diffusa, presenta potenzialità che ne fanno intuire il futuro largo im-
piego nella diagnostica laringologica.

Clinica Otorinolaringoiatrica, Università di Brescia


La videokimografia 145

Fig. 1.

Il principio che consente di ovviare ai sopradescritti limiti della VLS è la possi-


bilità di fotografare ad alta velocità (poco meno di 8000 scatti al secondo) una sot-
tile porzione trasversale del piano glottico, indipendentemente dalle caratteristiche
di emissione del segnale sonoro. La selezione della striscia del piano cordale da
prendere in esame durante la VCG, viene eseguita passando da un’immagine video-
laringoscopica in bianco e nero (Fig. 1) alla registrazione ad alta velocità mediante
un comando a pedale, nel momento in cui il margine superiore della videata è in cor-
rispondenza del punto desiderato.
In tal modo, la porzione del piano cordale corrispondente alla striscia selezio-
nata viene ripresa durante tutti i movimenti compiuti in senso medio-laterale nel
corso di vari cicli vocali. Sul monitor appaiono, quindi, in tempo reale ed in se-
quenza verticale, tutti gli istanti successivi del movimento della striscia di glottide
prescelta. Su una singola schermata, dunque, il tempo risulta rappresentato lungo
l’asse delle ordinate (asse-y), mentre quello delle ascisse (asse-x) corrisponde ad
una singola fotografia della striscia di glottide prescelta (Fig. 2).

Fig. 2.

IV.
4
146 G. Peretti et al.

Fig. 3.

Mediante la registrazione digitale di queste immagini e la loro successiva valu-


tazione al rallentatore, è così possibile analizzare in modo molto accurato le carat-
teristiche del movimento del punto prescelto del piano cordale durante più cicli vo-
cali (Fig. 3).
Il fermo immagine delle videate più significative e la loro stampa su carta con-
sentono infine il confronto diretto tra un Paziente e l’altro o tra quadri laringosco-
pici dello stesso caso in momenti differenti della storia clinica (pre- e post-tratta-
mento, ad esempio). Come vedremo in seguito, su questa base sono inoltre possibi-
li una serie di misurazioni oggettive ulteriormente confrontabili tra loro.
Limiti principali della VCG sono a tutt’oggi un costo aggiuntivo rispetto a quel-
lo della VLS, un maggior ingombro e peso della telecamera rispetto a quella nor-
malmente utilizzata per la laringostroboscopia e la necessità di una maggior «com-
pliance» da parte del Paziente. È infatti necessaria una notevole inclinazione in
avanti ed in basso dell’ottica al fine di inquadrare le porzioni più anteriori della glot-
tide e non è infrequente il riscontro di soggetti che tollerano a fatica l’esame anche
dopo un’adeguata anestesia locale per contatto. Per questo motivo, particolarità ana-
tomiche come un’epiglottide alta o conformata in modo atipico, un’ipertrofia o un’i-
peradduzione delle false corde e/o delle aritenoidi possono addirittura impedire una
corretta esecuzione dell’esame 3.
Nella VCG la messa a fuoco della telecamera e l’orientamento dell’ottica ri-
spetto al piano cordale risultano inoltre di maggiore importanza rispetto a quanto os-
servato durante la VLS, rendendo l’esecuzione dell’esame tecnicamente più com-
plessa. La scelta della porzione di glottide che si vuole esaminare è spesso difficile
per la necessità di passare continuamente dall’immagine laringoscopica (in cui si se-
leziona la striscia glottica da valutare) a quella VCG (in cui si apprezza il movi-
mento medio-laterale del punto selezionato). Per ovviare a tale inconveniente e per
semplificare la metodica di esecuzione, alcuni Autori hanno ibridizzato la VLS e la
VCG in una tecnica da loro definita videostrobochimografia 9. Quantunque più sem-
plice e fattivamente identico ad una normale valutazione laringostroboscopica, que-
sto esame non consente, a nostro parere, di ottenere gli stessi risultati della VCG
quanto ad accuratezza e definizione dell’immagine ottenuta. Il superamento delle
difficoltà tecniche della VCG potrebbe invece essere ottenuto, come già in fase di
La videokimografia 147

studio negli Stati Uniti, mediante la selezione e registrazione «off-line» della stri-
scia glottica desiderata (Dati non pubblicati).
La valutazione dei parametri della VCG è al presente svolta in modo sostan-
zialmente qualitativo, basandosi sulla percezione soggettiva della simmetria della
vibrazione cordale, della presenza o meno di un’insufficienza glottica costante in
ogni fase del ciclo e dell’ampiezza della vibrazione di una corda rispetto alla con-
trolaterale. Queste valutazioni, quantunque utilissime nel singolo caso, rendono dif-
ficili le comparazioni tra differenti soggetti, diverse condizioni patologiche e casi-
stiche multicentriche. Per ovviare a questa limitazione, presso la nostra Clinica, do-
ve la VCG è routinariamente applicata come esame complementare alla VLS dal
Luglio 1999 3, sono state standardizzate varie misurazioni oggettive volte ad otte-
nere parametri numerici facilmente confrontabili tra loro. La misurazione in milli-
metri, eseguita su stampe di diverse videate di uno stesso esame, dell’ampiezza del-
la vibrazione cordale di un lato rispetto al controlaterale e l’espressione di questo
valore mediante un rapporto consentono infatti di quantificare le caratteristiche del-
l’onda mucosa di entrambe le corde, sia prese singolarmente che l’una in relazione
all’altra. Tale rapporto (R ampiezza) è un indice di asimmetrie nella vibrazione di
una corda vocale rispetto alla controlaterale. Nel caso di patologia glottica unilate-
rale, il rapporto viene per convenzione calcolato mettendo al numeratore l’ampiez-
za misurata a livello della corda sana (Fig. 4).
Nello stesso modo si possono misurare l’ampiezza di un’insufficienza glottica o
di una sovrapposizione compensatoria dei margini liberi superiori delle corde voca-
li. Un altro parametro utile all’oggettivazione di quei dati precedentemente valutati
in modo esclusivamente soggettivo è inoltre il rapporto tra la lunghezza d’onda del-
la vibrazione di entrambe le corde vocali. Tale rapporto (R lambda) è un indice in-

Fig. 4.

IV.
4
148 G. Peretti et al.

Fig. 5.

versamente correlato alla variazione di frequenza dovuta alle alterazioni strutturali


patologiche della corda (Fig. 5).
La misurazione della lunghezza della fase di apertura e di quella di chiusura in
un singolo ciclo glottico ed il calcolo del loro rapporto (R ciclo) sono invece corre-
lati al grado di insufficienza glottica (Fig. 6) (Osservazioni personali, dati non pub-
blicati).

Fig. 6.
La videokimografia 149

L’introduzione in un software dedicato di queste misurazioni, per ora eseguite


soltanto manualmente, renderà in futuro più rapide, precise e riproducibili tali valu-
tazioni numeriche. L’esecuzione di queste misurazioni in una vasta popolazione di
controllo consentirà inoltre di stabilire parametri numerici «normali» al di fuori dei
quali definire un pattern VCG di vibrazione cordale patologico. Si potrebbero di
conseguenza definire precisi pattern vibratorii tali da inquadrare in modo specifico
i diversi elementi nosologici ed apprezzare le modificazioni indotte dal trattamento
logopedico e/o chirurgico nell’ambito di queste stesse patologie.

BIBLIOGRAFIA
1
Colden D, Zeitels SM, Hillman RE, Jarboe J, Bunting G, Spanou N. Stroboscopic assessment of
vocal-fold atypia and early cancer. Ann Otol Rhinol Laryngol 2001;110:293-8.
2
Gall V. Strip kymography of the glottis. Eur Arch Otorhinolaryngol 1984;240:287-93.
3
Giudice M, Peretti G, Piazza C, Valentini S, Balzanelli C, Antonelli AR. Preliminary experience in
videokymographic examination of the larynx. In: Abstract Book of the 6th Symposium of Interna-
tional Association of Phonosurgeons 2000;45.
4
Hess MM, Gross M. High-speed, light-intensified digital imaging of vocal fold vibrations in high
optical resolution via indirect microlaryngoscopy. Ann Otol Rhinol Laryngol 1993;102:502-7.
5
Hirose H. High-speed digital imaging of vocal fold vibration. Acta Otolaryngol (Stockh)
1998;458(Suppl):151-3.
6
Mahieu HF, Peeters AJGE. The value of videolaryngostroboscopy and videokymography in detec-
tion and imaging of early glottic carcinoma. Eur Arch Otorhinolaryngol 1998;225(Suppl 1):36.
7
Peretti G, Piazza C, Balzanelli C, Cantarella G, Nicolai P. Vocal outcome after endoscopic cordec-
tomies for Tis and T1 glottic carcinoma. Ann Otol Rhinol Laryngol, in press.
8
Schutte HK, Svec JG, Sram F. First results of clinical application of videokymography. Laryngo-
scope 1998;108:1206-10.
9
Sung M-W, Kim KH, Koh T-Y, Kwon T-Y, Mo J-H, Choi S-H, et al. Videostrobokymography: A
new method for the quantitative analysis of vocal fold vibration. Laryngoscope 1999;109:1859-63.
10
Svec JG, Schutte HK. Videokymography: High-speed line scanning of vocal fold vibration. J Voi-
ce 1996;10:201-5.

IV.
4
150 A. Ricci Maccarini et al.

IV.5. L’ESAME SPETTROACUSTICO DELLA VOCE

A. Ricci Maccarini, W. De Colle*, E. Lucchini, D. Casolino

Attualmente le strumentazioni a tecnologia digitale, implementate su Personal


Computer, consentono elaborazioni ed analisi del segnale verbale in modo rapido ed
affidabile, offrendo nel contempo prodotti grafici e dati numerici obbiettivi prima
impensabili con le apparecchiature analogiche.
Una stazione di lavoro per l’analisi acustica della voce è essenzialmente costi-
tuita da un PC dotato di pacchetti software dedicati e di un hardware finalizzato al-
l’acquisizione e riproduzione del segnale. Recentemente anche quest’ultimo può es-
sere sostituito da una comune scheda audio incorporata nel personal computer (ve-
di cap. IV.5).
La facilità di impiego dei diversi software e l’abbattimento dei costi hanno con-
sentito da un lato una notevole semplificazione dell’interazione utente-macchina,
dall’altro una considerevole diffusione di tali strumentazioni, per cui molti ambula-
tori dedicati alla diagnosi-terapia dei disturbi della voce possono disporre attual-
mente di sistemi di analisi acustica in grado di integrare altre valutazioni, come
quella laringostroboscopica.
Le principali analisi effettuate nella prassi ambulatoriale sono l’esame spettro-
grafico a finestra lunga e corta; la determinazione della frequenza fondamentale (fo)
e dell’ampiezza di emissione vocale, con il loro andamento nel tempo (curva di in-
tonazione e di intensità); l’estrazione di parametri numerici volti all’obbiettivazio-
ne delle perturbazioni del Periodo Fondamentale (Jitter) e dell’Ampiezza (Shim-
mer), lo studio del bilancio energetico spettrale (rapporto fra componente periodica
ed aperiodica nel segnale: Harmonic to Noise Ratio), della diplofonia (semplice o
multipla) nonché degli arresti momentanei dell’emissione (Breaks Vocali).
Altra metodica di analisi, nata per lo studio della voce cantata, è rappresentata
dalla fonetografia, che oggi consente valutazioni del campo vocale anche in sogget-
ti privi di «orecchio musicale» (con modalità automatica).
Utilizzando come base il sistema CSL della Kay Elemetrics Corp., oggi ampia-
mente diffuso a livello nazionale ed internazionale (ed a cui si riferisce tutta l’ico-
nografia presentata), si possono implementare pacchetti applicativi diversi che con-
sentono di ottenere le misurazioni sopra riportate in modo semplice e rapido.

U.O. ORL, Ospedale «M. Bufalini», Cesena


*
Centro Medico-Chirurgico di Foniatria, Padova
L’esame spettroacustico della voce 151

ANALISI SPETTROGRAFICA

Lo spettrogramma rappresenta le variazioni temporali del contenuto spettrale del


segnale verbale. Applicando a successive «finestre di analisi» la trasformata rapida
di Fourier (FFT: Fast Fourier Transform) si ottiene una serie di spettri di potenza (o
sezioni) che avanza nel tempo. Le informazioni di ciascuna sezione, rappresentata da
frequenza ed ampiezza di ogni armonica, sono riportate rispettivamente in ordinata
ed in numero di pixel di ogni piccola porzione dello schermo, codificando l’intensità
con diverse variazioni colorimetriche. Il tempo viene invece rappresentato sull’asse
delle ascisse come evento spettrale delle successive finestre analizzate.
Lo spettrogramma è quindi una rappresentazione grafica tridimensionale che, ri-
spetto ad altre analisi, aggiunge il pregio della temporalità; non è una analisi stati-
ca, ma rileva le modificazioni nel tempo dell’emissione glottica e del filtro sovra-
glottico. Questo aspetto può essere evidenziato anche in tempo reale (con l’utilizzo
del software Real-time Spectrogram) con indubbi vantaggi nella pratica diagnosti-
ca e riabilitativa.
La risoluzione frequenziale, che nel vecchio linguaggio analogico si risolveva
in «filtro a banda larga» (banda passante sui 300 Hz) e «filtro a banda stretta» (ban-
da passante sui 45 Hz), è ora espressa come finestra di analisi (o frame), ovvero co-
me segmento temporale costituito da un determinato numero di campioni (o cosid-
detti punti campionati). Una «finestra lunga» presenta una maggiore risoluzione fre-
quenziale: essa è in grado di separare le diverse armoniche e corrisponde ad un fil-
tro analogico a banda stretta; una «finestra corta» ha minor capacità di risoluzione
frequenziale: nella sua applicazione algoritmica può comprendere due o più armo-
niche ed è analoga ad un filtro a banda larga 4 (Fig. 1).
È necessario dunque «presettare» la lunghezza della finestra di analisi quando
ci si accinge allo studio spettrografico.
Nel sistema CSL la larghezza della finestra è calcolata in numero di punti cam-
pionati. Vengono proposti nove valori: 50, 75, 100, 125, 200, 256, 512, 600 e 1024.
Il programma emula una determinata banda passante (analoga ad un filtro analogi-
co), modificando la frequenza di campionamento e la larghezza della finestra di ana-
lisi. Ad esempio, per dati campionati a 10.000 Hz, una finestra di 50 punti corri-
sponde ad una banda di 293 Hz (come una banda larga), mentre alla stessa frequen-
za di campionamento una finestra di analisi di 512 punti emula un filtro analogico
di 29 Hz, in grado di separare ogni singola armonica anche con segnali a bassa fo.
L’analisi spettrografica rappresenta uno degli esami fondamentali nello studio
delle disfonie. L’interpretazione degli spettrogrammi, particolarmente quelli a fine-
stra lunga, tiene conto della presenza ed estensione frequenziale delle armoniche,
del loro andamento nel tempo, delle caratteristiche di attacco e di estinzione, della
presenza o meno di diplofonia, oppure di aperiodicità (rumore) nelle diverse regio-
ni spettrali, sostitutiva o meno della tessitura armonica.
La presenza di rumore alle alte frequenze è messa in relazione con l’insuffi-
ciente tensione e adduzione cordale, con conseguente fuga d’aria fonatoria e sensa-
zione percettiva di voce soffiata. La componente aperiodica a bassa frequenza,
frammista o sostitutiva delle armoniche, è dovuta alla vibrazione irregolare per au-
mento dell’adduzione e della rigidità cordale 1.

IV.
5
152 A. Ricci Maccarini et al.

Fig. 1.
Spettrogramma a «finestra lunga» (a sinistra) ed a «finestra corta» (a destra) della vocale [a] di una vo-
ce femminile normale (soggetto adulto). Lo spettrogramma a finestra lunga è stato ottenuto con un fra-
me di 512 punti (= 35,76 Hz) e frequenza di campionamento di 12.500 Hz. Lo spettrogramma a finestra
corta invece è stato ottenuto con frame di 200 punti (= 366,21 Hz) e frequenza di campionamento di
50000 Hz.

Lo spettrogramma a finestra corta fornisce un maggior numero di informazioni


sulle caratteristiche di risonanza del condotto vocale, con possibilità di ricavare no-
tizie su come il soggetto utilizza i propri organi articolatori.
Considerando sia la distribuzione spettrale sia l’intensità della componente ape-
riodica (rumore) sia le modificazioni delle armoniche, Yanagihara (1967) ha pro-
posto una classificazione spettrografica di gravità della disfonia. Lo studio inte-
ressava 167 pazienti che percettivamente presentavano disfonia lieve, moderata o
grave:
Tipo I: le regolari componenti armoniche sono frammiste alla componente di
rumore nella regione formantica delle vocali [a], [i], [u], [o] ed [e] (al di sotto dei
3000 Hz): disfonia lieve.
Tipo II: la componente di rumore nella seconda formante di [i] ed [e] predomi-
na sulla componente armonica, e compare lieve rumore anche alle frequenze al di
sopra dei 3000 Hz, sempre nelle stesse vocali ([i] ed [e]): disfonia moderata.
Tipo III: la seconda formante di [i] ed [e] è totalmente sostituita da rumore, che
aumenta ulteriormente al di sopra dei 3000 Hz: disfonia grave.
Tipo IV: le seconde formanti di [a], [i] ed [e] sono sostituite da rumore, le pri-
me formanti di tutte le vocali perdono la loro componente periodica; il rumore alle
alte frequenze aumenta di intensità: disfonia molto grave.
Nell’interpretazione dello spettrogramma bisogna considerare, come già sotto-
lineato, la presenza o meno di diplofonia, che graficamente si presenta come sub-
armoniche di intensità ridotta intercalate alle armoniche regolari.
L’esame spettroacustico della voce 153

Fig. 2.
Spettrogramma a finestra lunga di voce femminile patologica (soggetto adulto con cisti cordale). Dopo
il terzo secondo del vocalizzo (/a/ tenuta) compaiono due tratti di diplofonia.

La «diplofonia» consiste in un suono laringeo complesso a cui si sovrappone un


secondo suono complesso, con la seconda fondamentale subarmonica della prima,
più grave di un’ottava 12. La diplofonia viene prodotta da una vibrazione glottica di
ampiezza asimmetrica: dopo una vibrazione di una certa ampiezza ne segue una me-
no ampia 10. Non si ha la percezione di due suoni distinti, dal momento che il suono
è armonico e favorisce il raggruppamento delle armoniche rispetto alla fondamen-
tale bassa 20 (Fig. 2). Queste caratteristiche definiscono la diplofonia di primo gra-
do. La diplofonia di secondo grado è invece caratterizzata da una vibrazione di am-
piezza ridotta ogni due vibrazioni regolari; ne consegue che la seconda fondamen-
tale ha frequenza 1/3 rispetto alla prima e tra le armoniche del primo suono sono
presenti due sub-armoniche relative al secondo suono.
La diplofonia deve essere distinta dalla voce bitonale; in questo caso sono pre-
senti due frequenze fondamentali, che possono anche non essere in rapporto armo-
nico tra loro, poiché il secondo suono è prodotto da un’altra sorgente sonora larin-

IV.
5
154 A. Ricci Maccarini et al.

Fig. 3.
Spettrogramma «storico», a banda stretta, range 0-8000 Hz, di vocalizzo bitonale di Demetrio Stratos.
Si individuano due suoni acuti non in relazione armonica tra loro, uno con fo di 3700 Hz circa e con re-
siduo di 2° armonica (indicata dal triangolo pieno) e un altro suono «puro» di frequenza superiore ai
5000 Hz (indicato dal triangolo vuoto) (da Ferrero et al., 1980).

gea in aggiunta alla normale sorgente glottica. La seconda sorgente può essere rap-
presentata dalla vibrazione delle false corde o delle aritenoidi (Fig. 3).
Situazione del tutto diversa è la voce difonica, la cui genesi è riconducibile al-
l’azione di filtraggio selettivo operata dal tratto vocale sul suono glottico. La sor-
gente sonora è in questo caso unica (la glottide) e produce un suono complesso nor-
male. Grazie a una particolare conformazione del tratto vocale ed ad un preciso ac-
cordo fono-articolatorio, una armonica della seconda formante viene esaltata a sca-
pito di quelle contigue, al punto da renderla percepibile come un secondo suono
«puro» 24 12.
Il «canto difonico» rappresenta quindi il massimo effetto dell’azione di filtrag-
gio del segnale glottico operato dal tratto vocale.
L’effetto di risonanza del tratto vocale sopraglottico è appunto quello di aumen-
tare l’ampiezza di alcune armoniche filtrandone altre; se l’inviluppo spettrale del se-
gnale glottico si presenta monotonamente discendente senza minimi o massimi ap-
prezzabili, il segnale verbale evidenzia picchi o zone a massima energia, denomina-
te Formanti (F1, F2, F3, F4, ecc.) 9. Le Formanti rappresentano le frequenze di riso-
nanza del condotto vocale. Lo studio delle loro caratteristiche (frequenza, ampiezza
e banda), come già ricordato (vedi cap. II.4), consente dunque una valutazione di co-
me il soggetto utilizza le proprie cavità sovraglottiche.
La metodica utilizzata nella caratterizzazione delle formanti è l’LPC (Linear
Predictive Coding) che, a partire dal segnale verbale e mediante opportune opera-
zioni matematiche, emula le caratteristiche di quel filtro complesso e variabile nel
tempo costituito dal condotto vocale. Mediante il sistema CSL 4300 B è possibile
da un lato rilevare l’andamento delle frequenze formantiche sovrapposto allo spet-
trogramma a finestra corta e dall’altro ottenere i dati numerici relativi (Fig. 5). Le
problematiche inerenti l’utilizzo dell’LPC sono state esaurientemente discusse in
letteratura ed a questa si rimanda 16 19 4.
L’esame spettroacustico della voce 155

Fig. 4.
Spettrogramma a finestra lunga di vocalizzo difonico di Trân Quâng Hai. Si evidenzia la ridotta inten-
sità della fo, che viene tenuta fissa su una sola nota e l’intensificazione selettiva di una armonica della
seconda formante, che varia nel tempo (prima secondo una scala discendente e poi ascendente).

DETERMINAZIONE DELLA FREQUENZA FONDAMENTALE

È effettuata dai sistemi in commercio con modalità automatica utilizzando di-


verse metodiche ed algoritmi a precisione variabile 21. La natura quasi periodica de-
gli impulsi generati dalla laringe, e le successive modificazioni apportate dalla riso-
nanza del condotto vocale, possono infatti creare difficoltà nell’estrarre la Frequen-
za Fondamentale del segnale. Nel segmento temporale considerato come intervallo
di analisi (finestra di analisi), è possibile talvolta identificare due Periodi Fonda-
mentali (e quindi due fo) diversi.
Nel sistema CSL l’fo è calcolata con una metodica di autocorrelazione la quale
considera come più attendibile quel valore che meglio si correla con i parametri
estratti nei frames precedenti e successivi.
Al fine di ridurre la possibilità di errore è indispensabile «presettare» alcune va-
riabili di calcolo quali la lunghezza della finestra di analisi, il passo di avanzamen-
to della finestra, i valori minimi e massimi della fo attesa (Fig. 6) 3.
In ambito clinico l’estrazione della frequenza fondamentale (fo), il suo valore
numerico medio e il suo andamento nel tempo (curva di intonazione), sono impor-
tanti prodotti dell’analisi acustica, utili ai fini diagnostici e riabilitativi. Il valore nu-
merico medio può rientrare o meno nei range di normalità di un soggetto maschio
adulto, di una femmina adulta o di un bambino; la rappresentazione grafica della fo

IV.
5
156 A. Ricci Maccarini et al.

Fig. 5.
Andamento delle frequenze formantiche nel tempo della vocale [a] di soggetto femmina adulto nor-
mofonico sovrapposte ad uno spettrogramma a finestra corta. I valori numerici delle frequenze e bande
sono:
Formanti (Hz) Bande (Hz)
F1 872 170
F2 1343 312
F3 3064 197
F4 3982 126
F5 4956 386

Fig. 6.
Estrazione della fo con la metodica di autocorrelazione. Il segnale è la vocale [a] di un soggetto fem-
minile adulto; considerando un range di fo attesa compreso fra 100 e 300 Hz; per l’estrazione sono sta-
ti scelti i seguenti valori di pre-settaggio: lunghezza della finestra di analisi: 15 msec; passo di avanza-
mento: 15 msec, Fomin = 70 Hz, Fomax = 350 Hz; range frequenziale della finestra: 0-350 Hz. Il valore
medio ottenuto della fo è di 257 Hz.
L’esame spettroacustico della voce 157

nella dimensione temporale può dare informazioni sulla tenuta, sulla presenza di di-
plofonia, su modificazioni di rilievo del vocalizzo.

DETERMINAZIONE DELL’AMPIEZZA

La misurazione dell’Ampiezza di un segnale complesso qual è quello verbale


necessita di metodiche che si basano sui valori mediati delle ampiezze istantanee.
Generalmente è utilizzata l’ampiezza efficace (in inglese RMS amplitude: root
mean squared amplitude), cioè la radice quadrata della media dei quadrati delle am-
piezze istantanee 18. Il sistema CSL agisce sui valori di ampiezza dei campioni di da-
ti di finestre di analisi successive, e la lunghezza di queste condiziona la sensibilità
dell’algoritmo. Quanto più lunga è la finestra di analisi tanto minore è la sensibilità
alle rapide variazioni di ampiezza che nel tracciato appariranno «addolcite» (in in-
glese «smoothed»). Per ovviare a tali problemi di calcolo lo stesso sistema utilizza
una lunghezza di finestra uguale ad ogni periodo della forma d’onda. La lunghezza
della finestra è dunque variabile avendo ogni volta il valore del Periodo Fondamen-
tale misurato. La metodica è definita «pitch-synchronous». Se invece è preselezio-
nata una determinata lunghezza (i valori possibili nel sistema CSL operante in am-
biente Windows variano da 1 a 250 msec) l’estrazione dell’energia sarà «pitch asyn-
chronous».
L’estrazione dell’energia o ampiezza, particolarmente nella sua rappresentazio-
ne grafica (curva di intensità) fornisce informazioni sull’attacco vocale (dolce o du-
ro) e sulla tenuta di emissione (regolare, irregolare, modulata, interrotta, in caduta,
insufficiente) (Fig. 7).

Fig. 7.
Curva di intensità ottenuta con metodica RMS. A destra, di un soggetto femminile adulto normofonico;
a sinistra, di un soggetto femminile affetto da tremore vocale. In quest’ultimo caso si noti l’incapacità
a mantenere una regolare tenuta di emissione.

IV.
5
158 A. Ricci Maccarini et al.

Il software Real-Time Pitch Extraction, supportato dal sistema CSL, fornisce


in tempo reale il grafico dell’andamento della fo e dell’ampiezza, ed in tempo dif-
ferito i valori statistici relativi. Il suo utilizzo riveste importanza, oltre che diagno-
stica, soprattutto riabilitativa poiché costituisce un modello target nel trattamento
dei disturbi della voce.

PARAMETRI DI VOCALITÀ

Il segnale vocale è un suono complesso quasi periodico, presenta cioè, anche se


prodotto con la massima stazionarietà e da un soggetto normofonico, variazioni del
Periodo Fondamentale e dell’Ampiezza, a breve e/o a lungo termine.
Le modificazioni casuali a breve termine (microperturbazioni) del Periodo Fon-
damentale, e quindi della fo, sono definite come jitter, mentre quelle dell’Ampiezza
come shimmer.
Le variazioni regolari delle stesse caratteristiche del segnale a lungo termine
(più o meno periodiche) costituiscono al contrario le così dette modulazioni di Fre-
quenza ed Ampiezza (tremori di Frequenza ed Ampiezza) e di esse è calcolabile sia
la frequenza che la profondità 15.
Oltre a questi parametri è stato poi introdotto anche il rapporto fra energia ar-
monica e disarmonica (HNR: Harmonic to Noise Ratio) o il suo «inverso» (NHR:
Noise to Harmonic Ratio), la quantificazione della diplofonia semplice o multipla,
la misurazione delle interruzioni momentanee o irregolari dell’emissione.
Il software MDVP (Multi-Dimensional Voice Program), supportato dal sistema
CSL, con frequenza di campionamento di 25000 o 50000 Hz di una emissione, per
default, di tre secondi (in genere una [a]), calcola tutti questi parametri offrendo nel
contempo rappresentazioni grafiche originali.
L’algoritmo di calcolo del jitter e shimmer effettua una media delle differenze
di durata o ampiezza di periodi successivi adiacenti; il risultato può essere espresso
in valore assoluto (jitter in µs: Jita, shimmer in dB: ShdB) o in percentuale (%) di-
videndo rispettivamente i valori assoluti per il valore medio del Periodo Fondamen-
tale e dell’Ampiezza (Jitt e Shim nel sistema MDVP). Altri parametri che esplora-
no le stesse caratteristiche sono ottenuti mediante sotto-medie di periodi adiacenti
(3, 5, 11 o altri valori definibili dall’utente), e ciò al fine di ridurre l’errore dovuto
ad inadeguata estrazione del Periodo Fondamentale. Ne derivano, in percentuale, i
parametri RAP (Perturbazione Relativa Media: Relative Average Perturbation),
PPQ (Quoziente di Perturbazione di fo: Pitch Period Perturbation Quotient), sPPQ
(Quoziente Mediato di Perturbazione di fo: Smoothed Pitch Period Perturbation
Quotient) per il jitter, ed i parametri APQ (Quoziente di Perturbazione di Ampiez-
za: Amplitude Perturbation Quotient), sAPQ (Quoziente Mediato di Perturbazione
di Ampiezza: Smoothed Amplitude Perturbation Quotient) per il shimmer.
Le modulazioni di Frequenza ed Ampiezza, nelle loro caratteristiche di fre-
quenza ed ampiezza (o profondità), sono espresse, per la frequenza (in Hz), dai pa-
rametri Fftr (Frequenza del tremore della Fo: Fo – Tremor Frequency) e Fatr (Fre-
quenza del tremore in ampiezza: Amplitude Tremor Frequency) e, per la profondità
(in %), dai parametri FTRI (Indice di profondità del tremore in frequenza: Fre-
L’esame spettroacustico della voce 159

quency Tremor Intensity Index) ed ATRI (Indice di profondità del tremore in am-
piezza: Amplitude Tremor Intensity Index).
Le variazioni percentuali complessive a breve ed a lungo termine, casuali o re-
golari, sono rilevate per la frequenza dal parametro vFo (Variazione di Fo: Funda-
mental Frequency Variation) e per l’ampiezza da vAm (Variazione di Ampiezza di
Picco: Peak Amplitude Variation), calcolate rispettivamente dal rapporto fra la de-
viazione standard ed il valore medio della fo e dell’Ampiezza.
I bilanci energetici spettrali in diversi range frequenziali sono espressi, in valo-
re assoluto, mediante i parametri:
• NHR (Rapporto Rumore-Armoniche: Noise to Harmonic Ratio): rapporto
medio di energia fra le componenti disarmoniche (rumore) nella banda 1500-
4500 Hz e le componenti armoniche nella banda 70-4500 Hz.
• VTI (Indice di Turbolenza: Voice Turbulence Index): rapporto medio fra le
componenti di energia spettrale disarmonica (di rumore) nella banda 2800-
5800 Hz e le componenti di energia spettrale armonica nella banda 70-4500
Hz. Il parametro dovrebbe essere altamente correlato con la turbolenza se-
condaria ad incompleta o lenta adduzione delle corde vocali, cioè con la voce
definita «soffiata».
• SPI (Indice di Fonazione Sommessa: Soft Phonation Index): rapporto medio
fra l’energia spettrale armonica nella banda 70-1600 Hz, e l’energia spettrale
armonica nella banda 1600-4500 Hz. Questo parametro non è una misura del
livello di rumore, ma piuttosto della struttura armonica dello spettro.
I rimanenti parametri sono relativi alla obbiettivazione della diplofonia (DSH in
% o grado di diplofonia: Degree of sub-harmonic components, ed NSH in valore as-
soluto o numero di segmenti diplofonici: Number of Sub-Harmonic Segments), del-
le interruzioni momentanee della sonorità (DVB in % o grado di rotture della sono-
rità: Degree of Voice Breaks, ed NVB in numero assoluto o numero di rotture della
sonorità: Number of Voice Breaks), e degli arresti irregolari della sonorità (DUV in
% o grado di sordità: Degree of Voiceless, ed NUV in numero assoluto o numero di
segmenti sordi: Number of Unvoiced Segments). Il valore normativo di questi è per
definizione uguale a zero in quanto una voce normale sostenuta non dovrebbe ave-
re zone di interruzione né segmenti diplofonici.
L’MDVP fornisce due videate grafiche di cui una consente di valutare «a vista»
i valori parametrici in soglia o che eccedono la normalità, costituendo per l’otorino-
foniatra quello che l’audiogramma è per l’audiologo, ed a ben ragione è dunque de-
finito «vocaligramma» 7 (Fig. 8).
L’utilizzo di questi parametri offre la possibilità di disporre di dati oggettivi in
grado di caratterizzare una determinata disfunzione vocale. In particolare permette
la integrazione con quella soggettività insita non solo nella valutazione uditivo-per-
cettiva della voce, ma anche nella stessa valutazione spettrografica. Infatti anche in
quest’ultima l’interpretazione si basa prevalentemente su una impressione visiva
che condiziona un giudizio ampiamente soggettivo.
Disporre di una vasta gamma di parametri di vocalità, come sopra elencato, può
risultare clinicamente utile in quanto alcuni di questi possono essere caratterizzanti
per una certa patologia. Ad esempio una voce soffiata può avere i parametri relativi
alle perturbazioni a breve termine nella norma, e valori dei parametri relativi alla

IV.
5
160 A. Ricci Maccarini et al.

Fig. 8.
Vocaligramma. Il segnale analizzato è costituito Fig. 9.
dalla vocale [a] emessa ad intensità ed altezza Riduzione dei 33 parametri di vocalità a 11. Il se-
confortevoli e costanti per tre secondi da un sog- gnale è lo stesso della Figura 5.
getto femmina disfonico. La circonferenza ester-
na della corona rappresenta i limiti normativi di
soglia dei diversi parametri. Questi sono indivi-
duati dai raggi che riportano al loro limite ester-
no i rispettivi acronimi. I valori sperimentali cal-
colati per ciascun parametro cadono nell’interse-
zione del proprio raggio col perimetro esterno di
un’area che presenta un colorito marrone se il va-
lore stesso è inferiore al valore di soglia, o rosso
se eccede la normalità. Il sistema MDVP calcola
in totale 33 parametri, ma solo 22 sono graficati
nella modalità rappresentata in figura.

turbolenza anomali. Così pure i parametri relativi al tremore che misurano l’insta-
bilità della voce a lungo termine possono risultare patologici in pazienti affetti da
morbo di Parkinson e normali in altre patologie laringee 8.
D’altra parte molti dei parametri elencati sono certamente ridondanti poiché
esprimono, con algoritmi diversi, una identica caratteristica vocale. Numerose ri-
cerche da un lato suggeriscono di ridurre i parametri MDVP convenzionalmente uti-
lizzabili a soli undici (Fig. 9) e dall’altro sottolineano la opportunità che ogni labo-
ratorio si attrezzi di una propria normativa 14 15 2 4. Infatti, a parità di utilizzo del me-
desimo sistema di analisi, ogni gruppo di lavoro può presentare modalità assai di-
verse sia per la registrazione, le situazioni di rumore ambientale, i microfoni … etc.
Questi fattori, insieme alla diversa tipologia della popolazione considerata e al di-
verso giudizio di qualità vocale, possono determinare con relativa facilità variazio-
ni non trascurabili della soglia di normalità e quindi della categorizzazione nosolo-
gica del soggetto.
Presenteremo ora alcuni esempi clinici.
Caso 1: soggetto di sesso femminile, età 37 anni, normofonico.
In Figura 10, nelle diverse finestre, sono rappresentati: A: forma d’onda della
L’esame spettroacustico della voce 161

Fig. 10.
Analisi acustica di un soggetto femminile normofonico (vedi testo).

vocale [a] sostenuta; B: spettrogramma a finestra lunga di analisi; C: andamento del-


la fo e dell’intensità nel tempo; D: vocaligramma. Si noti la regolare tenuta sia del-
l’intensità che della Frequenza Fondamentale e la regolarità delle armoniche nello
spettrogramma; in quest’ultimo tuttavia si può intravedere energia disarmonica (ru-
more) a bassa intensità, intercalata alla tessitura armonica e non sostitutiva.
Il vocaligramma evidenzia tutti gli indici di vocalità entro i limiti normativi. Il
parametro ATRI, relativo alla profondità delle modulazioni di Ampiezza, non è gra-
ficato in quanto il suo valore è inferiore alla soglia di analisi del sistema che per de-
fault è 4,37%.
In Tabella I sono riportati i valori degli indici vocaligrafici.
Caso 2: maschio di 27 anni affetto da paralisi cordale sinistra post-tiroidectomia
con inadeguato compenso cordale controlaterale. Analisi acustica prima della tera-
pia logopedica.
Nella finestra A della Figura 11 sono riportate le forme d’onda di tre [a] soste-
nute; la porzione di forma d’onda della terza [a], delimitata dai cursori in blu (circa
tre secondi), rappresenta la parte del segnale sottoposto ad analisi multiparametrica
con il sistema MDVP e la cui rappresentazione grafica è riportata nella finestra D.
La finestra B evidenzia lo spettrogramma relativo con scarsa rappresentazione del-
la tessitura armonica, presenza di rumore intercalato alle armoniche alle basse fre-
quenze e completamente sostitutivo alle medio-alte (grado tre sec. Yanagihara). Si
intravede inoltre diplofonia, soprattutto nella seconda e terza [a]. Nella stessa fine-
stra sono riportati i cursori (in blu) che delimitano la porzione di spettrogramma cor-
rispondente alla parte della forma d’onda analizzata con il sistema MDVP. La cor-

IV.
5
162 A. Ricci Maccarini et al.

Tab. I.
Valori parametrici vocaligrafici del soggetto di cui sopra.

Average Fundamental Frequency Fo 213,85 Hz


Average Pitch Period To 4,677 ms
Average Fundamental Frequency Fo 213.85 Hz
Average Pitch Period To 4,677 ms
Jitter Jitt 0,6 %
Fundamental Frequency Variation vFo 0,989 %
Shimmer Percent Shim 2,418 %
Peak-to-Peak Amplitude Variation vAm 6,971 %
Noise to Harmonic Ratio NHR 0,116
Voice Turbulence Index VTI 0,039
Soft Phonation Index SPI 4,087
Fo-Tremor Intensity Index FTRI 0,158 %
Degree of Voice Breaks DVB 0 %
Degree of Sub-harmonics DSH 0 %

rispondenza è ottenuta mediante il comando «Link Windows …» del menù. Questa


modalità di analisi è importante in quanto consente di controllare i dati spettrogra-
fici con l’analisi obbiettiva multiparametrica. Si noti inoltre la scarsa tenuta della fo
e dell’intensità. In Tabella II sono riportati i valori numerici vocaligrafici relativi.

Fig. 11.
Analisi acustica prima della terapia logopedica di soggetto maschio affetto da paralisi cordale sinistra
(vedi testo).
L’esame spettroacustico della voce 163

Tab. II.
Valori numerici vocaligrafici pre-terapia logopedia.

Average Fundamental Frequency Fo 123,409 Hz


Average Pitch Period To 8,972 ms
Jitter Percent Jitt 2,852 %
Fundamental Frequency Variation vFo 35,725 %
Shimmer Percent Shim 16,33 %
Peak-to-Peak Amplitude Variation vAm 35,486 %
Noise to Harmonic Ratio NHR 0,295
Voice Turbulence Index VTI 0,073
Soft Phonation Index SPI 11,394
Amplitude Tremor Intensity Index ATRI 17,633 %
Degree of Voice Breaks DVB 4,29 %
Degree of Sub-harmonics DSH 13,095 %

Il paziente ha seguito riabilitazione logopedica (dodici sedute) ottenendo una


completa chiusura glottica fonatoria; persiste tuttavia la paralisi cordale sinistra.
All’analisi acustica di tre [a] sostenute e consecutive (Fig. 12), si rileva un ri-
pristino della tessitura armonica anche alle alte frequenze con intercalato rumore
parzialmente sostitutivo alle alte frequenze; non si evidenzia diplofonia. La valuta-
zione mediante MDVP è stata effettuata con la stessa modalità di cui sopra, ossia de-
limitando una porzione di forma d’onda di circa tre secondi con controllo visivo del-

Fig. 12.
Analisi acustica successiva alla terapia logopedica.

IV.
5
164 A. Ricci Maccarini et al.

Tab. III.
Valori numerici degli indici di vocalità post-trattamento logopedico.

Average Fundamental Frequency Fo 110,578 Hz


Average Pitch Period To 9,044 ms
Jitter Percent Jitt 0,317 %
Fundamental Frequency Variation vFo 0,73 %
Shimmer Percent Shim 3,498 %
Peak-to-Peak Amplitude Variation vAm 7,337 %
Noise to Harmonic Ratio NHR 0,126
Voice Turbulence Index VTI 0,091
Soft Phonation Index SPI 5,811
Fo-Tremor Intensity Index FTRI 0,091 %
Amplitude Tremor Intensity Index ATRI 0,915 %
Degree of Voice Breaks DVB 0 %
Degree of Sub-harmonics DSH 0 %

lo spettrogramma corrispondente. Il vocaligramma riporta una riduzione significati-


va di molti dei parametri che prima della terapia eccedevano la normalità. Persiste
un aumento lieve dello Shim e maggiormente del parametro VTI, indice di rumore
alle più alte frequenze. In Tabella III i valori numerici relativi.

FONETOGRAFIA

La metodica rappresenta graficamente e misura l’intensità minima e massima di


emissione vocale alle diverse frequenze, dalle più gravi alle più acute. È dunque una
rappresentazione dell’entità del campo vocale del soggetto. In ascissa è riportata la
frequenza ed in ordinata l’intensità; il grafico risultante (Fonetogramma) è essen-
zialmente costituito da due linee: la cosiddetta «curva dei piani» che rappresenta l’e-
stensione vocale alle più deboli intensità, e la «curva dei forti» che indica l’esten-
sione alle intensità più elevate.
Operativamente, ad esempio mediante una tastiera sonora, viene prodotto un
suono che il soggetto deve riprodurre alla massima e minima intensità; se l’altezza
del vocalizzo eseguito corrisponde a quella richiesta dall’esaminatore, l’intensità ri-
levata con un fonometro, posizionato a 30 cm dalla bocca, è riportata sul grafico in
corrispondenza della frequenza fondamentale emessa. Una tale modalità può essere
lunga e laboriosa, poiché richiede da parte dell’esaminando e dell’esaminatore un
«orecchio musicale». Queste difficoltà sono attualmente superabili con metodi
informatici che utilizzano softwares che consentono la rilevazione del campo voca-
le anche in soggetti «stonati», richiedendo l’esecuzione alla massima e alla minima
intensità di una scala musicale o di una «sirena», che dalla nota più grave arriva fi-
no a quella più acuta. Nelle figure seguenti (Figg. 13 e 14) sono esemplificati i cam-
pi vocali ottenuti con metodica tradizionale (Restricted plot to target tone) e con me-
todica di registrazione di tutte le emissioni del soggetto testato (Plot all input), uti-
lizzando il software Voice Range Profile (VRP) Model 4.326 della Kay Elemetrics
Corp.
L’esame spettroacustico della voce 165

Fig. 13.
Fonetogramma di un cantante maschio in modalità «Restricted Plotto TargetTone», vocale [a]. L’esten-
sione tonale è di circa 3 ottave. La freccia indica il «passaggio di registro».

Fig. 14.
Fonetogramma ottenuto con modalità «Plot All Inputs» di una voce femminile; range tonale di circa 2
ottave.

Il range tonale nei soggetti normali è di almeno due ottave (24 note successive
o «semitoni»); esso può aumentare fino a tre ottave nei cantanti professionisti e può
ridursi a pochi semitoni in caso di patologia laringea.
La dinamica della intensità è massima nelle note centrali dell’estensione tonale
e si riduce sia verso le note più gravi sia verso le più acute.
I più importanti parametri di valutazione sono:
a) il range in semitoni; b) la massima frequenza; c) la minima intensità; d) la ri-

IV.
5
166 A. Ricci Maccarini et al.

duzione di dinamica in intensità che si può osservare nella nota del «passaggio di
registro» (Fig. 13) (I).
La fonetografia ha una notevole importanza nella classificazione della voce can-
tata e nella diagnosi delle disodie, ma attualmente si assiste ad una sua sempre mag-
giore applicazione anche nella diagnostica e nel follow-up delle disfonie 26 27 5.
Con la combinazione di diversi parametri acustici Wuyts et al. (IV) hanno pro-
posto un indice caratterizzante la gravità della disfonia (Dysphonia Severity Index
– Indice di Severità della Disfonia). I parametri acustici utilizzati sono il Tempo Fo-
natorio Massimo in sec. (MPT), la massima frequenza in Hz (Fo – High), la mini-
ma intensità in dB (I – Low) e il Jitter in %. I valori di massima frequenza e mini-
ma intensità sono ottenuti dal fonetogramma, mentre il valore del Jitter viene otte-
nuto dal grafico dell’MDVP. Mediante un’analisi discriminativa lineare di Fisher gli
AA definiscono la seguente formula:

DSH = 0,13 x TMF + 0,0053 x Fo max – 0,26 x I min – 1,18 x Jitter % + 12,4

Una voce normale ottiene valori di DSI intorno a + 5, mentre una disfonia lie-
ve (G1) corrisponde ad un DSI di + 1, una disfonia moderata (G2) corrisponde ad
un DSI di - 1,4 ed una disfonia grave (G3) corrisponde ad un DSI di - 5. Secondo
l’esperienza degli Autori, eventuali artefatti o irregolarità nel calcolo del DSI pos-
sono avvenire soprattutto se non viene valutato accuratamente il valore della mi-
nima intensità nel fonetogramma. Questa metodica merita di essere presa in con-
siderazione nella batteria delle indagini per la valutazione della voce, anche se ne-
cessita di essere sperimentata da vari operatori del settore per la sua validazione
definitiva.

PROTOCOLLO PER L’ESAME SPETTROACUSTICO DELLA VOCE

Negli ultimi cinque anni abbiamo messo a punto, presso i nostri laboratori di fo-
niatria, un protocollo per l’effettuazione dell’esame spettroacustico della voce. Dal
1° gennaio del 2000 il protocollo viene eseguito nella sua versione «definitiva». Es-
so prevede l’utilizzo dello spettrografo computerizzato CSL 4300B della Kay Ele-
metrics (attualmente nella versione «DOS» ma prossimamente nella versione «win-
dows»), contenente i principali programmi per l’effettuazione della spettrografia
(CSL50), il calcolo dei parametri di vocalità (Multi Dimensional Voice Program –
MDVP) e il fonetogramma (VRP).
Lo scopo di questa standardizzazione dell’esame spettroacustico è quello di of-
frire al foniatra una metodica di facile e rapida esecuzione, che nel contempo dia le
principali informazioni per una caratterizzazione quali-quantitativa della voce nor-
male e patologica (similmente a quanto fu proposto per l’esame spettroacustico del-
la voce cantata) 22.
Questo protocollo fa parte di un più ampio progetto realizzato dalla Società Ita-
liana di Foniatria e Logopedia per la proposta di un protocollo standardizzato per la
valutazione soggettiva od oggettiva della voce 23.
L’esame spettroacustico della voce 167

Tab. IV.
Metodica procedurale da seguire per l’esame spettroacustico della voce (De Jongkere 5; De Colle 4; Di
Nicola 8).

Metodica procedurale per la registrazione della voce per l’analisi acustica


• ambiente silente (< 30 dB di rumore di fondo)
• microfono a 10 cm dalle labbra (30 cm per il fonetogramma), angolato di 45°
• regolazione della saturazione d’ingresso predeterminata ed invariabile a 5/9 del CH1 (o a 6/9 se la
distanza del microfono dalla bocca è di 20 cm, come raccomandati da Di Nicola)
• intensità di voce di conversazione

METODICA E PROCEDURA

La premessa fondamentale per la corretta esecuzione dell’esame spettroacusti-


co della voce è l’applicazione di una rigorosa metodica procedurale per la registra-
zione della voce da analizzare (Tab. IV), che deve essere sempre rispettata se si vuo-
le che i dati ottenuti siano attendibili e confrontabili.
Ogni laboratorio si deve inoltre dotare di una propria normativa per quanto ri-
guarda i valori di normalità e di patologia per i diversi tipi di parametri acustici da
analizzare.
Nella Tabella V sono riportati i valori di soglia (media + 1 e media + 2 DS) ot-
tenuti nel nostro laboratorio, considerando 100 soggetti normofonici (48 maschi e 42
femmine); sono riportati inoltre i valori di soglia per default forniti dalla Kay.
Il protocollo si articola in sei «steps»:
1. Valutazione del Tempo Massimo Fonatorio (TMF, v.n. (10 sec) 17, sulla vo-
cale /a/. La prova viene ripetuta tre volte, considerando solo il massimo va-
lore ottenuto.
2. Previo adeguato allenamento del soggetto, registrazione (alla normale voce
di conversazione) di un messaggio contenente:

Tab. V.
Limiti normativi superiori ottenuti con la media più una e due deviazioni standard. Sono riportati an-
che i limiti proposti a default 5.

Parametro Media + 1 DS Media + 2 DS Default

Jitt -% 0,69 0,92 1,04


vFo -% 1,02 1,22 1,10
Shim -% 2,94 3,64 3,81
vAm -% 9,41 11,38 8,20
NHR M 0,142 0,158 0,190
F 0,124 0,136
VTI 0,052 0,063 0,061
SPI M 15,483 19,663 14,120
F 9,711 12,807
FTRI -% 0,48 0,63 0,95
ATRI -% 3,79 4,97 4,37

IV.
5
168 A. Ricci Maccarini et al.

G 0

I 0

R 0

B 0

A 0

S 0

Fig. 15.
MDVP di soggetto maschile normofonico. A lato viene riportata la valutazione percettiva.

• cognome e nome;
• i numeri da 1 a 10;
• la parola /aiuole/;
• le cinque vocali I, E, A, O, U prolungate per almeno 4 sec;
• la frase di una nota canzone: «Fra Martino, campanaro, dormi tu».
Tale messaggio può essere registrato direttamente su PC con l’utilizzo dei di-
versi programmi (CSL50 o altri software da questo supportati) o su DAT (Digital
Audio Tape).
Questo esempio vocale può essere utilizzato sia per l’analisi acustica sia per la
valutazione percettiva della voce. Come già riportato nel capitolo (vedi cap. IV.2),
per la valutazione percettiva della voce utilizziamo la metodica «GIRBAS», secon-
do le indicazioni del Committee of Phoniatrics della European Laryngological So-
ciety 6.
3. Analisi spettrografica della vocale /a/ mediante il programma CSL.
Il segnale viene previamente «decampionato» da 50.000 Hz a 10.000 Hz e quin-
di viene eseguito lo spettrogramma a «finestra lunga» (600 punti) nel range fre-
quenziale 0-4000 Hz, al fine di visualizzare le componenti armoniche, le compo-
nenti di rumore e le eventuali diplofonie. L’interpretazione dello spettrogramma si
basa essenzialmente sulla valutazione della componente di rumore. A tale scopo non
potendo essere utilizzata la classificazione di Yanagihara, che necessita di uno spet-
trogramma con cinque vocali, è possibile utilizzare la seguente classificazione, de-
dotta dalla prima, ma basata solo sulle regioni frequenziali (e non anche sulle re-
gioni formantiche):
L’esame spettroacustico della voce 169

Fig. 16.
Spettrogramma a sinistra e grafico MDVP a destra della stessa vocale [a] di un soggetto maschile con
disfonia da sulcus glottidis. Esame pre-operatorio.

TIPO I: si evidenziano distintamente le componenti armoniche frammiste al-


le componenti di rumore presenti nel range 0-3000 Hz;
TIPO II: nel range 2000-4000 Hz le componenti di rumore predominano sul-
le componenti armoniche;
TIPO III: si evidenzia solo rumore nel range 2000-4000 Hz;
TIPO IV: il rumore predomina su tutto lo spettro. Solo la frequenza fonda-
mentale e le armoniche fino ai 500 Hz possono essere evidenziate.
Nel caso di presenza diplofonie nello spettrogramma viene aggiunta una /d/ ac-
canto al numero relativo alla classe di rumore (es. Tipo IIId).
4. Calcolo dei parametri di vocalità mediante sistema MDVP, della stessa vo-
cale /a/ previamente registrata a 50.000 Hz (e poi decampionata per l’anali-
si spettrografica). Del vocalizzo sono considerati solo i tre secondi centrali
eliminando l’attacco e l’estinzione dell’emissione. Si prendono in conside-
razione gli 11 parametri vocaligrafici come sopra indicato.
La spettrografia della stessa vocale /a/ utilizzata per l’MDVP offre la possibilità
di un controllo visivo di parametri come l’NHR (rapporto rumore/armoniche) o il
DSH (grado di diplofonia).
Si evitano così errori di valutazione che si possono verificare se ci si basa esclu-
sivamente sui parametri «quantitativi» forniti dall’MDVP. Nelle figure 16 e 17 so-
no riportati ad esempio i grafici MDVP ed i relativi spettrogrammi di un soggetto
maschile con disfonia da sulcus glottidis, valutato prima e dopo intervento di fono-
chirurgia.
Nell’esame pre-operatorio (Fig. 16) si evidenzia una marcata componente di ru-
more nello spettrogramma (Tipo II), mentre il valore dell’NHR nell’MDVP è nei li-
miti della norma.
Nell’esame post-operatorio (Fig. 17) il valore dell’NHR rimane sempre norma-
le, ma questa volta corrisponde alla classe di rumore (zero) dello spettrogramma.
Nella Figura 18 è riportato l’esame di un soggetto femminile con disfonia da ci-

IV.
5
170 A. Ricci Maccarini et al.

Fig. 17.
Spettrogramma a sinistra e vocaligramma a destra della vocale [a] dello stesso soggetto della figura pre-
cedente. Esame post-operatorio.

sti cordale. Anche qui il programma MDVP non riporta un valore corretto: si tratta
in questo caso del grado di diplofonia (DSH), che risulta nei limiti della norma. In
realtà la voce è fortemente diplofonica, tanto da presentare sub-armoniche continue
in tutti i tre secondi analizzati. La frequenza fondamentale sub-armonica (di 135 Hz)
viene considerata dal programma MDVP come la normale frequenza fondamentale
(normale per un soggetto maschile!) e di conseguenza il valore del DSH risultava
nella norma. Lo spettrogramma mette invece in evidenza la diplofonia.
5. Studio spettrografico della parola /aiuole/ utilizzando sempre il programma
CSL50 ed applicando il settaggio della finestra a 600 punti. Se il segnale vie-
ne registrato direttamente nel CSL si utilizza un campionamento di 10.000

Fig. 18.
Spettrogramma a sinistra e vocaligramma a destra della stessa vocale [a] di un soggetto femminile con
disfonia da cisti intracordale.
L’esame spettroacustico della voce 171

Fo: 123 Hz

Fig. 19.
Spettrogramma della parola /aiuole/ di soggetto maschile normofonico. È riportato sovrapposto anche il
valore della fo media

Hz, mentre se il segnale era stato registrato su DAT a 50.000 Hz è necessa-


rio decampionarlo a 10.000 Hz (come precedentemente descritto per la vo-
cale /a/). Viene valutata sia la gravità della disfonia secondo la classificazio-
ne di Yanagihara, con la presenza di eventuali diplofonie, sia la frequenza
fondamentale media, che corrisponde in modo più attendibile (rispetto a
quella della vocale /a/) alla frequenza fondamentale media della voce di con-
versazione (Fig. 19).
6. Esecuzione del fonetogramma mediante il programma Voice Range Profile
(VRP). Per poter eseguire il fonetogramma anche in soggetti «stonati» o co-
munque privi di «orecchio musicale» viene utilizzata la modalità «automati-
ca» (Plot All Inputs). La vocale richiesta è la /a/ con produzione di una sca-
la musicale o di una sirena, dalla nota più grave a quella più acuta, prima al-
la massima intensità, poi alla minima intensità. La prova può essere ripetuta
più volte ed ogni volta il «campo vocale» viene ulteriormente aggiornato, fi-
no ad ottenere il massimo delle possibilità del soggetto esaminato.
I parametri presi in considerazione nel grafico ottenuto sono:
• la frequenza e la nota più acuta;

IV.
5
172 A. Ricci Maccarini et al.

Fig. 20.
Fonetogramma di soggetto maschile normofonico.

• la frequenza e la nota più grave;


• il range tonale in semitoni;
• la minima intensità;
• l’intensità massima a livello della fo media della voce di conversazione (pre-
cedentemente determinata sulla parola /aiuole/);
• la riduzione della dinamica in intensità (in particolare per l’aumento dell’in-
tensità minima) a livello della nota corrispondente al passaggio di registro
(Fig. 20).
I valori di alcuni parametri ottenuti nei diversi tipi di esame vengono utilizzati
per il calcolo dell’Indice di Severità della Disfonia (Dysphonia Severity Index 27).
Il calcolo dell’indice può essere effettuato in modo automatico mediante foglio di
calcolo (Excel).
Le quattro stampe relative agli esami acustici (spettrogramma della vocale /a/ e
della parola /aiuole/, vocaligramma, fonetogramma) vengono inserite nella cartella
clinica del paziente.
La durata totale per l’esecuzione delle prove e delle quattro stampe degli esami
è di circa 20 minuti.
Riportiamo alcuni esempi di applicazione del protocollo per l’esame spettroa-
custico della voce in casi di soggetti disfonici.
L’esame spettroacustico della voce 173

Caso 1
Donna di 40 anni, con disfonia da paralisi della corda vocale sinistra.

Protocollo acustico pre-operatorio

G 2

I 2

R 1

B 3

A 3

S 1

Fig. 21.
MDVP. Si evidenziano valori alterati di Jitter, Shimmer, VTI e DSH. La valutazione percettiva (sul la-
to destro) evidenzia una disfonia moderata (G2) con marcata alterazione tipo «voce soffiata» (B3).

TMF: 7 sec

Fig. 22.
Spettrogramma della vocale /a/ utilizzata per
l’MDVP. Si evidenziano componenti di ru-
more classificabile come tipo III (sec. Yana-
gihara modificato). A lato viene riportato il
valore del Tempo Massimo Fonatorio.

IV.
5
174 A. Ricci Maccarini et al.

Fo: 199 Hz

Fig. 23.
Spettrogramma della parola /aiuole/.
Classe di rumore tipo III. A lato viene ri-
portato il valore della frequenza fonda-
mentale media.

Fig. 24.
Fonetogramma. Range: 16 semitoni.
L’esame spettroacustico della voce 175

Protocollo acustico post-operatorio


Stesso paziente dopo intervento di iniezione intracordale di grasso autologo (8 a giornata).

G 1

I 1

R 0

B 1

A 1

S 1

Fig. 25.
MDVP. Jitter migliorato, così come il VTI ed il DSH, ma Shimmer peggiorato. La valutazione percet-
tiva evidenzia un miglioramento del grado globale di disfonia (G1 disfonia lieve) e in particolare della
«voce soffiata» (B1).

Fig. 26.
Spettrogramma della vocale /a/ utilizza-
ta per l’MDVP. Classe di rumore tipo I.
Tempo Massimo Fonatorio aumentato.

IV.
5
176 A. Ricci Maccarini et al.

Fo: 205Hz

Fig. 27.
Spettrogramma della parola /aiuole/. Lieve diplofonia nella /a/. Classe di rumore: tipo I.

Fig. 28.
Fonetogramma. Range: 14 semitoni.
L’esame spettroacustico della voce 177

Caso 2
Donna di 54 anni, con disfonia da paralisi della corda vocale sinistra.

Protocollo acustico pre-operatorio

G 2

I 3

R 3

B 2

A 1

S 3

Fig. 29.
MDVP. Si evidenziano valori alterati di Jitter, Shimmer, VTI e soprattutto DSH. La valutazione percet-
tiva evidenzia una disfonia moderata (G2), con marcata alterazione della «voce rauca» con la presenza
di diplofonia (R3).

Fig. 30.
Spettrogramma della /a/ utilizzata per
l’MDVP. Si evidenzia marcata diplofo-
nia. Classe di rumore di tipo IId.

IV.
5
178 A. Ricci Maccarini et al.

Fig. 31.
Spettrogramma della parola /aiuole/. Si evidenziano diplofonie in tutte le vocali. Classe di rumore di ti-
po IId.

Fig. 32.
Fonetogramma. Campo vocale molto
«povero». Range di 8 semitoni.
L’esame spettroacustico della voce 179

Protocollo acustico post-operatorio


Dopo intervento di tiroplastica tipo I (8° giornata).

G 0

I 1

R 1

B 0

A 0

S 0

Fig. 33.
MDVP. Si evidenzia ancora alterazione del DSH, del Jitter, dello Shimmer e del VTI, mentre la valuta-
zione percettiva risulta pressoché nella norma.

TMF: 8 sec
Fig. 34.
Spettrogramma della vocale /a/ utilizza-
ta per l’MDVP. L’entità della diplofonia
è ridotta e la classe di rumore è di tipo II.
Il Tempo Massimo Fonatorio rimane di
8 sec.

IV.
5
180 A. Ricci Maccarini et al.

Fig. 35.
Fonetogramma. Il campo vocale è ora
ben rappresentato sia in intensità che in
frequenza, con un range di 10 semitoni.

CONCLUSIONI

Questo protocollo per l’analisi acustica della voce è stato da noi applicato fino-
ra a 1160 soggetti; è risultato di facile e veloce applicabilità e di grande utilità nel
follow-up dopo un trattamento medico, logopedico e/o chirurgico.
L’analisi acustica è stata associata alle altre indagini clinico-strumentali con-
template nel protocollo per la valutazione della voce proposto dalla Società Italiana
di Foniatria e Logopedia 23, in accordo con quanto proposto dal Committee of Pho-
niatrics della European Laryngological Society 6.
Come già ribadito da molti Autori 6 5, la valutazione del prodotto vocale deve es-
sere multidimensionale perché multidimensionale è il meccanismo della sua produ-
zione; essa deve comprendere una valutazione percettiva, videostroboscopica, acu-
stica, aerodinamica, e soggettiva da parte del paziente. Una buona diagnosi può sca-
turire solo dall’integrazione ragionata di tutti questi dati.
In ambito prettamente acustico valgono le stesse considerazioni: i numerosi e
nuovi dati parametrici offerti dalla moderna tecnologia digitale non possono in al-
cun modo fornire una valutazione completa delle caratteristiche vocali del soggetto.
Essi sono dati aggiuntivi rispetto alle più tradizionali analisi quali la spettrografia e
la fonetografia. Gli stessi parametri forniti dall’MDVP, pur nella loro pregnante og-
gettività, sono dati mediati e quindi carenti nel fornire informazioni sulle variazioni
temporali del prodotto vocale. Inoltre gli stessi algoritmi utilizzati possono in alcu-
ni casi essere inadeguati nel processare un segnale complesso come quello vocale,
fornendo risultati in contrasto con quelli rilevati allo spettrogramma e/o alla valuta-
zione percettiva (come negli esempi precedentemente riportati).
Le nuove metodiche di analisi dunque devono essere confrontate ed integrate
con quelle tradizionali per addivenire ad una diagnosi sempre più affidabile, evitan-
do grossolani errori valutativi.
L’esame spettroacustico della voce 181

Così come l’esame audiometrico o altri esami audiologici più complessi (vedi
l’ABR) vengono eseguiti dai tecnici audiometristi, analogamente le diverse fasi del-
l’analisi acustica (allenamento del paziente, settaggio della strumentazione, regi-
strazione del materiale vocale, analisi del segnale) possono essere eseguite dai lo-
gopedisti, fermo restando che l’interpretazione dei dati e quindi la diagnosi, in que-
sto caso acustica, rimane compito del medico specialista foniatra. Ciò è auspicabile
in quanto aumenta notevolmente il numero degli operatori esperti nel settore. Inol-
tre, la diffusione sempre maggiore di sistemi per l’analisi strumentale della voce,
costituiti da un semplice software da applicare al Personal Computer (vedi capitolo
seguente), contribuisce ad eliminare anche l’ostacolo economico all’affermazione
dell’esame acustico come indagine strumentale indispensabile nella valutazione del
paziente disfonico.

BIBLIOGRAFIA
1
Biondi S, Zappalà M, Amato G. La spettrografia della voce. Acta Phon Lat 1990;12:199-236.
2
De Colle W. Il sistema MDVP: Considerazioni metodologiche ed esperienza clinica. In: L’impiego
del programma CSL (Computerized Speech Laboratory) nella pratica clinica. XXXII Congresso
Nazionale della Società Italiana di Foniatria e Logopedia (SIFEL), Abano Terme 1998:27-30.
3
De Colle W, Ricci-Maccarini A. Acoustic analysis by Kay CSL 4300 in voice assessment. Work-
book of the Workshop at the 6th I.A.P. Symposium. Venezia-Abano Terme 2000:19-22.
4
De Colle W. Voce & Computer-Analisi acustica digitale del segnale verbale (Il sistema CSL-
MDVP). Torino: Ed. Omega 2001.
5
Dejonckere PH. Perceptual and Laboratory Assessment of Dysphonia. In: Rosen CA, Murry T, (a
cura di). Voice Disorders and Phonosurgery. Otolaryngol Clin North Am 2000;I(Suppl):731-50.
6
Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier Buchman L, Friedrich G, et al. A basic
Protocol for functional assessment of voice pathology, especially for investigating the efficacy of
(phonosurgical) treatments and evaluating new assessment techniques. Eur Arch Otorhinolaryngol
2001;258:77-82.
7
De Santis M, Accordi M, Cianfrone G, Ferrero F, Passali D. L’indagine elettroacustica nella pato-
logia della voce. Relaz XIV Congresso Soc Ital Audiol e Foniatria. Boll Audiol Foniat 1976:25-1.
8
Di Nicola V, Fiorella ML, Luperto P, Staffieri A, Fiorella R. La valutazione obiettiva della disfo-
nia. Possibilità e limiti. Acta ORL Ital 2000;21:10-21.
9
Ferrero FE, Genre A, Boe LJ, Contini M. Nozioni di fonetica acustica. Torino: Ediz Omega 1979.
10
Ferrero FE, Pelamatti GM, Vagges K. Simulazione artificiale di emissioni diplofoniche. Acta Pho-
niatrica Latina 1979;2:259-68.
11
Ferrero FE, Croatto L, Accordi M. Descrizione elettroacustica di alcuni tipi di vocalizzo di Deme-
trio Stratos. Riv It Acustica 1980;IV:229-58.
12
Ferrero FE, Ricci Maccarini A, Tisato G. I suoni multifonici nella voce umana. Proceedings del
XIX Convegno Nazionale della Associazione Italiana di Acustica, Napoli 10-12 Aprile 1991:415-
21.
13
Ferrero FE, Vagges K, Di Ottavio R, Sfakianu T. Caratterizzazione multiparametrica della voce: il
vocaligramma. Atti XXVII Congresso Nazionale SIFEL, Montesilvano (PE), 7-9 Aprile 1994.
14
Ferrero FE, Lanni R. Valutazione del sistema CSL-MDVP con campioni di voce normale patologi-
ca, digitale e analogica, microfonica ed elettroglottografica. Padova: Quaderni del CSRF-CNR,
Ediz. CSRF-CNR 1995;13:257-89.
15
Ferrero FE, Lanni R, De Colle W. Primi risultati di uno studio per la validazione del sistema
MDVP come strumento per una caratterizzazione multiparametrica della voce. Acta Phon Lat
1995;17:161-80.
16
Ferrero FE. Le vocali: problemi di classificazione e di misurazione spettroacustici. Un contributo.

IV.
5
182 A. Ricci Maccarini et al.

Atti delle VII Giornate di Studio del Gruppo di Fonetica Sperimentale – AIA Napoli, 14-15 No-
vembre 1996.
17
Hirano M. Clinical Examination of Voice. Wien, New York: Springer Verlag 1981.
18
Johnson K. Acoustic and Auditory Phonetics. Cambridge, Mass. USA: Blackwell Publishers 1997.
19
Kent RD, Read C. The acoustic analysis of speech. San Diego: Singular Publishing Group 1992.
20
McAdams S. Spectral fusion and the creation of auditory images. In: Music, mind and brain. New
York: Pleuum Press 1981:279-98.
21
Parsa V, Jamieson DG. A comparison of high precision Fo extraction algorithms for sustained
vowels. J Speech Lang Hear Res 1999;42:112-6.
22
Ricci Maccarini A, Bergamini G, Ghidini A, Galetti G. Proposta di un protocollo per l’analisi elet-
troacustica della voce cantata. Acta Phon Lat 1989;11:127-37.
23
Ricci Maccarini A, Lucchini E. Protocollo per la valutazione soggettiva ed oggettiva della disfo-
nia. In: Ricci Maccarini A, Di Nicola V, (a cura di). Relazione Ufficiale del XXXVI Congresso Na-
zionale SIFEL, Acta Phon Lat 2002 (in stampa).
24
Tisato G. Analisi e sintesi del canto difonico. Atti dell’VIII Colloquio di Informatica Musicale, Ca-
gliari 1989:33-51.
25
Yanagihara N. Significance of harmonic changes and noise components in hoarseness JSHR.
1967;10:531-41.
26
Woisard-Bassols V. Bilan clinique da la voix. In: Encyclopedie Medico Chirurgicale, 20-753 A-10
Oto-Rhino-Laryngologie.
27
Wuyts F, De Bodt M, Molenbergs G, Remacle M, Heylen L, Millet B, et al. The Dysphonia Seve-
rity Index : An objective measure of vocal quality based on a multiparameter approach. J Speech
Lang Hear Res 2000;43:796-809.
L’esame spettroacustico «ambulatoriale» 183

IV.6. L’ESAME SPETTROACUSTICO «AMBULATORIALE»

G. Migliori

L’esame spettroacustico della voce può essere oggi agevolmente realizzata nel-
l’ambulatorio specialistico ORL-foniatrico, grazie a prodotti software «low-cost».
Questi software di analisi vocale (Dr. Speech – Multi-Speech – SoundScope)
permettono, in ambiente Windows o Macintosh, di catturare ed analizzare il cam-
pione vocale (DSP – digital signal processing) nell’ambito di un PC multimediale.
La nostra esperienza si è realizzata con il «Multi-Speech 3700» della Kay Ele-
metrics Corp.
Non è indispensabile che il PC sul quale installare il software abbia un proces-
sore particolarmente potente; la Kay richiede un Pentium maggiore di 266 MHz con
almeno 16 MB di memoria Ram, nettamente inferiore all’attuale standard medio di
un comune PC multimediale (Pentium 3 a 700 MHz con 64 MB di memoria Ram).
Come tutti i programmi basati su un hardware multimediale anche quelli in og-
getto sono alquanto limitati dalle specifiche performance della scheda sonora, so-
prattutto nei riguardi della qualità del rapporto segnale/rumore (SNR: signal-to-noi-
se ratio), abitualmente 40-60 dB contro gli 86 dB del CSL 4300B.
La maggior parte delle schede sonore abitualmente installate sui computer mul-
timediali non hanno particolari funzioni per «l’audio input» che è generalmente al-
quanto semplice e quasi sempre descritto nelle sue caratteristiche senza dettaglio. È
pertanto indispensabile, per effettuare un corretto esame spettroacustico, installare
sul proprio PC schede sonore «professionali» che possano migliorare le caratteristi-
che dell’acquisizione audio, supportando adeguatamente un microfono ad alta sen-
sibilità.

PRELIEVO DEL SEGNALE

È ottimale che la cattura del segnale vocale avvenga in una cabina silente; ove
non fosse disponibile è raccomandabile che il rumore di fondo dell’ambulatorio non
superi i 40 dB per non inficiare la successiva analisi del segnale vocale.
Il microfono professionale consigliato dalla Kay per il Multi-Speech è il «AKG
Acoustic Model C-410» posizionato a 5 cm dalle labbra (per evitare interferenze del
rumore ambientale) con una angolazione di 45° (per evitare perturbazioni del flus-
so aereo).

U.O. ORL, Ospedale Civile di Fano

IV.
6
184 G. Migliori

L’uso di un preamplificatore microfonico esterno protegge il basso livello del


segnale microfonico dal rumore del computer, ottenendo un aumento del rapporto
segnale/rumore di circa 6 dB.
Fra i microfoni a condensatore di ultima generazione meritano di essere ricor-
dati, per le specifiche caratteristiche tecniche, il «Rode NTK», lo «Shure KSM-44»
e lo «Sennheiser MKH800».
Per uniformare il metodo di campionamento, su una acquisizione vocale di al-
meno 6 secondi, (/a/ tenuta) vanno presi in considerazione solo i 2 secondi centrali
sia per evitare le interferenze dell’attacco e dello stacco vocale che per analizzare
almeno 110 cicli di vibrazione delle corde vocali. Campioni vocali di 3 secondi per-
mettono di analizzare circa 200 cicli di vibrazione delle corde vocali anche in pre-
senza di voci molto gravi. L’intensità di emissione della /a/ deve essere eguale alla
voce di conversazione, senza variazioni di intensità o frequenza, possibilmente fra i
50 e i 65 dB; infatti emissioni vocaliche eguali o maggiori di 70 dB di intensità, ten-
dono a «saturare» l’oscillogramma alterando la successiva valutazione dei parame-
tri vocali quali jitter, shimmer ed H/N ratio.
Le schede sonore multimediali hanno tre frequenze di campionamento standard
(11025 Hz, 22050 Hz e 44100 Hz); con il Multi-Speech possiamo effettuare acqui-
sizione e campionamento a qualsiasi valore fino alla frequenza più alta supportata
dalla scheda sonora. Alte frequenze di campionamento comportano campioni voca-
li di notevoli dimensioni ed occupanti quindi grandi quantità di memoria nell’HD
(disco rigido); la capacità di memoria degli HD attuali (30-40 GB) e la diffusa pre-
senza di sistemi di back-up a basso costo (masterizzatori) hanno risolto il problema
dell’acquisizione di dati ad alte frequenze di campionamento e della loro successi-
va archiviazione.
Il «sampling rate» (frequenza di campionamento) ottimale è di 20 kHz (le infor-
mazioni linguistiche sono significative fino a circa 8-10 kHz) ma per l’analisi di
classi di fonemi come le vocali, l’informazione pregnante è tutta contenuta al di sot-
to dei 4-5 kHz quindi è sufficiente utilizzare una frequenza di campionamento di 10-
12 kHz (Ferrero FE, Accordi M, 1998).
Una volta ottimizzato il sistema di acquisizione (livello del rumore ambientale,
caratteristiche del PC, scheda sonora, microfono professionale con preamplificato-
re), il metodo e la frequenza di campionamento, va effettuata una «normativa per-
sonale» sulla apparecchiatura, analizzando da 50 a 100 soggetti eufonici con anam-
nesi ed obiettività negative per patologia vocale. I valori ottenuti con la «normativa
personale» debbono rappresentare il «default» di riferimento del sistema per la suc-
cessiva valutazione dei casi patologici.
Il Multi-Speech permette anche l’analisi del segnale vocale in «tempo reale»
(con il modulo opzionale Real-Time Spectrogram). È possibile ottenere uno spet-
trogramma (con scala di grigi o a colori) del segnale vocale a «finestra di analisi»
(window o frame) lunga o corta, a secon