UNIVERSIDAD NACIONAL DE COLOMBIA –FONOAUDIOLOGIA PROFUNDIZACION EN HABLA
LA MEDICION DE LA CUALIDAD VOCAL
Tradicionalmente, todas las cualidades (o timbre) de un sonido se ha definido como “los
atributos de la sensación auditiva en la cual un oyente puede juzgar que dos sonidos son
similares, tienen la misma intensidad y el tono es diferente” (Estándar ANSI S1.1.12.9). La
cualidad incluye los efectos perceptuales del amplio espectro y sus cambios en el tiempo,
fluctuaciones periódicas de la amplitud o de la frecuencia fundamental, y algunos ruidos
que componen la señal (Plomp,1976) y entonces es inherentemente multidimensional.
Dada esta dificultad, muchos autores que estudian la cualidad como un todo, prefieren
centrarse en una única dimensión ó aspectos específicos de la cualidad. Por ejemplo, se han
utilizado términos como voz ronca, voz áspera, voz raspada, voz aspirada, hipernasal,
hiponasal, desnasal. También se han incorporado términos como foco, constricción,
sonoridad, modo, esfuerzo/suavidad, estridencia, afonía, disfonía, diplofonía, fraseo
desordenado, resonancia inmadura, frote glótico, ataque glótico, (Boone, 1971; Wilson,
1972: Perkins, 1977; Wilson, 1977). La utilización de estos términos para describir voces
tiene problemas de confiabilidad; esto quiere decir que los juicios de diferentes personas, o
de la misma persona en momentos diferentes pueden no coincidir. Por ejemplo, un juez
puede calificar una voz como “raspada” y otro insistir en que es “áspera”.
Basic & Ludlow (1986) seleccionaron algunas de las dimensiones del sistema
multidimensional de calificación propuesto por Darley (1969):
Temblor: fluctuaciones rápidas en el tono y/o la intensidad que dan la impresión de una
voz temblorosa.
Ondulación: patrones consistentes de fluctuaciones lentas, graduales, con altibajos en el
tono y/o intensidad que resultan en una modulación rítmica la cual es más lenta que la
observada en el temblor.
Rudeza & Frote: es una cualidad de voz brusca o desagradable en fonaciones de tono bajo.
Puede o no estar asociada con frote glótico.
Ronquera húmeda: cualidad de voz como sonido-de-liquido, húmeda, desagradable y
brusca.
Ruda & Chillona: cualidad de voz ruda o estridente, mentalita o raspada que ocurre en
fonaciones de tono relativamente alto, algunas veces asociada con ataque glótico fuerte.
Aspirada: escape audible de aire que da como resultado una fonación delgada y débil,
relacionada con una incapacidad funcional de cerrar firmemente las cuerdas vocales.
Estrangulada: la fonación da la impresión de un paso de la voz por la glotis como si la
estuvieran exprimiendo con esfuerzo.
Prof. Luisa Fernanda Ángel G.
UNIVERSIDAD NACIONAL DE COLOMBIA –FONOAUDIOLOGIA PROFUNDIZACION EN HABLA
PROGRAMA MULTIDIMENSIONAL DE LA VOZ - MDVP-
Los parámetros del MDVP son mediciones muy pequeñas de anomalías y perturbaciones en
la voz. Estos parámetros son indicadores sensibles de la función vocal y la confiabilidad de
estas medidas por tanto dependen de la calidad de la muestra capturada (grabada).
Este programa analiza cuatro parámetros acústicos de la voz1 a partir de una vocalización:
(1) el RAP o jitter, (2) el Shimmer, (3) el VTI o índice de turbulencia de la voz, y (4) el
NHR o ruido en la relación armónica. Los parámetros obtenidos pueden ser presentados en
forma numérica o gráfica en comparación con una base de datos.
Mediciones relacionadas con perturbaciones de la frecuencia y la amplitud:
Concepto Unidad Descripción Medición
normal
Promedio relativo de perturbación a partir de la
RAP % 0.68
variabilidad del tono durante tres periodos.
Variabilidad de pico a pico de la amplitud, de periodo
Shimmer % 3.81
a periodo.
Mediciones relacionadas con el ruido:
Concepto Unidad Descripción Medición
normal
El ruido en la relación armónica es la evaluación
general de la presencia de ruido en la señal analizada
como son las variaciones en la frecuencia y en la
amplitud, la turbulencia, componentes sub-armónicos, y/o
NHR 0.19
quiebres de voz. Es una relación del promedio de la
energía de los componentes inarmónicos en el rango
1500-4500 Hz. a la energía de los componentes
armónicos en el rango 70-4500 Hz.
El índice de turbulencia de la voz es la medición del
nivel de energía relativo del ruido de la frecuencia más
alta. Generalmente es correlacionado con la turbulencia
causada por una aducción incompleta o ausente de las
cuerdas vocales. El VTI es un promedio de la relación de
VTI la energía del espectro inarmónico de la frecuencia más 0.061
alta en el rango 2800-5800 Hz. con la energía del espectro
armónico en el rango 70-4500 Hz, en dónde las áreas de
influencia de las variaciones de la frecuencia y la
amplitud, los quiebres de tono y los componentes sub-
armónicos son mínimas.
1
En modelos más recientes analiza 22 parámetros de la voz.
Prof. Luisa Fernanda Ángel G.
UNIVERSIDAD NACIONAL DE COLOMBIA –FONOAUDIOLOGIA PROFUNDIZACION EN HABLA
Fig. 1. Gráfico radial resultante del análisis de la voz de un individuo en comparación con los umbrales de normalidad preestablecidos. El
umbral típico es representado en el circulo verde. Los parámetros de normalidad acordes con los umbrales de normalidad son graficados
en marrón. Los parámetros que exceden la tipicidad son diagramados en rojo.
La ventaja de determinar cuatro parámetros vocales es que precisamente con base en
diferentes parámetros es factible el análisis de diferentes patologías vocales. Por ejemplo,
una voz aspirada puede tener valores de jitter normales pero el grado de aspiración puede
revelarse mediante la obtención del parámetro de “turbulencia” (VTI).
En modelos más recientes el sistema multidimensional de la voz (MDVP) calcula
rápidamente 33 medidas de la función vocal y los representa en un gráfico que incorpora
valores normativos para la potencial identificación de diferencias clínicas importantes:
PARÁMETROS ACUSTICOS ABREVIATURA VALOR NORMAL
Threshold Values
- Promedio de la frecuencia fundamental Fo
Average fundamental frequency
- Promedio del periodo del tono To
Average pitch period
- Frecuencia fundamental máxima Fhi
Highest fundamental frequency
- Frecuencia fundamental mínima Flo
Lowest fundamental frequency
- Desviación estándar de la frecuencia fundamental STD
Standard deviation of Fo
- Rango fonatorio en semitonos PFR
Phonatory Fo-range in semitones
- Amplitud de la frecuencia del temblor Fatr
Amplitude tremor frecuency
- Duración del ejemplo analizado Tsam
Length of analized sample
1. Jitter absoluto Jita 83.2 us
Absolute jitter
2. Porcentaje de jitter Jitt 1.04 %
Jitter percent
Prof. Luisa Fernanda Ángel G.
UNIVERSIDAD NACIONAL DE COLOMBIA –FONOAUDIOLOGIA PROFUNDIZACION EN HABLA
3. Promedio relativo de la perturbación RAP 0.68 %
Relative average perturbation
4. Cociente de perturbación del tono PPQ 0.84%
Pitch perturbation quotient
5. Cociente de perturbación del tono ininterrumpido Sppq 1.02 %
Smoothed pitch perturbation quotient
6. Variación de la frecuencia fundamental vFo 1.10 %
Peak-amplitude variation
7. Shimmer en dB ShdB 0.35 dB
8. Porcentaje de shimmer Shim 3.81 %
Shimmer percent
9. Cociente de perturbación de la amplitud APQ 3.07 %
Amplitude perturbation quotient
10. Cociente de perturbación de la amplitud ininterrumpido Sapq 4.23 %
Smoothed amplitu perturbation quotient
11. Variación de la amplitud máxima vAm 8.20 %
Peak-amplitude variation
12. Ruido de la relación armónica NHR 0.190
Noise to harmonic ratio
13. Indice de turbulencia de la voz VTI 0.061
Voice turbulence index
14. Indice de fonación suave SPI
Soft phonation index
15. Indice Fo-intensidad del temblor FTRI
Fo-tremor intensity index
16. Indice de la intensidad de la amplitud del temblor ATRI
Amplitude tremor intensity index
17. Grado de quiebre vocal DVB
Degree of voice breaks
18. Grado de segmentos sub-harmónicos DSH
Degree of subharmonic segments
19. Grado de no sordera DUV
Degree of voiceless
- Número de quiebres vocales NVB
Number of voice breaks
- Número de segmentos sub-armónicos NSH
Number of subharmonic segments
- Número de segmentos ensordecidos NUV
Number of unvoiced segments
El MDVP es aplicada idealmente para el análisis de vocalizaciones sostenidas, tarea
comúnmente utilizada en la evaluación clínica de la voz. El MDVP no es conveniente en el
análisis de la voz de muestras conversacionales que consisten de segmentos sonoros y
sordos.
Prof. Luisa Fernanda Ángel G.