Procesamiento Digital de Señales
Frecuencia
Se ha visto que el sonido es el resultado de la propagación de una onda mecánica en un
medio elástico producto de la excitación o vibración de un objeto. Esta onda describe las
variaciones de presión, por arriba y por debajo de un valor normal, de las moléculas de aire
en la atmósfera terrestre (compresión y enrarecimiento de las moléculas). Hemos estudiado la
representación de esta onda tanto en el dominio temporal (grafico amplitud-tiempo) como en
le dominio frecuencial (gráfico amplitud-frecuencia). Una vez que la onda mecánica impacta
un transductor acústico-eléctrico, como es el caso de un micrófono, o acústico-bioeléctrico
como lo es el oído humano, estos convierten la señal acústica en eléctrica: transforman el
fenómeno acústico en variaciones de voltajes equivalentes al patrón de la onda que los
impacta. Una vez en el dominio eléctrico es posible procesar, analizar y codificar esta señal.
Hoy día, el procesamiento de señales acústicas se hace, principalmente, a través de
computadores, en el dominio digital. Para lograr esto, la señal eléctrica se convierte en una
secuencia de números a través de conversores análogo-digital. El proceso de conversión
digital se base en asignar un valor numérico proporcional al valor del voltaje de la señal
eléctrica, en un instante determinado. Los valores de voltaje de una señal equivalente a una
onda acústica cambian constantemente, en cada instante de tiempo. Para efectos prácticos, un
computador es incapaz de registrar todos los cambios que suceden en una señal eléctrica en
todos los instantes de tiempo (infinitos), tanto por limitaciones del computador mismo como
de los conversores análogo-digital. Por esta razón, los valores de la señal eléctrica son
tomados como muestras (sampling), en intervalos de tiempo de igual duración, resultando
una señal discreta, no continua, de valores digitales, es decir, una secuencia de valores
numéricos. Este método de representación de una señal analógica en una secuencia de
números se le llama PCM: pulse code modulation (modulación de código de pulso).
El tiempo de separación o intervalos entre los instantes en que se toman las muestras de la
señal eléctrica se le conoce como intervalo de muestreo o período de muestreo (Ts), el
inverso de este valor representa el número de veces que la señal es muestreada en un
segmento o en un tiempo dado y se le llama frecuencia de muestreo (fs), cuya unidad es el
Hertz (ciclos/seg)
Mientras más muestras se tomen del fenómeno, en este caso de la señal eléctrica, más
precisa será su representación digital, lo que a su vez sugiere que si no se toman infinitas
muestras su homologo digital tendrá cierto error respecto del original. Vale entonces la
siguiente pregunta: ¿Cuál es la frecuencia de muestreo mínima necesaria para representar
apropiadamente una señal eléctrica en el dominio digital?. La respuesta surge a través del
análisis matemático, donde se puede comprobar que el error de conversión digital, producto
de un número finito de muestras de una señal, es despreciable si la frecuencia de muestreo es
igual o mayor al doble de la componente o parcial de más alta frecuencia de la señal a ser
digitalizada. Este criterio se le conoce como criterio de Nyquist y se expresa por la siguiente
relación:
fs
fN =
2
donde f N es la frecuencia de Nyquist, y f s es la frecuencia de muestreo (sampling).
!
En el caso de señales acústicas perceptibles por el sistema de audición humano, el rango de
! frecuencias va de los 20 Hz a!los 20 KHz, por lo que para representar apropiadamente en
digital estas señales se esperarían frecuencias de muestreo superiores a los 40 KHz, según el
criterio de Nyquist.
El sistema de digitalización que se implementa dentro de las interfaces o conversores
análogo-digital, cuidan que las frecuencias de las señales a procesar estén dentro de los
rangos permitidos por el criterio de Nyquist, a través de filtros (ecualizadores) pasa bajos a la
entrada y salida de las interfaces tal y como se muestra en la figura VIII.1. En la imagen se
aprecia un filtro antes del conversor análogo-digital (A/D) y otro posterior al conversor
digital-análogo (D/A), asegurando que las frecuencias tanto de entrada como de salida estén
dentro de los rangos apropiados.
Figura VIII.1. Uso de Filtros en el proceso de digitalización.
Mientras más alta sea la frecuencia de muestreo, más alta será la frecuencia que podrá ser
representada, con el costo de una mayor demanda en la velocidad y poder de procesamiento
del computador. Los sistemas de digitalización de audio sin compresión están diseñados para
cubrir todo el rango de frecuencias audibles por el ser humano. Hoy día se puede encontrar
en hardwares profesionales de conversión A/D frecuencias de muestreo iguales a 44.1, 48,
88.2, 96, 176.4, 192 kHz quedando a criterio del ingeniero de sonido cual utilizar,
dependiendo del material que se procese. Por su parte el formato del Disco Compacto (CD)
utiliza una frecuencia de muestreo de 44.1 kHz.
Para entender el funcionamiento y limitación en frecuencia de los sistemas digitales de audio
considérese la siguiente señal:
Figura VIII.2. Sinusoide de 10 kHz.
Suponga que esta onda tiene una frecuencia de 10 kHz y será muestreada con una señal de 40
kHz. Los instantes de muestreo se muestran en la figura por medio de los puntos en la señal.
La secuencia de valores digitales para este ejemplo, podría lucir como sigue: [1, 0, -1, 0, 1, 0,
-1, 0,…]. Cuando esta señal sea retransformada a analógica, el filtro pasa-bajos suavizará la
señal, eliminando componentes de alta frecuencia producto de la digitalización,
aproximándola más a su forma original de sinusoide. Esto se deriva de que toda señal
diferente a una sinusoide tendrá componentes que sobrepasan la frecuencia máxima
permitida por el filtro. De forma general, una vez filtrada la señal, existirá solo una onda que
satisfaga la secuencia de valores dada por la conversión digital y que no contenga
componentes en frecuencia mayores a la frecuencia de Nyquist.
¿Qué pasa si para muestrear una señal se usa una frecuencia menor a la indicada por el
criterio de Nyquist?. Para ilustrar esto vease la figura VIII.3. Se muestra una onda seno de
frecuencia 30 kHz y los puntos indican valores de muestras tomadas a una frecuencia de 40
kHz (igual que el caso anterior). Si igualmente se despliegan los valores digitales que se
obtienen se tendrá [1, 0, -1, 0, 1, 0, -1, 0,…] que resultan los mismo que la señal de 10 kHz
de la figura VIII.2. Cuando la señal sea convertida nuevamente a analógica se obtendrá un
tono de 10 kHz en vez de la señal original de 30 kHz. A este fenómeno se le conoce como
aliasing y es producto de sub-muestreo: muestrear una señal a una frecuencia inferior a la
impuesta por el criterio Nyquist.
Figura VIII.3. Seno de 30 kHz y muestras a 40 kHz.
El aliasing se representa matemáticamente por la siguiente ecuación:
f salida = f s " f entrada
donde f salida es la frecuencia de la señal resultante, f s es la frecuencia de muestreo
(sampling) y f entrada es la!frecuencia de la señal de entrada. Esta relación aplica solo cuando
f entrada sea menor a la frecuencia de Nyquist, de otra forma f entrada = f salida .
! !
!
! ! !
Bits
El siguiente parámetro importante en la digitalización de señales es la precisión con la que
los valores numéricos de cada muestra son medidos, los bits de resolución. Una de las
características que define la fidelidad de un sistema de digital para procesamiento de audio es
su rango dinámico: la relación entre el sonido más fuerte y el mínimo que puede manejar el
sistema. El rango dinámico se expresa en Decibeles (dB), a mayor rango dinámico mayor
será la claridad del sonido. El rango dinámico de un sistema electrónico expresa la relación
entre el mínimo sonido que sea capaz de procesar vs. la mayor amplitud de señal que puede
manejar sin distorsión.
Otra característica asociada con el rango dinámico es la relación señal a ruido (SNR: signal
to noise ratio), que compara el nivel de una señal dada con el ruido del sistema,
entendiéndose por ruido cualquier señal residual producto de los componentes electrónicos
del sistema, ajeno a la señal deseada. Con estas dos definiciones es posible afirmar que, en el
caso ideal de cero ruido, el rango dinámico predice la máxima relación señal a ruido posible
del sistema.
Mientras la relación señal a ruido de un grabador analógico de cinta puede alcanzar 70 dB, y
con sistemas comerciales de reducción de ruido (ej. Dolby SR) puede sobrepasar lo 90 dB, el
SNR de un sistema digital de audio puede ser aun mayor. Una vez que una señal es
digitalizada se dice que es cuantizada de acuerdo a cierta resolución digital. La resolución
digital se expresa en bits, correspondientes al tamaño de una palabra digital utilizada para
almacenar el valor de cada una de las muestras de la señal. Matemáticamente se puede
demostrar que para un sistema A/D de n número de bits, la resolución del mismo será de 2 n
posibles valores. Por ejemplo, un sistema es de 16 bits tendrá una resolución 216 = 65.536
valores; si se hace circular una señal de 20 V (voltios) por este sistema cada escalón de
!
cuantización, correspondiente al valor de un bit, sera de 20/65.536 = 0.00030517 V/bit. De
!
esto se deduce que a mayor cantidad de bits mejor será la resolución y menor el error de
cuantización.
En el caso de la música, donde las señales de audio están cambiando constantemente, el
rango dinámico y la relación señal a ruido de cuantización (SQNR: signal to quantization
noise ratio) que se obtiene de un sistema digital es de 6 dB/bit. Por ejemplo, un sistema de 16
bits tendrá un rango dinámico de 96 dB, suponiendo que el ruido del sistema estará 96 dB
por debajo de una señal con la mayor amplitud pueda circular por el sistema. A nivel
profesional existen conversores A/D y D/A con resoluciones de 16, 18, 20 y 24 bits.
El proceso de digitalización que hemos estudiado hasta ahora es lineal. Existen otros métodos
de digitalización que involucran compresión de la data de audio y que requieren algoritmos
mucho más complejos que involucran estudios preceptúales y psicoacústicos del ser humano.
Referencias
Dodge, Charles. Computer Music, Síntesis, Composición and Performance. USA. Schirmer
Thomson Learning. II Edición, 1997.