Procesamiento de audio y video (conversión
analógica/digital)
Introducción
Procesamiento de audio y video (conversión A/D)
Referencias
LECCIÓN 1 de 3
Introducción
La conversión analógico-digital (A/D) en audio y video
El mundo real es analógico. Nuestros ojos y nuestros oídos
funcionan de forma analógica interpretando variaciones de luz y
de color o de presión sonora que cambian de forma continua.
Una imagen de video se representa analógicamente mediante
formas de onda que traducen sus cambios de brillo y de color.
Un sonido se representa analógicamente mediante formas de
onda que muestran su frecuencia y su amplitud (volumen). Los
aparatos de grabación de audio y video analógico registran
estas ondas en un material magnético, y el resultado puede ser
más o menos fiel. En los diferentes dispositivos de la cadena
audiovisual, las ondas se tratan como variaciones de tensión,
frecuencia y fase (en el caso del video).
(…)
El procedimiento por el cual una señal eléctrica que transporta
información de audio y video se digitaliza y se convierte a dígitos
binarios (unos y ceros) se denomina conversión analógico
digital. Este proceso se lleva a cabo mediante el conversor AD,
un componente electrónico especializado en esta tarea. En el
conversor se llevan a cabo dos procesos, el muestreo y la
cuantificación. El muestreo consiste, como su nombre indica, en
tomar muestras de la señal analógica cada cierto tiempo. La
cuantificación es el proceso por el cual se da un valor numérico a
estas muestras. Este valor se asigna en código binario, usando
solo “unos” y “ceros”, con lo que el resultado final es un chorro de
dígitos binarios que representan la onda original.
(…)
La señal audiovisual en formato digital es perfecta para su
almacenamiento, transporte y distribución. Pero para visualizar
las imágenes o escuchar el sonido, es necesario devolverla al
ámbito analógico, antes de atacar la pantalla del televisor, los
elementos de imagen del proyector, el amplificador de la cadena
musical o los altavoces activos. Este proceso se lleva a cabo por
el conversor digital a analógico, o DAC. En el caso de los
dispositivos de imagen siempre está incluido en el mismo. En el
caso de los sistemas de audio, puede estar incorporado en
diferentes elementos, como el amplificador, receptor AV, el
reproductor de red, o puede ser un elemento separado. En todos
los casos, entregará una señal analógica lista para ser
amplificada y escucharse por los altavoces.
Los DACs suelen ser chips especializados que reciben la señal
digital y generan a partir de ella una onda analógica, con la
información de video, de audio, o ambas. La calidad de un DAC
depende de los formatos digitales que que admite en su
entrada, y de las frecuencias de muestreo y niveles de
cuantificación que soporta. (Castillo, 2020,
[Link]
audio-y-video/)
C O NT I NU A R
LECCIÓN 2 de 3
Procesamiento de audio y video (conversión A/D)
Como analista senior de IT de la compañía, a
menudo recibes pedidos de asesoramiento
referidos a temas técnicos. En esta oportunidad, el
área de compras te ha pedido que los ayudes con
la renovación de los periféricos de los sistemas de
computación que se utilizan en los departamentos
de la empresa.
Al comienzo, las computadoras se limitaban a agilizar las tareas de cálculo.
Sin embargo, el uso de la información requirió, además del texto y los
números, el uso del audio y el video. Por lo tanto, fue necesario procesar y
almacenar todo tipo de formatos.
Actualmente concebimos a las computadoras como centros de
procesamiento multimedia de información. Esto requiere de un nivel de
complejidad mayor dentro del procesamiento, así como grandes cantidades
de espacio de almacenamiento disponible para este tipo de datos.
La voz humana y los sonidos e imágenes producidos por el mundo natural
son analógicos, esto quiere decir que las señales cambian de forma continua
y toman infinitos valores a lo largo del tiempo. En cambio, una computadora
maneja señales digitales donde los cambios son discretos, por ejemplo, un 1
binario se representa con 5 voltios (V) y un 0 binario, con 0 V.
Conversión A/D
Tal como señalamos, los fenómenos físicos naturales son analógicos, por
ejemplo, voz, música, imágenes, temperatura, etc. Estos fenómenos son
transmisibles a cortas distancias y en algunos casos no son transmisibles. El
medio de transmisión usualmente es el aire y ocasionalmente el agua.
Tomando como base el texto del profesor Edinson Coimbra de la Universidad
de Santa Cruz de la Sierra, diremos que estos datos analógicos tienen
formatos que no pueden transmitirse por un sistema de comunicación
electrónico, por eso se convierten a un formato (señal) que el medio
electrónico pueda aceptar.
D AT O A N A LÓ G I C O E S TA O N D A LA S E Ñ A L A N A LÓ G I C A
Se refiere a información que toma valores continuos, como el sonido de la
voz. Cuando alguien habla, crea una vibración u onda continua en el aire.
D AT O A N A LÓ G I C O E S TA O N D A LA S E Ñ A L A N A LÓ G I C A
Es capturada por un micrófono (transductor) y convertida en una señal
eléctrica analógica.
D AT O A N A LÓ G I C O E S TA O N D A LA S E Ñ A L A N A LÓ G I C A
Es una onda continua que cambia suavemente en el tiempo. Tiene un número
infinito de valores de voltaje dentro de un rango.
Figura 1: Señales y datos analógicos
Fuente: Coimbra, E. (2013). [Imagen sin título sobre señales y datos analógicos]. Recuperado
de [Link]
Datos y señales analógicas, no son aptos para el
procesamiento… ¿Por qué?
En consecuencia, los sistemas electrónicos que, en su mayoría, procesan
datos digitales, deben tratar con estas magnitudes físicas analógicas en su
punto de contacto con el mundo exterior (sus entradas) y para procesarlas
las convierten a datos digitales.
El proceso de conversión analógico-digital se resume así:
Un transductor (micrófono, cámara de video, sensor, etc.) convierte
la magnitud física en una señal eléctrica analógica.
Un acondicionador (amplificador, filtro, etc.) acondiciona la señal
eléctrica analógica.
Un conversor A/D convierte la señal eléctrica analógica en dato
digital (flujos de 0’s y 1’s)
Figura 2: Conversión analógica - digital
Fuente: Coimbra. E. (2014). [Imagen sin título sobre conversión analógica - digital].
Recuperado de [Link]
Existen muchas técnicas para realizar la conversión A/D, pero la más
utilizada es la llamada PCM (pulse code modulation) o modulación por
codificación de pulsos. Esta técnica consta de 3 pasos o procesos que se
ejecutan en serie, y se los conoce como muestreo, cuantificación y
codificación.
Muestreo
–
En este paso se toman muestras de la señal analógica a intervalos de tiempo
constantes.
Cuantificación
–
En la medida que se desarrolla el muestreo, se mide el valor que alcanza la
muestra y se le asigna un valor discreto en una escala de valores posibles.
Codificación
–
A cada valor ya cuantificado de la muestra se le asigna un código binario, que
representa ese valor.
Figura 3: Conversión analógica – digital (parte 2)
Fuente: Coimbra. E. (2014). [Imagen sin título sobre conversión analógica – digital (parte 2)].
Recuperado de [Link]
No siempre es fácil muestrear señales
analógicas. Por ejemplo, la voz humana es una
señal analógica, pero aperiódica, o sea que no se
repite.
Muestreo
Según el teorema de Nyquist, es posible reconstruir una señal analógica a
partir de muestras periódicas, siempre que la tasa de muestreo sea por lo
menos el doble de la frecuencia más alta contenida en la señal analógica. Se
puede muestrear una señal solo si su ancho de banda es limitado.
De esta forma, para una señal analógica determinada:
Figura 4: Muestreo
Fuente: Coimbra. E. (2014). [Imagen sin título sobre muestreo]. Recuperado de
[Link]
Siempre que 𝑓s > 2𝑓𝑚á𝑥 siendo 𝑓S = frecuencia de muestreo, en Hz., 𝑓𝑚á𝑥 =
frecuencia más alta de señal analógica, en Hz., y TS = periodo de muestreo,
en s.
Existen habitualmente dos técnicas de muestreo que son las más usadas.
Estas son:
El muestreo natural, donde un conmutador de alta velocidad se
enciende por cortos periodos de tiempo. Las muestras siguen el
nivel de la señal durante ese período.
El muestreo de cresta plana, donde un conmutador de alta
velocidad se enciende por cortos periodos de tiempo, pero las
muestras permanecen al nivel de la señal al comienzo del período
de muestra, gracias a un circuito de muestreo/retención.
Figura 5: Técnicas de muestreo
Fuente: Coimbra. E. (2014). [Imagen sin título sobre técnicas de muestreo]. Recuperado de
[Link]
Cuantificación
El muestreo genera pulsos con amplitudes comprendidas entre la mínima y
máxima amplitud de la señal analógica que estamos muestreando. El
conjunto de amplitudes de las muestras obtenidas (la cresta de la barra
vertical) puede ser infinito, con valores no enteros que no pueden usarse en
el proceso de codificación. Por ello, vamos a transformar estos infinitos
valores no enteros en una serie de valores enteros bien definidos y
conocidos. El proceso puede dividirse en dos etapas que se ejecutan en un
cuantificador.
C U A N T I FI C A C I Ó N V A LO R C U A N T I FI C A D O
Esta etapa consiste en dividir el rango (escala) de amplitudes obtenidas en un
número limitado de intervalos de cuantificación (en la figura 6, serían 8
intervalos de 5 V de altura).
C U A N T I FI C A C I Ó N V A LO R C U A N T I FI C A D O
Aquí, las amplitudes se normalizan al valor de la altura de los intervalos y las
muestras toman los valores cuantificados que se fijan en el punto medio de
cada intervalo; las que estén dentro de un mismo intervalo toman el mismo
valor cuantificado (en el ejemplo de la figura 6, 20/5 = 4…15/5 = 3…10/5 = 2…,
etc.).
Figura 6: Cuantificación
Fuente: Forouzan, B. (2013). [Imagen sin título sobre cuantificación], p. 120.
En el ejemplo de la figura 6, los niveles mínimos y máximos de tensión son
-20 V y + 20 V. El número de niveles se fija en 8, entonces L = 8, y como Vmáx.
– Vmín, = 40. El delta es, entonces, de 5 V.
Si en la etapa de muestreo se toman 10 muestras. Se indican los valores de
tensión de cada una en el gráfico (-6,1 V, 7,5 V, 16,2 V, etc.). A modo de
ejemplo, la muestra -6,1 V está más cerca del nivel 2. La muestra 16,2 V está
más cerca del nivel 6.
Los valores en la fila denominada normalized PAM values muestran los
niveles exactos tomados en la etapa de muestreo divididos en delta. La fila
normalized quantified values muestra el valor corregido para que el nivel sea
el mismo en el centro de cada zona. La diferencia entre estos dos valores se
muestra en la fila normalized error y produce el denominado error de
cuantificación.
¿El error indica que la señal cuantificada y
muestreada no será igual que la señal analógica
original? ¿Habrá distorsión?
Algunos comentarios con respecto a este paso de la conversión son los
siguientes:
Niveles
–
Los niveles de cuantificación dependen del rango de las amplitudes de la
señal analógica y de la precisión con la que se necesite recuperarla. En el
ejemplo se han mostrado 8 niveles de cuantificación. Si la amplitud de la
señal fluctúa solo entre 2 valores, se necesitan solo 2 niveles. La señal de
audio, como la de voz, tiene muchos valores de amplitud, por eso necesita
más niveles, normalmente 256. En video, se necesitan miles de niveles.
Habitualmente se utiliza 𝑁 = 2𝑛 siendo 𝑁 = número de niveles y 𝑛 = número
de bits por muestra.
Error
–
La cuantificación es un proceso de aproximación. Los valores de entrada del
cuantificador son reales, los de salida son aproximados. Si el valor de entrada
se encuentra en la mitad del intervalo no hay error de cuantificación, en otro
caso sí. El error disminuye si se aumentan los intervalos de cuantificación y
se eliminaría totalmente si el número de intervalos fuera infinito, lo cual no es
posible. El error de cuantificación deforma la señal reconstruida y causa una
distorsión que se denomina ruido de cuantificación. El nivel de ruido de
cuantificación afecta a la relación señal a ruido S/N del sistema o su
equivalente. Normalmente se usa la fórmula S/ N(dB) = 1,76 + 6,02n, donde
S/N = relación señal a ruido, en dB y 𝑛 = número de bits por muestra.
Codificación
Por último, en la etapa de codificación, a cada muestra cuantificada obtenida
se le asigna un código de cuantificación, en el ejemplo, de 0 a 7, que luego se
pasa a su valor binario (encoded word).
Las características de esta etapa son:
Es la última etapa en PCM. Con la codificación se representan las
muestras cuantificadas mediante una secuencia binaria de unos y
ceros.
El número de bits para cada muestra se determina a partir del
número de niveles de cuantificación.
La tasa de bit generada se calcula con base a la tasa de muestreo y
la cantidad de bits por muestra. V𝑡(bps) = 𝑓S(Hz) × 𝑛 donde 𝑣𝑡 =
tasa de bit, en bps, 𝑓S = tasa de muestreo, en Hz. y 𝑛 = número de
bits por muestra.
C O NT I NU A R
LECCIÓN 3 de 3
Referencias
Castillo, F. (2020). La conversión analógico-digital en audio y vídeo.
Recuperado de [Link]
en-audio-y-video/.
Coimbra, E. (2013). Datos y señales analógicas y digitales. Recuperado de
[Link]
analogicas-y-digitales.
Coimbra. E. (2014). Telecomunicaciones. Recuperado de
[Link]
Forouzan, B. (2013). Data Communication and Networking (pp. 115-124).
Estados Unidos: McGraw Hill.
C O NT I NU A R