CODEC
Procesamiento digital de señales
Docente:
Victor Castro
Sergio Andrés Castiblanco
Fabian Camilo Salgado Sosa
Universidad Santo Tomas.
Bogotá D.C.
Septiembre 2020
CODEC
Los códec se pueden definir como dispositivos que tienen la capacidad de codificar
o decodificar una señal, ocasionando que un archivo de flujo de datos sea transformado a una
señal, las funciones de estos dispositivos es comprimir un flujo digital, y es empleado entre
300 HZ a 3.4 Hz.
Existen diferentes tipos de CODESC, que son clasificados dependiendo del formato
en el que se encuentren, ya sean de audio o de video. De esta manera son utilizados estos
algoritmos que reducen el contenido de datos, extrayendo la información primordial,
buscando que a la hora de la reconstrucción tenga gran similitud de tal forma que el ojo u
odio humano no perciba ningún tipo de cambio.
CODEC DE AUDIO
La principal función de estos tipos de codec es codificar y decodificar los datos
auditivos, ocasionando la reducción de bits que tiene el formato auditivo. Estos deben contar
con un muestreo preciso causando una resolución más amplia, mayor rango dinámico
mayores variaciones en el espectro de potencia.
• DOLBY AC-3
Este tipo de codec de audio esta diseñado por medio de bloques PCM (Modulación
Por Impulsos Codificados) tomando muestras sucesivas cada 256 veces del ultimo
diagrama de bloque de audio, esta permite cambiar el diseño de un bloque de 512 a
256 señales de audio con violentos cambios de amplitud, este algoritmo opera a una
longitud definida y que no varia en el tiempo, obteniendo una buena resolución en
tiempo y frecuencia en donde el decodificador procesa una secuencia intercalada de
forma idéntica a secuencias de bloques largos, una definición de la ecuación de
transformada directa AC-3 para bloques largos y cortos es
𝑁−1
1 2𝜋 1
𝑥(𝑘) = ∑ 𝑥(𝑛)cos ( )(𝑘 + )(𝑛 + 𝑛0)), 𝑘 = 0,1, … . . , 𝑁 − 1
𝑁 𝑁 2
𝑛=0
• MPEG:
Es una técnica de video y de audio que es denominado MPEG (Motion Picture
Experts Groups). Este aplica una transformada de coseno discreta, que reduce la
transformada de los bloques desde el dominio del espacio al dominio de la frecuencia.
Existen diferentes opciones dependiendo del uso:
MPEG-1:
Está diseñado para guardar una imagen, compararla y luego almacenar las diferencias.
MPEG-2:
Se centra el ampliar la técnica del MPEG-1 para cubrir imágenes mas grandes y de calidad.
MPEG-3:
Fue diseñada para HDTV (Televisión De Alta Definición), pero fue reemplazo por MPEG-
2.
MPEG-4:
Este incorpora muchas más herramientas que proporcionan mayor calidad de imagen.
• ASIGNACIÓN DINÁMICA DE BITS
Este codec denomina la frecuencia gana significativamente en rendimiento si
el numero de bits asignados de los coeficientes de transformación se adapta al
espectro de corto plazo de la codificación audio de bloque por bloque.
Los parámetros del espectro son codificados y transmitidos, luego se estima
el numero optimo de bits para cada coeficiente de transformación, que son
codificados y decodificados.
• TRANSFORMADA DISCRETA DEL COSENO MODIFICADA
Este codec más conocido como MDCT es una transformada discreta ortogonal
solapada. Este algoritmo de ortogonalización busca simplificar las operaciones de un
bloque de 2*N es equivalente a una operación de datos que muestra N/2 seguido de
un punto N ortogonales que bloquean las transformadas de los bloques en N. El
problema que ocasiona este tipo de filtro es el tiempo y en la introducción de los
filtros, ocasionando problemas en las frecuencias y el los filtros ondulatorios.
Algunos tipos de algoritmos empleados en la transformada discreta de coseno
modificada son.
DCT-I
𝑁−2
1 𝜋
𝑥 = (𝑥𝑜 + (−1)𝑘 𝑥𝑁 − 1) + ∑ 𝑥𝑗 cos [ 𝑗𝑘] 𝑘 = 0, … … , 𝑁 − 1
2 𝑁−1
𝑗−1
DCT-II
𝑁−1
𝜋 1
𝑥 = ∑ 𝑥𝑗 cos [ (𝐽 + )𝑘] 𝑘 = 0, … … , 𝑁 − 1
𝑁 2
𝑗−0
DCT-III
𝑁−1
1 𝜋 1
𝑥 = 𝑥𝑜 + ∑ 𝑥𝑗 cos [ (𝑘 + )𝑗] 𝑘 = 0, … . , 𝑁 − 1
2 𝑁 2
𝑗−1
DCT-IV
𝑁−2
𝜋 1 1
𝑥 = ∑ 𝑥𝑗 cos [ (𝑗 + )(𝑘 + )] 𝑘 = 0, … . , 𝑁 − 1
𝑁 2 2
𝑗−0
• MP3
Es un tipo de formato de compresión de audio digital, este codec de audio es el más
utilizado, además es utilizado por defecto para compartir música en la red, y es
utilizado en computadores y en dispositivos móviles. Al momento de comprimir un
archivo se eliminan los datos débiles y no se notarán las modificaciones de sonido,
este codec utiliza la transformada discreta de coseno modificada por (MDCT) y es un
diseño con bloques consecutivos, que es un formato codificado con MPEG-1.
𝑁−2
1 𝜋
𝑥 = (𝑥𝑜 + (−1)𝑘 𝑥𝑁 − 1) + ∑ 𝑥𝑗 cos [ 𝑗𝑘] 𝑘 = 0, … … , 𝑁 − 1
2 𝑁−1
𝑗−1
• PAC
Es un codec que utiliza técnicas de codificación de fuente que elimina la redundancia
de una señal, luego combina métodos que producen una buena lectura del audio
mientras se aseguran de una máxima calidad de la señal, este brinda un ancho de
banda de 20 HZ a 20 KHZ de la señal ya que codifica el audio estereofónico y
multicanal, y utiliza la transformada discreta de coseno modificado.
𝑁−1
𝜋 1
𝑥 = ∑ 𝑥𝑗 cos [ (𝐽 + )𝑘] 𝑘 = 0, … … , 𝑁 − 1
𝑁 2
𝑗−0
CODEC DE VOZ
Su funcionalidad principal es clasificar la forma de las ondas, es decir si hubiera un error de
cuantificación, la señal de voz seria reproducida de manera exacta, y se basan en parámetros
de producción de habla.
• LPC
El codec (LPC) más conocida como Linear Predictive Coding , esta se basa en el
grado de periodicidad de una señal, la amplitud de la señal selecciona para que
coincida con una codificación de bits bajas, además emplea la transformada rápida de
Fourier(FFT) para su codificación.
1−𝑘 𝐴𝑖 + 1
𝐺1 = 𝑓(𝐾) = log ( ) = log ( ) 1<𝑖<𝑝
1+𝑘 𝐴𝑖
• MBE
Este codec de voz trabaja según la forma de la onda de la señal y el ruido de la banda
estrecha, y las ondas son utilizadas armónicamente relacionados para generar los
componentes periódicos y el ruido es utilizado para componentes aperiódicos, este
realiza un análisis por medio de la transformada de Fourier (FFT).
∞
𝐹(𝑢) = ∫ 𝑓(𝑥)𝑒 −2𝜋𝑖𝑢𝑥 𝑑𝑥
−∞
• GSM
Este tipo de codec de voz GSM utiliza la información de muestras anteriores, para
predecir la muestra actual. La señal de voz se segmenta en bloques tiene una duración
de 20 ms, y la voz opera a 13 Kbps
• Códec sub-banda
Divide la señal de voz en un número de frecuencias y cuantificar las bandas por
separado, así el ruido de cuantificación se mantiene dentro de la banda, y utilizan
bancos de filtros, generando un banco de filtros que es reemplazado por la
transformada rápida de Fourier (FFT).
∞
𝐹(𝑢) = ∫ 𝑓(𝑥)𝑒 −2𝜋𝑖𝑢𝑥 𝑑𝑥
−∞
CODEC DE IMÁGENES
• JPEG – Joint Photographic Experts Group
Este codec de imagen utiliza un método para comprimir imágenes, ajustando la
calidad de la imagen que se desea reconstruir. La forma que utiliza para la compresión
de imagen de entrada es el algoritmo de la transformada discreta de coseno (DCT), al
obtener la imagen los pixeles y el tamaño se ajustan de acuerdo de la calidad de
imagen, al digitar una imagen de colores cada pixel tiene un valor de intensidad de
rojo, verde o azul, y cuando se aplica el algoritmo la imagen se transformara a un
espacio el que se tienen dos canales de color y uno de brillo.
𝑀−1 𝑁−1
𝜋(2𝑚 + 1)𝑝 𝜋(2𝑛 + 1)𝑞
𝐵𝑝𝑞 =∝ 𝑝 ∝ 𝑞 ∑ ∑ 𝐴𝑚𝑛 cos cos ,0 < 𝑝 < 𝑀 − 1
2𝑀 2𝑁
𝑚=0 𝑛=0
1 2
∝= { ,𝑝 = 0 ,√ , 𝑝 = 0, 1 < 𝑝 < 𝑀 − 1
√𝑀 𝑀
• SIPHT – Set Partitioning in Hierarchical Trees
Este codec se basa en un conjunto de datos organizados jerárquicamente que buscan
la descendencia de los coeficientes que codifican. El algoritmo que emplea el
algoritmo de Wavelet (DWT), y tiene como objetivo principal la codificación de la
información.
𝑁−1
∅(𝑡) = ∑ √2 ∗ ℎ𝑘 + ∅(2𝑡 − 𝐾)
𝑘=0
1 𝑡
∅(𝑡) = ∗ ∅( − 𝑛)
√2𝑖 2𝑖
• EZW – Embedded Zerotree Wavelet
Este tipo de codec se basa en transmitir bits por orden significativo que produce una
compresión progresiva de imágenes, entre los bits se añadan mas detalles se
transmitirán, el algoritmo que utilizan es la incrustación definido por Shapiro, este
cuantifica los coeficientes de wavelet de la imagen por potencias recudiendo el envió
de bits.
𝑁−1
∅(𝑡) = ∑ √2 ∗ ℎ𝑘 + ∅(2𝑡 − 𝐾)
𝑘=0
CODEC DE VIDEO
Los códec de video se utilizan para descomprimir y comprimir video digital, normalmente
los algoritmos utilizados por estos códec ocasionan una pérdida de información.
El principal problema de estos códec es que la resolución que administran tiene un espacio
típico determinado y la manipulación de esta información ya sea su copia edición o
visualización puede conllevar a la sobrecarga en sus procesos o eliminar información.
Podemos encontrar los siguientes códec de video.
• DCT
El códec DCT consiste en una transformación basada en bloques, esto quiere decir que la
señal se divide en bloques, los cuales se transforman usando cosenos discretos ortogonales.
• VP8
A través de la última imagen, marco de referencia y marco de oro este códec realiza la
compresión de video, el proceso de compresión se lleva a cabo dividiendo la señal en
fragmentos llamados macrobloques lo cual se utiliza para poder encontrar elementos
similares al movimiento actual, este códec emplea predicción de fotograma Intra para
información dentro del video y fotogramas Inter para marcos que están previamente
codificados.
Para dividir los bloques, este códec utiliza la DCT (Transformada discreta del coseno).
𝑁−1
2𝑐(𝑘) (2𝑗 + 1)𝑘𝜋
𝐹(𝑘) = ∑ 𝑓(𝑗)cos [ ]
𝑁 2𝑁
𝑗=0
1
Donde 𝑐(𝑘) = para k=0 y c(k) =1 para otros números enteros hasta N-1.
√2
Esta se utiliza ya que expresa una secuencia finita de puntos de datos en termino de suma de
funciones de coseno que oscilan en diferentes frecuencias, a su vez para transformadas de
frecuencia el códec emplea la transformada de Hadamard.
𝑁−1 𝑁−1
1 𝑘−1
𝐻(𝑢, 𝑣) = ∑ ∑ 𝑓(𝑥, 𝑦)(−1)∑𝑖=0 𝑏𝑖 (𝑥)𝑏𝑖(𝑢)+𝑏𝑖 (𝑦)𝑏𝑖 (𝑣)
𝑁
𝑥=0 𝑦=0
Lo cual permite un funcionamiento lineal en 2^m que corresponde a números reales o
complejos, esta transformada es equivalente a la DCT.
• WMV
(Windows Media Video) es un conjunto de algoritmos de compresión que se ubican en el set
propietario de tecnologías de vídeo desarrolladas por Microsoft, el cual forma parte del
framework Windows Media, estos realizan la compresión de archivos para retransmisiones
a través de internet de forma que combinan audio comprimido con video comprimido, a los
ficheros de solo video se les asigna la extensión .wmv con este se obtienen resoluciones que
van desde 720 a 1080 pixeles. Es utilizado en [Link], MPlayer y Windows Media Player
WMV no se construye solo con tecnología interna de Microsoft. Desde la versión 7 (WMV1),
Microsoft ha utilizado su propia versión no estandarizada de MPEG-4. El vídeo generalmente
se combina con sonido en formato Windows Media Audio.
• H264
Este códec controla el bit-rate, utiliza compresión de movimiento para reducir la redundancia
temporal, se divide en dos bloques, uno es el encargado de reducir la redundancia temporal
además de utilizar vectores de movimiento para realizar el filtrado de bloques que reduce
errores o distorsión introducida en el bloque durante el proceso de cuantificación, tiene
capacidad de compresión de 16x16, 16.8x16 y 8x8, utiliza la transformada de Hadamard 4x4
que corresponde a coeficientes DC y 2x2 que corresponde a coeficientes de crominancia, de
acuerdo al residuo.
𝑁−1 𝑁−1
1 𝑘−1
𝐻(𝑢, 𝑣) = ∑ ∑ 𝑓(𝑥, 𝑦)(−1)∑𝑖=0 𝑏𝑖 (𝑥)𝑏𝑖(𝑢)+𝑏𝑖 (𝑦)𝑏𝑖 (𝑣)
𝑁
𝑥=0 𝑦=0
• MPG-4
Se Basa en técnicas de codificación de voz con pérdidas, audio general. Es usualmente
utilizado en la telefonía en tiempo real con compresión de audio de alta calidad.
Este códec emplea varios grupos de formato de audio y a cada uno se le asigna un tipo de
objeto de audio para su representación y distinguir el método de codificación. Se organiza
por niveles que limitan parámetros de herramientas presentes en un perfil como la velocidad
de muestreo y el número de canales codificados al mismo tiempo, realiza diferentes funciones
como la multiplexación y sincronización de datos asociados con objetos del medio los cuales
pueden ser eficientes al momento de la transmisión a través de la red y además cuenta con
interacción de escena audiovisual formada en el lado del receptor, esta emplea la
transformada discreta de coseno (DCT).
𝑁−1
2𝑐(𝑘) (2𝑗 + 1)𝑘𝜋
𝐹(𝑘) = ∑ 𝑓(𝑗)cos [ ]
𝑁 2𝑁
𝑗=0
1
Donde 𝑐(𝑘) = para k=0 y c(k) =1 para otros números enteros hasta N-1.
√2
Referencias
[1] Vijay K. Madisetti, Douglas B. Williams, “Digital signal processing Handbook”,
1999
[2]Anonymous "Qué es un CODEC y para qué sirve," 2020.
Available: [Link]
[3] Anonymous (). Algoritmos De Compresion.
Available: [Link]
[4] MADISETTI, Vijay (Ed.). The digital signal processing handbook. CRC press,
1997
[5] FOGG, Chad, et al. MPEG video compression standard. Springer Science &
Business Media, 2007.
[6] P. T. [Link]. (). Wavelets: Concepto y aplicaciones para el análisis de señales -
[Link]. Available: [Link]
aplicaciones-analisis-senales/[Link].
[7] Anonymous (). Extensión de archivo H.264 y formato MP4. Available: [Link]
[Link]/es/formato-de-archivo/h264.
[8] Anonymous "Codec de compresión de video VP8 para WebM," 2017.
Available: [Link]
[9] MCCREE, Alan V.; BARNWELL, Thomas P. A mixed excitation LPC vocoder
model for low bit rate speech coding. IEEE Transactions on Speech and audio
Processing, 1995.