TRANSFORMADA
DISCRETA DEL COSENO
(DCT)
INTRODUCCIÓN
• La DFT es el ejemplo más común de una clase general de
transformadas de longitud finita, que se expresa de la forma:
𝑁−1
𝐴𝑘 = 𝑥 𝑛 ∅𝑘 ∗ 𝑛 (1)
𝑛=0
𝑁−1
1
𝑥𝑛 = 𝐴 𝑘 ∅𝑘 𝑛 2
𝑁
𝑘=0
INTRODUCCIÓN
• Denominando a Øk como las secuencias base, que son ortogonales
entre si, es decir:
𝑁−1
1 ∗ 1, 𝑚 = 𝑘
∅𝑘 𝑛 ∅𝑚 𝑛 =
𝑁 0, 𝑚 ≠ 𝑘
𝑛=0
INTRODUCCIÓN
• En el caso de la DFT, las secuencias de la base son las exponenciales complejas
periódicas 𝑒 𝑗2𝜋𝑘/𝑁 y la secuencia A 𝑘 es compleja incluso si la secuencia 𝑥 𝑛 es
real, por ello la idea de que existan conjuntos de secuencias de la base reales que
produzcan secuencias de transformada A 𝑘 con valores reales cuando 𝑥 𝑛 sea
real ha llevado a la definición de otras representaciones basadas en transformadas
ortogonales.
𝑁−1
𝐴𝑘 = 𝑥 𝑛 ∅𝑘 ∗ 𝑛 (1)
𝑛=0
• La DCT (Discrete Cosine Transform) es una transformada ortogonal para
secuencias reales, que se ha convertido en una herramienta para las aplicaciones
de tratamiento de señales, particularmente para la compresión de voz e imagen.
DEFINICIÓN DCT
• La DCT es una transformada con la forma de las ecuaciones (1) y (2)
en donde las secuencias de la base Øk son cosenos. Debido a que los
cosenos son periódicos y tienen simetría par, la extensión de 𝑥 𝑛
fuera del intervalo 0 ≤ 𝑛 ≤ 𝑁 − 1 en la ecuación de síntesis (2) será
periódica y simétrica.
• La DFT asume la hipótesis implícita de periodicidad.
• Mientras que la DCT asume las hipótesis implícitas de periodicidad y
simetría par.
DEFINICIÓN DCT
• La DCT corresponde a formar una secuencia periódica y simétrica a
partir de la secuencia de longitud finita de tal forma que se pueda
recuperar de forma única dicha secuencia de longitud finita.
• En la Figura 1 se pueden ver 17 muestras de cuatro ejemplos de
extensiones simétricas y periódicas de una secuencia de cuatro puntos.
La secuencia de longitud finita original se muestra en cada una de las
subfiguras como muestras con puntos negros.
GRAFICA DE EXTENSIÓN DE X[n]
• Los cuatro casos diferentes que se
muestran en la figura ilustran la
periodicidad implícita en las cuatro formas
comunes de la DCT, denominadas
respectivamente DCT-1, DCT-2, DCT-3 y
DCT-4.
• Hay cuatro formas más de crear una
secuencia periódica par a partir de x[n].
Además, es también posible crear ocho
secuencias periódicas reales con simetría
impar a partir de x[n], lo que nos conduciría a
ocho versiones diferentes de la DST (discrete
sine transform).
• Estas transformadas constituyen una familia
de 16 transformadas ortonormales de
secuencias reales. De todas ellas, las que más
se utilizan son la DCT-1 y la DCT-2.
Figura 1.
DEFINICIÓN DCT-1 Y LA DCT-2
• Todas las extensiones periódicas que conducen a las diferentes formas
de la DCT se pueden ver como una suma de copias desplazadas de las
secuencias de N puntos ±𝑥 𝑛 y ±𝑥 −𝑛 . Las diferencias entre las
extensiones para la DCT-1 y la DCT-2 dependen de si los puntos
extremos se solapan con versiones desplazadas de sí mismos y, si es
así, que puntos extremos se solapan.
DEFINICIÓN DCT-1 Y LA DCT-2
• Para la DCT-1, x[n] se modifica primero en sus extremos y después se
extiende para que su periodo sea 2N − 2. La secuencia periódica resultante
es:
𝑥1 𝑛 = 𝑥∝ 𝑛 2𝑁−2 + 𝑥∝ −𝑛 2𝑁−2 (3)
• Donde 𝑥∝ 𝑛 es la secuencia modificada 𝑥∝ 𝑛 =∝ 𝑛 𝑥 𝑛 , con:
1
∝ 𝑛 = 2, 𝑛 =0𝑦𝑁−1 (4)
1, 1≤𝑛 ≤𝑁−2
DEFINICIÓN DCT-1 Y LA DCT-2
• La ponderación de los extremos compensa el hecho de que se doblan
cuando los dos términos de la Ecuación (3) se solapan en 𝑛 = 0, 𝑛 =
𝑁 − 1 y en los correspondientes puntos separados de esos por
múltiplos enteros de 2𝑁 − 2 .
• Con esta ponderación, se puede verificar fácilmente que 𝑥 𝑛 = 𝑥1 𝑛
para 𝑛 = 0,1, … 𝑁 − 1. La secuencia periódica resultante 𝑥1 𝑛 tiene
simetría periódica par alrededor de los puntos 𝑛 = 0 y 𝑛 = 𝑁 −
1, 2𝑁 − 2, 𝑒𝑡𝑐. Denominaremos a esta simetría, simetría periódica de
tipo-1.
DEFINICIÓN DCT-1 Y LA DCT-2
• La DCT-1 se define mediante la pareja de transformadas:
𝑁−1
𝑐1
𝜋𝑘𝑛
𝑋 𝑘 =2 ∝ 𝑛 𝑥 𝑛 cos , 0≤𝑘 ≤𝑁−1 (5)
𝑁−1
𝑛=0
𝑁−1
1 𝑐1
𝜋𝑘𝑛
𝑥𝑛 = ∝ 𝑘𝑋 𝑘 cos , 0≤𝑛 ≤𝑁−1 (6)
𝑁−1 𝑁−1
𝑘=0
Donde ∝ 𝑛 se define en la Ecuación (4).
DEFINICIÓN DCT-1 Y LA DCT-2
• Para el caso de la DCT-2, x[n] se extiende hasta tener periodo 2N, y la
secuencia periódica es:
𝑥2 𝑛 = 𝑥 𝑛 2𝑁 + 𝑥 −𝑛 2𝑁 (7)
• Como los puntos extremos no se solapan, no se requiere modificarlos
para asegurar que 𝑥 𝑛 = 𝑥2 𝑛 para 𝑛 = 0,1, … 𝑁 − 1. En este caso,
que denominaremos simetría periódica de tipo-2, la secuencia
periódica 𝑥2 𝑛 tiene simetría periódica par alrededor de los puntos de
“mitad de muestra” −1 2 , 𝑁 −1 2, 2𝑁 −1 2 , 𝑒𝑡𝑐.
DEFINICIÓN DCT-1 Y LA DCT-2
• La DCT-2 se define mediante la pareja de transformadas:
𝑁−1
𝑐2
𝜋𝑘 2𝑛 + 1
𝑋 𝑘 =2 𝑥 𝑛 cos , 0≤𝑘 ≤𝑁−1 (8)
2𝑁
𝑛=0
𝑁−1
1 𝑐2
𝜋𝑘 2𝑛 + 1
𝑥𝑛 = 𝛽𝑘𝑋 𝑘 cos , 0≤𝑛 ≤𝑁−1 (9)
𝑁 2𝑁
𝑘=0
DEFINICIÓN DCT-1 Y LA DCT-2
• Donde la DCT-2 inversa utiliza la función de ponderación β 𝑘 :
1
𝛽 𝑘 = 2, 𝑘=0 (10)
1, 1 ≤ 𝑘 ≤ 𝑁 − 1
GRAFICA DCT-1 Y DCT-2 DE LA
SECUENCIA ORIGINAL
GRAFICA DCT-1 Y DCT-2 DE LA
SECUENCIA ORIGINAL
• Estas figuras ilustran que las DCT son también secuencias periódicas.
Sin embargo, la simetría de la secuencia transformada no es siempre la
misma simetría periódica implícita de la secuencia de entrada.
• Mientras que 𝑥1 𝑛 y la extensión de 𝑋 𝑐1 𝑘 tienen ambas simetría de
tipo 1, comparando las figura (c) de la gráfica de extensión y la figura
(b) de la gráfica de DCT-1 y DCT-2 podemos ver que 𝑋 𝑐2 𝑘 tiene la
misma simetría que 𝑥3 𝑛 y no la de 𝑥2 𝑛 .
RELACION ENTRE LA DFT Y DCT-1
• Existe una estrecha relación entre la DFT y las diversas clases de DCT,
para esta relación se debe tener en cuenta que, como en la DCT-1,
𝑥1 𝑛 se construye a partir de 𝑥1 𝑛 mediante las Ecuaciones (1) y (2),
donde se define la secuencia de longitud finita:
𝑥1 𝑛 = 𝑥∝ 𝑛 2𝑁−2 + 𝑥∝ −𝑛 2𝑁−2 = 𝑥1 𝑛 (11)
• Para n = 0,1, … 2𝑁 − 3, donde 𝑥∝ 𝑛 =∝ 𝑛 𝑥 𝑛 es la secuencia real
de N puntos con los extremos divididos por 2.
RELACION ENTRE LA DFT Y DCT-1
• A partir de la Ecuación (11) se deduce que la DFT de (2N − 2) puntos
de la secuencia de (2N − 2) puntos 𝑥1 𝑛 es:
𝑋1 𝑘 = 𝑋∝ 𝑘 + 𝑋∝ ∗ 𝑘 = 2𝑅𝑒 𝑋∝ 𝑘 (12)
• Para 𝑘 = 0,1, … 2𝑁 − 3, donde 𝑥∝ 𝑘 es la DFT de (2N − 2) puntos de
la secuencia de N puntos ∝ 𝑛 𝑥 𝑛 ; es decir, ∝ 𝑛 𝑥 𝑛 se rellena
con (N − 2) muestras de valor cero.
RELACION ENTRE LA DFT Y DCT-1
• Utilizando la definición de DFT de (2N − 2) puntos de la secuencia
ampliada con ceros obtenemos para 𝑘 = 0,1, … 𝑁 − 1,
𝑁−1
2𝜋𝑘𝑛
𝑋1 𝑘 = 2𝑅𝑒 𝑥∝ 𝑘 =2 ∝ 𝑛 𝑥 𝑛 cos = 𝑋 𝑐1 𝑘 (13)
2𝑁 − 2
𝑛=0
• Por tanto, la DCT-1 de una secuencia de N puntos es idéntica a la DFT
de (2N −2) puntos de la secuencia ampliada simétricamente 𝑥1 𝑛 , y es
igual también a dos veces la parte real de los primeros N puntos de la
DFT de (2N − 2) puntos de la secuencia ponderada 𝑥∝ 𝑘 .
DCT-1 INVERSA
• La DCT-1 inversa se puede calcular también utilizando la DFT
inversa. Sólo es necesario utilizar la Ecuación (13) para construir
𝑋1 𝑘 a partir de 𝑋 𝑐1 𝑘 y calcular después la DFT inversa de (2N − 2)
puntos. Concretamente,
𝑋 𝑐1 𝑘 , 𝑘 = 0, … 𝑁 − 1
𝑋1 𝑘 = 𝑐1 (14)
𝑋 2𝑁 − 2 − 𝑘 , 𝑘 = 0, … 2𝑁 − 3
DCT-1 INVERSA
• Utilizando la definición de DFT inversa de (2N − 2) puntos, se puede
calcular la secuencia extendida simétricamente:
2𝑁−3
1
𝑥1 𝑛 = 𝑥1 𝑘 𝑒 𝑗2𝜋𝑘𝑛 (2𝑁−2)
(15)
2𝑁 − 2
𝑘=0
• Para n = 0,1, … 2𝑁 − 3, de donde se puede obtener 𝑥 𝑛 extrayendo
los primeros N puntos. Es decir 𝑥 𝑛 = 𝑥1 𝑛 para n = 0,1, … 𝑁 − 1.
Se dice también que la relación de la DCT-1 inversa se puede expresar
en función de 𝑋 𝑐1 𝑘 y funciones coseno.
RELACION ENTRE LA DFT Y DCT-2
• De manera similar es posible expresar la DCT-2 de una secuencia de
longitud finita 𝑥 𝑛 en función de DFT, para desarrollar la relación
podemos observar que tomando un periodo de la secuencia periódica
𝑥2 𝑛 se define la secuencia de 2N puntos:
𝑥2 𝑛 = 𝑥 𝑛 2𝑁 + 𝑥 −𝑛 − 1 2𝑁 = 𝑥2 𝑛 (16)
• Para n = 0,1, … 2𝑁 − 1, donde 𝑥 𝑛 es la secuencia real original de N
puntos.
RELACION ENTRE LA DFT Y DCT-2
• Utilizando la Ecuación (17), obtenemos:
𝑋2 𝑘 = 𝑋 𝑘 + 𝑋 ∗ 𝑘 𝑒 𝑗2𝜋𝑘 (2𝑁)
𝑋2 𝑘 = 𝑒 𝑗𝜋𝑘 2𝑁 𝑋 𝑘 𝑒 −𝑗𝜋𝑘 2𝑁 + 𝑋 ∗ 𝑘 𝑒 𝑗𝜋𝑘 2𝑁
𝑋2 𝑘 = 𝑒 𝑗𝜋𝑘 2𝑁 2𝑅𝑒 𝑋 𝑘 𝑒 −𝑗𝜋𝑘 2𝑁 (18)
• A partir de la definición de la DFT de 2N puntos se deduce que:
𝑁−1
−𝑗𝜋𝑘 2𝑁
𝜋𝑘 2𝑛 + 1
𝑅𝑒 𝑋 𝑘 𝑒 = 𝑥 𝑛 cos (19)
2𝑁
𝑛=0
RELACION ENTRE LA DFT Y DCT-2
• Por lo tanto utilizando las Ecuaciones (8), (17) y (19), se puede expresar
𝑋 𝑐2 𝑘 en función de X 𝑘 , la DFT de 2N puntos de la secuencia de N
puntos 𝑥 𝑛 , de la siguiente forma:
𝑋 𝑐2 𝑘 = 𝑅𝑒 𝑋 𝑘 𝑒 −𝑗𝜋𝑘 2𝑁
(20)
• Para k = 0,1, … 𝑁 − 1, o en función de la DFT de 2N puntos de la secuencia
extendida simétricamente 𝑥2 𝑛 definida en la Ecuación (16) como:
𝑋 𝑐2 𝑘 = 𝑋2 𝑘 𝑒 −𝑗𝜋𝑘 2𝑁
(21)
𝑋2 𝑘 = 𝑋 𝑐2 𝑘 𝑒 −𝑗𝜋𝑘 2𝑁
(22)
DCT-2 INVERSA
• La DCT-2 inversa se puede calcular también utilizando la DFT
inversa. Sólo es necesario utilizar la Ecuación (22) junto con la
propiedad de simetría de la DCT-2. Concretamente, se puede verificar
fácilmente por sustitución directa en la Ecuación (8) que:
𝑋 𝑐2 2𝑁 − 𝑘 = −𝑋 𝑐2 𝑘
• Para todo k = 0,1, … 2𝑁 − 1
DCT-2 INVERSA
• De la ecuación anterior se deduce:
𝑋 𝑐2 0 , 𝑘 = 0,
𝑒 −𝑗𝜋𝑘 2𝑁 𝑋 𝑐2 𝑘 , 𝑘 = 1, … 𝑁 − 1,
𝑋2 𝑘 = (24)
0 𝑘=𝑁
−𝑒 −𝑗𝜋𝑘 2𝑁 𝑋 𝑐2 2𝑁 − 𝑘 , 𝑘 = 𝑁 + 1, 𝑁 + 2, … 2𝑁 − 1
DCT-2 INVERSA
• Utilizando la definición de DFT inversa se puede calcular la secuencia
extendida simétricamente:
2𝑁−1
1
𝑥2 𝑛 = 𝑥2 𝑘 𝑒 𝑗2𝜋𝑘𝑛 (2𝑁)
(25)
2𝑁
𝑘=0
• Para n = 0,1, … 2𝑁 − 1, de donde se puede obtener 𝑥 𝑛 = 𝑥2 𝑛 para
n = 0,1, … 𝑁 − 1.
PROPIEDAD DE COMPACTACIÓN DE LA
ENERGÍA DE LA DCT-2
• La DCT-2 se utiliza en muchas aplicaciones de compresión de datos
con preferencia sobre la DFT debido a una propiedad que se denomina
frecuentemente “compactación de la energía”. Concretamente, la DCT-
2 de una secuencia de longitud finita tiene a menudo los coeficientes
más concentrados en los índices bajos que la DFT.
PROPIEDAD DE COMPACTACIÓN DE LA
ENERGÍA DE LA DCT-2
• La importancia de este hecho surge del teorema de Parseval, que para la
DCT-1 es:
𝑁−1 𝑁−1
2
1
∝ 𝑛 𝑥𝑛 = ∝ 𝑘 𝑋 𝑐1 𝑘 2
(26)
2𝑁 − 2
𝑛=0 𝑘=0
• Para la DCT-2 es:
𝑁−1 𝑁−1
2
1
𝑥𝑛 = 𝛽 𝑘 𝑋 𝑐2 𝑘 2
(27)
𝑁
𝑛=0 𝑘=0
EJEMPLO COMPACTACIÓN DE LA
ENERGÍA
• Ejemplo 8.13 Compactación de la energía de la DCT-2 (Páginas 664
-666)
APLICACIONES DE LA DCT
• La aplicación más importante de la DCT-2 es la compresión de
señales, que es un aspecto clave de muchos algoritmos estandarizados.
En esta aplicación, los bloques de la señal se representan mediante sus
transformadas del coseno.
• La popularidad de la DCT en compresión de señales se debe a su
propiedad de compactación de la energía, que hemos ilustrado con un
ejemplo simple en la sección anterior.
APLICACIONES DE LA DCT
• Las DCT son transformadas ortogonales como la DFT y por tanto
tienen muchas propiedades similares a las de la DFT que las hacen
muy flexibles para manejar las señales que representan. Una de las
propiedades más importantes de la DFT es que la convolución
periódica de dos secuencias de longitud finita corresponde a la
multiplicación de sus correspondientes DFT. En el caso de la DCT, el
correspondiente resultado es que la multiplicación de transformadas
DCT corresponde a la convolución periódica de las secuencias
simétricamente extendidas subyacentes.
APLICACIONES DE LA DCT
• Sin embargo, surgen otras complicaciones adicionales. Por ejemplo, la
convolución periódica de dos secuencias periódicas simétricas de tipo
2 no es una secuencia de tipo 2, sino una secuencia de tipo 1.
Alternativamente, la convolución periódica de una secuencia de tipo 1
con una de tipo 2 del mismo periodo implícito es una secuencia de tipo
2.
• Por tanto, se requiere una mezcla de transformadas DCT para efectuar
la convolución por transformación inversa del producto de las mismas.
APLICACIONES DE LA DCT
• Para el caso de la DFT, la convolución periódica se caracteriza por sus
efectos en los extremos. Los efectos en los extremos para la convolución
periódica simétrica son diferentes de la convolución ordinaria y de la
convolución periódica, realizadas mediante multiplicación de transformadas
DFT.
• La extensión simétrica crea simetría en los puntos extremos. Esto implica
un “suavizado” de los límites que mitiga los efectos de borde que aparecen
al convolucionar secuencias de longitud finita.
• Un área en la que la convolución simétrica es particularmente útil es el
filtrado de imagen donde aparecen efectos de borde objetables debidos a
artefactos de bloques. En esos casos, la DCT puede ser superior a la DFT o
incluso a la convolución lineal ordinaria.
EJERCICIOS MATLAB
• EJERCICIO 1:
Encuentre cuántos coeficientes DCT representan el 99% de la energía en
una secuencia.
EJERCICIO 1
EJERCICIO 1
EJERCICIOS MATLAB
• EJERCICIO 2:
Eliminar las frecuencias altas de una imagen mediante la transferencia
de coseno discreta (DCT) bidimensional.
EJERCICIO 2
EJERCICIO 2
EJERCICIOS MATLAB
• EJERCICIO 3:
Realizar la compensación de iluminación mediante anulación de las
componentes de baja frecuencia en el dominio transformado por DCT,
que corresponde al triangulo superior izquierdo de la imagen
transformada.
EJERCICIO 3
EJERCICIO 3
EJERCICIO 3
CONCLUSIONES
• Se demuestra que la DCT y la DFT están estrechamente relacionadas y
que comparten un supuesto implícito de periodicidad.
• La DCT tiene una buena capacidad de compactación de la energía al
dominio transformado, es decir, que la transformada de coseno
discreta consigue concentrar la mayor parte de la información en
pocos coeficientes transformados.
• La transformación es independiente de los datos. El algoritmo aplicado
no varia con los datos que recibe, como si sucede en otros algoritmos
de compresión.
CONCLUSIONES
• De los resultados mostrados, se debe destacar que la imagen con
iluminación compensada tiene un aspecto estéticamente más agradable
a la vista que el caso de otros algoritmos.
• Por otro lado, se observa que a partir del valor Ddis = 18, cuando se
eliminan cada vez más componentes de baja frecuencia la imagen
resultante presenta sectores con claras oscilaciones en la escala de
grises, lo cual podría puede significar un cierto grado de pérdida de
información importante de la imagen.
• Del mismo modo, para Ddis = 9 o menor, se ve que aún hay zonas con
sombras importantes que no han sido compensadas, lo cual también
puede generar un efecto negativo si se quiere reconocer el rostro.
REFERENCIAS
[1] A. Oppenheim y R. Schafer, «Transformada Coseno Discreta,» de Tratamiento de Señales en Tiempo Discreo,
Madrid, Pearson, 2011, pp. 657-667.