0% encontró este documento útil (0 votos)
24 vistas136 páginas

Fundamentos de Compresión de Video TDT

El documento aborda los fundamentos de la compresión de video en el contexto de la Televisión Digital Terrestre (TDT) y los estándares DVB-T2. Se discuten diversas técnicas de compresión como MPEG-2, H.264, y HEVC, así como la importancia de la codificación de fuente y canal. Además, se analizan métricas de calidad de video y la evolución histórica de los estándares de codificación.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas136 páginas

Fundamentos de Compresión de Video TDT

El documento aborda los fundamentos de la compresión de video en el contexto de la Televisión Digital Terrestre (TDT) y los estándares DVB-T2. Se discuten diversas técnicas de compresión como MPEG-2, H.264, y HEVC, así como la importancia de la codificación de fuente y canal. Además, se analizan métricas de calidad de video y la evolución histórica de los estándares de codificación.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Fundamentos de TDT DVB-T2

Compresión de Video
David Gómez Barquero
Grupo de Comunicaciones Móviles
Instituto de Telecomunicaciones y Aplicaciones Multimedia - iTEAM
Universidad Politécnica de Valencia
Seminarios Teóricos

1. Introducción a la Televisión Digital


2. Compresión de Video
3. Transmisión de Televisión Digital
4. Televisión Digital Terrestre (TDT)

iTEAM © 2014 2
EJERCICIO

• Cómo configurar los codec?


• Qué bit rate se necesita según la definición del video?
• Qué bit rate se necesita al codificar varios canales de TV
conjuntamente (multiplexación estadística)?

iTEAM © 2014 3
Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding (AVC)
ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding (HEVC)
• Multiplexación Estadística
Codificación de Fuente y Codificación de Canal

• La separación de la codificación de fuente de la codificación de


canal permite adaptarse independientemente a:
– Propiedades de la información de fuente a transmitir
– Propiedades del canal de transmisión
iTEAM © 2014 5
Formatos de Imagen Digital y Aplicaciones

iTEAM © 2014 6
Formatos de Imagen Digital

iTEAM © 2014 7
¿Por qué comprimir el vídeo?
• Servicio TV digital calidad estándar (SDTV) ITU-R BT.601 4:2:2
– La frecuencia de muestreo de la crominancia 6.75 MHz es la mitad que
la luminancia 13.5 MHz, tanto en horizontal como en vertical
• Teorema de Nyquist: filtros paso bajo @5.75 MHz y @2.75 MHz (menor que la
mitad de la frecuencias de muestreo)

• Cuantificación de 8 bits
• 10 bits: 270 Mbps

• HDTV (ITU-R BT.709) hasta 3 Gbps 1050p


iTEAM © 2014 8
ITU-R BT.601 SDTV 4:2:2
• Doble de muestras de
luminancia que de
crominancia (4:2:2)
– Orden Y, Cr, Y Cb, Y, …
• El principio y final de la señal
de video se marcan con unas
palabras especiales SAV/EAV
– Horizontal blanking

• Nivel de cuantificación de las


señales Y/Cb/Cr con 8 y 10 bits
• No se utiliza todo el margen
dinámico para poder
iTEAMidentificar
© 2014 claramente las 9
palabras SAV/EAV
ITU-R BT.709
• Common Image Format (CIF): 1080 líneas activas x 1920 pixels
– Total 1125 líneas
– Para 50 y 60 fotogramas por segundo
Frecuencias de muestreo
• Progresivo x2

Escaneado
entrelazado

Escaneado
progresivo

Filtro paso bajo


iTEAM © 2014 10
• Progresivo x2
Fundamentos de Compresión de Video (I)

• Un compresor de video reduce la información de la señal eliminando


información redundante e información poco importante para el ojo
humano

• Se pueden distinguir tres tipos de redundancia


– Psíquico-Visual
– Espacial y temporal
– Entropia

iTEAM © 2014 11
Fundamentos de Compresión de Video (II)
• Redundancia Psíquico-Visual
– Este tipo de redundancia resulta en la manera en la que el ojo y el cerebro funcionan
(e.g. el oido humano tiene una respuesta en frecuencia limitada)
– En video hay que tener presente dos limites:
• El limite de la resolución espacial que puede distinguir el ojo
• El límite de la resolución temporal del ojo para seguir imágenes en movimiento
• Redundancia Espacial y Temporal
– Los pixeles que forman una imagen no toman valores independientes sino que hay una
gran correlación con los pixeles vecinos
– Esto también aplica a fotogramas consecutivos
– El valor de los pixeles se puede predecir
• Entropía
– Algunos valores ocurren más frecuentemente que otros. Esta propiedad se puede
explotar utilizando técnicas de codificación de longitud variable, en la que se asignan
códigos más cortos a los valores más probables
– VLC (Variable Lenght Coding) o código de Huffman
– Código Morse: letras “E” y “T” se representan como “.” “-” letras “X”, “Y” y “Z” se
iTEAM © 2014 12
representan con cuatro digitos
El Sistema de Visión Humano

• Características:
– La resolución temporal del ojo es limitada
(parpadeo)
– Los límites de resolución del color son
mucho menores que las del brillo (luminancia)
– Los objetos estáticos se reconocen con una precisión mayor que los
objetos en movimiento
– Texturas con frecuencias mayores que el límite del sistema visual
humano no son reconocibles
– Los límites de resolución son mayores para estructuras verticales y
horizontales que para estructuras diagonales
– El ojo humano es especialmente sensible a cambios de contraste en
los bordes

iTEAM © 2014 13
Algunas Características Sistema Visual Humano

iTEAM © 2014 14
Espacios de Colores
• RGB (Red, Green Blue) • Imagen junto con
– Tres colores primarios sus componentes
– El ojo es más sensible al verde Y, U, y V

• YUV
– Señal de luminancia más dos de crominancia
• Plano de color U-V,
valor Y = 0.5

• Y, Cb, Cr

iTEAM © 2014 15
Sub-Muestreo del Color

• Muestreo 4:4:4
– No hay pérdida de información de color (máxima calidad)
• Muestreo 4:2:2
– Se muestrea exactamente la mitad de la información cromática
– Diferencias visuales con respecto al muestreo 4:4:4 prácticamente inexistentes
– El tamaño den las imágenes se reduce aproximadamente en un tercio
• Muestreo 4:1:1
– Cada cuatro muestras de luminancia se obtiene una muestra de crominancia
– Se reduce el ancho de banda de la señal hasta la mitad
• Muestreo 4:2:0
– Misma cantidad de información cromática que en el muestreo 4:1:1 (50% color)
– La diferencia radica en el orden en que se toman las muestras (e.g. dos a dos)
iTEAM © 2014 16
Sub-Muestreo del Color

iTEAM © 2014 17
Sensación de Movimiento
• El ojo humano percibe movimiento continuo ante una sucesión
rápida de imágenes
– Una cámara de cine no es más que una cámara de fotos que “echa fotos muy
rápido”

• Imágenes o fotogramas por segundo


– Cine 24 fotogramas por segundo (cada imagen se reproduce durante 0.04 s)
– Animación 15 fotogramas por segundo
– PAL 25 fotogramas por segundo, NTSC 29.97 fotogramas por segundo

• Por tanto hay una gran correlación entre fotogramas sucesivos y que
se©puede
iTEAM 2014 explotar con técnicas de compresión 18
Estimación de Movimiento
• No es necesario transmitir todos los fotogramas completos
• Con un mecanismo de estimación de movimiento sólo es necesario
transmitir la diferencia con respecto al fotograma anterior
• Algunos fotogramas tienen que ser codificados sin otra información para
poder empezar a reproducir el video

iTEAM © 2014 19
Differential Pulse Code Modulation

iTEAM © 2014 20
Métricas de Calidad de Video
• Pérdidas de Codificación en Compresión
Secuencia
Original
ENCODER

T Q VLC

Bitstream
DECODER

T-1 Q-1 VLC-1

Secuencia
Decodificada

La etapa de cuantificación introduce perdidas irrecuperables que evitan el poder


reconstruir la imagen original de modo exactos. En los entornos de producción
estas perdidas no deben ser perceptuales, y se debe trabajar con un margen
suficiente de calidad, para los fuertes procesos que sufren en las etapas de edición
y post-producción (multigeneración), previas a su difusión (nueva compresión)
iTEAM © 2014 21
Métricas de Calidad Objetiva de Vídeo

• La PSNR (Peak Signal-to-Noise Ratio) es la métrica mas utilizada y se


define con un valor numérico que determina la diferencia
matemática entre los valores de la imagen original y la decodificada,
en dB

– Vpeak máximo valor del pixel: 255 para 8 bits y 1023 para 10 bits de precisión
– Ncol y Nlin numero de columnas y de filas del formato de la secuencia
– ori y cod imagen original y decodificada, respectivamente

iTEAM © 2014 22
Métricas de Calidad Objetiva: PSNR (I)

Secuencia Secuencia
Original Decodificada

PSNR (dB)

iTEAM © 2014 23
Métricas de Calidad Objetiva: PSNR (II)

Imagen original PSNR 45. 53 dB PSNR 36.81 dB PSNR 31.45 dB


sin comprimir

• Cuanto mayor es el PSNR, mayor es la calidad objetiva de la señal


• Valores típicos de PSNR están entre 30 dB y 50 dB
• Para transmisiones a dispositivos móviles con tamaños de
pantalla reducidos se puede tolerar valores de PSNR menores

iTEAM © 2014 24
Métricas de Calidad Objetiva: PSNR (III)

• Para ciertas distorsiones, la métrica PSNR no es adecuada, al no


ponderar donde esta realmente la distorsión
• En el ejemplo, dos imágenes presentan la misma PSNR de 29 dB,
sin embargo una de ellas su distorsión es debida a un
macrobloque erróneo que afecta gravemente a la imagen

iTEAM © 2014 25
Métricas de Calidad Subjetiva de Vídeo
• Las métricas de calidad subjetiva, persiguen conocer la valoración del
usuario sobre la calidad de una imagen
• Para imágenes 2D se emplea la definida en la ITU-R BT.500, donde la
valoración se da en MOS (Mean Opinion Square) con valores entre 1 y 5
• Para ello se preparan sesiones de visualización donde el usuario
compara la misma secuencia codificada con distintas calidades, incluida
sin compresión
• Pero exigen de un gran esfuerzo en tiempo, costes y logística (espacio y
número de observadores a utilizar)

iTEAM © 2014 26
Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding (AVC)
ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding (HEVC)
• Multiplexación Estadística
Tecnologías de Compresión de Video

iTEAM © 2014 28
Estandarización de Codificación de Imágenes y Video

• Se estandariza el decodificador
– Restricciones en el flujo de bits (bitstream)
– Sintáxis (señalización)
• Permite competencia en los algoritmos de compresión
• Permite un compromiso entre complejidad y prestaciones
• No proporciona una garantía sobre la calidad, sólo
interoperabilidad
iTEAM © 2014 29
Evolución Histórica de los Estándares de
Codificación de Vídeo

ITU-T H.263 - H.263+


H.261 H.263++
1984 1990 1993 1998

ITU-T/ ISO H.262 H.264


MPEG-2 MPEG-4 AVC
1990 1994 1998 2003

ISO
MPEG-1 MPEG-4
1988 1992 1996 2000

• Joint Collaborative Team on Video Coding (JCTV-VC)


– ITU-T Video Coding Experts Group (VCEG)
– ISO/IEC Moving Pictures Expert Group (MPEG)
iTEAM © 2014 30
Evolución Histórica de los Estándares de
Codificación de Vídeo
• 1988: El ISO configura el grupo de trabajo denominado MPEG (Moving Pictures Experts Group) para el
desarrollo de un estándar de codificación multimedia para soporte en disco
• 1990: El ITU-T aprueba el estándar H.261 para redes de conmutación de circuitos 64 kbps
• 1990: El ISO y el ITU-T se unen para la definición de un estándar de codificación de vídeo optimizado
para TV digital
• 1992: El ISO aprueba el estándar MPEG-1 (ISO 11172) para codificación de audio y vídeo con tasas
binarias de 1.5 Mbps
• 1994: Se aprueba el estándar MPEG-2 (ISO 13818) y H.262 (ITU-T) para TV digital y TV de alta definición
• 1996: El ITU-T aprueba la recomendación H.263 como mejora al H.261 para muy bajas tasas binarias,
aplicaciones de videoconferencia
• 1998: El ITU-T aprueba una serie de anexos (12) al H.263 que mejoraban su eficiencia de codificación y
que pasó a denominar H.263+
• 1998: Simultáneamente el ISO aprueba la Versión 1 del estándar MPEG-4 Visual, para codificación de
objetos con formas arbitrarias
• Julio 2001: MPEG abre un “Call for Proposal” CfP para la tecnologia “Advanced Video Coding” (AVC) que
gana H.26L
• Diciembre 2001: después de 11 años el ITU-T y el ISO se vuelven a unir conformando el “Joint Video
Team” (JVT) para el desarrollo del nuevo estándar basado en H.26L
• Mayo 2003: los respectivos organismos aprueban el H.264 (ITU-T) y el MPEG-4 parte 10 (ISO MPEG-4
AVC) como estándares genéricos de codificación de vídeo.
Scalable
• iTEAM © 2014 Video Coding (SVC) & MVC (Multi-View Coding) & HEVC (H.265) 31
MPEG-1

• El primer objetivo del foro MPEG fue definir un algoritmo de


codificación de video para almacenar contenidos digitales (CD-ROM)
– Velocidad de transmisión máxima 1.5 Mbps

• El estándar MPEG-1 se compone de tres partes:


– Aspectos de sistema (multiplexación y sincronización)
– Codificación de video
– Codificación de audio

• Los estándares de compresión de video sólo definen la sintaxis del bit


stream y el proceso de decodificación
– Libre competencia en el diseño de algoritmos de compresión
compatibles con el estándar

iTEAM © 2014 32
MPEG-2
• En el año 1990, MPEG empezó a trabajar en un segundo estándar
que fuera capaz de codificar directamente imágenes entrelazadas
para aplicaciones de alta calidad (TV digital)
– SDTV ~4 Mpbs, HDTV ~18-20 Mbps

• El estándar MPEG-2 también consiste en tres partes:


– Sistema, Video y Audio
Los
• iTEAM decodificadores MPEG-2 decodifican MPEG-1, pero no al revés
© 2014 33
Herramientas de Compresión de Vídeo MPEG-2

• Reducción de la frecuencia de muestreo del color


– El ojo humano es mucho más susceptible al brillo (luminancia)

• Transformada de coseno discreta (Discrete Cosine Function, DCT)


– Similar a la transformada discreta de Fourier (DFT)
• La DCT trabaja con cosenos (la DFT con exponenciales complejas)
– Elimina redundancia espacial de las imágenes concentrando la energía
de la señal en unos pocos coeficientes
– Cuantificación + Codificación de Entropía

• Predicción de movimiento
– Elimina la redundancia temporal de la secuencia de imágenes
– Basado en técnicas similares a DPCM (Differential Pulse-Code
Modulation)
iTEAM © 2014 34
MPEG-2 Bloques y Macro-bloques
• En MPEG, la redundancia espacial es eliminada procesando las
imágenes en bloques de 8x8 pixels
– “Macro-bloque” corresponde a cuatro bloques 8x8 de luminancia
• Es la unidad básica dentro de la imagen

iTEAM © 2014 35
Influencia del Tamaño del Bloque

• El tamaño de bloque de 8x8 representa un buen compromiso


entre eficiencia de codificación y complejidad
• La siguiente figura representa la eficiencia de la codificación en
función del tamaño del bloque

iTEAM © 2014 36
Reducción de la Resolución del Color
• El número de bloques de croma 8x8 depende del formato de color
de la fuente
– Ejemplo formato común 4:2:0 hay un bloque de croma por macro-
bloque por cada canal haciendo un total de seis bloques por macro-
bloque

4:2:0

iTEAM © 2014 37
Codificación Transformada de Imágenes,
Cuantificación, y Codificación de Entropía

iTEAM © 2014 38
Codificación Transformada de Imágenes
• A cada bloque 8x8 se le realiza una transformada discreta del coseno
(DCT, Discrete Cosene Function) y se obtiene la información en el
dominio de la frecuencia

Proceso
reversible

• La compresión se consigue gracias a que la información de la imagen


se concentra en unos pocos coeficientes
– Un bloque 8x8 de 8 bits necesitaría 8x8 de 11 bits para no perder información
– También se comprime la imagen cuantificando con menos bits
iTEAM © 2014 39
Ejemplo DCT 1 Dimensión

• 8 muestras de una señal de video se


transforman al dominio de la
frecuencia
– Primer valor: componente continua (DC)
– Frecuencias bajas/medias/altas

• Con una transformada inversa se


recupera la señal original sin pérdidas

iTEAM © 2014 40
Definición 2D DCT
• Definición 2D DCT

• Comparación DFT vs. DCT


• Funciones base 2D DCT

iTEAM © 2014 41
Implementación 2D DCT

• La transformada DCT implica una multiplicación de matrices en el


codificador
• Proceso inverso en el decodificador
– Se almacenan lookup tables en HW

iTEAM © 2014 42
Cuantificación de Coeficientes DCT

• En el proceso de cuantificación se producen pérdidas irreversibles

iTEAM © 2014 43
Cuantificación de Coeficientes DCT (I)

• Una vez realizada la transformada, los coeficientes se cuantifican


– La cuantificación es diferente para cada coeficiente dependiendo de la
frecuencia espacial que representa
– Las componentes de alta frecuencia toleran un error de cuantificación mayor
ya que el ruido a altas frecuencias en menos visible
– La componente de color (crominancia) tolera un error de cuantificación mayor
• Objetivo: minimizar el número de bits codificados
– Compromiso tamaño de la imagen codificada vs. Error de cuantificación
– Este proceso es irreversible: el ruido de cuantificación introducido por el
codificador no puede ser eliminado por el decodificador
• MPEG-2 define unas matrices de ponderación que definen la
precisión de la cuantificación para los diferentes coeficientes
– Se pueden utilizar diferentes matrices para diferentes cuadros según el modo
de predicción
iTEAM © 2014 44
Ejemplo Cuantificación de Coeficientes DCT

• Cada coeficiente DCT se divide por un


valor de cuantificación (Q)

• El valor de Q depende de la frecuencia


• Cuanto mayor es el valor de Q, la
cuantificación es menos precisa
– Las componentes de altas frecuencias
toleran un ruido de cuantificación mayor

• Como resultado muchos coeficientes


cuantificados tienen un valor próximo a
cero
• La información se concentra en los
coeficientes
iTEAM © 2014 de bajas frecuencias 45
Ejemplo Transformada DCT 2D

• Cada bloque 8x8 se transforma al dominio


• Bloque 8x8 original de la frecuencia mediante una
transformada 2D DCT
• Antes de realizar la transformada, se le
resta 128 a todos los valores para tener
valores con signo
• Bloque 8x8 transformado

DCT 2D

Resta 128

iTEAM © 2014 46
Ejemplo Cuantificación 2D
• Los valores transformados se dividen por el factor de cuantificación
• MPEG-2 define tablas de cuantificación
– A las tablas se le puede aplicar un factor de cuantificación específico para
cada macro-bloque
– Un codificador puede operar con sus tablas específicas
• Tienen que ser transmitidas al receptor

• Bloque transformado • Tabla de Cuantificación • Bloque cuantificado

• El bloque 8x8 cuantificado tiene muchos componentes a cero


• ©Presenta
iTEAM 2014 simetría diagonal 47
Codificación de Entropía

• Después de la cuantificación, los coeficientes DCT se leen en


forma de zig-zag

– Se definen dos patrones de lectura


– El codificador indica qué patrón utiliza
al decodificador
– Un patrón para imágenes con
componentes de frecuencias
verticales importantes (imágenes
entrelazadas)
– Un patrón para imágenes sin una
componente vertical predominante
(ejemplo figura)

iTEAM © 2014 48
Codificación de Ráfagas RLC y
Codificación de Longitud Variable VLC
• Los coeficientes se codifican contando el número de coeficientes a cero que
preceden a un coeficiente no cero (Run-Length Coding, RLC)
• La secuencia de ceros y el valor del coeficiente distinto de cero se combinan
y se codifican utilizando un código de longitud variable (Variable-Lenght
Coding, VLC)
• El VLC explota el hecho de que son más probables secuencias cortas de
ceros y coeficientes pequeños
• Codificación de longitud adaptativa (tipo Hoffman) según la frecuencia de
ocurrencia esperada
– Combinaciones comunes utilizan códigos pequeños
– Combinaciones no frecuentes utilizan códigos grandes
– Código de escape para codificar directamente:
secuencia codificada con 6 bits, coeficiente con 12 bits
– Se utilizan normalmente tablas
– El coeficiente DC se trata de manera específica en algunos casos
iTEAM © 2014 49
Ejemplo Codificación RLC & VLC
• Bloque cuantificado • Bloque tras la lectura en zig-zag

• Secuencia tras codificación de ráfagas RLC (Run Length Coding)

• Secuencia tras codificación


de longitud variable VLC
iTEAM © 2014 (Variable Length Coding) 50
Buffering and Feedback

• La cuantificación de los componentes de la DCT y la codificación


de longitud variable generan un bit rate variable que depende de
la complejidad de la imagen
• Para generar una tasa de bit constante, es necesario un buffer
para suavizar las variaciones en el bit rate
• Para evitar overflow/underflow del buffer, su ocupación se
monitorea y se realimenta al codificador
• El proceso de cuantificación se puede utilizar para un control
directo del buffer
– Cuando el buffer se llena el cuantificador reduce la precisión
iTEAM © 2014 51
Reducción de la Redundancia Temporal (I)
• Predicción entre fotogramas para aprovecharse de que las
imágenes cambian muy poco de una a otra
– Modo de predicción temporal que intenta predecir un fotograma a partir de
uno anterior de referencia
• DPCM (Differential Pulse Code Modulation)
– Se cuantifica y se transmite la diferencia entre la señal de entrada y la señal
la señal predicha a partir de la señal decodificada localmente
– El codificador contiene un decodificador local que reconstruye las imágenes
como si fuera el decodificador
• La predicción tiene que
ser reproducible en el
decodificador (donde la i
imagen original no está
disponible)

iTEAM © 2014 52
Reducción de la Redundancia Temporal (II)

• MPEG-2 combina predicción inter-frame (reduce la redundancia


temporal) con la cuantificación DCT y codificación de longitud
variable VLC (reducen la redundancia espacial)

• El predictor más sencillo


consistiría en un bloque que
introduce un retraso de una
fotograma
• Válido sólo para imágenes fijas

iTEAM © 2014 53
Motion-Compensated Inter-frame Prediction

• Este método de predicción


tiene en cuenta el
movimiento de los bloques
del fotograma codificado
con respecto a un
fotograma de referencia

• Se transmite el vector de
movimiento y la diferencia
entre bloques

• Resolución de un pixel

iTEAM © 2014 54
Motion-Compensated Inter-frame Prediction (II)

• Una manera de estimar el movimiento entre el cuadro que se va a


codificar y un cuadro de referencia consiste en buscar entre los
pixeles de alrededor

• Como MPEG-2 define sólo el proceso de decodificación, y no el


codificador, el algoritmo de estimación de movimiento es abierto al
diseñador del codificador y diferentes implementaciones pueden
tener diferentes prestaciones
iTEAM © 2014 55
Motion-Compensated Bi-Directional Prediction

• La predicción bidireccional se
• Opcional
obtiene a partir de un
fotograma anterior y otro • MPEG define un
posterior perfil sin predicción
bidireccional
– Combinación lineal
• Particularmente útil cuando el
movimiento revela áreas con
detalles
• Para poder reproducir la
secuencia de imágenes es
necesario cambiar el orden de
las mismas
– Introduce latencia en el
sistema

iTEAM © 2014 56
Codificación Vectores de Movimiento

• La unidad de codificación para redundancia espacial en MPEG son


bloques de 8x8 pixels
• La compensación de movimiento se basa en macro-bloques de 16x16
pixels
– El tamaño del macro-bloque representa un compromiso entre la
información necesaria para señalizar el movimiento (vectores de
movimiento) y la necesidad de variar el proceso de predicción
localmente tanto en contenido como en movimiento
• Los vectores de movimiento se codifican diferencialmente con
respecto a los vectores de movimiento anteriores
• El error de predicción del vector de movimiento es codificado
mediante una codificación de longitud variable VLC con unas tablas
específicas
iTEAM © 2014 57
Tipos de Imágenes MPEG-2

• MPEG-2 define tres tipos de imágenes: I, P, y B.


– Intra pictures (I pictures)
– Predictive pictures (P pictures)
– Bi-directionally-predictive pictures (B-pictures)
• El tipo de imagen determina los modos de predicción que se pueden
utilizar para codificar los macro-bloques

iTEAM © 2014 58
Tipos de Imágenes MPEG-2
• Intra pictures (I pictures)
– Se codifican sin ninguna referencia a otras imágenes
– Compresión por reducción de la redundancia espacial pero no temporal
– Son imágenes importantes ya que se usan como referencia por otras imágenes
y permiten empezar a reproducir el video
• Predictive pictures (P pictures)
– Codificadas con predicción de movimiento de imágenes I o P pasadas
– Pueden ser utilizadas para futuras predicciones
– Imágenes tipo I requieren aproximadamente el triple de bits que las tipo P
• Bi-directionally-predictive pictures (B-pictures)
– Utilizan imágenes pasadas y futuras (I o P) para compensación de movimiento
– Ofrecen el mayor grado de compresión. Las imágenes tipo P requieren
aproximadamente un 50% más de bits que una imagen tipo B
– El codificador re-ordena las imágenes de tal manera que las imágenes B se
transmiten después de las imágenes futuras que referencia, introduciendo un
retraso que depende del número de imágenes B consecutivas
iTEAM © 2014 59
Reordenamiento de Imágenes B

• Decodificación de un macrobloque B

iTEAM © 2014 60
Decodificación de una Imagen Tipo B

• Diferentes modos de predicción: forward, interpolated, backward

iTEAM © 2014 61
Group of Pictures (GOP)

• Los diferentes tipos de imágenes normalmente se suceden


formando una secuencia repetitiva conocida como GOP

• Una imagen tipo I por GOP

• Un GOP se puede describir por dos parámetros:


– N número de imágenes en el grupo
– M espaciado entre imágenes tipo P
• Número de imágenes tipo B entre imágenes P: M-1
– Ejemplo GOP N = 6; M = 2

• Determina el tiempo de acceso al servicio

iTEAM © 2014 62
Perfiles y Niveles MPEG-2

• Los perfiles (profiles) con conjuntos de técnicas (algoritmos de compresión)


• Los niveles (levels) son una serie de restricciones en el video comprimido
iTEAM © 2014 63
– Resolución o velocidad de decodificación
Perfiles y Niveles MPEG-2
• Perfil Simple (Simple profile)
– Video 4:2:0
– No utiliza imágenes tipo B y por tanto predicción hacia atrás o entrelazada
– Adecuado para aplicaciones de baja latencia, como video conferencia
• Perfil Principal (Main profile)
– Permite utilizar imágenes tipo B lo que permite mejorar la calidad de la
imagen para una tasa de bits dada, aunque a costa de aumentar la latencia
• Perfil SNR (SNR profile)
– Añade soporte para la cuantificación de los coeficientes DCT utilizando
escalabilidad en SNR (Signal-to-Noise Ratio)
• Perfil Espacial (Spatial profile)
– Añade soporte para capas de mejora transportando imágenes con
diferentes resoluciones utilizando la herramienta de escalabilidad espacial
• Perfil Alto (High profile)
– Añade soporte para video 4:2:2
iTEAM © 2014 64
Modos de Predicción de Movimiento

• Un macro bloque se puede predecir:


– De un fotograma pasado “forward predicted”
– De un fotograma futuro “backward predicted”
– Interpolado de un fotograma futuro y pasado “interpolated”
– Sin predicción, directamente DCT codificada: Intra (I)

• Modos de predicción de movimiento:


– Field prediction coding
– Frame prediction coding
– 16 x 8 motion compensation
– Dual prime mode

iTEAM © 2014 65
Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding
(AVC) ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding (HEVC)
• Multiplexación Estadística
MPEG-4

• Proporciona una ganancia aproximada del 50% en la reducción de la


tasa binaria con respecto a MPEG-2
– Mejora del factor de compresión hasta 2.25 – 2.5
– No hay una mejora especialmente importante, sino que son pequeñas
mejoras en diferentes partes de la cadena de compresión
• Tasas binarias para servicios de TV
– SDTV ~2 Mbps; HDTV ~8 Mbps
– Codec de video adoptado para la TDT en Colombia
– Adecuado para tasas binarias más pequeñas
• Complejidad con respecto a MPEG-2
– Decodificador x2-x3; Codificador x4-x5
• Diseñado para ser transmitido en diferentes sistemas
– Capa de video: Video Coding Layer (VCL)
Capa de rd: Network Abstraction Layer (NAL)
iTEAM–© 2014 67
H.264/AVC – Principales Novedades
• Soporta formatos 4:2:0, 4:2:2 y 4:4:4
• Nueva predicción INTRA basada en el dominio espacial
• Predicciones basadas en hasta 16 fotogramas
• Mejora de compensación de movimiento
– Rresolución 1/4 pixel en vez de 1/2
• Nuevas imágenes tipo SP (Switching P) y SI (Switching I)
• Mayor resolución de 16 bits
• Tamaño de los macro-bloques flexible y variable
– 16x16, 16x8, 8x16, 8x4, 4x8, 4x4
• Mayor número de tablas de cuantificación: 52
• Transformada entera o de Hadamard en vez de DCT
• Filtro para eliminar efectos de borde de los bloques
• Estructura de slices flexible para un mejor rendimiento frente a errores
• Codificación entrópica mejorada con CAVLC (Context-Adaptative Variable
Length
iTEAM © 2014 Coding) y CABAC (Context Adaptive Binary Arithmetic Coding) 68
H.264/AVC – Estructura de Capas

VLC
Macrobloques
Video Coding Layer

NAL
Slices
Network Abstraction Layer (Particiones)

H.264 to H.264 to H.264 to H.264 to H.264 to


H.320 MPEG-2 Systems H.324 RTP/IP TCP/IP

Redes orientadas a streams Redes orientadas a paquetes


• H.264 está formado por 2 capas, la capa de abstracción de red NAL y la capa de
codificación de vídeo VCL
– NAL encapsula los datos para hacer compatible al tren de bits de salida del codificador
con los canales de comunicación existentes o medios de almacenamiento
– VCL forma el núcleo de los datos codificados que consiste en la secuencia de vídeo a
iTEAM © 2014 69
codificar
Codificador MPEG-4 H.264/AVC

• Codificación híbrida temporal y espacial con una transformada


discreta

iTEAM © 2014 70
Novedades Arquitecturales H.264/AVC

Incluye
escalado.
T de enteros Incrementos CAVLC,
4x4, 8x8 y 2x2 del 12.5% CABAC
X Y Z Codificador
Transformación Cuantificador
Estadístico
Q-1
Partición 16x16, 8x8 y 4x4,
4 ó 9 predictores direccionales T-1 Sin perdidas
MACROBLOQUE de precisión
de 16 x 16 I Predicción
P, B
(16 bloques de 4x4) Intraframe
Filtro
Compensación Loop deblocking
Memoria
de movimiento Filter
Frame

7 posibles Particiones: MV + #Frame Codificador


Estadístico
16x16, 16x8, 8x16,
Estimación Multi-buffer
8x8, 8x4, 4x8 y 4x4 de movimiento de hasta 15 UVLC,
frames CABAC

iTEAM © 2014 71
H.264/AVC – Slices & Macro-blocks

• Slices:
– Las imágenes se dividen en uno o varios
slices
• Secuencia de macro-bloques
– Son autocontenidos y se pueden codificar
independientemente
• Macrobloques:
– Unidad básica de codificación y sintáxis
– Contiene (16x16) muestras de luminancia y
2 x (8x8) muestras de crominancia
– Los macrobloques dentro de un slice
dependen unos de otros
– Los macrobloques se pueden particionar
iTEAM © 2014 72
H.264/AVC – Tipos de Slices

• H.264 divide los fotogramas (frames) en slices de forma arbitraria,


codificables de modo independiente
– Cada slice está compuesto por MBs de 16x16 píxeles (Y)

• 5 tipos de codificación de slices: I, P , B, SP y SI


– I (Intra), P (Predictive), B (Bi-predictive)
– SP (swtiching P), SI (switching I)

• Los slices tipo SP y SI permiten la conmutación de manera muy eficaz


entre diferentes flujos de vídeo codificados a diferentes tasas binarias
– Adaptación a la tasa binaria en función de la capacidad del medio de
transmisión
– Otra utilidad podría ser para un avance rápido de vídeo

iTEAM © 2014 73
H.264/AVC – Slices SI & SP (I)

• Cambio de stream usando • Cambio de stream usando


slices tipo I slices tipo SP

iTEAM © 2014 74
H.264/AVC – Slices SI & SP (II)

• Cambio rápido (fast-forward) utilizando slices tipo SP

iTEAM © 2014 75
Señales de Video de Entrada
• Fotogramas en formato progresivo o
entrelazado
– Formato entrelazado: campo superior
y campo inferior
– Se pueden utilizar los dos formatos en
una secuencia de video
• Los dos campos de una imagen
entrelazada se pueden codificar
conjuntamente como un único
fotograma o separadamente
– Primer campo tipo I, segundo campo tipo
P con compensación de movimiento
– Escenas con movimiento horizontal
• Una imagen progresiva se codifica
como un único fotograma, aunque se
considera que tiene dos campos en el
mismo
iTEAM © 2014 instante de tiempo 76
H.264/AVC – Protección Frente a Errores
• En H.264 los datos se pueden particionar dependiendo
de su importancia
– Ordenación de macrobloques flexible: en primer lugar se
transmiten los datos con mayor prioridad y seguidamente
se transmiten los datos menos significativos
• La codificación en capas minimiza el efecto de los
errores ya que durante la codificación temporal o
espacial es posible recuperar datos perdidos en otras
capas
• Slice Group:
– Conjunto de macrobloques que forman un slice
– Un grupo puede contener uno o varios slices
– Cada grupo se transmite separadamente
• Macroblock allocation map:
– Define el orden de transmisión de los macrobloques
5 patrones (regulares e irregulares)
iTEAM–© 2014 77
H.264/AVC – Tranformada Entera
• Transformada entera o de Hadamard
• La transformada se implementa sólo con sumas, restas y
desplazamientos sin pérdida de resolución
– Aritmética entera de 16 bits con una única multiplicación de enteros por
coeficiente

iTEAM © 2014 78
Transformada de Macrobloques de Luminancia

1. Se hace la transformada en frecuencia de los bloques 4x4


2. Los coeficientes DC de 16 bloques se transforman mediante la
transformada de Hadamard para aumentar la compresión
iTEAM © 2014 79
H.264/AVC – Predicción Intra-Frame
• Se utiliza para codificar bloques o macrobloques de referencia a
partir de los pixeles frontera
– Predicción en el dominio espacial y no en el transformado (frecuencia)
– Se codifica la señal residual (error de predicción) entre el bloque y la
predicción
• H.264 define hasta 9 predictores
– Combinaciones posibles depende del tamaños del MB: 16x16, 8x8 y 4x4

iTEAM © 2014 80
H.264/AVC – Buffer Multi-Frame
• Permite una predicción a largo plazo que aumenta significativamente
la eficiencia del predictor temporal
• El máximo valor es de 15 frames
– MPEG-2 sólo 1 frame antes y después
– Aumenta el tamaño del buffer en transmisión y recepción

iTEAM © 2014 81
H.264/AVC – Nuevas Referencias Temporales

• MPEG-2

• MPEG-4
– Referencing order and display order are decoupled
– Referencing ability and picture type are decoupled

iTEAM © 2014 82
H.264/AVC – Particionado de la Imagen
• Particionado de macro-bloques adaptado a la complejidad de la
imagen, aumentando considerablemente su eficiencia de compresión
con respecto a MPEG-2 (bloques fijos 8x8)
– Zonas con poco movimiento bloques 16x16
– Zonas con mucho movimiento bloques hasta 4x4

iTEAM © 2014 83
H.264/AVC – Particionado de Macrobloques

iTEAM © 2014 84
Resolución Estimación Movimiento

• Resolución 1/4 pixel para


luminancia
– Half Sample Positions
– Quarter Sample Positions

iTEAM © 2014 85
H.264/AVC – Debloking Filter (I)
• Los codecs de video trabajan con bloques de pixeles
– Los bordes de los bloques se reconstruyen típicamente con una resolución
menor que los pixeles del interior
– El efecto de “blocking” es uno de los principales artefactos visuales
• H.264 incorpora un filtro adaptativo para solucionar el problema,
aumentando la calidad subjetiva
– Reduce la tasa binaria en un 5-10% para una misma calidad subjetiva

• Se filtran
los valores
de p0 y
q0, y
ocasional
mente p1
y q1
iTEAM © 2014 86
H.264/AVC – Debloking Filter (II)
• Orden de filtrado
– El filtrado se aplica macrobloque a macrobloque
– Primero se filtran los bordes verticales y después los horizontales
– El borde inferior y el derecho se filtran una vez decodificado el macrobloque
adyacente

iTEAM © 2014 87
H.264/AVC – Codificación de Entropía (I)
• Context-Adaptive Variable Lenth Coding (CAVLC)
– Después de la transformación y la cuantificación, la probabilidad de que el valor
de un coeficiente sea cero o +/- 1 es muy alta. Por lo tanto, se codifica el
número total de ceros y +/-1 que ocurren. Para los demás coeficientes sólo se
codifica su nivel. Las reglas son:
• Se utiliza una palabra para expresar el número de coeficientes diferentes de cero
• Se forma una palabra para indicar los signos de los unos en orden inverso
• Se utiliza una palabra para cada nivel de los coeficientes restantes en orden inverso
• Se utiliza una palabra para indicar en número de ceros. Las palabras resultantes se
codifican utilizando runlength en orden inverso

iTEAM © 2014 88
H.264/AVC – Codificación de Entropía (II)
• Context-Adaptive Binary Arithmetic Coding (CABAC)
– 15% eficiencia más que CAVLC pero mucho más complejo
– 3 fases

iTEAM © 2014 89
H.264/AVC – Profiles
• H.264/AVC define tres perfiles principales:
– Baseline: todas las herramientas excepto modo entrelazado, slices B,
predicción ponderada, CABAC, partición de datos, slices SI y SP
• Aplicaciones video en tiempo real
– Main: añade al baseline modo entrelazado, slices B, predicción
ponderada y CABAC
• Aplicaciones de almacenamiento y transmisión de TV
– Extended: todas las herramientas excepto CABAC
• Aplicaciones de streaming en Internet
– Con posterioridad se aprobó un perfil alto
• Distribución de video y post-producción
• Los perfiles definen el conjunto de técnicas o algoritmos que se
pueden utilizar para comprimir el video
– Los decodificadores deben de soportar todas las características de un
determinado perfil. Los codificadores no.
iTEAM © 2014 90
H.263/AVC – High Profile

• Es el mas eficiente para la codificación de contenidos de HD en


tasas binarias < 10Mbps
• Su mejora se debe a la inclusión de las siguientes herramientas:
– Transformada adaptativa de 8x8 vs. 4x4
– Codificación independiente de las componentes de crominancia
– Matrices de codificación perceptual
• Es más complejo que el perfil principal, pero ofrece una mejora
subjetiva de la calidad muy significativa, en especial para
contenidos deportivos

iTEAM © 2014 91
H.263/AVC – Niveles

• Los niveles definen restricciones en ciertos parámetros del bitstream


(tamaño de la imagen en macro-bloques, velocidad de procesado del
decodificador (macro-bloques/s), tamaño del buffer multi-frame, tasa
binaria, tamaño del buffer de video

• H.264/AVC define 11 niveles para cada perfil caracterizados por:


– Tamaño de la imagen: número total de MB/frame (99 - 36864)
– Velocidad de procesado del decodificador: Máximo MB/s (1485 –
983040)
– Máximo bit rate (64Kb/s – 240Mb/s)
– Máximo tamaño de buffer (número de frames de referencia)
– Rango de búsqueda de MV (64 - 512)
– Mínima relación de compresión (2-4)
iTEAM © 2014 92
H.264/AVC – Perfiles y Aplicaciones

iTEAM © 2014 93
H.264/AVC – Niveles

iTEAM © 2014 94
iTEAM © 2014 95
H.264/AVC – Ganancia Compresión

iTEAM © 2014 96
Eficiencia H.264/AVC

-37% -34%

-68%

iTEAM © 2014 97
Eficiencia H.264/AVC (% bit rate)

• Streaming

• Real-time
conversation

• Entertainment-
quality applications
iTEAM © 2014 98
H.264/AVC Complejidad vs. Eficiencia
Complejidad Eficiencia

Particiones ME-MC 2.5% por partición 4% a 20% • Codificador


Slices B 20% 10%

CABAC 20% a 30% 15%

Precisión ME ¼ píxel 10% 30% (baja tasa binaria)

Buffer Multi-Frame 25% 14%

Filtro Deblocking 10% 5% a 10%


Complejidad

Slices B 12% a 29%


• Decodificador
CABAC 12%

Precisión ME ¼ píxel 15%

iTEAM © 2014 Filtro Deblocking 6% 99


Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding (AVC)
ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding (HEVC)
• Multiplexación Estadística
Simulcast vs. Codificación de Video Escalable

• Simulcast consiste en transmitir el mismo contenido en diferentes


resoluciones
• Una codificación de video escalable consiste en mandar una capa
base con la calidad mínima, y capas de mejora para aumentar la
calidad
• Se consigue una reducción del bit rate total
iTEAM © 2014 101
Ganancia Codificación Video Escalable

iTEAM © 2014 102


Extensiones Escalables de AVC: SVC & MVC

• SVC (Scalable Video Coding) y MVC (Multi-View Coding) son


extensiones de H.264/AVC (Advanced Video Coding)
– Capa base compatible con AVC
– Capa de mejora con información para aumentar la calidad (SVC) o
contenido 3D (MVC)

iTEAM © 2014 103


Scalable Video Coding (SVC)

• Escalabilidad Calidad:
– La capa de mejora aumenta la calidad de la capa
base
• Escalabilidad Espacial:
– La capa de mejora aumenta la resolución espacial
de la capa base
• Escalabilidad Temporal:
– Las dos capas tienen la misma resolución espacial
– La capa de mejora permite aumentar el número
de fotogramas por segundo (frame rate)

• Características Coste/Ganancia SVC


– El coste (capa base + capa mejora) es en torno al 10%
– La ganancia depende del porcentaje que represente la capa base
iTEAM © 2014 104
Ganancia SVC vs. Simulcast
• La ganancia de SVC depende de la proporción entre las tasas binarias
de las capas base y de mejora
– La capa base SVC es AVC, y por tanto no tiene penalización
– La capa de mejora SVC requiere ~10% de bit rate más que AVC

50%
SVC Video Coding Gain (%)

40%
Código escalable ideal
30%

20%

SVC overhead 10%


10%

0%

-10%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

iTEAM © 2014 SVC BL Ratio (%) 105


Casos de Uso SVC (I)
• Avance rápido a una resolución menor
• Tiempo de zapping rápido con una resolución menor

• Degradación suave de la señal para servicios móviles

iTEAM © 2014 106


Casos de Uso SVC (II)
• Control de la congestión

iTEAM © 2014 107


Casos de Uso SVC (III)

• Gestión de portabilidad de un mismo contenido

iTEAM © 2014 108


Casos de Uso SVC (III)
• Transmisión eficiente de contenidos de muy alta calidad

iTEAM © 2014 109


Perfiles SVC

iTEAM © 2014 110


Codificación Multi-Vista

• Imágenes multi-vista y 3D requieren múltiples señales de video


sincronizadas que muestran la misma escena desde diferentes
puntos de vista
– La cantidad de datos que tiene que ser comprimida aumenta
proporcionalmente con el número de cámaras
– La correlación entre vistas puede ser muy alta
iTEAM © 2014 111
Multi-View Coding (MVC)

• MVC proporciona una


vista base 2D
compatible con
H.264/AVC y añade
más vistas con capas
adicionales

• Ganancia con respecto a simulcast


30%-50%
• Tasa binaria proporcional con el
número de cámaras

iTEAM © 2014 112


Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding (AVC)
ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding
(HEVC)
• Multiplexación Estadística
High-Efficiency Video Coding (HEVC)
• Evolución de MPEG-4 (H.264/AVC)
– Objetivo principal: ganancia de compresión objetivo 50%
– Objetivo secundario: reducir la complejidad
• Implementación paralelizable
• Fecha estandarización
– Enero 2013

• Resultados
– Resultados prometedores especialmente para resoluciones 1080p y
superiores
– Mejores resultados para una misma calidad subjetiva (50%) que para
una misma calidad objetiva (35%)
iTEAM © 2014 114
Diagrama Bloques Decodificador HEVC
• En gris las principales novedades

iTEAM © 2014 115


Principales Características HEVC

• Nuevas funcionalidades
– Particionado de bloque variable usando “quadtrees”
– Posibilidad de que bloques vecinos compartan la misma información
de movimiento
– Nuevo filtro antiblocking denominado “sample adaptive offset”
• Filtrado de todos los bordes verticales de la imagen en vez de bloque a bloque
• Después del filtrado se añaden offsets adaptativos a las muestras

• Mejoras de funcionalidades existentes con respecto a H.264/AVC


– Más ángulos de predicción
– Mejora en la predicción de los vectores movimiento
– Tamaños de transformadas más grandes
– Codificación de coeficientes transformados más eficiente
– Codificador de entropía único CABAC
iTEAM © 2014 • Se ha reducido la complejidad y los requisitos de memoria 116
HEVC – Quadtree Structures
• Estructura en árbol flexible

• Coding Tree Block (CTB) generaliza el concepto de macrobloque


– Bloques 16x16 hasta 64x64 muestras de luminancia
– Configuración típica: CB 8x8, TB 4x4 hasta 32x32
iTEAM © 2014 117
HEVC Intra-Prediction Modes

• 35 modos

iTEAM © 2014 118


HEVC – Precisión Estimación Movimiento
• Misma resolución ¼ pixel para luminancia (1/8 pixel crominancia)
que H.264/AVC pero con una interpolación más compleja
– Luminancia: filtro 8 taps en vez de 6
– Crominancia: filtro 4 taps en vez de interpolación bilineal

iTEAM © 2014 119


HEVC – Particionado de Bloques

iTEAM © 2014 120


HEVC Inter-Prediction Block Merging

iTEAM © 2014 121


Eficiencia HEVC vs. H.264/AVC High Profile
• Intra: edición profesional de video (sólo predicción intra-trama)
• Random access: almacenamiento de video (predicción intra/inter-trama)
• Low Delay B: video conferencia (predicción inter-trama sólo con fotogramas
anteriores)

iTEAM © 2014 122


Complejidad HEVC vs. H.264/AVC High Profile

• En las últimas versiones del estándar se priorizó para el Main Profile la


complejidad frente a la eficiencia de compresión
– Reducción de la complejidad 10%/15%
– Reducción eficiencia 3%
iTEAM © 2014 123
Comparativa PSNR HEVC vs. H264/AVC

iTEAM © 2014 124


Ganancia Eficiencia HEVC

iTEAM © 2014 125


Ganancia Eficiencia HEVC

iTEAM © 2014 126


Contenidos – Compresión de Video

• Fundamentos Compresión de Video


• MPEG-2
• H.264 Advanced Video Coding (AVC)
ó MPEG-4 Part 10
• Scalable Video Coding (SVC)
• Multi-View Coding (MVC)
• High-Efficiency Video Coding (HEVC)
• Multiplexación Estadística
Constant Bit Rate (CBR) vs. Variable Bit Rate (VBR)

PSNR (dB) bps


45.00 1600000

40.00
PSNR
1400000
VBR@QP33
35.00 CBR@480kbps
1200000
30.00
1000000
25.00 bps
800000
20.00 VBR@QP33
CBR@480kbps
600000
15.00
400000
10.00

5.00 200000

BUS CITY CREW FOOTBALL FOREMAN HARBOUR MOBILE SOCCER


0.00 0 scene cut
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86
iTEAM © 2014 (concatenated test sequences)
128
Time (s)
Multiplexación Estadística
• En un canal de frecuencia de TV digital es posible transmitir varios canales
de televisión (múltiplex) que tiene una tasa binaria máxima

• La multiplexación
estadísitica con
codificación VBR permite
reducir el ancho de banda
con respecto a una
codificación CBR
iTEAM © 2014 129
Estrategias Multiplexación Estadística

• Codificación de tasa
constante CBR

• Codificación de tasa
variable VBR

iTEAM © 2014 130


Ganancia Multiplexación Estadística

iTEAM © 2014 131


Conclusiones & Resúmen









iTEAM © 2014 132


¡Gracias por su atención!
¿Preguntas?

Dr. David Gómez Barquero


Grupo de Comunicaciones Móviles
Instituto de Telecomunicaciones y Aplicaciones Multimedia (iTEAM)
Universidad Politécnica de Valencia
[email protected]
Frame & Field-based Motion Prediction

• Frame prediction coding


– Cada macro-bloque tiene su
vector de movimiento
– Adecuado para escenas con poco
movimiento

• Field prediction coding


– Dos vectores de movimiento por
macro-bloque
iTEAM © 2014 – Escenas con mucho movimiento 134
Compensación Movimiento 16x8 & Dual Prime

• Compensación de movimiento 16x8


– Utiliza por lo menos dos vectores movimiento por macro-bloque
• Parte superior (16x8) y parte inferior (16x8)
– Para imágenes tipo B, hasta cuatro vectores movimiento
• Imágenes futura y pasada
– Compensación de movimiento 16x16 sólo para imágenes con predicción por
campos (field-based prediction)
• El área cubierta por cada vector de movimiento es aproximadamente igual a un
macro-bloque 16x16
• Dual prime mode
– Se puede utilizar tanto para predicción por fotogramas y campos (frame & field-
based prediction), pero sólo para imágenes tipo P cuando no hay imágenes tipo
B entre la imagen tipo P y su referencia
– Se transmite un vector de movimiento y un vector con un desplazamiento
diferencia
– Se consigue una eficiencia de codificación similar a las imágenes tipo B pero sin
necesidad de reordenar la secuencia de imágenes transmitidas
iTEAM © 2014 135
Señalización Codificación MPEG-2

• Codificación adaptativa variable a lo largo del tiempo

iTEAM © 2014 136

También podría gustarte