0% encontró este documento útil (0 votos)
41 vistas25 páginas

Compresión de Audio y Video en TotalCode

Este documento describe cómo codificar secuencias de video y audio utilizando el software TotalCode Studio. Explica los pasos para cargar una secuencia, seleccionar un códec y configurar parámetros como el tamaño de GOP y el bitrate. También analiza las secuencias codificadas utilizando el software Qualify.

Cargado por

qc2dx5cbkx
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
41 vistas25 páginas

Compresión de Audio y Video en TotalCode

Este documento describe cómo codificar secuencias de video y audio utilizando el software TotalCode Studio. Explica los pasos para cargar una secuencia, seleccionar un códec y configurar parámetros como el tamaño de GOP y el bitrate. También analiza las secuencias codificadas utilizando el software Qualify.

Cargado por

qc2dx5cbkx
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Difusión de Audio y Video:

Práctica 1
COMPRESIÓN DE AUDIO Y VIDEO

EV A M AR Í A C IRUGED A R O LD ÁN

Curso 2022-2023
TABLA DE CONTENIDO

1 Introducción __________________________________________________________________ 2
2 Calificación ___________________________________________________________________ 2
3 Codificación de secuencias con TotalCode Studio ____________________________________ 3
3.1 Agregar una secuencia a TotalCode Studio ____________________________________________ 4
3.2 Configuración de la codificación _____________________________________________________ 5
3.2.1 Selección del códec ____________________________________________________________ 5
3.2.2 Selección de la estructura de trama _______________________________________________ 7
3.2.3 Configuración del códec ________________________________________________________ 9
3.3 Selección del fichero de salida _____________________________________________________ 10
3.4 Iniciar la transcodificación ________________________________________________________ 11

4 Análisis de secuencias con Qualify _______________________________________________11


4.1 Análisis Gráfico _________________________________________________________________ 13
4.2 Statistics _______________________________________________________________________ 14
4.3 MB details _____________________________________________________________________ 15
4.4 Header ________________________________________________________________________ 17
4.5 DCT ___________________________________________________________________________ 17

5 Tareas ______________________________________________________________________17
5.1 Recodificación de vídeo___________________________________________________________ 17
a) Captura y parámetros de la secuencia de entrada _____________________________________________ 18
b) Codificación de video ___________________________________________________________________ 18
c) Evaluación de la calidad _________________________________________________________________ 19
5.2 Influencia del Bitrate _____________________________________________________________ 19
5.3 Influencia del GOP _______________________________________________________________ 21
5.4 Influencia del algoritmo de estimación de movimiento _________________________________ 23
5.5 Influencia de la tasa de distorsión __________________________________________________ 23
5.6 Caso Práctico ___________________________________________________________________ 24

1
1 Introducción
El objetivo de la presente práctica es conocer en detalle las distintas técnicas de compresión de audio y
vídeo aplicadas en las cabeceras de difusión de TV, en particular aquellos códecs utilizados en la difusión
de contenidos audiovisuales en televisión digital.

Se prestará especial atención a los distintos parámetros de compresión y codificación estudiados en el tema
2 y se evaluarán las prestaciones de las distintas codificaciones disponibles.

Se evaluarán distintas opciones de codificación, formato Elementary streams, program streams o transport
streams de acuerdo con los contenidos del tema 3.

Para ello, el alumno utilizará el software de compresión de audio y video “totalCodeStudio” para modificar
los parámetros que afectan a las principales etapas de compresión, transformación y compensación del
movimiento como el tamaño del GOP, el escaneo y la tasa de codificación. El alumno visualizará sus efectos
en los coeficientes transformados, la energía del residuo, vectores de movimiento, tamaño de imagen y la
imagen decodificada por medio del analizador de tramas comprimidos “Qualify ”.

De igual modo, el alumno resolverá un caso práctico en el que deberá aplicar sus conocimientos para
configurar convenientemente los parámetros de codificación de una cabecera de compresión,
optimizándolos para un servicio de TV con limitaciones de ancho de banda.

2 Calificación
La evaluación de esta práctica se realizará por medio de la entrega de la memoria en el apartado
correspondiente del aula virtual. Los streams codificados utilizados en la práctica deberán incluirse en una
carpeta nombrada “Practica1_evaluacion” dentro del repositorio del grupo (DAV_PRXX) en labmu.

La memoria debe seguir la estructura de la plantilla facilitada a través del aula virtual antes de la fecha
límite el próximo 04 de marzo a las 23.59 horas. Se puede solicitar una prórroga de la misma en caso
necesario antes del viernes 4 marzo. Esta prórroga otorga 15 días de plazo adicionales, hasta el 18 de
marzo a las 23.59 horas, pero se incurrirá en una penalización en la calificación final del 10% de la nota
por cada semana de retraso en la entrega.

Cada alumno trabajará, preferiblemente en el ordenador que le ha sido asignado, para saber en qué
ordenador debe situarse o a cuál debe conectarse de forma remota, En el listado de grupos de prácticas
se le ha asignado un número que corresponde al PC sobre el que debe trabajar.

2
La práctica se califica mediante una guía de evaluación en aula virtual y se puntúa con un total de 10
puntos.

3 Codificación de secuencias con TotalCode Studio


En la Figura 1 se muestra la interfaz gráfica del software TotalCode Studio sobre el cual se trabajará en esta
práctica. Dicha interfaz se divide en tres secciones. La sección derecha, encuadrada en rojo, muestra una
previsualización de la secuencia de entrada una vez cargada y seleccionada una secuencia de entrada. La
sección superior izquierda, encuadrada en naranja, muestra las componentes de la secuencia de entrada,
en el ejemplo, la de audio y la de video.

Importar fichero Iniciar transcodificación

Códec utilizado

Formato Codificación
Configuración del códec

Nombre fichero de salida


Posición de la imagen en el video : frame y temporal

Figura 1 Interfaz gráfica de usuario de Total Code Studio

La sección inferior izquierda, recuadrada en verde, muestra las características del vídeo de salida según
queramos que sea codificado.

3
3.1 Agregar una secuencia a TotalCode Studio
Para agregar una nueva secuencia de entrada a TotalCode estudio será suficiente con pulsar en el botón
“importar fichero” (ver Figura 1) o bien utilizando el menú superior File  Open Media, una vez
seleccionada dicha opción aparecerá un cuadro de dialogo como el mostrado en la Figura 2.

En la barra superior se indicará la ubicación de nuestro repositorio en Labmu, esta dirección será
básicamente: \\[Link]\DAV_PRXX\labmu\P1 donde XX índica el grupo de prácticas al
que pertenece cada alumno.

Figura 2: Cuadro de dialogo de carga de fichero de video de entrada

En dicha carpeta se encuentran los ficheros necesarios para la realización de esta práctica. Una vez
seleccionado el video se pulsa en abrir y dicho fichero se agregará a la sección del fichero de entrada.

Figura 3: Características de la codificación de las componentes de la secuencia de vídeo de entrada

Si se pulsa en el desplegable mostrado con un símbolo más al lado de cada componente (ver Figura 3), se
pueden ver las características del audio y del vídeo de la secuencia de video de entrada, donde se muestran

4
la duración, el códec utilizado, la resolución, el tamaño del GOP y el bitrate entre otras características. De
igual forma, pulsando sobre la cruz con el más a la izquierda de la componente de audio, se muestran las
características de dicha componente, entre otras, la duración, el número de muestras, la frecuencia de
muestreo, la profundidad y el bitrate.

3.2 Configuración de la codificación


Para poder configurar la codificación del vídeo, es en primer lugar necesario arrastrar la secuencia a codificar
a la sección de video de salida (ver Figura 1, recuadro verde), una vez insertada la secuencia a codificar, se
observa como aparecen distintas opciones de configuración del códec en la parte inferior de la pantalla
(ver Figura 4).

Figura 4 Características del códec utilizado en la transcodificación de contenidos.

3.2.1 Selección del códec


En primer lugar, es necesario seleccionar el códec que se va a utilizar en la transcodificación del vídeo. Para
ello, se debe pulsar sobre el botón desplegable que aparece junto a la opción de “preset”. Una vez pulsado,
se abrirá un menú donde se pueden observar los distintos códecs que pueden ser utilizados (ver Figura 3),
TotalCode Studio permite selecciona entre distintos algoritmos de codificación que se utilizan en la
actualidad, tanto para distribución de TV terrestre, IPTV o por internet a través de plataformas OTT como
se estudiará más adelante.

5
En esta práctica el estudiante se centrará en el estudio de los códecs que se definen en el estándar DVB-T
para la difusión de contenidos audiovisuales en HD:

• AVC / H.264
• VC-1
• HEVC / H.265

Estos pueden seleccionarse a partir de la opción CUSTOM (mostrada en la Figura 5), HEVC o Digital TV.

Figura 5. De izquierda a derecha: Posibles códecs para utilizar en transcodificación de las secuencias, tipos de
estructura de la trama del fichero codificado, y opciones de configuración del códec.

Una vez seleccionado el códec a utilizar el estudiante debe seleccionar el tipo de trama que presentará el
fichero de salida. No obstante, al pulsar sobre cada una de las componentes que van a ser codificadas se
observa cómo se pueden elegir distintas opciones compatibles dentro del códec seleccionado (ver Figura
6). Por ejemplo, en vídeo se observa como da dos opciones: “PRO” y “BroadCast [Demo]”, esto nos indica
opción “profesional” y opción “difusión”, es decir, si se utilizará la codificación H.264 para estudios de
grabación o para “difusión de contenidos”.

De igual forma, al pulsar sobre la componente de audio (Figura 6) se muestran en un menú desplegable
los distintos códecs de audio compatibles con el códec de vídeo seleccionado que el estándar DVB
contempla para la codificación de las componentes de audio de un programa.

6
Una vez seleccionado el códec a utilizar el estudiante debe seleccionar el tipo de trama que presentará el
fichero de salida.

Figura 6: Opciones compatibles de codificación de audio y video conforme el estándar H.264. Izquierda para
componente de vídeo y derecha para componente de audio

3.2.2 Selección de la estructura de trama


Al pulsar sobre el desplegable que aparece al final de “Target” (ver Figura 6) se puede configurar la
estructura de la trama que presentará el fichero de salida una vez codificado.

Figura 7: Estructura de la trama

Se pueden observar cuatro opciones, dentro de ellas el estudiante se centrará en los formatos que se han
visto en clase dentro del tema 3, y en particular en los siguientes formatos:

• Program Stream (PS)

7
• Transport Stream (TS)

Al seleccionar la opción transport stream (ver Figura 7) se observa como aparece una nueva línea
identificada como “Program #1 ID:1000” y se ha activado el botón identificado como “+P” en la parte
derecha del cuadro. Esto se debe a que, tal y como se ha visto en teoría, el PS solo puede contener
componentes relativas a un programa mientras que un TS puede contener varios programas distintos
codificados y multiplexados.

Figura 8: Formato de trama. A la izquierda trama program Stream y en la derecha Transport Stream

Pulsando en la opción “+P” el programa añade una nueva línea de programa con sus componentes al cual
podremos añadir un segundo fichero de entrada si se desea o fuera necesarios (ver Figura 8). Para añadir
el segundo programa solo es necesario repetir los pasos indicados en 3.1. Se pueden añadir tantos
programas como el usuario considere necesario codificar.

Figura 9:Transport stream con dos programas multiplexados.

8
3.2.3 Configuración del códec
Para configurar el códec se pueden seleccionar entre las distintas opciones básicas de configuración que
se muestran en la parte inferior de la sección de salida (ver Figura 6) en función de la componente
seleccionada.

Para el vídeo se permite elegir el códec (versión compatible), la dupla perfil@nivel tal y como se han visto
en el tema 2, el modo de codificación, PAL o NTSC, la tasa de fotograma o frecuencia de refresco y el
escaneo progresivo o entrelazado. Se permite también seleccionar el ancho, alto y resolución de la imagen.
Finalmente permite elegir el tipo de tasa de codificación, constante, variable o calidad constante, por
ejemplo y la tasa de codificación en Kbps.

De forma similar para el audio, podemos seleccionar el códec a utilizar, el número de canales, tipo de
codificación, la frecuencia de muestreo, la profundidad (bits/muestra), el tipo de bitrate y su tasa (ver Figura
6)

Además de estas opciones básicas de configuración, si se pulsa en la llave que aparece en la esquina
superior derecha de cuadro, se accede a las opciones avanzadas de configuración (ver Figura 10).

Figura 10: Opciones de configuración básicas y avanzadas

Dentro de las opciones básicas, se puede acceder a opciones más específicas como el submuestreo croma
o la profundidad (número de bits) utilizados en la codificación de las componentes luma y croma, también
se permite configurar los tamaños de buffer de codificación y el tamaño máximo para los distintos
fotogramas considerados (Intra, Progresivo, Bidireccional).

9
Por otro lado, dentro de las opciones avanzadas, podemos seleccionar la dupla nivel@perfil y configurar
distintos parámetros relativos a la estructura del GOP, el algoritmo de estimación de movimiento, la
distorsión de tasa entre otras.

Dentro de la estructura del GOP se puede elegir su tamaño y la configuración de los fotogramas
bidireccionales (B), entre otras opciones. En el algoritmo de estimación y compensación de movimiento se
permite definir el tamaño del macrobloque, el número de fotogramas de referencia y el rango de búsqueda.
Como características adicionales se puede seleccionar entre la aplicación o no del filtro de bordes, el tipo
de codificación entrópica y el número de cortes por imagen.

3.3 Selección del fichero de salida


Finalmente, y antes de comenzar la transcodificación se debe asignar un nombre coherente al fichero de
salida. Este puede ser algo del tipo: “Codificación_1_GOP_N_M_CBR_RATE_kbps.mpg”, donde N y M hacen
referencia al tamaño de GOP, CBR hace referencia al tipo de tasa constante o VBR a variable y RATE se
sustituiría por el valor numérico de la tasa de codificación. Al nombre se le debe asignar algo coherente y
representativo que indique las características utilizadas para la codificación.

Para asignar bastaría con situarse en el cuadro de dialogo en la parte inferior de la sección del vídeo de
salida (ver Figura 1) e indicar la ruta completa y nombre de archivo. O bien pulsar sobre el icono de la
rueda de configuración, justo a la derecha (ver Figura 1) donde se abrirá un cuadro de dialogo como el
mostrado en la Figura 11 dónde se puede seleccionar la ruta.

Figura 11: Selección fichero de salida

Dado que el servidor Labmu es bastante lento, se recomienda trabajar en modo local en el escritorio. Pero
recordad que solo se calificaran las secuencias que se encuentren en la carpeta de evaluación en el servidor
Labmu, así que las secuencias finales, deben copiarse a la carpeta correspondiente del servidor.

10
3.4 Iniciar la transcodificación
Para iniciar la transcodificación, una vez seleccionado el fichero de entrada, configuradas las opciones de
codificación y asignado el fichero de salida, basta con pulsar sobre el botón “play” cuyo símbolo es un
triángulo y se encuentra en el menú superior de la interfaz gráfica (ver Figura 1). Con ello empezara la
transcodificación.

Su proceso puede observarse en la parte derecha de la interfaz gráfica de usuario (ver Figura 1, recuadro
rojo). La visualización del proceso de transcodificación suele ralentizarlo, podemos ocultarlo pulsando sobre
el primer icono que aparece en la esquina superior derecha, el que tiene un ojo sobre la pantalla (ver Figura
12). El segundo icono, el que presenta las dos flechas nos permite ver los fotogramas una vez codificados,
mientras que el último, la cámara no permite guardar una captura de del frame mostrado en la pantalla de
previsualización con la calidad especificada.

Figura 12: Iconos de previsualización

4 Análisis de secuencias con Qualify


Qualify es un programa para analizar tramas codificadas. Este software permite analizar la influencia en los
distintos parámetros de codificación y su influencia.

Figura 13: Interfaz gráfica de usuario de Qualify (izquierda) y cuadro de dialogo creación de nuevo proyecto (derecha)

La Figura 13 muestra la interfaz gráfica de usuario de Qualify. El primer paso es crear el proyecto de análisis
de la secuencia de vídeo para ello se debe pulsar sobre el botón “PROJECT” y seleccionar la opción “New
Project”, tal y como se muestra en la Figura 13, tras lo cual se abrirá un cuadro de diálogo, donde se debe
indicar la ruta y el nombre del proyecto. De nuevo, se recomienda trabajar de forma local debido a la
lentitud del servidor labmu, pero el proyecto completo debe ser copiado a la carpeta Labmu al final de la

11
sesión. Este proyecto debe tener un nombre identificativo, se recomienda algo similar al nombre del archivo
a analizar.

Una vez creado el nuevo proyecto, aparecerá en la interfaz de usuario un nuevo cuadro de dialogo (ver
Figura 14), para agregar la secuencia que se va a analizar bastaría con arrastrar dicha secuencia desde su
carpeta de origine al proyecto de Qualify. También puede agregarse mediante el explorador, al pulsar en
el botón “EXPLORER” se abre un nuevo cuadro de dialogo que permite seleccionar la carpeta y secuencia
que se va a analizar y añadirla al proyecto de Qualify.

Una vez agregada la secuencia de vídeo que se desea analizar es necesario pulsar sobre el botón “START
ANALYSER”, mediante esta acción, el programa realiza un análisis exhaustivo de la secuencia codificada y
permite visualizar y analizar sus características.

Figura 14: Creación de proyecto e inserción de secuencias en Qualify

Figura 15. Análisis de tramas en Qualify.

12
Una vez analizada la secuencia, se debe pulsar sobre el botón “DETAILS”, este abre una nueva pantalla de
análisis donde se muestran 3 ventana (ver Figura 15). En la parte superior izquierda aparece el detalle de
los fotogramas y se indica el tipo de codificación utilizada (I, P o B). En la parte superior derecha se puede
observar el detalle del tipo de codificación de los macrobloques en cada imagen y en la parte inferior
aparece un gráfico donde se pueden observar el tamaño y tipo de codificación de cada frame y a la vez
que otros parámetros de caracterización.

4.1 Análisis Gráfico


El análisis gráfico muestra el tamaño en bytes asignado a cada frame y el tipo de frame utilizado en su
codificación.

(a)

(b)

Figura 16: Análisis gráfico

La Figura 16 muestra el tamaño de cada frame codificado y el tipo de frame utilizado. Se puede ver su
evolución en función de cada frame o nos permite utilizar una distribución del eje X en el dominio temporal
para ver la evolución del tamaño de codificación.

En esta gráfica podemos comparar el tamaño del GOP, distancia entre frames I en rojo. El número de
frames B utilizados, en verde y los frames P en azul.

El marcador nos permite situarnos en un determinado frame y ver tu tamaño en bytes, en el ejemplo de la
Figura 16, el marcador está representado como una línea vertical discontinua blanca y hace referencia al
frame 360. La parte inferior presenta una ampliación de una sección de la gráfica donde se puede observar

13
con mayor detalle el número de frame B utilizados y como se trata de un GOP cerrado, presenta un frame
P justo antes del frame I al inicio del siguiente GOP

4.2 Statistics
Seleccionando la opción “Statistics” de la barra superior se abre la nueva pantalla mostrada en la Figura
17 aparece un set de tres gráficos. El primero índica el número de bytes de cada tipo de frame asignados
en la codificación de la secuencia, el segundo, índica el número de frames y su tipo de codificación a lo
largo de la secuencia y el tercero, la distribución de los macrobloques codificados en el frame seleccionado.

El primer gráfico es independientemente del frame que se seleccione para analizar sus estadísticas ya que
se corresponde con la trama completa, es decir, indica cuantos MB del total de la secuencia están
codificados como tipo I, P o B.

El segundo gráfico, muestra el contador de frames, de nuevo este gráfico hace referencia al número total
de frames que hay codificados como tipo I, P o B en la totalidad de la secuencia.

Figura 17: Análisis estadístico de la secuencia y fotograma seleccionado.

14
Por último, el gráfico de la derecha (current MB types) muestra un análisis del fotograma seleccionado y la
distribución de la codificación utilizada para los distintos macrobloques en ella. En el ejemplo de la Figura
17 se ha seleccionado un frame de tipo B y en él se indican el porcentaje y tamaño, en MB, asignado a los
macrobloques que se han codificado como tipo Intra, el sentido de predicción de los algoritmos de
estimación de movimiento (MV) se ha hecho desde macrobloques anteriores, posteriores o ambos, aquellos
macrobloques que no han requerido codificación o aquellos que se han codificado sin necesidad de aplicar
MV. Este último gráfico es el único que cambia para cada frame.

4.3 MB details
Esta opción indica los detalles de codificación de cada macrobloque en el frame seleccionado. Para ello
primero es necesario seleccionar un fotograma codificado de la secuencia en “frame details”, una vez
seleccionado y abierta la pestaña de MB details, sobre la imagen del fotograma mostrada en la parte
derecha podemos arrastrar el ratón y ver cómo cambian los valores mostrados en los MB details (ver Figura
18).

Los MB details muestran en la tabla de la izquierda el corte al que pertenece el macrobloque seleccionado,
el número de macrobloque, los bits y el tipo de codificación de los macrobloques. El tipo de macrobloque
puede consultarse dentro de las normas ITU-T H.264 o H.265 correspondientes a cada tipo de codificación
(estas pueden encontrarse dentro del aula virtual).

Figura 18: MB details

15
Se permite visualizar los coeficientes codificados de cada macrobloque, los coeficientes tras el proceso de
cuantificación inverso y los coeficientes tras el proceso de transformación inverso. En la parte inferior se
observa el macrobloque al cual se corresponden los coeficientes.

Figura 19: Distintas codificaciones en función del número de los coeficientes considerados

16
4.4 Header
Esta opción permite visualizar las cabeceras asignadas a cada unidad codificada. Podemos verla en forma
de Árbol o como mapa de cabeceras. En ella se puede observar la información que va contenida en la
cabecera de cada unidad. Podemos observar en función de las unidades de acceso que cabeceras y que i
información se asigna durante el proceso de codificación que es necesaria para los decodificadores.

4.5 DCT
Esta opción permite visualizar la imagen en función del número de coeficientes que se tengan en cuenta
en su decodificación.

En los DCT settings se pueden seleccionar los coeficientes que se van a tener en cuenta para la
decodificación de la imagen, pueden seleccionarse todos o solo algunos de ellos. En la Figura 19 se
observan en primer lugar la decodificación completa de la imagen teniendo en cuenta todos los
coeficientes, en la segunda imagen se observa la parte decodificada correspondiente a frecuencias más
altas, la cual contiene detalles más finos y finalmente la última opción muestra la decodificación de la
imagen teniendo en cuenta los dos primeros coeficientes según el escaneo en zig-zag.

Esta opción muestra como la mayor cantidad de la información está contenida en los coeficientes de las
frecuencias más bajas.

5 Tareas
Dentro de la carpeta labmu asignada a cada grupo de prácticas (usuario DAV_PRxx) se encuentra un vídeo
F1_2020.mp4. Este vídeo se trata de una secuencia de vídeo de Formula 1 codificado en UHD utilizando
H.264 de 10 bits, con un bitrate de calidad constante.

5.1 Recodificación de vídeo


En este apartado se va a recodificar la secuencia propuesta en los distintos formatos utilizados en difusión
de TV digital, utilizando los 4 códecs admitidos en el estándar DVB-T para formato HD: MPEG-2, H.264,
VC-1 y H.265.

De acuerdo con la norma ETSI TS 101 154 se permite la difusión de señales de TV con las siguientes
combinaciones de perfil@nivel, según se muestran en la Tabla 1.

17
Tabla 1 Estándares de codificación para difusión de TV digital

Códec Perfil Nivel


HDTV MPEG-2 Main High
H.264/AVC High 4/4.2
HEVC Main / Main10 4.1
VC-1 Advanced 3
UHDTV HEVC Main 10 5.2

a) Captura y parámetros de la secuencia de entrada


Capture el frame correspondiente a su grupo multiplicado por 10. Indique en una tabla los parámetros más
relevantes del formato de codificación de video.

Puede incluir una captura de pantalla o una tabla con los parámetros más característicos del vídeo.

b) Codificación de video
Para cada formato de TV especificado en la Tabla 1 debe recodificar la secuencia facilitada considerando
todas las opciones de codificación mostradas con los parámetros adecuados, consulte las transparencias
del tema 2.

A la hora de configurar el códec (Preset) debe tener en cuenta que para establecer el nivel adecuado hay
que abrir las opciones de configuración avanzadas, pulsando en la herramienta. No todos los códecs os
permitirán seleccionar la dupla nivel@perfil. Tened en cuenta que para VC-1 en versión HD, advanced@3,
necesitáis seleccionar la opción Blue-Ray: BD VC-1 High Resolution. El objeto de codificación, Target, debe
ser un MPEG Transport Stream.

Se deben mantener los mismos parámetros de codificación para cada formato: HDTV, UHDTV, dentro de
las posibilidades para que puedan ser evaluados a efectos de calidad y tamaño en el siguiente apartado.

Las secuencias de salida finales deben almacenarse en la carpeta “Práctica1_evaluación” que ha tenido que
crear dentro de su usuario correspondiente en DAV_PRxx/PR1.

Cada secuencia resultante debe identificarse de forma inequívoca, donde se indiquen los parámetros
utilizados en su codificación: <formato>_<codec>_<frameRate>_<resolución>_<tipoBR>_<bitrate>, por
ejemplo: “HD_MPEG2_25i_916_CBR_8000kbps”

Indique en una tabla a continuación el nombre de la secuencia y los parámetros utilizados en su


codificación: formato, códec, nivel, perfil, tipo BR, tasa, resolución, frecuencia y tipo de escaneo, para cada
formato considerado. Tenga en cuenta que el sistema DVB utiliza una codificación PAL y no NTSC.

18
c) Evaluación de la calidad
Visualice las secuencias obtenidas para los formatos SDTV y HDTV en el apartado anterior. Clasifíquelas por
orden de mayor a menor calidad visual, indique el resultado en una tabla. Indique para cada codificación
el tamaño del archivo, puede hacerlo en formato tabla. ¿Cómo afecta la codificación utilizada al tamaño
del archivo? ¿Qué tipo de codificación cree que es mejor para SDTV? ¿Y para HDTV? Justifique su respuesta
en ambos casos.

5.2 Influencia del Bitrate


En este apartado se va a analizar la influencia del bitrate en la codificación para ello vamos a generar una
secuencia de referencia a partir de la cual realizaremos los estudios.

Para obtener la secuencia de referencia, se debe recodificar la secuencia original para difusión de HDTV
(Digital TV -> DBV HD H.264) y configurando los parámetros básicos de acuerdo con el estándar y
considerando una tasa de bitrate constante (CBR), la máxima permitida.

Es necesario mantener un GOP fijo ya que esto puede afectar en la codificación y está relacionado
directamente con el bitrate. Para ello en la configuración avanzada se debe desactivar la opción de “habilitar
detección de escena” y establecer un tamaño fijo de GOP en 33 frames con 3 frames B. Capture el cuadro
de dialogo donde se muestran las opciones de configuración avanzada fijando el GOP y deshabilitando la
detección de escena.

Denominaremos a esta secuencia de referencia como: “Referencia_BitRate.mpg” y la encapsularemos como


un transport stream.

Ahora partiendo de dicha secuencia de referencia la recodificaremos manteniendo las mismas opciones
que para la secuencia de referencia y considerando los siguientes bitrates aproximados_:

• Tasa Constante (CBR): 75000, 37500, 19000, 10000, 6000, 3000 y 1500 kbps.
• Tasa variable (VBR): considerar tasas de codificación cuyo target sea equivalente a las tasas
CBR consideradas y el máximo no exceda del doble del target.

Tanto la secuencia de referencia como las secuencias resultantes de la codificación deben almacenarse en
la carpeta “Práctica1_evaluación” que ha tenido que crear dentro de su usuario correspondiente en
DAV_PRxx/PR1.

19
De igual forma que en el apartado anterior se les deben asignar nombre identificativos y representativos a
los video codificados donde se indiquen de forma inequívoca los parámetros utilizados en su codificación,
como, por ejemplo, “Referencia_BitRate_CBR_2000kbps” para un bitrate constante. En el caso de tasas
variables se debe indicar la tasa target, por ejemplo, “Referencia_BitRate_VBR_2000kbps”.

Indique mediante una tabla el tamaño resultante de las codificaciones anteriores. Visualice las secuencias y
analice los resultados obtenidos. ¿Qué tipo de tasa considera más adecuada para utilizar en la codificación
de este tipo de secuencias? En el caso de considerar una tasa de codificación CBR ¿Qué tasa consideraría
que es más adecuada?

Seleccione el archivo codificado a tasa constante que ha considerado como más adecuada y abra el
analizador de streams Qualify.

Capture la gráfica de la distribución de bytes/frame donde se muestren al menos dos GOPs e inclúyala en
la memoria.

Indique si el resultado que se muestra en la gráfica es el esperado, en base al tamaño del GOP observado
en las gráficas, el patrón del GOP y el tamaño de codificación de los frames. ¿Se mantiene constante el
tamaño de los frames, siempre y cuando sean del mismo tipo? ¿Por qué?

Vuelva a analizar las opciones avanzadas de codificación e identifique que opción que puede influir en la
distribución de los frames dentro del GOP. Recodifique la secuencia desmarcando la opción “adaptive B
placement” pero manteniendo el resto de las características iguales. ¿Obtenemos la misma distribución de
GOP que en caso anterior? ¿Cómo afecta esto a la calidad? ¿Y al tamaño? Céntrese en los fotogramas en
los cuales los GOPs son distintos

Seleccione una de las secuencias codificada con tasa VBR equivalente e indique cual ha seleccionado,
capture la misma gráfica (mismos GOPs) y añádala a la memoria. Justifique las similitudes y diferencias
observadas entre las dos secuencias consideradas.

Seleccione la secuencia con bitrate variable pero misma tasa objetivo que en el caso anterior, indique cual
ha seleccionado, visualice la gráfica de bytes/frame capture la pantalla y comenté las similitudes y
diferencias con respecto a la misma secuencia codificada con CBR equivalente.

Recupere la secuencia inicial en CBR y seleccione un frame I cualquiera (anote que frame ha seleccionado
e indíquelo en la memoria), visualice y capture la gráfica de los Current MB type y adjúntela a la memoria.
Repita el proceso seleccionando el mismo frame I para otra de las secuencias codificadas con un CBR
distinto. Compare ambas figuras. ¿Qué diferencias observa? ¿A que pueden deberse dichas diferencias?

20
Ahora repita el proceso para un frame de tipo P. Indique el número de frame correspondiente al frame P
seleccionado. En el cuadro donde aparece el vídeo codificado (“picture display”) marque la opción
Macroblock grid. Esta opción nos permite ver los macrobloques de luminancia y crominancia juntos o por
separado y su estructura de codificación. Visualice las distintas opciones que ofrece: “MB Coding Type”,
“MB Quantizer”, “Bits per MB” y “Slice Structure” y conteste a las siguientes preguntas:

a) Cuando se selecciona la opción “Macrobock Grid” aparecen unos bloques en gris oscuro, ¿Por qué?
b) ¿Cuántos cortes presenta el frame seleccionado?

Visualice las opciones “Residual Frame”, “Motion compensated” y “Decoded Frame” ¿que representa cada
una de estas opciones?

Adjunte una captura de pantalla en la que se puedan observar las opciones que considera más
características para interpretar el resultado anterior.

Por último, seleccione un frame B (indique el número correspondiente al frame seleccionado) y capture la
gráfica de Statistics, asegúrese de seleccionar un frame que contenga una representación de todos los tipos
de “current MB types”. En el mismo cuadro de dialogo donde aparece el fotograma decodificado seleccione
la opción “Forward MV” y capture la pantalla que aparece. ¿Qué son las líneas negras que aparecen en la
pantalla y a que son debidas?, haga lo mismo con el BackWard MV. Capture la pantalla y adjúntela en la
memoria.

5.3 Influencia del GOP


En este apartado se va a analizar la influencia del GOP en la codificación. De acuerdo con los resultados
obtenidos en el apartado anterior, en este punto vamos a trabajar con un escaneo progresivo de 25 frames.
Abra la opción de configuración avanzada y seleccione el nivel 4.1 corresponde al perfil High. Fije los
parámetros del GOP al igual que en apartado anterior de 33 frames con un número máximo de 3 frames
B y sin detección de escena. Considere una tasa de codificación constante de 30000 kbps y limite la
transcodificación al intervalo comprendido entre los segundos 45 y 60 de vídeo, aproximadamente (vea la
Figura 20). Encapsule la secuencia codificada en un Transport Stream e identifique esta secuencia como
“Referencia_GOP”

21
Figura 20: Limitación del tiempo de transcodificación

Para poder evaluar la influencia del GOP de forma válida, necesitamos considerar un bitrate límite. Esto es
aquella tasa de codificación que empieza a generar distorsiones en la imagen. Para ello, cogeremos la
secuencia de referencia y la recodificaremos a una tasa constante de 10.000 kbps, considerando un perfil
HD para H.264 Broadcast con una frecuencia de frame entrelazada de 50 Hz. Después, considerando
siempre una tasa constante (CBR) la recodificaremos de forma iterativa reduciendo cada vez en 1000kbps
hasta que veamos que aparecen artefactos en la secuencia codificada. ¿A que tasa CBR ocurre esto? Incluya
una captura de la secuencia con y sin distorsión e indique las dos tasas a las cuales se observan y no se
observan artefactos. Fijaros en particular justo antes de que el coche tenga el accidente y observad el
pixelado de la imagen.

Seleccione la tasa inmediatamente superior a la que obtuvo con artefactos, y repita el proceso de
codificación reduciendo en 200 kbps la tasa de codificación. ¿Cuál cree que es la tasa límite de codificación?

Seleccione como secuencia de referencia para este apartado la secuencia codificada a la tasa
inmediatamente superior a la que se han observado los artefactos. Nombre a esta secuencia como
“Referencia_Limite_CBR_xxxxKbps” y guárdela en su carpeta.

Ahora vamos a evaluar las distintas posibilidades que hay para el GOP. Partiendo de la secuencia de
referencia que ha obtenido, mantenga el resto de los parámetros iguales y recodifíquela considerando:

• Desactive la opción de detección de escena y fije GOP fijo elevado por ejemplo 80-100 frames
• Active la opción de detección de escena y un GOP fijo elevado por ejemplo 80-100 frames
• Desactive la opción de detección de escena y un GOP fijo reducido por ejemplo 6-10 frames
• Active la opción de detección de escena y un GOP fijo reducido por ejemplo 6-10 frames
• Active la opción de detección de escena, considere un GOP medio en torno a 33 frames y considere
distintos valores para número de frames B

Guarde los resultados de codificación en la carpeta indicada para su evaluación. Los nombres de los archivos
generados deben ser suficientemente identificativos, para cada uno de ellos.

22
Visualice las secuencias generadas y observe como varia la calidad del video con los distintos cambios
realizados en el GOP. ¿Qué conclusiones puede extraer? ¿Afecta a su tamaño? Muestre los resultados de
tamaño en una tabla.

5.4 Influencia del algoritmo de estimación de


movimiento
Partiendo de la misma secuencia obtenida en el punto anterior e identificada como
“Referencia_Limite_CBR_xxxxKbps” proceda a su recodificación modificando las opciones de configuración
avanzadas con respecto al algoritmo de estimación de movimiento y recodifique las secuencias
manteniendo el resto de los parámetros iguales que en la secuencia de partida.

• Desactive la opción de Fast Multi-reference frame search


• Desactive la opción Fast Sub-block search
• Desactive ambas opciones

Guarde dichas secuencias en su carpeta con un nombre suficientemente representativo. Visualice las
secuencias obtenidas ¿Qué efectos observa en cada caso sobre cada secuencia? ¿afecta al tamaño de la
secuencia codificada?

5.5 Influencia de la tasa de distorsión


Partiendo de la misma secuencia obtenida en el punto 6.3 e identificada como
“Referencia_Limite_CBR_xxxxKbps” proceda a su recodificación modificando las opciones de configuración
avanzadas con respecto al algoritmo de decisión y recodifique las secuencias manteniendo el resto de los
parámetros iguales que en la secuencia de partida.

• Desactive la opción de Fast intra decisions


• Desactive la opción Fast inter decisions
• Desactive ambas opciones

Guarde dichas secuencias en su carpeta con un nombre suficientemente representativo. Visualice las
secuencias obtenidas ¿Qué efectos observa en cada caso sobre cada secuencia? ¿afecta al tamaño de la
secuencia codificada?

23
5.6 Caso Práctico
Un radiodifusor desea emitir 5 servicios en un múltiplex digital de IPTV de acuerdo con el estándar DVB-T
con las siguientes características:

• 1 canal de deportes en HD
• 1 canal de informativos en calidad HD
• 1 canal infantil en HD basado principalmente en dibujos animados
• 1 servicio de Radio
• Servicio de subtítulos para cada programa de televisión
• guía de programa
• Multiplexación estadística
• Capacidad total del múltiplex 20 Mbps

La cabecera presenta la siguiente arquitectura:

• Redundancia en codificación con 4 codificadores de salvaguarda


• Redundancia en multiplexación con 2 multiplexores

Busque equipos comerciales que cumplan las especificaciones técnicas.

Capture las características técnicas de los codificadores seleccionados: Marca, modelo, códecs e interfaces
de entrada y salida, adjunte las hojas técnicas de dichos codificadores.

Capture las características técnicas de los multiplexores seleccionados: Marca, modelo, número de
entradas/salidas, interfaces de entrada/salida y tipo de multiplexación.

Justifique el porqué de la selección de dichos codificadores y multiplexores y realice un diagrama de


bloques de la arquitectura de la cabecera diseñada utilizando algún software de diseño de procesos tipo:
[Link], lucidchart, sketch, visio….

En dicho diagrama defina los parámetros principales para cada uno de los servicios como: resolución, códec
de video/audio utilizado y bitrate.

24

También podría gustarte