Compresión de Audio y Video en TotalCode
Compresión de Audio y Video en TotalCode
Práctica 1
COMPRESIÓN DE AUDIO Y VIDEO
EV A M AR Í A C IRUGED A R O LD ÁN
Curso 2022-2023
TABLA DE CONTENIDO
1 Introducción __________________________________________________________________ 2
2 Calificación ___________________________________________________________________ 2
3 Codificación de secuencias con TotalCode Studio ____________________________________ 3
3.1 Agregar una secuencia a TotalCode Studio ____________________________________________ 4
3.2 Configuración de la codificación _____________________________________________________ 5
3.2.1 Selección del códec ____________________________________________________________ 5
3.2.2 Selección de la estructura de trama _______________________________________________ 7
3.2.3 Configuración del códec ________________________________________________________ 9
3.3 Selección del fichero de salida _____________________________________________________ 10
3.4 Iniciar la transcodificación ________________________________________________________ 11
5 Tareas ______________________________________________________________________17
5.1 Recodificación de vídeo___________________________________________________________ 17
a) Captura y parámetros de la secuencia de entrada _____________________________________________ 18
b) Codificación de video ___________________________________________________________________ 18
c) Evaluación de la calidad _________________________________________________________________ 19
5.2 Influencia del Bitrate _____________________________________________________________ 19
5.3 Influencia del GOP _______________________________________________________________ 21
5.4 Influencia del algoritmo de estimación de movimiento _________________________________ 23
5.5 Influencia de la tasa de distorsión __________________________________________________ 23
5.6 Caso Práctico ___________________________________________________________________ 24
1
1 Introducción
El objetivo de la presente práctica es conocer en detalle las distintas técnicas de compresión de audio y
vídeo aplicadas en las cabeceras de difusión de TV, en particular aquellos códecs utilizados en la difusión
de contenidos audiovisuales en televisión digital.
Se prestará especial atención a los distintos parámetros de compresión y codificación estudiados en el tema
2 y se evaluarán las prestaciones de las distintas codificaciones disponibles.
Se evaluarán distintas opciones de codificación, formato Elementary streams, program streams o transport
streams de acuerdo con los contenidos del tema 3.
Para ello, el alumno utilizará el software de compresión de audio y video “totalCodeStudio” para modificar
los parámetros que afectan a las principales etapas de compresión, transformación y compensación del
movimiento como el tamaño del GOP, el escaneo y la tasa de codificación. El alumno visualizará sus efectos
en los coeficientes transformados, la energía del residuo, vectores de movimiento, tamaño de imagen y la
imagen decodificada por medio del analizador de tramas comprimidos “Qualify ”.
De igual modo, el alumno resolverá un caso práctico en el que deberá aplicar sus conocimientos para
configurar convenientemente los parámetros de codificación de una cabecera de compresión,
optimizándolos para un servicio de TV con limitaciones de ancho de banda.
2 Calificación
La evaluación de esta práctica se realizará por medio de la entrega de la memoria en el apartado
correspondiente del aula virtual. Los streams codificados utilizados en la práctica deberán incluirse en una
carpeta nombrada “Practica1_evaluacion” dentro del repositorio del grupo (DAV_PRXX) en labmu.
La memoria debe seguir la estructura de la plantilla facilitada a través del aula virtual antes de la fecha
límite el próximo 04 de marzo a las 23.59 horas. Se puede solicitar una prórroga de la misma en caso
necesario antes del viernes 4 marzo. Esta prórroga otorga 15 días de plazo adicionales, hasta el 18 de
marzo a las 23.59 horas, pero se incurrirá en una penalización en la calificación final del 10% de la nota
por cada semana de retraso en la entrega.
Cada alumno trabajará, preferiblemente en el ordenador que le ha sido asignado, para saber en qué
ordenador debe situarse o a cuál debe conectarse de forma remota, En el listado de grupos de prácticas
se le ha asignado un número que corresponde al PC sobre el que debe trabajar.
2
La práctica se califica mediante una guía de evaluación en aula virtual y se puntúa con un total de 10
puntos.
Códec utilizado
Formato Codificación
Configuración del códec
La sección inferior izquierda, recuadrada en verde, muestra las características del vídeo de salida según
queramos que sea codificado.
3
3.1 Agregar una secuencia a TotalCode Studio
Para agregar una nueva secuencia de entrada a TotalCode estudio será suficiente con pulsar en el botón
“importar fichero” (ver Figura 1) o bien utilizando el menú superior File Open Media, una vez
seleccionada dicha opción aparecerá un cuadro de dialogo como el mostrado en la Figura 2.
En la barra superior se indicará la ubicación de nuestro repositorio en Labmu, esta dirección será
básicamente: \\[Link]\DAV_PRXX\labmu\P1 donde XX índica el grupo de prácticas al
que pertenece cada alumno.
En dicha carpeta se encuentran los ficheros necesarios para la realización de esta práctica. Una vez
seleccionado el video se pulsa en abrir y dicho fichero se agregará a la sección del fichero de entrada.
Si se pulsa en el desplegable mostrado con un símbolo más al lado de cada componente (ver Figura 3), se
pueden ver las características del audio y del vídeo de la secuencia de video de entrada, donde se muestran
4
la duración, el códec utilizado, la resolución, el tamaño del GOP y el bitrate entre otras características. De
igual forma, pulsando sobre la cruz con el más a la izquierda de la componente de audio, se muestran las
características de dicha componente, entre otras, la duración, el número de muestras, la frecuencia de
muestreo, la profundidad y el bitrate.
5
En esta práctica el estudiante se centrará en el estudio de los códecs que se definen en el estándar DVB-T
para la difusión de contenidos audiovisuales en HD:
• AVC / H.264
• VC-1
• HEVC / H.265
Estos pueden seleccionarse a partir de la opción CUSTOM (mostrada en la Figura 5), HEVC o Digital TV.
Figura 5. De izquierda a derecha: Posibles códecs para utilizar en transcodificación de las secuencias, tipos de
estructura de la trama del fichero codificado, y opciones de configuración del códec.
Una vez seleccionado el códec a utilizar el estudiante debe seleccionar el tipo de trama que presentará el
fichero de salida. No obstante, al pulsar sobre cada una de las componentes que van a ser codificadas se
observa cómo se pueden elegir distintas opciones compatibles dentro del códec seleccionado (ver Figura
6). Por ejemplo, en vídeo se observa como da dos opciones: “PRO” y “BroadCast [Demo]”, esto nos indica
opción “profesional” y opción “difusión”, es decir, si se utilizará la codificación H.264 para estudios de
grabación o para “difusión de contenidos”.
De igual forma, al pulsar sobre la componente de audio (Figura 6) se muestran en un menú desplegable
los distintos códecs de audio compatibles con el códec de vídeo seleccionado que el estándar DVB
contempla para la codificación de las componentes de audio de un programa.
6
Una vez seleccionado el códec a utilizar el estudiante debe seleccionar el tipo de trama que presentará el
fichero de salida.
Figura 6: Opciones compatibles de codificación de audio y video conforme el estándar H.264. Izquierda para
componente de vídeo y derecha para componente de audio
Se pueden observar cuatro opciones, dentro de ellas el estudiante se centrará en los formatos que se han
visto en clase dentro del tema 3, y en particular en los siguientes formatos:
7
• Transport Stream (TS)
Al seleccionar la opción transport stream (ver Figura 7) se observa como aparece una nueva línea
identificada como “Program #1 ID:1000” y se ha activado el botón identificado como “+P” en la parte
derecha del cuadro. Esto se debe a que, tal y como se ha visto en teoría, el PS solo puede contener
componentes relativas a un programa mientras que un TS puede contener varios programas distintos
codificados y multiplexados.
Figura 8: Formato de trama. A la izquierda trama program Stream y en la derecha Transport Stream
Pulsando en la opción “+P” el programa añade una nueva línea de programa con sus componentes al cual
podremos añadir un segundo fichero de entrada si se desea o fuera necesarios (ver Figura 8). Para añadir
el segundo programa solo es necesario repetir los pasos indicados en 3.1. Se pueden añadir tantos
programas como el usuario considere necesario codificar.
8
3.2.3 Configuración del códec
Para configurar el códec se pueden seleccionar entre las distintas opciones básicas de configuración que
se muestran en la parte inferior de la sección de salida (ver Figura 6) en función de la componente
seleccionada.
Para el vídeo se permite elegir el códec (versión compatible), la dupla perfil@nivel tal y como se han visto
en el tema 2, el modo de codificación, PAL o NTSC, la tasa de fotograma o frecuencia de refresco y el
escaneo progresivo o entrelazado. Se permite también seleccionar el ancho, alto y resolución de la imagen.
Finalmente permite elegir el tipo de tasa de codificación, constante, variable o calidad constante, por
ejemplo y la tasa de codificación en Kbps.
De forma similar para el audio, podemos seleccionar el códec a utilizar, el número de canales, tipo de
codificación, la frecuencia de muestreo, la profundidad (bits/muestra), el tipo de bitrate y su tasa (ver Figura
6)
Además de estas opciones básicas de configuración, si se pulsa en la llave que aparece en la esquina
superior derecha de cuadro, se accede a las opciones avanzadas de configuración (ver Figura 10).
Dentro de las opciones básicas, se puede acceder a opciones más específicas como el submuestreo croma
o la profundidad (número de bits) utilizados en la codificación de las componentes luma y croma, también
se permite configurar los tamaños de buffer de codificación y el tamaño máximo para los distintos
fotogramas considerados (Intra, Progresivo, Bidireccional).
9
Por otro lado, dentro de las opciones avanzadas, podemos seleccionar la dupla nivel@perfil y configurar
distintos parámetros relativos a la estructura del GOP, el algoritmo de estimación de movimiento, la
distorsión de tasa entre otras.
Dentro de la estructura del GOP se puede elegir su tamaño y la configuración de los fotogramas
bidireccionales (B), entre otras opciones. En el algoritmo de estimación y compensación de movimiento se
permite definir el tamaño del macrobloque, el número de fotogramas de referencia y el rango de búsqueda.
Como características adicionales se puede seleccionar entre la aplicación o no del filtro de bordes, el tipo
de codificación entrópica y el número de cortes por imagen.
Para asignar bastaría con situarse en el cuadro de dialogo en la parte inferior de la sección del vídeo de
salida (ver Figura 1) e indicar la ruta completa y nombre de archivo. O bien pulsar sobre el icono de la
rueda de configuración, justo a la derecha (ver Figura 1) donde se abrirá un cuadro de dialogo como el
mostrado en la Figura 11 dónde se puede seleccionar la ruta.
Dado que el servidor Labmu es bastante lento, se recomienda trabajar en modo local en el escritorio. Pero
recordad que solo se calificaran las secuencias que se encuentren en la carpeta de evaluación en el servidor
Labmu, así que las secuencias finales, deben copiarse a la carpeta correspondiente del servidor.
10
3.4 Iniciar la transcodificación
Para iniciar la transcodificación, una vez seleccionado el fichero de entrada, configuradas las opciones de
codificación y asignado el fichero de salida, basta con pulsar sobre el botón “play” cuyo símbolo es un
triángulo y se encuentra en el menú superior de la interfaz gráfica (ver Figura 1). Con ello empezara la
transcodificación.
Su proceso puede observarse en la parte derecha de la interfaz gráfica de usuario (ver Figura 1, recuadro
rojo). La visualización del proceso de transcodificación suele ralentizarlo, podemos ocultarlo pulsando sobre
el primer icono que aparece en la esquina superior derecha, el que tiene un ojo sobre la pantalla (ver Figura
12). El segundo icono, el que presenta las dos flechas nos permite ver los fotogramas una vez codificados,
mientras que el último, la cámara no permite guardar una captura de del frame mostrado en la pantalla de
previsualización con la calidad especificada.
Figura 13: Interfaz gráfica de usuario de Qualify (izquierda) y cuadro de dialogo creación de nuevo proyecto (derecha)
La Figura 13 muestra la interfaz gráfica de usuario de Qualify. El primer paso es crear el proyecto de análisis
de la secuencia de vídeo para ello se debe pulsar sobre el botón “PROJECT” y seleccionar la opción “New
Project”, tal y como se muestra en la Figura 13, tras lo cual se abrirá un cuadro de diálogo, donde se debe
indicar la ruta y el nombre del proyecto. De nuevo, se recomienda trabajar de forma local debido a la
lentitud del servidor labmu, pero el proyecto completo debe ser copiado a la carpeta Labmu al final de la
11
sesión. Este proyecto debe tener un nombre identificativo, se recomienda algo similar al nombre del archivo
a analizar.
Una vez creado el nuevo proyecto, aparecerá en la interfaz de usuario un nuevo cuadro de dialogo (ver
Figura 14), para agregar la secuencia que se va a analizar bastaría con arrastrar dicha secuencia desde su
carpeta de origine al proyecto de Qualify. También puede agregarse mediante el explorador, al pulsar en
el botón “EXPLORER” se abre un nuevo cuadro de dialogo que permite seleccionar la carpeta y secuencia
que se va a analizar y añadirla al proyecto de Qualify.
Una vez agregada la secuencia de vídeo que se desea analizar es necesario pulsar sobre el botón “START
ANALYSER”, mediante esta acción, el programa realiza un análisis exhaustivo de la secuencia codificada y
permite visualizar y analizar sus características.
12
Una vez analizada la secuencia, se debe pulsar sobre el botón “DETAILS”, este abre una nueva pantalla de
análisis donde se muestran 3 ventana (ver Figura 15). En la parte superior izquierda aparece el detalle de
los fotogramas y se indica el tipo de codificación utilizada (I, P o B). En la parte superior derecha se puede
observar el detalle del tipo de codificación de los macrobloques en cada imagen y en la parte inferior
aparece un gráfico donde se pueden observar el tamaño y tipo de codificación de cada frame y a la vez
que otros parámetros de caracterización.
(a)
(b)
La Figura 16 muestra el tamaño de cada frame codificado y el tipo de frame utilizado. Se puede ver su
evolución en función de cada frame o nos permite utilizar una distribución del eje X en el dominio temporal
para ver la evolución del tamaño de codificación.
En esta gráfica podemos comparar el tamaño del GOP, distancia entre frames I en rojo. El número de
frames B utilizados, en verde y los frames P en azul.
El marcador nos permite situarnos en un determinado frame y ver tu tamaño en bytes, en el ejemplo de la
Figura 16, el marcador está representado como una línea vertical discontinua blanca y hace referencia al
frame 360. La parte inferior presenta una ampliación de una sección de la gráfica donde se puede observar
13
con mayor detalle el número de frame B utilizados y como se trata de un GOP cerrado, presenta un frame
P justo antes del frame I al inicio del siguiente GOP
4.2 Statistics
Seleccionando la opción “Statistics” de la barra superior se abre la nueva pantalla mostrada en la Figura
17 aparece un set de tres gráficos. El primero índica el número de bytes de cada tipo de frame asignados
en la codificación de la secuencia, el segundo, índica el número de frames y su tipo de codificación a lo
largo de la secuencia y el tercero, la distribución de los macrobloques codificados en el frame seleccionado.
El primer gráfico es independientemente del frame que se seleccione para analizar sus estadísticas ya que
se corresponde con la trama completa, es decir, indica cuantos MB del total de la secuencia están
codificados como tipo I, P o B.
El segundo gráfico, muestra el contador de frames, de nuevo este gráfico hace referencia al número total
de frames que hay codificados como tipo I, P o B en la totalidad de la secuencia.
14
Por último, el gráfico de la derecha (current MB types) muestra un análisis del fotograma seleccionado y la
distribución de la codificación utilizada para los distintos macrobloques en ella. En el ejemplo de la Figura
17 se ha seleccionado un frame de tipo B y en él se indican el porcentaje y tamaño, en MB, asignado a los
macrobloques que se han codificado como tipo Intra, el sentido de predicción de los algoritmos de
estimación de movimiento (MV) se ha hecho desde macrobloques anteriores, posteriores o ambos, aquellos
macrobloques que no han requerido codificación o aquellos que se han codificado sin necesidad de aplicar
MV. Este último gráfico es el único que cambia para cada frame.
4.3 MB details
Esta opción indica los detalles de codificación de cada macrobloque en el frame seleccionado. Para ello
primero es necesario seleccionar un fotograma codificado de la secuencia en “frame details”, una vez
seleccionado y abierta la pestaña de MB details, sobre la imagen del fotograma mostrada en la parte
derecha podemos arrastrar el ratón y ver cómo cambian los valores mostrados en los MB details (ver Figura
18).
Los MB details muestran en la tabla de la izquierda el corte al que pertenece el macrobloque seleccionado,
el número de macrobloque, los bits y el tipo de codificación de los macrobloques. El tipo de macrobloque
puede consultarse dentro de las normas ITU-T H.264 o H.265 correspondientes a cada tipo de codificación
(estas pueden encontrarse dentro del aula virtual).
15
Se permite visualizar los coeficientes codificados de cada macrobloque, los coeficientes tras el proceso de
cuantificación inverso y los coeficientes tras el proceso de transformación inverso. En la parte inferior se
observa el macrobloque al cual se corresponden los coeficientes.
Figura 19: Distintas codificaciones en función del número de los coeficientes considerados
16
4.4 Header
Esta opción permite visualizar las cabeceras asignadas a cada unidad codificada. Podemos verla en forma
de Árbol o como mapa de cabeceras. En ella se puede observar la información que va contenida en la
cabecera de cada unidad. Podemos observar en función de las unidades de acceso que cabeceras y que i
información se asigna durante el proceso de codificación que es necesaria para los decodificadores.
4.5 DCT
Esta opción permite visualizar la imagen en función del número de coeficientes que se tengan en cuenta
en su decodificación.
En los DCT settings se pueden seleccionar los coeficientes que se van a tener en cuenta para la
decodificación de la imagen, pueden seleccionarse todos o solo algunos de ellos. En la Figura 19 se
observan en primer lugar la decodificación completa de la imagen teniendo en cuenta todos los
coeficientes, en la segunda imagen se observa la parte decodificada correspondiente a frecuencias más
altas, la cual contiene detalles más finos y finalmente la última opción muestra la decodificación de la
imagen teniendo en cuenta los dos primeros coeficientes según el escaneo en zig-zag.
Esta opción muestra como la mayor cantidad de la información está contenida en los coeficientes de las
frecuencias más bajas.
5 Tareas
Dentro de la carpeta labmu asignada a cada grupo de prácticas (usuario DAV_PRxx) se encuentra un vídeo
F1_2020.mp4. Este vídeo se trata de una secuencia de vídeo de Formula 1 codificado en UHD utilizando
H.264 de 10 bits, con un bitrate de calidad constante.
De acuerdo con la norma ETSI TS 101 154 se permite la difusión de señales de TV con las siguientes
combinaciones de perfil@nivel, según se muestran en la Tabla 1.
17
Tabla 1 Estándares de codificación para difusión de TV digital
Puede incluir una captura de pantalla o una tabla con los parámetros más característicos del vídeo.
b) Codificación de video
Para cada formato de TV especificado en la Tabla 1 debe recodificar la secuencia facilitada considerando
todas las opciones de codificación mostradas con los parámetros adecuados, consulte las transparencias
del tema 2.
A la hora de configurar el códec (Preset) debe tener en cuenta que para establecer el nivel adecuado hay
que abrir las opciones de configuración avanzadas, pulsando en la herramienta. No todos los códecs os
permitirán seleccionar la dupla nivel@perfil. Tened en cuenta que para VC-1 en versión HD, advanced@3,
necesitáis seleccionar la opción Blue-Ray: BD VC-1 High Resolution. El objeto de codificación, Target, debe
ser un MPEG Transport Stream.
Se deben mantener los mismos parámetros de codificación para cada formato: HDTV, UHDTV, dentro de
las posibilidades para que puedan ser evaluados a efectos de calidad y tamaño en el siguiente apartado.
Las secuencias de salida finales deben almacenarse en la carpeta “Práctica1_evaluación” que ha tenido que
crear dentro de su usuario correspondiente en DAV_PRxx/PR1.
Cada secuencia resultante debe identificarse de forma inequívoca, donde se indiquen los parámetros
utilizados en su codificación: <formato>_<codec>_<frameRate>_<resolución>_<tipoBR>_<bitrate>, por
ejemplo: “HD_MPEG2_25i_916_CBR_8000kbps”
18
c) Evaluación de la calidad
Visualice las secuencias obtenidas para los formatos SDTV y HDTV en el apartado anterior. Clasifíquelas por
orden de mayor a menor calidad visual, indique el resultado en una tabla. Indique para cada codificación
el tamaño del archivo, puede hacerlo en formato tabla. ¿Cómo afecta la codificación utilizada al tamaño
del archivo? ¿Qué tipo de codificación cree que es mejor para SDTV? ¿Y para HDTV? Justifique su respuesta
en ambos casos.
Para obtener la secuencia de referencia, se debe recodificar la secuencia original para difusión de HDTV
(Digital TV -> DBV HD H.264) y configurando los parámetros básicos de acuerdo con el estándar y
considerando una tasa de bitrate constante (CBR), la máxima permitida.
Es necesario mantener un GOP fijo ya que esto puede afectar en la codificación y está relacionado
directamente con el bitrate. Para ello en la configuración avanzada se debe desactivar la opción de “habilitar
detección de escena” y establecer un tamaño fijo de GOP en 33 frames con 3 frames B. Capture el cuadro
de dialogo donde se muestran las opciones de configuración avanzada fijando el GOP y deshabilitando la
detección de escena.
Ahora partiendo de dicha secuencia de referencia la recodificaremos manteniendo las mismas opciones
que para la secuencia de referencia y considerando los siguientes bitrates aproximados_:
• Tasa Constante (CBR): 75000, 37500, 19000, 10000, 6000, 3000 y 1500 kbps.
• Tasa variable (VBR): considerar tasas de codificación cuyo target sea equivalente a las tasas
CBR consideradas y el máximo no exceda del doble del target.
Tanto la secuencia de referencia como las secuencias resultantes de la codificación deben almacenarse en
la carpeta “Práctica1_evaluación” que ha tenido que crear dentro de su usuario correspondiente en
DAV_PRxx/PR1.
19
De igual forma que en el apartado anterior se les deben asignar nombre identificativos y representativos a
los video codificados donde se indiquen de forma inequívoca los parámetros utilizados en su codificación,
como, por ejemplo, “Referencia_BitRate_CBR_2000kbps” para un bitrate constante. En el caso de tasas
variables se debe indicar la tasa target, por ejemplo, “Referencia_BitRate_VBR_2000kbps”.
Indique mediante una tabla el tamaño resultante de las codificaciones anteriores. Visualice las secuencias y
analice los resultados obtenidos. ¿Qué tipo de tasa considera más adecuada para utilizar en la codificación
de este tipo de secuencias? En el caso de considerar una tasa de codificación CBR ¿Qué tasa consideraría
que es más adecuada?
Seleccione el archivo codificado a tasa constante que ha considerado como más adecuada y abra el
analizador de streams Qualify.
Capture la gráfica de la distribución de bytes/frame donde se muestren al menos dos GOPs e inclúyala en
la memoria.
Indique si el resultado que se muestra en la gráfica es el esperado, en base al tamaño del GOP observado
en las gráficas, el patrón del GOP y el tamaño de codificación de los frames. ¿Se mantiene constante el
tamaño de los frames, siempre y cuando sean del mismo tipo? ¿Por qué?
Vuelva a analizar las opciones avanzadas de codificación e identifique que opción que puede influir en la
distribución de los frames dentro del GOP. Recodifique la secuencia desmarcando la opción “adaptive B
placement” pero manteniendo el resto de las características iguales. ¿Obtenemos la misma distribución de
GOP que en caso anterior? ¿Cómo afecta esto a la calidad? ¿Y al tamaño? Céntrese en los fotogramas en
los cuales los GOPs son distintos
Seleccione una de las secuencias codificada con tasa VBR equivalente e indique cual ha seleccionado,
capture la misma gráfica (mismos GOPs) y añádala a la memoria. Justifique las similitudes y diferencias
observadas entre las dos secuencias consideradas.
Seleccione la secuencia con bitrate variable pero misma tasa objetivo que en el caso anterior, indique cual
ha seleccionado, visualice la gráfica de bytes/frame capture la pantalla y comenté las similitudes y
diferencias con respecto a la misma secuencia codificada con CBR equivalente.
Recupere la secuencia inicial en CBR y seleccione un frame I cualquiera (anote que frame ha seleccionado
e indíquelo en la memoria), visualice y capture la gráfica de los Current MB type y adjúntela a la memoria.
Repita el proceso seleccionando el mismo frame I para otra de las secuencias codificadas con un CBR
distinto. Compare ambas figuras. ¿Qué diferencias observa? ¿A que pueden deberse dichas diferencias?
20
Ahora repita el proceso para un frame de tipo P. Indique el número de frame correspondiente al frame P
seleccionado. En el cuadro donde aparece el vídeo codificado (“picture display”) marque la opción
Macroblock grid. Esta opción nos permite ver los macrobloques de luminancia y crominancia juntos o por
separado y su estructura de codificación. Visualice las distintas opciones que ofrece: “MB Coding Type”,
“MB Quantizer”, “Bits per MB” y “Slice Structure” y conteste a las siguientes preguntas:
a) Cuando se selecciona la opción “Macrobock Grid” aparecen unos bloques en gris oscuro, ¿Por qué?
b) ¿Cuántos cortes presenta el frame seleccionado?
Visualice las opciones “Residual Frame”, “Motion compensated” y “Decoded Frame” ¿que representa cada
una de estas opciones?
Adjunte una captura de pantalla en la que se puedan observar las opciones que considera más
características para interpretar el resultado anterior.
Por último, seleccione un frame B (indique el número correspondiente al frame seleccionado) y capture la
gráfica de Statistics, asegúrese de seleccionar un frame que contenga una representación de todos los tipos
de “current MB types”. En el mismo cuadro de dialogo donde aparece el fotograma decodificado seleccione
la opción “Forward MV” y capture la pantalla que aparece. ¿Qué son las líneas negras que aparecen en la
pantalla y a que son debidas?, haga lo mismo con el BackWard MV. Capture la pantalla y adjúntela en la
memoria.
21
Figura 20: Limitación del tiempo de transcodificación
Para poder evaluar la influencia del GOP de forma válida, necesitamos considerar un bitrate límite. Esto es
aquella tasa de codificación que empieza a generar distorsiones en la imagen. Para ello, cogeremos la
secuencia de referencia y la recodificaremos a una tasa constante de 10.000 kbps, considerando un perfil
HD para H.264 Broadcast con una frecuencia de frame entrelazada de 50 Hz. Después, considerando
siempre una tasa constante (CBR) la recodificaremos de forma iterativa reduciendo cada vez en 1000kbps
hasta que veamos que aparecen artefactos en la secuencia codificada. ¿A que tasa CBR ocurre esto? Incluya
una captura de la secuencia con y sin distorsión e indique las dos tasas a las cuales se observan y no se
observan artefactos. Fijaros en particular justo antes de que el coche tenga el accidente y observad el
pixelado de la imagen.
Seleccione la tasa inmediatamente superior a la que obtuvo con artefactos, y repita el proceso de
codificación reduciendo en 200 kbps la tasa de codificación. ¿Cuál cree que es la tasa límite de codificación?
Seleccione como secuencia de referencia para este apartado la secuencia codificada a la tasa
inmediatamente superior a la que se han observado los artefactos. Nombre a esta secuencia como
“Referencia_Limite_CBR_xxxxKbps” y guárdela en su carpeta.
Ahora vamos a evaluar las distintas posibilidades que hay para el GOP. Partiendo de la secuencia de
referencia que ha obtenido, mantenga el resto de los parámetros iguales y recodifíquela considerando:
• Desactive la opción de detección de escena y fije GOP fijo elevado por ejemplo 80-100 frames
• Active la opción de detección de escena y un GOP fijo elevado por ejemplo 80-100 frames
• Desactive la opción de detección de escena y un GOP fijo reducido por ejemplo 6-10 frames
• Active la opción de detección de escena y un GOP fijo reducido por ejemplo 6-10 frames
• Active la opción de detección de escena, considere un GOP medio en torno a 33 frames y considere
distintos valores para número de frames B
Guarde los resultados de codificación en la carpeta indicada para su evaluación. Los nombres de los archivos
generados deben ser suficientemente identificativos, para cada uno de ellos.
22
Visualice las secuencias generadas y observe como varia la calidad del video con los distintos cambios
realizados en el GOP. ¿Qué conclusiones puede extraer? ¿Afecta a su tamaño? Muestre los resultados de
tamaño en una tabla.
Guarde dichas secuencias en su carpeta con un nombre suficientemente representativo. Visualice las
secuencias obtenidas ¿Qué efectos observa en cada caso sobre cada secuencia? ¿afecta al tamaño de la
secuencia codificada?
Guarde dichas secuencias en su carpeta con un nombre suficientemente representativo. Visualice las
secuencias obtenidas ¿Qué efectos observa en cada caso sobre cada secuencia? ¿afecta al tamaño de la
secuencia codificada?
23
5.6 Caso Práctico
Un radiodifusor desea emitir 5 servicios en un múltiplex digital de IPTV de acuerdo con el estándar DVB-T
con las siguientes características:
• 1 canal de deportes en HD
• 1 canal de informativos en calidad HD
• 1 canal infantil en HD basado principalmente en dibujos animados
• 1 servicio de Radio
• Servicio de subtítulos para cada programa de televisión
• guía de programa
• Multiplexación estadística
• Capacidad total del múltiplex 20 Mbps
Capture las características técnicas de los codificadores seleccionados: Marca, modelo, códecs e interfaces
de entrada y salida, adjunte las hojas técnicas de dichos codificadores.
Capture las características técnicas de los multiplexores seleccionados: Marca, modelo, número de
entradas/salidas, interfaces de entrada/salida y tipo de multiplexación.
En dicho diagrama defina los parámetros principales para cada uno de los servicios como: resolución, códec
de video/audio utilizado y bitrate.
24