NEWTON C.
BRAGA
Como Funciona
Aparelhos, Circuitos e Componentes
Eletrônicos
Volume 46
Newton C. Braga
Patrocinado por
Mouser Electronics
1
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Índice
Apresentação da Série 7
As ondas de rádio 11
Ligação de microfones em transmissores 17
LoRa e LoRaWAN 31
O que é LoRa e LoraWAN 33
A modulação dos sinais 34
Os parâmetros regionais 36
Os elementos de uma rede LoRaWAN 36
Tipos de antenas 39
Os tipos de antenas 39
Dipolo simples 41
Dipolo dobrado 43
Antena yagi 44
Antena cônica 48
Log periódica 49
Antena selada 51
Ondas T ou radiação submilimétrica 53
Componentes para 6G na Mouser 60
O receptor de rádio reflex 61
O receptor reflex 65
O padrão MPEG 71
A necessidade da compressão 72
Princípios de compressão 73
Aplicações em TV 74
Introdução à compressão de vídeo digital 79
2
NEWTON C. BRAGA
Correntes MPEG 82
Monitoramento e análise 83
Armadilhas da compressão 84
Conclusão 86
Fundamentos e protocolos do MPEG 89
Codificação espacial ou temporal 89
Codificação espacial 90
Ponderação 94
Varredura 97
Codificação de entropia 98
Um codificador espacial 99
Codificação temporal 101
Compensação de movimento 103
Codificação bidirecional 105
Imagens I-, P- e B 107
Um compressor MPEG 110
Pré-processamento 114
Wavelets 115
Conclusão 117
A compressão de áudio 118
A audição humana 118
Codificação de sub-banda 121
Camada 1 do MPEG 124
Camada 2 do MPEG 125
Codificação de transformada 126
Camada 3 do MPEG 127
Áudio MPEG-2 127
3
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Áudio MPEG-4 128
AC-3 129
Os padrões MPEG 129
MPEG-1 129
MPEG-2 130
Perfis e níveis no MPEG-2 131
MPEG-4 134
Documentos do padrão MPEG-4 135
Codificação à objeto 136
Codificação de áudio e vídeo 137
Escalabilidade 138
Outros aspectos do MPEG-4 139
O futuro do MPEG-4 140
MPEG-7 141
MPEG-21 142
Conclusão 145
Correntes de dados 146
Correntes elementares em pacotes 146
Os pacotes PES 147
Selos de tempo 148
PTS/DTS 149
Correntes de programa (program streams) 151
Gravação versus transmissão 151
Introdução às correntes de programas 153
Correntes de transporte 154
A tarefa de uma corrente de transporte 154
Pacotes 156
4
NEWTON C. BRAGA
Clock de referência de programa (PCR) 157
Identificação de pacote (PID) 159
Informação específica de programa (PSI) 160
Modulação digital 164
Princípios de modulação 165
Modulação analógica 165
Modulação em quadratura 166
Sistemas simples de modulação digital 167
Quadrature amplitude modulation (QAM) 170
Vestigial sideband modulation (VSIB) 173
Coded orthogonal frequency division multiplex - COFDM 175
Integrated service data broadcasting (ISDB) 178
Sistema ISDB-S para satélite 179
Sistema ISDB-C para cabo 179
Sistema ISDB-T para terrestre 180
Resumindo o ISDB 181
DVB e ATSC 182
Uma Vista Geral 183
Remultiplexação 185
Service Information (SI) 187
Correção de erro 190
Codificação de canal 194
Codificação interna 196
Dígitos de transmissão 198
5
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
6
NEWTON C. BRAGA
Apresentação da Série
Este é o quadragésimo segundo volume desta grande série de
livros que levamos aos nossos leitores sob patrocínio da Mouser
Electronics ([Link]). Conforme os leitores que já baixaram
os volumes anteriores sabem, esta série é baseada na enorme
quantidade de artigos que escrevemos ao longo de nossa carreira como
escritor técnico e que publicamos em diversas revistas, folhetos, livros,
cursos e no nosso próprio site tanto em português, como em espanhol e
em inglês. São artigos que representam mais de 50 anos de evolução
das tecnologias eletrônicas e, portanto, têm diversos graus de
atualidade. Os mais antigos foram analisados sendo feitas alterações e
atualizações que julgamos necessárias. Outros pela sua finalidade
didática, tratando de tecnologias antigas e mesmo de ciência
(matemática, física, química e astronomia) não foram muito alterados a
não ser pela linguagem, que sofreu modificações se bem que em alguns
casos mantivemos os termos originais da época em que foram escritos.
Não estranhem se alguns deles tiverem ainda a ortografia antiga que foi
mantida por motivos históricos. Os livros da série consistirão numa
excelente fonte de informações para nossos leitores.
7
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Os artigos têm diversos níveis de abordagem, indo dos mais
simples que são indicados para os que gostam de tecnologia, mas que
não possuem uma fundamentação teórica forte ou ainda não são do
ramo. Neles abordamos o funcionamento de aparelhos de uso comum
como eletroeletrônicos, não nos aprofundando em detalhes técnicos que
exijam conhecimento de teorias que são dadas nos cursos técnicos ou
de engenharia.
Outros tratam de componentes e circuitos, ideais para os que
gostam de eletrônica e já possuem uma fundamentação quer seja
estudando ou praticando com as montagens que descrevemos em
nossos artigos. Estes já exigem um pequeno conhecimento básico da
eletrônica que também podem ser obtidos em artigos de nosso site,
livros e nossos cursos EAD. Estes artigos também vão ser uma
excelente fonte de consulta para professores que desejam preparar suas
aulas e alunos que desejam enriquecer seus trabalhos
Temos ainda os artigos teóricos que tratam de circuitos e
tecnologias de uma forma mais profunda com a abordagem de
instrumentação e exigindo uma fundamentação técnica mais alta. São
indicados aos técnicos com maior experiência, engenheiros e
professores.
8
NEWTON C. BRAGA
Também lembramos que no formato virtual o livro conta com
links importantes, vídeos e até mesmo pode passar por atualizações
on-line que faremos sempre que julgarmos necessário.
Neste volume ainda trataremos do funcionamento de
equipamentos antigos em especial televisores, monitores antigos de
computadores, gravadores de vídeo e games que utilizavam o padrão da
TV analógica., sendo especialmente indicado aos que desejam
recuperar este tipo de equipamento e já possuam um conhecimento
técnico, que estejam estudando ou que precisam de material de consulta
para suas aulas ou trabalhos práticos.
Trata-se de mais um livro que certamente será importante na sua
biblioteca de consulta, devendo ser carregado no seu tablet, laptop ou
celular para consulta imediata. Os livros podem ser baixados
gratuitamente no nosso site e um link será dado para os que desejarem
ter a versão impressa pagando apenas pela impressão e frete.
Newton C. Braga
9
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Nota sobre a ortografia: os artigos que coletamos para fazer
parte das edições da série Como Funcionam foram escritos a partir de
1965. Desde aquela época, a língua portuguesa passou por muitas
transformações, como a perda do trema em frequência, do acento em
polo, termos que foram substituídos por equivalentes modernos, tanto
em inglês como em português. O próprio uso da vírgula mudou. Assim,
em muitos casos, ao recuperar os artigos dependendo da época,
mantivemos a forma original (pelo valor histórico) como também
foram feitas alterações para o português moderno. Assim, eventuais
“erros” que o leitor encontre, não são erros, mas a manutenção da
forma original. Para usar estes artigos em eventuais trabalhos, o leitor
estará livre para manter a forma original, indicando isso, ou de fazer
alterações para o português moderno, onde se fizer necessário, com a
devida observação.
Conheça o Instituto
Newton C. Braga
[Link]
10
NEWTON C. BRAGA
As ondas de rádio
É incompreensível para muitos de nossos leitores a maneira
como podem sinais que levam a voz atravessar o espaço e serem
reproduzidos por um conjunto de componentes que formam um rádio.
Nota: Este texto antigo (1988) fez parte de um livro em que se
ensinava a montagem e reparação de rádios, hoje pouco comum. Vale
pela teoria e para aqueles que desejam aprender o básico e recuperar
rádios antigos e também outros modernos, pois a teoria não mudou.
Outros artigos sobre o mesmo tema podem ser encontrados em volumes
anteriores desta série.
Por maravilhoso que isso seja, o leitor perceberá que isto
também é muito simples e que o entendimento do modo como isso
acontece facilitará em muito o entendimento do funcionamento das
peças que formam o seu rádio. Vejamos, portanto, de que modo são
produzidas as ondas de rádio, o que elas são e como elas podem viajar
pelo espaço.
Quando uma corrente elétrica passa por um fio é produzida uma
perturbação de natureza magnética que pode propagar-se pelo espaço.
Se esta corrente for de alta frequência, ou seja, mudar de sentido
milhares de vezes por segundo ou mesmo milhões de vezes, esta
11
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
perturbação pode se propagar pelo espaço atingindo longas distâncias
sob a forma de ondas de rádio. (figura 1)
Um transmissor de rádio é, portanto, um aparelho que produz
estas correntes de altas frequências as quais são levadas a uma antena
que permite que as perturbações de natureza eletromagnética, ou seja,
as ondas de rádio ou ondas eletromagnéticas sejam produzidas e
espalhadas pelo espaço.
O número de vibrações que corresponde a cada tipo de onda é
importante, pois determina o comportamento da mesma no espaço, ou
seja, seu alcance, o tipo de aparelho que pode recebê-la e o tipo de
12
NEWTON C. BRAGA
informação que ela pode levar. Existe assim uma divisão das ondas de
rádio segundo a frequência, ou seja, o número de vibrações, e em cada
caso é reservada uma utilidade prática.
Os rádios comuns de AM (amplitude modulada), por exemplo,
recebem estações de ondas médias e curtas. As ondas médias
correspondem a frequências entre 550 000 e 1 600 000 vibrações o que
é dado cm Hertz (Hz) o que nos leva a dizer que as estações de ondas
médias operam entre frequências de 550 kHz e 1 600 kHz (veja a
marcação do mostrador de seu radinho).
As estações de radiodifusão que operam então nestas
frequências, cada uma com seu valor próprio de frequência, são
estações locais, ou seja, de curto alcance normalmente destinadas a
serem recebidas numa pequena região em torno de uma cidade ou no
máximo, durante a noite, a algumas centenas de quilômetros.
As ondas curtas, por outro lado, podem alcançar distâncias
maiores porque podem refletir-se nas altas camadas da atmosfera que
são eletrizadas, sendo denominada esta camada de “ionosfera”.
Refletindo-se sucessivamente nestas camadas e também na terra,
conforme mostra a figura 2, as "ondas curtas podem alcançar enormes
distâncias.
13
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
É por este motivo que sintonizando as ondas curtas de um rádio
você pode à noite ouvir estações de outros países, muito distantes. As
ondas curtas correspondem a frequências entre 1,6 MHz e 28 MHz, ou
seja, entre 1 600 000 vibrações por segundo e 28 000 000 de vibrações
por segundo.
Existe ainda um outro tipo de emissão que já está tornando-se
popular em nosso pais que é a emissão em FM (frequência modulada).
Com este tipo de emissão pode-se obter muito melhor qualidade de som
que no AM, mas o alcance deste tipo de emissão é limitado a 100 ou
200 km dependendo da existência de obstáculos para a propagação das
ondas tais como montanhas ou prédios, conforme mostra a figura 3.
14
NEWTON C. BRAGA
E como o rádio pode receber tais ondas?
As perturbações eletromagnéticas que atingem um fio qualquer
em seu caminho como, por exemplo, a antena de um rádio pode induzir
no mesmo uma corrente de mesma frequência. Se esta corrente for
levada a um aparelho especial que a amplifique e dela extraia a
informação que leva, pode-se ouvir a emissão original, ou seja, a
emissão distante.
Entretanto, um rádio não é tão simples em primeiro lugar
porque a antena recebe as ondas de todas as estações que estejam
transmitindo e que a atinjam, e em segundo lugar porque as correntes
geradas pelas ondas são muito fracas. Como fazer isso será estudado
posteriormente porque agora temos ainda uma pequena explicação a
dar: como podem as ondas de rádio levar a informação que corresponde
a um som como, por exemplo, a voz de um locutor ou cantor ou a
música de um instrumento ou orquestra?
Os sons correspondem também a vibrações, mas estas não são
elétricas. Os sons são ondas compressão e descompressão do ar de
15
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
frequências muito mais baixas que as ondas de rádio. Os sons que
podemos ouvir têm vibrações compreendidas entre apenas 15 Hz e 20
000 Hz, aproximadamente, ou seja, milhares de vezes menores que as
ondas de rádio.
Para fazer uma onda de rádio “levar” estas vibrações são usados
processos especiais denominados “modulação”. Existem dois tipos de
modulação que dão nome aos tipos de emissões de rádio que existem:
modulação em amplitude ou amplitude modulada que dá a sigla AM, e
modulação em frequência ou frequência modulada que dá a sigla FM.
Vejamos como funciona cada uma delas:
Na modulação em amplitude o que se faz é variar a intensidade
da corrente que produz a onda de rádio na antena da estação
transmissora do mesmo ritmo do som que se deseja emitir. Assim, ao
transmissor é ligado um amplificador que controla sua potência. Na
modulação em frequência, o que se faz é variar a frequência dos sinais
emitidos acompanhando as variações do som que se deseja levar ao
receptor.
As técnicas sendo diferentes exigem também o emprego de
circuitos especiais nos rádios para que os sinais sejam depois
separados. Uma vez separados estes sinais moduladores eles podem ser
amplificados no rádio e levados ao alto-falante reproduzidos.
16
NEWTON C. BRAGA
Ligação de microfones em
transmissores
Normalmente os transmissores são usados para transmitir a voz
de um único operador que nele liga um microfone. Diversos são os
tipos de microfones existentes no comércio e com características que
nem sempre combinam com as dos transmissores. O resultado de um
“desacordo” de características é uma transmissão ruim com distorção,
falta de modulação, perda de potência e outros problemas.
Como ligar um microfone a um transmissor, ou melhor, ao seu
modulador?
Isso é o que veremos nas linhas seguintes com alguns circuitos
práticos bastante simples, úteis e interessantes. O microfone mais usado
nos pequenos transmissores é o de eletreto que pode ter dois ou três
terminais. Este tipo de microfone possui um transistor de efeito de
campo interno que funciona como amplificador. Por este motivo ele
precisa ser polarizado para funcionar. Isso é feito por meio de um
resistor externo que lhe aplica tensões entre 1 e 10 Volts. O sinal é
derivado para o circuito externo por meio de um capacitor.
Na figura 94 temos dois circuitos de ligação de microfones de
eletreto, para dois e três terminais.
17
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
O valor do resistor depende da tensão de alimentação.
Estes circuitos funcionam com a maioria dos pequenos
transmissores, ligado diretamente ao oscilador ou então em
transmissores maiores, excitando o amplificador modulador. O valor do
capacitor determina a resposta de graves, ficando tipicamente entre 100
nF e 10 uF. A sensibilidade destes microfones é grande e seu tamanho
reduzido o que facilita sua aplicação em pequenos transmissores.
Um segundo tipo de microfone que podemos encontrar em
transmissores é o de cristal. Este microfone tem uma alta impedância e
boa sensibilidade podendo ser ligado diretamente em alguns pequenos
transmissores ou na entrada dos circuitos moduladores. Na figura 2
temos o aspecto de um microfone deste tipo.
18
NEWTON C. BRAGA
Observe que ele não precisa de polarização externa, ou seja, de
alimentação.
Este tipo de microfone possui uma limitação que o torna crítico
no uso em transmissores portáteis: ele é sensível ao calor e umidade
perdendo sensibilidade e apresentando distorções. Uma improvisação
comum para microfones consiste no uso de um pequeno alto-falante.
Os Alto-falantes quando recebem som produzem pequenas
correntes elétricas funcionando como microfones de baixa impedância.
Para termos um bom rendimento com um alto-falante usado como
microfone e preciso aumentar a sua impedância. Para isso o recurso
mais usado é o do transformador, conforme mostra a figura 3.
19
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
O transformador pode ser do tipo de saída para transistores em
que a impedância de primário varia entre 200 e 1000 ohms, ou então
um tipo de velhos aparelhos a válvula onde a impedância de primário é
de 500 a 5000 ohms. Nos dois casos a nova impedância será a do
primário do transformador.
Uma possibilidade de se usar o alto-falante como microfone
consiste no uso de um circuito adaptador de impedância conforme
mostra a figura 4.
20
NEWTON C. BRAGA
É importante observar que a curva de resposta de um
alto-falante como microfone e pobre o que significa que sempre que
possível devemos usar um microfone real e não este componente que
consiste numa solução de emergência.
Um circuito muito interessante usado em transmissores de
telecomunicações é o chamado “microfone de ganho" ou "mike de
ganho". O que este circuito faz é estreitar a faixa de áudio transmitida,
o que não afeta a inelegibilidade da voz, mas só serve para este tipo de
comunicação. Com isso, podemos concentrar a potência do transmissor
numa faixa mais estreita e com isso aumentar seu alcance.
Na figura 5 temos um circuito simples de microfone de ganho
que o leitor pode montar sem muita dificuldade para seu transmissor de
radioamador.
21
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Como em todas as montagens de áudio na entrada de
transmissores duas precauções são muito importantes para se garantir o
perfeito funcionamento do aparelho:
A primeira delas refere-se a filtragem e desacoplamento da
fonte. A filtragem deve ser feita da melhor maneira possível para que
não ocorram roncos. A segunda precaução é a blindagem do circuito e
de todos os condutores por onde passam os sinais de áudio. Estes fios
devem ser blindados, curtos e a malha externa devidamente aterrada. Se
mesmo assim o ronco ainda aparecer num circuito deste, podemos
pensar em blindar todo o aparelho com uma série de folhas de metal
aterradas ou mesmo instalá-lo em caixa separada. A fonte de
alimentação para este circuito pode ser a mesma do transmissor, já que
o consumo de corrente é muito baixo.
Outro equipamento de modulação muito importante na operação
de um transmissor experimental de radiodifusão é a mesa de som ou
22
NEWTON C. BRAGA
mixer. Para transmitir o som de microfones, toca-discos, gravadores e
de outras fontes de sinal precisamos de um eficiente circuito de
comutação e mixagem dos sinais de áudio. Na figura 6 temos um mixer
de 4 entradas o que permite ligar dois microfones, um toca-discos e um
toca-fitas.
O transistor usado é o BC549 de baixo nível de ruído e
alto-ganho, já que esta montagem exige este tipo de componente. As
entradas têm boa sensibilidade, mas eventualmente se o microfone for
pouco sensível precisaremos de um pré-amplificador intercalado,
conforme mostra a figura 7.
23
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Algumas observações em relação à montagem:
Todas as ligações por onde passam os sinais como, por exemplo,
dos jaques de entrada e de saída devem ser feitas com fios blindados e
as malhas devidamente aterradas. Será interessante usar uma caixa
metálica que possa servir de blindagem adicional para o aparelho. A
alimentação deve ser feita preferivelmente por pilhas ou bateria
minimizando-se desta forma os problemas que possam ocorrer de
roncos gerados por uma filtragem deficiente. Os fios aos
potenciômetros devem ser diretos, curtos e blindados para que não
ocorram captações de ruídos, roncos ou instabilidades de
funcionamento.
Para usar o aparelho é preciso determinar em cada
potenciômetro o melhor ajuste que dê um sinal puro na saída sem
distorções. Se a fonte de sinal for muito forte pode ocorrer a saturação
logo no início do ajuste. Neste caso devemos usar um atenuador que
pode ser um ou mais resistores, conforme mostra a figura 8.
24
NEWTON C. BRAGA
Mais canais podem ser agregados a este projeto bastando para
isso que as etapas de entrada sejam reproduzidas em maior quantidade.
Um recurso muito importante quando se fala em transmissão
experimental, principalmente na faixa de FM é a modalidade estéreo. A
mistura dos sons dos dois canais, de modo que eles possam ser
separados depois no receptor, ocorre segundo uma técnica denominada
“multiplexação”.
Os sinais são misturados de modo alternado numa frequência
que é da ordem de 19 kHz de modo que sincronizadamente possa ser
feita sua decodificação por um processo especial que opera chaveando
o sinal na mesma frequência, conforme sugere a figura 9.
25
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Os receptores de FM estéreo possuem todos os decodificadores
já calibrados para fazer a decodificação do sinal quando o identificam
pelo chamado “sinal piloto" de 19 kHz. Este sinal faz acender o LED
no painel quando está presente numa transmissão, indicando que ela é
estéreo.
Para podermos transmitir um sinal estéreo precisamos muito
mais do que misturar os sinais numa mesma entrada de um transmissor.
Precisamos multiplexá-lo por meio de um circuito especial que opere
justamente na frequência para a qual os receptores comuns de FM estão
preparados na decodificação. O circuito que damos a seguir é de um
simples codificador de FM estéreo que pode ser aperfeiçoado ou
mesmo usado da maneira indicada na transmissão de sinais para
receptores de FM comuns.
Uma pequena estação experimental de FM estéreo pode ser
montada com um de nossos transmissores, modulador, mixer e este
codificador. Na figura 10 temos o diagrama completo de nosso
26
NEWTON C. BRAGA
codificador estéreo, que deve trabalhar com sinais de pequena
intensidade como, por exemplo, as saídas de mixers e
pré-amplificadores. Nunca ligue a saída de amplificadores ou outros
circuitos de potência nesta entrada pois pode haver a sobrecarga e
queima do circuito.
A montagem deve ser feita em placa de circuito impresso cujo
desenho é dado na figura 11.
27
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Os circuitos integrados devem ser montados em soquetes para
se evitar problemas de calor nos terminais durante o processo de
soldagem. Todos os resistores são de 1/8 watt ou mais e os capacitores
eletrolíticos devem ter tensões de trabalho de 12 Volts ou mais.
A fonte de alimentação deve ter filtragem perfeita para que não
ocorram roncos na transmissão. Como o consumo de corrente é muito
baixo, uma sucessão de filtros na fonte e um desacoplamento muito
bom são fáceis de obter. A montagem numa caixa metálica ajuda a
superar problemas de blindagem.
O único ajuste que temos para o funcionamento é da frequência
do sinal piloto feito em P1. Ele deve ser ajustado até que a lâmpada
28
NEWTON C. BRAGA
indicadora de estéreo do receptor acenda. Veja que isso pode ocorrer
em várias posições pois o circuito pode responder a harmônicas. O
leitor deve escolher a que dê a reprodução estéreo. Para isso sugerimos
injetar sinais de frequências de áudio diferente nas entradas, de modo a
se verificar melhor a separação entre os canais.
Se houver tendência a aparecer ruído nos sinais transmitidos,
deve ser colocado um capacitor de desacoplamento de 10 nF a 220 nF
(o valor será obtido experimentalmente) da saída de áudio do
modulador à terra.
29
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
30
NEWTON C. BRAGA
LoRa e LoRaWAN
Com a ampliação das aplicações em IoT além de outras que
incluem o mundo agro, monitoramento de pessoas e animais, fitness,
medicina, a necessidade de uma comunicação de dados a longa
distância tem seu foco em LoRa e LoRaWan. Neste artigo, damos o
básico sobre o assunto para os leitores que desejam entrar no mundo de
seus projetos e precisam de conceitos básicos ou de informações
adicionais.
Nosso artigo é baseado em documentação da Semtech, criadora
dessa tecnologia.
Quando se fala na comunicação de dados sem fio, esbarra-se
numa limitação que já abordamos em nosso site. Essa limitação é dada
pelo teorema de Shannon. Como se sabe, a quantidade de dados que
pode ser transmitida através de um canal está limitada a largura desse
canal. Por outro lado, sabemos que, se vamos transmitir maior
quantidade de dados, precisamos alargar o canal e com isso a potência
utilizada na transmissão se distribui por um espectro maior, limitando
assim o alcance.
As tecnologias de comunicação digital levam em conta isso:
tanto maior a taxa de dados a ser transmitida, mais potência precisamos
para obter um determinado alcance. Assim, se comparamos as
31
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
tecnologias mais comuns, vemos que através de determinadas
tecnologias podemos obter dispositivos com diversos desempenhos, e
que encontram sua gama própria de aplicações em nossos dias.
Assim, temos o telefone celular convencional que possui longo
alcance (graças ao uso das ERBs), pode trabalhar com taxas elevadas
de dados, mas que precisando de maior potência, tem uma autonomia
menor para sua bateria.
Temos o Wi-Fi ou Local Area Network que tem pequeno
alcance, trabalha com taxas elevadas de dados, seu custo é médio, mas
ainda tem uma durabilidade de bateria (no caso em que é usada)
pequena. Também temos a NB-IoT ou Narrow Band IoT (Internet das
Coisas de Banda Estreita) que é utilizada em dispositivos fixos,
pequeno alcance com baixa taxa de dados. A baixa taxa de dados
permite o uso de pequenas potências e com isso se obtém boa
autonomia para a bateria.
Também incluímos no grupo o Bluetooth que se enquadra em
uma Personal Area Network ou rede de área pessoal. Com muito
pequeno alcance, baixa taxa de dados e baixo custo, ela proporciona
uma boa autonomia para a bateria.
Uma outra tecnologia importante é a Cat-M1 que apresenta
características de longo alcance, alta taxa de dados, alto consumo de
bateria e custo médio. Mas, o destaque é para a LoRa que se enquadra
32
NEWTON C. BRAGA
no que se denomina que apresenta características de Longo Alcance
(Long Range, como o nome já indica), baixa taxa de dados, longa
duração para bateria, baixo custo e alta capacidade para a quantidade de
dispositivos. É dela justamente que vamos tratar agora.
O que é LoRa e LoraWAN
LoRa consiste numa tecnologia de modulação que permite a
elaboração de sistemas de comunicação de dados em redes cobrindo
grandes áreas (LPWAN) ou WA significa Wide Area ou área ampla e
LP vem de Low Power e N de Network – rede)
LoRa foi criada pela Semtech para padronizad as LPWAN
proporcionando um alcance de até 5 km em áreas urbanas e 15 km em
áreas rurais. A característica-chave desta tecnologia é a baixa potência.
Alguns dispositivos podem usar baterias que podem durar até 10 anos.
Algumas características destacadas:
a) Longo alcance, incluindo a penetração dos em edifícios com
muitos andares. Topologia em estrela para a rede.
b) Longa duração para a bateria, chegando a 10 anos.
c) Alta capacidade, podendo ser aviadas milhões e mensagens por
estação base/gatway
d) Infraestrutura mínima, software open-source
33
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
e) Localização: dentro e fora de ambientes, preciso sem o uso de
GPS.
f) Roaming
g) Segurança: AES-128, ID único
Analisando essas características, podemos destacar a alta
durabilidade da bateria dada pela possibilidade de se transmitir
pequenos pacotes de dados poucas vezes por dia. Além disso, quando
os dispositivos estão em repouso (sleep) o consumo é extremamente
baixo. Outra característica importante é que uma rede LoRaWAN pode
suportar milhões de mensagens. Com isso, até 60 000 dispositivos
podem ser utilizados, e com 10 gateways pode chegar a 100 000
dispositivos e 1 milhão de mensagens.
A modulação dos sinais
A modulação utilizada é uma variação da tecnologia Chirp
Spread Spectrum (CSS) derivada da técnica de modulação em espectro
espalhado (veja artigos no site). Com essa tecnologia temos um
compromisso entre a sensibilidade e a taxa de dados, ao mesmo tempo
operado num canal de largura fixa entre 125 kHz e 500 kHz para o
uplink e 500 kHz para o downlink. Com esse compromisso obtemos
uma maior durabilidade para a bateria.
Na figura temos a organização das camadas de dados utilizadas.
34
NEWTON C. BRAGA
Figura 1 – O sistema utiliza 7 camadas de dados
Na figura 2 temos o modo como sinal é utilizado no sistema
DSSS (Direct Sequence Spread Spectrum).
Figura 2 – A distribuição do sinal ao longo do espectro
35
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
É nessa alteração dos dados com sua multiplicação da sequência
de dados que justamente se obtém maior alcance. Com esse recurso
temos maior ganho e menor relação sinal-ruído no receptor e com isso
é possível manter menor nível de saída de sinal com maior alcance
quando comparamos, por exemplo, a outras tecnologias de modulação
como a FSK.
Os parâmetros regionais
Para cada região temos parâmetros próprios definidos em
documento que pode ser acessado em:
[Link]
nal-parameters
Os elementos de uma rede LoRaWAN
Na figura 3 temos os elementos básicos de uma rede LoRa com
topologia em estrela.
36
NEWTON C. BRAGA
Figura 3 – Topologia em estrela (fig do livrio do Luiz Henrique)
Para a criação de uma rede LoRa existem duas possibilidades.
Pode-se fazer uso de uma rede pública que é mantida por uma
operadora, a qual disponibiliza o acesso a quem desejar. Por outro lado,
existe a possibilidade de se implementar uma rede particular que é
criada por alguém que faz seu uso restrito.
Mas, o principal problema que temos hoje está na distribuição
das frequências do espectro que podem ser utilizadas. Milhões, ou
esmo bilhões de dispositivos estão compartilhando uma faixa limitada
do espectro eletromagnético devendo, portanto, haver uma distribuição
muito bem definida. Assim, os governos dos países criam normas e
regras para o uso do espectro e pequenas diferenças podem ocorrer.
Assim, as frequências destinadas a operação das redes LoRa
num país podem ser diferentes de outros. Isso é muito importante para
os projetistas que devem então escolher os circuitos que sejam
37
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
permitidos nos locais em que pretendem vender seus produtos. No
Brasil, as normas são estabelecidas pela Anatel, devendo ser
consultadas, portanto, se você pretende criar um produto.
Assim, temos o ato 1448 publicado em 2017 que regulamenta a
tecnologia LoRa no brasil e que pode ser consultado em
[Link]
017/1139-ato-14448
Para a américa latina a faixa de frequências vai de 915 MHz a
928 MHz, o denominado padrão Australiano de 923 MHz.
Voltaremos oportunamente em outro artigo com uma análise
mais profunda do modo como as redes LoRa podem ser
implementadas. Também estaremos lançando em breve o livro: IoT
com RedFox de Luiz Henrique Correa Bernardes que traz uma
abordagem prática para a implementação de produtos IoT usando
Sigfox numa rede LPWAN.
38
NEWTON C. BRAGA
Tipos de antenas
Na recepção de ondas eletromagnéticas são usadas antenas de
diversos tipos. Neste artigo, tirado de um livro nosso que trata
especificamente de antenas de TV para a faixa de VHF e UHF,
analisamos alguns tipos de antena. Se bem que a TV analógica já tenha
sido substituída pela TV digital, o artigo tem valor didático e histórico,
pois os fundamentos usados nas antenas descritas são válidos para
outros tipos de antenas.
Os tipos de antenas
Em artigo anterior do mesmo autor tivemos informações
teóricas básicas que nos mostraram que uma antena consiste num
conjunto de varetas condutoras cuja quantidade e dimensionamento
depende não só das frequências que desejamos captar, ou seja, dos
canais, como também do ganho e diretividade.
A diretividade é a capacidade que uma antena tem de receber
com mais facilidade os sinais que venham de determinada direção e
rejeitar os que não venham dessa mesma direção. Em função disso
existem muitos tipos de antenas disponíveis no comércio, e mesmo a
possibilidade de montarmos algumas, se bem que esta prática não seja
recomendada em muitos casos pelos seguintes motivos:
39
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
a) Se a antena tiver muitos elementos, sua construção além de
difícil exige recursos de ferramentas e materiais que nem sempre são
simples. É preciso ter uma boa oficina com ferramentas para trabalhar
em metais como o corte de alumínio para se montar as varetas.
b) O custo de uma antena pronta e rigorosamente dimensionada
pelo fabricante com ganho e características adicionais importantes pode
ser muito menor do que a do material que utilizamos para montar uma
igual em casa. A produção em massa, quando o fabricante pode obter
bons preços comprando o material em quantidade, permitem isso.
Assim, a não ser que o leitor realmente queira fazer algum tipo de
experiência com a montagem de uma antena, o melhor mesmo é
adquirir uma pronta e concentrar seu trabalho numa atividade muito
mais proveitosa: instalar esta antena de modo que ela lhe proporcione a
melhor recepção.
Os casos em que a montagem de uma antena pode ser indicada
são aqueles em que a antena pode ser suficientemente simples para
poder ser feita com material comum que não precisamos "sair atrás*.
Assim, em relação aos tipos de antenas, elas podem ser classificadas da
seguinte maneira:
• Com relação ao formato, que designa o tipo específico de
antena se é um dipolo simples, yagi, log periódica, parabólica, etc.
40
NEWTON C. BRAGA
• Com relação ao número de elementos, que está associado ao
rendimento e diretividade da antena.
• Com relação ao tamanho, que determina a faixa de canais que
esta antena pode captar.
Vamos analisar os principais tipos, lembrando o leitor que,
conhecendo-os, será fácil escolher a melhor antena para sua casa ou
para a aplicação visada.
Dipolo simples
Dois fios condutores, que tenham um dimensionamento que
corresponda a 1/4 do comprimento de onda do canal sintonizado,
conforme mostra a figura 1 formam uma antena dipolo simples.
Esta antena é direcional no sentido de que ela recebe com maior
facilidade os sinais que venham segundo uma direção perpendicular às
varetas. Para os sinais que venham na mesma direção das varetas, o
rendimento é mínimo. Como esta antena não tem recursos que
concentrem os sinais, como diretores e refletores, ela não é indicada
41
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
para locais de sinais fracos, ou seja, para captar estações fracas ou
distantes.
Se o leitor quiser improvisar uma antena deste tipo em sua casa,
uma antena interna num apartamento não muito longe da estação, basta
prender dois fios na parede, conforme mostra a figura 2.
Os tamanhos dos fios são obtidos dividindo 300 000 000 pela
frequência do canal e depois o resultado por 4. O valor obtido, em
metros, dá o comprimento total da antena. Para o canal 5, por exemplo,
o comprimento da antena será:
300 000 000/79 000 000 = 3,797
Dividindo o resultado por 4:
3,97/4 = 0,94 metros
Obs: o valor 79 000 000 corresponde à frequência central do
canal que vai de 76 a 82 MHz.
42
NEWTON C. BRAGA
Este mesmo tipo de antena pode ser usado em aparelhos de FM,
com bom rendimento. Veja que esta disposição de elementos
corresponde justamente à que obtemos com uma antena interna. Assim,
além do posicionamento da antena, é importante ajustar o comprimento
da vareta no sentido de se obter a melhor recepção.
Dipolo dobrado
Um tipo de antena simples, e que pode também ser fixada numa
parede, ou mesmo montada com fios rígidos, para receber um canal que
não esteja muito longe e nem seja muito fraco, é o dipolo dobrado
mostrado na figura 3.
Esta antena recebe melhor os sinais que venham segundo um
plano perpendicular ao que a define. No mesmo plano, os sinais são
rejeitados. Seu dimensionamento deve ser tal que, de ponta a ponta, ela
21 deve ter metade do comprimento de onda do canal que deve ser
recebido. Assim, para o canal 5, a antena terá 1,98 metros.
43
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Uma característica importante deste tipo de antena é que sua
impedância é de 300 ohms, o que permite usar a linha paralela na sua
conexão, aceita pela entrada da maioria dos televisores. Veja,
entretanto, que o maior ganho desta antena ocorre numa única
frequência, o que significa que ela é interessante apenas para o caso de
o leitor ter dificuldades em receber, por exemplo, um determinado
canal com uma outra antena e desejar esta somente para ele.
Antena yagi
Evidentemente, se temos espaço no telhado para colocar algo
mais do que um simples dipolo, e se uma antena com mais elementos
significa maior ganho, maior diretividade e a possibilidade de
captarmos mais canais com maior rendimento em todos eles,
certamente esta deve ser a opção do instalador.
O primeiro tipo de antena multielementos que vamos analisar é
a Yagi, que foi desenvolvida por um engenheiro japonês que lhe dá o
nome, no início deste século, e que até hoje é usada com bom
desempenho. Esta antena, conforme mostra a figura 4, em sua versão
mais simples, contém um dipolo dobrado como elemento principal
onde é ligado ao cabo de descida.
44
NEWTON C. BRAGA
Na parte da frente da antena, ou seja, da direção em que chegam
os sinais, são colocadas duas varetas com comprimentos um pouco
menores que metade do comprimento da onda, e, portanto, menor que o
dipolo, denominados diretores. Na parte traseira são colocados dois
elementos um pouco maiores que o dipolo, e que são denominados
refletores. A finalidade dos diretores é concentrar os sinais que chegam
no dipolo, enquanto a finalidade dos refletores é refletir de volta para o
dipolo os sinais que conseguem passar por ele.
Os elementos do diretor e do refletor são normalmente 5% mais
curtos e mais longos, respectivamente, que o dipolo. O afastamento dos
diretores e dos refletores em relação ao dipolo não é aleatório, mas
deve ser calculado. Normalmente o distanciamento do diretor é de 0,15
do comprimento de onda do canal para o qual a antena é dimensionada,
e do refletor de 0,25.
Com este distanciamento obtém-se uma maior impedância, a
diretividade é máxima e o ganho menor, com a possibilidade de receber
45
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
uma faixa mais larga de frequências. Já, afastando-se os diretores de 0,1
do comprimento de onda e o refletor de 0,15 desse comprimento,
estreitamos a faixa de frequências, passamos a ter uma impedância
menor, e a diretividade é menor. No entanto, o ganho passa a ser
máximo.
Nos tipos comerciais, como o mostrado na figura 5, em que
temos diversos diretores, estas distâncias são calculadas de modo que a
faixa de canais recebidos seja a de VHF completa, ou ainda dos canais
baixos ou altos.
A impedância da antena também normalmente é fixada em 300
ohms, que corresponde aos cabos de descida mais comuns. Veja então
que as antenas Yagi não são todas iguais e que na sua escolha devemos
fazer as seguintes considerações:
46
NEWTON C. BRAGA
a) Que faixa de frequências ela capta, ou seja, se o tipo que
desejamos "pega" todos os canais ou somente os canais altos ou baixos.
b) Qual é o seu ganho? A antena tem elementos suficientes para
captar todos os canais que desejamos no local em que pretendemos
instalá-la? Não seria talvez necessário usar duas antenas para faixas
separadas com maior ganho em lugar de uma só, com um ganho menor
que não receberia da maneira desejada todos os canais?
Concluindo nossas observações sobre este tipo de antena, o que
ocorre quando colocamos muitos elementos diretores para que sua
diretividade e ganho aumente, é que a impedância fica reduzida, não
mais se casando com os cabos que pretendemos usar. Uma maneira de
corrigir isso é a diminuição do diâmetro dos elementos do dipolo,
conforme mostra a figura 6.
47
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Antena cônica
A antena cónica também popularmente conhecida como "pé de
galinha" é uma das mais populares, pois além de ser simples e barata
apresenta um bom rendimento nas localidades de sinais razoáveis em
toda a faixa de VHF.
Na figura 7 temos o aspecto desta antena que possui dois
conjuntos de varetas.
O primeiro conjunto forma dois leques com três varetas cada um
e corresponde aos elementos ativos onde é ligado ao cabo de descida.
Este leque tem uma abertura de 40 graus e sua finalidade é ampliar a
faixa de frequências da antena. O segundo par de leques forma o
elemento refletor, que reflete de volta os sinais que passam pelos
48
NEWTON C. BRAGA
elementos ativos, aumentando assim o ganho da antena e
proporcionando maior diretividade.
A impedância desta antena é de 300 ohms e a grande vantagem
na sua utilização está no bom rendimento nos canais de VHF em toda a
faixa, do 2 ao 13. No entanto, para que ela tenha bom rendimento na
captação de todos os canais é preciso que todas as estações estejam na
mesma direção, o que nem sempre ocorre, principalmente em grandes
cidades como São Paulo.
Observe que nesta antena, assim como nas demais, os elementos
ativos devem ser isolados, mas os diretores e os refletores não. Assim,
estes podem ser fixados diretamente na gôndola, que é elemento de
sustentação de toda a antena.
Log periódica
Esta antena, pela sua aparência, recebe o nome popular de
"espinha de peixe"' e é mostrada na figura 8.
49
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Nesta antena temos conjuntos de varetas de tamanhos que vão
aumentando da parte da frente para a parte de trás, ligados de forma
alternada, como mostra a própria figura. Os elementos são
dimensionados de tal forma que cada par de varetas funciona como um
dipolo para uma determinada frequência.
Assim, quando vamos sintonizar o canal 5, por exemplo, as
varetas que correspondem a este canal atuam como elementos ativos,
ou seja, como dipolos. As varetas que estão na sua frente, por serem
menores, funcionam como diretores, concentrando o sinal e
determinando o ganho, e o par de varetas imediatamente atrás, por ser
maior, funciona como refletor. Isso significa que cada par de varetas é
um dipolo para uma frequência, enquanto as varetas que estão a sua
frente funcionam como diretores para aquele canal, e as que vem
depois como refletores.
Podemos então, colocando varetas em quantidade apropriada,
ter antenas que captam qualquer faixa de frequências, ou seja, todos os
canais que desejarmos, com excelente ganho. Esta característica deste
tipo de antena a torna a mais popular de todas em nossos dias, para a
recepção dos canais de VHF.
50
NEWTON C. BRAGA
Antena selada
Trata-se de um tipo de antena também muito popular em nossos
dias, que combina as características da antena yagi e da In periódica, e
por elevado ganho é recomendada nas localidades em que os sinais
chegam fracos, quer seja porque as emissoras são fracas, quer seja
porque estejam distantes. Na figura 9 temos o aspecto desta antena.
O nome selado se deve ao fato de que as ligações entre as
varetas que formam os elementos que são ativos, conforme os canais
sintonizados, ficam no interior da gôndola que sustenta a antena, e por
isso estão protegidas do tempo. Esta antena possui diversos dipolos que
são ligados da mesma forma que numa antena log periódica, mas
51
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
também possui elementos passivos como diretores e refletores que
operam exclusivamente nestas funções.
52
NEWTON C. BRAGA
Ondas T ou radiação
submilimétrica
Com a chegada da 5ª geração das comunicações móveis, a 5G, e
já se falando em 6G, a possibilidade de se utilizar frequências cada vez
mais elevadas, leva à discussão as dificuldades tecnologias que vão ter
de ser superadas quanto ao comportamento dos sinais que devem ser
emitidos e recebidos com a maior eficiência possível. Fala-se então nas
ondas T raios T ou ondas submilimétricas na faixa dos Terahertz (1
Terahertz equivale a 1012 ou 1 000 000 000 000 Hz).
Até os nossos dias estamos usando de maneira convencionais
sinais de rádio que estão em faixas cujo comportamento não foge a um
padrão comum que todos conhecemos. São os sinais de frequências do
espectro eletromagnético até pouco mais de uma dezena de 1 Terahertz
e que conhecemos como espectro das ondas de rádio ou espectro de
rádio, conforme mostra a figura 1
53
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 1 – O espectro de rádio termina na faixa de microondas
pouco acima de 1 Terahertz.
Na realidade não existe um ponto exato de transição. Na região
em que chegamos a 1 Terahertz começamos a ter uma transição mais
acentuada no comportamento dos sinais. As ondas de rádio que podem
ser trabalhadas pelos dispositivos emissores e receptores com antenas,
deixam de ter um comportamento que permita isso e passam a ter um
comportamento que tendem muito mais ao da radiação, da luz visível e
da radiação ultravioleta, regiões seguintes do espectro.
Isso significa que fenômenos comuns aos sinais de rádio que
estudamos em nossos cursos de telecomunicações devem ser abordados
de uma forma diferente. A ITU (International Telecommunication
Union) fixa as ondas T ou ondas submilimétricas na faixa de 0,3 a 3
Terahertz (300 a 3 000 GHz). As faixas de 90 GHz a 1 |THz já estão
sendo reservadas para estas aplicações na 6G.
54
NEWTON C. BRAGA
Banda Frequência WR-Size
F 90 GHz-140 GHz WR-8
D 110 GHz to 170 GHz WR-6
G 140 GHz to 220 GHz WR-5
G 170 GHz to 260 GHz WR-4
G 220 GHz to 325 GHz WR-3
Y 325 GHz to 500 GHz WR-2
Y 500 GHz to 750 GHz WR-1.5
Y 750 GHz to 1100 GHz WR-1
até 3000 GHz (3 Terahertz)
Os comprimentos de onda correspondentes a estes sinais já nos
permitem avaliar como estes sinais se comportam. Para sinais em
frequências relativamente baixas, como os das ondas curtas e VHF os
problemas são pequenos em relação aos objetos do nosso mundo
ambiente. Esses sinais podem contornar a maioria dos objetos e
refletir-se apenas nos maiores. A refração ocorre de uma maneira que
pode ser manuseada com facilidade e até utilizada com finalidades
55
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
práticas. Os sinais também atravessam com facilidade a maioria dos
objetos. (figura 2)
Figura 2 – Refração de sinais em camadas de ar quente
No entanto, à medida que a frequência aumenta, cada vez mais
temos um comportamento que se aproxima da luz. Quando chegamos
na faixa das microondas, os sinais já começam a ter comportamentos
que se assemelham ao da luz.
As microondas podem ser conduzidas como a luz através de
fibras ópticas. São as guias de onda, que pelas suas dimensões
funcionam nessa faixa, mas não poderiam operar com ondas de maior
comprimento, devido às dimensões que deveria ter. A figura 3 mostra
uma guia de onda.
56
NEWTON C. BRAGA
Figura 3 – As guias de onda
As guias de onda funcionam como “canalizações” para as
ondas, mostrando um comportamento diferente. Para a faixa dos
Terahertz temos comprimentos de onda inferiores a 1 mm, o que quer
dizer que uma antena convencional seria difícil de ser implementada. A
condução dos sinais pelo circuito também seria um problema a ser
analisado.
Uma maneira de se obter o rendimento necessário para os sinais
dos transmissores dos equipamentos, tais como os celulares, seria
incrementar a diretividade das emissões. Hoje se analisa o uso de
microantenas que seriam direcionadas da mesma maneira que se faz
com os dispositivos de microespelhos ou DMD de digital micromirror
device ou dispositivos de microespelhos digitais. Trata-se de uma
matriz de espelhos extremamente pequenos num chip, os quais podem
ser movimentados a partir de um sinal elétrico. Essa tecnologia foi
desenvolvida pela Texas Instruments.
57
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
O dispositivo pode ser usado também como memória óptica, já
que os espelhos permanecem na posição do último comando, mesmo
depois do sinal ter sido retirado. Na figura 4 um dispositivo desse tipo
trabalhando com luz em projetores de TV.
Figura 4 – Um chip DMD usado em projetores de imagem –
imagem Texas Instruments
Para a faixa do 6G dispositivos equivalentes serão usados para
direcionar os sinais das ondas T de modo a se ter maior rendimento na
recepção ou na transmissão. Dispositivos deste tipo seriam colocados
em uma distribuição ortogonal, como se faz com os sensores inerciais
de modo que eles seriam posicionados por comando elétrico sempre de
modo a estar alinhado com a direção de máximo sinal.
A ideia da tecnologia 6G é justamente essa. Pela dificuldade de
propagação das ondas T, o que resultaria em alcances pequenos,
58
NEWTON C. BRAGA
principalmente em áreas densamente povoadas, milhares de células,
colocadas em tudo que seja possível, atuem como estações repetidoras.
Com os microespelhos que na verdade seriam substituídos por
microantenas, o direcionamento em busca sempre do melhor sinal seria
automático e muito rápido, a ponto de não se perder o sinal numa
transição de estação, devido ao movimento. Mas, as ondas também
encontram outras aplicações além das comunicações, como no caso da
6G.
Essas ondas podem penetrar em certos corpos como, por
exemplo, o nosso e refletir-se em determinadas estruturas, com um
comportamento que lembra um pouco o do raio X, com a diferença de
que não ionizante. Lembramos que, à medida que a frequência de uma
onda eletromagnética aumenta, ela passa a apresentar um
comportamento quântico cada vez mais evidente. Os “pacotes” de
energia ou quanta em que os sinais podem ser divididos, transportam
quantidades cada vez maiores de energia.
Assim, com um valor suficientemente alto, como o que ocorre
com as frequências acima da radiação ultravioleta, essa radiação pode
romper ligações atômicas causando assim, no caso de seres vivos, a
destruição de células. Com as ondas T, isso não ocorre. Assim, podem
ser criados equipamentos de escaneamento de pessoas e mesmo objetos
com aplicações em segurança.
59
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
É claro que isso dependerá da criação dos dispositivos capazes
de emitir, receber ou ainda direcionar essas ondas. Na foto da figura 5
um transmissor/receptor 6G experimental. Já estão surgindo esses
componentes, conforme podemos ver nos exemplos abaixo.
Componentes para 6G na Mouser
Já estão surgindo esses componentes, conforme podemos ver
nos exemplos abaixo.
Figura 5 – Transmissor/Receptor 6G – imagem da internet
([Link]
60
NEWTON C. BRAGA
O receptor de rádio reflex
Conhecer um pouco da tecnologia antiga é fundamental para o
praticante da eletrônica moderna, principalmente aqueles que estudam
projetos que envolvem ideias pouco comuns. Muitas delas podem ser
adaptadas para fazer uso de tecnologias modernas, evitando assim a
necessidade de se “redescobrir” coisas que nossos antepassados já
conheciam. É o caso da tecnologia usada nos receptores reflex que
abordaremos neste artigo.
Para que o leitor tenha uma ideia de quão antiga é a tecnologia
do receptor Reflex nos baseamos num livro da editora de Hugo
Gernsback escrito por P. E. Feldman em 1924.
Figura 1 – A capa do livro
61
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Evidentemente o transistor ainda não existia, mas a ideia do
receptor reflex com transistor passou para a nova tecnologia como
vamos analisar neste artigo. Partimos então da estrutura de um receptor
antigo valvulado simples que usava uma válvula tríodo, conforme
mostra a figura 2.
Figura 2 – O receptor de amplificação direta
Nesse receptor, simplesmente sintonizava-se o sinal da estação
desejada usando um circuito LC (bobina e capacitor variável) e jogando
o sinal na grade de uma válvula tríodo ela o detectava e amplificava.
Era então possível ouvir a estação através de um fone magnético de alta
impedância ligado ao anodo da válvula. Se quiséssemos mais
sensibilidade aumentando o número de válvulas e, portanto, a
amplificação, havia duas possibilidades.
62
NEWTON C. BRAGA
A primeira consistia em detectarmos o sinal e o amplificarmos
com uma primeira válvula e depois jogar o sinal de áudio a uma
segunda válvula que proporcionaria nova amplificação, conforme
mostra a figura 3.
Figura 3 – Usando duas válvulas para amplificar o áudio
Era possível aumentar ainda mais o número de válvulas para se
obter sinal de intensidade suficiente até para excitar um alto-falante,
mas havia um problema. Com maior número de válvulas o circuito se
tornava instável ocorrendo instabilidades e realimentação com apitos e
outros problemas. Havia um limite para a amplificação desta forma.
Uma outra maneira consistia em se usar uma válvula para
amplificar o sinal de RF sintonizado, sem detectá-lo e depois de
amplificado, aí sim, ele era detectado e jogado na grade de uma nova
válvula amplificadora.
63
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Esta técnica também podia ser ampliada com o uso de mais
válvulas, por exemplo, duas de RF e duas de áudio, obtendo-se assim
um rádio de 4 válvulas com bom ganho, conforme mostra o circuito da
figura 4.
Figura 4 – Rádio com duas etapas de RF e duas de áudio
Observe que já tínhamos a dificuldade de ter dois circuitos
sintonizados na mesma estação, o que tornava difícil e crítico o ajuste.
O variável era duplo neste caso.
Mas, novamente entravam em cena alguns problemas como as
instabilidades e eventualmente a necessidade de se sintonizar cada
etapa de RF de forma independente. Algumas tecnologias tentavam
resolver esse problema antes do surgimento da melhor, a do receptor
super-heteródino que prevalece até hoje. Uma delas foi a do receptor
reflex de que trataremos neste artigo.
64
NEWTON C. BRAGA
O receptor reflex
Observou-se que nesses circuitos a válvula era usada para
amplificar sinais de RF ou então sinais de áudio. Porque não fazer com
que ela amplifique os dois ao mesmo tempo. Já que são diferentes?
Assim, nos anos 20 criou-se uma tecnologia denominada
“reflex” em que o sinal de RF era amplificado e detectado e depois
“refletido” para a entrada do circuito na forma de sinal de áudio e agora
amplificado novamente pelas mesmas válvulas. Para entender como
isso funciona, vamos pegar um circuito que trabalha com os dois tipos
de sinais, um amplificador simultâneo para sinais de áudio e RF,
mostrado na figura 5.
Figura 8 – Uma válvula amplificando sinais de áudio e RF
65
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Se isso funcionava, então seria possível aplicar a um receptor de
rádio. Chegamos então a um circuito como o mostrado na figura 9 que
permitirá ao leitor ter uma ideia de seu funcionamento.
Figura 9 – Um receptor reflex de uma válvula
Os sinais que são captados pela antena são levados a uma
bobina de acoplamento 1, sendo transferidos para a bobina 2 que forma
juntamente com o capacitor variável o circuito de sintonia.
Os sinais de RF da estação selecionada são aplicados
diretamente à grade da válvula tríodo, recebendo amplificação. No
entanto, na saída da válvula, ou seja, na placa, esses sinais encontram o
fone magnético de alta impedância e um capacitor de 0,002 uF (2 nF).
O fone é uma indutância elevada, não respondendo aos sinais de
RF, e então esses sinais passam pelo capacitor sendo aplicado a um
66
NEWTON C. BRAGA
transformador de alta frequência ou Radio Transformer como era
chamado.
Passando por esse transformador, os sinais de RF sintonizados
encontram o diodo detector. Feita a detecção, passamos a ter nesse
ponto sinais de áudio que são levados de volta à bobina 2. O capacitor
de 0,001 uF ou 10 nF faz o desacoplamento dos sinais de RF.
Encontrando a bobina 2 os sinais de áudio passam com
facilidade, pois essa bobina tem baixa indutância para a sintonia dos
sinais de RF. Passando através dessa bobina, chegam à grade da válvula
agora sinais de áudio que então são amplificados. Uma vez recebendo
amplificação eles aparecem nos fones, sem passar pelo capacitor em
paralelo, onde são amplificados.
Assim, com engenhosidade, uma válvula funciona duas vezes
como amplificadora, sendo uma vez para sinais de RF e uma vez para
sinais de áudio. Aperfeiçoamentos foram feitos com a utilização de
mais válvulas que então poderiam ter função dupla no circuito.
Na figura 10 temos um exemplo de receptor que usa duas
válvulas que funcionam como 4 contendo transformadores de rádio que
deixam passar sinais de RF e transformadores de áudio que deixam
passar somente áudio!
67
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 10 – Rádio reflex de duas válvulas
Fica o desafio para o leitor traçar o percurso dos sinais de RF e
de áudio neste circuito, até chegar no fone de ouvido. E a coisa foi mais
longe, com um circuito de 4 válvulas, usando antena de quadro. Neste
circuito fica mais percebemos o percurso dos sinais de rádio e de áudio
pelos transformadores diferentes. (figura 11)
68
NEWTON C. BRAGA
Figura 11 – Receptor de 4 válvulas
Com a chegada do transistor, a ideia de se usar um mesmo
transistor para amplificar sinais de RF e de áudio não foi esquecida.
Assim, tomamos na figura 12 um receptor reflex transistorizado.
Figura 12 – Receptor dos anos 70.
69
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Analisemos seu funcionamento. Os sinais de RF captados pela
antena e sintonizados pelo circuito de entrada passam para a base do
transistor onde são amplificados. No coletor do transistor temos então
esses sinais de RF que, encontrado o choque de 25 mH não passam
para o fone. No entanto, eles passam pelo capacitor de 100 pF
encontrando o detector formado pelos dois diodos.
Detectados temos agora sinais de áudio que passam para a base
do transistor onde recebem nova amplificação. O capacitor de 0,005 uF
(5 nF) faz o desacoplamento do RF. No coletor do transistor os sinais
de áudio não passam pelo capacitor de 100 pF, mas passam pelo choque
de 25 mH chegando ao transformador de onde são aplicados ao fone.
Versões elaboradas mais modernas podem até usar um circuito
integrado para amplificar o sinal de áudio. Diversos circuitos podem ser
encontrados em nosso site.
A série de artigos que apresentamos a seguir detalha o princípio
de funcionamento da TV digital. Esta série é de 2006 quando ainda não
estava definido o padrão de TV digital a ser usado em nosso país. No
entanto, ela é de grande valia para que se entenda o princípio usado na
transmissão digital que temos hoje em plena utilização.
70
NEWTON C. BRAGA
O padrão MPEG
Com a aproximação da data de definição do padrão de TV
digital que deve vigorar em nosso país, os profissionais da área se vêm
diante da necessidade de se aprofundar no conhecimento das técnicas
envolvidas (*). Apesar do farto noticiário que corre à respeito, a
documentação técnica que realmente ajude os profissionais a entender
melhor todo o sistema, assim como a literatura disponível, pode ser
considerada dispersa e vaga. Assim, ressaltando as raízes didáticas de
nossas publicações e site que foram as primeiras a abordar em
profundidade muitas tecnologias quando elas foram implantadas em
nosso país, iniciamos uma série de artigos sobre tudo que seja
relacionado com a TV digital, inicialmente focalizando os aspectos
gerais que não envolvem a definição de um padrão específico (**).
Muito do que estaremos levado ao leitor é baseado em ampla literatura
fornecida pela Tektronix ([Link]/video).
Uma das técnicas mais usadas de compressão de sinais de áudio
e vídeo é a conhecida como MPEG. MPEG não é apenas um simples
padrão, mas uma série de padrões que se adapta a diversos tipos de
aplicações que sejam baseadas no mesmo princípio de funcionamento.
MPEG significa Moving Picture Experts Group, que é uma parte do
71
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Joint Technical Committee (JTC1), estabelecido pela International
Electrotechnical Commision ou IEC.
O JTC1 é responsável pelos padrões que envolvem tecnologia
da informação, e dentro dele o SG29 é um outro sub-grupo responsável
pelo trabalho de codificação de áudio, filmes, informações multimídia e
hipermídia.
A necessidade da compressão
O grande obstáculo enfrentado para o armazenamento de grande
quantidade de informações, como a necessária para o caso de um filme,
é a limitação da mídia usada. Uma imagem digital comum gera 200
megabits de dados por segundo, o que significa uma enorme
capacidade de armazenamento da mídia, além de uma faixa passante
muito larga para sua transmissão.
Isso significa que, na sua forma original, o vídeo digital só pode
ser usado nos casos em que se dispõe de um sistema de transmissão
capaz de trabalhar com tais taxas de dados. A ideia básica da
compressão é expressar a mesma imagem original, mas usando menor
quantidade de dados. Isso significa comprimir os dados, o que nos leva
às seguintes vantagens:
● Necessita-se de menos espaço para o armazenamento da
informação
72
NEWTON C. BRAGA
● Trabalhando em tempo real, com a compressão pode-se reduzir
a largura de faixa necessária à transmissão.
● Com o registro do sinal comprimido, a mídia pode usar menor
densidade de sinal, o que a torna menos sensível à influência
externas.
Princípios de compressão
Existem duas técnicas básicas para se obter a redução da
quantidade de dados para se enviar uma informação. Na prática, as duas
formas são usadas, algumas vezes até combinadas de maneira
complexa. A primeira técnica visa aumentar a eficiência da codificação.
Os sinais de áudio e vídeo comuns contém uma grande
quantidade de informações redundantes, ou seja, de dados que na
realidade podem ser eliminados. Usados de forma apropriada os dados
comprimidos podem ser descomprimidos levando a recuperação total,
sem qualquer alteração na informação original.
Esse tipo de compressão em que a descompressão permite a
recuperação total da informação é denominada “sem perdas” ou
“loseless”. É claro que essas técnicas são as mais interessantes, mas
para sinais de áudio e vídeo, elas não proporcionam o grau de
compressão que seria desejável numa aplicação prática. Se mesmo com
a eliminação da redundância não se conseguir ainda uma compressão
73
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
nos níveis desejados para o sinal, deve-se apelar para um recurso
adicional que seria o descarte de parte das informações.
Obtém-se nesse caso um sistema em que a recuperação dos
dados não é total, mas ocorre com perdas ou “loss”. Para isso deve
existir algum meio de se identificar os dados de menor relevância que
possam ser eliminados sem prejudicar a qualidade do áudio ou vídeo
envolvidos. No caso específico da TV. a compressão com a
determinação do que é o que não é relevante nos dados deve levar em
conta o sistema visual e auditivo das pessoas.
Além disso, outros fatores típicos do comportamento humano
devem ser analisados. Um sistema de compressão que não recupere
esses dados, é dito “visually lossless”, ou seja, visualmente sem perdas.
Aplicações em TV
Sinais de televisão, quer seja na forma analógica ou digital,
transportam uma grande quantidade de informações, exigindo assim
uma faixa passante muito larga. Técnicas de compressão para esses
sinais já têm sido usadas há um bom tempo. O exemplo mais patente
dessa técnica é o que todos os técnicos conhecem por entrelaçamento.
Dois campos são transmitidos alternadamente de modo que suas linhas
sejam entrelaçadas, obtendo-se assim o quadro, conforme mostra a
figura 1.
74
NEWTON C. BRAGA
Figura 1 – Entrelaçamento usado na TV analógica
Como cada campo contém metade das linhas e, portanto,
metade da informação, ele precisa apenas de metade da largura de faixa
que seria necessária para a transmissão direta quadro a quadro da
imagem, na mesma taxa. No entanto, essa técnica dificulta a utilização
de sinais digitais.
Assim, muito da complexidade do MPEG-2 é resultante
justamente da necessidade de se trabalhar com sinais entrelaçados,
havendo uma perda significativa na eficiência da codificação
justamente por isso.
75
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Para os sinais em cores temos o triplo da informação a ser
transmitida, e tudo isso deve ser feito na mesma faixa de frequências.
As soluções foram adotadas em partes. A primeira consistiu em
transformar os sinais RGB em um sinal de brilho (denominado Y) e
dois sinais de diferença de cor (U-V e I-Q).
Essa solução demorou a ser encontrada devido à necessidade de
se manter a compatibilidade de recepção dos receptores
monocromáticos. Se analisarmos os “sensores” que temos no nosso
sistema visual, vemos que eles são de duas espécies, conforme mostra a
figura 2.
Figura 2 – Nosso olho
Temos sensores de brilho que permitem ver as imagens com alta
resolução e temos sensores de cores que têm muito menor resolução.
Assim, não adiante sobrecarregar um sinal que represente uma cena em
76
NEWTON C. BRAGA
baixo grau de iluminação com muita informação sobre cor, pois nossa
visão não será capaz de percebê-la. Em outras palavras, pode-se
remover a informação de alta frequência de cores de certas imagens,
pois nossa visão não responder a esses sinais quando reproduzidos.
A televisão no padrão NTSC tem uma largura de faixa de
apenas 500 kHz para os sinais diferença de cor, e mesmo assim as
imagens são suficientemente nítidas para a finalidade as que se
destinam. Trata-se de um exemplo interessante de remoção de
informação não relevante para se obter maior compressão dos sinais.
Outro recurso adotado no padrão NTSC e PAL é perder o sinal
diferença de cores das partes não usadas do espectro do sinal
monocromático. Na tecnologia digital, as técnicas utilizadas para se
obter compressão são mais sofisticadas. No caso do MPEG, por
exemplo, ele transforma os sinais em diferentes domínios de modo a
facilitar o isolamento das partes irrelevantes.
Na figura 3 temos o sistema tradicional analógico de TV e o
digital representados em blocos para maior facilidade de comparação.
77
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 3 – Blocos de um sistema de TV analógica e um digital
No sistema digital moderno, os sinais digitalizados passam por
um processo de codificação e compressão MPEG. Uma característica
importante do processo digital é que a taxa de transmissão pode ser
modificada conforme a aplicação. Com taxas baixas de transmissão,
por exemplo, ele pode ser usado em videoconferência e em videofones.
O Digital Video Broadcastong (DVB) e o Advanced Television
Systems Committeee (ATSC) – sistema europeus e americanos de TV
digital não são viáveis sem a compressão porque a largura de faixa
exigida é muito grande.
78
NEWTON C. BRAGA
Introdução à compressão de vídeo
digital
Num sinal de vídeo existem dois tipos de informações: as que
são imprevisíveis e as que são previsíveis. A primeira informação é
denominada entropia enquanto a segunda é denominada redundância.
Podemos citar como exemplo de redundância, uma área da
imagem que tem a mesma cor. Os pixels adjacentes são todos iguais.
Esse é um caso de redundância especial. Podemos citar como exemplo
de redundância temporal o caso de uma imagem que não muda ao
longo do tempo. Os sistemas de compressão operam separando a
entropia da redundância. Somente a entropia é gravada ou transmitida
ficando por conta de o decodificador computar a redundância. Na
figura 4 mostramos de uma forma simplificada como isso funciona.
Figura 4 – O processo de compressão
79
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Na prática adotam-se diversos processos, cuja complexidade e
velocidade se adaptam às aplicações visadas. Uma vantagem do MPEG
é a sua flexibilidade, pois ele contém uma quantidade de ferramentas e
recursos que permitem modificar sua velocidade e taxa de compressão
de acordo com a aplicação.
Existem, portanto, diversos formatos de vídeo digital, cada qual
operando com uma velocidade diferente. Por exemplo, um sistema de
alta definição (HDTV) tem seis vezes a taxa de transmissão de um
sistema comum.
No MPEG-2 e MPEG-4 os dados são divididos em diversos
conjuntos que têm complexidades diferentes de modo que cada um
pode ser implementado num nível diferente dependendo da resolução
da imagem. Um compressor ideal é extremamente complexo.
Um compressor prático pode ser bem menos complexo, tanto
por razões econômicas como para adequar à mídia que deve ser usada
para transmitir os dados. Na figura 4(b) temos uma relação entre
complexidade e a qualidade da imagem. Maior é o fator de compressão
exigida, mais complexo deve ser o compressor. Deve-se, portanto,
analisar a possibilidade de utilizar um canal com velocidade constante e
cortar a entropia quando precisa ser transmitida, com perda na
qualidade da imagem, ou trabalhar com um canal variável, de modo a
80
NEWTON C. BRAGA
aumentar sua capacidade quando uma cena de maior entropia precisa
ser transmitida.
Por motivos de maior facilidade de operação, muitas redes de
telecomunicações preferem a primeira opção, mas uma memória pode
ser usada para armazenar a informação que naquele momento não pode
ser enviada, enviando-a depois, nos intervalos de menor entropia.
Esse procedimento funciona quando a imagem não deve ser
reproduzida em tempo real, mas sim gravada. Se o movimento pode ser
medido, uma aproximação para a imagem seguinte pode ser criada,
deslocando parte da imagem anterior para uma nova posição. O
processo de deslocamento (shifting) é controlado por um par de valores
verticais e horizontais, denominados “motion vector” (vetor de
movimento) que é transmitido ao decoder.
O MPEG pode trabalhar tanto com imagens entrelaçadas como
não entrelaçadas. Uma imagem em determinado instante é sempre
denominada “picture” quer seja ela um campo ou um quadro.
A eficiência de um codificador temporal aumenta com o
espalhamento do tempo no qual ele pode atuar. Assim, se um alto fator
de compressão é necessário, um espalhamento do tempo na entrada
deve ser considerado e com isso um obtém-se maior tempo para a
codificação.
81
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Correntes MPEG
A saída de um codificador MPEG de áudio ou vídeo é
denominada uma corrente elementar. Uma corrente elementar é um
sinal sem fim perto do tempo real. Por conveniência, uma corrente
elementar pode ser quebrada em blocos de dados de tamanho que possa
ser manuseado, formando uma corrente elementar em pacotes (PES =
packetized elementary stream).
Esses blocos de dados precisam de uma informação de
cabeçario que os identifique, e incluam informações sobre tempo, pois
eles são deslocados no eixo dos tempos ao serem enviados. Na figura 5
temos um diagrama de blocos onde um PES de vídeo e um certo
número de PES de áudio são combinados para formar uma corrente de
programa.
Figura 5 – Blocos de PES de vídeo e PES de áudio são
combinados para se obter uma corrente de programa.
82
NEWTON C. BRAGA
Para transmissão, diversos programas e os PES associados
podem ser multiplexados num único meio. Trata-se de uma corrente de
transporte, que é diferente de uma corrente de programa, já que nela os
pacotes PES são subdivididos em pacotes menores de tamanho fixo e
os programas codificados com clocks múltiplos para serem
transportados.
Uma corrente de transporte para um único programa (SPTS)
também é possível. Cada corrente elementar deve ter o mesmo
identificador (PID), de tal forma que o decodificador ou o
demultiplexador possa separar os diversos programas.
Monitoramento e análise
O transporte MPEG tem uma estrutura extremamente complexa
usando tabelas interligadas e identificadores codificados para separar os
programas e as correntes elementares dentro dos programas. Dentro de
cada corrente elementar existe também uma estrutura complexa que
permite ao decodificador distinguir os diversos elementos que a
compõe como vetores, coeficientes e tabelas de quantização.
Problemas de sincronização, como perdas ou corrupção de
padrões de sincronismo, podem fazer com que uma corrente inteira de
transporte deixe de ser recebida. Protocolos de detecção de problemas
de transporte podem ajudar a evitar a perda total de dados, talvez
83
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
deixando de enviar a imagem, mas enviando o som. O envio correto de
dados, mas com jitter excessivo pode causar problemas de
temporização no decodificador.
As ferramentas tradicionais de teste de vídeo, o gerador de
sinais, monitor de formas de onda e o vetorscópio não são apropriados
para analisar um sinal MPEG, exceto para assegurar que os sinais que
entram e saem desse sistema estão com qualidade compatível.
Uma fonte apropriada de sinais de teste MPEG é essencial para
se analisar os equipamentos receptores e decodificadores. Com um
analisador apropriado, a performance de codificadores, sistemas de
transmissão, multiplexadores e demultiplexadores pode ser verificada
com um alto grau de confiabilidade.
Armadilhas da compressão
A compressão MPEG tem perdas, no sentido de que o sinal que
sai do decodificador não é igual ao que entra no codificador. A entropia
da fonte de sinal varia e quando ela é alta, o sistema de compressão
pode causar o aparecimento de deficiências visíveis na decodificação.
Na compressão temporal, redundância entre imagens sucessivas
é assumida e quando esse não é o caso, o sistema pode falhar. Um
exemplo disso pode ser dado numa cena de chegada de um artista, por
exemplo, em que muitos flashes disparam. A imagem em que o flash
84
NEWTON C. BRAGA
dispara é bem diferente das imagens anteriores e posteriores, e nesse
ponto os recursos de codificação e compressão podem falhar.
O movimento irregular de diversos objetos numa mesma
imagem exige uma banda de vetor muito larga e a sua transmissão só
pode ser obtida reduzindo-se a banda passante dos dados da imagem.
Novamente, em função disso, defeitos podem aparecer na imagem
reproduzida, os quais dependem do grau de movimento e da quantidade
de objetos.
Esse problema ocorre principalmente quando a cena
corresponde a um evento esportivo. Uma quantização excessiva resulta
em problemas de luminância de contornos e cor posterizada.
Isso pode ser visto como sombras coloridas e bloqueios em
grandes áreas de cor plena. Subjetivamente, os defeitos de compressão
são piores do que os que ocorrem nos sistemas de televisão analógica.
A única solução para se evitar tais problemas é reduzir o fator de
compressão. Isso significa que o usuário deve ser capaz de determinar
qual é o melhor para sua aplicação, entre a economia da alta
compressão e o alto nível dos problemas.
Além disso, aumentando os retardos de codificação e
decodificação, na codificação temporal também dificulta a editoração.
Veja que o MPEG não pode ser editado de forma arbitrária.
85
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Essa restrição ocorre porque, na codificação temporal, a
decodificação de uma imagem pode exigir o conteúdo de imagens
anteriores e esse conteúdo pode não estar disponível. O fato de que as
imagens podem ser enviadas fora de sequência complica ainda mais a
editoração.
Se uma codificação apropriada for usada, a editoração pode ser
feita, mas apenas em pontos que sejam reativamente espaçados. Se uma
editoração arbitrária for necessária, a corrente MPEG deve passar por
um processo de recodificação através de um código modificador que
permita fazer isso, se bem que ele resulte em perdas.
Conclusão
A compressão é um recurso essencial para a transmissão ou
gravação de imagens na forma digital. A elevada quantidade de dados
que contém cada imagem exige isso para que os meios comuns usados
na transmissão e gravação possam ser usados. No entanto, a
compressão é um processo delicado que pode levar a perdas capazes de
causar imperfeições numa imagem reproduzida.
O processo MPEG de codificação e compressão é uma
ferramenta versátil para essa finalidade e por isso usado na televisão
digital. Com a escolha apropriada dos diversos recursos que ele possui,
86
NEWTON C. BRAGA
uma imagem pode ser comprimida e descomprimida sendo recuperada
na forma original com um mínimo de perdas.
No entanto, a escolha de quais recursos devem ser usados
depende de cada caso, conforme vimos nesse artigo introdutório. No
próximo artigo voltaremos ao assunto analisando os fundamentos do
MPEG e fazendo um estudo da análise do protocolo usado.
87
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
88
NEWTON C. BRAGA
Fundamentos e protocolos do
MPEG
No capítulo anterior fizemos uma breve introdução aos
processos de compressão, verificando porque eles são necessários e
quais as vantagens do MPEG no caso específico da TV digital. Nesse
segundo artigo, em que continuamos a abordar o tema, veremos os
princípios em que se baseia a compressão de vídeo, os quais são
baseados justamente na nossa percepção visual. O tema terá uma
abordagem introdutória, mas com os elementos essenciais para que o
leitor, por conta própria, possa depois se aprofundar no assunto
procurando literatura especializada.
Codificação espacial ou temporal
Verificamos anteriormente que para a compressão de um sinal
de vídeo pode-se aproveitar tanto a redundância espacial como
temporal. A redundância espacial ocorre quando numa mesma imagem
temos largas regiões com as mesmas características, caso de um fundo
extenso da mesma cor.
A redundância temporal ocorre quando detalhes de uma imagem
não mudam na passagem de quadro a quadro. No MPEG, a redundância
temporal é reduzida em primeiro lugar aproveitando-se as semelhanças
89
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
entre imagens sucessivas. Quando essa técnica é usada, é preciso
apenas enviar como informação as diferenças entre as duas imagens, e
essa diferença passa então por uma compressão especial.
A compressão espacial se baseia nas semelhanças entre pixels
adjacentes de grandes áreas de uma imagem, além das frequências
espaciais das áreas dominantes.
Codificação espacial
Para se fazer a codificação espacial de um sinal, o primeiro
passo consiste em se fazer uma análise das frequências espaciais
usando uma transformada. A saída de uma transformada consiste num
conjunto de coeficientes que descreve como as diversas harmônicas que
formam esse sinal e as frequências que ele contém se distribuem.
Se esses coeficientes forem manuseados com precisão
suficiente, a sua utilização para recuperar a forma de onda original dá
excelentes resultados. A transformada mais utilizada nesse tipo de
aplicação é a transformada de Fourier. Essa transformada localiza cada
frequência componente do sinal de entrada multiplicando a forma de
onda de entrada por uma amostra de uma frequência alvo, denominada
função base.
Depois, produto é integrado, conforme mostra a figura 1.
90
NEWTON C. BRAGA
Figura 1 – Formas de onda para integração do produto
Os resultados podem ser como os mostrados se a componente
de frequência está em fase com a função-base. Entretanto, se a
componente de frequência está em quadratura com a função-base, a
integral ainda será zero. Por isso, é necessário realizar duas buscas para
cada frequência, com funções-base em quadratura, uma em reação a
outra, de tal forma que todas as fases do sinal de entrada sejam
detectadas.
A transformada de Fourier tem a desvantagem de precisar de
coeficientes tanto para a componente seno como cosseno de cada
frequência. Na transformada do cosseno, a forma de onda de entrada, é
espelhada no tempo em relação a ela mesma antes da multiplicação
pelas funções-base. A figura 2 mostra que esse espelhamento cancela
todas as componentes senoidais e dobra todas as componentes
cossenoidais.
91
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 2 – Cancelamento por espelhamento
A função base senoidal é desnecessária e apenas um coeficiente
se torna necessário para cada frequência. A Transformada Discreta de
Cosseno (DCT) é a versão amostrada da transformada de cosseno e
usada intensamente na forma de duas dimensões do MPEG. Um bloco
de 8 x 8 pixels é transformado num bloco de 8 x 8 de coeficientes.
Como a transformada exige a multiplicação por frações, existe
uma extensão do comprimento da palavra, resultando em coeficientes
que tem um comprimento maior do que os valores dos pixels.
Tipicamente, um bloco de pixels de 8 bits resulta num bloco de
coeficientes de 11 bits. Assim, a DCT não proporciona compressão,
mas sim um aumento da quantidade de bits. No entanto, nesse formato,
a compressão torna-se possível.
Na figura 3 temos os resultados de uma transformada inversa
para cada um dos coeficientes individuais de uma DCT de 8 x 8 bits.
92
NEWTON C. BRAGA
Figura 3 – Resultados de uma transformada inversa para um
DCT
No caso do sinal de luminância, o coeficiente do topo à
esquerda é o brilho médio ou a componente DC do bloco inteiro.
Movendo para a direita na fila superior, a frequência espacial horizontal
aumenta. Movimento para baixo na coluna da esquerda, a frequência
espacial aumenta nas imagens reais, frequências verticais e horizontais
diferentes podem ocorrer simultaneamente e com isso um coeficiente
em algum ponto dentro de bloco vai representar todas as combinações
horizontais e verticais possíveis. Fica claro para imagens em cores, que
as amostragens de diferença de cor também precisam ser manuseadas.
Dados Y, Cb e Cr são montados em conjuntos diferentes de 8 x 8 e
transformados individualmente.
93
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Ponderação
A figura 4 mostra um gráfico em que temos a percepção
humana ao ruído em função da frequência espacial.
Figura 4 – Curva da percepção humana ao ruído em função da
frequência espacial
Através desse gráfico é possível perceber que mais ruído é
tolerado nas altas frequências espaciais. Também no caso de ruídos de
vídeo, temos efetivamente o mascaramento pelos detalhes mais finos de
uma imagem, enquanto nas áreas planas, esse ruído se torna claramente
visível. A compressão reduz a precisão dos coeficientes e tem um efeito
semelhante quando se usa uma amostragem mais curta em PCM. Isso
significa que o nível de ruído aumenta.
Em PCM por se diminuir o tamanho das palavras o nível de
ruído aumenta da mesma forma em todas as frequências. Como a DCT
94
NEWTON C. BRAGA
divide o sinal em diversas frequências, torna-se possível controlar o
espectro do ruído. Assim, nesse processo os coeficientes das baixas
frequências são deixados de uma maneira mais precisa do que os das
altas frequências através de um processo de ponderação. Na figura 5
temos o modo como o processo de ponderação funciona.
Figura 5 – Funcionamento do processo de ponderação
Nesse processo de ponderação, os coeficientes da DCT são
divididos por constantes que são função da frequência bidimensional.
Os coeficientes das baixas frequências são divididos por pequenos
números e os das altas frequências são divididos por números maiores.
95
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Seguindo a divisão, o resultado é truncado até o inteiro mais
próximo. Esse corte é uma forma de requantizar. Na ausência de
ponderação a requantização tem por efeito aumentar uniformemente o
tamanho do passo de quantização, mas com a ponderação, ele aumenta
com passos de acordo com o fator de divisão. O resultado é que os
coeficientes representando as baixas frequências espaciais são
requantizados com passos pequenos e com isso sofrem apenas um
pequeno aumento do ruído.
Já os coeficientes que representam frequências espaciais mais
elevadas são requantizados com passos maiores e por isso estão sujeitos
a mais ruído. No decodificador, zeros de baixa ordem são adicionados
para recuperar os coeficientes às suas magnitudes corretas. Eles serão
então multiplicados pelos fatores inversos de ponderação.
Seguindo a ponderação inversa, os coeficientes terão seu valor
original de saída na DCT mais o erro de requantização, que será maior
nas altas frequências do que nas baixas. Fica claro que o grau de
compressão obtido e na verdade, a taxa de saída de bits obtida é função
do grau em que o processo de requantização é aplicado.
Taxas de bits diferentes vão exigir diferentes tabelas de
ponderação. No MPEG é possível usar diversas tabelas de ponderação e
96
NEWTON C. BRAGA
a tabela em uso pode ser transmitida ao decodificador, de tal forma que
a correta decodificação seja assegurada.
Varredura
Num material de programa típico, os coeficientes DCT mais
significativos são normalmente encontrados perto do canto superior
esquerdo da matriz. Depois da ponderação, os coeficientes de baixos
valores podem ser arredondados para zero. Uma transmissão mais
eficiente pode ser obtida se todos os coeficientes que não forem zero
forem transmitidos antes, seguindo-se um código que informa que os
coeficientes restantes são zero.
A varredura é uma técnica que aumenta a probabilidade de se
alcançar esse resultado, porque ela envia os coeficientes em ordem
decrescente de valor. Na figura 6(a) mostra que num sistema não
entrelaçado a probabilidade é maior para um coeficiente com um valor
maior tendo um valor mais alto no canto superior esquerdo e menor
para um coeficiente no canto direito inferior.
97
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 6 – Probabilidades dos sistemas
Uma linha diagonal em ziguezague em 45 graus é a melhor
sequência para ser usada nesse caso. Na figura 6(b) uma alternativa de
padrão de varredura podendo ser usada para fontes entrelaçadas. Se
uma imagem entrelaçada, um bloco de 8 x 8 DCT de um campo se
estende por duas vezes a área vertical da tela, então para um certo
detalhe de imagem, as frequências verticais vão aparecer duas vezes
maiores do que as frequências horizontais.
Codificação de entropia
No vídeo real nem todas as frequências espaciais estão presentes
simultaneamente. Isso significa que a matriz de coeficientes DCT
deverá conter termos que são zeros. A requantização vai aumentar o
número de zeros eliminando os valores pequenos.
98
NEWTON C. BRAGA
Apesar de se usar a varredura, os coeficientes zero vão aparecer
entre os valores significantes. O RLC (Run Length Code) permite que
esses coeficientes sejam manuseados de uma forma mais eficiente.
Onde existem valores que se repetem, como no caso de uma sequência
de zeros, o RLC simplesmente transmite o número de zeros em lugar de
cada bit individualmente.
Um codificador espacial
A figura 7 mostra os conceitos que envolvem um quantizador
espacial.
Figura 7 – Conceitos de um quantizador espacial
Os sinais de entrada são do tipo [Link] SDI (Serial Digital
Interface) os quais podem ter de 8 a 10 bits de comprimento por
palavra. MPEG utiliza apenas resolução de 8 bits, o que significa que
um estágio de arredondamento será necessário para quando o sinal SDI
conter palavras de 10 bits.
99
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
A maioria dos perfis MPEG opera com amostragem [Link], o que
significa que um filtro/estágio de interpolação será necessário. O
formato de raster de entrada escaneado deve ser armazenado para que
possa ser convertido em blocos de 8 x 8 pixels. O estágio DCT
transforma a informação de imagem no domínio das frequências.
A DCT por si só não consegue nenhuma compressão. Seguindo
a DCT, os coeficientes são ponderados e truncados, proporcionando
uma primeira compressão significativa. Os coeficientes são escaneados
em ziguezague para aumentar a probabilidade de que coeficientes
significativos ocorram antes na varredura.
Depois os últimos coeficientes que não sejam zero, e um EOB
(fim de bloco ou End of Block) é gerado. Os dados de coeficientes são
depois comprimidos pela codificação run-length e code-length. Num
sistema de taxa de bits variável, a quantização deve ser fixa, mas num
sistema de taxa de bits fixa, um buffer de memória é usado para
absorver as variações na dificuldade de codificação.
No decodificador, a corrente de bits é desserializada e a
codificação de entropia revertida para reproduzir os coeficientes
ponderados. Os coeficientes são colocados na matriz de acordo com a
varredura em ziguezague e uma ponderação inversa é aplicada para
criar o bloco original de coeficientes DCT.
100
NEWTON C. BRAGA
Seguindo uma transformada inversa, o bloco de 8 x 8 pixels é
recriado. Para obter uma saída do raster escaneado, os blocos são
armazenados numa RAM, que é lida linha por linha. Para obter uma
saída [Link] de dados [Link], um processo de interpolação vertical é
necessário, sendo realizado conforme mostra a figura 8.
Figura 8 – O processo de interpolação vertical
As amostragens de croma [Link] são posicionadas a meio
caminho das amostragens de luminância no eixo vertical de tal forma
de que elas sejam igualmente espaçadas quando uma fonte entrelaçada
é usada.
Codificação temporal
A redundância temporal pode ser separada por intercodificação
ou então ser transmitidas as diferenças entre as imagens. A figura 9
101
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
mostra que o intervalo de uma imagem combinado com uma
subinformação pode computar as diferenças entre as imagens.
Figura 9 – Computando diferenças entre imagens
A diferença de imagem é uma imagem por si só e pode ser
comprimida pelo codificador espacial como descrevemos
anteriormente. O decodificador reverte a codificação especial e
adiciona a diferença de imagem para a imagem anterior de modo a
obter a imagem seguinte. Existem algumas desvantagens nesse simples
sistema.
Em primeiro lugar, como devem ser enviadas apenas diferenças,
é impossível começar a decodificação depois do início da transmissão.
Uma solução para esse problema consiste em utilizar um sistema que
não seja completamente diferencial. Na figura 10 mostramos como isso
pode ser feito.
102
NEWTON C. BRAGA
Figura 10 – Usando um sistema não completamente
diferencial
O sistema não transmite indefinidamente a diferença entre as
imagens. De tempos em tempos, a imagem completa é enviada. Esse
sistema é denominado “intra-coded pictures” ou i-pictures, sendo
obtido por compressão especial apenas. Se um erro ocorre ou ainda
uma mudança de canal é possível interromper a decodificação e
começar de nodo na próxima imagem.
Compensação de movimento
O movimento reduz as similaridades entre as imagens e
aumenta a quantidade de dados necessária para criar uma imagem
diferença. A compensação de movimento é usada para aumentar a
similaridade. Na figura 11 mostramos o princípio de funcionamento
desse processo.
Figura 11 – A compensação do movimento
103
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Quando um objeto se move na tela da TV, ele pode aparecer em
diferentes lugares a cada imagem sucessiva, mas não muda muito sua
própria aparência. A imagem diferença pode ser reduzida pela medida
do movimento no codificador. Essa informação é enviada ao
codificador na forma de um vetor.
O decodificador usa esse vetor para deslocar parte da imagem
anterior para um novo local, obtendo-se assim a nova imagem. Um
vetor que controla o deslocamento de uma área inteira da imagem é
conhecido como “macrobloco”. O tamanho do macroblock é
determinado pela codificação DCT e pela estrutura da subamostragem
de cor.
A figura 12(a) mostra que, com um sistema [Link], o
espaçamento vertical e horizontal das amostragens de cor são
exatamente duas vezes o espaçamento da luminância.
104
NEWTON C. BRAGA
Figura 12 – Espaçamentos verticais e horizontais das
amostragens
Um bloco único de amostragem de cor DCT de 8 x 8 se estende
pela mesma área com quatro blocos 8 x 8 de luminância. Essa é a
menor área de imagem que pode ser deslocada por um vetor. Um
macrobloco contém quatro blocos de luminância, dois blocos Cb e dois
blocos Cr.
O avaliador de movimento opera comparando os dados de
luminância de duas imagens sucessivas. Um macrobloco na primeira
imagem é usado como referência. A correlação entre a referência e a
imagem seguinte é medida em todos os modos de deslocamento
possíveis com uma resolução de meio pixel em toda a faixa varrida.
Quando a maior correlação é encontrada, essa correlação é
assumida para representar o movimento correto. O vetor deslocamento
tem uma componente vertical e uma componente horizontal. Num
material típico de programa, um objeto que se move pode se estender
por um certo número de macroblocos.
Codificação bidirecional
Quando um objeto se move, ele descobre o fundo, revelando
seus detalhes em seu trajeto. O fundo revelado precisa de novos dados
105
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
para ser transmitido, porque não existem informações prévias sobre ela
na imagem anterior enviada.
O MPEG ajuda a minimizar esse problema usando codificação
bidirecional, que permitem que informação sejam obtidas de imagens
antes e depois da imagem que está sendo reproduzida. Se um fundo está
sendo revelado, ele deverá estar presente na imagem seguinte e a
informação pode ser movida “para trás” no tempo para se criar parte da
imagem anterior. A figura 13 mostra esse conceito de codificação
bidirecional.
Numa base de macrobloco individual, uma imagem codificada
bidrecionalmente pode obter dados compensados em movimento de
uma imagem anterior ou posterior, ou mesmo usar uma média entre as
duas.
106
NEWTON C. BRAGA
Figura 13 – Codificação bidirecional
A codificação bidirecional reduz significativamente a
quantidade de diferença de dados implementando um certo grau de
predição.
Imagens I-, P- e B
Para o MPEG três tipos diferentes de imagem são necessárias
para poderem aceitar a codificação diferencial e bidirecional,
minimizando os erros de propagação. As imagens I ou I-pictures são
imagens intra-codificadas que não precisam de informações adicionais.
Elas precisam de uma grande quantidade de dados quando
comparadas a outros tipos de imagem e, além disso, não são
107
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
frequentemente usadas. Elas consistem primariamente de coeficientes
de transformada e não têm nenhum vetor. As imagens I são
decodificadas sem referência em relação a nenhuma outra imagem, o
que significa que se pode mudar de canal sem que ocorram erros de
propagação.
As imagens P ou P-pictures possuem uma previsão da imagem
seguinte em relação à imagem anterior, que eventualmente pode ser
uma imagem I ou outra imagem P.
Os dados da imagem P consistem em vetores descrevendo onde,
na imagem anterior, cada macrobloco se encontrava, e coeficientes de
transformada que descrevem a correção ou diferença que deve ser
adicionada ao macrobloco. Quando nenhum casamento apropriado
pode ser encontrado num macrobloco pela procura de compensação de
movimento, dados intra (intra data) são enviados para codificar o
macrobloco. As imagens P exigem aproximadamente metade dos
dados de uma imagem I.
As imagens B são previstas bidirecionalmente em relação às
imagens posterior e anterior, as quais podem ser imagens I, imagens B
ou outra imagem P. Elas também contêm dados intra codificados que
proporcionam as correções necessárias. Novamente se não houver
nenhum casamento de macroblocos de imagens anterior e posterior que
108
NEWTON C. BRAGA
se casem com a imagem atual, intra-dados são enviados para codificar
o macrobloco.
A figura 14 mostra o conceito de GOP. O GOP apresenta a
estrutura de imagens I-, P- e B- na sequência. Geralmente a estrutura
GOP repete através da sequência, mas o comprimento GOP e estrutura
pode mudar a qualquer momento.
Figura 14 – Mudanças do comprimento GOP
Não existem limites formais para o comprimento de uma GOP,
mas para efeito de transmissão, o comprimento típico é de 12 a 15
imagens. Existem dois tipos de GOP: aberto e fechado. Um GOP
fechado não exige nenhuma referência fora dele. Na ordem de
apresentação, ele pode começar com uma imagem I e terminar com
uma imagem P.
Na ordem de transmissão normalmente temos imagens B
seguindo a última imagem P, mas as imagens que serão apresentadas
antes serão as últimas P. É possível começar e terminar um GOP
fechado com imagens B (na ordem de apresentação), mas nesse caso as
109
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
imagens B do começo e fim devem ser codificadas usando apenas uma
direção de previsão.
As imagens B do início de um GOP fechado devem ser
previstas apenas para frente, e as do final apenas para trás. Um GOP
aberto não tem essas restrições em relação aos vetores de predição. Por
exemplo, as imagens B no final de um GOP podem ser usadas para
predição da última imagem P, e as previsão para trás da primeira
imagem I do GOP seguinte pode ser usada.
Essa estrutura é sensivelmente mais eficiente, mas as predições
podem cruzar os contornos de qualquer imagem.
Um compressor MPEG
Na figura 15 temos o diagrama de blocos que representa a
estrutura de um compensador de movimento direcional típico.
110
NEWTON C. BRAGA
Figura 15 – Um compressor MPEG em blocos
O vídeo pré-processado entra no circuito com uma série de
frames que são armazenados e passados adiante para que sua ordem
possa ser alterada.
Os dados entram então no subtractor e no avaliador de
movimento. Para criar uma imagem I, o final do retardo de entrada é
selecionado e o subtractor é desligado de tal forma que os dados
passam diretamente através do circuito para serem codificados
especialmente. A saída de dados do subtractor passam então para um
armazenador de frame que podem manusear diversas imagens.
A imagem I é mantida armazenada.
111
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Para codificar uma imagem P, as imagens B no buffer de entrada
são passadas adiante de tal forma que a imagem futura possa ser
selecionada, conforme mostra a figura 16.
Figura 16 – Prevendo imagens futuras
O avaliador de movimento compara a imagem I no
armazenamento de saída com a imagem P no armazenamento de
entrada de modo a criar os vetores de movimento. Os macroblocos de
imagem I são deslocados por esses vetores para fazer uma imagem P. A
imagem P prevista é subtraída da imagem P atual de modo a produzir o
erro de predição, que é espacialmente codificado e enviado com os
vetores.
112
NEWTON C. BRAGA
O armazenamento de saída contém então uma imagem I e uma
imagem P. Uma imagem B do buffer de entrada pode ser agora
selecionada. O compensador de movimento vai comparar a imagem B
com a imagem I que a precede e a imagem P que a segue, de modo a
obter os vetores bidirecionais, conforme mostra a figura 17.
Figura 17 – Compensando movimentos
A compensação para frente e para trás do movimento é realizada
de modo a produzir duas imagens B previstas. Essas são subtraídas da
imagem atual B.
Numa base de macrobloco para macrobloco, os dados adiante e
anteriores são selecionados de acordo com os que representam as
113
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
menores diferenças. As diferenças entre as imagens são então
especialmente codificadas e enviadas com os vetores.
Pré-processamento
Um compressor tem por finalidade eliminar a redundância na
imagem e entre imagens. Qualquer coisa que reduz a redundância
aparente, ou seja, o conteúdo da imagem é indesejável. Ruído e
granulação dos filmes são especialmente problemáticos porque ocorrem
em toda a extensão de uma imagem.
Depois do processo DCT, o ruído resulta em mais coeficientes
que sejam não nulos, e o codificador não pode distinguir essa
informação da verdadeira informação que corresponde a imagem. Uma
quantização pesada será então necessária para codifica todos os
coeficientes, reduzindo assim a qualidade da imagem. O ruído também
reduz as semelhanças entre as imagens sucessivas, aumentando assim
os dados dessa diferença que precisam ser enviados.
Na maioria das aplicações do MPEG-2 o processo de
amostragem [Link] é o usado, exigindo um processo de baixa
amostragem de croma se a fonte de sinal é [Link]. No MPEG-1, a
luminância e o cromo também são amostrados para produzir uma
imagem de entrada ou CIF (common image format) que tem apenas
352 pixels de largura.
114
NEWTON C. BRAGA
Figura 18 – Pré-processamento
Wavelets
Todas as transformadas sofrem com o problema da incerteza
porque, por mais precisa que seja o conhecimento do domínio de
frequência, menos precisamente será conhecido o domínio de tempo (e
vice-versa). Na maioria das transformadas, como a discreta de Fourier
(DFT), e a discreta de cosseno (DCT), o comprimento do bloco é
fixado, de tal forma que a resolução de tempo e frequência também é
fixa.
Os coeficientes de frequência representam valores igualmente
espaçados numa escala linear. Infelizmente, como os sentidos humanos
são logarítmicos, a escala completa de uma DCT ou DFT fornece uma
resolução de frequência inadequada num extremo, com excesso de
resolução no outro. A transformada de ondinha (wavelet) não é afetada
por esse problema, pois sua resolução de frequência é uma fração fixa
de uma oitava e então tem características logarítmicas. Isso é obtido
115
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
mudando o comprimento do bloco em função da frequência. Quando a
frequência diminui, o bloco se torna mais longo.
Assim, uma característica da transformada de ondinha e que
todas as funções base contém o mesmo número de ciclos, e esses ciclos
são simplesmente escalados ao longo do eixo do tempo para diferentes
frequências. A figura 19 compara os tamanhos dos blocos DFT/DCT
com os blocos variáveis das ondinhas.
Figura 19 – Tamanhos dos blocos
116
NEWTON C. BRAGA
Para a codificação de vídeo, as ondinhas têm a vantagem de
produzir sinais de resolução escalável sem nenhum esforço extra. No
vídeo em movimento, as vantagens das ondinhas podem ser um pouco
diminuídas dada maior dificuldade em se identificar vetores de
movimento em blocos de comprimento variável.
Conclusão
Vimos nesse artigo que existem três tipos de imagens que são
usadas de diversas formas no MPEG para se obter a possibilidade de
uma compressão dos dados enviados. Vimos também os eventuais
problemas que podem ocorrer em alguns casos e como eles são
solucionados. No próximo artigo dessa série analisaremos a codificação
dos sons e quais são os padrões MPEG que existem assim como sua
aplicação na TV digital.
117
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
A compressão de áudio
Nessa série de artigos temos analisado os fundamentos do
MPEG assim como seus protocolos. No artigo anterior tratamos da
compressão da imagem e dos tipos de imagens com que o MPEG
trabalha. Continuamos essa série agora analisando a compressão do
áudio, pois tão importante como a imagem é som que a acompanha e
que deve ser reproduzido com fidelidade. O que publicamos aqui, dado
o espaço limitado disponível, é uma versão compacta obtida de
documentação da Tektronix (A Guide to MPEG Fundamentals and
Protocol Analysis).
A compressão dos sinais de áudio com perdas é baseada
inteiramente nas características do ouvido humano.
Surpreendentemente, o ouvido humano não é tão crítico para os sons
estereofônicos em termos de discriminação como é o caso a visão.
Assim, a compressão de áudio não precisa ser tratada de uma forma tão
intensa como a da imagem.
A audição humana
A audição ocorre através de processos físicos no ouvido e no
sistema nervoso que se combinam para nos dar as sensações sonoras. A
sensação que temos não é exatamente a mesma que corresponde à
118
NEWTON C. BRAGA
forma de onda presente no canal auditivo porque alguma entropia é
perdida. A faixa de frequências de ressonância da membrana basilar
determina a faixa auditiva humana, normalmente indo de 20 Hz a 15
Hz. Essa faixa muda conforme a idade e de pessoa para pessoa.
Frequências diferentes na entrada fazem com que diferentes
áreas da membrana vibrem. Cada área tem terminações nervosas
diferentes para permitir a determinação da nota correspondente. A
membrana basilar também possui músculos delicados controlados pelos
nervos que, agindo em conjunto, funcionam como um sistema de
feedback positivo capaz de aumentar o fator Q na ressonância.
Esse limiar ressonante da membrana basilar é exatamente igual
ao limiar de um analisador de transformada. De acordo com a teoria da
incerteza das transformadas, mais preciso é o domínio de frequências
de um sinal, menos precisamente o domínio dos tempos é conhecido.
Consequentemente, quanto maior for a capacidade de uma
transformada de discriminar duas frequências, menos ela será capaz de
discriminar o tempo entre dois eventos.
O ouvido humano tem um certo compromisso que equilibra a
discriminação pela incerteza no tempo com a discriminação pela
incerteza da frequência. Nesse equilíbrio nenhuma das duas
capacidades é perfeita. O resultado de uma discriminação imperfeita de
119
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
frequência é a incapacidade que temos de separar frequências que
estejam muito próximas.
Essa inabilidade é conhecida como mascaramento auditivo e é
definida como a sensibilidade reduzida a um som em presença de outro.
A figura 1(a) mostra como o limiar da audição é função da frequência
do som.
Figura 1 – Sensibilidade do ouvido humano
A maior sensibilidade, como é de se esperar, ocorre justamente
na faixa da nossa fala. Na presença de um simples tom, o limiar é
modificado, conforme mostra a figura 1(b). A discriminação imperfeita
de tempos pelo ouvido é devido à sua resposta ressonante. O fator Q é
tal que para um determinado que esteja presente por pelo menos 1
milissegundos antes, ele se torna audível.
Devido a essa baixa resposta, o mascaramento também pode
ocorrer mesmo quando os dois sinais envolvidos não estejam presentes
simultaneamente. O mascaramento adiante e atrás ocorre quando o som
120
NEWTON C. BRAGA
que mascara continua a mascarar sons em níveis mais baixos antes e
depois da duração do som real. A figura 2 mostra o que ocorre.
Figura 2 - Mascaramento
O mascaramento alcança o limiar da audição e os compressores
tiram vantagem desse efeito aumentando o piso de ruído, o que permite
que uma forma de onda seja expressa com menos bits.
Codificação de sub-banda
Na figura 3 mostramos um compander que faz a separação de
bandas ou “band-spliting”.
121
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 3 – separação de bandas
O filtro de divisão de bandas é um conjunto de filtros de fase
linear e faixa estreita que têm todos a mesma largura de faixa. A saída
de cada banda consiste em amostras representando uma forma de onda.
Em cada banda de frequência a entrada de áudio é amplificada ao nível
máximo permitido para a transmissão. Depois disso, cada nível é
levado de volta ao seu valor correto.
O ruído captado na transmissão é reduzido em cada banda. Se a
redução de ruído for comparada com o limiar da audição em cada
banda pode-se ver que ruídos maiores podem ser tolerados em certas
bandas devido ao mascaramento. Dessa forma, em cada banda, depois
do processo de “companding” é possível reduzir o tamanho das
palavras de amostragem.
Essa técnica consegue compressão porque o ruído de
quantização introduzido pelas perdas de resolução é mascarado. A
122
NEWTON C. BRAGA
figura 4 mostra um simples codificador divisor de banda como usado
na camada 1 do MPEG. A entrada de áudio digital é aplicado a um
filtro divisor de bandas que divide o espectro num certo número de
bandas.
Figura 4 – Blocos do processamento de áudio
No MPEG esse número é 32. O eixo dos tempos é dividido em
blocos de igual comprimento. Na camada 1 do MPEG existem 384
entradas de amostragem, assim, existem 12 amostragens em cada uma
das 32 bandas na saída do filtro.
A saída do banco de filtros para a camada 1 MPEG é analisada
usando uma FFT de 512 pontos de modo a determinar o espectro do
sinal de entrada. Essa análise cria um modelo de mascaramento que
determina o grau de mascaramento que deve ser esperado em cada
banda.
123
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Camada 1 do MPEG
A figura 5 mostra a camada 1 de áudio do MPEG. Seguindo o
padrão de sincronismo e o cabeçário, existem 32 bits de códigos de
alocação, com quatro bits cada um.
Figura 5 – A codificação de áudio MPEG
Esses códigos descrevem o comprimento da palavra das
amostragens em cada sub-banda. Depois vêm 32 fatores de escala
usados para o companding de cada band. Esses fatores de escala
determinam o ganho necessário no decodificador para retornar o sinal
de áudio ao seu nível original. Os fatores de escala são seguidos, por
sua vez, pelos dados de áudio em cada banda. A figura 6 mostra um
decodificador da camada 1.
124
NEWTON C. BRAGA
Figura 6 – Decodificador de camada
Camada 2 do MPEG
A figura 7 mostra que quando um filtro separador de banda é
usado para excitar o modelo de mascaramento, a análise espectral não é
muito precisa, já que existem apenas 32 bandas e a energia poderá estar
em qualquer parte da banda.
Figura 7 – Análise espectral do sinal do filtro separador
O piso de ruído não pode ser elevado muito porque, no pior caso
mostrado, o mascaramento pode não operar. Uma análise espectral mais
precisa pode permitir um fator de compressão maior. No MPEG
camada 2, a análise espectral é realizada por um processo separado.
125
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Em lugar disso, uma FFT (Fast Fourier Transform) de 1024
pontos trabalha diretamente a partir da entrada e é usado para excitar o
modelo de mascaramento. Para resolver as frequências de um modo
mais preciso o espalhamento de tempo da transformada não é
aumentado, o que é feito é aumentar o tamanho do bloco para 1152
amostragens.
Codificação de transformada
As camadas 1 e 2 são baseadas em filtros separadores de banda
nos quais o sinal é ainda representado por uma forma de onda. No
entanto, a camada 3 adota uma codificação de transformada similar ao
que é usado na codificação de vídeo. Para fatores de compressão
elevados os coeficientes podem ser requantizados, tornando-os menos
precisos.
Esse processo produz ruído que aparecerá nas frequências onde
o mascaramento é maior. Uma finalidade de um codificador de
transformada é fazer com que o espectro de entrada seja conhecido de
modo preciso, de modo que um modelo preciso de mascaramento possa
ser criado.
126
NEWTON C. BRAGA
Camada 3 do MPEG
Uma transformada discreta de cosseno é usada tendo 384
coeficientes por bloco. A saída pode ser obtida pelo processamento
direto nas amostragens de entrada, mas com um código multi-nível é
possível usar uma transformada híbrida incorporando as 32 camadas de
filtragem das camadas 1 e 2 como base.
Se isso for feito, as 32 sub-bandas do QMF (Quadrature Mirror
Filter) são processadas por um MDCT (Modified Discret Cosine
Transform) de 12 bandas para obter 384 coeficientes de saída.
Áudio MPEG-2
Apesar de originalmente designados como áudio MPEG níveis
1, 2 e 3, os sistemas são agora conhecidos de forma mais precisa como
MPEG-1 nível 1, etc. MPEG-2 define extensões para o áudio MPEG-1,
e um sistema mais avançado de codificação. O MPEG-2 permite o uso
de uma amostragem a taxas mais baixas que o MPEG-1.
Isso não significa que haja uma compatibilidade decrescente,
mas requer apenas tabelas adicionais e um decodificador adicional
MPEG-1 para interoperabilidade. O áudio MPEG-2 BC (Backward
Compatible) proporciona canais 5:1 (cinco canais de banda completa,
mais um canal de baixa largura de faixa para efeitos de baixa
frequências).
127
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
O MPEG-2 BC tem um fluxo de bits MPEG-1 (2 canais) no seu
cerne e adicional extensões multi-canais numa forma que possa ser
ignorada por um decodificador MPEG-1. O MPEG-2 AAC (Advanced
Audio Coding) é um sistema mais sofisticado com bancos de filtros alta
resolução e ferramentas adicionais de codificação. Ele oferece uma
eficiência mais elevada na codificação, mas não tem compatibilidade
decrescente.
Áudio MPEG-4
A codificação MPEG-4 é baseada em objetos. Os objetos
MPEG-4 podem representar sons naturais ou sintéticos. Para a
codificação de sons naturais, o conjunto de ferramentas MPEG-4 inclui
um MPEG-2 AAC assim como uma variedade de outras ferramentas.
Elas incluem codificação paramétrica para taxas de bits muito lentas e
uma técnica de codificação denominada “code excited linear
predictive” (CEL)) para palavra e que opera na faixa das médias
frequências. Várias formas de escalabilidade são suportadas, incluindo
a de fluxo de bits que pode ser aplicadas a pontos do sistema de
transmissão.
128
NEWTON C. BRAGA
AC-3
A técnica de codificação de áudio AC-3, inventada pelos
laboratórios Dolby, é usada com o sistema ATSC em lugar de esquema
de codificação de áudio MPEG. Ela está documentada nos padrões
ATSC a/52. Subsequentemente, o AC-3 adotou um componente
opcional de DVB e pela Motorola o sistema Digicypher II.
Os padrões MPEG
MPEG significa Moving Pictures Experts Group, um comitê
que foi formado sob o controle da International Standards Organization
(IEC). O IEC controla a padronização internacional das tecnologias
elétricas e eletrônicas e o ISO trata praticamente de tudo mais. No
início da era da tecnologia, ISO e IEC formavam um conjunto de
comitês técnicos JTC1 que tratava dos assuntos IT. O JTC1 possui
diversos grupos de trabalho, incluindo o JPEG (Joint Photographic
Experts Group) e o WG11, que é o MPEG.
MPEG-1
O sistema MPEG-1 ISO/IEC 11172 é o primeiro padrão
internacional de compressão para imagem em movimento tendo sido
desenvolvido entre 1988 e 1992. Esse sistema usa transformadas DCT,
129
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
quantização de coeficientes e codificação com comprimento variável.
De forma similar ao JPEG, ele também inclui compensação de
movimento para a compressão temporal. O MPEG-1 é dividido em três
partes:
● Sistema ISO/IEC 11172-1 – estrutura de multiplex
● ISO/IEC 11172-1 – codificação de vídeo
● ISO/IEC 11172-3 – codificação de áudio
O MPEG-1 representa uma grande conquista técnica.
Ele foi projetado para comprimir fluxos de imagem com
imagens do tamanho SIF, 352 x 288 (PAL 25 Hz) ou 36\52 x 240
(NTSC 30 Hz) e áudio associado, para aproximadamente 1,5 Mbits/s de
velocidade total para os dados comprimidos. O formato CIF é um
compromisso entre os formatos SIF europeu e americano (source input
format): resolução especial para 625 SIF (352 x 288) e resolução
temporal 525 SIF (29,97 Hz). Essa é a base da videoconferência.
MPEG-2
O MPEG-1 foi congelado em 1991. Apenas as mudanças
subsequentes foram acrescentadas apenas na forma editorial. No
mesmo ano o processo MPEG-2 foi iniciado e ele se tornou
praticamente um padrão em 1994. As metas iniciais eram simples: era
necessário um padrão que acomodasse vídeo nas faixas disponíveis na
130
NEWTON C. BRAGA
TV comercial. Isso exigia uma codificação “full size” das imagens
com definição padronizadas (704 x 480 em 29,97 Hz e 704 x 576 em
25 Hz), além da capacidade de trabalhar com códigos de vídeo
entrelaçado de maneira eficiente. De muitas formas, o MPEG-2
representa a “era de chegada” do MPEG.
A maior flexibilidade do MPEG-2 combinada com o aumento
da disponibilidade de circuitos integrados em larga escala, significa que
o MPEG-2 pode ser usado numa grande quantidade de aplicações. O
MPEG-2 é documentado como ISO/IEC 13818, atualmente em 10
partes. As partes mais importantes do padrão são:
● ISO/IEC 13818-1 – Sistema (correntes de transporte e
programas), PES, modelo de buffer T-STD e tabelas básicas
PSI: CAT, PAT, PMT e NIT.
● ISO/IEC 13818-2 – Codificação de vídeo
● ISO/IEC 13818-3 – Codificação de áudio
● ISO/IEC 13818-4 – Conformidade e testes MPEG
● ISO/IEC 13818-5 – Difusão de dados e DSMCC
Perfis e níveis no MPEG-2
Com algumas pequenas exceções, o MPEG-1 foi projetado para
uma tarefa: a codificação de imagens de tamanho fixo e áudio
associado para uma taxa de bits de 1,5 Mbits/s. As ferramentas do
131
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
MPEG-1 e sintaxe podem ser usadas para outras finalidades, mas o uso
fora do padrão exige codificadores e decodificadores licenciados.
Existe apenas um tipo de decodificador compliante com o
padrão MPEG-1. Por outro lado, existe uma meta similar para o
MPEG-2. Ele foi destinado a codificação de imagens de difusão e som,
nominalmente nos formatos 525/60 e 625/50, dos sistemas entrelaçados
de TV. Na prática não existe um único decodificador MPEG-2.
Se um decodificador compliante for capaz de manusear as
correntes de bits de alta velocidade codificada usando todas as
ferramentas possíveis, ele seria uma solução econômica para diversos
tipos de aplicações. O MPEG apresenta duas estruturas bidimensionais
de perfis e níveis para classificação de correntes de bits e
decodificadores. Os perfis definem as ferramentas que devem ser
usadas.
Por exemplo, uma codificação bidirecional (Quadros B) deve
ser usada no perfil principal, e não em perfil simples. Os níveis
mostram como escalar. Um decodificador de alto nível deve ser capaz
de receber uma corrente de bits mais rápida, e deve ter mais buffer de
decodificação e um armazenamento maior de quadros do que um
decodificador do nível principal.
A figura 8 mostra os pares de perfis e níveis que são definidos
pelo MPEG-2 (perfis no eixo horizontal e níveis no eixo vertical).
132
NEWTON C. BRAGA
Figura 8 – Pares de perfis do MPEG-2
Note que nem todas as combinações são válidas.
Apenas as que possuem pares completos são definidas no
padrão. Isso é uma exigência de conformidade do padrão que um
decodificador em qualquer perfil/nível deve ser capaz de decodificar
sinais de perfis e níveis mais baixos.
Por exemplo, um decodificador MP@ML deve ser capaz de
decodificar o perfil principal de baixo nível MP@LL, e correntes de
bits SP@ML Como uma alternativa, codificando apenas as baixas
frequências especiais numa imagem de HDTV, pode-se produzir um
fluxo principal de bits o qual pode ser decodificado por um receptor
convencional SDTV.
133
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Se a imagem de baixa definição é localmente decodificada e
subtraída da imagem original, uma imagem de melhor definição será
obtida. A imagem pode então ser codificada com um sinal de ajuda.
Um decodificador apropriado pode combinar o sinal principal com
sinais de ajuda para receber imagens HDTV. Esse é o princípio da
escalabilidade especial.
O perfil alto suporta tanto escalabilidade SNR como espacial,
assim como permite a opção de amostragem [Link]. O perfil [Link] foi
desenvolvido para uma compatibilidade melhorada com os
equipamentos de produção digital. Esse perfil permite a operação [Link]
sem a necessidade de complexidade adicional de se usar o alto perfil.
Por exemplo, um decodificador HP@ML pode suportar escalabilidade
SNR que não é uma exigência para produção.
O perfil [Link] tem a mesma liberdade de uma estrutura GOP
como outros perfis, mas na prática é comumente usada com GOPs
curtos, facilitando a editoração.
MPEG-4
Mesmo quando um padrão é oficialmente adotado, existem
ainda muitas melhorias que podem ser feitas assim como extensões que
podem ser criadas. Assim foi com o MPEG-2. Como vimos o MPEG-3
foi iniciado e abandonado, de tal forma que o projeto seguinte foi o
134
NEWTON C. BRAGA
MPEG-4. Duas versões do MPEG-4 já estão completas e mesmo assim,
o trabalho de se criar novas extensões continua. O principal objetivo do
MPEG-4 é codificar vídeo e áudio a taxas muito baixas. De fato, o
padrão foi padronizado para três taxas de bits:
● Abaixo de 64 kbit/s
● De 64 kbits/s a 384 kbits/s
● De 384 kbits/s a 4 Mbits/s
O desempenho em baixas taxas de bits permanece o maior
objetivo e algumas ideias muito criativas contribuíram para essa
finalidade. Muita atenção foi também dada aos erros, tornando o
MPEG-4 muito apropriado para ser utilizado em ambientes sensíveis a
erros, como nos equipamentos portáteis de uso pessoal.
Documentos do padrão MPEG-4
As principais partes do padrão MPEG-4 são:
● ISO/IEC 14496-1 – Sistemas
● ISO/IEC 14496-2 – Visual
● ISO/IEC 14496-3 – Áudio
● ISO/IEC 14496-4 – Teste de conformância (compliance)
● ISO/IEC 14496-6 – DMIF (Delivery Multimidia Integration
Framework)
135
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Codificação à objeto
A ideia mais importante dos sistemas convencionais de
transmissão é o conceito de objeto. As diferentes partes de uma cena
final podem ser codificadas e transmitidas separadamente como objetos
de vídeo e objetos de áudio para serem tratadas juntos ou compostos
pelo decodificador.
Diferentes tipos de objetos podem ser cada um codificado com
uma ferramenta mais apropriada para a tarefa. Os objetos podem ser
gerados independentemente, ou uma cena analisada para separação, por
exemplo, os objetos de primeiro e segundo plano, como ocorre numa
partida de futebol em que a bola pode ser processada separadamente da
cena. Um diagrama de blocos na figura 9 mostra o sistema de
codificação orientado a objeto MPEG-4.
Figura 9 – Diagrama de blocos do sistema de codificação
MPEG-4
136
NEWTON C. BRAGA
Codificação de áudio e vídeo
Muitas das ferramentas de codificação de vídeo no MPEG-4 são
similares às do MPEG-2, mas melhoradas pelo melhor uso da
codificação preditiva e mais eficiente codificação da entropia. No
entanto, a aplicação das ferramentas pode diferir de modo significativo
em relação às dos padrões anteriores.
O MPEG-4 codifica objetos de vídeo. No modelo mais simples
um vídeo é codificado da mesma forma que no MPEG-2, mas é
descrito como um simples objeto de vídeo com um formato retangular.
A representação da imagem é conhecida como codificação de textura.
Onde não existe mais do que um objeto de vídeo, alguns podem
ter formatos irregulares e geralmente menores do que o fundo de tela.
Isso significa que apenas a área ativa do objeto precisa ser codificada,
mas a forma e posição também devem ser representadas.
O padrão inclui ferramentas para a codificação do formato de
objetos retangulares e irregulares tanto na escala binária ou gray
(semelhante a um canal alfa). Esse conceito é mostrado na figura 10.
137
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 10 – Ferramentas de codificação de formato
Escalabilidade
No contexto de compressão de mídia, escalabilidade significa a
capacidade de distribuir o conteúdo de mais de um nível de qualidade
dentro de uma mesma corrente de bits. MPEG-2 e MPEG-4 fornecem
ambos os perfis escaláveis usando um modelo convencional. Nele o
codificador gera uma camada de base e uma ou mais camadas de
melhoria, como mostrado na figura 11.
Figura 11 – Camadas do MPEG-2 e MPEG-4
138
NEWTON C. BRAGA
As versões mais recentes do MPEG-4 incluem um perfil de
escalabilidade de grão fino (fine grain scalability – FGS). Essa técnica
gera uma corrente única de bits representando o nível de maior
qualidade, mas que permite versões de menor qualidade que podem ser
extraídas.
Outros aspectos do MPEG-4
O MPEG-4 é enorme e os comentários que foram feitos apenas
abordam alguns aspectos do padrão. Existem perfis de estúdio para
codificação de alta qualidade que, em conjunto com a codificação do
objeto, permitem o armazenamento de todos os elementos separados de
um sinal de vídeo composto. Mais extensões do MPEG-4 podem
proporcionar níveis de qualidade compatível com o cinema digital. A
figura 12 mostra os perfis do MPEG-4 definidos atualmente.
Figura 12 – Perfis do MPEG-4
139
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Alguns tipos de objetos definidos no MPEG-4 são interessantes.
Um exemplo é o “sprite”. Um sprite é um objeto de fundo estático,
geralmente maior do que a parte visível ou display. Por exemplo, a ação
de um vídeo game pode ocorrer diante de uma cena de fundo.
O futuro do MPEG-4
Como visto anteriormente, o MPEG-4 é uma ampla gama de
padrões, oferecendo capacidades muito ricas para muitas aplicações.
Essa é a teoria: na prática o MPEG-4 pode mostrar ter menos sucessos.
Em particular, muitos observadores esperavam que o MPEG-4
rapidamente se tornaria o mecanismo dominante de codificação para
materiais audiovisuais transmitidos através da Internet e com isso
substituir diversos Codecs licenciados em uso hoje.
No entanto, isso não ocorre, nem se espera que vá ocorrer num
futuro próximo. Existem duas principais razões para que isso não
aconteça. A primeira é que a tecnologia e a performance resultante do
MPEG-4 é que ela se baseia no H.26x desenvolvido pela ITU, que data
dos anos 1990.
A distribuição de áudio e vídeo pela Internet é um negócio
competitivo, e os maiores participantes como a Apple, Microsoft e
RealNetoworks implementaram esquemas próprios de codificação de
vídeo para superar o codec do MPEG-4.
140
NEWTON C. BRAGA
A outra razão para a falha é a situação do licenciamento da
patente. Até 2002, as empresas que desejassem implementar o MPEG4
não sabiam que tipo de royalties deveriam pagar aos donos das
patentes. O esquema proposto de licenciamento para os níveis básicos
do MPEG-4 foi publicado depois e encontraram uma reação fortemente
adversa da indústria.
MPEG-7
Como o MPEG-3 foi cancelado, a sequência de padrões,
MPEG-1, MPEG-2 e MPEG-4 é a que foi adotada. Alguns
participantes do comitê desejavam que o padrão seguinte da série fosse
o MPEG-5. Outros, atraídos pela conotação binária da série, acharam
que o seguinte deveria ser o MPEG-8. Finalmente, concluiu-se que o
seguinte seria o MPEG-7.
O MPEG-7 não trata apenas de compressão, mas sobre
metadata. Metadata é a informação digital que descreve o conteúdo de
outros dados digitais. Na terminologia moderna o material de programa
ou uma imagem de vídeo, áudio ou objetos de dado que veiculem
informação, são conhecidos como “data essence” (essência de dados).
O metadata fornece todas as informações que se necessita sobre o que
há nessa essência.
141
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
MPEG-21
O MPEG-21 novamente difere em espécie ao trabalho anterior
do comitê.
O conceito básico é relativamente simples – através de uma
vasta procura, o MPEG-21 visa criar uma estrutura completa para o
manuseio e uso de itens digitais, incluindo todo suporte de
infraestrutura para transações comerciais e manuseio de direitos que
precisam acompanhar essa estrutura.
A afirmação básica é “capacitar o uso transparente e aumentado
de fontes de multimídia através de uma ampla faixa de redes e
dispositivos”. O escopo do MPEG-21 é indicado por 7 elementos de
arquitetura definidos da seguinte forma:
1. A declaração de item digital é esperada para “estabelecer uma
abstração flexível e uniforme e esquema interabilidade para
definir itens digitais”. O esquema deve se aberto e extensível
para toda e qualquer fonte de mídia e os esquemas de descrição
e devem suportar uma estrutura hierárquica que seja de fácil
procura e navegação.
2. A representação de item digital do MPEG-21 é a tecnologia que
vai ser usada para codificar o conteúdo e proporcionar todos os
mecanismos necessária para sincronizar todos os elementos do
142
NEWTON C. BRAGA
conteúdo. Espera-se que essa camada seja referência para pelo
menos o MPEG-4.
3. Identificação digital de item e descrição que proporcionar o
conjunto de bits para a identificação e descrição dos itens
digitais (ligando todos os elementos do conteúdo). Esse item vai
incluir esquemas de descrição do MPEG-7, mas precisa também
incluir “novos sistemas de geração de identificação para
suportar gerenciamento e informação efetivos, precisos e
automatizados, regras de uso e monitoramento, etc. Deve
satisfazer todas as necessidades dos usuários do MPEG-21.
4. Conteúdo de gerenciamento e uso que deve definir as interfaces
e protocolos para armazenamento e gerenciamento de itens
digitais MPEG-21. Deve suportar o arquivamento e catalogação
do conteúdo, ao mesmo tempo preservando os direitos de uso e
a capacidade de acompanhar mudanças para itens e descrições.
Esse elemento do MPEG-21 deverá suportar uma forma de
“trading” onde os consumidores podem trocar informações
pessoais para o direito de acesso ao conteúdo, e mecanismo de
formatação pessoal para “canais pessoais” e construções
similares.
5. Proteção e Gerenciamento de Propriedade Intelectual é um
componente essencial. As controvérsias que existem atualmente
143
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
em relação aos arquivos de áudio MP3 demonstra a necessidade
de novos mecanismos de copyrights capazes de operar no
mundo digital. Pode-se arguir que o conteúdo não tem nenhum
valor a não ser que ele seja protegido. O MPEG-21 será
elaborado no trabalho que está sendo realizado com o MPEG-4
e MPEG-7, mas vai necessitar de extensões para acomodar
novos tipos de itens digitais e novos mecanismos de
fornecimento.
6. Terminais e Redes MPEG-21 vai endereçar o fornecimento dos
itens numa ampla gama de redes e terá a capacidade de obter o
conteúdo de uma ampla gama de terminais. Conceitualmente,
um filme pode ser enviado em qualidade total de cinema digital
para um cinema, ou com menor qualidade numa rede de
velocidade mais baixa para um dispositivo de consumidor (a um
preço diferente). Em ambos os casos, devem existir restrições
quanto ao número e tipo de usos. O usuário deve se preocupar
com nenhum problema de complexidade associada aos meios de
envio e recepção.
7. Finalmente, existe a necessidade de um relato de evento para
padronizada as medidas e interface de desempenho de todos os
itens. O mais óbvio exemplo disso é que o sistema permita ao
144
NEWTON C. BRAGA
usuário acessar a um item protegido, mas que um pagamento
apropriado seja feito.
Conclusão
Os padrões MPEG abrangem uma enorme quantidade de itens,
conforme o leitor pode constatar por mais esse artigo de nossa série.
A evolução rumo a uma convergência, mostra que o MPEG
também caminha rumo a uma utilização de uma forma mais ampla não
só em TV digital, como também nos elementos que permitam o envio
de programas através da internet. Nos outros artigos dessa série, iremos
além abordando as diversas tecnologias estão associados ao envio dos
sinais.
145
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Correntes de dados
Nessa série de artigos temos analisado os fundamentos do
MPEG assim como seus protocolos. No capítulo anterior tratamos da
compressão de áudio e dos protocolos com que o MPEG trabalha.
Continuamos essa série agora analisando as correntes de dados ou
“streams”. As correntes são responsáveis pelo transporte da informação
digital possuindo uma estrutura muito bem definida que será analisada
aqui, é uma versão compacta obtida de documentação da Tektronix (A
Guide to MPEG Fundamentals and Protocol Analysis). Os leitores que
dominam o inglês também podem acessar a versão original em
[Link]/video_audio.
Correntes elementares em pacotes
Para efeitos práticos, as correntes elementares contínuas que
carregam tanto vídeo como áudio de compressores, precisam ser
divididas em pacotes. Esses pacotes são identificados por cabeçários
que contém informações de tempo para sincronizar os pacotes PES ou
Packetized Elementary Streams ou Correntes Elementares em Pacotes.
Os PES podem ser usados para criar Correntes de Programas ou
Correntes de Transportes.
146
NEWTON C. BRAGA
Os pacotes PES
Num PES, uma corrente elementar sem fim é dividida em
pacotes de um tamanho conveniente para a aplicação. Cada pacote é
precedido por um pacote cabeçario PES. Na figura 1 mostramos o
conteúdo de um cabeçario.
Figura 1 – Cabeçario PES
O pacote começa com um prefixo de código de partida de 24
bits e uma corrente ID que identifica o conteúdo do pacote como vídeo
ou áudio e, além disso, especifica o tipo de codificação de áudio. É
importante não confundir o pacote num PES com um pacote muito
menor usado nas correntes de transporte que, infelizmente, dividem o
mesmo nome.
Como MPEG define somente o pacote de transporte, não o
encoder, um projetista deve escolher a versão para construir um
multiplexador que converta de correntes elementares para a corrente de
transporte em um passo. Nesse caso, os pacotes PES não devem nunca
147
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
existir na sua forma identificável, mas em lugar disso, eles estarão
logicamente presentes na corrente de transporte do pacote.
Selos de tempo
Depois da compressão, as imagens são enviadas fora de
sequência, dada a codificação bidirecional. Elas exigem uma
quantidade de dados variável e estão sujeitas a retardos variáveis
devido a multiplexação e transmissão. De modo a manter o áudio e o
vídeo juntos, selos ou etiquetas de tempo devem ser incorporados
periodicamente em cada imagem.
Um selo de tempo é um número de 33 bits obtido de um
contador operando com um clock de 90 kHz. Como os tempos de
apresentação são sempre espaçados, não é essencial incluir um selo de
tempo em cada unidade apresentada. Em lugar disso, selos de tempo
podem ser interpolados pelo decodificador. Os selos de tempo indicam
onde uma unidade particular de acesso pertence no tempo.
O sincronismo dos lábios é obtido incorporando selos de tempo
nos cabeçarios tanto de pacotes PES de áudio como vídeo. Quando um
decodificador recebe um pacote PES selecionado, ele decodifica cada
unidade de acesso e a coloca na RAM. Quando a contagem de linhas
alcança o valor do selo de tempo, a RAM é lida.
148
NEWTON C. BRAGA
PTS/DTS
Quando codificação bidirecional é usada, uma imagem pode
precisar ser decodificada algum tempo antes de ser apresentada, de tal
forma que ela deve agir como a fonte de dados de uma imagem B. Por
exemplo, imagens podem ser apresentadas na ordem IBBP, e serem
transmitidas na ordem IPBB. Consequentemente, dois tipos de selos de
tempo estarão presentes.
O selo de tempo do decodificador (DTS) que indica o instante
em que a imagem precisa ser decodificada, e também o selo do tempo
de decodificação (PTS) que indica quando a imagem deve ser
apresentada na saída do decodificador. As imagens tipo B são
decodificadas e apresentadas simultaneamente, de tal forma que elas
contêm apenas PTS.
Quando uma sequência IPBB é recebida, tanto as imagens I
como P devem ser decodificadas antes da primeira imagem B. Um
decodificador somente pode decodificar uma imagem de cada vez, o
que significa que a imagem I é decodificada em primeiro lugar e
armazenada. Enquanto a imagem P está sendo decodificada, a imagem
I é levada a saída, de tal forma que ela possa ser seguida das imagens
B.
A figura 2 mostra que, quando a unidade de acesso contendo
uma imagem I é recebida, ela tem tanto selos DTS como PTS no
149
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
cabeçario e esses selos de tempo devem ser separados por um período
de imagem.
Figura 2 – Protocolos de uma imagem
Se a codificação bidirecional está sendo usada, uma imagem P
deve seguir e essa imagem também deve ter um selo de tempo DTS e
um PTS, mas a separação entre os dois selos de tempo será três
períodos de imagem, de modo a permitir a presença das imagens B.
Assim, se uma sequência IBBP é recebida, a imagem I será
atrasada de um período de imagem, as duas imagens B não serão
tratadas e a sequência de apresentação será IBBP. Veja que a estrutura
do GOP é mudada de tal forma que se existirem mais imagens B entre
imagens I e P, a diferença entre os DTS e PTS nas imagens P será
maior.
150
NEWTON C. BRAGA
Os avisos PTS e DTS no cabeçario do pacote são colocados
para indicar a presença de PTS sozinho ou tanto selos de tempo PTS
como DTS. Os pacotes de áudio podem conter diversas unidades de
acesso e o cabeçario do pacote conter um PTS. Devido ao fato de que
pacotes de áudio não são nunca transmitidos fora de sequência, não
existe DTS num pacote de áudio.
Correntes de programa (program
streams)
As correntes de programa consistem num meio de se combinar
diversas correntes de pacotes PES sendo vantajosas para aplicações de
gravação como no caso do DVD.
Gravação versus transmissão
Para uma determinada qualidade de imagem, a taxa de dados do
vídeo comprimido pode variar de acordo com o conteúdo. Na
transmissão, os canais práticos são fixados e a taxa de bits média é
mantida constante pelo uso de dados sem significado (enchimento).
Num DVD, o uso de material de “enchimento” ocupa espaço precioso
de armazenamento.
Entretanto, um meio de armazenamento poderá necessitar ser
retardado ou acelerado, tanto fisicamente como, no caso de um disk
151
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
drive, pela mudança da taxa de dados transferida. Essa abordagem
permite que um canal com taxa de dados variável seja obtido sem afetar
a capacidade de armazenamento. Quando um meio é reproduzido, a
velocidade pode ser ajustada de modo a manter os dados enviados em
metade da capacidade.
Se o decodificador lê do buffer numa velocidade aumentada, ele
tende a encher o buffer. Nesse caso o sistema de drive simplesmente
aumenta a velocidade de acesso de modo a equilibrar o
rearmazenamento. Essa técnica apenas funciona se o áudio e o vídeo
forem codificados a partir do mesmo clock. De outra forma, os dois
podem se desviar ao longo da gravação.
Para satisfazer essas exigências conflitantes, as correntes de
programa e transporte foram vistas como alternativas. Uma corrente de
programa trabalha bem com um único programa que tenha uma taxa
variável de bits num ambiente de gravação.
Já uma corrente de transporte trabalha bem em programas
múltiplos numa taxa fixa de bits num ambiente de transmissão. O
problema de acoplar isso a uma fonte não ocorre num DVD player. O
player determina a base de tempo do vídeo com um gerador local de
pulso de sincronização (interno ou externo) e simplesmente obtém
dados do disco para fornecê-los à imagem naquela base de tempo.
152
NEWTON C. BRAGA
Na transmissão, o decodificador tem de recriar a base de tempo
no encoder ou ele passará a ter problemas de overflow e underflow.
Assim, uma corrente de transporte usa um clock de programa de
referência (PCR), enquanto uma corrente de programa não precisa do
clock de programa.
Introdução às correntes de programas
Uma corrente de programa é um pacote PES multiplexado que
carrega diversas correntes elementares que são codificadas usando o
mesmo clock mestre ou um clock de tempo do sistema (STC). Essa
corrente pode ser uma corrente de vídeo e suas correntes de áudio
associadas, ou ainda num programa apenas de áudio multicanal.
A corrente elementar de vídeo é dividida em unidades de acesso
(AU), cada qual contendo dados comprimidos descrevendo uma
imagem. Essas imagens são identificadas como I, P ou B e cada uma
carrega um número AU que indica a sequência correta em que ela deve
ser apresentada. Um AU de vídeo torna-se um pacote de corrente de
programa. Em vídeo, esses pacotes variam em tamanho.
Por exemplo, um pacote de uma imagem I deve ser muito maior
do que um pacote de uma imagem B. As unidades de acesso digital são
geralmente do mesmo tamanho e são montadas num pacote de corrente
153
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
de programa. Esses pacotes não devem ser confundidos com os pacotes
da corrente de transporte que são menores e de tamanho fixo.
Correntes de transporte
Uma corrente de transporte é mais do que um multiplex de
muitos pacotes PES. Nas correntes de programa, selos de tempo são
suficientes para recriar o eixo de tempo porque áudio e vídeo estão
ligados a um clock comum. Para a transmissão através de uma rede de
dados à distância, existe uma exigência adicional para recriar o clock
de cada programa no decodificador. Isso exige uma camada adicional
de sintaxe para proporcional sinais PCR.
A tarefa de uma corrente de transporte
A corrente de transporte carrega diversos programas e cada um
pode usar um fator de compressão diferente além de uma taxa de bits
que muda dinamicamente mesmo quando a média da taxa de bits de
mantém constante. Esse comportamento é chamado de multiplexação
estatística e permite a um programa que esteja manuseando um material
difícil emprestar faixa passante de um programa que esteja manuseando
um material mais leve.
Cada PES de vídeo pode ter um número diferente de PES de
áudio e vídeo associados. Além dessa flexibilidade, um decodificador
154
NEWTON C. BRAGA
pode ser capaz de mudar de um programa para o seguinte e
corretamente selecionar os canais apropriados de dados e áudio. Alguns
programas podem ser protegidos por taxas de assinaturas pagas.
A corrente de transporte deve conter informação PA para
administrar essa proteção. A corrente de transporte contém PSI para
administrar essas tarefas. A camada de transporte converte os dados
PES em pequenos pacotes de tamanho constante (adicionando
enchimento se necessário) que sejam autocontidos.
Quando esses pacotes chegam ao decodificador, pode ocorrer
deslocamento na temporização. O uso de “time division multiplexiing”
também causa um retardo, mas esse fator não é fixo porque a proporção
da corrente de bits alocada para cada programa não precisa ser fixa. A
operação do equipamento de produção de vídeo digital é altamente
independente da distribuição de um clock de sistema estável para
sincronização.
Na produção de vídeo, o atrelamento é usado, mas somente para
longas distâncias, a distribuição de um clock separado não é prática. Na
corrente de transporte, os diferentes programas podem ter diferentes
origens e não são necessariamente sincronizados. Como resultado, a
corrente de transporte deve fornecer um meio separado de sincronizar
cada programa.
155
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
O método adicional de sincronização é chamado PCR e ele
recria um clock estável de referência que pode ser dividido para criar
uma linha de tempo no decodificador, de tal forma que os selos de
tempo das correntes elementares em cada programa se tornem úteis.
Pacotes
A figura 3 mostra a estrutura de um pacote de uma corrente de
transporte.
Figura 3 – Estrutura de uma corrente de transporte
O tamanho é constante, 188 bytes, e é somente dividido num
cabeçario e um cerne.
A figura 3(a) mostra o cabeçario mínimo de 4 bytes. Nesse
cabeçario, a informação mais importante é:
● O Byte sinc. Esse byte é conhecido pelo decodificador de tal
forma que o cabeçario e o conteúdo possam ser desserializados.
156
NEWTON C. BRAGA
● O indicador de erro de transporte. Esse indicador é colocado se
a camada de correção de erros acima da camada de transporte
verificar um erro na taxa de bits (BER) que seja muito alto para
ser corrigido. Ele indica que o pacote pode conter erros.
● A identificação de pacote (PID). Esse código de treze bits é
usado para distinguir entre os diversos tipos de pacotes.
● O contador de continuidade. Esse valor de quatro bits é
incrementado pelo multiplexador a cada novo pacote tendo o
mesmo PID que seja enviado. Ele é usado para determinar se
qualquer pacote é perdido, repetido ou fora de sequência.
Em alguns casos, mais informações de cabeçario são necessárias
caso em que bits de controle de adaptação de campo são enviados para
indicar que o cabeçario é maior que o normal. A figura 3(b) mostra
que, quando isso acontece, o comprimento extra de cabeçario é descrito
pelo código de capo de adaptação.
Clock de referência de programa (PCR)
O encoder usado para um programa determinado deve ter um
clock de programa de 27 MHz. No caso de uma entrada SDI (Serial
Digital Interface), o clock deve ser dividido por 10 para produzir o
clock de programa do encoder. Onde diversos programas originam a
157
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
mesma possibilidade de produção é possível que eles tenham o mesmo
clock.
No caso de uma entrada de vídeo analógico, o período de
sincronismo H será necessário para ser multiplicado por uma constante
num PLL para produzir 27 MHz. O campo de adaptação no cabeçario
do pacote é usado periodicamente para incluir um código PCR que
permite a geração de um clock travado no decodificador.
Se o encoder ou multiplexador tiver que comutar fontes, o PCR
deve ter uma descontinuidade. A contagem de continuidade pode
também ser perturbada. Esse evento é manuseado pelo indicador de
descontinuidade, que informa ao decodificador que ele deve esperar
uma perturbação. De outra forma, uma descontinuidade é uma condição
de erro. A figura 4 mostra como o PCR é usado pelo decodificador para
recriar uma versão remota do sinal de clock de 27 MHz para cada
programa.
Figura 4 – PCR usado para recriar uma imagem
158
NEWTON C. BRAGA
O PCR é um número de 42 bits que é representado por uma base
PCR de 33 bits mais uma extensão PCR de 9 bits de modo a
proporcionar uma resolução mais alta. Os pacotes gerados por cada
encoder são dados por um PID diferente. O decoder reconhece que os
pacotes com o PID de correção para que o programa selecionado ignore
os demais.
No decoder, um oscilador controlado por tensão (VCO) gera um
clock nominal de 27 MHz, e ele controla o contador PCR local. O PCR
local é comparado com o cabeçario do pacote e a diferença é o erro de
fase PCR. Esse erro é filtrado para controlar o VCO que eventualmente
vai atuar sobre o contador do PCR local de modo a fazer a correção.
Identificação de pacote (PID)
Um campo de 13 bits no cabeçario do pacote de transporte
contém o código de identificação de pacote (PID). O PID é usado para
demultiplexador para distinguir os pacotes que contém diferentes tipos
de informações. A taxa de bits da corrente de transporte deve ser
constante, mesmo levando em conta que a soma das taxas de todos as
diferentes correntes varia.
Essa exigência é manuseada pelo uso de pacotes nulos. Se a taxa
de um pacote real de conteúdo falha, mais pacotes de nulo são
inseridos. Os pacotes de nulo sempre tem o mesmo PID, que é 8191
159
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
(treze uns em representação binária). Numa dada corrente de transporte,
todos os pacotes pertencendo a uma determinada corrente elementar
devem ter o mesmo PID.
O demultiplexador pode facilmente selecionar todos os dados
para uma determinada corrente elementar simplesmente aceitando
apenas os pacotes com o PID correto. Dados para um programa inteiro
podem ser selecionados usando o PID para correntes de áudio, vídeo e
dados como subtítulos ou teletexto.
Informação específica de programa
(PSI)
A PSI é transportada em pacotes tendo um único PID, alguns
dos quais são padronizados e alguns dos quais são especificados pela
tabela de associação de programa (PAT), tabela de acesso condicional
(CAT) e tabela de descrição da corrente de transporte (TSDT). Esses
pacotes devem ser incluídos periodicamente em cada corrente de
transporte.
O PAT sempre tem um PID de 0. O CAT sempre tem um PID de
1, e o TSDT sempre tem um PID de 2. Esses valores e o pacote de PID
nulo de 8191 são os únicos PIDs fixados pelo padrão MPEG. O
demultiplexador deve determinar todos os outros PIDs acessando as
tabelas apropriadas. No entanto existem algumas restrições no uso de
160
NEWTON C. BRAGA
PIDs em ATSC ou DVB. Em relação a isso (e alguns outros), MPEG e
DVB/ATSC não são completamente intercambiáveis.
Todas as correntes de transporte DVB e ATSC devem estar de
acordo com o MPGE-2 (ISO/IEC 1318-1), mas nem todas as correntes
de transporte MPEG-2 devem ser compatíveis com os padrões ATSC
(A/65A) ou DVB (EM 300 468).
Os programas que estão presentes na corrente de transporte são
listados em pacotes (PID=0) na tabela de associação de programa (PAT)
que carrega o PID de cada pacote PMT. A primeira entrada no
programa PAT, programa 0, é reservada para os dados de rede e contém
o PID da rede, pacotes da tabela de informações (NIT). O uso do NIT é
opcional em MPEG-2, mas obrigatório em DVB.
Os PIDs das mensagens de controle de titulamento (ECM) e
mensagens de controle de titulamento (EMM) são listados na tabela de
acesso condicional (CAT) pacotes (PID=1). Como a figura 5 mostra, os
PIDs de vídeo, áudio e correntes elementares de dados que pertençam
ao mesmo programa são listadas nos pacotes da Tabela de
Mapeamento de Programa (PMT).
161
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 5 – Tabela de Mapeamento de programa
Cada pacote PMT normalmente tem seu próprio PID, mas o
MPEG-2 não obriga isso. O número de programa dentro de cada PMT
vai definir unicamente cada PMT. Uma determinada tabela de
informação de rede (NIT) contém detalhes mais do que simplesmente a
corrente de transporte que a carrega.
Também incluídos estão detalhes de outras correntes de
transporte que podem estar disponíveis no mesmo decodificador, por
exemplo, pela sintonia de um canal de RF diferente ou ainda de uma
parabólica que sintonize outro satélite. O NIT pode listar um certo
número de outras correntes de transporte e cada uma pode ter um
162
NEWTON C. BRAGA
descritor que especifica a frequência, a posição orbital e assim por
diante.
Em DVB metadados adicionais, conhecidos como DVB-SI
podem ser incluídos e o NIT será considerado como parte do DVB-SI.
Além de primeiramente receber uma corrente de transporte, o
demultiplexador deve travar para PIDs 0 e 1, no pacote de cabeçarios.
Todos os pacotes PID 0 contém o PAT e o todos os PID 1 contém dados
CAT.
Lento o PAT, o demultiplexador pode encontrar os PIDs do NIT
e a tabela de mapas de cada programa (PMT). Encontrando os PMTs, o
demultiplexador pode encontrar os PIDs de cada corrente elementar.
Consequentemente, se a decodificação de um determinado programa se
torna necessária, referência ao PAT e então ao PMT é tudo que se
necessita para se encontrar os PIDs de todos as correntes elementares
no programa. Se o programa for encriptado, acesso ao CAT também
será necessário.
Como a demultiplexação é impossível sem um PAT, a
velocidade de atracamento é função da rapidez como os pacotes PAT
são enviados.
163
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Modulação digital
Começamos em capítulos anteriores pelo modo como o MPEG
é usado na compressão dos dados e no envio de informações sobre som
e imagem na forma digital. Na edição anterior tratamos das correntes
de transporte, que são os pacotes de dados enviados com o seu
conteúdo, e como esse conteúdo é organizado. Continuamos a série
agora, analisando os processos de modulação digital que não são
usados apenas em TV, mas também em todos os meios que trocam
informações digitais como os telefones celulares, sistemas de redes sem
fio e muito mais.
Este artigo consiste em uma versão compacta obtida da tradução
adaptada a versão completa da documentação original da Tektronix de
2005. Os leitores que dominam o inglês também podem acessar a
versão original em www. [Link]/vídeo_audio.
Em determinadas aplicações, os dados MPEG na forma de uma
corrente de transporte devem ser enviados de um lugar para outro (ou
muitos outros lugares). Os sistemas de TV usam cabos, satélites e
transmissão terrestre de várias formas para fornecimento, distribuição e
difusão. Todos esses mecanismos de transporte exigem que os dados
sejam modulados e aplicados a uma portadora. Neste artigo daremos
164
NEWTON C. BRAGA
uma breve introdução aos esquemas digitais de modulação que são
usados para alcançar essas finalidades.
Princípios de modulação
Uma portadora contínua não carrega nenhuma informação, a
não ser que seja modificada de alguma maneira pela informação que
deve ser transmitida. Uma portadora pode ser modificada de três
maneiras distintas: pela mudança de sua amplitude, frequência ou fase.
Frequência e fase estão relacionadas de uma maneira muito próxima.
Apesar de serem tratadas como tipos de modulação diferentes, a
distinção pode se tornar difícil em alguns casos uma vez que alguns
sistemas de “modulação em frequência" são implementados por
"moduladores de fase".
Modulação analógica
No mundo analógico, a amplitude ou a frequência de uma
portadora é mudada (modulada) de acordo com a amplitude de um sinal
de áudio ou vídeo, normalmente seguindo uma lei linear.
A modulação de fase também é usada em sistemas analógicos e
o exemplo mais comum, bem ao alcance de nossos leitores, é o dos
sinais de "diferença de cor" em uma subportadora de cor nos sistemas
de TV PAL e NTSC. Essa operação familiar fornece um exemplo útil.
165
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Podemos pensar na informação de cor de duas formas: ela pode
ser expressa como um ângulo de fase (relacionado ao matiz) mais uma
amplitude (relacionada à saturação), ou como valores de dois sinais de
diferença de cor, B-Y e R-Y.
Se as componentes de diferença de cor são tratadas como
valores; X e Y num gráfico, as duas representações podem ser vistas
relacionadas de maneira muito próxima, como ilustrado na figura 1.
Figura 1 – Modulação X-Y
Essa figura é similar à bem conhecida imagem do vetorscópio.
Modulação em quadratura
A figura 2 mostra como podemos modular uma portadora com
dois sinais diferentes utilizando uma técnica conhecida como
“modulação em quadratura".
166
NEWTON C. BRAGA
Figura 2 – Modulação em quadratura
Uma única portadora é separada em dois percursos e, em um
deles, é retardada de um tempo que seja igual a um quarto do período
de um ciclo do sinal. Isso gera uma portadora para a mesma frequência,
mas com um deslocamento de fase de 90 graus em relação à portadora
original.
As duas portadoras são moduladas em amplitude separadamente
e depois somadas. Isso gera um sinal único com amplitude e fase
determinadas pelas amplitudes dos dois; sinais moduladores.
Sistemas simples de modulação digital
A maioria dos sistemas digitais de modulação utiliza alguma
forma de modulação em quadratura. Nela, os dois eixos são
normalmente denominados; l e Q. Algumas vezes apenas um eixo é
167
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
usado. Alguns sistemas simples de modulação digital transportam
apenas um bit de informação por símbolo.
Em outras palavras, cada símbolo deve ser representado por um
(de dois possíveis estados). Podem representar um binário l ou um
binário O. Nesse caso, a taxa de bits do sistema é a mesma que a taxa
de símbolos. Entretanto, outros sistemas podem ter muitos estados
possíveis para cada símbolo.
Geralmente, o número de estados é tal que consiste numa
potência de dois e, assim, a taxa de bits do sistema é algum múltiplo
inteiro da taxa de símbolos. Os sistemas de modulação digital são
frequentemente indicados pelo tipo de modulação, precedido por um
número que representa o número de estado de cada símbolo.
Por exemplo, 4QAM descreve uma modulação em quadratura
em amplitude com quatro possíveis estados para cada símbolo. Quatro
estados podem carregar dois bits de informação (00. 0110 e 11), assim a
taxa de bits de um sistema 4QAM é duas vezes a taxa de símbolos.
A modulação chamada Binary Frequency Shift Keying (BPSK
ou ZPSK) usa uma base da portadora (de amplitude constante) para
representar o binário zero, e o inverso (deslocamento de fase de l80
graus) para representar o binário 1. Os estados diferentes possíveis de
um símbolo são mostrados normalmente num "diagrama de
constelação", onde as diversas combinações resultantes dos valores
168
NEWTON C. BRAGA
permitidos dos sinais moduladores I e Q são dadas. O diagrama de
constelação para BPSK é exibido na figura 3. Nele apenas um eixo é
utilizado, e só existem dois valores permitidos.
Figura 3 – Diagrama de constelação para o BPSK
Descrevemos no item anterior a BPSK ou ZPSK. Outras formas
de modulação PSK empregam tanto o eixo l cromo o Q. A Quaternary
Phase Shift keying (QPSK) também conhecida como "quadrature phase
shift keying" é a mais comum, e usa valores nos dois eixos. O diagrama
de constelação é apresentado na figura 4.
Figura 4 - Diagrama de constelação para QSPK
169
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
A QPSK tem quatro estados possíveis por símbolo, assim cada
símbolo carrega dois bits de informação. A QSPK é utilizada de modo
extensivo em comunicações por satélites. A 8PSK é a menos comum,
mas também é usada em sistemas por satélite, particularmente no
Japão. O diagrama de constelação é mostrado na figura 5.
Figura 5 – Diagrama de constelação da 8PSK
Quadrature amplitude modulation
(QAM)
A Quadrature Amplitude Modulation ou Modulação em
Amplitude em quadratura (QAM) é a base de muitos sistemas de
transmissão. Tanto o eixo I como Q são usados para a modulação, e
dependendo da variante particular, dois ou mais níveis de amplitude são
permitidos para cada eixo.
170
NEWTON C. BRAGA
A variante mais simples é a 4QAM, que tem apenas dois valores
usados para cada eixo, possibilitando assim quatro estados possíveis
para cada símbolo. O diagrama de constelação é ilustrado na figura 6,
onde deve ser observado que a 4QAM é idêntico à QPSK e carrega dois
bits por símbolo.
Figura 6 – Diagrama de constelação para a QAM
A 4QAM usa quatro bits para cada eixo, proporcionando 16
estados possíveis. Os sistemas 16QAM transportam 4 bits por símbolo.
Se seis valores são permitidos para cada eixo de modulação, existe um
total de 36 estados possíveis. Cinco bits podem ser transportados
utilizando apenas 32 estados assim quatro das combinações possíveis
não são usadas na 32QAM. O diagrama de constelação para a 16QAM
é exibido na figura 7.
171
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 7 – Diagrama de constelação para a 16QAM
Para a 32QAM temos o diagrama da figura 8.
Figura 8 – Diagrama para a 32QAM
Na 32QAM os quatro estados dos cantos não são usados. Esses
são os estados que poderiam representar as maiores amplitudes e,
portanto, a maior potência transmitida. As figuras 7 e 8 também ajudam
a mostrar a relação entre a taxa de bits e a robustez.
172
NEWTON C. BRAGA
Na presença de ruídos ou oscilações, o espaçamento menor
entre os estados na 32QAM (para potências iguais transmitidas) torna
os erros de decodificação mais prováveis. Por outro lado, com o
número maior de estados possíveis de símbolos, melhor será a relação
sinal/ruído necessária para uma determinada taxa de ruídos.
Vestigial sideband modulation (VSIB)
Quando uma portadora é modulada, bandas laterais são geradas,
acima e baixo da frequência da portadora. Por exemplo, um sistema
QAM com uma taxa de símbolos de 3 megassímbolos por segundo, tem
uma faixa lateral superior e inferior com largura de 3 MHz exigindo
assim uma faixa nominal de canal de 6 MHz.
Para recuperar tanto a informação em fase quanto de amplitude
(ou os dois eixos da modulação em quadratura) as duas bandas laterais
devem ser recuperadas no receptor. Os sistemas de bandas laterais
vestigiais ou Vestigial Sideband, eliminam uma das bandas laterais
antes da transmissão de modo que apenas um eixo de modulação pode
ser recuperado (uma interpretação alternativa, consiste em se dizer que
o outro eixo de modulação é empregado para suprimir a banda lateral
indesejável. A 2VSB tem o mesmo diagrama de constelação da BPSK.
A figura 9 apresenta o diagrama de constelação para a 4VSB,
que carrega dois bits por símbolo.
173
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 9 – Diagrama de constelação para a 4VSB
Na figura 10 temos a 8VSB que carrega três bits por símbolo.
Figura 10 – Diagrama de constelação para a 8VSB
A modulação 8VSB é usada nos Estados Unidos pelo padrão de
televisão digital ATSC. A 4VSB foi proposta originalmente para
proporcionar dois bits por símbolo. No entanto, verificou-se que a.
8VSB em conjunto com a codificação de Trellis uma correção de erro
interna convolucional, proporciona a mesma taxa de dados com uma
performance sinal/ruído melhorada.
174
NEWTON C. BRAGA
Coded orthogonal frequency division
multiplex - COFDM
No sistema indicado, o sinal de banda-base é fornecido aos
moduladores que operam com uma simples portadora de modo a
produzir as bandas laterais transmitidas. Uma alternativa para um
sistema de banda larga é a que produz diversas portadoras de banda
estreita em um espaçamento cuidadosamente regulado.
A figura 11(a) mostra que uma portadora digitalmente modulada
tem um ponto de nulo espectral de cada lado.
Figura 11 – Portadora digital com dois pontos de nulo
Uma outra portadora idêntica pode ser colocada ali sem sofrer
interferência porque elas são mutuamente ortogonais, conforme mostra
175
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
a figura 11(a). Esse é o princípio da OFDM (Orthogonal Frequency
Division Multiplexing ou
Multiplexação por Divisão Ortogonal de Frequência). Na
prática, uma variante conhecida como Coded Orthogonal Frequency
Divisional Multiplexing (COFDM) melhora dramaticamente a
performance em condições de canal não ideais pelo uso de codificação
convolucional de Viterbi.
A COFDM é usada na transmissão de difusão de vídeo digital
(DVB) no sistema terrestre (DVB-T). Cada portadora de um sistema
OFDM deve ser modulada por qualquer das técnicas descritas nesse
artigo. Na prática, a QAM é a mais usada. Mas a 16QAM e 64QAM
têm sido também comuns. Não é necessário utilizar todas as portadoras.
Por exemplo, se uma parte do canal está sujeita a um alto grau
de interferência, as portadoras afetadas podem ser omitidas. O número
de portadoras de um sistema OFDM pode ser muito grande. A DVB-T
tem opções para 1705 ou 681 7 portadoras (conhecidos como sistemas
2k e 8k).
Como a largura de faixa alocada por cada portadora é pequena,
a taxa de símbolos é reduzida de forma correspondente, e o intervalo de
tempo necessário para transmitir cada símbolo é, aumentado. Essa é a
chave da tolerância da OFDM às interferências multi-trajeto. Em um
176
NEWTON C. BRAGA
sistema de portadora simples, como a 8VSB, uma taxa elevada de
dados significa que o tempo de símbolo é muito pequeno.
No caso do sistema digital de televisão ATSC, algo como 11l
milhões de símbolos são transmitidos em cada segundo, dando a um
símbolo uma duração menor do que 100 ns. Isso significa que mesmo
um atraso multitrajeto muito pequeno pode criar uma interferência
inter-símbolos porque o sinal retardado representa um símbolo que
chega durante a recepção do símbolo seguinte. Em contraste, um
sistema a OFDM com milhares de portadoras terá um tempo de
símbolo da ordem de centenas de microssegundos (dependendo da taxa
de dados, do número de portadoras e da modulação usada).
A interferência inter-símbolos poderá ser virtualmente
eliminada pela soma de uma "banda de guarda" para cada símbolo -
deliberadamente fazendo o símbolo maior do que o necessário. Essa
tolerância à interferência multi-trajeto também torna os sistemas
COFDM bem apropriados para redes de frequência única, onde dois ou
mais transmissores sincronizados emitem o mesmo sinal.
Um receptor pode, dependendo de sua localização e sistema de
antenas, receber sinais de mais de um transmissor em tempos
diferentes. Se os comprimentos das trajetórias forem radicalmente
diferentes, o sinal principal provavelmente será muito mais forte do que
o sinal secundário, e a interferência serão mínimos.
177
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Se os comprimentos das trajetórias dos sinais forem os mesmos,
a banda de guarda vai prevenir que ocorra uma interferência
inter-símbolos. Os sistemas COFDM são muito flexíveis, e podem ser
"sintonizados" para ser apropriados a uma grande variedade de
exigências de transmissão mas, como sempre, o aumento da robustez
sempre ocorre em detrimento da taxa de dados.
Integrated service data broadcasting
(ISDB)
O Integrated Services Data Broadcasting (ISDB) ou Serviços
Integrados de Difusão de Dados consiste em um desenvolvimento que
usa diversos esquemas de modulação, tendo sido desenvolvido para
serviços de televisão digital no Japão. Ele foi projetado para suportar
sistemas hierárquicos de diversos níveis.
Ele pode ser utilizado, por exemplo, para fornecer
simultaneamente uma recepção de baixa taxa de dados em condições
móveis excepcionalmente difíceis, uma taxa intermediária (definição
padrão) em condições normais e uma taxa de dados elevada (talvez em
HDTV) para boas condições de recepção.
Há três sistemas de modulação ISDB em uso no Japão.
178
NEWTON C. BRAGA
Sistema ISDB-S para satélite
Até oito correntes de transporte podem ser usadas ao todo em
um modo que deve ser obtido de comum acordo entre as emissoras que
compartilham o transponder. A taxa agregada de bits dependerá da
largura de faixa do transponder e do modo de modulação empregada.
Por exemplo, para um transponder de 34,5 MHz, a taxa máxima,
incluindo a correção adiantada de erro, é de 65,610 Mbits/s.
A modulação hierárquica permite que o modo de modulação
seja variado na base de pacote por pacote (dentro de quadros de 48
pacotes). Cada pacote é associado a um slot de modulação. Quatro
módulos de modulação são suportados: BPSK (l/2), QSPK 7/8) e
TC8PSK. O número de slots varia de acordo com o modo usado.
Sistema ISDB-C para cabo
A principal característica desse sistema é que ele pode transmitir
diversas correntes de transporte numa única portadora 64QAM. O
sistema foi desenvolvido para ser capaz de retransmitir eficientemente a
informação transportada por sinais ISDB-S. Um máximo de 52,17
Mbits/s de informação é transmitido tipicamente em uma portadora
digital BS.
A taxa de informações de um sinal 64QAM/6 MHz é de 19,162
Mbits/s. Assim, pelo menos dois canais de TV a cabo devem ser
179
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
utilizados para retransmitir a informação de uma portadora única BS. O
serviço digital BS completo consiste em 4 transmissoras e ocupa
aproximadamente 174 MHz, incluindo as bandas de guarda.
Sistema ISDB-T para terrestre
O canal ISDB-T (terrestre) é dividido em 13 segmentos
(tipicamente de 400 a 500 kHz de largura). Uma transmissão COFDM
separada é usada para cada segmento. Todos os parâmetros que afetam
a robustez (número de portadoras, comprimento da banda de guarda,
tipo de modulação, codificação de convolução) podem ser escolhidos
separadamente para cada hierarquia.
Por exemplo, o segmento mais robusto pode usar uma banda de
guarda longa, modulação QSPK e codificação de ½ convolução. O
nível mais alto pode empregar uma banda de guarda mais curta
64QAM e codificação de convolução de 7/8 - proporcionando taxas de
dados muitas vezes maiores que o segmento robusto. O segmento
central deve ser utilizado para uma recepção parcial, projetado para
permitir que um receptor de banda estreita receba somente ele.
Na OFDM normal a largura de faixa de um canal completo
representa uma única camada. As portadoras usadas são espaçadas ao
longo da largura de faixa por um conjunto de múltiplos de uma certa
frequência.
180
NEWTON C. BRAGA
No ISDB-T a largura do canal de 5,6 MHz é dividida em até 13
segmentos, cada qual tendo uma largura de faixa de 429 kHz. A
transmissão hierárquica ISDB-T é conseguida pela transmissão de
grupos de segmentos OFDM com parâmetros diferentes de transmissão.
Numa modulação não hierárquica, o mesmo esquema de modulação é
empregado para todos os 13 segmentos.
Resumindo o ISDB
O ISDB-S proporciona um meio de se aplicar diferentes modos
de modulação a múltiplas correntes de transporte e transmiti-las em um
canal de 34,5 MHz com uma simples portadora. O ISDB-C proporciona
um meio de se transmitir diversas correntes de transporte num único
canal de 6 MHz e uma única portadora, mas com um modo comum de
modulação. O ISDB-T visa o manuseio de até três transmissões na
mesma corrente de transporte com um único canal de 6 MHz.
181
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
DVB e ATSC
Apresentamos mais um de uma série de artigos sobre os
fundamentos da TV digital, que começou tratando do modo como o
MPEG é usado na compressão dos dados e no envio de informações
sobre som e imagem na forma digital. Na edição anterior estudamos os
processos digitais de modulação, com uma análise das vantagens e
desvantagens que cada um pode apresentar. Continuamos essa série
tratando agora dos sistemas de TV digital, com uma breve introdução
ao seu princípio de funcionamento. Este artigo consiste numa versão
que é uma tradução adaptada completa da documentação original da
Tektronix. Os leitores que dominam o inglês também podem acessar a
versão original em [Link]/video_audio.
A compressão MPEG é a base dos sistemas de TV digital,
tornando-se cada vez mais importante na transmissão de qualquer tipo
de dado, principalmente os que representam grande quantidade de
informações, e que estejam na forma digital. Nesse artigo, baseado em
material da Tektronix vamos discutir as exigências da TV digital
analisando os principais padrões, começando pelo DVB e o ATSC para
depois passarmos ao padrão japonês que foi aprovado para uso em
nosso país.
182
NEWTON C. BRAGA
Uma Vista Geral
A ATSC (Advanced Television Systems Committee) é uma
organização americana que define os padrões para as difusão digital
terrestre.
DVB significa Digital Video Broadcasting Project tratando dos
padrões e práticas estabelecidas pelo Projeto DVB. Esse projeto era
originalmente europeu, mas produz padrões e orientações aceitas em
muitas áreas do mundo. Esses padrões fornecem guias para todos os
meios de transmissão, incluindo satélite, cabos e difusão terrestre. A
difusão digital tem uma distribuição e também exigências de
transmissão diferentes, conforme mostra a figura 1.
Figura 1 – Exigências da TV digital
183
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
As devem produzir correntes de transporte que contenham
diversos programas de televisão. As correntes de transporte não
possuem nenhuma proteção contra erros e nos dados comprimidos, o
efeito de erros pode ser muito sério. As correntes de transporte
precisam ser fornecidas sem erros aos transmissores, links de subida de
satélites e transmissores de cabos.
Nesse contexto, livre de erros significa uma taxa de erros de bit
(BER) de 1 em 10-11 ou melhor. Essa tarefa é normalmente realizada por
operadores de redes de telecomunicações, que vão utilizar uma camada
adicional de correção de erro da forma necessária (as estratégias de
correção de erros são selecionadas dependendo do canal de
transmissão). Essa camada deve ser transparente ao seu destino.
Difusão no domínio digital consiste em enviar a corrente de
transporte inteira ao telespectador. Quer seja o canal em cabo, satélite
ou terrestre, os problemas são mais ou menos os mesmos. Metadados
(Metadata) descrevendo a transmissão devem ser codificados na
corrente de transporte de uma forma padronizada.
No DVB os metadados são chamados informação de serviço
(DVB-S) e incluem serviços tais como teletexto assim como detalhes
dos programas que são transmitidos, tanto individuais como junto com
outros multiplexados. Na difusão existe muito menos controle sobre a
qualidade do sinal e ruído, além do que interferência é uma
184
NEWTON C. BRAGA
possibilidade a ser considerada. Isso requer algum tipo de camada de
correção adiantada de erro (FEC).
Diferentemente da FEC usada por operadores de redes de
telecomunicações, que podem ter proprietários (ou padronizadas como
pelo European Telecommunications Standard Institute (ETS), que
define a transmissão DVB em redes SDH e PDH), a correção adiantada
de erro (FEC) usada em difusão deve ser padronizada de tal forma que
todos os receptores possam usá-la.
Remultiplexação
Remultiplexar consiste em juntar diversos sinais multiplexados
num novo sinal multiplexado contendo mais informações ainda.
Trata-se de uma tarefa complexa porque as saídas dos multiplexadores
que vão ser trabalhados devem ser compatíveis e, além disso, deve-se
montar o sinal com partes dos outros. Os dados necessários para se
formar uma corrente de transporte devem ser selecionados em relação a
tabela de associação de programa e as tabelas de mapeamento de
programa as quais vão abrir os PIDs dos programas.
Se for possível usar os mesmos PIDs em duas correntes de
transporte então os PIDs e uma ou mais correntes elementares devem
ser mudados. Os cabeçarios dos pacotes devem passar no clock de
referência de programa (PCR) que vai permitir que o decodificador
185
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
final recrie o sinal de clock de 27 MHz. Como a posição dos pacotes
contendo PCRs pode ser diferentes na nova multiplexação, o
remultiplexador deve editar os valores PCR para que eles possam ser
refletidos na nova posição no eixo de tempo.
As tabelas de mapeamento de programa e tabelas de associação
de programa devem ser editadas para refletir a estrutura da nova
corrente de transporte, assim como as tabelas de acesso condicional. Se
na soma da corrente de programas selecionada a taxa de bits é menor
do que na saída, o remultiplexador vai criar pacotes de enchimento com
PIDs apropriados.
Entretanto, se as correntes de transporte vierem como
multiplexadores estatísticos, é possível que a taxa de bits instantânea da
nova corrente de transporte exceda a capacidade do canal. Essa
condição pode ocorrer se diversos programas selecionados em
diferentes correntes de transporte contiverem simultaneamente alta
entropia.
Nesse caso, a única solução consiste em se recomprimir e criar
novos coeficientes mais curtos em uma ou mais correntes de bits de
modo a reduzir a taxa de bits.
186
NEWTON C. BRAGA
Service Information (SI)
No futuro, o envio de sinais digitais vai significar a existência
de um grande número de programas, teletextos e serviços disponíveis
para o telespectador e eles devem ser espalhados através de diversas
correntes de transporte. Tanto o telespectador como o decodificador
integrado ao receptor (IRD) devem ser capaz de ajudar a mostrar o que
está disponível e acessar o serviço selecionado.
Essa capacidade exige metadados entre as capacidades do
MPEG-OS (Program Specific Information) e é denominada como
DVB-SI (Service Information). DVB-SI deve incluir o NIT que é
opcional nas correntes de transporte MPEG. O DVB-SI é embutido na
corrente de transporte como pacotes adicionais de transporte com PIDs
próprios que carregam informação técnica para os IRDs.
O DVB-SI também contém informações de um guia eletrônico
de programa (EPG), como a natureza de um programa, o horário e o
canal no qual ele estará disponível, além dos países nos quais ele estará
disponível. Os programas também podem ser avaliados de tal forma
que um controle de acesso por idade possa ser feito.
O DVB-SI inclui as seguintes tabelas e os MPEG-PSI:
● Tabela de informação de rede (NIT). Informação numa corrente
de transporte que descreve diversas correntes de transporte. O
NIT leva informação relacionada com a organização fixa do
187
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
multiplexador, correntes de transporte carregadas numa rede e
as características da própria rede. As correntes de transporte são
identificadas pela combinação de um ID de rede original e um
ID da corrente de transporte no NIT.
● Tabela de Descrição de Serviço (SDT). Cada serviço numa
corrente de transporte DVB deve ter uma descrição desse
serviço e todas as descrições devem ser montadas numa tabela
de descrição de serviço. Um serviço pode ser televisão, rádio ou
teletexto. O descritor de serviço inclui o nome do fornecedor do
serviço.
● Tabela de Informação de Evento (EIT) – EIT é uma tabela para
DVB que contém os nomes dos programas, horários do início,
duração e tudo mais.
● Tabela de Horário e Data (TDT) – A TDT é uma tabela que
embute a hora UTC e um selo de dados na corrente de
transporte.
O DVB-SI também define outras tabelas opcionais como: tabela
de associação de buquê (BA), tabela de status para os dados em
processamento (RST), tabela de offset de horário (TOT) e tabela de
enchimento (ST).
O ATSC, assim como o DVB, usa a seção de tabelas privadas
do MPEG-2 para definir diversas novas tabelas. O conjunto de tabelas
188
NEWTON C. BRAGA
de comando definido pela ATSC em A/65a é parte do protocolo de
informação do sistema e programa (PSIP). O PSIP do ATSC inclui as
seguintes tabelas sobre e acima do MPEG-PSI:
● Tabela de Canal Visual Terrestre (TVCT) definindo, num
mínimo, os programas MPEG-2 embutidos na corrente de
transporte na qual o TVCT é transportado.
● Tabela de Guia Mestre (MGT) definindo o tipo, identificadores
de pacotes e versões para todas as outras tabelas PSIP na
corrente de transporte, exceto para a tabela de tempo do sistema
(SIT).
● Tabela de Região Avaliada (RRT) definindo o nível de controle
(censura) dos programas de qualquer conteúdo carregado na
corrente de transporte.
● Tabela de Horário do Sistema (SST) determinando a data e
horário.
● Tabela de Informação de Evento (EIT-n) definindo as primeiras
quatro tabelas de informação de evento (EIT-0, EIT-1, EIT2 e
EIT-3) descrevendo 12 horas de eventos (programas de TV),
cada uma com uma cobertura de 3 horas, e incluindo os canais
virtuais listados no TVCT.
189
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Correção de erro
A correção de erro é necessária porque as condições de longos
percursos de transmissão não podem ser controladas. Em alguns
sistemas, a detecção do erro é suficiente porque ela pode ser usada para
pedir uma nova transmissão.
Está claro que essa abordagem não vai funcionar com sinais em
tempo real como os usados em televisão. Em lugar disso, é usado o
FEC no qual bits extras suficientes, conhecidos como redundância, são
adicionados aos dados de modo a permitir que o decodificador faça
correções em tempo real.
O FEC usados nos sistemas modernos são usualmente baseados
nos códigos Reed-Solomon (R-S). Como funcionam esses códigos foge
à finalidade dessa série de artigos. De forma resumida, os códigos R-S
adicionam redundância aos dados de modo a formar uma palavra de
código de tal forma que cada símbolo é dado como um termo num
mínimo de duas equações.
Se não existir nenhum erro a soma (ou síndrome) é sempre zero.
Essa condição de zero é obtida independentemente dos dados e torna a
checagem fácil. Nas correntes de transporte os pacotes sempre têm 188
bytes de comprimento, antes da adição dos dados de correção de erro.
A soma de 16 bytes da redundância R-S produz um pacote com
comprimento de 204 bytes (na prática, as correntes de transporte podem
190
NEWTON C. BRAGA
usar 204 bytes mesmo quando uma FEC não está presente. O uso de 16
bytes de enchimento impede o reclocking do sistema quando o FEC é
adicionado ou deletado).
No caso de que a síndrome não seja zero, ao resolver as
equações simultâneas o resultado será dois valores necessários à
correção do erro: a localização do erro e a sua natureza. Entretanto, se o
tamanho do erro excede metade do tamanho da redundância
adicionada, o erro não poderá ser corrigido. Infelizmente, nos canais
típicos de transmissão, a qualidade do sinal é estatística. Isso significa
que alguns bits individuais podem estar errados devido a ruído, e num
momento até mesmo um número elevado deles, conhecido como burst
(salva) pode ser corrompido em conjunto.
Essa corrupção pode ocorrer devido a uma descarga elétrica ou
interferência de equipamento elétrico. Não é econômico proteger cada
palavra de código contra esses bursts porque eles não ocorrem sempre.
A solução é o uso de uma técnica denominada “interleaving”. A figura
2 mostra que a fonte de dados é codificada FEC antes da transmissão e
esses dados são aplicados num buffer RAM.
191
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Figura 2 – Codificação da fonte de dados
Na figura 3 é mostrada uma das possíveis técnicas em que os
dados entram na RAM em filas e então são lidos em colunas. Os dados
reordenados são então transmitidos. Na recepção, os dados são
recolocados na sua ordem original ou de-interleaved, utilizando-se uma
segunda RAM.
Figura 3 – Recepção dos dados
192
NEWTON C. BRAGA
O resultado do processo de interleaving é que os erros de burst
no canal após o de-interleaving se torna um grande número de símbolos
de erros individuais, que podem ser corrigidos com mais facilidade.
Quando um erro de burst alcança o tamanho máximo que pode ser
corrigido, o sistema se torna vulnerável a erros aleatórios de bits que
tornam palavras de código incorrígiveis. O uso de código interno
aplicado depois do interleave e corrigido antes do de-interlaved pode
prevenir erros aleatórios evitando que eles entrem na memória
de-interleave.
Como a figura 3 mostrou, quando essa abordagem é usada com
uma estrutura de blocos de interleave, o resultado é um código de
produto. A figura 4 mostra que a interleave pode também ser
convolucional, na qual o conjunto de dados é cortado, aplicando-se um
intervalo diferente a cada fila. O interleave convolucional ou cruzado,
tem a vantagem de precisar de menos memória para o processo de
interleave e de-interleave.
Figura 4 – O interleave
193
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Codificação de canal
Dados seriais de binários em sequência são impróprios para a
transmissão por diversos motivos. Sequências de bits idênticos causam
desvios DC e afetam o clock de bits. Não existe controle do espectro e
a faixa passante exigida é muito grande. Nos sistemas de rádio e cabo
práticos, um esquema de modulação denominado código de canal é
necessário. Os esquemas de modulação digital, como os que vimos em
artigo anterior, e mostrado na figura 5, nos permite ver uma aplicação
desses princípios num modulador 64QAM.
Figura 5 – Esquema de modulação digital 64QAM
194
NEWTON C. BRAGA
Nos esquemas descritos acima, o espectro do sinal transmitido
depende do sinal. Algumas partes do espectro podem conter alta
energia e causar interferência em outros serviços enquanto outras partes
do espectro podem conter pouca energia e por isso serem suscetíveis à
interferência.
Na prática, um processo aleatório é necessário para
descorrelacionar o espectro transmitido do conteúdo de dados. A figura
6 mostra que, quando a energia tornada aleatória ou dispersada é usada,
uma sequência pseudoaleatória é somada aos dados seriais antes de sua
entrada ao modulador.
Figura 6 – Usando uma sequência pseudo aleatória
O resultado é que o espectro transmitido é como ruído, com
uma estatística relativamente estacionária. Fica claro que uma
sequência sincronizada e idêntica deve ser subtraída no receptor, como
foi mostrado. Tornar aleatória não pode ser aplicável aos padrões de
sincronismo, ou eles não poderão ser detectados.
195
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
Codificação interna
A codificação interna de um sistema FEC é projetada para
prevenir erros aleatórios, causados pela redução da potência do
esquema de interleaving. Um código interno apropriado pode prevenir
tais erros dando um aumento aparente na relação sinal-ruído (SNR) na
transmissão. Na codificação por treliça, que pode ser usada com sinais
multiníveis, diversos símbolos multiníveis são associados a um grupo.
A forma de onda que resulta de um determinado grupo de
símbolos é chamada treliça. Se cada símbolo pode ter oito níveis, então
em três símbolos pode haver 512 possíveis treliças. Na codificação por
treliça, os dados são colocados de tal forma que somente certas formas
de onda de treliças representam dados válidos.
Se somente 64 das treliças representam dados livres de erro,
então dois bits de dados por símbolo podem ser enviados em lugar de
três. O bit remanescente é uma forma de redundância porque as treliças,
diferentes das 64 corrigidas, podem ser devido a erros. Se uma treliça é
recebida na qual o nível de um dos símbolos é ambíguo devido ao
ruído, a ambiguidade pode ser resolvida porque o nível correto deve ser
um que resulta numa treliça válida.
Essa técnica é conhecida como decodificação de máxima
semelhança. As 64 treliças válidas devem ser feitas tão diferentes
quanto seja possível de modo a permitir que o sistema continue a
196
NEWTON C. BRAGA
trabalhar com uma relação sinal-ruído pobre. Se o codificador de
treliça comete um erro, o código externo vai corrigi-lo.
A codificação convolucional de Viterbi pode usada no DVB. A
figura 7 mostra que, seguindo um interleaving, os dados são aplicados a
um shift register. O conteúdo do shift register vão produzir duas saídas
que representam verificações de paridade diferentes nos dados de
entrada, de tal forma que erros de bits possam ser corrigidos.
Fica claro vão existir dois bits de saída para cada bit de entrada,
assim o codificador mostrado é denominado codificador de taxa ½.
Figura 7 – Bits de entrada e saída
Qualquer taxa entre 1/1 e ½ pode pertencer aos dados originais a
serem transmitidos, mas a quantidade de redundância pode variar. A
falha em se transmitir a saída inteira ½ é denominada “puncturing” e
197
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
ela permite qualquer balanceamento seja obtido na taxa de bits e na
potência de correção.
Dígitos de transmissão
A figura 8 mostra os elementos de um transmissor digital ATSC.
A informação de serviço descrevendo a transmissão é adicionada a
corrente de transporte. Essa corrente é então tornada aleatória antes de
ser roteada a um codificador de correção de erro R-S externo que
adiciona redundância aos dados.
Figura 8 – Roteamento da corrente de dados
Um processo de interleaving convolucional reordena então os
dados de tal forma que os dados adjacentes na corrente de transporte
não sejam adicionados na transmissão. Um codificador interno de
treliça é então usado para produzir um sinal multinível para um
198
NEWTON C. BRAGA
modulador de banda lateral vestigial (VSB). A figura 9 mostra um
transmissor DVB-T.
A informação de serviço é adicionada como antes, seguida por
um estágio que torna aleatórios os sinais para dispersão de energia.
Uma verificação externa R-S de símbolos é adicionadas antes do
interleaving.
Figura 9 – Verificação externa de símbolos
Depois disso, um processo de codificação interna é realizado e
os dados codificados são aplicados a um modulador COFDM. A saída
do modulador é então convertida para produzir a saída de RF. No
199
Como Funciona - Aparelhos, Circuitos e Componentes Eletrônicos - Volume 46
receptor, o bit de clock é extraído e usado para controlar a temporização
do sistema inteiro.
A codificação de canal é revertida para se obter o fluxo de dados
mais os erros de transmissão. O código interno corrige os erros
aleatórios e pode também identificar erros grandes para ajudar o
codificador externo depois do de-interleaving. A colocação aleatória
dos dados é removida e o resultado é a corrente original de transporte.
O receptor pode então identificar o PAT, a informação de
serviço (SI) e o PMT de modo que o telespectador possa ver o que está
disponível na corrente de transporte e selecionar o programa que deseja
ver no multiplexador.
200