UHDTV – Sistema de TV de Ultra-Alta Definição – 4ª Parte


Sistemas de codificação e decodificação

Esses dados são nossos velhos conhecidos através dos artigos anteriores, mas vale relembrar que, o sistema de televisão em ultra-alta definição (UHDTV ou SHV) possui um formato com varredura progressiva de 4000 linhas, 60 quadros por segundo e definição de 7680 x 4320 pixels, ou seja, com uma definição 16 vezes maior do que a do HDTV. O áudio é constituído de um super sistema de som surround com 22.2 multicanais. Com tudo isso, o resultado é uma gigantesca, porém proporcional, relação de bits do sistema de 24 Gbit/s.

Para esse sistema ser utilizado na prática como serviço de radiodifusão, onde o usuário doméstico possa receber os sinais tanto por meio de satélite como por canais de radiodifusão terrestre, além de poder efetuar sua gravação para as mais diversas utilizações, é preciso que os sinais de áudio e vídeo passem por um sistema de compressão e codificação/decodificação (codec) de alta eficiência. Esse sistema deve ser capaz de possibilitar uma maneira de reduzir essa alta relação de bits de áudio e vídeo para uma faixa aceitável e utilizável que se situe entre 120 e 160 Mbit/s, atualmente empregada nos sistemas HDTV.

A NHK tem desenvolvido em seus laboratórios e também com empresas afiliadas, alguns sistemas de codificação de vídeo baseados nos padrões MPEG-2 e AVC/H.264 (Advanced Video Coding / H.264 ou MPEG-4 Part 10). O SHV, que utiliza equipamentos de captação, gravação e exibição de áudio e vídeo que trabalham com resolução de cerca de 32 milhões de pixels, não pode contar ainda com equipamentos integradores que respondam a esse nível de resolução. A solução mais viável apresentada até o momento parece ser a conversão do sinal original para 16 sinais HDTV, sendo cada um deles processado por um codificador HDTV individual. Para isso, podemos concluir que deve ser empregado nesse caso um sistema com equipamentos e tecnologias bem especiais, a exemplo do próprio UHDTV, com características muito específicas.

Os sistemas de codec e a conversão de formato do vídeo
Os sistemas de codec são basicamente compostos de um conversor de formato de vídeo, um codificador/decodificador de áudio e um codificador/ decodificador de vídeo. A conversão do sinal de vídeo original é necessária para torná-lo mais fácil de ser manipulado durante sua transformação para o formato YUV.

Conversores
O conversor de formato de vídeo, sobre o qual já conhecemos um pouco quando falamos sobre o vídeo do SHV, transforma o sinal original de 7680 x 4320 pixels, obtido a partir de um arranjo arranjo de sensores de cores G1, G2, B e R para 16 imagens de 1920 x 1080 pixels e vice-versa, ou seja, converte as 16 imagens do padrão 1920 x 1080 para outra de 7680 x 4320. Esses processos realizam a divisão da imagem SHV por meio de técnicas especiais, de acordo ainda com o que já vimos quando escrevemos sobre o vídeo. Por esse motivo, seria até interessante que o leitor desse uma repassada naquela parte da matéria (edição 109 da Revista da SET) o que vai ajudar no entendimento dos conceitos sobre os conversores e codecs.

Codificadores e decodificadores (codec)
Existem atualmente duas plataformas básicas de codificadores, que são o MPEG-2 e o AVC/H.264, ou MPEG-4.

A figura 1 mostra um diagrama genérico, de ponta a ponta, dos sistemas de codificação e decodificação de sinais.

Na figura 1 podemos ver o denominado bloco “CONVERSOR DE FORMATO E PARALELIZADOR”, cuja função é converter o formato do sinal SHV da entrada e dividir os 24 Gbps em 16 sinais que serão aplicados cada um a um codificador e processá-lo em tempo real. É ele também quem controla o tempo de início da atuação de cada codificador de forma a assegurar o perfeito sincronismo de operação entre eles.

Para a utilização do sinal codificado é realizada uma operação inversa. Os sinais codificados são recebidos (seja por meio de fibra, satélite, RF ou cabo), decodificados individualmente por 16 decodificadores e encaminhados ao bloco “SINCRONIZADOR DE FASE E SERIALIZADOR”, onde é feita a sincronização de fase entre eles e em seguida são aplicados ao estágio serializador que entrega na sua saída um único sinal SHV idêntico ao original.

Codec SHV baseado no padrão mPEG-2
O sistema baseado no MPEG-2 representou a primeira versão de codecs consistindo de quatro sub-codecs para imagens de 3840 x 2160. Cada um desses sub-codecs contém quatro unidades MPEG-2 HDTV e um frame-synchronizer multicanais.

O sinal de áudio pode ser transmitido no padrão PCM linear não-comprimido, com amostragem de 48 kHz e 24 bits/amostragem, ou então através de codecs Dolby-E com razão de compressão de 1:4. Nesse sistema de 22.2 multicanais são transportados 24 canais de áudio. Veja a tabela 1.

Os sinais codificados de áudio e vídeo são multiplexados em quatro sinais TS (Transport Stream) MPEG-2, interfaceados via DVB-ASI.

Para garantir a armazenagem de programas de longa duração, precisou ser desenvolvido e fabricado um equipamento de gravação de TS (Transport Stream) especial. A capacidade de armazenamento desse equipamento é de 1,2 Tbytes, o que permite a gravação de um programa de 4,5 horas de duração quando codificado a uma taxa de 600 Mbit/s.

Quando é necessária a utilização das redes IP públicas para transmissão dos sinais SHV codificados, dependendo do caminho utilizado para a transmissão, devem ser levados em consideração o jitter e o atraso de tempo. Para sincronizar os quatro TS gerados pelos sub-codificadores, o sistema gerencia o tempo de cada quadro de vídeo por meio de um time code e de uma referência temporal existente na estrutura GOP (Group Of Pictures – uma camada opcional que contém um cabeçalho que transporta as informações de time code e edição) do fluxo de vídeo MPEG-2. A comunicação entre os sub-codificadores é feita via ethernet. Um sub-codificador mestre controla o início da atividade dos outros sub-codificadores. Na decodificação, o sub-decodificador ajusta o tempo de exibição de todos os outros sub-decodificadores e considera um atraso de transmissão se referenciando ao time code e à referência temporal. O decodificador pode lidar perfeitamente com um atraso relativo nos quatro TS internos em 15 quadros de vídeo.

O atraso total provocado pelo codificador é de cerca de 650 ms, considerando a codificação, a decodificação e a conversão de formato do vídeo.

Veja na Tabela 1 as principais especificações do codificador MPEG-2.

Codec SHV baseado no padrão AVC/H.264 (mPEG-4)
Numa atuação conjunta entre a NHK e a Fujitsu Laboratories Ltda. foi produzido um modelo de codec em tempo real com bit-rate muito baixo baseado no padrão AVC/H.264 que é, atualmente, o mais eficiente padrão de codificação de vídeo sendo largamente utilizado em várias aplicações tais como radiodifusão de pequenas imagens para recepção móvel ou serviços de HDTV via satélite. O AVC/H.264 é um esquema de codificação padronizado pela ISO/IEC e pela ITU-T.

Para conseguir um equipamento capaz de processar imagens tão grandes como as do SHV, foram utilizados 16 codificadores iguais aos utilizados em HDTV trabalhando em paralelo e cada um deles contendo 16 unidades de processamento. Cada um desses codificadores abriga três FPGAs (Field- Programmable Gate Arrays – chips constituídos de inúmeras chaves programáveis cujo objetivo é simular o funcionamento de outros circuitos, como por exemplo, processadores, controladores de vídeo, interface serial e outros) e um DSP (Digital Signal Processor – microprocessador dedicado ao processamento digital de sinais de áudio e vídeo em tempo real ou offline), possibilitando que o processo de codificação seja alterado com uma simples substituição de software.

O sistema divide um quadro de HDTV em 4 partes e processa cada uma delas em paralelo A estimativa de movimento, que é realizada no FPGA, atua em duas fases: na primeira é feita uma predição grosseira no quadro como um todo, com precisão de dois pixels; a segunda, uma estimativa bem mais precisa de um quarto de pixel, é feita em cada uma das quatro partes do quadro. O chip DSP, usado principalmente para controle de taxa, administra o módulo de processamento de codificação.

Para manter o sincronismo das 16 imagens do sistema, também foi criado um novo mecanismo de sincronização mestre- escravos onde um dos codificadores assume o papel de mestre para comandar os outros 15 escravos. Note que qualquer um dos codificadores pode ser indexado como mestre, o que é definido via software.

No final do processo, o sinal sofre uma compressão em tempo real de cerca de 200:1, baixando aqueles 24 Gbit/s para cerca de 120 Mbit/s. Embora essa banda ainda seja seis vezes maior do que a utilizada para vídeo em HD no Japão, ela já serve para uso num sistema de radiodifusão e transmissão para satélites. Uma vez recebido no seu destino, o sinal é processado inversamente, ou seja, é decodificado, sendo então restaurado para um sinal SHV.

As propriedades estatísticas das fontes de sinal do SHV não são efetivamente utilizadas nesses codificadores. Uma tarefa já programada para o futuro será dividir as fontes de informação do SHV entre os codificadores para assim melhorar a performance do sistema.

Avanços recentes
Há algum tempo, a NHK STRL (Nippon Hoso Kyokai Science & Technology Research Laboratories), juntamente com a BBC R&I (British Broadcasting Corporation Research & Innovation), está com suas pesquisas focadas no desenvolvimento de um sistema de compressão específico para SHV. A base dessas pesquisas é um projeto iniciado pela BBC, denominado Dirac. Esse sistema utiliza uma tecnologia conhecida como wavelet para transformar o erro residual do sinal, ao invés da tradicional DCT (Discret Cosine Transform) que, segundo os pesquisadores da BBC, limitam a flexibilidade dos blocos utilizados no processamento desses sinais. A wavelet é uma função capaz de decompor outras funções no domínio da freqüência, de forma que elas possam ser analisadas em diferentes escalas de freqüência e de tempo. Essa decomposição é conhecida como “transformada de wavelet”. Por isso, as funções wavelet são ferramentas poderosas para análise e compressão de sinais e o SHV tem muito a ganhar com essa tecnologia.

A compressão utilizando essa técnica dispensa o artifício da divisão da imagem em blocos para poder comprimi-los, e sua faixa de aplicação abrange a compressão de arquivos de alta resolução para produção, compressão para conteúdo de radiodifusão e compressão para aplicações em web 2.0, sem perdas ou com perdas visuais.

Sua eficiência de compressão é semelhante à do H.264 em altas resoluções, porém sem a sua complexidade de codificação. É um codec híbrido convencional, ou seja, atua tão bem em situações intra-frames como em inter-frames.

A meta é atingir um nível de relação de bits de vídeo da ordem de 65 Mbit/s de forma a poder transmitir o SHV por meio de um único transponder de satélite (70 Mbit/s). Os cientistas envolvidos nessa tarefa sabem que não vai ser fácil chegar lá, mas estão bastante satisfeitos com os resultados dos experimentos que estão sendo realizados.

Espera-se a cada dia novos avanços, graças aos progressos que vêm sendo alcançados nas tecnologias de codificação e compressão de imagens.

Referências
(1) E. Nakasu, Y. Nishida, M. Maeda, M. Kanazawa, S. Yano, M. Sugawara, K. Mitani, K. Hamasaki and Y. Nojiri, “Technical development towards implementation of extremely high resolution imagery system with more than 4000 scanning lines,” IBC2006 Conference Publication – p. 349, Amsterdam, Sep. 11, 2006.http://www.nhk.or.jp/digital/en/technical/ pdf/02_1.pdf

(2) Shinichi Sakaida, Nao Nakajima, Atsuro Ichigaya, Masaaki Kurozumi, Kazuhisa Iguchi, Yukihiro Nishida, Eisuke Nakasu, Seiichi Gohshi (NHK Science and Technical Research Laboratories) – “The Super Hi-Vision Codec”- pp I-21 to I-24 – IEEE 2007. http://www-video.eecs.berke-ley.edu/Proceedings/ICIP2007/pdfs/0100021.pdf

(3) Y. Shishikui, Y. Fujita and K. Kubota (NHK STRL), “The Super Hi-Vision demos at IBC-2008 – The star of the show! pp, 09-10” EBU Technical Review, January 2009. http://tech.ebu.ch/docs/techreview/ trev_2009-SE.pdf

(4) John Zubrzycki and Thomas Davies (BBC R&D); Peter-Calvert Smith (Siemens IT Solutions and Services); Paul Styles (Cable&Wireless); Bill Whiston (SIS LIVE); Yukihiro Nishida and Masaru Kanazawa (NHK STRL) – “The London-Amsterdam live contribution link”- pp, 30-32” EBU Technical Review, January 2009.http://tech.ebu.ch/docs/techreview/ trev_2009-SE.pdf

(5) BBC R&D – Dirac – The video compression family using open technology – The technology behind Dirachttp://www.bbc.co.uk/rd/projects/dirac/ technology.shtml

* Alberto é supervisor de projetos da TV Cultura de São Paulo e Diretor da AdesedA-Consultoria, Projetos e Instalações – [email protected]

Revista da SET – ANO XXI – N.111 – DEZ 2009