SINCRONISMO EM TV DIGITAL MÓVEL – 1a PARTE

TRANSMISSÃO
SINCRONISMO EM TV DIGITAL MÓVEL – 1a PARTE
ESSE ARTIGO DISCUTE O SINCRONISMO DE MÍDIAS NO CONTEXTO DAS APLICAÇÕES DE TV DIGITAL COM RECEPÇÃO MÓVEL. É APRESENTADO UM FRAMEWORK PARA AUXILIAR NA AVALIAÇÃO DOS IMPACTOS DE PARÂMETROS DE QOS.
Por Roberto Mitsuake Hirayama, Regina Melo Silveira

As aplicações de TV digital geralmente utilizam redes de distribuição de conteúdo para enviar sinais de vídeo e áudio às antenas transmissoras de uma emissora. Esse transporte é feito através de redes de pacotes que podem adicionar atrasos e variações de atraso às informações prejudicando o sincronismo e, conseqüentemente, a apresentação das mídias.
Para aplicações móveis de TV digital, devido a sua configuração, essas redes de distribuição são complexas e, por isso, mecanismos para reduzir os efeitos dessas perturbações no sincronismo devem estar presentes.
Nesse artigo serão analisados os mecanismos de sincronismo para aplicações de TV digital com recepção móvel com o intuito de investigar a influência do sincronismo na qualidade da apresentação de mídias em terminais móveis de TV digital. Além disso, será proposto um framework para o estudo da influência das perturbações causadas pelas redes de dados no sincronismo de programas MPEG-2 e na apresentação de mídias aos usuários com o intuito de simular as condições reais de uma rede de distribuição de conteúdo empacotados em fluxos de transporte MPEG-2.

Panorama da Radiodifusão de Sinais de TV digital para Recepção Móvel
Alguns aspectos da infra-estrutura para a radiodifusão de sinais de TV digital para recepção por terminais móveis são fundamentais. A geração do conteúdo, seu transporte até o modulador/transmissor, a modulação do conteúdo em sinais de TV digital e sua efetiva transmissão, devem ser levados em consideração quando são projetadas aplicações móveis de TV digital, principalmente em redes que cobrem regiões metropolitanas.

Tabela 1

Cada um dos padrões existentes de TV digital terrestre, DVB-T [30], ATSC [34] e ISDB-T [33] aborda a recepção móvel de uma forma diferente, principalmente na modulação. Uma análise dos principais métodos de modulação para TV digital, COFDM (Coded Orthogonal Frequency Division Multiplexing) [1] e 8-VSB (8-Vestigial Side Band) [20, 21], indica que a garantia de uma qualidade satisfatória do vídeo na recepção móvel, depende da modulação utilizada, a qual deve ser robusta, em conseqüência dos efeitos de ruídos, distorção por múltiplos caminhos, atenuação, etc [2, 6]. Por isso, a eficiência espectral para a transmissão dos sinais de TV digital móvel, se comparada à recepção fixa, é menor e, conseqüentemente, a banda disponível por canal também será. Estudos na literatura [3] indicam que a recepção móvel no DVB-T, que utiliza o esquema de modulação COFDM, tem melhor desempenho com a modulação QPSK.
Por outro lado, a recepção fixa pode utilizar outras modulações como o 16QAM ou 64QAM, o que determina taxas de bits maiores para a recepção móvel. Na tabela 1, são apresentadas taxas de bits obtidas em testes com o padrão DVB-T, com o esquema de modulação COFDM utilizando parâmetros e esquemas de modulação diferentes [3]. Os resultados são apresentados na tabela 1 para ilustrar como a taxa de bits é afetada pela modulação.
Outro aspecto importante, onde se mostra que a máxima separação das antenas de dois transmissores adjacentes para o esquema de modulação COFDM com FFT de 2k e intervalo de guarda 1/32, ou seja, as características adequadas para a recepção móvel, são de dois quilômetros. Portanto, para a radiodifusão de sinais de TV digital com recepção móvel devem ser instalados vários transmissores para cobrir a área de uma grande região metropolitana.
Torna-se necessário, assim, implementar uma rede de transmissores para cobrir uma cidade de médio ou grande porte. De forma análoga a uma rede celular, as antenas transmissoras devem estar espaçadas de acordo com predições de cobertura, ou seja, considerando-se a potência do sinal, a atenuação, relação sinal-ruído, etc, definindo-se uma região de cobertura para cada célula e assim garantindo que a área desejada será atendida por pelo menos um transmissor.
A rede de transmissores para aplicações de TV digital, ao contrário das redes celulares, pode ter duas configurações: de freqüência única (SFN – Single Frequency Network) ou de múltiplas freqüências (MFN – Multiple Frequency Network) [2]. As redes MFN utilizam um conjunto de freqüências que são reutilizadas de forma a evitar interferências co-canal entre células vizinhas. No caso de uma rede MFN para TV digital, cada antena transmissora utilizaria uma determinada freqüência que não seria reutilizada pelos transmissores adjacentes, sendo reutilizada somente por células distantes. Uma rede SFN, por sua vez, utilizaria uma única freqüência para todos os transmissores. Apesar da aparente simplificação devido a utilização de uma única freqüência, as SFNs apresentam limitações de sincronismo bastante importantes [2], ou seja, todas as antenas transmissoras devem estar sincronizadas em termos de freqüência, tempo e bits.
A rede de transmissores deve irradiar o sinal de TV digital para todos os terminais dentro da sua área de cobertura. Entretanto, a geração de conteúdo não é feita, na maioria das implementações, em cada transmissor e sim numa localidade centralizada e portanto faz-se necessário distribuir esse conteúdo para todas as antenas transmissoras espalhadas geograficamente pela região desejada. Denomina-se rede primária de distribuição, a infra-estrutura de transporte necessária para levar o conteúdo para as antenas transmissoras e rede secundária de distribuição a rede de transmissores propriamente dita, ambas mostradas na figura 1.
A rede primária de distribuição transporta geralmente o sinal de TV digital em banda base, onde vídeos e áudio são encapsulados na estrutura do MPEG-2 Transport Stream (MPEG-2 TS). A geração de conteúdo de forma centralizada tem vantagens pois na rede primária podem ser incluídos ou retirados programas do MPEG-2 TS e a qualidade do sinal é preservada, pois a relação sinal ruído se mantém praticamente inalterada na rede primária.

Fig. 1 – Redes para transmissão de TV digital terrestre.

A rede primária introduz desafios para a implementação da TV digital, tanto para recepção móvel quanto para recepção fixa, pois se trata geralmente de uma rede de pacotes, onde questões como atraso, variação de atraso, sincronismo no receptor, etc, deverão ser examinadas para garantir uma qualidade satisfatória no terminal final.

Multiplexação e Sincronização na Infra-estrutura de TV digital

Mecanismos de Multiplexação
O principal objetivo da TV digital é disponibilizar programação no formato digital aos telespectadores. Uma possível conseqüência da digitalização na TV é a interatividade entre o espectador e a fornecedora do conteúdo, a qual pode ser implementada de várias maneiras. Por exemplo, em um programa de TV transmitindo a apresentação de uma orquestra, o usuário não precisa se restringir à edição feita pelas emissoras como na TV analógica atual, pode ser dada a opção de escolher qual a perspectiva mais lhe agrada a cada momento e assim modificar a câmera que deseja assistir. Além dessa função, diversas outras são possíveis, tais como: seleção de naipes de instrumentos (cordas, metais, madeiras e percussão), obtenção de informações adicionais sobre a peça apresentada, o compositor, o regente e os músicos, etc. Nota-se que cada programa na TV digital pode ser formado por diversos vídeos, áudios e dados diferentes. No exemplo, cada câmera seria um fluxo de vídeo, cada naipe de instrumentos seria um fluxo de áudio e as informações adicionais seriam fluxos de dados. O Laboratório de Arquitetura e Redes de Computadores (LARC) da Escola Politécnica da USP e a TV Cultura estão desenvolvendo uma aplicação nesses moldes.

Tabela 2.

Numa programação real de TV, com várias emissoras transmitindo, são disponibilizados diversos programas MPEG que, por sua vez, podem ser formados por vários fluxos de informação. Pode-se imaginar que a organização de todas essas mídias digitais num único meio de transmissão (canal de radiodifusão, cabo coaxial, fibra ótica, etc) não é tarefa fácil. O processo utilizado para reunir todas essas informações é denominado multiplexação. Adicionalmente, na nomenclatura MPEG cada mídia – vídeos, áudios e dados – é denominada fluxo elementar [23] (Elementary Stream – ES).
Os Fluxos Elementares consistem em dados comprimidos para uma única fonte (vídeo, áudio ou dados), e informações para sincronização básica, além da identificação e das características da fonte.
A estrutura utilizada para a multiplexação foi padronizada pelo MPEG-2 System [23]. Nele são definidas as regras, os protocolos e os mecanismos para o transporte e multiplexação de vídeo, áudio e outras mídias digitais através de um meio de transmissão qualquer, sendo fundamental para a implementação da TV digital em seu nível mais elementar, ou seja, a infra-estrutura de transmissão de pacotes (camada de enlace).
A Multiplexação é feita através do encapsulamento de cada mídia em pacotes diferentes devidamente identificados para que sejam separados no receptor. Os pacotes podem ter tamanhos fixo ou variável, com tamanho variável o fluxo resultante é denominado Fluxo de Programa (PS – Program Stream) e tamanho fixo Fluxo de Transporte (TS – Tranport Stream). Na tabela 2 são apresentadas as diferenças básicas entre o TS e o PS, sendo mais utilizado em aplicações de TV digital o fluxo de transporte.
Os fluxos elementares não podem ser enviados diretamente ao receptor. Eles devem ser encapsulados em pacotes PES (Packetized Elementary Stream), ou diretamente em pacotes TS. O PES é fundamental para que o receptor obtenha informações tais como: dados de sincronismo, indicadores de embaralhamento do campo de dados do pacote, copyright, etc [23, 29].
Uma vez preenchidos, os pacotes PES podem ser inseridos no campo de dados dos pacotes TS para transmissão ao receptor. O encapsulamento do PES no pacote TS pode ser feito de várias formas, por exemplo, a cada pacote TS inserimos um único pacote PES (caso o pacote PES tenha tamanho menor que 184bytes) ou também dividir um pacote PES em vários pacotes TS.

Mecanismos de Sincronização do MPEG-2 System
Cada programa na TV digital tem sua base de tempo, comum a todos os fluxos elementares que o constituem. A decodificação e a apresentação das mídias segue uma temporização definida pelo transmissor que, por sua vez, tem como referência o relógio do sistema (STC – System Time Clock) sendo, portanto, muito importante garantir que o receptor reconstrua esse relógio corretamente utilizando as informações contidas nos pacotes dos fluxos multiplexados (PS ou TS) e mantendo o sincronismo em relação ao transmissor.
Por isso, a especificação do MPEG-2 System define um modelo de temporização, onde o atraso fim a fim do sinal de entrada no codificador até o sinal de saída no decodificador é constante para vídeos e áudio. Esse atraso é a soma dos tempos de codificação, buferização no codificador, multiplexação, transmissão ou armazenagem, demultiplexação, buferização no decodificador, decodificação e de apresentação. O modelo baseia-se num atraso fim a fim constante, apesar dos atrasos variáveis nos buffers do emissor e do receptor. O atraso na transmissão ou armazenamento é considerado constante, entretanto, na prática alguma variação de atraso pode ocorrer e portanto deve ser compensada por algum mecanismo no receptor.
Na codificação dos fluxos multiplexados são incluídas informações de tempo que são utilizadas para implementar sistemas que possuem esse comportamento (atraso fim a fim constante). Todas as informações de temporização são definidas em relação a um relógio de sistema comum ao emissor e ao receptor. Alguns parâmetros utilizados no modelo são: as amostras do relógio do sistema, denominadas PCR (Program Clock Reference); e os tempos de apresentação e decodificação das mídias, PTS (Presentation Time Stamp) e DTS (Decoding Time Stamp), respectivamente.
Para assegurar atrasos fim a fim constantes, o modelo define também um relógio comum denominado STC gerado no emissor. A partir dele são criados os registros de tempo (time stamps) que indicam os instantes corretos para a decodificação e apresentação dos vídeos e áudio. No emissor são geradas amostras do STC em períodos regulares originando valores instantâneos do relógio, os PCRs.
Os PTSs, DTSs, PCRs devem ser devidamente especificados de forma que: vídeo e áudio sejam precisamente sincronizados na apresentação ao usuário, e os buffers no receptor não sofram transbordo (overflow). Para o receptor definir os atrasos corretos nos buffers de decodificação e de apresentação (PTS e DTS) e tornar o atraso do sistema como um todo constante, o relógio no receptor deve ser bastante próximo daquele no emissor. Por isso, o relógio é reconstruído no receptor através de amostras do relógio do emissor, ou seja, por meio dos PCRs.
Os PCRs são calculados através da amostragem do relógio do sistema.e são enviados periodicamente dentro do fluxo de transporte. A distância entre dois pacotes contendo PCRs é controlada de forma que essas amostras sejam dispostas em intervalos constantes. Os pacotes com PCRs formam uma linha de tempo para todos os demais.
Dessa forma, a partir dos PCRs é determinada a taxa de envio de fluxos elementares para o decodificador, ou em outras palavras, a taxa de leitura do “buffer” de decodificação.
Essa taxa pode ser calculada dividindo o número de bits entre dois pacotes consecutivos com PCR e a diferença de tempo entre o valor de suas amostras. Portanto, caso seja mantido o número de pacotes entre dois PCRs, a diferença dos valores dos PCRs também será constante e conseqüentemente a taxa de leitura no buffer de decodificação também será. Mantendo-se constante o atraso do fluxo de pacotes de transporte com relação ao receptor, ele será capaz de reconstruir o relógio do emissor sem muitas distorções [10].
Entre dois PCRs consecutivos a taxa de decodificação é mantida constante, por isso a taxa do fluxo de transporte é denominada constante em partes (piecewise constant rate). Em outras palavras, pode-se modificar a taxa no decodificador através do deslocamento das amostras do PCR no fluxo de transporte. Esse mecanismo é bastante útil quando são feitas intervenções no fluxo de transporte, por exemplo, em remultiplexações devido a mudança das taxas de alguns fluxos elementares (mudança da codificação de vídeo ou aúdio) ou na retirada de algum fluxo elementar do fluxo de transporte em algum nó da rede, por exemplo numa rede de TV a cabo entregando um canal pay-per-view a um assinante específico.
Os processos utilizados para reconstruir o relógio do emissor são implementados, em hardware ou software, para garantir o sincronismo das mídias transportadas pelos fluxos de transporte. Destacam-se as seguintes atividades para a reconstrução da base de tempo: regeneração do relógio do sistema, correção do relógio na presença de variação de atraso nos pacotes do fluxo multiplexado, e a utilização dos tempos de apresentação e decodificação. A unidade receptora e decodificadora (URD) deve implementar essas funções com o objetivo de apresentar os fluxos elementares selecionados pelo usuário.
Cada uma delas tem fundamental importância para as aplicações da TV digital, que são executadas acima das camadas de transporte, multiplexação e codificação.
As redes de transporte utilizadas para enviar os pacotes do fluxo multiplexado apresentam atrasos e variação de atraso que podem alterar sobremaneira o instante de chegada de cada PCR. Isso pode causar uma grande variação do relógio no receptor.

Fig. 2 – Influência das variações na distância entre PCRs.

Para evitar mudanças bruscas no relógio do receptor e mantê-lo estável dentro de certos limites são utilizadas técnicas como o Phase Locked Loop (PLL) [23]. O efeito da variação entre o relógio do emissor e do receptor, caso não se tivesse o PLL, é um gradual e inevitável aumento ou diminuição do preenchimento do buffer do decodificador, de forma que o transbordo ou o esvaziamento total eventualmente ocorreria para buffers de tamanho finito.

Resincronização de Mídias
Por resincronização de mídias de TV digital entende-se como o processo através do qual mantêm-se a periodicidade e o valor das amostras do relógio do emissor (Program Clock Reference – PCR) o mais constante e fiel possível, utilizando para isso processos que atuam no fluxo de transporte para corrigir variações devido a atrasos na rede, etc. Os algoritmos que têm como objetivo resincronizar as mídias em sinais de TV digital devem, portanto, reposicionar os pacotes que contém essas amostras, i.e., os PCRs, de forma que a distância relativa entre cada amostra e a imediatamente anterior ou posterior seja constante. Além disso, os algoritmos devem adequar os valores de cada amostra para refletir a situação original no emissor. A resincronização de mídias tenta solucionar alguns problemas inerentes à distribuição de fluxos de transporte (MPEG-2 Transport Stream) por redes de pacotes até as estações transmissoras de TV digital, ou seja, utilização de redes primárias de distribuição.
A sincronização das mídias depende, em grande medida, dos atrasos e variações de atraso que apresentarem os pacotes do fluxo de transporte que contém as amostras do relógio do emissor (PCR), pois a distância entre amostras consecutivas pode variar devido à ocorrência dessas perturbações. Sendo que, essa distância determina a taxa de decodificação dos bytes dos fluxos elementares (vídeo e áudio) e variações excessivas podem provocar a perda de sincronismo nos mecanismos de reconstrução do relógio nos receptores, principalmente nos PLLs.
A influência das variações na distância de amostras consecutivas no receptor devido à mudança nas referências de tempo do relógio reconstruído (clock ticks) pode ser evidenciada na figura 2. Nota-se que uma mudança na distância entre PCRs determina uma taxa menor ou maior de decodificação, pois as referências de tempo do relógio mudam seu espaçamento. A situação ideal, considerada no modelo de sincronismo do MPEG-2 System, é obtida quando a distância entre os bytes dos PCRs i’ e i” é igual a diferença dos instantes registrados nos PCRs.