• PT
  • EN
  • ES

UHDTV – O Áudio no Sistema de TV de Ultra-Alta Definição

O áudio do Super Hi-Vision
Na edição anterior havia dito que tudo relacionado à TV de ultra-alta definição (UHDTV ou Super Hi-Vision) é especial, mas às vezes acho que especial é pouco! Chega a ser um absurdo, um sistema de som de 22.2 canais, assim como o é uma tela de 600 polegadas, 33 milhões de pixels, 16 vezes a definição do HDTV, e tudo mais.
A qualidade do vídeo exibido impressiona muito, e o áudio segue a mesma linha, afinal, ele tem que complementar o propósito do vídeo de fazer a platéia acreditar que está no local da cena, e não a assistindo.
Numa das exibições que assisti, o vídeo mostrava algumas crianças brincando e, por mais de uma vez eu me senti cercado por elas, ou melhor, pelo som delas. Numa outra apresentação, também “estive” na torcida durante aquela partida de futebol. Ouvi o juiz apitar o escanteio, por meio de uma caixa acústica posicionada atrás de mim, no nível do chão. Ouvi claramente o som do chute que o jogador deu na bola, numa outra caixa abaixo, à minha direita, e escutei o barulho do cabeceio do atacante desviando a bola para dentro do gol, bem ali naquela caixa acústica do centro da sala, a meia altura. Eu sei que toda a torcida também ouviu, afinal “nós”, metade dela, vibramos com aquele gol, metade da torcida gritou com aquele gol, em todas as caixas acústicas. Não foram todos que vibraram, porque a outra metade era do time adversário! Aquele trecho de futebol foi o mais bonito que já vi e ouvi, sem estar no estádio, mas me sentindo totalmente lá.
Os cientistas da NHK, em seus estudos, definiram que o sistema sonoro do SHV precisa satisfazer, antes de mais nada, os seguintes pontos:

• localizar sons frontais posicionados acima da área da tela;
• reproduzir os eventos sonoros que ocorrem em todas as direções ao redor do espectador, inclusive nas elevações;
• reproduzir uma impressão espacial tridimensional a fim de aumentar a sensação de realidade;
• criar uma ampla área audível com qualidade excepcional;
• ser compatível com os sistemas sonoros multicanais existentes (3).

Para atender a essas premissas, foi idealizado um sistema com três camadas de caixas acústicas arranjadas horizontalmente, mais um sistema adicional para reprodução de baixas frequências. Dessa forma, não se trata simplesmente de um “sistema de áudio”, mas de um arranjo espacial tridimensional que envolve completamente o ouvinte e dá a uma perfeita sensação de realidade e presença nunca anteriormente experimentada. Nesse arranjo, as caixas acústicas são instaladas estrategicamente de forma que o ouvinte, dentro da sala, se sinta realmente parte do arranjo. A figura 1, ilustra o sistema.
A camada superior é constituída de nove canais divididos em três grupos, destinados a reproduzir os sons que vêm do alto, tal como aviões, helicópteros e pássaros. Um desses grupos, situado bem acima da tela, é constituído de três caixas acústicas (SF1, SF2 e SF3) e reproduz os sons que se situam exatamente sobre a cena; o segundo grupo possui mais três caixas, sendo uma delas situada no teto da sala e as outras duas, no mesmo nível da primeira, porém nas laterais (SC1, SC2 e SC3), e reproduzem os sons bem acima do espectador; o terceiro grupo é constituído de três caixas acústicas instaladas na parte traseira da sala (ST1, ST2 e ST3) e reproduzem sons vindos do alto, atrás do espectador.
A camada mediana possui 10 canais, divididos em dois grupos: o primeiro é composto de cinco caixas frontais, sendo três delas (MF2, MF3 e MF4) posicionadas atrás da tela, as quais atuam tal e qual os canais frontais dos Home Theaters, mais duas frontais posicionadas nas laterais da tela (MF1 e MF5), atuando da mesma forma que os canais centrais dos Home Theaters. As outras cinco são distribuídas nas laterais (MC1 e MC2) e na traseira da sala (MT1, MT2 e MT3). Esses canais reproduzem sons que se situam à altura dos ouvidos do espectador. A camada inferior, instalada abaixo da tela, é composta por três canais (IF1, IF2 e IF3), mais dois adicionais (LF1 e lf2) para reprodução de LFE ou Low Frequency Effects intercalados com os outros três e no mesmo nível, com a finalidade de reproduzir os sons que partem do nível do chão, tais como praia, riachos, pessoas, carros, etc.
Nos sistemas de áudio multicanais atualmente utilizados, o 2.0 e o surround de 5.1 canais, chamados sistemas 2D por não atuarem na dimensão vertical, o som está fortemente atrelado à imagem exibida e parece sair da própria tela, ou seja, é um som basicamente frontal. O máximo que se consegue, por meio de um Home Theater, é uma boa separação daquele som, utilizando, porém, a mesma dimensão, sem conseguir envolver plenamente o ouvinte. O crédito para a excepcional contribuição do áudio ao sistema de SHV deve-se também em grande parte à forma de captura dos sons. São utilizados arranjos de microfones que capturam não apenas aquele som envolvido diretamente com a cena, mas também os sons dos arredores dela, como podemos ver nas montagens mostradas nas figuras 2 e 3. É quase que como se fossem riscadas do vocabulário as palavras “silêncio, gravando”. Aqui, a idéia é gravar todos os sons do ambiente, pertencentes ou não à cena. Aquele avião ou helicóptero que você não está vendo na cena, mas está ouvindo; aquele barulho de riacho ou daquela britadeira; as crianças brincando no parque ao lado… Todos esses sons fazem parte do programa, mesmo sem pertencer à cena, e eles são reproduzidos o mais próximo possível da posição em que eles ocorrem, ou seja, o do avião é reproduzido no alto, de preferência se deslocando, as crianças na camada inferior, e assim por diante. Com essa multiplicidade de fontes de sinais sonoros sendo simultaneamente reproduzidas, o espectador não tem como não se sentir participante da ação.
Em testes realizados com o objetivo de comparar as impressões acerca de vários atributos espaciais utilizando conteúdos com imagem UHDTV numa grande sala, os cientistas da NHK demonstraram que o sistema tridimensional de 22.2 multicanais pode produzir sons espaciais com melhor qualidade, realidade e presença numa área mais ampla de audição do que os sistemas surround 5.1 e o estéreo 2.0 canais.

Demonstrações
Na demonstração realizada em novembro de 2005, quando ocorreu a primeira transmissão oficial ao vivo, durante a World EXPO 2005 em Aichi (Japão), o sinal de áudio trafegou sem compressão por uma distância superior a 260 km, por meio de uma rede de fibra ótica, a uma taxa de 28 Mbit/s. Foi durante essa World EXPO que os cientistas realizaram as avaliações subjetivas dos três sistemas de som multicanais (2.0, 5.1 e 22.2 canais) que terminaram com a aprovação do sistema de 22.2 canais.
No ano seguinte, foi a vez de Osaka receber os sinais de UHDTV provenientes de Tókio, via rede óptica IP. O sinal de vídeo foi codificado em Mpeg-2 e comprimido para cerca de 600 Mbit/s. O áudio, em 32 canais digitais e amostrado em 48 kHz com 24 bits foi embutido nos streams do MPEG-2 e transmitido a cerca de 500 Km de distância.
Em setembro de 2008, durante o IBC, ocorreu uma transmissão simultânea via satélite, a partir de Londres, e via rede IP, partindo de Turim, sendo ambos os sinais recebidos em Amsterdã. O sinal de áudio vindo de Londres sem compressão seguiu mixado ao vídeo comprimido em um transport stream MPEG- 2. De Turim, o vídeo e o áudio foram codificados em MPEG-4 AVC e AAC respectivamente, produzindo um sinal codificado de cerca de 140 Mbit/s, o qual foi dividido em dois transport streams e transmitido por meio de dois transponders de satélite, modulados em 8PSK. Em Amsterdã, os sinais foram recebidos simultaneamente numa sala e exibidos aos espectadores.

Progressos e dificuldades
Os pesquisadores do NHK STRL (Science and Technical Research Laboratory), em seus constantes estudos e experimentos sobre o SHV, desenvolveram em 2007 um sistema de reprodução de fone de ouvido de 22.2 canais que foi demonstrado no STRL Open House naquele ano. A figura 4 mostra esse fone e mais alguns detalhes do sistema de reprodução de som em 22.2 canais.
Também foi mostrada uma mesa de áudio com função panning tridimensional (figura 4) para auxiliar na produção de programas com 22.2 canais. Outro desenvolvimento marcante foi a caixa acústica para uso doméstico com três níveis de alto falantes, um baixo, um médio e um alto, que eles acharam por bem chamar de “menino alto”, cuja performance de localização de som foi confirmada num experimento de avaliação reproduzindo um som de alta qualidade ao vivo (4).
Embora em termos de tecnologia o sistema de som de 22.2 canais pareça estar totalmente dominado, os engenheiros e projetistas ainda sofrem com a falta de conhecimento e experiência na área em relação à mixagem dos efeitos sonoros, musicas e vozes. Existem várias questões a serem resolvidas, tais como o uso efetivo das camadas superior e inferior, o movimento tridimensional das fontes sonoras e a criação do sentido de elevação.

Referências:
– Masayuki Sugawara – NHK; EBU-Technical Review – Hot Topics – 2008 Q2; Super Hi-Vision – research on a future ultra-HDTV system. http://www.ebu.ch/fr/technical/trev/trev_2008-Q2_ nhk-ultra-hd.pdf
– John Zubrzycki, Thomas Davies, Peter-Calvert Smith, Paul Styles, Bill Whiston, Yukihiro Nishida and Masaru Kanazawa; EBU-Technical Review – Hot Topics – 2009 SE; Super Hi-Vision – the London-Amsterdam live contribution link. http://www.ebu.ch/en/technical/trev/trev_2009- Q0_SHV-BBC.pdf
– Kimio Hamasaki, Toshiyuki Nishiguchi, Reiko Okumura, Yasushige Nakayama and Akio Ando: 22.2 Mutlichannel Sound System for Ultrahigh- Definition TV; First published in SMPTE Technical Conference Publication in October 2007. http://www.nhk.or.jp/digital/en/technical/pdf/ IBC2007_08040907.pdf
– NHK STRL Annual Report 2007- Research Report 1 – p. 04. Ultimate Broadcasting System Conveying a Strong Sensation of Reality. 1.3 Research on extremely realistic audio. http://www.nhk.or.jp/strl/results/annual2007/en/frm-set-r1.html

*Alberto é Supervisor de Projetos da TV Cultura de São Paulo, vice-diretor editorial da SET e diretor da AdesedA-Consultoria, Projetos e Instalações (adeseda@uol.com.br)

Revista da SET – ANO XXI – N.109 – 2009