High Dynamic Range – Expandindo os limites do vídeo

NAB 201nab_set6

“O OLHAR DOS ESPECIALISTAS DA SET”

por Guido Stolfi

Um dos temas “quentes” da atualidade, trabalhado em várias sessões técnicas e presente em muitos estandes na feira da NAB deste ano, é a HDR – “High Dynamic Range”, que se refere a novos dispositivos de captura e exibição de imagens capazes de proporcionar um aumento considerável da faixa dinâmica de luminância, permitindo a visualização de detalhes tanto em áreas de sombra como nas altas luzes.
Antes de falarmos da HDR, temos que explicar algo sobre aquilo que agora é caridosamente descrito como “Standard Dynamic Range”, ou SDR.
Até recentemente, toda a cadeia de processamento de vídeo estava fundamentada numa série de parâmetros (resolução espacial, contraste, colorimetria, etc.) que representavam apenas o mínimo absolutamente necessário para prover qualidade aceitável para o observador médio. Apesar disso, a grande vantagem da televisão – levar, virtualmente, o espectador a qualquer época e lugar – suplantou todas essas mediocridades.
Quanto à colorimetria, só para dar um exemplo, a recomendação ITU-R BT.709 especifica para a SDR cores primárias que cobrem cerca de 33% do espaço perceptual de cromaticidades (CIE U’-V’ 1976), e com saturações menores que 50% para certos tons verde azulados. Qual a justificativa? Esse espaço corresponde às cromaticidades da maioria dos objetos naturais, quando iluminados com luz branca. Isso faz sentido, pois quanto mais saturada é a cor de um objeto, menos comprimentos de onda (e, portanto, menos energia) são refletidos e mais escuro será esse objeto. Quebra o galho na maioria das vezes. Bem, e quando é que isso deixa de funcionar?
Em geral é no dia 31 de dezembro. Mais especificamente, próximo da meia-noite.
Poucas coisas ficavam tão ruins e insípidas na TV quanto os espetáculos de fogos de artifício. Com captação noturna, o brilho dos fogos provoca saturação da câmera, fazendo a crominância cair a zero. Todos os fogos ficam “chapados” e esbranquiçados, e perdem o impacto original das cores saturadas e detalhes de alta luminosidade. Culpa da faixa dinâmica insuficiente.
Mesmo a TV de Alta Definição (HD – 2k) continuou usando praticamente os mesmos parâmetros, aumentando apenas o campo de visão relativamente à TV convencional (30 graus contra 10 graus). Com o advento do 4k, o ângulo de visão cresceu um pouco, mas a resolução espacial da imagem melhorou significativamente. Isso abriu espaço para a busca de outros aperfeiçoamentos, entre os quais temos a expansão do espaço de cores (WCG – “Wider Color Gamut”), o aumento da taxa de quadros por segundo (HFR – “High Frame Rate”) e o aumento da faixa dinâmica da luminância (HDR). Depois do fracasso do 3D – mas isso é outra história – a meta agora é obter condições seguras para prover qualidade excelente para a maioria dos espectadores. Em muitos casos, os padrões vão estar à frente da tecnologia, aguardando o futuro para serem completamente viabilizados.
A técnica HDR é objeto de várias especificações preliminares, como o Hybrid Log-Gamma (HLG) e o Perceptual Quantizer (PQ). Nas conferências técnicas da NAB, tanto Tim Borer (BBC), com o trabalho “Interconversion of High Dynamic Range Video Formats”, quanto Yukihiro Nishida (NHK), na apresentação “Launching 8k/4k High Dynamic Range Television Broadcasting”, citaram as diferenças entre os dois sistemas e apresentaram técnicas para sua transcodificação.
O sistema HLG define um sinal de Luminância que varia de zero a 100%, conforme a Figura 1. O valor de 50% corresponde ao nível de branco; até este ponto, a curva HLG é semelhante à expressão da luminância na BT.709. Acima de 50%, representa luminosidades maiores do que o branco. 100% corresponde a uma luminância 12 vezes maior! Se atualmente um televisor é capaz de apresentar luminância máxima de 300 nits, um monitor HDR deveria chegar a quase 4000 nits!

Figura 1 – Função de Transferência Opto-Elétrica do HLG

Figura 1 – Função de Transferência Opto-Elétrica do HLG

No estande da NHK haviam de fato monitores com essa capacidade, mostrando efeitos de contraluz e reflexos nunca antes vistos numa tela de TV. Fogos de artifício inclusive. Já no estande da Harmonic, era feita a comparação de um monitor com 1000 nits ao lado de um com 100 nits, para demonstrar um sistema de conversão entre SDR e HDR. Essa é, aliás, a ponta do iceberg que nos espera: compatibilizar a captação, transmissão e exibição em HDR com o legado de conteúdos e televisores SDR. Se mal utilizado, um monitor HDR tem capacidade de ofuscar a visão e provocar sério desconforto ao espectador.
Kirk Barker (Technicolor) abordou este assunto na palestra “High Dynamic Range: Challenges and Opportunities Linked to the Next Wave of Consumer Video Innovation”. Afirmou que falta padronização entre Cinema, Vídeo e Radiodifusão, e listou uma série de problemas de conversão e compatibilidade, como ruído em zonas de sombra e amenização de saturações, demonstrando com isso as facilidades do seu software de processamento para pós-produção.

Figura 2 - Cromaticidades dos Primários BT.709 (HD) e BT.2020 (WCG)

Figura 2 – Cromaticidades dos Primários BT.709 (HD) e BT.2020 (WCG)

Embora seja uma outra área, a expansão do espaço de cores (WCG) anda junta com a HDR. Para substituir a colorimetria da BT.709, temos agora a BT.2020, que utiliza primárias monocromáticas nos comprimentos de onda de 467, 532 e 630 nanômetros (Figura 2), e cobre cerca de 57% do espaço perceptual. Em sua apresentação “BT.202 Colorimetry – Challenges and Opportunities”, Sindar Sadasivan, da QD Vision, mostrou tecnologias exóticas como lasers, “quantum dots” e outras formas de chegar a essa gama de cores. Mas foi levantada a questão da “falha metamérica do observador”: na verdade, devido a diferenças genéticas, amarelamento da córnea, densidades e constituições diferentes de pigmentação nas células da retina etc., não existe o tal do “Observador Padrão” que estaria na base da teoria colorimétrica. Cada indivíduo é ligeiramente diferente. Quanto mais as primárias são monocromáticas, e quanto mais o azul e o vermelho se aproximam dos extremos do espectro visível, mais as diferenças entre observadores se tornam aparentes: aquilo que é uma cor para um espectador é outra cor para outro.
Da minha parte, como eu uso óculos, as imagens WCG tendem a apresentar intensas franjas coloridas nos contornos, devidas à dispersão cromática nas lentes. Apesar da beleza das cores vivas, dos magentas e cianos profundos, a imagem acaba ficando desconfortável, principalmente ao movimentar a cabeça. Além disso, a luz emitida por esses monitores possui um índice de reprodução cromática muito baixo, e deixa o ambiente com uma coloração desagradável.
Jaclyn Pytlarz, da Dolby, apresentou uma colorimetria denominada I CP CT, que substitui com vantagens a Y CB CR quando usada em conjunto com a HDR. Segundo ela, uma das vantagens é eliminar interferências cruzadas entre luminância e crominância, resolvendo assim alguns problemas sutis que acontecem na justaposição ou mixagem de cores diferentes.
Finalmente, Sean McCarthy (da ARRIS) apresentou o trabalho “Understanding the Viewer Experience when Designing Ultra HD Services”, que juntou HDR com WCG e High Frame Rate (HFR). Mostrou estudos recentes das bases do mecanismo visual, que justificam a necessidade de altas taxas de quadros por segundo para criar a “sensação de presença”, que é o objetivo dos sistemas de Ultra Alta Definição (UHD). Para ele, a “sensação de estar lá” aparece quando o espectador tem que mover a cabeça para apreender a totalidade da imagem. Neste caso (que acontece para telas maiores que o HD), a velocidade do movimento ocular impõe uma restrição à frequência temporal mínima, para que o olho não se perca durante a trajetória. Esta restrição soma-se ao fenômeno de cintilação na visão periférica, exacerbado pela alta luminância dos monitores HDR, justificando assim a necessidade da varredura 120p.
Em resumo, temos que lembrar que uma das razões que movem essas evoluções tecnológicas, é claro, é fazer com que os espectadores joguem fora suas TVs antigas e comprem novas. Mas é inegável que os avanços são impressionantes: as imagens vistas na feira são incomparáveis, mesmo em relação ao HD. Restam, porém, muitos problemas de compatibilidade a serem resolvidos, principalmente pela falta de padrões definitivos.
Onde vamos chegar? O objetivo final já está aí – é o 8k, que vem sendo demonstrado pela NHK há 10 anos. Hoje ele está com HDR, HFR, WCG, som 22.2, quantização de 12 bits e a mais abrangente sensação de “estar lá”. Só não está à venda no supermercado. Você aguenta esperar?

 

ed159_pag56_3Guido Stolfi é professor de Telecomunicações na Escola Politécnica da USP, onde leciona Princípios de Televisão Digital desde 1997, e pesquisador associado no Laboratório de TV Digital do Instituto Presbiteriano Mackenzie. Trabalha com digitalização de vídeo desde 1986 e participou dos estudos do sistema de modulação ISDB-T para a definição do SBTVD. Contato: [email protected]

Post Tags: