Closed Caption na TV Brasileira – Primeira Parte

Nº 143 – Julho 2014

Por Marina Iorio*

ARTIGO

A Revista da SET solicitou a duas empresas brasileiras que trabalham com Closed Caption que expliquem porque é necessária a implantação desta ferramenta nas emissoras do Brasil. Nesta edição publicamos a visão da ShowcasePRO, na próxima será a vez da EITV, ambas parceiras da SET, e comprometidas com o desenvolvimento de tecnologias brasileiras que possam ser utilizadas no padrão ISDB-TB.

As emissoras de televisão do Brasil e do mundo devem, por obrigação moral e jurídica, transmitir informação, discussão e entretenimento a população inteira, inclusive àqueles que possuem alguma deficiência e já sofrem o bastante com as dificuldades de acesso do dia-a-dia. É por isso que as emissoras de televisão contam com uma importante tecnologia: o closed caption, ferramenta que, até certo grau, consegue amparar às dificuldades do deficiente auditivo de acompanhar uma programação de seu interesse.
O closed caption, ou legenda oculta, é uma Tecnologia da Informação e Comunicação (TIC) que transforma o áudio de um filme ou programa de televisão em texto. Assim, pessoas que possuem alguma deficiência auditiva podem acompanhar a programação desejada através da legenda, que inclui efeitos sonoros como aplausos, risos ou fundo musical.
A Lei 10.098/2000, ou Lei da Acessibilidade, como é conhecida, é a responsável pela implementação da legenda oculta na programação das emissoras brasileiras, assim como de outras tecnologias de acessibilidade, como libras e audiodescrição.
Desde junho de 2013, a Portaria Nº 310/2006, do Ministério das Comunicações, determinou que as emissoras de televisão deveriam cumprir doze horas diárias de closed caption. Essa norma será gradativa até que se cumpra 24 horas diárias de programação legendada.
A legenda oculta não só é importante para deficientes auditivos como também para ambientes ruidosos, como bares, restaurantes e aeroportos.
A produção de closed caption não é tão simples quanto parece. É um processo inicialmente complexo, que exige prática e concentração, especialmente em uma emissora que possui quase 24 horas de programação ao vivo. Então, como produzir uma legenda simultânea ao que o apresentador fala? Por isso, e para quê seja possível ter closed caption é possível implantar nas emissoras o método conhecido como “Reconhecimento de Voz” para a produção da legenda. O Reconhecimento de Voz requer um locutor para efetuar o trabalho. O locutor basicamente repete o que é dito no programa para um software que reconhece vozes e produz em forma de texto. O software trabalha com base em um banco de dados com milhares de vozes pré-gravadas. Ou seja, a voz do locutor é digitalizada e os sons emitidos são comparados com aqueles gravados no banco de dados. Se o aplicativo conseguir reconhecer semelhança entre aquilo que foi dito com os sons de sua coleção, a palavra aparece na tela em forma de texto.

Imagem de closed caption da TV Gazeta

A base de dados desse programa pode ser atualizada e personalizada pelo locutor. Quanto mais palavras novas ele adicionar no dicionário do software, mais palavras serão escritas corretamente, aumentando a sua precisão. Giovanna Frugis é operadora de closed caption na TV Gazeta há um ano e afirma que “o mais importante é ter muita concentração para não perder nenhuma informação do que o apresentador está falando e sempre melhorar o perfil de voz, ou seja, salvar novas palavras todos os dias”. Mesmo assim, podem ocorrer erros, mas Giovanna argumenta: “Com uma boa mão-de-obra conseguimos produzir uma legenda com no máximo 2% de erros e 4 segundos de atraso, que é o que a ABNT exige”.
Há outra forma de produção de closed caption: por estenotipia. Neste caso, os sons e falas são registrados através de um estenótipo, um teclado especial que representa letras e grupos de fonemas. Porém, este é um método arcaico, que exige de cinco a sete anos de treinamento até que o aluno se torne profissional.
Os modos de produção por Reconhecimento de Voz e estenotipia possuem o mesmo grau de precisão e qualidade na legendagem, a vantagem é que o Reconhecimento de Voz é uma forma de produção prática, moderna e de fácil aprendizado: o funcionário recebe três dias de curso antes de começar a operação.
Como o closed caption por Reconhecimento de Voz funciona tecnicamente. A cadeia de produção de legendagem oculta, nos moldes do modelo desenvolvido e aplicado pela ShowCasePRO, envolve:
a) XON75 – Sistema Gerador de Legendas Ocultas
b) Estação Locutora
c) ENC25 – Codificador de Legendas Ocultas
d) IFN50 – Implementador de Funções
e) Monitor com funcionalidade de decodificação de legenda oculta.

Todo codificador, também conhecido por “encoder” – responsável por modificar determinado fluxo, seja ele áudio, vídeo, dados ou a combinação destes. Porém, há codificadores que efetuam, por exemplo, a compreensão desses fluxos para poder transmiti-los por satélite; há outros que modificam o sinal, colocando, retirando ou trocando dados, que é o caso do Codificador de Legendas Ocultas.
Este codificador é responsável por agregar a informação de legendagem oculta “dentro” do fluxo de vídeo, para que essa ferramenta de acessibilidade esteja disponível para sua audiência. Para isso, ele deve lidar com aspectos importantes dentro de uma emissora, como a manutenção da sincronia e da qualidade de vídeo e áudio, além de ser compatível com formatos de vídeos diferentes.
O Codificador de Legendas Ocultas é uma produto desenvolvido no Brasil com algumas peças importadas, mas toda sua inteligência de funcionamento foi desenvolvida pela equipe de engenharia da ShowcasePRO.
O XON75 é um sistema central para produção de legendas ocultas, seja ao vivo ou pré-produzido. Ele integra diversos métodos e mídias para que o produto final seja o fluxo de texto padronizado para entrega ao codificador. Com ele, é possível extrair dados e gerenciar o acesso a produtos de terceiros, como motores de reconhecimento de fala (como o ViaVoice ou o Nuance) e sistemas de jornalismo (iNEWS, ENPS etc.) em uma interface web amigável e descomplicada.
No caso de TV Digital ou analógica há duas combinações possíveis: para TV analógica, o ENC25 trabalha no modo SD, ou Standard Definition. Para TV Digital, o ENC25 que opera no modo HD, ou Alta Definição, sendo necessário, em alguns casos, também o uso do IFN50.

*Marina Maria Iorio Duarte de Oliveira é graduada em jornalismo pela Faculdade Cásper Líbero