Imprimir artigo

Um mundo com legendas

Combinando óculos de realidade aumentada e transcrição em tempo real, a XRAI Glass quer traduzir a fala para pessoas surdas

Por Emma Woollacott

(Ilustração por iStock/calvindexter)

Durante uma visita a sua família nas férias de inverno de 2021, Dan Scarfe, profissional de TI, ficou chateado porque seu avô, que tinha então 96 anos, não conseguia participar totalmente das conversas devido à sua surdez crescente.

Leia também:

Moradia (para todos) primeiro

Um selante sustentável

De acordo com a Organização Mundial da Saúde (OMS), mais de 1,5 bilhão de pessoas em todo o mundo – quase 20% da população global – vivem com algum tipo de perda de audição, e 430 milhões dessas pessoas têm deficiência auditiva. Além disso, embora muitos surdos possam se comunicar por meio da língua de sinais ou ouvir com dispositivos como aparelhos auditivos ou implantes cocleares, o isolamento social como o vivido pelo avô de Scarfe é comum.

Scarfe queria ajudar. “Já temos legendas em tempo real no [Microsoft] Teams e no Zoom, e começamos a pensar nos novos óculos de realidade aumentada (AR)”, lembra ele. “Por que não podemos simplesmente combinar os dois e criar legendas ao vivo?” Scarfe montou uma parceria com seis amigos e ex-colegas de trabalho com experiência em aprendizado de máquina, marketing e trabalho de caridade para fundar a XRAI Glass em julho de 2022. Sua missão, diz ele, é “legendar o mundo”.

O XRAI Glass é um aplicativo que permite que os óculos de realidade aumentada se conectem a serviços de transcrição baseados em nuvens da Amazon, Microsoft e Deepgram para criar legendas em tempo real na tela dos óculos.

“Basta carregar o software no celular e você pode vê-lo conectado aos serviços de nuvem”, explica Scarfe. “Literalmente, trata-se de projetar conteúdo digital no mundo real bem diante dos seus olhos.”

O software tem recursos de gravação e reprodução e pode até identificar um alto-falante em meio a um grupo de pessoas.
Em apenas um ano, a empresa alcançou 5.000 usuários no mundo todo. Carol Cover, profissional de gestão educacional cuja audição se deteriorou rapidamente após um implante coclear fracassado, elogia a tecnologia por ajudá-la a participar de conversas em restaurantes movimentados e a se confessar na igreja com privacidade, como os demais fiéis. “É como um milagre para mim”, diz ela.

O financiamento da empresa vem de vários investidores privados, entre os quais já levantou alguns milhões de dólares. Instituições de caridade como o Royal National Institute for Deaf People, do Reino Unido, e a DeafKidz International também deram apoio financeiro.

Uma das primeiras preocupações de Scarfe e dos demais fundadores é a privacidade, e a política da XRAI tem sido a de se abster de coletar dados dos dispositivos dos usuários. Em vez disso, o utilizador do aplicativo é o controlador oficial dos dados e o responsável por garantir que seus interlocutores consintam com a transcrição de suas palavras, de acordo com as leis de privacidade de cada local.

A fase de inicialização também contou com uma série de atualizações de software, incluindo os serviços de tradução do aplicativo e seu assistente virtual. O app agora pode processar 76 idiomas e 140 dialetos diferentes, traduzi-los e transcrevê-los em tempo real. O novo assistente virtual é executado no ChatGPT, que permite que os usuários façam perguntas do tipo “Como vai ser o tempo hoje?” e tenham as respostas exibidas como legendas nas telas de seus óculos. O assistente também pode reproduzir conversas anteriores e criar um resumo de seu conteúdo.

Os fundadores da XRAI estão desenvolvendo um software de tradução reversa que permitirá que os dispositivos falem e transcrevam. Essa pode ser uma característica importante para, por exemplo, aqueles que são surdos de nascença e incapazes de falar sozinhos – cerca de 70 milhões de pessoas em todo o mundo, de acordo com a OMS.

Uma vez que muitos surdos preferem usar a língua de sinais para se comunicar, Scarfe está interessado em desenvolver uma versão do software que possa traduzir a Língua Americana de Sinais (ASL), projetando a palavra falada em uma imagem de realidade aumentada dentro dos óculos. Ele tem conversado com uma empresa que pode concretizar essa ideia nos próximos meses.

Scarfe conta que recebe regularmente mensagens de usuários encantados por poder ouvir podcasts, conversar durante o jantar e se confessar sem ter que usar mensagens escritas. “Para uma empresa pequena como a nossa, é incrível o feedback que tivemos de todo o mundo.”

A AUTORA

Emma Woollacott é jornalista britânica e já contribuiu para a BBC, para a revista Forbes e outros veículos.



Newsletter

Newsletter

Pular para o conteúdo