A Microsoft lança o ‘Group Transcribe’, um aplicativo de transcrição e tradução para reuniões pessoais

154

Um novo projeto da incubadora interna da Microsoft, o Microsoft Garage, apresenta uma visão diferente das transcrições de reuniões. Embora hoje haja uma série de aplicativos de transcrição em tempo real para usar em seu telefone – como Otter.ai ou o aplicativo Gravador do Google para dispositivos Pixel, por exemplo – o novo aplicativo Group Transcribe da Microsoft reinventa as transcrições de reuniões como um processo mais colaborativo, onde todos simultaneamente grava a reunião em seu próprio dispositivo para maior precisão. Ele também oferece tradução em tempo real para idiomas falados em mais de 80 localidades distintas.

Para usar o aplicativo, uma pessoa deve primeiro iniciar a reunião em seu próprio dispositivo. Eles podem então convidar os outros participantes da reunião para ingressar na sessão via Bluetooth, um código QR digitalizável ou compartilhando um link. Depois que os outros participantes ingressarem na sessão e a reunião começar, cada pessoa verá a transcrição aparecer em tempo real em seu próprio dispositivo.

 

Créditos de imagem: Microsoft

O aplicativo, que é alimentado por tecnologia de fala e linguagem AI, é capaz de transcrever com maior precisão e atribuição de alto-falante com base no volume do alto-falante capturado pelo microfone de cada telefone sendo usado na reunião.

Ao comparar o nível de volume da voz de uma pessoa, o serviço de nuvem tenta determinar qual dispositivo está mais próximo do locutor e as preferências de idioma desse locutor. Isso significa que os alto-falantes também são identificados com precisão no aplicativo, o que pode ser um desafio para outros aplicativos de transcrição em que apenas uma pessoa está gravando.

Além disso, se os participantes da reunião quiserem falar em seu próprio idioma, o aplicativo pode fornecer a tradução para os dispositivos de outras pessoas em seu próprio idioma.

 

Créditos de imagem: Microsoft

A Microsoft diz que o aplicativo foi projetado com acessibilidade em mente, pois torna mais fácil para pessoas surdas, com deficiência auditiva e falantes não nativos participarem mais plenamente das reuniões, acompanhando as transcrições e traduções ao vivo.

O projeto em si foi desenvolvido por funcionários da Microsoft que, coletivamente, falam mais de uma dezena de idiomas e dialetos diferentes.

“Esta pode ser uma ferramenta fantástica de comunicação. O que eu adoraria ver é que isso quebraria as barreiras para as pessoas que falam vários idiomas ”, disse Franklin Munoz, Líder Principal de Desenvolvimento, ao apresentar o projeto.

Como a maioria dos serviços de transcrição baseados em nuvem, o aplicativo não deve ser usado para reuniões altamente confidenciais. No entanto, a Microsoft criou dados granulares e controles de privacidade que permitem aos usuários decidir se ou quando desejam compartilhar seus dados de conversa.

 

Créditos de imagem: Microsoft

Para funcionar, os dados de entrada de áudio e texto coletados são enviados para as tecnologias de reconhecimento de fala e tradução online da Microsoft – embora com um identificador gerado aleatoriamente, não seu nome real.

Artigos Recentes:

Embora a Microsoft não salve as transcrições e gravações de reuniões depois do fato – elas são salvas no seu dispositivo – o aplicativo incentiva os participantes a “contribuir” com suas gravações de reuniões para a Microsoft para que possa melhorar o serviço.

Isso permite que a Microsoft retenha as transcrições de texto geradas pelo reconhecimento de voz e áudio quando todos os participantes da reunião concordarem em participar dessa sessão. Ao revisar os dados, a Microsoft pretende melhorar seus recursos de reconhecimento de voz e atribuição de alto-falante ao longo do tempo, afirma. Os dados do usuário serão acessados ​​sob o NDA por funcionários da Microsoft e contratados de outras empresas que trabalham para a Microsoft, mas não incluirão nenhuma das credenciais da conta dos palestrantes.

Os revisores também terão acesso apenas a trechos aleatórios de áudio, não a gravações completas. E a Microsoft diz que “desidentifica” gravações de reuniões removendo longas sequências de números que poderiam representar coisas como números de cartão de crédito ou números de telefone, por exemplo. Os usuários podem excluir suas gravações compartilhadas anteriormente a qualquer momento, mas, caso contrário, elas são retidas por até 2 anos em servidores criptografados, diz a empresa.

Como não há uma maneira de uma empresa, em nível de administrador, configurar ou bloquear a configuração de “contribuição” para todos os usuários, as pessoas devem pesar cuidadosamente as vantagens e os riscos de tal serviço. É também um projeto do Microsoft Garage, o que significa que deve ser mais experimental e pode ser fechado a qualquer momento.