DeepL lança DeepL Voice, tradutor de voz em tempo real

DeepL lança DeepL Voice, tradutor de voz em tempo real

A DeepL é uma startup alemã que acabou se tornando bastante conhecida graças as suas traduções precisas e detalhadas em seus produtos. Por isso, a empresa tem planos de se destacara inda mais nessa área, e agora traz uma novidade bem interessando com o lançamento do DeepL Voice.

A DeepL, que atualmente tem uma avaliação de 2 bilhões de dólares e mais de 100 mil clientes pagantes, agora está apostando na tradução de áudio em tempo real com o novo recurso. A ideia é trazer uma opção mais precisa e rápida para o público nesse segmento. Confira mais detalhes.

Leia também:

Fones Galaxy Buds agora podem fazer tradução de chamadas em tempo real
Telegram ganha tradução de mensagens em tempo real, emojis com animações de tela cheia e mais

DeepL Voice traduz voz para texto em tempo real

DeepL Voice

O novo recurso DeepL Voice permite que os usuários possam ouvir alguém falando em outro idioma e receber a tradução automaticamente em sua própria língua (ou outro idioma escolhido), tudo em tempo real e com o máximo possível de precisão.

Atualmente, a DeepL é capaz de captar o áudio em idiomas como inglês, alemão, japonês, coreano, sueco, holandês, francês, turco, polonês, português, russo, espanhol e italiano, oferecendo legendas traduzidas em até 33 idiomas, o que mostra uma grande abrangência.

O recurso é voltado principalmente para reuniões e videoconferências ao vivo, mas vai além da tradução comum de áudio. Isso porque, ao invés de gerar o resultado em áudio ou vídeo, o DeepL Voice apresenta as traduções em forma de texto. Isso garante um processamento mais rápido, algo importante para as conversas ao vivo, já que muitas soluções de tradução baseadas em IA ainda apresentam certo atraso, o que acaba afetando as interações em tempo real.

Como o DeepL Voice funciona

DeepL Voice

No caso das reuniões presenciais, o usuário pode configurar o recurso em um smartphone, colocando-o entre os participantes em uma mesa de reunião para que ambos visualizem a tradução como uma “imagem espelhada”.

Já nas videoconferências, as traduções aparecem em forma de legendas, recurso que atualmente está disponível apenas na plataforma Microsoft Teams, que já alcança a maioria dos clientes B2B da DeepL. Jarek Kutylowski, fundador e CEO da DeepL, vê o novo recurso como um primeiro passo da empresa em tradução de voz e afirma que este é o futuro da tradução para o próximo ano.

Embora o foco principal seja para uso em reuniões corporativas, o DeepL ainda acredita que o recurso também poderá ser bem aproveitado em outras áreas, como a de atendimento ao cliente, em locais como restaurantes e outros estabelecimentos de atendimento direto ao público. Isso porque ela garantiria uma comunicação mais eficiente entre funcionários e clientes que falam diferentes idiomas, contribuindo para um melhor atendimento e experiência do usuário.

O diferencial do DeepL está em sua tecnologia

Mas, por mais interessante que seja o novo recurso, ele não é exatamente inédito, o que significa que a concorrência no mercado de tradução em tempo real está em alta. Empresas como Google e startups especializadas em IA também estão explorando traduções automáticas de áudio, com ferramentas como as legendas automáticas do Google Meet e o Eleven Labs Dubbing, que utiliza vozes deepfake para entregar traduções sincronizadas com vídeo.

Embora as soluções de IA de voz ofereçam novas possibilidades, o diferencial do DeepL Voice está na rapidez do processamento de texto. Para Kutylowski, o recurso de tradução em texto é calculado e exibido com agilidade, enquanto as tecnologias de processamento de áudio e vídeo ainda precisam evoluir para entregar resultados tão rápidos quanto o texto.

Desde 2017, quando a empresa lançou seu tradutor, a demanda por tradução de voz é a principal solicitação dos clientes da DeepL. Diferente de muitas empresas que utilizam modelos de linguagem de outras companhias, o DeepL desenvolve suas próprias tecnologias de tradução. Em julho, a empresa lançou um novo modelo de linguagem otimizado especificamente para traduções, que, segundo Kutylowski, supera até mesmo o GPT-4, do OpenAI, e as soluções do Google e Microsoft para traduções.

Privacidade e segurança dos dados

Com o crescimento da tecnologia de IA, a preocupação com a privacidade e proteção de dados também cresce. O DeepL Voice transmite os áudios para os servidores da empresa, onde a tradução é processada, mas Kutylowski garante que nenhum dado de áudio é armazenado ou utilizado para o treinamento dos modelos de linguagem da empresa.

A DeepL assegura que está comprometida em seguir as regulamentações de proteção de dados, incluindo o GDPR, e trabalhará em parceria com seus clientes para evitar qualquer violação.

Fonte: techcrunch

Sobre o Autor

Avatar de Larissa Ximenes
Redes Sociais:

Deixe seu comentário

X