A ElevenLabs, empresa especializada em tecnologia de inteligência artificial, lançou uma nova plataforma de IA que pode trabalhar de maneiras impressionantes com áudio, mais especificamente com a voz do usuário.
A plataforma, que saiu recentemente da fase beta, é capaz de clonar a voz humana em até 30 idiomas diferentes. Isso é possível graças ao modelo de IA Multilingual v2, que não apenas detecta automaticamente o idioma do texto, mas também gera uma voz com nuances emocionais específicas de cada língua.
Leia também
O que é deepfake e por que é tão perigoso?
Voicebox é a nova ferramenta IA da Meta que recria a voz do usuário rapidamente
Como funciona o serviço?
O processo para clonar a voz é surpreendentemente simples e acessível. Os usuários precisam apenas enviar algumas amostras de fala para a plataforma. A partir daí, a ElevenLabs oferece dois tipos de serviços de clonagem de voz: um voltado para a conversão de texto em fala e outro, denominado “VoiceLab”, projetado para simular vozes específicas.
Com essas duas opções, o usuário pode, por exemplo, escrever um texto e fazer com que ele seja lido com a sua própria voz. Já a função “VoiceLab” permitirá usar vozes famosas, como de atores ou políticos.
Mati Staniszewski, CEO e cofundador da ElevenLabs, expressou otimismo sobre o potencial da nova ferramenta. Segundo ele, a tecnologia tem o poder de colocar criadores de conteúdo em pé de igualdade com grandes estúdios. Através do Multilingual v2, eles podem produzir áudio de alta qualidade em múltiplos idiomas sem a necessidade de estúdios de gravação ou dubladores profissionais.
“Com este lançamento, estamos um passo mais perto de tornar esse sonho uma realidade e tornar as vozes de IA de qualidade humana disponíveis em todos os dialetos. Nossas ferramentas de geração de texto para fala ajudam a nivelar o campo de jogo e trazem recursos de áudio falado de alta qualidade para todos os criadores lá fora“, disse o CEO da empresa.
Preocupações com deepfakes e desinformação
No entanto, a novidade não está isenta de controvérsias. Há preocupações éticas e morais significativas relacionadas ao potencial uso indevido da clonagem de voz. A empresa já tomou medidas preventivas, como limitar o acesso à clonagem de voz a contas pagas e implementar ferramentas de detecção baseadas em IA para mitigar riscos.
Em teoria, isso deve ser o suficiente para evitar casos de deepfakes envolvendo discursos de ódio ou desinformação.
A ElevenLabs também tem planos ambiciosos para o futuro. A empresa pretende introduzir um mecanismo que permita aos usuários compartilhar vozes na plataforma, abrindo novas oportunidades para colaborações entre humanos e IA.
Além disso, a empresa já está trabalhando em parcerias com diversos criadores de conteúdo e estúdios, incluindo desenvolvedores de jogos e plataformas de vídeo. Curiosamente, o inglês ainda não é um dos idiomas suportados. A empresa disse que vai incluir o inglês em breve, junto com outras línguas, como português, alemão, espanhol e francês.
Fontes: ElevenLabs via Android Headlines
Deixe seu comentário