ElevenLabs lança ferramenta de inteligência artificial que pode clonar a sua voz em até 30 idiomas

A ElevenLabs, empresa especializada em tecnologia de inteligência artificial, lançou uma nova plataforma de IA que pode trabalhar de maneiras impressionantes com áudio, mais especificamente com a voz do usuário.

A plataforma, que saiu recentemente da fase beta, é capaz de clonar a voz humana em até 30 idiomas diferentes. Isso é possível graças ao modelo de IA Multilingual v2, que não apenas detecta automaticamente o idioma do texto, mas também gera uma voz com nuances emocionais específicas de cada língua.

Leia também
O que é deepfake e por que é tão perigoso?
Voicebox é a nova ferramenta IA da Meta que recria a voz do usuário rapidamente

Como funciona o serviço?

Multilingual V2

O processo para clonar a voz é surpreendentemente simples e acessível. Os usuários precisam apenas enviar algumas amostras de fala para a plataforma. A partir daí, a ElevenLabs oferece dois tipos de serviços de clonagem de voz: um voltado para a conversão de texto em fala e outro, denominado “VoiceLab”, projetado para simular vozes específicas.

Com essas duas opções, o usuário pode, por exemplo, escrever um texto e fazer com que ele seja lido com a sua própria voz. Já a função “VoiceLab” permitirá usar vozes famosas, como de atores ou políticos.

Mati Staniszewski, CEO e cofundador da ElevenLabs, expressou otimismo sobre o potencial da nova ferramenta. Segundo ele, a tecnologia tem o poder de colocar criadores de conteúdo em pé de igualdade com grandes estúdios. Através do Multilingual v2, eles podem produzir áudio de alta qualidade em múltiplos idiomas sem a necessidade de estúdios de gravação ou dubladores profissionais.

Com este lançamento, estamos um passo mais perto de tornar esse sonho uma realidade e tornar as vozes de IA de qualidade humana disponíveis em todos os dialetos. Nossas ferramentas de geração de texto para fala ajudam a nivelar o campo de jogo e trazem recursos de áudio falado de alta qualidade para todos os criadores lá fora“, disse o CEO da empresa.

Preocupações com deepfakes e desinformação

681688

No entanto, a novidade não está isenta de controvérsias. Há preocupações éticas e morais significativas relacionadas ao potencial uso indevido da clonagem de voz. A empresa já tomou medidas preventivas, como limitar o acesso à clonagem de voz a contas pagas e implementar ferramentas de detecção baseadas em IA para mitigar riscos.

Em teoria, isso deve ser o suficiente para evitar casos de deepfakes envolvendo discursos de ódio ou desinformação.

A ElevenLabs também tem planos ambiciosos para o futuro. A empresa pretende introduzir um mecanismo que permita aos usuários compartilhar vozes na plataforma, abrindo novas oportunidades para colaborações entre humanos e IA.

Além disso, a empresa já está trabalhando em parcerias com diversos criadores de conteúdo e estúdios, incluindo desenvolvedores de jogos e plataformas de vídeo. Curiosamente, o inglês ainda não é um dos idiomas suportados. A empresa disse que vai incluir o inglês em breve, junto com outras línguas, como português, alemão, espanhol e francês.

Fontes: ElevenLabs via Android Headlines

Postado por
Cearense. 37 anos. Apaixonado por tecnologia desde que usou um computador pela primeira vez, em um hoje jurássico Windows 95. Além de tech, também curto filmes, séries e jogos.
Siga em:
Compartilhe
Deixe seu comentário
Img de rastreio
Localize algo no site!