Com o desenvolvimento das inteligências artificiais, cada vez mais ferramentas vão surgindo com a tecnologia oferendo uma gama ampla de serviços. É o caso do MusicGen, um gerador de músicas com base em IA criado pela Meta.
O serviço consegue entender uma descrição ou prompt de comando para criar uma faixa de áudio curta, de até 15 segundos. Embora não seja pioneira no ramo, a Meta promete trazer um competidor de peso a outras soluções como o MusicLM do Google, principalmente porque o MusicGen é open-source.
Leia também:
Beatles lançarão música inédita graças à Inteligência Artificial
Inteligência Artificial prevê câncer de mama com até 5 anos de antecedência
MusicGen conta com mais de 20 mil horas de músicas autorizadas
O MusicGen conta com o algoritmo Transformer, que é da OpenAI e atualmente pode ser encontrado na maioria das plataformas com base em IA generativa. Ela funciona também como essas outras ferramentas, a diferença é que enquanto algumas como a DALL-E e o Midjourney transformam uma descrição em texto em imagem, o MusicGen transforma em um áudio de som.
Além do algoritmo eles também usando o EnCodec, da própria Meta, que é um tokenizador de áudio e permite a criação das faixas através de machine learning, ou seja, aprendizado de máquina. O fato do resultado ser curto é o que garante que ele consiga ser entregue em pouco tempo.
Para alimentar a base de dados do sistema, a equipe conseguiu ter acesso a mais de 20 mil horas de músicas autorizadas, o que ajuda a criar resultados mais diversificados. Além disso, eles também adicionaram mais de 10 mil gravações de áudio disponíveis na internet.
Porém é preciso ressaltar que a ferramenta da Meta ainda está em fase inicial e de desenvolvimento, mesmo que já esteja disponível para todos testarem. Dessa forma, ele ainda não entrega resultados tão precisos e tão satisfatórios, assim como também acontece com as ferramentas geradoras de imagens.
Algumas das vezes, ela simplesmente entrega uma faixa de áudio mais genérica, que não foca tanto no pedido feito na plataforma, porém ajuda a alimentar seu banco de dados. Quem entende mais sobre edição e geração de áudio certamente conseguirá tirar um melhor proveito dela e entender melhor os seus resultados.
De qualquer forma, no site da plataforma eles sugerem alguns pedidos que entregam resultados um pouco mais precisos para quem tem interesse em saber como ela funciona. Ainda assim, todos são livres para tentar criar seus próprios áudios exclusivos.
A tendência é que ela se torne mais precisa com o passar do tempo, com cada vez mais usuários testando e alimentando o banco de dados. É possível ainda que ela ofereça no futuro áudios mais longos e mais consistentes.
Como criar seu áudio no MusicGen
Para quem tem curiosidade e já quer testar a ferramenta, é muito simples. Ela atualmente está disponível através da API Hugging Face, que é um modelo de código aberto. Basta entrar no site clicando aqui e começar a experiência.
Primeiro, vá no local “Describe your music” e digite qual o texto que usará para criação de áudio. Ainda não ficou claro se ela entende todos os idiomas, então por via das dúvidas é melhor colocar em inglês.
Ele te dá a opção de adicionar um áudio de uma música já existente para ser usada como base, para isso é só fazer o upload do seu aparelho, porém essa etapa é opcional, não é obrigatória.
Clique no botão “Generate” e então é só esperar o áudio ser produzido. Ele dá uma média de segundos que vai levar para que isso aconteça e no momento a média é de 300 a 350 segundos, ou seja, pouco mais de 5 minutos.
Quando a música for gerada é só dar o play e curtir. Lembrando que ele gera apenas um trecho curto do áudio, com até 15 segundos.
Ainda não dá para saber se essa será uma ferramenta que vai de fato chamar a atenção dos usuários ou não, principalmente porque atualmente novas ferramentas com inteligência artificial estão surgindo em grande quantidade, porém é mais uma forma de entender melhor as capacidades desse tipo de tecnologia.
Deixe seu comentário