Na semana passada, a OpenAI conseguiu direcionar novamente para si os holofotes do noticiário com o anúncio do Sora. Uma espécie de ChatGPT para vídeos. A tecnlogia é capaz de converter prompts em texto para vídeos, com resolução 1080p, de até 1 minuto de duração.
Ver essa foto no Instagram
A tecnologia impressiona pelos resultados gerados. Sendo capaz inclusive de entregar vídeos altamente realistas. Além da interação via prompt de texto, o Sora também consegue animar imagens estáticas. Opção que é similar ao que outras empresas do mesmo ramo, como a Runway, com o Gen2, já oferecem.
Com isso, é possível fazer uma combinação de IA generativas. O usuário pode utilizar alguma ferramenta de geração de imagens, como o MidJourney, Bing Image Creator e Dall-E, e utilizar o Sora para dar movimento para aquela foto.
No site oficial da ferramenta, a OpenAI mostrou algumas opções de animações que foram geradas a partir de imagens produzidas utilizando o Dall-E 3, que também é da companhia gerenciada por Sam Altman. Confira abaixo o resultado:
Por enquanto, o Sora está reservado aos pesquisadores e usuários selecionados pela OpenAI para testar e aperfeiçoar a ferramenta, antes do lançamento para o grande público.
“Estamos sendo cuidadosos com a implantação aqui e garantindo que todas as nossas bases estejam cobertas antes de colocarmos isso nas mãos do público em geral”, explicou Aditya Ramesh, cientista da OpenAI responsável pela criação do DALL-E.
O grupo selecionado que já está testando a ferramenta está tentando de todas as maneiras fazer com que a Sora produza conteúdo questionável e que possa gerar problemas. Sempre que um tipo de conteúdo deste tipo, que possa gerar desinformação, ou preconceito, por exemplo, a OpenAI é alertada e trabalhará para “corrigir” o comportamento do modelo de inteligência artificial.
Ainda não há uma previsão para a liberação do beta do Sora.
Deixe seu comentário