Google revela 2 softwares de Inteligência Artificial capaz de transformar frases em vídeos

Google revela 2 softwares de Inteligência Artificial capaz de transformar frases em vídeos

Hoje em dia já existem algumas ferramentas e softwares de Inteligência Artificial capazes de transformar textos e frases em imagens, e com uma precisão cada vez maior. Agora, o Google deu um passo a frente nessa caminhada e apresentou não uma, mas duas novas ferramentas que conseguem ir além, transformando frases em vídeos, como GIFs ou até animações.

Enquanto a primeira é mais focada em trazer vídeos mais curtos e mais focados no realismo, a outra é mais voltada para quem quer vídeos mais longos, ou seja, com mais duração. Conheça agora mais detalhes sobre ambas:

Leia também:

Inteligência artificial Dall-E 2 já pode ser usada por qualquer pessoa; veja como experimentar
Site usa Inteligência Artificial para transformar personagens em Pokémons

Inteligência Artificial – Google Imagen Video

A primeira ferramenta apresentada pelo Google é a Google Imagen Video, que é focada em vídeos mais curtos e mais semelhantes aos GIFs. A ferramenta não é exatamente nova, já vem sendo trabalhada pela empresa há um tempo e chegou com o objetivo de ser uma concorrente direta para outros softwares semelhantes, principalmente o DALL-E.

Ou seja, ela também tem a função de transformar as frases em imagens, porém vai um passo além para transformá-las em vídeo. Para isso, a ferramenta utiliza uma técnica de Inteligência Artificial mais avançada, que é capaz de pegar uma imagem parada e criar várias outras semelhantes para trazer a sensação de movimento. E o resultado é bem interessante.

Os vídeos são curtos, e por isso se assemelham aos GIFs tradicionais. Nas imagens divulgadas de exemplo, eles mostram diversas situações e cenários diferentes, uns com cenas mais reais e outras com conteúdos surreais, como um panda dirigindo um carro ou um urso de pelúcia patinando no gelo.

Inteligência Artificial

Embora algumas dessas imagens ainda pareçam um tanto falsas, há algumas que acabam se destacando por ter mais realismo, como a da pá movendo a neve, ou uma mão pegando uma xícara e o nascer de um broto vegetal.

Um dos pontos fracos do Google Imagen Video por enquanto são as movimentações de animais e pessoas, que ainda parecem mais falsas já que a ferramenta não teve aprimoramento nessa parte. Porém, mesmo assim, o resultado ainda impressiona se você tiver em mente que essas imagens foram criadas a partir de frases em texto, por uma técnica de Inteligência Artificial e sem qualquer tipo de edição ou interferência humana.

Forma de criação das imagens

Além de apresentar o Google Imagen Video, a empresa também falou um pouco sobre como essas imagens e vídeos são criados. No site oficial da ferramenta ao passar o mouse por cima de um dos vídeos, é possível ver a frase que o originou, e com isso, dá para perceber que não é necessário criar uma frase muito extensa ou com grandes detalhes. Uma dica: cada vez que você atualiza o site, novos vídeos aparecem.

Segundo eles, o Imagen Video produz um modelo com 16 quadros de imagens e 3 fps, com resolução de 24 x 48 pixels. Depois disso, esse conteúdo que apresenta uma resolução baixa é aprimorado, ganhando um redimensionamento através de uma das ferramentas do software mais avançadas, o que garante um GIF de 128 quadros de imagens com 24 fps e resolução de 1280 x 768.

Eles também falaram um pouco sobre a preocupação de que esse tipo de ferramenta seja utilizada para reproduzir preconceitos sociais, algo que acaba se tornando um debate em toda e qualquer forma de Inteligência Artificial. Por isso, os engenheiros responsáveis pelo Imagen Video revelaram que já testaram alguns filtros para que esse tipo de coisa não aconteça, porém não afirmaram se irão implementar esses filtros ou não e nem como isso acontecerá.

“Modelos generativos de vídeo podem ser usados ​​para impactar positivamente a sociedade, por exemplo, amplificando e aumentando a criatividade humana. No entanto, esses modelos generativos também podem ser mal utilizados, por exemplo, para gerar conteúdo falso, odioso, explícito ou prejudicial.”

Uma ferramenta como essa, seja criando imagens ou vídeos, sempre traz esse tipo de discussão, e que vai além de preconceitos. Elas podem ser usadas para fins mais obscuros como criar um deepfake de alguma celebridade, ou até mesmo imagens e vídeos com cenas pornográficas, além de discurso de ódio contra grupos, racismos e incentivo à violência.

Por isso, é muito provável que esse tipo de software só venha a ser usado pelo público depois que a empresa tiver certeza que não poderá ser usado para essas finalidades. Para isso, ela geralmente implementa filtros e travas de certas palavras ou frases, evitando assim que elas sejam usadas para a criação de um conteúdo impróprio pela Inteligência Artificial.

Inteligência Artificial – Google Phenaki

O segundo software apresentado pelo Google com esse intuito foi o Phenaki. Nesse caso ele se difere do Imagen Videos porque seu foco é criar vídeos com mais tempo de duração, e para isso é preciso ter legendas e frases mais detalhadas.

O intuito é, por exemplo, criar pequenas histórias animadas ou cenas rápidas. É como quando um desenhista pega um roteiro e cria uma história em quadrinhos em cima daquele roteiro. Nesse caso, aqui no Phenaki a legenda na verdade é, de fato, um roteiro para a história que será criada.

Google Phenaki

Exatamente por essa finalidade, essa ferramenta será mais voltada para o mercado profissional, já que dificilmente pessoas sem muito conhecimento conseguiriam criar um roteiro com detalhes suficientes e descrições importantes.

Claro que, por isso, ele acaba trazendo uma qualidade visual bastante inferior quando comparado com o Imagen Video, que faz vídeos bem curtos e rápidos. Além de resolução mais baixa, esses vídeos contam com uma movimentação mais lenta e mais artificial, mas é bom lembrar que ele ainda está em desenvolvimento.

E, ainda assim, é bastante impressionante pensar que dá para criar um roteiro de uma história, colocar em um software, e ele te entregar uma animação de 2 minutos e 21 segundos sem qualquer tipo de interferência humana. É um grande passo!

Para quem tem interesse, dá para entrar no site oficial da ferramenta e ver alguns dos projetos já desenvolvidos por ela. Um exemplo é o seguinte roteiro:

Muito tráfego na cidade futurista. Uma nave alienígena chega à cidade futurista. A câmera entra na nave alienígena. A câmera avança até mostrar um astronauta na sala azul. O astronauta está digitando no teclado. A câmera se afasta do astronauta. O astronauta sai do teclado e caminha para a esquerda. O astronauta deixa o teclado e vai embora. A câmera se move além do astronauta e olha para a tela. A tela atrás do astronauta mostra peixes nadando no mar. Bater zoom no peixe azul. Seguimos o peixe azul enquanto ele nada no oceano escuro. A câmera aponta para o céu através da água. O oceano e o litoral de uma cidade futurista. Bater zoom em direção a um arranha-céu futurista. A câmera dá zoom em uma das muitas janelas. Estamos em uma sala de escritório com mesas vazias. Um leão corre em cima das mesas de escritório. A câmera dá um zoom no rosto do leão, dentro do escritório. Diminua o zoom para o leão vestindo um terno escuro em uma sala de escritório. O leão vestindo olha para a câmera e sorri. A câmera se afasta lentamente para o exterior do arranha-céu. Timelapse do pôr do sol na cidade moderna.

Que deu origem ao seguinte vídeo:

Inteligência Artificial

A empresa revelou que essa ferramenta será capaz de criar vídeos com som e sem uma limitação máxima de tempo, e que no futuro ela poderá ser usada por artistas para explorar sua criatividade. A ideia de poder criar uma animação inteira apenas com palavras e sem qualquer tipo de edição de vídeo parece de fato bem interessante, e pelo visto é o que eles pretendem para um futuro próximo.

Lembrando que a Google não é a única empresa de olho nesse tipo de software, já que a Meta também já anunciou uma iniciativa com Inteligência Artificial capazes de transformar scripts de texto em vídeos curtos.

Fonte: The Verge

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X