GauGAN2: NVIDIA revela IA que gera imagens a partir de textos

GauGAN2: NVIDIA revela IA que gera imagens a partir de textos

Ontem (22), a NVIDIA revelou a inteligência artificial (IA) GauGAN2 que consegue gerar imagens fotorrealistas a partir de frases. O modelo de deep learning é capaz de criar cenários diferentes com base em três ou quatro palavras.

Anteriormente, a IA GauGAN era um programa utilizado para gerar simples desenhos em imagens fotorrealistas. Em 2019, a tecnologia deu origem ao NVIDIA Canvas, aplicativo lançado no início deste ano, mas só roda em PCs com placas de vídeo RTX.

Agora, com a IA GauGAN 2, a Nvidia dá um salto maior em sua tecnologia com o uso da ferramenta textual.

De acordo com a NVIDIA, o modelo de deep learning por trás da IA GauGAN 2 permite que todos possam tornar a sua imaginação em obras de arte fotorrealistas. Isso porque o modelo é baseado em Redes Adversárias Generativas (Generative Adversarial Networks, ou seja, GAN).

GauGAN2 NVIDIA
Imagem gerada pelo GauGAN 2 com o termo “Brazilian Countryside”, que significa “interior do Brasil”. Embora seja uma bela imagem, não tenho certeza se esse local esteja de fato no interior do país, mas se parece bastante com as montanhas de Minas Gerais. Créditos: Nvidia/Hardware.com.br

GANs utilizam duas redes neurais operando em propósitos cruzados: uma produz o output enquanto a outra rede define se essa é válida. Por isso o termo “adversária”.

O modelo IA por trás do GauGAN2 foi treinado utilizando 10 milhões de imagens de alta qualidade através do Supercomputador Selene, da Nvidia. Esse supercomputador está entre os 10 mais poderosos do mundo.

Os pesquisadores utilizaram uma rede neural que consegue aprender a conexão entre palavras e visuais.

Leia também:

Testando a GauGAN2, a nova invenção da NVIDIA

Segundo a NVIDIA, é muito fácil utilizar o GauGAN 2. Portanto, decidimos fazer um teste, utilizando até mesmo o nome do nosso site, para conferir os resultados das imagens geradas pela GauGAN 2.

A GauGAN 2 está hospedada em um site da Nvidia e você pode acessar clicando aqui. Obviamente, por estar em fase de testes, a GauGAN 2 compreende apenas textos em inglês, afinal, a empresa é americana. A Nvidia inseriu um tutorial no site da ferramenta, bem como um vídeo no canal do YouTube. Confira abaixo.

Agora, é minha vez de apresentar os resultados que consegui obter com utilizando a GauGAN 2. Primeiramente, eu utilizei o termo “farming grass”, que significa cultivo de grama. Além disso, fiz alterações na imagem, removendo o fundo e, surpreendentemente, a IA gerou um fundo extremamente condizente com a imagem. Confira abaixo.

GauGAN2 NVIDIA
A imagem original gerada pelo termo “farming grass”. Créditos: Nvidia/Hardware.com.br
GauGAN2 NVIDIA
A mesma imagem com o fundo alterado. Créditos: Nvidia/Hardware.com.br

Após constatar o potencial da ferramenta, tentei ser mais ousado e utilizei o termo “Hardware on Brazil”, fazendo alusão ao nosso site. Veja só o que aconteceu:

Por ainda estar em fase de testes e focar apenas em cenários, o resultado da minha imagem com o termo “Hardware on Brazil” ficou bastante bizarro. Créditos: Nvidia/Hardware.com.br

Por fim, além da ferramenta principal, a Nvidia inseriu no GauGAN2 vários recursos de aplicativos de manipulação de imagem que podem ser bastante úteis para designers de todo o mundo.

Você também deve ler: Este é o Deep Nostalgia, uma ferramenta de IA capaz de animar fotos antigas

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X