DALL-E: esta IA gera imagens a partir de qualquer descrição e o resultado é surpreendente

DALL-E: esta IA gera imagens a partir de qualquer descrição e o resultado é surpreendente

Hoje em dia a inteligência artificial já é usada em diversas categorias e tipos de aparelhos, mas ela realmente se destaca quando traz algo inovador de tempos em tempos. É o caso da noca DALL-E 2, que é uma IA que utiliza o machine learning (também conhecido como ML, que significa aprendizado de máquina).

Esse ML é uma espécie de treinamento dos algoritmos que faz com que, com o passar do tempo e mais e mais uso, a IA fique cada vez mais capacitada e precisa em seu objetivo. No caso do DALL-E 2, o objetivo é garantir imagens bem interessantes e feitas a partir de frases escritas.

Leia também:

Inteligência artificial mostra como seriam personagens clássicos de desenho na vida real
O poder da inteligência artificial: Brasileiros desenvolvem detector de fake news

DALL-E 2 gera imagens mais realistas

DALL-E

O DALL-E 2 foi criado pela OpenIA, uma empresa justamente focada em pesquisa em inteligência artificial e que é bancada por ninguém mais ninguém menos do que Elon Musk. Ela já está bem avançada no campo e já conta com algumas criações que ficaram famosas pela sua eficiência, como é o caso do GPT-3, que consegue produzir conversas em textos mais naturais para os chatbots.

“Nossa esperança é que DALL·E 2 capacite as pessoas a se expressarem criativamente. O DALL·E 2 também nos ajuda a entender como os sistemas avançados de IA veem e entendem nosso mundo, o que é fundamental para nossa missão de criar IA que beneficie a humanidade.”

O DALL-E 2 foi revelado para o público em abril desse ano e sua pronúncia é “Dalí”, como Salvador Dalí, uma homenagem ao pintor espanhol, já que ele é capaz de criar imagens que lembram pinturas.

A ideia do DALL-E 2 é bem simples, ele consegue gerar imagens bem interessantes a partir de um texto escrito, como uma frase. Embora o projeto original seja fechado para pesquisadores, ele ganhou um site com uma versão mais “básica” que não demorou muito para cair no gosto da internet. Com isso, muitos usuários estão compartilhando suas criações com o programa.

dall-e

Ele já teve uma versão no ano passado, o primeiro DALL-E, porém acabou não ganhando tão destaque quanto essa nova versão, que viralizou em pouco tempo. Isso porque a versão 2 da IA agora garante imagens mais reais e menos “abstratas”, como acontecia com a versão 1.

O motivo desse sucesso acontece principalmente porque é possível usar figuras públicas para participar dessas imagens geradas, como atrizes, atores, cantores, políticos e até mesmo desenhos animados conhecidos, colocando-os em situações inusitadas e engraçadas.

Mais opções de modelos de IA da categoria

Mesmo com o sucesso do DALL-E 2, hoje em dia modelos de IA que são capazes de transformar palavras e frases em imagens não são exatamente uma novidade, e já contamos com outras opções desses estilo.

O próprio Google já lançou um concorrente para o DALL-E em maio desse ano, o Imagen. De acordo com a apresentação da empresa da sua ferramenta, ela tem capacidade de gerar imagens realistas e bem interessantes, porém não se sabe até onde elas foram realmente geradas ou se tiveram uma ajudinha de uma edição manual depois. Isso porque a ferramenta não é liberada para o público para evitar a geração de conteúdo ofensivo, pornográfico e outros.

imagen

Outro exemplo é a ferramenta Dream, da Wombo, que também gera imagens a partir de frases e até deixa que o usuário escolha um tipo de pintura. Essas são imagens mais abstratas e não tão realistas, mas ainda assim passam a mensagem e são até bonitas a depender do que for escrito. Eles inclusive dão a opção de upar uma imagem que sirva como base para o que você deseja.

Como acontece a formação das imagens?

O DALL-E 2 funciona através do processamento de informações. Nesse caso, ele processa uma grande quantidade de dados como imagens e descrições de texto para, só então, conseguir identificar os padrões entre eles. É basicamente o que acontece com qualquer ferramenta de Machine Learning.

Em seguida, é feita a “difusão”. O programa é capaz de separar todas as imagens de um determinado objeto e escolher as que contam com partes semelhantes para criar uma nova imagem daquele objeto em alta resolução e em situações diferentes.

DALL-E

É assim que ele consegue pegar imagens de algo e criar variações dela, e é como, por exemplo, é possível colocar artistas em locais que eles nunca foram e situações que nunca vivenciaram. O DALL-E 2 é bem avançado, e funciona mais ou menos como o Imogen do Google, criando imagens mais realistas, porém está fechado para pesquisadores.

Porém, um desenvolvedor francês, Boris Dayma, criou uma versão menos precisa da ferramenta, mas aberta para todos, que é o DALL-E Mini, que pode ser acessado aqui.

Nesse caso ele já mostra mais ou menos como a ferramenta funciona e é exatamente ela que está colocando o DALL-E em evidência nas redes sociais. No caso as imagens são formada com borrões, principalmente no rosto das pessoas envolvidas, já que muitas delas usam nomes conhecidos publicamente.

dall-e

A ferramenta traz uma funcionalidade bem parecida com o primeiro DALL-E e permite que qualquer pessoa que acessa o site possa gerar suas imagens a depender da sua imaginação. Algumas imagens mais artísticas são comparadas às produções do modelo original do DALL-E 2, porém com resoluções bem menores. Mas nas imagens mais realistas, com pessoas, não fica tão preciso assim.

O pesquisador revelou que embora fosse um desafio grande recriar uma ferramenta como essa, ele queria que o público participasse mais um pouco do processo, mesmo que fosse em uma versão mais primitiva. E deu certo, certamente muitas pessoas estão se divertindo com a possibilidade de brincar com o DALL-E Mini.

“Se você olhar para qualquer tecnologia e qualquer ciência, sempre houve essas duas abordagens, aberta e fechada. São abordagens complementares. Mas a beleza do open source é a mesma beleza da ciência: fazer coisas de forma aberta, transparente, colaborativa. É poder distribuir o poder para que qualquer organização possa se manter atualizada e garantir proteções éticas para que a tecnologia possa evoluir.” Revelou Clem Delangue, presidente-executivo da Hugging Face, que é quem hospeda o DALL-E Mini.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X