A OpenAI anunciou o lançamento do GPT Image 1.5, nova versão do seu modelo de geração de imagens integrado ao ChatGPT, em meio ao buzz provocado pelos modelos “Nano Banana Pro” do Google. A atualização traz uma interface redesenhada para imagens no chatbot e promete desempenho até quatro vezes mais rápido em relação à geração anterior.
O recurso já está sendo liberado para a maior parte dos usuários do ChatGPT, com exceção de clientes Business e Enterprise, que receberão a novidade depois. O modelo também passa a ficar disponível via API, sob o nome GPT-Image-1.5.
Introducing ChatGPT Images, powered by our flagship new image generation model.
– Stronger instruction following
– Precise editing
– Detail preservation
– 4x faster than beforeRolling out today in ChatGPT for all users, and in the API as GPT Image 1.5. pic.twitter.com/NLNIPEYJnr
— OpenAI (@OpenAI) December 16, 2025
Nova interface foca em uso recorrente
A área de imagens do ChatGPT ganhou uma aba dedicada na barra lateral, com filtros prontos e sugestões de prompts. A OpenAI aposta que esse desenho incentiva o uso recorrente e formatos “virais” produzidos diretamente dentro da plataforma, sem depender de ferramentas externas.
Em vídeo de demonstração, a empresa exibiu comparações lado a lado entre o GPT Image 1.0 e o 1.5, com cenas como um bairro de Chelsea, em Londres, nos anos 1970, e um mecânico trabalhando em um carro. As amostras destacam melhorias em fidelidade visual e consistência entre versões ligeiramente modificadas de uma mesma imagem.
Movimento responde à onda do Nano Banana
O anúncio acontece após os modelos de imagem do Google, apelidados de Nano Banana e Nano Banana Pro, ganharem repercussão nas últimas semanas. Baseados nos modelos Gemini 2.5 Flash Image (Nano Banana) e Gemini 3 Pro Preview (Nano Banana Pro), eles chamaram atenção pela capacidade de gerar imagens e permitir edições conversacionais sem “quebrar” rostos, iluminação ou composição.
Segundo o Google, o Nano Banana Pro consegue combinar até 14 imagens de referência em uma única composição, preservando a semelhança de até cinco pessoas, além de oferecer controles de câmera e luz e melhor renderização de textos em pôsteres, convites e diagramas. Os recursos miram usos práticos, como mockups, materiais gráficos e peças promocionais.
Nano Banana Pro: guia de como criar os melhores prompts para gerar imagens
OpenAI mira consistência e custo
Na documentação oficial, a OpenAI posiciona o GPT Image 1.5 como um avanço em consistência visual, com foco em preservar logotipos, elementos de marca e detalhes importantes ao longo de múltiplas edições. A empresa cita o uso em e-commerce, onde um único clique pode gerar catálogos inteiros a partir de uma imagem base de produto.
A OpenAI também anuncia redução de custos: entradas e saídas de imagem ficam cerca de 20% mais baratas no GPT Image 1.5 em comparação ao GPT Image 1. Pelo tabela de preços da API, o gpt-image-1.5 sai por 8 dólares por 1 milhão de tokens de imagem de entrada, 2 dólares por 1 milhão em cache e 32 dólares por 1 milhão de tokens de saída.
Google reforça marcação de imagens geradas por IA
Enquanto a OpenAI destaca velocidade e repetibilidade, o Google enfatiza mecanismos de identificação de conteúdo sintético. Nas páginas do AI Studio, a empresa informa que imagens criadas ou editadas com o Gemini 2.5 Flash Image recebem a marca d’água invisível SynthID.
Há uma marca d’água visível, o chamado “Gemini sparkle”, aplicada a usuários gratuitos e do plano Pro, removida apenas para assinantes Ultra e no próprio AI Studio. A estratégia busca reduzir risco de uso indevido de imagens geradas por IA em contextos enganosos.
Com o GPT Image 1.5, a OpenAI tenta equilibrar a disputa com o Google no segmento de geração de imagens por IA, oferecendo um produto mais rápido, com foco em consistência entre edições e custo menor para desenvolvedores que usam a API.
