Pesquisadores descobrem brecha no ChatGPT que gerava imagens sexuais

Segundo a empresa de pesquisa e segurança em inteligência artificial Mindgard, o especialista Jim Nightingale utilizou um comando que circulava na plataforma de mídia social X, instruindo o ChatGPT a “restaurar imagens anexadas”, mesmo sem que nenhuma imagem tivesse sido fornecida.

Em vez de solicitar aos usuários que fornecessem arquivos, o sistema gerava imagens automaticamente. Os resultados iniciais eram principalmente imagens de mulheres sexualizadas. Quando os pesquisadores ajustaram alguns detalhes nos comandos, o ChatGPT continuou a produzir conteúdo sexualmente violento ou perturbador. O Sr. Nightingale faz parte da equipe de “contra-testes” da Mindgard. Esse método simula como os usuários poderiam explorar vulnerabilidades para fazer com que um sistema de IA viole as proteções estabelecidas.

A Mindgard observou que o fato de pequenas alterações no comando terem repetidamente contornado o filtro sugere que este pode não ser um incidente isolado. O caso representa um novo desafio para as empresas de IA na prevenção de conteúdo prejudicial sem restringir excessivamente o potencial criativo da tecnologia.

A OpenAI afirmou ter investigado o relatório e adicionado medidas de segurança para esse tipo de comando. A empresa identificou o problema como ocorrendo quando o comando se refere a uma imagem anexada, mas o usuário não carrega a imagem de fato. A OpenAI está ajustando o ChatGPT para que o sistema solicite aos usuários o arquivo ausente, em vez de gerar uma imagem aleatoriamente. A Mindgard também forneceu à empresa sessões e comandos relevantes para fins de teste.

Você também deve ler!

Ver Mais

Esta postagem foi modificada pela última vez em 21/06/2026 13:32

William R. Plaza: Editor-chefe no Hardware.com.br, aficionado por tecnologias que realmente funcionam. Segue lá no Insta: @plazawilliam Elogios, críticas e sugestões de pauta: william@hardware.com.br
Postagem relacionada