Segundo a empresa de pesquisa e segurança em inteligência artificial Mindgard, o especialista Jim Nightingale utilizou um comando que circulava na plataforma de mídia social X, instruindo o ChatGPT a “restaurar imagens anexadas”, mesmo sem que nenhuma imagem tivesse sido fornecida.
Em vez de solicitar aos usuários que fornecessem arquivos, o sistema gerava imagens automaticamente. Os resultados iniciais eram principalmente imagens de mulheres sexualizadas. Quando os pesquisadores ajustaram alguns detalhes nos comandos, o ChatGPT continuou a produzir conteúdo sexualmente violento ou perturbador. O Sr. Nightingale faz parte da equipe de “contra-testes” da Mindgard. Esse método simula como os usuários poderiam explorar vulnerabilidades para fazer com que um sistema de IA viole as proteções estabelecidas.
A Mindgard observou que o fato de pequenas alterações no comando terem repetidamente contornado o filtro sugere que este pode não ser um incidente isolado. O caso representa um novo desafio para as empresas de IA na prevenção de conteúdo prejudicial sem restringir excessivamente o potencial criativo da tecnologia.
A OpenAI afirmou ter investigado o relatório e adicionado medidas de segurança para esse tipo de comando. A empresa identificou o problema como ocorrendo quando o comando se refere a uma imagem anexada, mas o usuário não carrega a imagem de fato. A OpenAI está ajustando o ChatGPT para que o sistema solicite aos usuários o arquivo ausente, em vez de gerar uma imagem aleatoriamente. A Mindgard também forneceu à empresa sessões e comandos relevantes para fins de teste.
Você também deve ler!
Esta postagem foi modificada pela última vez em 21/06/2026 13:32