31 de Outubro, 2024

Nova técnica de injeção de prompt burla segurança do ChatGPT

codes codicos binario

Um relatório recente do gerente de programas de segurança da Mozilla, Marco Figueroa, aponta vulnerabilidades na nova versão do modelo de linguagem GPT-4o da OpenAI, lançada em maio. Segundo Figueroa, técnicas de injeção de prompt — um método onde comandos prejudiciais são codificados e disfarçados — permitem que usuários mal-intencionados contornem os filtros de segurança do ChatGPT e solicitem respostas potencialmente perigosas, como a criação de códigos de exploração para brechas de segurança.

O GPT-4o, modelo mais avançado da OpenAI, se destaca por sua capacidade de resposta rápida e processamento de múltiplos tipos de entrada em diversas línguas. Contudo, o sistema de filtragem de conteúdo que deveria impedir abusos se mostrou insuficiente diante de técnicas que fogem à linguagem natural convencional. Figueroa demonstrou que, ao codificar instruções em hexadecimal e utilizar variações de linguagem como “leet speak,” o modelo decodifica e executa instruções que, normalmente, rejeitaria se apresentadas de forma direta.

Em um dos exemplos, ele usou essas técnicas para enganar o ChatGPT, induzindo-o a gerar um código de exploit para uma vulnerabilidade crítica no Docker, classificada como CVE-2024-41110, sem que o sistema bloqueasse a ação. Essa exploração revela uma falta de “consciência de contexto” do modelo, que processa instruções em etapas compartimentadas, sem análise profunda da sequência completa e das implicações de segurança de cada passo.

Figueroa observou que, em comparação, modelos de IA de outras empresas, como os da Anthropic, apresentaram mais barreiras para esse tipo de manipulação, evidenciando uma possível prioridade dada pela OpenAI à inovação em detrimento da segurança. Para aumentar a proteção, ele sugere que a OpenAI desenvolva mecanismos que permitam ao GPT-4o identificar comandos potencialmente perigosos em contextos mais amplos.

Com informações DarkReading

Este post foi traduzido e resumido a partir de sua versão original com o uso do ChatGPT versão 4o, com revisão humana.

Quer ficar por dentro das ultimas notícias na área?

Assine nossa newsletter semanal e acompanhe as notícias mais relevantes em segurança da informação e proteção de dados.

Posts recentes

BACEN admite incidente de segurança envolvendo dados pessoais de pesquisa

O Banco Central do Brasil (BACEN) informou que sofreu um incidente de segurança que resultou na exposição de dados pessoais de 1.500 participantes da 2ª edição da pesquisa “O brasileiro e os hábitos de uso de meios de pagamento”. O incidente, ocorrido devido a um erro operacional, aconteceu durante a divulgação dos resultados da pesquisa […]

Ler Mais
STJ valida assinaturas eletrônicas avançadas em contratos privados não vinculados à ICP-Brasil

O Superior Tribunal de Justiça (STJ) reconheceu a validade jurídica das assinaturas eletrônicas avançadas, mesmo quando realizadas por plataformas não credenciadas ao ICP-Brasil. A decisão foi tomada no julgamento de um recurso especial interposto por um fundo de investimento contra sentença que extinguiu, sem análise de mérito, uma ação de busca e apreensão. A cédula […]

Ler Mais
Falha de segurança e descumprimento da LGPD levam à condenação de banco

O Tribunal de Justiça do Distrito Federal e dos Territórios (TJDFT) manteve a condenação do Banco de Brasília (BRB) e da administradora de cartões do grupo ao ressarcimento e indenização de uma cliente que foi vítima de fraudes bancárias. A decisão reconheceu que falhas nos sistemas de segurança da instituição financeira permitiram movimentações fraudulentas na […]

Ler Mais
Av. Senador Alberto Pasqualini, n. 180, sala 2 - Três de Maio/RS
contato@brownpipe.com.br
Comercial: (55) 999164209 - WhatsApp e Signal 

CONECTE-SE CONOSCO
Fique atualizado com as notícias mais relevantes em segurança da informação e proteção de dados. Inscreva-se na nossa newsletter semanal! 
Políticas BrownPipe *
Termos de privacidade
linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram