Banco de Dados de Ameaças Vulnerabilidade Vulnerabilidade ChatGPhish no ChatGPT

Vulnerabilidade ChatGPhish no ChatGPT

Pesquisadores de cibersegurança descobriram uma vulnerabilidade no ChatGPT da OpenAI que explora a confiança da plataforma em links e imagens em Markdown, possibilitando ataques de injeção de código e criando novas oportunidades de phishing. A técnica, denominada ChatGPhish, demonstra como a sumarização por IA pode ser manipulada para entregar conteúdo malicioso diretamente por meio de uma interface confiável.

O problema surge da forma como o renderizador de respostas do ChatGPT processa elementos Markdown provenientes de páginas web de terceiros. Quando o chatbot resume conteúdo externo, ele automaticamente confia em links Markdown incorporados e URLs de imagens, buscando imagens remotas e exibindo os links como elementos ativos e clicáveis na interface do assistente.

A mecânica por trás do ataque

Um agente malicioso pode incorporar um pequeno código malicioso em uma página da web, que posteriormente é resumido pelo ChatGPT. Durante o processo de renderização, imagens controladas pelo atacante podem ser buscadas automaticamente, expondo potencialmente informações como o endereço IP da vítima, o User-Agent e os detalhes do Referer.

Além do vazamento de informações, a vulnerabilidade permite que conteúdo malicioso seja apresentado de forma altamente convincente. Os atacantes podem inserir links de phishing diretamente nas respostas do ChatGPT, exibir avisos de segurança fraudulentos semelhantes aos do sistema e apresentar códigos QR hospedados em infraestrutura controlada pelo atacante. Esses códigos QR podem incentivar os usuários a escaneá-los com dispositivos móveis, burlando efetivamente a filtragem de URLs em computadores e os controles de segurança corporativos.

O que torna o ChatGPhish particularmente significativo não é a injeção de prompts em si, mas o fato de o sistema de IA seguir fielmente as instruções embutidas e apresentar o conteúdo resultante como parte de um resumo confiável. Uma página da web aparentemente comum pode, portanto, gerar links de phishing, alertas de contas falsas, imagens remotas e códigos QR maliciosos diretamente na resposta de um assistente de IA.

A crescente superfície de ameaças da navegação assistida por IA

A descoberta destaca um desafio de segurança mais amplo: a sumarização emergiu como uma nova superfície de ataque adversária. No início de março de 2026, pesquisadores demonstraram que e-mails especialmente criados podiam manipular o Microsoft Copilot por meio de injeção cruzada de prompts (XPIA), influenciando resumos gerados por IA através de instruções ocultas.

À medida que as organizações dependem cada vez mais de ferramentas de IA para pesquisa e análise de conteúdo, qualquer página da web maliciosa processada por um assistente de IA pode introduzir instruções controladas pelo atacante no contexto do modelo. Isso representa uma grande mudança nas táticas de phishing. Em vez de exigir que os usuários abram anexos suspeitos ou interajam com e-mails maliciosos, os atacantes podem explorar atividades rotineiras de navegação e fluxos de trabalho de sumarização de IA.

A migração de ataques de ambientes de e-mail para interações de IA baseadas em navegador amplia drasticamente a superfície de ataque disponível. Uma simples solicitação de resumo de uma página da web pode ser suficiente para expor os usuários a conteúdo malicioso gerado por meio de técnicas de injeção indireta de prompts.

Uma onda crescente de técnicas de burla à segurança da IA

A divulgação do ChatGPhish surge em meio a uma onda de pesquisas que revelam novos métodos de ataque direcionados a sistemas de inteligência artificial. Descobertas recentes incluem:

  • A técnica de jailbreak Involuntary In-Context Learning (IICL), que explora conflitos entre o aprendizado em contexto e o alinhamento de segurança para contornar as restrições do GPT-5.4; estratégias de conversação em múltiplos turnos que gradualmente burlam as salvaguardas de grandes modelos de linguagem; ataques de injeção de prompts tipográficos que ocultam instruções em imagens visualmente distorcidas; ataques Neural Exec combinados com técnicas de sobreposição de Unicode da direita para a esquerda para contornar as proteções de Inteligência Artificial da Apple; e o WebPromptTrap, uma vulnerabilidade de injeção indireta de prompts que afeta o BrowserOS e manipula usuários por meio de resumos gerados por IA de conteúdo aparentemente legítimo.
  • Vulnerabilidades de segurança que afetam ecossistemas de IA e frameworks de agentes, incluindo uma vulnerabilidade no código Anthropic Claude que permitia a interceptação de comunicações MCP com suporte OAuth por meio de um pacote npm malicioso; um cenário de abuso de mecanismo de atualização remota direcionado a skills do OpenClaw; campanhas de phishing com texto oculto projetadas para enganar produtos de segurança de e-mail com IA; a vulnerabilidade ClaudeBleed que permitia que extensões de navegador emitissem comandos não autorizados para o Claude; vulnerabilidades críticas no Microsoft Semantic Kernel (CVE-2026-25592 e CVE-2026-26030) capazes de escalar injeções de prompts para execução remota de código em nível de host; falhas de segurança generalizadas nos repositórios de agentes ClawHub e skills.sh; e ataques contra a pilha de referência NemoClaw da NVIDIA que permitiam a exfiltração de dados do OpenClaw por meio de repositórios GitHub e pacotes npm maliciosos.

O futuro das ameaças cibernéticas impulsionadas por IA

À medida que os modelos avançados de IA continuam a amadurecer, os cibercriminosos estão experimentando cada vez mais com suas capacidades ofensivas. Os agentes de ameaças estão aproveitando grandes modelos de linguagem para desenvolver malware mais adaptável, capaz de modificar seu comportamento para burlar os mecanismos de detecção.

Além disso, sistemas de IA estão sendo incorporados aos processos de tomada de decisão de malware. Essas capacidades permitem que softwares maliciosos avaliem ambientes comprometidos, determinem se os alvos são valiosos e decidam se as condições são adequadas para a implantação de cargas adicionais.

A pesquisa da ChatGPhish serve como mais um lembrete de que as tecnologias de IA introduzem considerações de segurança totalmente novas. À medida que os assistentes de IA se integram profundamente aos fluxos de trabalho empresariais, a proteção contra injeções indiretas de prompts, resumos manipulados e abusos de interfaces baseadas em confiança se tornará um componente cada vez mais crítico da estratégia de cibersegurança.

Tendendo

Mais visto

Carregando...