A Violação de Segurança do DeepSeek Expõe Vulnerabilidades da IA e Desencadeia Ataques Cibernéticos

A mais recente IA generativa da China, DeepSeek, tem sido objeto de intenso escrutínio de segurança cibernética desde seu lançamento. Pesquisadores de segurança recentemente expuseram um jailbreak de prompt de sistema que revelou o funcionamento interno do modelo. Enquanto isso, o DeepSeek também enfrentou ondas de ataques DDoS, forçando-o a restringir novos registros de usuários. Esses incidentes destacam tanto os riscos de segurança dos modelos de IA quanto a sofisticação crescente dos ataques cibernéticos direcionados aos serviços de IA.
Índice
Jailbreak do Prompt de Sistema do DeepSeek: O Que os Pesquisadores Descobriram
Logo após a estreia do DeepSeek, pesquisadores da empresa de segurança de API Wallarm encontraram uma vulnerabilidade de jailbreak que expôs o prompt completo do sistema do modelo de IA. Esse tipo de falha de segurança é particularmente preocupante porque o prompt do sistema de uma IA dita seu comportamento, limitações de resposta e políticas de moderação de conteúdo. A maioria dos desenvolvedores de IA, incluindo OpenAI com ChatGPT, toma medidas rigorosas para evitar tais vazamentos.
Wallarm declarou em uma postagem de blog de 1º de fevereiro que seu método de jailbreak explorava lógica de resposta de IA baseada em viés, embora a empresa tenha retido detalhes técnicos específicos devido a políticas de divulgação responsáveis. A DeepSeek foi notificada do problema e desde então implantou uma correção. No entanto, a Wallarm publicou o texto completo do prompt do sistema, permitindo que especialistas em segurança analisassem a estrutura operacional da DeepSeek.
Esta revelação desencadeou discussões sobre:
- Medidas de privacidade da IA e a eficácia com que o DeepSeek protege os dados do usuário.
- Possíveis vieses no treinamento do DeepSeek, especialmente considerando alegações de que ele pode ter usado dados do OpenAI para treinamento.
- Restrições regulatórias que podem influenciar o funcionamento do modelo de IA, principalmente na China, onde o conteúdo de IA é rigidamente controlado.
Para investigar a potencial influência do OpenAI, Wallarm comparou o prompt do sistema do DeepSeek ao do ChatGPT. De acordo com a análise do ChatGPT, as respostas do DeepSeek se alinham com medidas de conformidade mais rigorosas, enquanto a abordagem do OpenAI é mais flexível e centrada no usuário.
Ataques de DDoS no DeepSeek: Um Ataque Cibernético Coordenado
À medida que a popularidade do DeepSeek crescia, ele se tornou alvo de ataques de negação de serviço distribuído (DDoS) em larga escala. A empresa anunciou que teve que bloquear novos registros de usuários devido ao volume esmagador de ataques.
De acordo com a NSFocus, uma empresa de segurança cibernética que monitora os ataques, a DeepSeek enfrentou três grandes ondas de ataques DDoS visando sua interface de API em 25, 26 e 27 de janeiro. Cada ataque durou cerca de 35 minutos, impactando severamente a plataforma da DeepSeek. Em 28 de janeiro, a interface de API ainda estava indisponível devido a interrupções contínuas.
O sistema de bate-papo DeepSeek também foi atacado, com ataques DDoS observados em 20 e 25 de janeiro, cada um com duração de cerca de uma hora.
Métodos do Ataque de DDoS
A NSFocus identificou diversas técnicas de ataque baseadas em reflexão, incluindo:
- Ataques de reflexão NTP – Exploração de servidores Network Time Protocol (NTP) para amplificar o tráfego de ataque.
- Ataques de reflexão Memcached – Uso de servidores Memcached mal configurados para inundar o DeepSeek com tráfego massivo.
- Ataques de reflexão SSDP – Visando serviços do Simple Service Discovery Protocol (SSDP) para sobrecarregar recursos de rede.
- Ataques de reflexão CLDAP – Aproveitando servidores CLDAP (Connection-less Lightweight Directory Access Protocol) para aumentar o volume de ataques.
Um Ataque Altamente Coordenado
Em 28 de janeiro, a DeepSeek relatou que os invasores estavam adaptando seus métodos em resposta aos esforços de mitigação da empresa. A precisão e a coordenação desses ataques levaram a NSFocus a concluir que os perpetradores eram uma equipe profissional e bem organizada, em vez de hackers aleatórios.
“O atacante demonstra um profissionalismo extremamente alto em cada etapa do ataque, desde a seleção dos alvos até o momento dos ataques e o controle da intensidade”, afirmou a NSFocus.
As principais fontes de ataque incluíram sistemas dos Estados Unidos, Reino Unido e Austrália, de acordo com a análise da empresa de segurança cibernética.
O Que isso Significa para a Segurança da IA
Os incidentes do DeepSeek destacam os crescentes riscos de segurança cibernética na IA generativa. De vulnerabilidades de jailbreak a ataques cibernéticos direcionados, os serviços de IA agora são alvos principais tanto para pesquisadores de segurança quanto para agentes maliciosos.
Principais conclusões:
- Os jailbreaks de IA continuam sendo um desafio de segurança – Até mesmo modelos de IA mais novos, como o DeepSeek, podem sofrer engenharia reversa para expor sua lógica interna.
- Os ataques DDoS contra plataformas de IA estão aumentando – À medida que os serviços de IA ganham popularidade, eles atraem ataques cibernéticos mais altamente coordenados.
- A segurança da IA deve evoluir rapidamente – Os desenvolvedores devem implementar salvaguardas robustas para evitar vazamentos imediatos e se defender contra ameaças cibernéticas.
À medida em que a IA continua a moldar o cenário digital, as equipes de segurança cibernética devem estar um passo à frente para garantir que os modelos de IA permaneçam seguros e resilientes contra ameaças emergentes.