La violació de seguretat DeepSeek exposa les vulnerabilitats de la IA i provoca ciberatacs

L'última IA generativa de la Xina, DeepSeek, ha estat objecte d'un intens escrutini de ciberseguretat des del seu llançament. Els investigadors de seguretat van exposar recentment un jailbreak del sistema que va revelar el funcionament intern del model. Mentrestant, DeepSeek també s'ha enfrontat a onades d'atacs DDoS, que l'han obligat a restringir els registres de nous usuaris. Aquests incidents posen de manifest tant els riscos de seguretat dels models d'IA com la creixent sofisticació dels ciberatacs dirigits als serveis d'IA.
Taula de continguts
Jailbreak del sistema de DeepSeek: què van descobrir els investigadors
Poc després del debut de DeepSeek, els investigadors de l'empresa de seguretat de l'API Wallarm van trobar una vulnerabilitat de jailbreak que va exposar el sistema complet del model d'IA. Aquest tipus d'error de seguretat és especialment preocupant perquè l'indicador del sistema d'una IA dicta el seu comportament, les limitacions de resposta i les polítiques de moderació del contingut. La majoria dels desenvolupadors d'IA, inclòs OpenAI amb ChatGPT, prenen mesures estrictes per evitar aquestes filtracions.
Wallarm va declarar en una publicació al blog de l'1 de febrer que el seu mètode de jailbreak aprofitava la lògica de resposta de la IA basada en el biaix, tot i que l'empresa va retenir detalls tècnics específics a causa de polítiques de divulgació responsable. DeepSeek va rebre una notificació del problema i des de llavors ha implementat una solució. Tanmateix, Wallar va publicar el text complet del sistema, permetent als experts en seguretat analitzar el marc operatiu de DeepSeek.
Aquesta revelació va provocar discussions sobre:
- Mesures de privadesa d'IA i amb quina eficàcia DeepSeek protegeix les dades dels usuaris.
- Potencials biaixos en la formació de DeepSeek, sobretot tenint en compte les afirmacions que podria haver utilitzat dades d'OpenAI per a la formació.
- Restriccions reguladores que podrien influir en el funcionament del model d'IA, especialment a la Xina, on el contingut d'IA està estretament controlat.
Per investigar la possible influència d'OpenAI, Wallar va comparar el missatge del sistema de DeepSeek amb el de ChatGPT. Segons l'anàlisi de ChatGPT, les respostes de DeepSeek s'alineen amb mesures de compliment més estrictes, mentre que l'enfocament d'OpenAI és més flexible i centrat en l'usuari.
Atacs DDoS a DeepSeek: un assalt cibernètic coordinat
A mesura que la popularitat de DeepSeek va créixer, es va convertir en l'objectiu d'atacs de denegació de servei (DDoS) distribuïts a gran escala. L'empresa va anunciar que havia de bloquejar els nous registres d'usuaris a causa del volum aclaparador d'atacs.
Segons NSFocus, una empresa de ciberseguretat que supervisa els atacs, DeepSeek es va enfrontar a tres grans onades d'atacs DDoS dirigits a la seva interfície API els dies 25, 26 i 27 de gener. Cada atac va durar uns 35 minuts, la qual cosa va afectar greument la plataforma de DeepSeek. El 28 de gener, la interfície de l'API encara no estava disponible a causa de les interrupcions en curs.
El sistema de xat DeepSeek també va ser atacat, amb vagues DDoS observades els dies 20 i 25 de gener, cadascuna amb una durada d'una hora.
Mètodes d'atac DDoS
NSFocus va identificar múltiples tècniques d'atac basades en la reflexió, com ara:
- Atacs de reflexió NTP : explotació de servidors de protocol de temps de xarxa (NTP) per amplificar el trànsit d'atac.
- Atacs de reflex Memcached : ús de servidors Memcached mal configurats per inundar DeepSeek amb trànsit massiu.
- Atacs de reflex SSDP : orientació als serveis de protocol simple de descoberta de serveis (SSDP) per desbordar els recursos de la xarxa.
- Atacs de reflexió CLDAP : aprofitant els servidors del protocol d'accés a directori lleuger (CLDAP) sense connexió per augmentar el volum d'atac.
Un atac altament coordinat
El 28 de gener, DeepSeek va informar que els atacants estaven adaptant els seus mètodes en resposta als esforços de mitigació de l'empresa. La precisió i la coordinació d'aquests atacs van portar a NSFocus a concloure que els autors eren un equip professional i ben organitzat en lloc de pirates informàtics aleatoris.
"L'atacant mostra una professionalitat extremadament alta en cada pas d'atac, des de seleccionar objectius fins a cronometrar els atacs i controlar la intensitat", va dir NSFocus.
Les principals fonts d'atac inclouen sistemes dels Estats Units, el Regne Unit i Austràlia, segons l'anàlisi de l'empresa de ciberseguretat.
Què significa això per a la seguretat de la IA
Els incidents de DeepSeek posen de manifest els creixents riscos de ciberseguretat en IA generativa. Des de vulnerabilitats de jailbreak fins a ciberatacs dirigits, els serveis d'IA són ara els objectius principals tant per als investigadors de seguretat com per als actors maliciosos.
Punts clau per emportar:
- Els jailbreaks d'IA segueixen sent un repte de seguretat : fins i tot els models d'IA més nous com DeepSeek es poden fer enginyeria inversa per exposar la seva lògica interna.
- Els atacs DDoS contra plataformes d'IA augmenten : a mesura que els serveis d'IA guanyen popularitat, atrauen ciberatacs més coordinats.
- La seguretat de la IA ha d'evolucionar ràpidament : els desenvolupadors han d'implementar garanties sòlides per evitar filtracions ràpides i defensar-se de les amenaces cibernètiques.
A mesura que la IA continua donant forma al panorama digital, els equips de ciberseguretat han de mantenir-se un pas per davant per garantir que els models d'IA segueixin sent segurs i resistents a les amenaces emergents.