DeepSeek-beveiligingslek legt AI-kwetsbaarheden bloot en veroorzaakt cyberaanvallen

China's nieuwste generatieve AI, DeepSeek, is sinds de lancering het onderwerp geweest van intensieve cybersecurity-controle. Beveiligingsonderzoekers hebben onlangs een systeemprompt-jailbreak onthuld die de interne werking van het model onthulde. Ondertussen heeft DeepSeek ook te maken gehad met golven van DDoS-aanvallen, waardoor het gedwongen werd om nieuwe gebruikersregistraties te beperken. Deze incidenten benadrukken zowel de beveiligingsrisico's van AI-modellen als de toenemende verfijning van cyberaanvallen gericht op AI-services.
Inhoudsopgave
DeepSeek's System Prompt Jailbreak: Wat onderzoekers ontdekten
Kort na de lancering van DeepSeek ontdekten onderzoekers van API-beveiligingsbedrijf Wallarm een jailbreak-kwetsbaarheid die de volledige systeemprompt van het AI-model blootlegde. Dit type beveiligingslek is met name zorgwekkend omdat de systeemprompt van een AI het gedrag, de responsbeperkingen en het beleid voor contentmoderatie dicteert. De meeste AI-ontwikkelaars, waaronder OpenAI met ChatGPT, nemen strikte maatregelen om dergelijke lekken te voorkomen.
Wallarm stelde in een blogpost van 1 februari dat zijn jailbreakmethode gebruikmaakte van op vooroordelen gebaseerde AI-responslogica, hoewel het bedrijf specifieke technische details achterhield vanwege beleid voor verantwoorde openbaarmaking. DeepSeek werd op de hoogte gesteld van het probleem en heeft sindsdien een oplossing geïmplementeerd. Wallarm publiceerde echter wel de volledige tekst van de systeemprompt, waardoor beveiligingsexperts het operationele raamwerk van DeepSeek konden analyseren.
Deze onthulling leidde tot discussies over:
- AI-privacymaatregelen en hoe effectief DeepSeek gebruikersgegevens beschermt.
- Mogelijke vooroordelen in de training van DeepSeek, vooral gezien de beweringen dat het OpenAI-gegevens voor de training zou hebben gebruikt.
- Regelgevende beperkingen die van invloed kunnen zijn op de werking van het AI-model, met name in China, waar AI-inhoud streng wordt gecontroleerd.
Om mogelijke invloed van OpenAI te onderzoeken, vergeleek Wallarm de systeemprompt van DeepSeek met die van ChatGPT. Volgens de analyse van ChatGPT komen de reacties van DeepSeek overeen met strengere nalevingsmaatregelen, terwijl de aanpak van OpenAI flexibeler en gebruikersgerichter is.
DDoS-aanvallen op DeepSeek: een gecoördineerde cyberaanval
Naarmate DeepSeek populairder werd, werd het doelwit van grootschalige distributed denial-of-service (DDoS)-aanvallen. Het bedrijf kondigde aan dat het nieuwe gebruikersregistraties moest blokkeren vanwege het overweldigende aantal aanvallen.
Volgens NSFocus, een cybersecuritybedrijf dat de aanvallen in de gaten houdt, kreeg DeepSeek te maken met drie grote golven van DDoS-aanvallen gericht op zijn API-interface op 25, 26 en 27 januari. Elke aanval duurde ongeveer 35 minuten en had een ernstige impact op het platform van DeepSeek. Op 28 januari was de API-interface nog steeds niet beschikbaar vanwege aanhoudende verstoringen.
Ook het DeepSeek-chatsysteem werd aangevallen, met DDoS-aanvallen op 20 en 25 januari, die elk ongeveer een uur duurden.
DDoS-aanvalsmethoden
NSFocus identificeerde meerdere op reflectie gebaseerde aanvalstechnieken, waaronder:
- NTP-reflectieaanvallen – Het misbruiken van Network Time Protocol (NTP)-servers om aanvalsverkeer te versterken.
- Memcached-reflectieaanvallen : verkeerd geconfigureerde Memcached-servers gebruiken om DeepSeek te overspoelen met enorm veel verkeer.
- SSDP-reflectieaanvallen – Deze aanvallen zijn gericht op SSDP-services (Simple Service Discovery Protocol) om netwerkbronnen te overbelasten.
- CLDAP-reflectieaanvallen – Gebruikmaken van Connection-less Lightweight Directory Access Protocol (CLDAP)-servers om het aanvalsvolume te vergroten.
Een zeer gecoördineerde aanval
Op 28 januari meldde DeepSeek dat aanvallers hun methoden aanpasten als reactie op de mitigatie-inspanningen van het bedrijf. De precisie en coördinatie van deze aanvallen leidden NSFocus tot de conclusie dat de daders een professioneel, goed georganiseerd team waren in plaats van willekeurige hackers.
"De aanvaller toont een extreem hoog professionalisme in elke aanvalsstap, van het selecteren van doelen tot het timen van de aanvallen en het beheersen van de intensiteit", aldus NSFocus.
Volgens de analyse van het cyberbeveiligingsbedrijf waren de belangrijkste aanvalsbronnen systemen uit de Verenigde Staten, het Verenigd Koninkrijk en Australië.
Wat dit betekent voor AI-beveiliging
De DeepSeek-incidenten benadrukken de groeiende cybersecurityrisico's in generatieve AI. Van jailbreak-kwetsbaarheden tot gerichte cyberaanvallen, AI-services zijn nu hoofddoelen voor zowel beveiligingsonderzoekers als kwaadwillende actoren.
Belangrijkste punten:
- AI-jailbreaks vormen nog steeds een beveiligingsuitdaging . Zelfs nieuwere AI-modellen zoals DeepSeek kunnen worden gemanipuleerd om hun interne logica bloot te leggen.
- DDoS-aanvallen op AI-platforms nemen toe – Naarmate AI-diensten populairder worden, trekken ze meer en meer gecoördineerde cyberaanvallen aan.
- De beveiliging van AI moet snel evolueren : ontwikkelaars moeten robuuste beveiligingen implementeren om snelle lekken te voorkomen en zich te verdedigen tegen cyberdreigingen.
Naarmate AI het digitale landschap vormgeeft, moeten cybersecurityteams een stap voor blijven om ervoor te zorgen dat AI-modellen veilig en veerkrachtig blijven tegen opkomende bedreigingen.