Ασφάλεια Υπολογιστών Η παραβίαση ασφαλείας DeepSeek αποκαλύπτει ευπάθειες AI...

Η παραβίαση ασφαλείας DeepSeek αποκαλύπτει ευπάθειες AI και πυροδοτεί κυβερνοεπιθέσεις

Το πιο πρόσφατο γενεσιουργό AI της Κίνας, το DeepSeek, έχει αποτελέσει αντικείμενο έντονου ελέγχου στον κυβερνοχώρο από την κυκλοφορία του. Ερευνητές ασφαλείας αποκάλυψαν πρόσφατα ένα άμεσο σύστημα jailbreak που αποκάλυψε την εσωτερική λειτουργία του μοντέλου. Εν τω μεταξύ, το DeepSeek αντιμετώπισε επίσης κύματα επιθέσεων DDoS, αναγκάζοντάς το να περιορίσει τις εγγραφές νέων χρηστών. Αυτά τα περιστατικά υπογραμμίζουν τόσο τους κινδύνους ασφαλείας των μοντέλων τεχνητής νοημοσύνης όσο και την αυξανόμενη πολυπλοκότητα των κυβερνοεπιθέσεων που στοχεύουν υπηρεσίες τεχνητής νοημοσύνης.

Πρόταση Jailbreak συστήματος του DeepSeek: Τι ανακάλυψαν οι ερευνητές

Λίγο μετά το ντεμπούτο του DeepSeek, οι ερευνητές της εταιρείας ασφαλείας API Wallarm ανακάλυψαν μια ευπάθεια jailbreak που αποκάλυψε το πλήρες σύστημα προτροπής του μοντέλου AI. Αυτός ο τύπος ελαττώματος ασφαλείας είναι ιδιαίτερα ανησυχητικός επειδή η προτροπή συστήματος ενός AI υπαγορεύει τη συμπεριφορά του, τους περιορισμούς απόκρισης και τις πολιτικές εποπτείας περιεχομένου. Οι περισσότεροι προγραμματιστές τεχνητής νοημοσύνης, συμπεριλαμβανομένου του OpenAI με ChatGPT, λαμβάνουν αυστηρά μέτρα για να αποτρέψουν τέτοιες διαρροές.

Η Wallarm δήλωσε σε μια ανάρτηση ιστολογίου την 1η Φεβρουαρίου ότι η μέθοδος jailbreak του εκμεταλλευόταν τη λογική απόκρισης τεχνητής νοημοσύνης που βασίζεται στην προκατάληψη, αν και η εταιρεία απέκρυψε συγκεκριμένες τεχνικές λεπτομέρειες λόγω υπεύθυνων πολιτικών αποκάλυψης. Το DeepSeek ειδοποιήθηκε για το πρόβλημα και έκτοτε έχει αναπτύξει μια επιδιόρθωση. Ωστόσο, η Wallarm δημοσίευσε το πλήρες κείμενο προτροπής του συστήματος, επιτρέποντας στους ειδικούς ασφαλείας να αναλύσουν το λειτουργικό πλαίσιο του DeepSeek.

Αυτή η αποκάλυψη πυροδότησε συζητήσεις σχετικά με:

  • Μέτρα απορρήτου AI και πόσο αποτελεσματικά το DeepSeek προστατεύει τα δεδομένα των χρηστών.
  • Πιθανές προκαταλήψεις στην εκπαίδευση του DeepSeek, ειδικά λαμβάνοντας υπόψη τους ισχυρισμούς ότι μπορεί να χρησιμοποίησε δεδομένα OpenAI για εκπαίδευση.
  • Ρυθμιστικοί περιορισμοί που θα μπορούσαν να επηρεάσουν τον τρόπο λειτουργίας του μοντέλου AI, ιδιαίτερα στην Κίνα, όπου το περιεχόμενο AI ελέγχεται αυστηρά.

Για να διερευνήσει πιθανή επιρροή του OpenAI, η Wallarm συνέκρινε το σύστημα προτροπής του DeepSeek με αυτό του ChatGPT. Σύμφωνα με την ανάλυση του ChatGPT, οι απαντήσεις του DeepSeek ευθυγραμμίζονται με αυστηρότερα μέτρα συμμόρφωσης, ενώ η προσέγγιση του OpenAI είναι πιο ευέλικτη και επικεντρωμένη στον χρήστη.

Επιθέσεις DDoS στο DeepSeek: Μια συντονισμένη επίθεση στον κυβερνοχώρο

Καθώς η δημοτικότητα του DeepSeek μεγάλωνε, έγινε στόχος μεγάλης κλίμακας κατανεμημένων επιθέσεων άρνησης υπηρεσίας (DDoS). Η εταιρεία ανακοίνωσε ότι έπρεπε να μπλοκάρει τις εγγραφές νέων χρηστών λόγω του συντριπτικού όγκου των επιθέσεων.

Σύμφωνα με την NSFocus, μια εταιρεία κυβερνοασφάλειας που παρακολουθεί τις επιθέσεις, το DeepSeek αντιμετώπισε τρία μεγάλα κύματα επιθέσεων DDoS με στόχο τη διεπαφή API του στις 25, 26 και 27 Ιανουαρίου. Κάθε επίθεση διήρκεσε περίπου 35 λεπτά, επηρεάζοντας σοβαρά την πλατφόρμα του DeepSeek. Μέχρι τις 28 Ιανουαρίου, η διεπαφή API ήταν ακόμα μη διαθέσιμη λόγω συνεχιζόμενων διακοπών.

Το σύστημα συνομιλίας DeepSeek δέχθηκε επίσης επίθεση, με απεργίες DDoS που παρατηρήθηκαν στις 20 και 25 Ιανουαρίου, με διάρκεια περίπου μία ώρα το καθένα.

Μέθοδοι επίθεσης DDoS

Το NSFocus εντόπισε πολλαπλές τεχνικές επίθεσης που βασίζονται σε αντανάκλαση, όπως:

  • Επιθέσεις ανάκλασης NTP – Εκμετάλλευση διακομιστών πρωτοκόλλου χρόνου δικτύου (NTP) για την ενίσχυση της κυκλοφορίας επιθέσεων.
  • Επιθέσεις ανάκλασης Memcached – Χρήση εσφαλμένων διακομιστών Memcached για να πλημμυρίσει το DeepSeek με τεράστια κίνηση.
  • Επιθέσεις ανάκλασης SSDP – Στόχευση υπηρεσιών Simple Service Discovery Protocol (SSDP) για την υπερκάλυψη πόρων δικτύου.
  • Επιθέσεις ανάκλασης CLDAP – Αξιοποίηση διακομιστών Lightweight Directory Access Protocol (CLDAP) χωρίς σύνδεση για αύξηση του όγκου των επιθέσεων.

Μια άκρως συντονισμένη επίθεση

Μέχρι τις 28 Ιανουαρίου, το DeepSeek ανέφερε ότι οι επιτιθέμενοι προσάρμοζαν τις μεθόδους τους ως απάντηση στις προσπάθειες μετριασμού της εταιρείας. Η ακρίβεια και ο συντονισμός αυτών των επιθέσεων οδήγησε το NSFocus στο συμπέρασμα ότι οι δράστες ήταν μια επαγγελματική, καλά οργανωμένη ομάδα και όχι τυχαίοι χάκερ.

«Ο επιτιθέμενος δείχνει εξαιρετικά υψηλό επαγγελματισμό σε κάθε επιθετικό βήμα, από την επιλογή στόχων μέχρι τον συγχρονισμό των επιθέσεων και τον έλεγχο της έντασης», δήλωσε ο NSFocus.

Οι κορυφαίες πηγές επιθέσεων περιελάμβαναν συστήματα από τις Ηνωμένες Πολιτείες, το Ηνωμένο Βασίλειο και την Αυστραλία, σύμφωνα με την ανάλυση της εταιρείας κυβερνοασφάλειας.

Τι σημαίνει αυτό για την ασφάλεια AI

Τα περιστατικά DeepSeek υπογραμμίζουν τους αυξανόμενους κινδύνους για την ασφάλεια στον κυβερνοχώρο στη γενετική τεχνητή νοημοσύνη. Από τις ευπάθειες του jailbreak έως τις στοχευμένες επιθέσεις στον κυβερνοχώρο, οι υπηρεσίες τεχνητής νοημοσύνης είναι πλέον πρωταρχικοί στόχοι τόσο για τους ερευνητές ασφαλείας όσο και για τους κακόβουλους παράγοντες.

Βασικά συμπεράσματα:

  1. Τα jailbreak της τεχνητής νοημοσύνης παραμένουν μια πρόκληση ασφαλείας – Ακόμη και νεότερα μοντέλα τεχνητής νοημοσύνης όπως το DeepSeek μπορούν να δημιουργηθούν αντίστροφα για να εκθέσουν την εσωτερική τους λογική.
  2. Οι επιθέσεις DDoS εναντίον πλατφορμών τεχνητής νοημοσύνης αυξάνονται – Καθώς οι υπηρεσίες τεχνητής νοημοσύνης αποκτούν δημοτικότητα, προσελκύουν πιο άκρως συντονισμένες κυβερνοεπιθέσεις.
  3. Η ασφάλεια της τεχνητής νοημοσύνης πρέπει να εξελίσσεται γρήγορα – Οι προγραμματιστές πρέπει να εφαρμόζουν ισχυρές διασφαλίσεις για την αποφυγή έγκαιρων διαρροών και την άμυνα έναντι των απειλών στον κυβερνοχώρο.

Καθώς η τεχνητή νοημοσύνη συνεχίζει να διαμορφώνει το ψηφιακό τοπίο, οι ομάδες κυβερνοασφάλειας πρέπει να παραμείνουν ένα βήμα μπροστά για να διασφαλίσουν ότι τα μοντέλα τεχνητής νοημοσύνης παραμένουν ασφαλή και ανθεκτικά έναντι των αναδυόμενων απειλών.

Φόρτωση...