Пробивът в сигурността на DeepSeek разкрива уязвимости на AI и предизвиква кибератаки

Превод на:

Най-новият генеративен изкуствен интелект в Китай, DeepSeek, е обект на интензивно изследване на киберсигурността от стартирането му. Изследователите по сигурността наскоро разкриха бърз джейлбрейк на системата, който разкрива вътрешната работа на модела. Междувременно DeepSeek също се изправи пред вълни от DDoS атаки, което го принуди да ограничи регистрациите на нови потребители. Тези инциденти подчертават както рисковете за сигурността на AI моделите, така и нарастващата сложност на кибератаките, насочени към услугите на AI.

Съдържание

Системен бърз джейлбрейк на DeepSeek: Какво откриха изследователите

Малко след дебюта на DeepSeek, изследователи от фирмата за сигурност на API Wallarm откриха уязвимост при джейлбрейк, която изложи на показ пълната системна подкана на AI модела. Този тип пропуск в сигурността е особено обезпокоителен, тъй като подканата на системата на AI диктува неговото поведение, ограничения на отговора и политики за модериране на съдържание. Повечето разработчици на AI, включително OpenAI с ChatGPT, предприемат строги мерки за предотвратяване на подобни течове.

Wallarm заяви в публикация в блог от 1 февруари, че неговият метод за джейлбрейк използва базирана на пристрастия логика на отговор на AI, въпреки че компанията задържа конкретни технически подробности поради политики за отговорно разкриване. DeepSeek беше уведомен за проблема и оттогава внедри корекция. Wallarm обаче публикува пълния текст на подканата на системата, което позволява на експертите по сигурността да анализират оперативната рамка на DeepSeek.

Това разкритие предизвика дискусии за:

AI мерки за поверителност и колко ефективно DeepSeek защитава потребителските данни.
Потенциални пристрастия в обучението на DeepSeek, особено като се имат предвид твърденията, че може да е използвал OpenAI данни за обучение.
Регулаторни ограничения , които биха могли да повлияят на функционирането на AI модела, особено в Китай, където съдържанието на AI е строго контролирано.

За да проучи потенциалното влияние на OpenAI, Wallarm сравни системната подкана на DeepSeek с тази на ChatGPT. Според анализа на ChatGPT, отговорите на DeepSeek са в съответствие с по-строгите мерки за съответствие, докато подходът на OpenAI е по-гъвкав и ориентиран към потребителя.

DDoS атаки срещу DeepSeek: Координирано кибер нападение

С нарастването на популярността на DeepSeek той стана цел на широкомащабни разпределени атаки за отказ на услуга (DDoS). Компанията обяви, че трябва да блокира регистрациите на нови потребители поради огромния обем атаки.

Според NSFocus, фирма за киберсигурност, наблюдаваща атаките, DeepSeek се е сблъсквал с три големи вълни от DDoS атаки, насочени към неговия API интерфейс на 25, 26 и 27 януари. Всяка атака е продължила около 35 минути, оказвайки сериозно въздействие върху платформата на DeepSeek. До 28 януари API интерфейсът все още беше недостъпен поради продължаващи прекъсвания.

Системата за чат DeepSeek също беше атакувана, като на 20 и 25 януари бяха наблюдавани DDoS удари, всеки с продължителност около час.

Методи за DDoS атака

NSFocus идентифицира множество техники за атака, базирани на отражение, включително:

Атаки за отразяване на NTP – Използване на сървъри на Network Time Protocol (NTP) за увеличаване на трафика на атака.
Memcached отразяващи атаки – Използване на неправилно конфигурирани Memcached сървъри за наводняване на DeepSeek с масивен трафик.
SSDP отразяващи атаки – Насочване към услугите на Simple Service Discovery Protocol (SSDP) за претоварване на мрежовите ресурси.
CLDAP отражателни атаки – Използване на сървърите на Lightweight Directory Access Protocol (CLDAP) без връзка за увеличаване на обема на атаката.

Високо координирана атака

До 28 януари DeepSeek съобщи, че нападателите адаптират своите методи в отговор на усилията на компанията за смекчаване. Прецизността и координацията на тези атаки накара NSFocus да заключи, че извършителите са професионален, добре организиран екип, а не случайни хакери.

„Нападателят показва изключително висок професионализъм във всяка атакуваща стъпка, от избора на цели до определяне на времето на атаките и контролиране на интензивността“, заяви NSFocus.

Основните източници на атаки включват системи от Съединените щати, Обединеното кралство и Австралия, според анализа на фирмата за киберсигурност.

Какво означава това за AI сигурността

Инцидентите с DeepSeek подчертават нарастващите рискове за киберсигурността в генеративния AI. От уязвимости при бягство от затвора до целенасочени кибератаки, AI услугите вече са основни цели както за изследователите по сигурността, така и за злонамерените участници.

Ключови изводи:

AI джейлбрейковете остават предизвикателство за сигурността – Дори по-нови AI модели като DeepSeek могат да бъдат проектирани обратно, за да разкрият вътрешната си логика.
DDoS атаките срещу AI платформи се увеличават – Тъй като AI услугите набират популярност, те привличат повече добре координирани кибератаки.
Сигурността на AI трябва да се развива бързо – разработчиците трябва да въведат стабилни предпазни мерки, за да предотвратят незабавни течове и да се защитят от кибер заплахи.

Тъй като AI продължава да оформя дигиталния пейзаж, екипите за киберсигурност трябва да са една крачка напред, за да гарантират, че AI моделите остават сигурни и устойчиви срещу нововъзникващи заплахи.

Процесорът за плащане на EnigmaSoft Digital River GmbH Подаването на молба за несъстоятелност не оказва влияние върху защитата на клиентите на SpyHunter срещу зловреден софтуер

Търсене

Промяна на региона