Нарушение безопасности DeepSeek выявило уязвимости ИИ и спровоцировало кибератаки

Новейший китайский генеративный ИИ DeepSeek стал объектом пристального внимания с точки зрения кибербезопасности с момента своего запуска. Недавно исследователи безопасности раскрыли системный джейлбрейк, который раскрыл внутреннюю работу модели. Между тем, DeepSeek также столкнулся с волнами DDoS-атак, вынудившими его ограничить регистрацию новых пользователей. Эти инциденты подчеркивают как риски безопасности моделей ИИ, так и растущую сложность кибератак, нацеленных на службы ИИ.
Оглавление
Система DeepSeek предлагает джейлбрейк: что обнаружили исследователи
Вскоре после дебюта DeepSeek исследователи из компании по безопасности API Wallarm обнаружили уязвимость джейлбрейка, которая раскрывала полную системную подсказку модели ИИ. Этот тип уязвимости безопасности особенно опасен, поскольку системная подсказка ИИ диктует его поведение, ограничения ответов и политику модерации контента. Большинство разработчиков ИИ, включая OpenAI с ChatGPT, принимают строгие меры для предотвращения таких утечек.
Wallarm заявил в сообщении в блоге от 1 февраля, что его метод джейлбрейка использовал логику реагирования ИИ на основе предвзятости, хотя компания скрыла конкретные технические подробности из-за ответственной политики раскрытия информации. DeepSeek был уведомлен о проблеме и с тех пор развернул исправление. Тем не менее, Wallarm опубликовал полный текст системного приглашения, что позволило экспертам по безопасности проанализировать операционную структуру DeepSeek.
Это открытие вызвало дискуссии о:
- Меры обеспечения конфиденциальности с помощью ИИ и эффективность защиты пользовательских данных с помощью DeepSeek.
- Возможные ошибки в обучении DeepSeek, особенно с учетом заявлений о том, что для обучения могли использоваться данные OpenAI .
- Нормативные ограничения , которые могут повлиять на работу модели ИИ, особенно в Китае, где контент ИИ жестко контролируется.
Чтобы исследовать потенциальное влияние OpenAI, Wallarm сравнил системные запросы DeepSeek с ChatGPT. Согласно анализу ChatGPT, ответы DeepSeek соответствуют более строгим мерам соответствия, тогда как подход OpenAI более гибкий и ориентирован на пользователя.
DDoS-атаки на DeepSeek: скоординированная кибератака
По мере роста популярности DeepSeek он стал объектом масштабных распределенных атак типа «отказ в обслуживании» (DDoS). Компания объявила, что ей пришлось заблокировать регистрацию новых пользователей из-за подавляющего объема атак.
По данным NSFocus, компании по кибербезопасности, отслеживающей атаки, DeepSeek столкнулась с тремя крупными волнами DDoS-атак, нацеленных на ее интерфейс API 25, 26 и 27 января. Каждая атака длилась около 35 минут, серьезно повлияв на платформу DeepSeek. К 28 января интерфейс API все еще был недоступен из-за продолжающихся сбоев.
Система чата DeepSeek также подверглась атаке: 20 и 25 января были зафиксированы DDoS-атаки, каждая из которых длилась около часа.
Методы DDoS-атак
NSFocus выявил методы атаки, основанные на множественном отражении, в том числе:
- Атаки с отражением NTP — использование серверов сетевого протокола времени (NTP) для усиления трафика атаки.
- Атаки с отражением Memcached — использование неправильно настроенных серверов Memcached для переполнения DeepSeek огромным трафиком.
- Атаки с отражением SSDP — нацелены на службы протокола Simple Service Discovery Protocol (SSDP) с целью перегрузки сетевых ресурсов.
- Атаки с отражением CLDAP — использование серверов протокола CLDAP без установления соединения для увеличения объема атак.
Высокоскоординированная атака
К 28 января DeepSeek сообщила, что злоумышленники адаптировали свои методы в ответ на усилия компании по смягчению последствий. Точность и координация этих атак привели NSFocus к выводу, что злоумышленники были профессиональной, хорошо организованной командой, а не случайными хакерами.
«Нападающий демонстрирует чрезвычайно высокий профессионализм на каждом этапе атаки, от выбора целей до расчета времени атак и контроля интенсивности», — заявили в NSFocus.
По данным анализа компании по кибербезопасности, основными источниками атак стали системы из США, Великобритании и Австралии.
Что это означает для безопасности ИИ
Инциденты DeepSeek подчеркивают растущие риски кибербезопасности в генеративном ИИ. От уязвимостей джейлбрейка до целевых кибератак, службы ИИ теперь являются главными целями как для исследователей безопасности, так и для злоумышленников.
Основные выводы:
- Взлом ИИ остается проблемой безопасности — даже новые модели ИИ, такие как DeepSeek, можно подвергнуть реверс-инжинирингу, чтобы раскрыть их внутреннюю логику.
- Число DDoS-атак на платформы ИИ растет . По мере того, как сервисы ИИ набирают популярность, они становятся объектом более скоординированных кибератак.
- Безопасность ИИ должна быстро развиваться . Разработчики должны внедрять надежные меры безопасности для предотвращения быстрых утечек и защиты от киберугроз.
Поскольку ИИ продолжает формировать цифровой ландшафт, команды по кибербезопасности должны быть на шаг впереди, чтобы гарантировать, что модели ИИ остаются безопасными и устойчивыми к новым угрозам.