Vi phạm bảo mật DeepSeek làm lộ lỗ hổng AI và gây ra các cuộc tấn công mạng

AI thế hệ mới nhất của Trung Quốc, DeepSeek, đã trở thành chủ đề của sự giám sát an ninh mạng chặt chẽ kể từ khi ra mắt. Các nhà nghiên cứu bảo mật gần đây đã tiết lộ một bản bẻ khóa hệ thống cho thấy hoạt động bên trong của mô hình. Trong khi đó, DeepSeek cũng phải đối mặt với làn sóng tấn công DDoS, buộc phải hạn chế đăng ký người dùng mới. Những sự cố này làm nổi bật cả rủi ro bảo mật của các mô hình AI và sự tinh vi ngày càng tăng của các cuộc tấn công mạng nhắm vào các dịch vụ AI.
Mục lục
Bẻ khóa hệ thống của DeepSeek: Những gì các nhà nghiên cứu phát hiện ra
Ngay sau khi DeepSeek ra mắt, các nhà nghiên cứu tại công ty bảo mật API Wallarm đã tìm thấy một lỗ hổng bẻ khóa đã tiết lộ toàn bộ lời nhắc hệ thống của mô hình AI. Loại lỗ hổng bảo mật này đặc biệt đáng lo ngại vì lời nhắc hệ thống của AI quyết định hành vi, giới hạn phản hồi và chính sách kiểm duyệt nội dung của nó. Hầu hết các nhà phát triển AI, bao gồm OpenAI với ChatGPT, đều thực hiện các biện pháp nghiêm ngặt để ngăn chặn các vụ rò rỉ như vậy.
Wallarm đã tuyên bố trong bài đăng trên blog ngày 1 tháng 2 rằng phương pháp bẻ khóa của họ đã khai thác logic phản hồi AI dựa trên sự thiên vị, mặc dù công ty đã giữ lại các chi tiết kỹ thuật cụ thể do chính sách tiết lộ có trách nhiệm. DeepSeek đã được thông báo về vấn đề này và kể từ đó đã triển khai bản sửa lỗi. Tuy nhiên, Wallarm đã công bố toàn bộ văn bản nhắc nhở hệ thống, cho phép các chuyên gia bảo mật phân tích khuôn khổ hoạt động của DeepSeek.
Sự tiết lộ này đã làm dấy lên những cuộc thảo luận về:
- Các biện pháp bảo mật AI và mức độ hiệu quả của DeepSeek trong việc bảo vệ dữ liệu người dùng.
- Có khả năng xảy ra sai lệch trong quá trình đào tạo của DeepSeek, đặc biệt khi xem xét đến tuyên bố rằng công cụ này có thể đã sử dụng dữ liệu OpenAI để đào tạo.
- Những ràng buộc về mặt quy định có thể ảnh hưởng đến cách thức hoạt động của mô hình AI, đặc biệt là ở Trung Quốc, nơi nội dung AI được kiểm soát chặt chẽ.
Để tìm hiểu ảnh hưởng tiềm tàng của OpenAI, Wallarm đã so sánh lời nhắc hệ thống của DeepSeek với ChatGPT. Theo phân tích của ChatGPT, phản hồi của DeepSeek phù hợp với các biện pháp tuân thủ chặt chẽ hơn, trong khi cách tiếp cận của OpenAI linh hoạt hơn và tập trung vào người dùng hơn.
Các cuộc tấn công DDoS vào DeepSeek: Một cuộc tấn công mạng được phối hợp
Khi DeepSeek ngày càng phổ biến, nó đã trở thành mục tiêu của các cuộc tấn công từ chối dịch vụ phân tán (DDoS) quy mô lớn. Công ty đã thông báo rằng họ phải chặn đăng ký người dùng mới do khối lượng tấn công quá lớn.
Theo NSFocus, một công ty an ninh mạng theo dõi các cuộc tấn công, DeepSeek đã phải đối mặt với ba đợt tấn công DDoS lớn nhắm vào giao diện API của mình vào ngày 25, 26 và 27 tháng 1. Mỗi đợt tấn công kéo dài khoảng 35 phút, ảnh hưởng nghiêm trọng đến nền tảng của DeepSeek. Đến ngày 28 tháng 1, giao diện API vẫn không khả dụng do sự gián đoạn đang diễn ra.
Hệ thống trò chuyện DeepSeek cũng bị tấn công, với các cuộc tấn công DDoS được quan sát vào ngày 20 và 25 tháng 1, mỗi cuộc kéo dài khoảng một giờ.
Phương pháp tấn công DDoS
NSFocus đã xác định nhiều kỹ thuật tấn công dựa trên phản xạ, bao gồm:
- Tấn công phản xạ NTP – Khai thác máy chủ Giao thức thời gian mạng (NTP) để khuếch đại lưu lượng tấn công.
- Tấn công phản chiếu Memcached – Sử dụng máy chủ Memcached được cấu hình sai để làm tràn ngập DeepSeek bằng lưu lượng truy cập lớn.
- Tấn công phản xạ SSDP – Nhắm mục tiêu vào các dịch vụ Giao thức khám phá dịch vụ đơn giản (SSDP) để làm quá tải tài nguyên mạng.
- Tấn công phản xạ CLDAP – Tận dụng máy chủ Giao thức truy cập thư mục nhẹ không cần kết nối (CLDAP) để tăng khối lượng tấn công.
Một cuộc tấn công được phối hợp chặt chẽ
Đến ngày 28 tháng 1, DeepSeek báo cáo rằng những kẻ tấn công đã điều chỉnh phương pháp của chúng để ứng phó với các nỗ lực giảm thiểu của công ty. Độ chính xác và sự phối hợp của các cuộc tấn công này khiến NSFocus kết luận rằng thủ phạm là một nhóm chuyên nghiệp, có tổ chức tốt chứ không phải là tin tặc ngẫu nhiên.
NSFocus cho biết: "Kẻ tấn công thể hiện tính chuyên nghiệp cực kỳ cao trong mọi bước tấn công, từ việc chọn mục tiêu đến thời điểm tấn công và kiểm soát cường độ".
Theo phân tích của công ty an ninh mạng, các nguồn tấn công hàng đầu bao gồm các hệ thống từ Hoa Kỳ, Vương quốc Anh và Úc.
Điều này có ý nghĩa gì đối với bảo mật AI
Các sự cố DeepSeek làm nổi bật những rủi ro an ninh mạng ngày càng tăng trong AI tạo sinh. Từ lỗ hổng bẻ khóa đến các cuộc tấn công mạng có mục tiêu, các dịch vụ AI hiện là mục tiêu chính cho cả các nhà nghiên cứu bảo mật và các tác nhân độc hại.
Những điểm chính cần ghi nhớ:
- Bẻ khóa AI vẫn là một thách thức về bảo mật – Ngay cả các mô hình AI mới hơn như DeepSeek cũng có thể bị thiết kế ngược để phơi bày logic bên trong của chúng.
- Các cuộc tấn công DDoS vào nền tảng AI đang gia tăng – Khi các dịch vụ AI ngày càng phổ biến, chúng sẽ thu hút nhiều cuộc tấn công mạng được phối hợp chặt chẽ hơn.
- Bảo mật AI phải phát triển nhanh chóng – Các nhà phát triển phải triển khai các biện pháp bảo vệ mạnh mẽ để ngăn chặn rò rỉ nhanh chóng và chống lại các mối đe dọa mạng.
Khi AI tiếp tục định hình bối cảnh số, các nhóm an ninh mạng phải luôn đi trước một bước để đảm bảo các mô hình AI vẫn an toàn và có khả năng phục hồi trước các mối đe dọa mới nổi.