Уязвимост на ChatGPhish в ChatGPT
Изследователи по киберсигурност откриха уязвимост в ChatGPT на OpenAI, която експлоатира доверието на платформата в линкове и изображения на Markdown, позволявайки атаки с бързо инжектиране и създавайки нови възможности за фишинг. Техниката, наречена ChatGPhish, демонстрира как обобщението, задвижвано от изкуствен интелект, може да бъде манипулирано, за да се доставя злонамерено съдържание директно през надежден интерфейс.
Проблемът произтича от начина, по който рендерът на отговори на ChatGPT обработва Markdown елементи, произхождащи от уеб страници на трети страни. Когато чатботът обобщава външно съдържание, той автоматично се доверява на вградени Markdown връзки и URL адреси на изображения, извличайки отдалечени изображения и показвайки връзките като активни, кликаеми елементи в интерфейса на асистента.
Съдържание
Механиката зад атаката
Злонамерен участник може да вгради малък зловреден полезен товар в уеб страница, който по-късно се обобщава от ChatGPT. По време на процеса на рендиране, контролирани от нападателя изображения могат да бъдат автоматично извлечени, потенциално разкривайки информация като IP адреса на жертвата, потребителския агент и данните за препращащия сървър.
Освен изтичането на информация, уязвимостта позволява представянето на злонамерено съдържание по изключително убедителни начини. Нападателите могат да изобразяват фишинг връзки директно в отговорите на ChatGPT, да показват измамни предупреждения за сигурност в системен стил и да представят QR кодове, хоствани на контролирана от нападателя инфраструктура. Тези QR кодове могат да насърчат потребителите да ги сканират с мобилни устройства, като по този начин ефективно заобикалят филтрирането на URL адреси, базирано на настолни компютри, и корпоративните контроли за сигурност.
Това, което прави ChatGPhish особено важен, не е самото бързо инжектиране, а фактът, че системата с изкуствен интелект следва вярно вградените инструкции и представя полученото съдържание като част от надеждно обобщение. Следователно, една на пръв поглед обикновена уеб страница може да генерира фишинг връзки, предупреждения за фалшиви акаунти, отдалечени изображения и злонамерени QR кодове директно в отговора на асистента с изкуствен интелект.
Разширяващата се повърхност на заплахите от сърфирането, подпомагано от изкуствен интелект
Откритието подчертава по-широко предизвикателство пред сигурността: обобщаването се очертава като нова повърхност за враждебна атака. По-рано през март 2026 г. изследователи демонстрираха, че специално създадени имейли могат да манипулират Microsoft Copilot чрез cross-prompt injection (XPIA), влияейки върху генерираните от изкуствен интелект обобщения чрез скрити инструкции.
Тъй като организациите все повече разчитат на инструменти с изкуствен интелект за изследвания и анализ на съдържание, всяка злонамерена уеб страница, обработена от асистент с изкуствен интелект, може да въведе контролирани от нападателя инструкции в контекста на модела. Това представлява голяма промяна във фишинг тактиките. Вместо да изискват от потребителите да отварят подозрителни прикачени файлове или да взаимодействат със злонамерени имейли, нападателите могат да използват като оръжие рутинната дейност по сърфиране и работните процеси за обобщаване с изкуствен интелект.
Миграцията на атаки от имейл среди към взаимодействия с изкуствен интелект, базирани на браузър, драстично разширява наличната повърхност за атака. Самото искане на обобщение на уеб страница може да е достатъчно, за да изложи потребителите на злонамерено съдържание, генерирано чрез техники за индиректно инжектиране на подкани.
Нарастваща вълна от техники за заобикаляне на сигурността с изкуствен интелект
Разкритието за ChatGPhish идва на фона на вълна от изследвания, разкриващи нови методи за атака, насочени към системи с изкуствен интелект. Последните открития включват:
- Техниката за джейлбрейк на неволно обучение в контекст (IICL), която използва конфликти между обучението в контекст и подравняването за безопасност, за да заобиколи ограниченията на GPT-5.4; стратегии за многократен разговор, които постепенно заобикалят защитите на големи езикови модели; атаки с инжектиране на типографски подкани, които крият инструкции във визуално изкривени изображения; атаки на Neural Exec, комбинирани с техники за отмяна на Unicode отдясно наляво, за да заобиколят защитите на Apple Intelligence; и WebPromptTrap, уязвимост за индиректно инжектиране на подкани, засягаща BrowserOS, която манипулира потребителите чрез генерирани от изкуствен интелект резюмета на привидно легитимно съдържание.
- Слабости в сигурността, засягащи екосистемите от изкуствен интелект и рамките на агентите, включително уязвимост в Anthropic Claude Code, която позволява прихващане на MCP комуникации, поддържани от OAuth, чрез нелоялен npm пакет; сценарий за злоупотреба с механизъм за дистанционно актуализиране, насочен към умения на OpenClaw; фишинг кампании със скрит текст, предназначени да заблудят продукти за сигурност на електронната поща, задвижвани от изкуствен интелект; уязвимостта ClaudeBleed, която позволява на разширенията на браузъра да издават неоторизирани команди на Claude; критични уязвимости в Microsoft Semantic Kernel (CVE-2026-25592 и CVE-2026-26030), способни да ескалират инжектиране на промпти в дистанционно изпълнение на код на ниво хост; широко разпространени пропуски в сигурността в хранилищата на агенти ClawHub и skills.sh; и атаки срещу референтния стек NemoClaw на NVIDIA, които позволяват изтичане на данни от OpenClaw чрез злонамерени хранилища на GitHub и npm пакети.
Бъдещето на киберзаплахите, задвижвани от изкуствен интелект
С развитието на усъвършенстваните модели на изкуствен интелект, киберпрестъпниците все повече експериментират със своите офанзивни възможности. Злонамерените лица използват модели с големи езици, за да разработват по-адаптивен зловреден софтуер, способен да променя поведението си, за да избегне механизмите за откриване.
Освен това, системите с изкуствен интелект се включват в процесите на вземане на решения за злонамерен софтуер. Тези възможности позволяват на злонамерения софтуер да оценява компрометирани среди, да определя дали целите са ценни и да решава дали условията са подходящи за разполагане на допълнителни полезни товари.
Изследването на ChatGPhish служи като поредно напомняне, че технологиите с изкуствен интелект въвеждат изцяло нови съображения за сигурност. Тъй като асистентите с изкуствен интелект се интегрират дълбоко в работните процеси на предприятието, защитата срещу индиректни инжекции с подкани, манипулирани обобщения и злоупотреби с интерфейси, базирани на доверие, ще се превърне във все по-важен компонент на стратегията за киберсигурност.