База даних загроз Вразливість Вразливість ChatGPhish у ChatGPT

Вразливість ChatGPhish у ChatGPT

Дослідники з кібербезпеки виявили вразливість у ChatGPT від OpenAI, яка використовує довіру платформи до посилань та зображень Markdown, що дозволяє здійснювати атаки швидкого впровадження та створювати нові можливості для фішингу. Ця техніка, що отримала назву ChatGPhish, демонструє, як підсумовування на базі штучного інтелекту можна маніпулювати для доставки шкідливого контенту безпосередньо через надійний інтерфейс.

Проблема виникає через те, як рендерер відповідей ChatGPT обробляє елементи Markdown, що походять зі сторонніх веб-сторінок. Коли чат-бот підсумовує зовнішній контент, він автоматично довіряє вбудованим посиланням Markdown та URL-адресам зображень, отримуючи віддалені зображення та відображаючи посилання як активні, клікабельні елементи в інтерфейсі помічника.

Механіка атаки

Зловмисник може вбудувати невелике шкідливе корисне навантаження на веб-сторінку, яке пізніше підсумовується ChatGPT. Під час процесу рендерингу зображення, контрольовані зловмисником, можуть бути автоматично отримані, що потенційно може розкрити таку інформацію, як IP-адреса жертви, агент користувача та дані реферера.

Окрім витоку інформації, ця вразливість дозволяє представляти шкідливий контент у дуже переконливі способи. Зловмисники можуть відображати фішингові посилання безпосередньо у відповідях ChatGPT, відображати шахрайські попередження безпеки в системному стилі та представляти QR-коди, розміщені на контрольованій зловмисником інфраструктурі. Ці QR-коди можуть спонукати користувачів сканувати їх за допомогою мобільних пристроїв, ефективно обходячи фільтрацію URL-адрес на основі комп’ютерів та засоби контролю безпеки підприємства.

Особливо важливим ChatGPhish робить не сама оперативність введення коду, а той факт, що система штучного інтелекту точно дотримується вбудованих інструкцій та представляє отриманий контент як частину надійного викладу. Таким чином, звичайна веб-сторінка може генерувати фішингові посилання, сповіщення про підроблені облікові записи, віддалені зображення та шкідливі QR-коди безпосередньо у відповіді помічника штучного інтелекту.

Розширення поверхні загроз перегляду веб-сторінок за допомогою штучного інтелекту

Це відкриття висвітлює ширшу проблему безпеки: підсумовування з'явилося як нова поверхня для зловмисної атаки. Раніше, у березні 2026 року, дослідники продемонстрували, що спеціально створені електронні листи можуть маніпулювати Microsoft Copilot за допомогою перехресного впровадження запитів (XPIA), впливаючи на підсумки, згенеровані штучним інтелектом, за допомогою прихованих інструкцій.

Оскільки організації дедалі більше покладаються на інструменти штучного інтелекту для досліджень та аналізу контенту, будь-яка шкідлива веб-сторінка, оброблена помічником штучного інтелекту, може впроваджувати інструкції, контрольовані зловмисником, у контекст моделі. Це являє собою суттєвий зсув у тактиці фішингу. Замість того, щоб вимагати від користувачів відкривати підозрілі вкладення або взаємодіяти зі шкідливими електронними листами, зловмисники можуть використовувати як зброю рутинну активність перегляду веб-сторінок та робочі процеси підсумовування за допомогою штучного інтелекту.

Міграція атак з електронної пошти до взаємодії зі штучним інтелектом на основі браузера значно розширює доступну поверхню для атак. Простого запиту на короткий опис веб-сторінки може бути достатньо, щоб наразити користувачів на шкідливий контент, створений за допомогою методів непрямого впровадження запитів.

Зростаюча хвиля методів обходу безпеки штучним інтелектом

Розкриття інформації про ChatGPhish з'явилося на тлі сплеску досліджень, що розкривають нові методи атак, спрямовані на системи штучного інтелекту. Нещодавні висновки включають:

  • Техніка джейлбрейка примусового навчання в контексті (IICL), яка використовує конфлікти між навчанням у контексті та вирівнюванням безпеки для обходу обмежень GPT-5.4; стратегії багаточергової розмови, які поступово обходять захист моделей великих мов; атаки з типографським впровадженням запитів, які приховують інструкції у візуально спотворених зображеннях; атаки Neural Exec у поєднанні з техніками перевизначення Unicode справа наліво для обходу захисту Apple Intelligence; та WebPromptTrap, вразливість непрямого впровадження запитів, що впливає на BrowserOS, яка маніпулювала користувачами за допомогою згенерованих штучним інтелектом резюме, здавалося б, легітимного контенту.
  • Влажності безпеки, що впливають на екосистеми штучного інтелекту та структури агентів, включаючи вразливість у коді Anthropic Claude, яка дозволяла перехоплювати зв'язок MCP, що підтримується OAuth, через шахрайський пакет npm; сценарій зловживання механізмом віддаленого оновлення, спрямований на навички OpenClaw; фішингові кампанії з використанням прихованого тексту, розроблені для обману продуктів безпеки електронної пошти на базі штучного інтелекту; вразливість ClaudeBleed, яка дозволяла розширенням браузера видавати несанкціоновані команди Claude; критичні вразливості в Microsoft Semantic Kernel (CVE-2026-25592 та CVE-2026-26030), здатні до ескалації впровадження запитів у віддалене виконання коду на рівні хоста; поширені недоліки безпеки в репозиторіях агентів ClawHub та skills.sh; та атаки на стек посилань NemoClaw від NVIDIA, які дозволяли витік даних OpenClaw через шкідливі репозиторії GitHub та пакети npm.

Майбутнє кіберзагроз, керованих штучним інтелектом

У міру розвитку передових моделей штучного інтелекту, кіберзлочинці все частіше експериментують зі своїми наступальними можливостями. Зловмисники використовують моделі великих мов програмування для розробки більш адаптивного шкідливого програмного забезпечення, здатного змінювати свою поведінку, щоб уникати механізмів виявлення.

Крім того, системи штучного інтелекту інтегруються в процеси прийняття рішень щодо шкідливих програм. Ці можливості дозволяють шкідливому програмному забезпеченню оцінювати скомпрометовані середовища, визначати цінність цілей та вирішувати, чи є умови придатними для розгортання додаткових корисних навантажень.

Дослідження ChatGPhish слугує ще одним нагадуванням про те, що технології штучного інтелекту вводять абсолютно нові міркування безпеки. Оскільки помічники штучного інтелекту глибоко інтегруються в робочі процеси підприємства, захист від непрямих введень запитів, маніпульованих підсумків та зловживань інтерфейсом на основі довіри стане дедалі важливішим компонентом стратегії кібербезпеки.

В тренді

Найбільше переглянуті

Завантаження...