Ranjivost ChatGPhisha u ChatGPT-u
Istraživači kibernetičke sigurnosti otkrili su ranjivost u OpenAI-jevom ChatGPT-u koja iskorištava povjerenje platforme u Markdown poveznice i slike, omogućujući napade brzog ubrizgavanja i stvarajući nove mogućnosti za phishing. Tehnika, nazvana ChatGPhish, pokazuje kako se sažimanje pokretano umjetnom inteligencijom može manipulirati kako bi se zlonamjerni sadržaj isporučio izravno putem pouzdanog sučelja.
Problem proizlazi iz načina na koji ChatGPT-ov renderer odgovora obrađuje Markdown elemente koji potječu s web stranica trećih strana. Kada chatbot sažima vanjski sadržaj, automatski vjeruje ugrađenim Markdown poveznicama i URL-ovima slika, dohvaća udaljene slike i prikazuje poveznice kao aktivne elemente na koje se može kliknuti unutar sučelja asistenta.
Sadržaj
Mehanika iza napada
Prijetnja može ugraditi mali zlonamjerni sadržaj unutar web stranice koju ChatGPT kasnije sažima. Tijekom procesa renderiranja, slike koje kontrolira napadač mogu se automatski dohvatiti, potencijalno otkrivajući informacije poput IP adrese žrtve, korisničkog agenta i podataka o referenci.
Osim curenja informacija, ranjivost omogućuje predstavljanje zlonamjernog sadržaja na vrlo uvjerljive načine. Napadači mogu prikazati phishing poveznice izravno unutar ChatGPT odgovora, prikazati lažna sigurnosna upozorenja u stilu sustava i predstaviti QR kodove smještene na infrastrukturi koju kontrolira napadač. Ovi QR kodovi mogu potaknuti korisnike da ih skeniraju mobilnim uređajima, učinkovito zaobilazeći filtriranje URL-ova na računalima i sigurnosne kontrole poduzeća.
Ono što ChatGPhish čini posebno značajnim nije samo brzo ubrizgavanje, već činjenica da AI sustav vjerno slijedi ugrađene upute i prikazuje rezultirajući sadržaj kao dio pouzdanog sažetka. Naizgled obična web stranica stoga može generirati phishing poveznice, upozorenja o krivotvorenim računima, udaljene slike i zlonamjerne QR kodove izravno unutar odgovora AI asistenta.
Širenje područja prijetnji pregledavanja potpomognutog umjetnom inteligencijom
Otkriće naglašava širi sigurnosni izazov: sažimanje se pojavilo kao nova površina za napad neprijatelja. Ranije u ožujku 2026. istraživači su pokazali da posebno izrađene e-poruke mogu manipulirati Microsoft Copilotom putem unakrsnog ubrizgavanja prompta (XPIA), utječući na sažetke generirane umjetnom inteligencijom putem skrivenih uputa.
Kako se organizacije sve više oslanjaju na alate umjetne inteligencije za istraživanje i analizu sadržaja, svaka zlonamjerna web stranica koju obrađuje AI asistent može u kontekst modela uvesti upute kojima upravlja napadač. To predstavlja veliku promjenu u taktikama krađe identiteta (phishing). Umjesto da od korisnika zahtijevaju otvaranje sumnjivih privitaka ili interakciju sa zlonamjernim e-porukama, napadači mogu iskoristiti rutinske aktivnosti pregledavanja i AI tijekove rada za sažimanje kao oružje.
Migracija napada iz okruženja e-pošte u interakcije umjetne inteligencije temeljene na pregledniku dramatično proširuje dostupnu površinu napada. Samo traženje sažetka web stranice može biti dovoljno da izloži korisnike zlonamjernom sadržaju generiranom tehnikama neizravnog ubrizgavanja prompta.
Rastući val tehnika zaobilaženja sigurnosti umjetne inteligencije
Otkriće ChatGPhisha dolazi usred porasta istraživanja koja otkrivaju nove metode napada usmjerene na sustave umjetne inteligencije. Nedavna otkrića uključuju:
- Tehnika jailbreaka nevoljnog učenja u kontekstu (IICL), koja iskorištava sukobe između učenja u kontekstu i sigurnosnog usklađivanja kako bi zaobišla ograničenja GPT-5.4; strategije višestrukog razgovora koje postupno zaobilaze zaštitne mjere modela velikih jezika; napadi ubrizgavanjem tipografskih promptova koji skrivaju upute unutar vizualno iskrivljenih slika; napadi Neural Exec u kombinaciji s tehnikama nadjačavanja Unicodea s desna na lijevo kako bi se zaobišle zaštite Apple Intelligencea; i WebPromptTrap, ranjivost neizravnog ubrizgavanja promptova koja utječe na BrowserOS koji je manipulirao korisnicima putem sažetaka naizgled legitimnog sadržaja generiranih umjetnom inteligencijom.
- Sigurnosne slabosti koje utječu na ekosustave umjetne inteligencije i okvire agenata, uključujući ranjivost u Anthropic Claude kodu koja je omogućila presretanje MCP komunikacije podržane OAuth-om putem lažnog npm paketa; scenarij zlouporabe mehanizma daljinskog ažuriranja usmjeren na OpenClaw vještine; phishing kampanje skrivenog teksta osmišljene za obmanjivanje sigurnosnih proizvoda za e-poštu pokretanih umjetnom inteligencijom; ranjivost ClaudeBleed koja je omogućila proširenjima preglednika izdavanje neovlaštenih naredbi Claudeu; kritične ranjivosti u Microsoft Semantic Kernelu (CVE-2026-25592 i CVE-2026-26030) sposobne za eskalaciju injekcija prompta u udaljeno izvršavanje koda na razini hosta; rašireni sigurnosni nedostaci unutar repozitorija agenata ClawHub i skills.sh; i napadi na NVIDIA-in NemoClaw referentni stog koji su omogućili krađu OpenClaw podataka putem zlonamjernih GitHub repozitorija i npm paketa.
Budućnost kibernetičkih prijetnji potaknutih umjetnom inteligencijom
Kako napredni modeli umjetne inteligencije nastavljaju sazrijevati, kibernetički kriminalci sve više eksperimentiraju sa svojim ofenzivnim sposobnostima. Akteri prijetnji koriste modele velikih jezičnih jezika kako bi razvili prilagodljiviji zlonamjerni softver sposoban mijenjati svoje ponašanje kako bi izbjegao mehanizme otkrivanja.
Osim toga, sustavi umjetne inteligencije uključuju se u procese donošenja odluka o zlonamjernom softveru. Ove mogućnosti omogućuju zlonamjernom softveru da procijeni kompromitirana okruženja, utvrdi jesu li ciljevi vrijedni i odluči jesu li uvjeti prikladni za postavljanje dodatnih korisnih tereta.
Istraživanje ChatGPhish-a služi kao još jedan podsjetnik da AI tehnologije uvode potpuno nova sigurnosna razmatranja. Kako se AI asistenti duboko integriraju u poslovne tijekove rada, zaštita od neizravnih promptova, manipuliranih sažetaka i zlouporaba sučelja temeljenih na povjerenju postat će sve važnija komponenta strategije kibernetičke sigurnosti.