Ranljivost ChatGPhish v ChatGPT
Raziskovalci kibernetske varnosti so odkrili ranljivost v tehnologiji ChatGPT podjetja OpenAI, ki izkorišča zaupanje platforme v povezave in slike Markdown, kar omogoča napade s takojšnjim vbrizgavanjem in ustvarja nove priložnosti za lažno predstavljanje. Tehnika, poimenovana ChatGPhish, prikazuje, kako je mogoče manipulirati s povzemanjem, ki ga poganja umetna inteligenca, da se zlonamerna vsebina dostavi neposredno prek zaupanja vrednega vmesnika.
Težava izhaja iz načina, kako upodabljalnik odgovorov ChatGPT obdeluje elemente Markdown, ki izvirajo s spletnih strani tretjih oseb. Ko klepetalni robot povzema zunanjo vsebino, samodejno zaupa vdelanim povezavam Markdown in URL-jem slik, pridobiva oddaljene slike in prikazuje povezave kot aktivne elemente, na katere je mogoče klikniti, znotraj vmesnika pomočnika.
Kazalo
Mehanika napada
Grožnjec lahko v spletno stran vdela majhen zlonamerni koristni tovor, ki ga ChatGPT kasneje povzame. Med postopkom upodabljanja se lahko samodejno pridobijo slike, ki jih nadzoruje napadalec, kar lahko razkrije informacije, kot so IP-naslov žrtve, uporabniški agent in podatki o napotiteljici.
Poleg uhajanja informacij ranljivost omogoča tudi predstavitev zlonamerne vsebine na zelo prepričljive načine. Napadalci lahko neposredno v odgovorih ChatGPT prikažejo lažne povezave, prikažejo goljufiva varnostna opozorila v slogu sistema in predstavijo QR kode, ki gostujejo na infrastrukturi, ki jo nadzoruje napadalec. Te QR kode lahko uporabnike spodbudijo k skeniranju z mobilnimi napravami, s čimer se učinkovito izognejo filtriranju URL-jev na namiznih računalnikih in varnostnim kontrolam podjetij.
Kar ChatGPhish dela še posebej pomembnega, ni samo hitro vbrizgavanje, temveč dejstvo, da sistem umetne inteligence zvesto sledi vdelanim navodilom in predstavi nastalo vsebino kot del zaupanja vrednega povzetka. Na videz običajna spletna stran lahko tako ustvari lažne povezave, opozorila o ponarejenih računih, oddaljene slike in zlonamerne kode QR neposredno v odgovoru pomočnika umetne inteligence.
Širjenje grožnje brskanja s pomočjo umetne inteligence
Odkritje poudarja širši varnostni izziv: povzemanje se je pojavilo kot nova površina za sovražnikov napad. Prej, marca 2026, so raziskovalci pokazali, da lahko posebej oblikovana e-poštna sporočila manipulirajo z Microsoft Copilotom prek navzkrižnega vbrizgavanja pozivov (XPIA) in s skritimi navodili vplivajo na povzetke, ki jih ustvari umetna inteligenca.
Ker se organizacije vse bolj zanašajo na orodja umetne inteligence za raziskave in analizo vsebin, lahko vsaka zlonamerna spletna stran, ki jo obdela pomočnik umetne inteligence, v kontekst modela vnese navodila, ki jih nadzoruje napadalec. To predstavlja velik premik v taktikah lažnega predstavljanja. Namesto da bi od uporabnikov zahtevali odpiranje sumljivih prilog ali interakcijo z zlonamernimi e-poštnimi sporočili, lahko napadalci kot orožje izkoristijo rutinsko brskanje in delovne postopke povzemanja z umetno inteligenco.
Selitev napadov iz e-poštnih okolij v interakcije z umetno inteligenco, ki temeljijo na brskalniku, dramatično širi razpoložljivo površino za napade. Že sama zahteva povzetka spletne strani je lahko dovolj, da uporabnike izpostavi zlonamerni vsebini, ki jo ustvarijo tehnike posrednega vbrizgavanja promptov.
Naraščajoči val tehnik obhoda varnosti z umetno inteligenco
Razkritje ChatGPhish prihaja sredi porasta raziskav, ki razkrivajo nove metode napadov, usmerjenih v sisteme umetne inteligence. Nedavne ugotovitve vključujejo:
- Tehnika jailbreaka neprostovoljnega učenja v kontekstu (IICL), ki izkorišča konflikte med učenjem v kontekstu in varnostno poravnavo za obhod omejitev GPT-5.4; strategije večobratnega pogovora, ki postopoma zaobidejo zaščitne ukrepe velikih jezikovnih modelov; napadi z vbrizgavanjem tipografskih ukazov, ki skrivajo navodila v vizualno popačenih slikah; napadi Neural Exec v kombinaciji s tehnikami preglasitve Unicode od desne proti levi za obhod zaščit Apple Intelligence; in WebPromptTrap, ranljivost posrednega vbrizgavanja ukazov, ki vpliva na BrowserOS in manipulira z uporabniki prek povzetkov na videz legitimne vsebine, ki jih ustvarja umetna inteligenca.
- Varnostne pomanjkljivosti, ki vplivajo na ekosisteme umetne inteligence in ogrodja agentov, vključno z ranljivostjo v kodi Anthropic Claude, ki je omogočala prestrezanje komunikacij MCP, podprtih z OAuth, prek lažnega paketa npm; scenarij zlorabe mehanizma za oddaljeno posodabljanje, usmerjen v spretnosti OpenClaw; kampanje lažnega predstavljanja s skritim besedilom, zasnovane za zavajanje izdelkov za varnost e-pošte, ki jih poganja umetna inteligenca; ranljivost ClaudeBleed, ki je razširitvam brskalnika omogočala izdajanje nepooblaščenih ukazov Claudeu; kritične ranljivosti v Microsoftovem semantičnem jedru (CVE-2026-25592 in CVE-2026-26030), ki lahko stopnjevajo vbrizgavanje pozivov v oddaljeno izvajanje kode na ravni gostitelja; razširjene varnostne pomanjkljivosti v repozitorijih agentov ClawHub in skills.sh; in napadi na referenčni sklad NemoClaw podjetja NVIDIA, ki so omogočili izbruh podatkov OpenClaw prek zlonamernih repozitorijev GitHub in paketov npm.
Prihodnost kibernetskih groženj, ki jih poganja umetna inteligenca
Z razvojem naprednih modelov umetne inteligence kibernetski kriminalci vse pogosteje eksperimentirajo s svojimi ofenzivnimi zmogljivostmi. Akterji grožnje izkoriščajo modele velikih jezikov za razvoj bolj prilagodljive zlonamerne programske opreme, ki je sposobna spremeniti svoje vedenje in se izogniti mehanizmom zaznavanja.
Poleg tega se sistemi umetne inteligence vključujejo v procese odločanja o zlonamerni programski opremi. Te zmogljivosti omogočajo zlonamerni programski opremi, da oceni ogrožena okolja, ugotovi, ali so tarče dragocene, in odloči, ali so pogoji primerni za namestitev dodatnih koristnih tovorov.
Raziskava ChatGPhish je še en opomin, da tehnologije umetne inteligence uvajajo povsem nove varnostne vidike. Ker se pomočniki umetne inteligence vse bolj integrirajo v delovne procese podjetij, bo zaščita pred posrednimi vbrizgavanji pozivov, manipuliranimi povzetki in zlorabami vmesnikov na podlagi zaupanja postala vse bolj ključna komponenta strategije kibernetske varnosti.