Vulnerabilitatea ChatGPhish în ChatGPT
Cercetătorii în domeniul securității cibernetice au descoperit o vulnerabilitate în ChatGPT de la OpenAI, care exploatează încrederea platformei în linkurile și imaginile Markdown, permițând atacuri prompte de tip injecție și creând noi oportunități de phishing. Tehnica, denumită ChatGPhish, demonstrează cum poate fi manipulată sumarizarea bazată pe inteligență artificială pentru a livra conținut rău intenționat direct printr-o interfață de încredere.
Problema provine din modul în care instrumentul de redare a răspunsurilor ChatGPT procesează elementele Markdown provenite de pe pagini web terțe. Când chatbot-ul rezumă conținut extern, acesta acordă automat încredere linkurilor Markdown și adreselor URL ale imaginilor încorporate, preluând imagini la distanță și afișând linkurile ca elemente active, pe care se poate da clic, în interfața asistentului.
Cuprins
Mecanica din spatele atacului
Un atacator poate încorpora o mică sarcină utilă malițioasă într-o pagină web, care este ulterior rezumată de ChatGPT. În timpul procesului de randare, imaginile controlate de atacator pot fi preluate automat, expunând potențial informații precum adresa IP a victimei, agentul utilizator și detaliile referitorului.
Dincolo de scurgerile de informații, vulnerabilitatea permite prezentarea conținutului rău intenționat în moduri extrem de convingătoare. Atacatorii pot reda linkuri de phishing direct în răspunsurile ChatGPT, pot afișa avertismente de securitate frauduloase în stilul sistemului și pot prezenta coduri QR găzduite pe infrastructura controlată de atacatori. Aceste coduri QR pot încuraja utilizatorii să le scaneze cu dispozitive mobile, ocolind efectiv filtrarea URL-urilor bazate pe desktop și controalele de securitate ale întreprinderii.
Ceea ce face ca ChatGPhish să fie deosebit de semnificativ nu este injectarea promptă în sine, ci faptul că sistemul de inteligență artificială urmează cu fidelitate instrucțiunile încorporate și prezintă conținutul rezultat ca parte a unui rezumat de încredere. Prin urmare, o pagină web aparent obișnuită poate genera link-uri de phishing, alerte de conturi contrafăcute, imagini la distanță și coduri QR malițioase direct în răspunsul unui asistent de inteligență artificială.
Suprafața de amenințare în expansiune a navigării asistate de inteligență artificială
Descoperirea evidențiază o provocare de securitate mai amplă: sumarizarea a apărut ca o nouă suprafață de atac adversă. La începutul lunii martie 2026, cercetătorii au demonstrat că e-mailurile special concepute pot manipula Microsoft Copilot prin injecție încrucișată (XPIA), influențând sumarizările generate de inteligența artificială prin instrucțiuni ascunse.
Întrucât organizațiile se bazează din ce în ce mai mult pe instrumente de inteligență artificială pentru cercetare și analiză de conținut, orice pagină web rău intenționată procesată de un asistent de inteligență artificială poate introduce instrucțiuni controlate de atacator în contextul modelului. Aceasta reprezintă o schimbare majoră în tacticile de phishing. În loc să le ceară utilizatorilor să deschidă atașamente suspecte sau să interacționeze cu e-mailuri rău intenționate, atacatorii pot transforma în arme activitatea de navigare de rutină și fluxurile de lucru de sumarizare bazate pe inteligență artificială.
Migrarea atacurilor din mediile de e-mail către interacțiunile bazate pe inteligență artificială bazate pe browser lărgește dramatic suprafața de atac disponibilă. Simpla solicitare a unui rezumat al unei pagini web poate fi suficientă pentru a expune utilizatorii la conținut rău intenționat generat prin tehnici indirecte de injectare de prompturi.
Un val tot mai mare de tehnici de ocolire a securității inteligenței artificiale
Dezvăluirea ChatGPhish vine pe fondul unui val de cercetări care dezvăluie noi metode de atac care vizează sistemele de inteligență artificială. Printre descoperirile recente se numără:
- Tehnica de jailbreak pentru învățarea involuntară în context (IICL), care exploatează conflictele dintre învățarea în context și alinierea la cerințele de siguranță pentru a ocoli restricțiile GPT-5.4; strategiile de conversație pe mai multe rânduri care eludează treptat măsurile de siguranță ale modelelor lingvistice mari; atacurile de tip injecție de prompturi tipografice care ascund instrucțiuni în imagini distorsionate vizual; atacurile Neural Exec combinate cu tehnici de suprascriere Unicode de la dreapta la stânga pentru a ocoli protecțiile Apple Intelligence; și WebPromptTrap, o vulnerabilitate de tip injecție indirectă de prompturi care afectează BrowserOS și care manipula utilizatorii prin rezumate generate de inteligență artificială ale unui conținut aparent legitim.
- Deficiențe de securitate care afectează ecosistemele de inteligență artificială și framework-urile agenților, inclusiv o vulnerabilitate în Anthropic Claude Code care a permis interceptarea comunicațiilor MCP bazate pe OAuth printr-un pachet npm necinstit; un scenariu de abuz al mecanismului de actualizare la distanță care vizează abilitățile OpenClaw; campanii de phishing cu text ascuns concepute pentru a înșela produsele de securitate a e-mailurilor bazate pe inteligență artificială; vulnerabilitatea ClaudeBleed care a permis extensiilor de browser să emită comenzi neautorizate către Claude; vulnerabilități critice în Microsoft Semantic Kernel (CVE-2026-25592 și CVE-2026-26030) capabile să escaladeze injecțiile prompte în execuția de cod la distanță la nivel de gazdă; defecte de securitate răspândite în depozitele de agenți ClawHub și skills.sh; și atacuri împotriva stivei de referință NemoClaw de la NVIDIA care au permis exfiltrarea datelor OpenClaw prin depozite GitHub și pachete npm rău intenționate.
Viitorul amenințărilor cibernetice bazate pe inteligență artificială
Pe măsură ce modelele avansate de inteligență artificială continuă să se maturizeze, infractorii cibernetici experimentează din ce în ce mai mult cu capacitățile lor ofensive. Actorii amenințători utilizează modele lingvistice ample pentru a dezvolta programe malware mai adaptive, capabile să își modifice comportamentul pentru a evita mecanismele de detectare.
În plus, sistemele de inteligență artificială sunt încorporate în procesele decizionale privind programele malware. Aceste capabilități permit programelor malware să evalueze mediile compromise, să determine dacă țintele sunt valoroase și să decidă dacă condițiile sunt potrivite pentru implementarea unor sarcini utile suplimentare.
Studiul ChatGPhish servește ca o nouă reamintire a faptului că tehnologiile de inteligență artificială introduc considerații de securitate complet noi. Pe măsură ce asistenții de inteligență artificială se integrează profund în fluxurile de lucru ale întreprinderilor, protejarea împotriva injecțiilor indirecte de prompturi, a rezumatelor manipulate și a abuzurilor de interfață bazate pe încredere va deveni o componentă din ce în ce mai critică a strategiei de securitate cibernetică.