Vulnerabilitat de ChatGPhish a ChatGPT
Investigadors de ciberseguretat han descobert una vulnerabilitat a ChatGPT d'OpenAI que explota la confiança de la plataforma en els enllaços i les imatges de Markdown, permetent atacs d'injecció ràpida i creant noves oportunitats de phishing. La tècnica, anomenada ChatGPhish, demostra com es pot manipular el resum basat en IA per lliurar contingut maliciós directament a través d'una interfície de confiança.
El problema prové de la manera com el renderitzador de respostes de ChatGPT processa els elements de Markdown originats en pàgines web de tercers. Quan el chatbot resumeix contingut extern, confia automàticament en els enllaços de Markdown i les URL d'imatges incrustats, obtenint imatges remotes i mostrant els enllaços com a elements actius i clicables dins de la interfície de l'assistent.
Taula de continguts
La mecànica darrere de l’atac
Un actor d'amenaces pot incrustar una petita càrrega útil maliciosa dins d'una pàgina web que posteriorment ChatGPT resumeix. Durant el procés de renderització, les imatges controlades per l'atacant es poden obtenir automàticament, cosa que podria exposar informació com ara l'adreça IP de la víctima, l'agent d'usuari i els detalls del referent.
Més enllà de la filtració d'informació, la vulnerabilitat permet que el contingut maliciós es presenti de maneres molt convincents. Els atacants poden representar enllaços de phishing directament dins de les respostes de ChatGPT, mostrar avisos de seguretat fraudulents d'estil sistema i presentar codis QR allotjats en una infraestructura controlada per l'atacant. Aquests codis QR poden animar els usuaris a escanejar-los amb dispositius mòbils, evitant eficaçment el filtratge d'URL basat en escriptori i els controls de seguretat empresarials.
El que fa que ChatGPhish sigui particularment significatiu no és la injecció ràpida en si mateixa, sinó el fet que el sistema d'IA segueix fidelment les instruccions incrustades i presenta el contingut resultant com a part d'un resum fiable. Per tant, una pàgina web aparentment normal pot generar enllaços de phishing, alertes de comptes falsificats, imatges remotes i codis QR maliciosos directament dins de la resposta d'un assistent d'IA.
La superfície d’amenaces en expansió de la navegació assistida per IA
El descobriment posa de manifest un repte de seguretat més ampli: el resum ha sorgit com una nova superfície d'atac adversari. A principis del març del 2026, uns investigadors van demostrar que els correus electrònics especialment dissenyats podien manipular Microsoft Copilot mitjançant la injecció creuada de missatges (XPIA), influint en els resums generats per la IA mitjançant instruccions ocultes.
A mesura que les organitzacions depenen cada cop més de les eines d'IA per a la recerca i l'anàlisi de contingut, qualsevol pàgina web maliciosa processada per un assistent d'IA pot introduir instruccions controlades per l'atacant en el context del model. Això representa un canvi important en les tàctiques de phishing. En lloc de demanar als usuaris que obrin fitxers adjunts sospitosos o interactuïn amb correus electrònics maliciosos, els atacants poden convertir en armes l'activitat de navegació rutinària i els fluxos de treball de resum de la IA.
La migració d'atacs des d'entorns de correu electrònic a interaccions d'IA basades en navegadors amplia dràsticament la superfície d'atac disponible. Simplement sol·licitar un resum d'una pàgina web pot ser suficient per exposar els usuaris a contingut maliciós generat mitjançant tècniques d'injecció indirecta de senyals.
Una onada creixent de tècniques d’elusió de la seguretat de la IA
La revelació de ChatGPhish arriba enmig d'una onada d'investigacions que revelen nous mètodes d'atac dirigits a sistemes d'intel·ligència artificial. Les troballes recents inclouen:
- La tècnica de jailbreak d'aprenentatge involuntari en context (IICL), que explota conflictes entre l'aprenentatge en context i l'alineació de seguretat per eludir les restriccions de GPT-5.4; estratègies de conversa multitorn que eludeixen gradualment les salvaguardes dels models de llenguatge grans; atacs d'injecció de prompts tipogràfics que amaguen instruccions dins d'imatges visualment distorsionades; atacs Neural Exec combinats amb tècniques de sobreescriptura d'Unicode de dreta a esquerra per eludir les proteccions d'Apple Intelligence; i WebPromptTrap, una vulnerabilitat d'injecció de prompts indirecta que afecta BrowserOS que manipulava els usuaris mitjançant resums generats per IA de contingut aparentment legítim.
- Debilitats de seguretat que afecten els ecosistemes d'IA i els marcs d'agents, incloent-hi una vulnerabilitat al codi Anthropic Claude que permetia la intercepció de comunicacions MCP basades en OAuth a través d'un paquet npm no autoritzat; un escenari d'abús del mecanisme d'actualització remota dirigit a les habilitats d'OpenClaw; campanyes de phishing de text ocult dissenyades per enganyar productes de seguretat de correu electrònic basats en IA; la vulnerabilitat ClaudeBleed que permetia que les extensions del navegador emetessin ordres no autoritzades a Claude; vulnerabilitats crítiques al nucli semàntic de Microsoft (CVE-2026-25592 i CVE-2026-26030) capaces d'escalar les injeccions ràpides a l'execució remota de codi a nivell d'amfitrió; defectes de seguretat generalitzats dins dels repositoris d'agents ClawHub i skills.sh; i atacs contra la pila de referència NemoClaw d'NVIDIA que permetien l'exfiltració de dades d'OpenClaw a través de repositoris de GitHub i paquets npm maliciosos.
El futur de les ciberamenaces impulsades per la IA
A mesura que els models avançats d'IA continuen madurant, els ciberdelinqüents experimenten cada cop més amb les seves capacitats ofensives. Els actors amenaçadors aprofiten grans models de llenguatge per desenvolupar programari maliciós més adaptatiu capaç de modificar el seu comportament per evadir els mecanismes de detecció.
A més, els sistemes d'IA s'estan incorporant als processos de presa de decisions sobre programari maliciós. Aquestes capacitats permeten al programari maliciós avaluar els entorns compromesos, determinar si els objectius són valuosos i decidir si les condicions són adequades per desplegar càrregues útils addicionals.
La investigació de ChatGPhish serveix com un altre recordatori que les tecnologies d'IA introdueixen consideracions de seguretat completament noves. A mesura que els assistents d'IA s'integren profundament en els fluxos de treball empresarials, la protecció contra les injeccions indirectes de prompts, els resums manipulats i els abusos d'interfície basats en la confiança esdevindrà un component cada cop més crític de l'estratègia de ciberseguretat.