Trusseldatabase Sårbarhed ChatGPhish-sårbarhed i ChatGPT

ChatGPhish-sårbarhed i ChatGPT

Cybersikkerhedsforskere har afdækket en sårbarhed i OpenAI's ChatGPT, der udnytter platformens tillid til Markdown-links og -billeder, hvilket muliggør hurtige injektionsangreb og skaber nye phishing-muligheder. Teknikken, kaldet ChatGPhish, demonstrerer, hvordan AI-drevet opsummering kan manipuleres til at levere skadeligt indhold direkte via en betroet grænseflade.

Problemet stammer fra den måde, hvorpå ChatGPTs responsrender behandler Markdown-elementer, der stammer fra tredjepartswebsider. Når chatbotten opsummerer eksternt indhold, stoler den automatisk på integrerede Markdown-links og billed-URL'er, henter eksterne billeder og viser links som aktive, klikbare elementer i assistentens brugerflade.

Mekanikken bag angrebet

En trusselsaktør kan integrere en lille skadelig nyttelast på en webside, som senere opsummeres af ChatGPT. Under gengivelsesprocessen kan angriberstyrede billeder hentes automatisk, hvilket potentielt kan afsløre oplysninger såsom offerets IP-adresse, brugeragent og henvisningsoplysninger.

Ud over informationslækage tillader sårbarheden, at skadeligt indhold præsenteres på meget overbevisende måder. Angribere kan gengive phishing-links direkte i ChatGPT-svar, vise falske systemlignende sikkerhedsadvarsler og præsentere QR-koder, der hostes på angriberkontrolleret infrastruktur. Disse QR-koder kan opfordre brugerne til at scanne dem med mobile enheder og dermed effektivt omgå desktopbaseret URL-filtrering og virksomhedssikkerhedskontroller.

Det, der gør ChatGPhish særligt betydningsfuldt, er ikke selve den hurtige indsprøjtning, men det faktum, at AI-systemet trofast følger indlejrede instruktioner og præsenterer det resulterende indhold som en del af et pålideligt resumé. En tilsyneladende almindelig webside kan derfor generere phishing-links, advarsler om forfalskede konti, fjernbilleder og ondsindede QR-koder direkte i en AI-assistents svar.

Den voksende trusselsoverflade inden for AI-assisteret browsing

Opdagelsen fremhæver en bredere sikkerhedsudfordring: opsummeringer er dukket op som en ny fjendtlig angrebsflade. Tidligere i marts 2026 demonstrerede forskere, at specialudformede e-mails kunne manipulere Microsoft Copilot via cross-prompt injection (XPIA) og dermed påvirke AI-genererede opsummeringer gennem skjulte instruktioner.

Efterhånden som organisationer i stigende grad bruger AI-værktøjer til research og indholdsanalyse, kan enhver ondsindet webside, der behandles af en AI-assistent, introducere angriberstyrede instruktioner i modellens kontekst. Dette repræsenterer et større skift i phishing-taktikker. I stedet for at kræve, at brugerne åbner mistænkelige vedhæftede filer eller interagerer med ondsindede e-mails, kan angribere udnytte rutinemæssig browsingaktivitet og AI-opsummeringsworkflows som våben.

Migreringen af angreb fra e-mailmiljøer til browserbaserede AI-interaktioner udvider den tilgængelige angrebsflade dramatisk. Blot at anmode om et resumé af en webside kan være tilstrækkeligt til at udsætte brugerne for skadeligt indhold genereret via indirekte prompt injection-teknikker.

En voksende bølge af AI-sikkerhedsomgåelsesteknikker

ChatGPhish-afsløringen kommer midt i en bølge af forskning, der afslører nye angrebsmetoder, der er rettet mod kunstig intelligens-systemer. Nylige resultater inkluderer:

  • Jailbreak-teknikken Involuntary In-Context Learning (IICL), der udnytter konflikter mellem in-context-læring og sikkerhedsjustering for at omgå GPT-5.4-begrænsninger; multi-turn-samtalestrategier, der gradvist omgår sikkerhedsforanstaltninger for store sprogmodeller; typografiske prompt injection-angreb, der skjuler instruktioner i visuelt forvrængede billeder; Neural Exec-angreb kombineret med Unicode højre-mod-venstre-override-teknikker for at omgå Apple Intelligence-beskyttelser; og WebPromptTrap, en indirekte prompt injection-sårbarhed, der påvirker BrowserOS, og som manipulerede brugere gennem AI-genererede resuméer af tilsyneladende legitimt indhold.
  • Sikkerhedssvagheder, der påvirker AI-økosystemer og agentframeworks, herunder en sårbarhed i Anthropic Claude Code, der muliggjorde aflytning af OAuth-baseret MCP-kommunikation gennem en uærlig npm-pakke; et misbrugsscenarie med en fjernopdateringsmekanisme rettet mod OpenClaw-færdigheder; phishing-kampagner med skjult tekst designet til at narre AI-drevne e-mailsikkerhedsprodukter; ClaudeBleed-sårbarheden, der tillod browserudvidelser at udstede uautoriserede kommandoer til Claude; kritiske sårbarheder i Microsoft Semantic Kernel (CVE-2026-25592 og CVE-2026-26030), der er i stand til at eskalere hurtige injektioner i fjernkodeudførelse på værtsniveau; udbredte sikkerhedsfejl i ClawHub- og skills.sh-agentlagre; og angreb mod NVIDIAs NemoClaw-referencestak, der muliggjorde OpenClaw-dataudfiltrering gennem ondsindede GitHub-lagre og npm-pakker.

Fremtiden for AI-drevne cybertrusler

Efterhånden som avancerede AI-modeller fortsætter med at modnes, eksperimenterer cyberkriminelle i stigende grad med deres offensive evner. Trusselaktører udnytter store sprogmodeller til at udvikle mere adaptiv malware, der er i stand til at ændre sin adfærd for at undgå detektionsmekanismer.

Derudover bliver AI-systemer indarbejdet i beslutningsprocesser vedrørende malware. Disse funktioner gør det muligt for skadelig software at evaluere kompromitterede miljøer, afgøre, om mål er værdifulde, og om forholdene er egnede til at implementere yderligere nyttelast.

ChatGPhish-forskningen tjener som endnu en påmindelse om, at AI-teknologier introducerer helt nye sikkerhedshensyn. Efterhånden som AI-assistenter bliver dybt integreret i virksomhedens arbejdsgange, vil beskyttelse mod indirekte promptinjektioner, manipulerede resuméer og tillidsbaseret grænseflademisbrug blive en stadig vigtigere del af cybersikkerhedsstrategien.

Trending

Mest sete

Indlæser...