Banta sa Database kahinaan Kahinaan ng ChatGPhish sa ChatGPT

Kahinaan ng ChatGPhish sa ChatGPT

Natuklasan ng mga mananaliksik sa cybersecurity ang isang kahinaan sa ChatGPT ng OpenAI na nagsasamantala sa tiwala ng platform sa mga link at imahe ng Markdown, na nagbibigay-daan sa mabilis na pag-atake gamit ang mga iniksyon at lumilikha ng mga bagong pagkakataon sa phishing. Ang pamamaraan, na tinatawag na ChatGPhish, ay nagpapakita kung paano maaaring manipulahin ang pagbubuod na pinapagana ng AI upang direktang maghatid ng malisyosong nilalaman sa pamamagitan ng isang mapagkakatiwalaang interface.

Ang isyu ay nagmumula sa paraan ng pagproseso ng response renderer ng ChatGPT ng mga elemento ng Markdown na nagmumula sa mga webpage ng third-party. Kapag binubuod ng chatbot ang panlabas na nilalaman, awtomatiko itong nagtitiwala sa mga naka-embed na link ng Markdown at mga URL ng imahe, kinukuha ang mga malayuang imahe at ipinapakita ang mga link bilang aktibo at naki-click na mga elemento sa loob ng interface ng assistant.

Ang Mekanismo sa Likod ng Pag-atake

Maaaring mag-embed ang isang threat actor ng isang maliit na malisyosong payload sa loob ng isang webpage na kalaunan ay ibubuod ng ChatGPT. Sa panahon ng proseso ng pag-render, maaaring awtomatikong makuha ang mga imaheng kontrolado ng attacker, na posibleng maglalantad ng impormasyon tulad ng IP address, User-Agent, at mga detalye ng Referer ng biktima.

Bukod sa pagtagas ng impormasyon, ang kahinaan ay nagpapahintulot sa malisyosong nilalaman na maipakita sa mga paraan na lubos na nakakakumbinsi. Maaaring direktang i-render ng mga attacker ang mga phishing link sa loob ng mga tugon ng ChatGPT, magpakita ng mga mapanlinlang na babala sa seguridad na parang sistema, at magpakita ng mga QR code na naka-host sa imprastraktura na kontrolado ng attacker. Ang mga QR code na ito ay maaaring hikayatin ang mga user na i-scan ang mga ito gamit ang mga mobile device, na epektibong nilalampasan ang desktop-based na URL filtering at mga kontrol sa seguridad ng enterprise.

Ang nagpapahalaga sa ChatGPhish ay hindi ang mismong agarang pag-inject, kundi ang katotohanan na ang AI system ay tapat na sumusunod sa mga naka-embed na tagubilin at nagpapakita ng nagresultang nilalaman bilang bahagi ng isang mapagkakatiwalaang buod. Samakatuwid, ang isang tila ordinaryong webpage ay maaaring makabuo ng mga phishing link, mga alerto sa pekeng account, mga remote na imahe, at mga malisyosong QR code nang direkta sa loob ng tugon ng isang AI assistant.

Ang Lumalawak na Banta sa Pag-browse na Tinutulungan ng AI

Itinatampok ng pagtuklas ang isang mas malawak na hamon sa seguridad: ang pagbubuod ay lumitaw bilang isang bagong adversarial attack surface. Noong unang bahagi ng Marso 2026, ipinakita ng mga mananaliksik na ang mga espesyal na ginawang email ay maaaring manipulahin ang Microsoft Copilot sa pamamagitan ng cross-prompt injection (XPIA), na nakakaimpluwensya sa mga buod na binuo ng AI sa pamamagitan ng mga nakatagong tagubilin.

Habang ang mga organisasyon ay lalong umaasa sa mga AI tool para sa pananaliksik at pagsusuri ng nilalaman, ang anumang malisyosong webpage na pinoproseso ng isang AI assistant ay maaaring magpakilala ng mga tagubiling kontrolado ng attacker sa konteksto ng modelo. Ito ay kumakatawan sa isang malaking pagbabago sa mga taktika ng phishing. Sa halip na hilingin sa mga user na magbukas ng mga kahina-hinalang attachment o makipag-ugnayan sa mga malisyosong email, maaaring gamitin ng mga attacker ang mga regular na aktibidad sa pag-browse at mga daloy ng trabaho sa pagbubuod ng AI.

Ang paglipat ng mga pag-atake mula sa mga kapaligiran ng email patungo sa mga interaksyon ng AI na nakabatay sa browser ay lubos na nagpapalawak sa magagamit na saklaw ng pag-atake. Ang simpleng paghingi ng buod ng isang webpage ay maaaring sapat na upang mailantad ang mga gumagamit sa malisyosong nilalaman na nabuo sa pamamagitan ng mga pamamaraan ng indirect prompt injection.

Isang Lumalagong Alon ng mga Teknik sa Pag-bypass ng Seguridad ng AI

Ang pagbubunyag ng ChatGPhish ay dumating sa gitna ng pagdami ng pananaliksik na nagbubunyag ng mga bagong paraan ng pag-atake na tumatarget sa mga sistema ng artificial intelligence. Kabilang sa mga kamakailang natuklasan ang:

  • Ang Involuntary In-Context Learning (IICL) jailbreak technique, na gumagamit ng mga conflict sa pagitan ng in-context learning at safety alignment upang malampasan ang mga paghihigpit ng GPT-5.4; mga multi-turn conversation strategies na unti-unting lumalampas sa malalaking language model safeguards; mga typographic prompt injection attack na nagtatago ng mga instruksyon sa loob ng mga biswal na distorted na imahe; mga Neural Exec attack na sinamahan ng mga Unicode right-to-left override techniques upang malampasan ang mga proteksyon ng Apple Intelligence; at WebPromptTrap, isang indirect prompt injection vulnerability na nakakaapekto sa BrowserOS na nagmamanipula sa mga user sa pamamagitan ng mga buod na binuo ng AI ng tila lehitimong nilalaman.
  • Mga kahinaan sa seguridad na nakakaapekto sa mga AI ecosystem at agent framework, kabilang ang isang kahinaan sa Anthropic Claude Code na nagpahintulot sa interception ng mga komunikasyon ng MCP na sinusuportahan ng OAuth sa pamamagitan ng isang rogue npm package; isang senaryo ng pang-aabuso sa mekanismo ng remote update na nagta-target sa mga kasanayan sa OpenClaw; mga kampanya ng hidden-text phishing na idinisenyo upang linlangin ang mga produktong pangseguridad ng email na pinapagana ng AI; ang kahinaan ng ClaudeBleed na nagpapahintulot sa mga extension ng browser na mag-isyu ng mga hindi awtorisadong utos kay Claude; mga kritikal na kahinaan sa Microsoft Semantic Kernel (CVE-2026-25592 at CVE-2026-26030) na may kakayahang magpalala ng mga agarang pag-inject sa pagpapatupad ng remote code sa antas ng host; malawakang mga depekto sa seguridad sa loob ng mga repositoryo ng ahente ng ClawHub at skills.sh; at mga pag-atake laban sa NemoClaw reference stack ng NVIDIA na nagpagana sa pag-exfiltration ng data ng OpenClaw sa pamamagitan ng mga malisyosong repositoryo ng GitHub at mga pakete ng npm.

Ang Kinabukasan ng mga Banta sa Cyber na Pinapatakbo ng AI

Habang patuloy na umuunlad ang mga advanced na modelo ng AI, ang mga cybercriminal ay lalong nag-eeksperimento sa kanilang mga kakayahan sa opensiba. Ginagamit ng mga threat actor ang malalaking modelo ng wika upang bumuo ng mas adaptive na malware na may kakayahang baguhin ang pag-uugali nito upang maiwasan ang mga mekanismo ng pagtuklas.

Bukod pa rito, isinasama ang mga sistema ng AI sa mga proseso ng paggawa ng desisyon tungkol sa malware. Ang mga kakayahang ito ay nagbibigay-daan sa malisyosong software na suriin ang mga nakompromisong kapaligiran, matukoy kung mahalaga ang mga target, at magpasya kung angkop ang mga kondisyon para sa pag-deploy ng mga karagdagang payload.

Ang pananaliksik ng ChatGPhish ay nagsisilbing isa pang paalala na ang mga teknolohiya ng AI ay nagpapakilala ng mga ganap na bagong konsiderasyon sa seguridad. Habang ang mga AI assistant ay lubos na naisama sa mga daloy ng trabaho ng negosyo, ang pagprotekta laban sa mga hindi direktang pag-inject ng prompt, mga manipuladong buod, at mga pang-aabuso sa interface na nakabatay sa tiwala ay magiging isang lalong kritikal na bahagi ng estratehiya sa cybersecurity.

Trending

Pinaka Nanood

Naglo-load...