ช่องโหว่ ChatGPhish ใน ChatGPT
นักวิจัยด้านความปลอดภัยทางไซเบอร์ได้ค้นพบช่องโหว่ใน ChatGPT ของ OpenAI ซึ่งใช้ประโยชน์จากความน่าเชื่อถือของแพลตฟอร์มที่มีต่อลิงก์และรูปภาพในรูปแบบ Markdown ทำให้เกิดการโจมตีแบบแทรกข้อความทันทีและสร้างโอกาสในการหลอกลวงแบบฟิชชิ่งรูปแบบใหม่ เทคนิคนี้ซึ่งถูกเรียกว่า ChatGPhish แสดงให้เห็นว่าการสรุปข้อความด้วย AI สามารถถูกบิดเบือนเพื่อส่งเนื้อหาที่เป็นอันตรายโดยตรงผ่านอินเทอร์เฟซที่เชื่อถือได้
ปัญหาเกิดจากวิธีการที่ตัวแสดงผลการตอบกลับของ ChatGPT ประมวลผลองค์ประกอบ Markdown ที่มาจากเว็บเพจภายนอก เมื่อแชทบอทสรุปเนื้อหาจากภายนอก มันจะเชื่อถือลิงก์ Markdown และ URL รูปภาพที่ฝังอยู่โดยอัตโนมัติ ดึงรูปภาพจากแหล่งภายนอก และแสดงลิงก์เป็นองค์ประกอบที่ใช้งานได้และคลิกได้ภายในอินเทอร์เฟซของผู้ช่วย
สารบัญ
กลไกเบื้องหลังการโจมตี
ผู้โจมตีสามารถฝังโค้ดที่เป็นอันตรายขนาดเล็กไว้ในเว็บเพจ ซึ่งต่อมาจะถูกสรุปโดย ChatGPT ในระหว่างกระบวนการแสดงผล รูปภาพที่ผู้โจมตีควบคุมอาจถูกดึงมาโดยอัตโนมัติ ซึ่งอาจเปิดเผยข้อมูลต่างๆ เช่น ที่อยู่ IP ของเหยื่อ User-Agent และรายละเอียดของ Referer ได้
นอกเหนือจากการรั่วไหลของข้อมูลแล้ว ช่องโหว่นี้ยังทำให้สามารถนำเสนอเนื้อหาที่เป็นอันตรายได้อย่างแนบเนียน ผู้โจมตีสามารถแสดงลิงก์ฟิชชิ่งโดยตรงภายในข้อความตอบกลับของ ChatGPT แสดงคำเตือนด้านความปลอดภัยปลอมในรูปแบบระบบ และแสดงรหัส QR ที่โฮสต์อยู่บนโครงสร้างพื้นฐานที่ผู้โจมตีควบคุม รหัส QR เหล่านี้อาจกระตุ้นให้ผู้ใช้สแกนด้วยอุปกรณ์เคลื่อนที่ ซึ่งเป็นการหลีกเลี่ยงการกรอง URL บนเดสก์ท็อปและการควบคุมความปลอดภัยขององค์กรได้อย่างมีประสิทธิภาพ
สิ่งที่ทำให้ ChatGPhish มีความสำคัญเป็นพิเศษไม่ใช่การแทรกข้อความแจ้งเตือนโดยตรง แต่เป็นข้อเท็จจริงที่ว่าระบบ AI ปฏิบัติตามคำสั่งที่ฝังไว้อย่างแม่นยำและนำเสนอเนื้อหาที่ได้เป็นส่วนหนึ่งของบทสรุปที่น่าเชื่อถือ ดังนั้น เว็บเพจที่ดูเหมือนธรรมดาจึงสามารถสร้างลิงก์ฟิชชิ่ง การแจ้งเตือนบัญชีปลอม รูปภาพจากระยะไกล และรหัส QR ที่เป็นอันตรายได้โดยตรงภายในคำตอบของระบบ AI
ภัยคุกคามที่ขยายตัวมากขึ้นจากการท่องเว็บโดยใช้ AI ช่วย
การค้นพบนี้เน้นให้เห็นถึงความท้าทายด้านความปลอดภัยที่กว้างขึ้น นั่นคือ การสรุปเนื้อหาได้กลายเป็นช่องทางโจมตีใหม่สำหรับผู้ไม่หวังดี ก่อนหน้านี้ในเดือนมีนาคม 2026 นักวิจัยได้แสดงให้เห็นว่าอีเมลที่สร้างขึ้นเป็นพิเศษสามารถควบคุม Microsoft Copilot ผ่านการแทรกโค้ดข้ามข้อความ (XPIA) ซึ่งส่งผลต่อการสรุปเนื้อหาที่สร้างโดย AI ผ่านคำสั่งที่ซ่อนอยู่
เนื่องจากองค์กรต่างๆ พึ่งพาเครื่องมือ AI ในการวิจัยและการวิเคราะห์เนื้อหามากขึ้นเรื่อยๆ เว็บเพจที่เป็นอันตรายใดๆ ที่ประมวลผลโดยผู้ช่วย AI อาจแทรกคำสั่งที่ผู้โจมตีควบคุมเข้าไปในบริบทของโมเดล ซึ่งถือเป็นการเปลี่ยนแปลงครั้งสำคัญในกลยุทธ์ฟิชชิง แทนที่จะบังคับให้ผู้ใช้เปิดไฟล์แนบที่น่าสงสัยหรือมีส่วนร่วมกับอีเมลที่เป็นอันตราย ผู้โจมตีสามารถใช้กิจกรรมการท่องเว็บตามปกติและเวิร์กโฟลว์การสรุปข้อมูลของ AI เป็นอาวุธได้
การย้ายรูปแบบการโจมตีจากสภาพแวดล้อมอีเมลไปสู่การโต้ตอบกับ AI บนเว็บเบราว์เซอร์ ทำให้พื้นที่การโจมตีขยายวงกว้างขึ้นอย่างมาก การขอสรุปเนื้อหาของเว็บเพจเพียงอย่างเดียวก็อาจเพียงพอที่จะทำให้ผู้ใช้ตกเป็นเหยื่อของเนื้อหาที่เป็นอันตรายซึ่งสร้างขึ้นผ่านเทคนิคการแทรกข้อความแจ้งเตือนทางอ้อมได้แล้ว
เทคนิคการหลบเลี่ยงระบบรักษาความปลอดภัยด้วย AI กำลังเพิ่มจำนวนขึ้นเรื่อยๆ
การเปิดเผยข้อมูลเกี่ยวกับ ChatGPhish เกิดขึ้นท่ามกลางงานวิจัยจำนวนมากที่เผยให้เห็นวิธีการโจมตีใหม่ๆ ที่มุ่งเป้าไปที่ระบบปัญญาประดิษฐ์ ผลการค้นพบล่าสุดได้แก่:
- เทคนิคการบุกรุก Involuntary In-Context Learning (IICL) ซึ่งใช้ประโยชน์จากความขัดแย้งระหว่างการเรียนรู้ตามบริบทและการจัดเรียงความปลอดภัยเพื่อหลีกเลี่ยงข้อจำกัดของ GPT-5.4; กลยุทธ์การสนทนาแบบหลายรอบที่ค่อยๆ หลีกเลี่ยงการป้องกันโมเดลภาษาขนาดใหญ่; การโจมตีด้วยการแทรกข้อความแจ้งเตือนทางตัวอักษรที่ซ่อนคำสั่งไว้ในภาพที่บิดเบี้ยว; การโจมตี Neural Exec ที่รวมกับเทคนิคการเขียนทับ Unicode จากขวาไปซ้ายเพื่อหลีกเลี่ยงการป้องกันของ Apple Intelligence; และ WebPromptTrap ซึ่งเป็นช่องโหว่การแทรกข้อความแจ้งเตือนทางอ้อมที่ส่งผลกระทบต่อ BrowserOS ซึ่งหลอกลวงผู้ใช้ผ่านบทสรุปที่สร้างโดย AI ของเนื้อหาที่ดูเหมือนถูกต้องตามกฎหมาย
- จุดอ่อนด้านความปลอดภัยที่ส่งผลกระทบต่อระบบนิเวศ AI และเฟรมเวิร์กเอเจนต์ รวมถึงช่องโหว่ใน Anthropic Claude Code ที่ทำให้สามารถดักจับการสื่อสาร MCP ที่ใช้ OAuth ผ่านแพ็กเกจ npm ที่เป็นอันตราย; สถานการณ์การใช้กลไกการอัปเดตระยะไกลในทางที่ผิดโดยมุ่งเป้าไปที่ทักษะ OpenClaw; แคมเปญฟิชชิ่งข้อความที่ซ่อนอยู่ซึ่งออกแบบมาเพื่อหลอกลวงผลิตภัณฑ์รักษาความปลอดภัยอีเมลที่ขับเคลื่อนด้วย AI; ช่องโหว่ ClaudeBleed ที่อนุญาตให้ส่วนขยายเบราว์เซอร์ออกคำสั่งที่ไม่ได้รับอนุญาตไปยัง Claude; ช่องโหว่ที่สำคัญใน Microsoft Semantic Kernel (CVE-2026-25592 และ CVE-2026-26030) ที่สามารถยกระดับการแทรกข้อความแจ้งเตือนไปสู่การเรียกใช้โค้ดระยะไกลระดับโฮสต์; ข้อบกพร่องด้านความปลอดภัยที่แพร่หลายภายใน ClawHub และที่เก็บเอเจนต์ skills.sh; และการโจมตีสแต็กอ้างอิง NemoClaw ของ NVIDIA ที่ทำให้สามารถดึงข้อมูล OpenClaw ออกมาผ่านที่เก็บ GitHub ที่เป็นอันตรายและแพ็กเกจ npm
อนาคตของภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI
เนื่องจากโมเดล AI ขั้นสูงพัฒนาขึ้นอย่างต่อเนื่อง อาชญากรไซเบอร์จึงทดลองกับความสามารถในการโจมตีของโมเดลเหล่านั้นมากขึ้นเรื่อยๆ ผู้ก่อภัยคุกคามใช้ประโยชน์จากโมเดลภาษาขนาดใหญ่เพื่อพัฒนาโปรแกรมมัลแวร์ที่ปรับตัวได้มากขึ้น ซึ่งสามารถปรับเปลี่ยนพฤติกรรมเพื่อหลีกเลี่ยงกลไกการตรวจจับได้
นอกจากนี้ ระบบ AI ยังถูกนำมาใช้ในกระบวนการตัดสินใจของมัลแวร์ ความสามารถเหล่านี้ช่วยให้ซอฟต์แวร์ที่เป็นอันตรายสามารถประเมินสภาพแวดล้อมที่ถูกบุกรุก กำหนดว่าเป้าหมายนั้นมีค่าหรือไม่ และตัดสินใจว่าเงื่อนไขเหมาะสมสำหรับการติดตั้งเพย์โหลดเพิ่มเติมหรือไม่
งานวิจัย ChatGPhish เป็นอีกหนึ่งเครื่องเตือนใจว่า เทคโนโลยี AI นำมาซึ่งข้อควรพิจารณาด้านความปลอดภัยรูปแบบใหม่ๆ มากมาย เมื่อผู้ช่วย AI ถูกบูรณาการเข้ากับกระบวนการทำงานขององค์กรอย่างลึกซึ้ง การป้องกันการแทรกข้อความแจ้งเตือนทางอ้อม การสรุปข้อมูลที่ถูกดัดแปลง และการละเมิดอินเทอร์เฟซที่อาศัยความไว้วางใจ จะกลายเป็นองค์ประกอบที่สำคัญยิ่งขึ้นเรื่อยๆ ในกลยุทธ์ด้านความปลอดภัยทางไซเบอร์