在生成式人工智能向智能体(Agent)时代全速演进的过程中,越发强大的工具调用和联网能力,也让安全防御的系统防线面临着前所未有的考验。为了应对日益猖獗的提示注入攻击,OpenAI 近日正式推出了一项极具破局意味的可选新安全设置——“封锁模式”(Lockdown Mode),目前已面向所有已登录用户、不同账户类型及工作区全面开放。
所谓提示注入攻击,一直是让大模型研发团队头疼的黑客手段。攻击者往往会将恶意指令巧妙地隐匿在网页、第三方文档或其他外部数据中。一旦 ChatGPT 在联网状态下读取了这些被“下毒”的内容,就可能被诱导忽略原有的核心安全规则,执行越权操作,甚至在用户毫无察觉的情况下,将输入的商业机密或个人隐私等敏感信息秘密发送至外部恶意服务器。
面对这一业内公认的顽疾,
一旦用户或工作区管理员开启了封锁模式,ChatGPT 的诸多核心“大招”将受到物理级限制。其中,实时网页浏览功能将被大幅削弱,系统仅能访问受保护的缓存网页内容,从而导致搜索结果可能出现不完整、过期或不可用的情况。同时,模型不会在回复中检索并展示任何来自外部网络的图片,也无法从网络下载任何文件用于高级数据分析。
不仅如此,被视为高阶生产力代表的“深度研究(Deep Research)”和“智能体模式(Agent Mode)”将被直接关闭。即使是在 Canvas 画布功能下生成的代码,也无法获得联网访问的批准。在这种模式下,大模型处理的文件仅限于用户手动上传的本地安全档案。
不过,
这一新功能的上线,直观地反映出当前 AI 产业所面临的现实悖论:大模型的联网权限越开放、自动化工具调用越深入,其暴露给外界的攻击面也就越庞大。封锁模式的推出,实际上是 OpenAI 明确为 AI 能力划定的一道安全边界。它没有开出“绝对安全”的空头支票,而是选择将“更强、更智能的协同体验”与“更低的数据外泄风险”之间的天平砝码,重新交还给用户与企业管理员自己去权衡。