能力与安全的博弈！OpenAI 上线 ChatGPT“封锁模式”，宁可断网也要防数据泄露

在生成式人工智能向智能体（Agent）时代全速演进的过程中，越发强大的工具调用和联网能力，也让安全防御的系统防线面临着前所未有的考验。为了应对日益猖獗的提示注入攻击，OpenAI 近日正式推出了一项极具破局意味的可选新安全设置——“封锁模式”（Lockdown Mode），目前已面向所有已登录用户、不同账户类型及工作区全面开放。

所谓提示注入攻击，一直是让大模型研发团队头疼的黑客手段。攻击者往往会将恶意指令巧妙地隐匿在网页、第三方文档或其他外部数据中。一旦 ChatGPT 在联网状态下读取了这些被“下毒”的内容，就可能被诱导忽略原有的核心安全规则，执行越权操作，甚至在用户毫无察觉的情况下，将输入的商业机密或个人隐私等敏感信息秘密发送至外部恶意服务器。

面对这一业内公认的顽疾，OpenAI此次推出的封锁模式，其底层设计思路非常务实。它并没有试图去完美识别所有层出不穷的恶意指令，而是选择直接限制最危险、最关键的一环——切断向外部发起网络请求的通路。

一旦用户或工作区管理员开启了封锁模式，ChatGPT 的诸多核心“大招”将受到物理级限制。其中，实时网页浏览功能将被大幅削弱，系统仅能访问受保护的缓存网页内容，从而导致搜索结果可能出现不完整、过期或不可用的情况。同时，模型不会在回复中检索并展示任何来自外部网络的图片，也无法从网络下载任何文件用于高级数据分析。

不仅如此，被视为高阶生产力代表的“深度研究（Deep Research）”和“智能体模式（Agent Mode）”将被直接关闭。即使是在 Canvas 画布功能下生成的代码，也无法获得联网访问的批准。在这种模式下，大模型处理的文件仅限于用户手动上传的本地安全档案。

不过，OpenAI官方也在帮助文档中明确坦言，封锁模式并非万能的防弹衣，它无法百分之百保证提示注入攻击彻底失效。因为恶意指令依然有可能潜伏在合法的缓存网页或用户自行上传的文件中，继续干扰模型的判断。

这一新功能的上线，直观地反映出当前 AI 产业所面临的现实悖论：大模型的联网权限越开放、自动化工具调用越深入，其暴露给外界的攻击面也就越庞大。封锁模式的推出，实际上是 OpenAI 明确为 AI 能力划定的一道安全边界。它没有开出“绝对安全”的空头支票，而是选择将“更强、更智能的协同体验”与“更低的数据外泄风险”之间的天平砝码，重新交还给用户与企业管理员自己去权衡。