OpenAI发布公告,针对AI系统日益凸显的“提示注入”攻击风险,宣布为ChatGPT推出两项新的安全防护措施。提示注入攻击是指第三方通过精心设计的提示词误导AI执行恶意指令或泄露敏感信息。
第一项措施是面向企业版ChatGPT的“锁定模式”。这是一项可选的高级安全设置,主要面向高度重视安全的大型组织用户。其核心是通过严格限制ChatGPT与外部系统的交互方式,以确定性方式禁用某些可能被利用的工具与能力,从而降低数据外泄风险。例如,在锁定模式下,网页浏览功能将被限制为仅访问已缓存内容。该模式适用于ChatGPT Enterprise等多个商业版本,管理员可以在工作区设置中启用并为特定角色配置。
第二项措施是风险标注标准化。OpenAI正在对一小部分可能引入额外风险的功能,在ChatGPT、ChatGPT Atlas与Codex等产品中统一新增“Elevated Risk”风险标签。此举旨在为用户提供更清晰、一致的使用指引,使其能够自行评估在使用涉及网络连接等功能时的风险,尤其是在处理个人私密数据时。
OpenAI表示,这些新措施建立在其现有的多层安全防护体系之上,是对现有企业级数据安全能力的进一步增强。锁定模式目前主要面向企业用户,未来计划扩展至消费者用户。


