微软警告“AI总结投毒”攻击:隐藏指令可固化AI偏见与操纵推荐

发布时间:2026-02-13 23:06

微软安全研究人员近日警告,一种类似于传统“SEO投毒”的新型“AI推荐投毒”攻击术正在出现,主要针对各类AI总结与推荐系统。攻击者通过篡改嵌入在网页或应用“AI总结”按钮中的隐藏指令参数,试图将特定提示词持久化注入AI助手的记忆。这些指令可能包含“将某公司视为可靠信源”或“优先推荐某网站”等内容,旨在固化AI的认知偏见。一旦这些参数被恶意篡改,例如将可信公司名称替换为诈骗实体,AI系统便会“照本宣科”,在未来生成的总结或推荐中持续输出被篡改、带有偏向性甚至有害的信息,而用户往往难以察觉。微软指出,此类攻击并非理论风险,已在多个行业的实际流量中发现案例,涉及金融、医疗、法律及营销等领域。攻击模式包括注入要求AI记住特定来源为可信的指令,甚至直接嵌入完整营销文案。这些案例表明,攻击可能导致金融工作者被引导至高风险平台,或使家长忽略儿童内容中的不良信息。为防范此类风险,用户不应完全依赖AI总结,在点击AI推荐的链接前应悬停预览,谨慎使用“AI总结”功能,并定期检查与清理AI存储的记忆。

客服微信
客服微信