谷歌Gemini遭大规模蒸馏攻击,攻击者试图窃取AI模型内部逻辑

发布时间:2026-02-15 07:31

谷歌公司报告称,其AI聊天机器人Gemini正遭遇大规模“蒸馏攻击”。这类攻击是指攻击者通过向AI模型重复、大量地提问,试图诱导其泄露内部工作机制、输出模式与决策逻辑。谷歌表示,攻击者的目标是通过探测模型内部机制,来“克隆”该模型或强化攻击者自己的AI系统。其中一场攻击活动对Gemini的提示次数达到了一个非常高的量级。

谷歌在报告中指出,这些攻击主要由具有“商业动机的行为者”发起。公司判断幕后人员可能来自希望获得竞争优势的AI私营企业或研究机构。攻击源遍布全球多个地区。谷歌威胁情报小组的首席分析师指出,针对Gemini的攻击规模表明,此类攻击很可能已开始或即将蔓延至更广泛的领域,包括小型企业使用的定制AI工具。他将大型平台的遭遇形容为行业风险的早期预警信号。

谷歌强调,此类蒸馏攻击本质上属于知识产权盗窃。AI聊天机器人的核心模型内部机制被视为高度重要的专有资产。尽管科技公司已部署能够识别与阻断蒸馏攻击的防护机制,但由于主流大模型服务面向公众开放,其本质上仍存在受攻击的风险。

报告还提到,多数攻击旨在套取Gemini的“推理”算法,即其信息处理与决策的核心机制。分析师警告,随着越来越多公司训练包含敏感数据的定制化大语言模型用于内部业务,蒸馏攻击可能带来的潜在危害会更大。例如,一个学习了公司内部长期业务逻辑的模型,其关键知识也存在被逐步提取的风险。

客服微信
客服微信