亚马逊云计算服务(AWS)近期发生服务中断事件,与其内部推广的AI编码工具有关。据知情人士透露,去年12月中旬,AWS一项供客户估算服务成本的系统经历了长达数小时的中断,起因是工程师允许其AI编码工具Kiro执行某些变更操作。这款具备代理能力的工具可代表用户自主行动,其当时判断的最佳操作方案是“删除并重建环境”。
亚马逊内部发布了一份关于此次“中断”的事后分析报告。多名员工表示,这是近几个月来公司AI工具第二次成为服务中断的中心。一位资深AWS员工指出,过去几个月内已至少目睹两次生产中断,并认为这些中断虽规模有限但完全可以预见。
亚马逊对此回应称,这两起事件均是“用户错误,而非AI错误”,并强调AI工具的参与是“巧合”,类似问题也可能发生在任何开发工具或手动操作中。公司表示,12月的事件是一次“影响范围极其有限”的孤立事件,仅波及中国大陆部分区域的单一服务;而第二次事件则未对“面向客户的AWS服务”造成影响。这两次中断的严重性远低于2025年10月那次导致包括ChatGPT在内的多个客户应用离线的大规模中断。
调查显示,在这两起事件中,相关工程师在实施变更前未按常规流程要求获得第二人批准。亚马逊解释称,其Kiro工具默认会在执行任何操作前请求授权,但12月事件中涉及的工程师拥有“比预期更宽的权限——这是一个用户访问控制问题,而非AI自主性问题”。
AWS于去年7月推出Kiro,旨在超越快速构建应用的“氛围编码”,转向基于具体规范编写代码。此前,AWS主要依赖其AI聊天机器人Amazon Q Developer辅助工程师编码,该工具也被指与更早的一次中断有关。
尽管存在风险,亚马逊仍在积极推进AI工具的应用,并为开发人员设定了使用目标。公司表示,Kiro已获得强劲的客户增长,并希望客户和员工都能从效率提升中受益。亚马逊补充说,在12月事件后,AWS已实施了包括强制同行评审和员工培训在内的多项保障措施。


