ARC系统:利用强化学习动态配置AI代理,提升准确率并降低计算成本

发布时间:2026-02-18 04:08

当前基于大语言模型(LLM)的AI代理系统配置,通常依赖于固定的大型模板或手动调整的启发式规则。这种方法存在明显缺陷:无论查询难易,系统都采用同一套繁琐配置,导致行为僵化并产生不必要的计算成本。

为解决此问题,研究将代理配置重新定义为针对每个查询的决策问题,并提出了ARC(智能体资源与配置学习器)系统。ARC的核心是使用强化学习训练一个轻量级的分层策略模型。该模型能够根据输入查询的具体情况,动态、智能地调整代理的工作流程、工具选择、令牌预算及提示词等关键配置参数。

在涵盖推理和工具增强问答的多个基准测试中,ARC学习到的策略模型表现优异,持续超越了精心设计的手动配置基线及其他对比方法。实验结果表明,这种按查询动态配置的方法,能够实现显著更高的任务准确率,同时有效降低令牌消耗和运行时间成本。这证明了针对每个查询学习专属配置,是替代“一刀切”固定设计的强大方案,为构建更高效、更灵活的AI代理系统提供了新方向。

客服微信
客服微信