ARC系统：利用强化学习动态配置AI代理，提升准确率并降低计算成本

发布时间：2026-02-18 04:08

当前基于大语言模型（LLM）的AI代理系统配置，通常依赖于固定的大型模板或手动调整的启发式规则。这种方法存在明显缺陷：无论查询难易，系统都采用同一套繁琐配置，导致行为僵化并产生不必要的计算成本。

为解决此问题，研究将代理配置重新定义为针对每个查询的决策问题，并提出了ARC（智能体资源与配置学习器）系统。ARC的核心是使用强化学习训练一个轻量级的分层策略模型。该模型能够根据输入查询的具体情况，动态、智能地调整代理的工作流程、工具选择、令牌预算及提示词等关键配置参数。

在涵盖推理和工具增强问答的多个基准测试中，ARC学习到的策略模型表现优异，持续超越了精心设计的手动配置基线及其他对比方法。实验结果表明，这种按查询动态配置的方法，能够实现显著更高的任务准确率，同时有效降低令牌消耗和运行时间成本。这证明了针对每个查询学习专属配置，是替代“一刀切”固定设计的强大方案，为构建更高效、更灵活的AI代理系统提供了新方向。

返回快讯列表