MERIT反馈机制提升大语言模型谈判能力

发布时间：2026-02-12 05:00 arXiv·cs.AI

谈判常被视为逻辑领域，但大语言模型因其战略深度有限及难以适应复杂人为因素，在此任务中仍面临挑战。现有基准难以充分捕捉这一局限。为弥补此差距，研究团队提出了一个以效用反馈为核心的框架。该框架主要包含三方面贡献：首先，推出了名为AgoraBench的新基准，涵盖欺骗、垄断等多种具有挑战性的设定，支持多样化的策略建模。其次，引入了基于效用理论、与人类偏好对齐的经济学评估指标，通过代理效用、谈判力和获取比率等，隐式衡量谈判与人类偏好的契合程度。最后，构建了一个基于人类偏好的数据集及学习流程，通过提示工程和微调两种方式，增强大语言模型的议价能力。实证结果表明，基线大语言模型的谈判策略常偏离人类偏好，而该机制能显著提升谈判表现，促使其展现出更深层的战略行为和更强的对手意识。该研究为提升大语言模型在复杂交互任务中的实用性与对齐性提供了新思路。

返回快讯列表