重新审视深度研究中基于LLM代理的文本排序技术

发布时间:2026-02-27 07:31

深度研究已成为一项重要任务,旨在通过广泛的开放网络探索来解决复杂查询。以往研究大多为基于大型语言模型的智能体配备不透明的网络搜索API,使其能够迭代地发起搜索查询、检索外部证据并进行推理。尽管搜索在深度研究中扮演着核心角色,但黑盒式的网络搜索API阻碍了对搜索组件的系统性分析,导致现有文本排序方法在深度研究中的实际表现尚不明确。

为填补这一空白,本研究在深度研究场景下,复现并评估了信息检索领域文本排序方法的一系列关键发现与最佳实践。研究主要从三个维度考察其有效性:首先是检索单元,对比了文档级与段落级检索的差异;其次是流程配置,分析了不同检索器、重排序器及重排序深度的影响;最后是查询特性,探讨了智能体生成的查询与文本排序器训练查询之间的不匹配问题。

实验在固定语料库的深度研究数据集上进行,评估了多种开源智能体、检索器与重排序器在不同配置下的表现。研究发现,智能体生成的查询通常遵循网络搜索风格的语法,这更有利于基于词法、学习型稀疏表示以及多向量的检索器。在上下文窗口有限的情况下,段落级检索单元效率更高,并能避免词法检索中因文档长度归一化带来的困难。此外,重排序被证明非常有效,而将智能体生成的查询转换为自然语言问题,能显著缓解查询不匹配的问题。

客服微信
客服微信