FAC框架:在LLM特征空间合成多样化数据提升下游性能

发布时间:2026-02-16 14:35

大语言模型下游任务性能的有效性,高度依赖于后训练数据的多样性。现有方法多采用基于文本的指标来衡量数据多样性,但这些指标仅能捕捉语言层面的变化,对决定下游性能的任务相关特征只能提供微弱信号。

为此,研究人员引入了特征激活覆盖率(FAC),这是一种在可解释的特征空间中衡量数据多样性的新指标。基于此指标,研究进一步提出了一个名为FAC Synthesis的多样性驱动数据合成框架。该框架首先使用稀疏自编码器从种子数据集中识别缺失的特征,然后生成明确反映这些特征的合成样本。

实验表明,该方法在包括指令遵循、毒性检测、奖励建模和行为引导在内的多种任务上,能持续提升数据多样性和下游性能。一个有趣的发现是,研究识别出了跨模型家族(如LLaMA、Mistral和Qwen)共享的可解释特征空间,这为跨模型知识迁移提供了可能。

这项工作为探索以数据为中心的大语言模型优化,提供了一种坚实且实用的方法论。

客服微信
客服微信