scPilot:首个实现组学原生推理的自动化单细胞分析框架

发布时间:2026-02-17 09:31

scPilot是首个系统性实现组学原生推理的框架。该框架让大语言模型能够使用自然语言进行对话,同时直接检查单细胞RNA测序数据并按需调用生物信息学工具。它将单细胞分析的核心任务——例如细胞类型注释、发育轨迹重建和转录因子靶向分析——转化为模型必须解决、论证并在必要时根据新证据进行修订的逐步推理问题。为了衡量进展,研究团队发布了scBench,这是一套由专家精心策划的数据集和评估器,用于忠实评估scPilot在不同大语言模型下的组学原生推理能力。实验表明,迭代式的组学原生推理提升了细胞类型注释的平均准确率,并显著降低了轨迹图的编辑距离,相比单次提示方法有显著改进。同时,该过程生成了透明的推理轨迹,能够解释标记基因的模糊性和调控逻辑。通过将大语言模型建立在原始组学数据之上,scPilot实现了可审计、可解释且具有诊断信息价值的单细胞分析。该论文已被NeurIPS 2025主会议接收,相关代码、数据和软件包已公开。

客服微信
客服微信