蚂蚁集团旗下灵波科技宣布全面开源具身大模型LingBot-VLA。作为面向真实机器人操作场景的“智能基座”,该模型旨在解决具身智能模型落地面临的泛化性挑战,实现跨本体、跨任务的泛化能力,并显著降低后训练成本,加速“一脑多机”的工程化应用。
在具身智能评测中,LingBot-VLA展现了突出的性能。在包含多项真实操作任务的基准测试中,该模型在多个不同真实机器人平台上,跨本体泛化的平均成功率相较于对比模型有显著提升。当引入深度信息增强空间感知后,其平均成功率得到进一步提高,刷新了相关真机评测的成功率纪录。在仿真基准测试中,面对高强度环境干扰,LingBot-VLA凭借其独特的可学习查询对齐机制,深度融合深度信息,其操作成功率相比对比模型亦有大幅提升,实现了从虚拟仿真到真实落地的性能领跑。
LingBot-VLA的突破源于其大规模预训练数据,覆盖了多种主流双臂机器人构型。这使得同一个“大脑”能够无缝迁移至不同构型的机器人,并在任务与环境变化时保持稳定的成功率与鲁棒性。与高精度空间感知模型配合,它能获得更优的深度信息表征,提升整体操作性能。
该模型大幅降低了下游任务的适配门槛,仅需少量演示数据即可实现高质量任务迁移。同时,其训练效率相比主流框架有倍数级提升,实现了数据与算力成本的双重降低。此次开源不仅提供了模型权重,还同步开放了包含数据处理、高效微调及自动化评估在内的全套代码库,旨在压缩模型训练周期,降低商业化落地的门槛。
蚂蚁灵波科技表示,希望通过LingBot-VLA的开源,积极探索具身智能上限,推进技术研发进入可复用、可验证、可规模化落地的新阶段,加速AI在物理世界的渗透与普及。



