MiniMax正式开源了其M2.5模型,这是M2系列在短时间内推出的新版本。模型权重已同步上线魔搭ModelScope平台,标志着低成本Agent时代的进程正在加速。该模型在能力、效率和成本三个方面均实现了显著突破,并在编程、搜索、办公等多个应用场景中展现出领先性能。同时,官方提供了从零代码开箱即用到私有化部署的全流程接入方案,以及工具调用与推理参数调优的完整实战指南。
在核心能力上,M2.5模型于多项权威评测中取得优异成绩。其在编程基准测试中表现突出,多语言编程能力位居行业前列。在搜索与工具调用相关评测中,模型能力大幅领先。具体到应用层面,该模型在编程任务上展现出架构师级别的规划能力,能够覆盖完整的开发生命周期,并支持多平台全栈开发,其框架泛化能力表现优异。在搜索任务中,能有效减少交互轮次消耗,在专家级搜索任务上表现卓越。在办公场景中,模型融合了金融、法律等行业知识,高阶办公能力突出。此外,M2.5模型在推理速度上较前代版本有显著提升,同时保持了极具竞争力的低成本优势。
M2.5模型的快速迭代得益于多项核心技术创新。其中包括实现训练加速的原生Agent强化学习框架、保障大规模训练稳定性的先进算法,以及平衡模型效果与响应速度的创新奖励设计。这些技术使得该模型在内部开发任务中承担了重要角色,并在关键基准测试上实现了快速的能力跃升,其迭代速度领先于行业主流模型。
为适配不同用户需求,M2.5提供了多样化的部署方式。非技术用户可通过网页端零代码开箱即用;开发者可选择调用免费或官方API服务,其成本显著低于同类模型;对于有私有化需求的用户,模型支持多种本地部署方案,分别适配高并发生产、中小规模生产、快速验证及本地开发等不同场景,并提供了相应的硬件要求与操作指引。
在工具调用方面,M2.5原生支持结构化工具调用,并可并行调用多个工具。官方提供了通过不同推理框架部署时的工具调用格式说明,以及工具结果回传模型的完整流程与最佳实践。在推理参数调优上,官方推荐了基础参数配置,并指出可根据不同场景灵活调整。模型对多种编程语言和开发框架均展现出优秀的适配性。


