京东在Hugging Face平台正式开源了其最新的大语言模型JoyAI-LLM-Flash。该模型总参数量达到48亿,采用混合专家模型架构,展现出在知识理解、推理及编程方面的能力。
JoyAI-LLM-Flash的核心创新在于引入了全新的FiberPO优化框架。该框架将纤维丛理论应用于强化学习优化过程,并结合了Muon优化器与稠密多Token预测技术。这一组合旨在解决传统大模型在规模扩展时遇到的训练不稳定问题,据称能有效提升模型的训练效率。
在技术规格方面,该模型拥有较多的网络层数,支持极长的上下文处理长度与大规模词表。这些特性使其能够处理更复杂的序列任务,标志着京东在人工智能基础模型研发领域取得了重要进展。此次开源旨在推动AI技术的共享与创新,为开发者和研究者提供了一个新的高性能模型选择。


