Midjourney操作界面

蚂蚁开源轻量级MoE推理模型Ring-lite

4.8
0热度
HuggingFace

近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCod

近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。

Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多项推理榜单上表现优异,比肩3倍激活参数大小的10B以下Dense模型。

在技术实现上,Ring-lite团队进行了多项创新。首创的C3PO强化学习训练方法有效解决了RL训练中回复长度波动导致的优化难题,显著改善了训练不稳定和吞吐波动问题。同时,团队还探讨了Long-CoT SFT与RL的黄金训练比重,从token efficiency角度提出了基于entropy loss来平衡训练效果和样本效率的方案,进一步提升了模型性能。

微信截图_20250621162245.png

此外,Ring-lite还直面了多领域数据联合训练的难题,系统验证了混合训练与分阶段训练的优劣边界,在数学、代码、科学三重领域实现了协同增益。在多项复杂推理任务中,Ring-lite均展现出了出色的性能,尤其在数学推理和编程竞赛方面,得分领先于对比模型。

为了验证Ring-lite的实际应用效果,团队还进行了高考数学和物理题的测试。结果显示,Ring-lite在数学全国一卷上可以获得130分左右的成绩,表现优异。

蚂蚁技术团队表示,Ring-lite的开源不仅包含了模型权重和训练代码,还将逐步公开所有训练数据集、超参配置乃至实验记录。这可能是轻量级MoE推理模型首次实现全链路透明化,为相关领域的研究人员提供了宝贵的参考资源。

GitHub:

https://github.com/inclusionAI/Ring

Hugging Face:

https://huggingface.co/inclusionAI/Ring-lite

ModelScope:

https://modelscope.cn/models/inclusionAI/Ring-lite

点赞(0)
顶部