有道新的开源数学推理模型:子曰4🚀。与之前版本相比,通过SFT-RL训练,Confucius-4实现了面向学习尤其是数学场景下的更高性能。
1. 集中优化了视觉能力。在多个视觉数理基准上达到同规模模型中SOTA水平,解决学习需求下的图表题、几何题等以前困难的场景。结果指标见图一。
2. 通过思维数据SFT,提升纯文本难题的解题能力,在内部Math-Hard-500数据集上实现了23%的性能提升,大幅领先同类模型。
3. 解决模型过度思考的问题,保证结果质量的前提下,减少思维链长度43%,降低成本、提升响应速度。指标见图二。
欢迎大家下载试用。参数量27B,基于Qwen-3.5后训练,感谢Qwen团队的基础模型。
http://t.cn/AX6Zo0aY
http://t.cn/AX6Zo0aj
发布于 日本
