开眼视点
26-06-26 12:39 微博认证:C114通信人家园3G版主、专栏作者李建昆,出版作品有《如影随形》 科技博主

VibeThinker-3B为何能以小博大?关键在“硬推理可压缩”假设!团队砍掉通用知识填充,用定向强化死磕推理链路。这种“精准灌溉”式训练,比暴力堆数据效率高一个数量级。附技术架构图,开源地址见评论区↓ http://t.cn/AXSKckrM ​

发布于 安徽