#姚顺雨首份混元答卷打几分##腾讯发布Hy3preview大模型#如果要给姚顺雨在腾讯混元交出的这份“首份答卷”(即最新发布的 混元Hy3 preview 模型)打分,结合目前的市场反馈、技术指标以及行业背景来看,这是一份“务实且犀利”的答卷。作为前OpenAI研究员、清华姚班出身的“天才少年”,姚顺雨在接手腾讯混元短短几个月后,不仅拿出了产品,更重要的是扭转了混元过去“盲目堆参数、刷榜单”的打法,展现出了极强的实用主义色彩。
Hy3 preview 没有盲目追求万亿级的参数规模,而是采用了 总参数295B、激活参数21B 的混合专家(MoE)架构。这种设计既保证了模型的智能上限,又大幅降低了推理成本。
引入了“快慢思考”融合机制。这意味着模型在处理复杂问题时能像人类一样进行逻辑推演,而不是单纯依靠概率“猜”答案。
虽然接近顶级水平,但在部分高难度代码和智能体任务上,与Claude Opus-4.6等全球最顶尖的闭源模型相比仍有微小差距。
这是姚顺雨带来的最大改变。他公开批评了过去模型“过度追逐榜单、数据被污染”的现象。Hy3 preview 的评测不再依赖容易作弊的公开榜单,而是通过自建基准(如CL-bench)和腾讯内部900多个业务场景(如元宝、ima、腾讯文档)进行实战验证。
在清华数学博士资格考试、SWE-Bench代码评测等“硬核”测试中,表现超过了GLM-5和Kimi-K2.5,证明了其在真实任务中的战斗力。
在阿里、MiniMax等纷纷转向闭源的大环境下,腾讯选择开源Hy3 preview。这不仅是为了获取社区反馈来迭代正式版,更是在开源生态中抢占了一席之地,与DeepSeek形成呼应。
腾讯混元在C端用户感知上(如豆包、Kimi)此前稍显落后,虽然Hy3 preview已接入元宝等核心产品,但要真正挽回市场口碑,还需要时间的沉淀。
姚顺雨的这份答卷,胜在“清醒”,赢在“实用”。
他没有沉迷于制造一个只会考试的“做题家”,而是致力于打造一个能解决实际问题的“工程师”。虽然距离“完美”还有提升空间(特别是在顶级推理和全球通用能力上),但对于急需在AI下半场找回节奏的腾讯来说,这绝对是一份及格线以上,且具有战略转折意义的优秀答卷。http://t.cn/AXx9uvFn
