【DeepSeek能否脱颖而出?】DeepSeek开源Engram架构虽有“降本增效”潜力,但新模型想爆火仍需跨越多重现实短板。
在我看来核心问题主要集中在三点。
一是token效率拉胯,V3.2在世界知识广度上落后Gemini 3 Pro,解决同一复杂任务要耗7.7万token,是Gemini的3倍多,根源是GRPO算法的“长度偏见”,仍会“凑字数躲惩罚”生成冗长错误内容。
二是架构与能力局限,128K上下文许久未更新,还受Transformer“计算裂脑综合征”影响,能讲清推理规则却不会执行,简单数学换算要超200秒,且无图像理解能力。
三是稳定性与适配不足,V3.1曾有随机插“极”字的Bug,新Engram需开发者重构代码适配,社区工具支持少,落地成本高。
就目前实验室数据来看,虽然数据很亮眼,但真实场景能否补齐这些短板,才是决定新模型能否突围的关键。#DeepSeek新模型能否再次爆火#
发布于 陕西
