垫脚石X 26-04-24 13:55
微博认证:财经博主

Deepseek V4 Pro,参数量已经达到1.6T,没记错应该是刷新了之前mimo的纪录,当然,说的是开源模型。上下文开到1M,这应该是当前主力大模型的标准配置。依旧采用MoE架构,激活参数量49B,这应该是deepseek性价比高的主要因素。同步发布的4.0 flash,应该是Pro的降维模型,284B规模,13B激活量,为端侧的部署提供可能。
#价值投机fan#

发布于 北京