#DeepSeekV4发布#DeepSeek刚刚发布了新的V4系列模型,主要有三项比较大的变化:支持百万级上下文、引入混合注意力机制通过压缩Token,百万级上下文需要的推理算力和显存显著下降、性能更高,多项基准刷新开源模型记录的同时Token成本更低。[good]
值得一提的是,V4不具备多模态能力。所以怎么说呢,期待的一年的V4模型,发布后基本符合预期吧。
在AI的浪潮里,大模型也上演着后浪推前浪,年初至今,Seedance 2.0、小米MiMo等国产大模型一个比一个表现出色,在全球掀起了巨大关注。这也应了那句:一支独放不是春,百花齐花春满园。中国大模型加油![耶]
发布于 上海
