风云学会陈经
25-03-25 16:04 微博认证:亚洲视觉科技 研发总监 2024微博年度新知博主 长文原创作者 财经观察官

#DeepSeek又更新了#
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

这次更新突出特点是不要钱,直接开源扔出权重,而且硬件要求很低,不需要很贵的GPU就能部署。

性能方面,它在数学和编程能力相比上个版本进步很大。

需要注意,这次是deepseek-V3的改进V3-0324,是“非推理模型”,基础能力进步了,估计又有不小的数据结构和算法优化。而后面应该会有基于它,再加上强化学习,提升复杂任务思考推理能力,做出deepseek-R1的后续版本R2。

直接效果就是美国闭源模型压力很大。

发布于 广东