Deepseek V4有种不屑于刷跑分的感觉。
从实际使用体感上来说,比跑分相近/靠前的模型强很多很多。
世界知识丰富、能力足够强,能读出来我话里隐藏的意思,但有一点点自作聪明——这点上比曾经我觉得最聪明的Gemini 2.5 Pro弱一点。
我手搓代码,用下来也比GLM 5.1强,用Trae。
改一个epub翻译应用,GLM 5.1改完后的epub一直打不开,Deepseek V4 Pro改一遍就能打开——大概率问题还是在上下文上。
这块点草某M开头的模型,实际体感比跑分差很多。
发布于 北京
