26-02-12 00:18

实测 DeepSeek V4 PK GLM 5.0 谁赢了?春节前的神仙打架

为了迎接春节的到来,AI 大模型也是准备好了,刚刚 DeepSeek V4 和 GLM 5.0 都更新了。
废话不多说,直接测试一下看看

1、测一下最近的让很多 AI 翻车的题目
我要出门洗车,洗车店距离50米,我是开车去呢还是步行去呢?

DeepSeek V4 还是翻车了,说明没有针对这个问题去优化了。

只有开启深度思考的情况下才能正确。

GLM 5 回答的很不错,考虑比较全面,没开启深度思考的情况下都正确回答了这个问题。

2、 做一个射击类游戏

DeepSeek V4 比较简陋一点,射击的对象是正方体,会一堆跑的屏幕前,不够合理 。

GLM 5 的射击对象是人形的样子,还有真实的血条,你会被攻击流血而死。。。

3、中国古风美学的天气卡片

看到有人想测这个

DeepSeek V4的效果可以说比以前是好看了

GLM 5 的效果感觉和 DeepSeek V4 差距不是很大,两个都还不错。

4、超级玛丽

DeepSeek V4 的界面确实很漂亮呀,特别的底部的得分和开新游戏部件,比一些小游戏的网站做的还好看。

GLM 5 就更新复刻版的 超级玛丽了,人物形象和游戏元素,可以说的真的游戏了。

5、Agent

GLM 5 更新了 Agent 功能,相当于给你了一个智能助手了,多样工具,多种技能,还直接给你交付结果,这个是我最喜欢的。

让他做个马年的PPT

直接给我可以修改的PPT文件,办公神器。

神龙摆尾

目前我测试下来只发现DeepSeek V4 的前端代码有所提升,还有上下文提升,其他方面还有待测试,不知道还有没有其他惊喜。

GLM 5 给我感觉是挺好的,各方面的功能都有,很全面,有点实力。

当然了,一次测试说明的问题有限,我今天测的这几个场景也只是冰山一角。

大模型的能力是很立体的,代码、推理、创意、多模态,每个维度都有深浅。也许换一批题目,结果又会不一样。

所以大家看个参考就好,真正适合自己的,还是得自己上手试试。

马上就是马年了,希望这些国产大模型都能跑得再快一点。。。
#人工智能[超话]##AI创造营##DeepSeek##GLM#

发布于 广东