实测 DeepSeek V4 PK GLM 5.0 谁赢了?春节前的神仙打架
为了迎接春节的到来,AI 大模型也是准备好了,刚刚 DeepSeek V4 和 GLM 5.0 都更新了。
废话不多说,直接测试一下看看
1、测一下最近的让很多 AI 翻车的题目
我要出门洗车,洗车店距离50米,我是开车去呢还是步行去呢?
DeepSeek V4 还是翻车了,说明没有针对这个问题去优化了。
只有开启深度思考的情况下才能正确。
GLM 5 回答的很不错,考虑比较全面,没开启深度思考的情况下都正确回答了这个问题。
2、 做一个射击类游戏
DeepSeek V4 比较简陋一点,射击的对象是正方体,会一堆跑的屏幕前,不够合理 。
GLM 5 的射击对象是人形的样子,还有真实的血条,你会被攻击流血而死。。。
3、中国古风美学的天气卡片
看到有人想测这个
DeepSeek V4的效果可以说比以前是好看了
GLM 5 的效果感觉和 DeepSeek V4 差距不是很大,两个都还不错。
4、超级玛丽
DeepSeek V4 的界面确实很漂亮呀,特别的底部的得分和开新游戏部件,比一些小游戏的网站做的还好看。
GLM 5 就更新复刻版的 超级玛丽了,人物形象和游戏元素,可以说的真的游戏了。
5、Agent
GLM 5 更新了 Agent 功能,相当于给你了一个智能助手了,多样工具,多种技能,还直接给你交付结果,这个是我最喜欢的。
让他做个马年的PPT
直接给我可以修改的PPT文件,办公神器。
神龙摆尾
目前我测试下来只发现DeepSeek V4 的前端代码有所提升,还有上下文提升,其他方面还有待测试,不知道还有没有其他惊喜。
GLM 5 给我感觉是挺好的,各方面的功能都有,很全面,有点实力。
当然了,一次测试说明的问题有限,我今天测的这几个场景也只是冰山一角。
大模型的能力是很立体的,代码、推理、创意、多模态,每个维度都有深浅。也许换一批题目,结果又会不一样。
所以大家看个参考就好,真正适合自己的,还是得自己上手试试。
马上就是马年了,希望这些国产大模型都能跑得再快一点。。。
#人工智能[超话]##AI创造营##DeepSeek##GLM#
