挨踢牛魔王 26-02-11 13:40
微博认证:科技博主

现在流行的洗车AI测试。
就是你问AI一个问题:
我想洗车,我家离洗车店只有50米,你是建议我走路去,还是开车去?

我测试了几家,没开深度思考,没联网。
图1,deepseek
图2,豆包
图3,千问
图4,元宝

全军覆没,都建议我走路去,可是我是去洗车啊,走路去,车怎么去洗呢?
这不是哪一家的问题,而是模型的注意力关注有问题,对于隐含的诉求没有发现。

深入研究这个问题,然后对这个进行优化,应该还能提升模型的智能。

你们也拿各个模型测试一下吧,我看国外的模型也未必行。

发布于 江苏