i陆三金 25-04-12 13:09
微博认证:AI博主

接上条微博(http://t.cn/A6rYWHi0),经@宝玉xp 老师提醒,同时用复杂提示词和简洁提示词完成一个任务,看看效果,感觉不同的模型的效果还是不太一样的。

复杂提示词都是 10 条输出,简单提示词都是 5 条输出。

图 1、图 2,Gemini 2.5 Pro
图 3、图 4,OpenAI GPT-4o
图 5、图 6,Claude 3.7 Sonnet
图 7、图 8,Grok 3
图 8、图 10,DeepSeek v3

个人觉得,
Gemini 2.5 Pro:复杂提示词效果更好
OpenAI GPT-4o:不相上下
Claude 3.7 Sonnet:不相上下
Grok 3:复杂提示词效果更好
DeepSeek v3 :简单提示词效果更好!

两点发现:
- 10 条输出中还是会出现一些完全前言不搭后语的废案,但是 5 条输出往往精华比较多。
- 一般来说,复杂提示词效果会有一些惊喜,但是 DeepSeek v3 的惊喜全在简单提示词中,甚至可以拿全场最佳[允悲]

注:此测试仅为个例,没有标准,仅为个人喜好,不代表模型真实水平

发布于 北京