接上条微博（http://t.cn/A6rYWHi0），经@宝玉xp 老师提醒，同时用复杂提示词和简洁提示词完成一个任务，看看效果，感觉不同的模型的效果还是不太一样的。复杂提示词都是 10 条输出，简单提示词都是 5 条输出。图 1、图 2，Gemini 2.5 Pro图 3、图 4，OpenAI GPT-4o图 5、图 6，Claude 3.7 Sonne

接上条微博（http://t.cn/A6rYWHi0），经@宝玉xp 老师提醒，同时用复杂提示词和简洁提示词完成一个任务，看看效果，感觉不同的模型的效果还是不太一样的。

复杂提示词都是 10 条输出，简单提示词都是 5 条输出。

图 1、图 2，Gemini 2.5 Pro
图 3、图 4，OpenAI GPT-4o
图 5、图 6，Claude 3.7 Sonnet
图 7、图 8，Grok 3
图 8、图 10，DeepSeek v3

个人觉得，
Gemini 2.5 Pro：复杂提示词效果更好
OpenAI GPT-4o：不相上下
Claude 3.7 Sonnet：不相上下
Grok 3：复杂提示词效果更好
DeepSeek v3 ：简单提示词效果更好！

两点发现：
- 10 条输出中还是会出现一些完全前言不搭后语的废案，但是 5 条输出往往精华比较多。
- 一般来说，复杂提示词效果会有一些惊喜，但是 DeepSeek v3 的惊喜全在简单提示词中，甚至可以拿全场最佳[允悲]

注：此测试仅为个例，没有标准，仅为个人喜好，不代表模型真实水平

发布于北京