CC女士不是西西 26-05-09 10:16

研究了一下GPT 5.5官方的prompt guidance,写prompt的理念和技巧确实要改了。

这不仅仅是要写更短的提示词这么简单,最重要的一条法则是:不要把 prompt 写成一长串“先做 A,再做 B,再做 C”的操作手册。GPT-5.5 prompt要遵循outcome-first原则:更适合先说清楚目标、成功标准、限制条件和可用上下文,然后让模型自己选择路径。OpenAI 原文的意思是,很多任务应该“描述目的地,而不是描述每一步”。

背后的原因是GPT 5.5更强了,至少在如下五个能力更强:更长上下文理解、更稳定的指令遵循、更好的任务分解、更强的工具使用、更强的自我检查。GPT-5 的提示指南也提到,模型改进重点包括 tool calling、instruction following、long-context understanding,这些能力一起支撑 agentic workflows。所以很长的提示词反而可能会限制模型的发挥。

这种变化不仅仅适用于GPT 5.5,Opus也遵循类似但不完全相同的趋势,具体可见官方文档。但这并不意味着模型更强,prompt就会更短,最关键的是提出更明确的结果需求outcome-first。

可以认为现在的prompt更像是一种契约,在绝大多数任务上,模型已经足够强大,不需要我们指导它应该怎么做,但是我们要让它明白我们具体要什么。

----------------------------------------------------------
以下为GPT 5.5官方说法:

1、以结果为先的提示词与停止条件
当提示词定义目标结果、成功标准、约束和可用上下文,并让模型自己选择路径时,GPT-5.5 最强。
对于很多任务,描述目的地,而不是描述每一步。这会给模型空间,让它为任务选择合适的搜索、工具或推理策略。

2、优先使用这种写法:
端到端解决客户的问题。
成功意味着:
- 基于可用政策和账户数据做出资格判断
- 在回复前完成所有允许执行的动作
- 最终答案包含 completed_actions、customer_message 和 blockers
- 如果缺少证据,询问最小必要缺失字段

3、避免不必要的绝对规则。旧提示词常用 ALWAYS、NEVER、must、only 这类严格指令来控制模型行为。只有真正不变的规则才使用这些词,例如安全规则、必填输出字段,或绝不应发生的动作。对于判断性问题,例如什么时候搜索、什么时候要求澄清、什么时候使用工具、什么时候继续迭代,应优先使用决策规则。

除非每一步都确实必要,否则避免这种指令风格:
- 先检查 A,再检查 B,然后比较每个字段,然后思考所有可能的例外,然后决定调用哪个工具,然后调用工具,然后向用户解释整个过程。

加入明确的停止条件:
- 用最少但有用的工具循环解决用户查询,但不要让减少循环次数凌驾于正确性、可访问的备用证据、计算,或事实性主张所需的引用标签之上。
- 每次拿到结果后,问自己:“我现在能否用有用证据和事实性主张所需的引用,回答用户的核心请求?”如果可以,就回答。

定义缺失证据时的行为:
- 使用足以正确回答的最少证据,精确引用,然后停止。

发布于 上海