爱可可-爱生活 26-01-06 08:56
微博认证:AI博主 2025微博新锐新知博主

【告别Few-shot,自我验证才是AI准确性的未来】

Meta AI研究人员发现了一种让大模型准确率提升94%的技术,而且完全不需要任何示例。

这就是"验证链"(Chain-of-Verification,CoVe)。

传统提示词的困境在于:大模型会产生幻觉,自信满满地给出完全错误的答案。Few-shot示例虽有帮助,但受限于示例选择、token预算,且依然无法根治幻觉问题。我们一直在治标,而非治本。

CoVe的核心逻辑是让模型自己检验自己,分四步走:
1. 生成初始回答
2. 规划验证问题
3. 独立回答这些验证问题
4. 基于验证结果生成最终答案

关键在于"独立"二字。模型单独回答每个验证问题,避免了循环论证——不再是为自己的第一个答案辩护,而是客观地核查它。生成与验证分离,这才是破局之道。

实测数据:复杂问答准确率从68%跃升至94%,适用于GPT-4、Claude、Gemini等主流模型,无需微调,零样本即可生效。

可以直接使用的提示词模板:

[你的问题]
请按以下步骤执行:
1. 提供你的初始答案
2. 生成3-5个能暴露答案错误的验证问题
3. 独立回答每个验证问题
4. 基于验证结果提供修正后的最终答案

有人质疑这项技术早在2023年9月就已存在,为何现在才火。技术的价值不在于发明时间,而在于被真正理解和应用的时刻。也有人指出,说Few-shot已死有些夸张——在教模型语气和结构方面,示例仍有用武之地。这是进化,不是替代。

更深一层看,这揭示了一个范式转移:从"给更好的示例"到"让模型更好地思考",再到"让模型学会自我怀疑"。真正的技能变成了:清晰描述任务,让模型思考,然后让模型质疑自己。

AI准确性的未来,在于验证,而非生成。

原文:x.com/godofprompt/status/2008125436774215722

发布于 北京