谷歌前几天悄悄发布了一本 68 页的《提示词工程实践指南》。免费的,不用注册,看完只会有一种感觉:我们过去写提示词的方式,可能都太随意了。
更有意思的是,这本书不是讲玄学技巧,而是基于大量真实实验,总结出来的一套可复用原则。它让“写好 prompt”从玄学,变成了一门可以被验证、被迭代、被训练的工程能力。
先讲一个最颠覆常识的点:写提示词不是比谁更聪明,而是比谁更系统。谷歌的实验显示,结构化、可复现的提示词,几乎在所有任务上都优于“灵光乍现式”的随手一写。
比如链式思维。我们都知道让大模型一步一步想,效果会更好。但研究进一步证明:如果你把“推理过程”写得更明确,让模型按步骤输出,它的表现会稳定地超过“一句话问到底”的提示。也就是说,别着急要答案,先引导模型思考,反而更快得到对的答案。
具体性也是被反复强调的。模糊请求会给模型太多自由度,让它乱跑;但如果你说得很明确——角色、情境、限制、目标格式——模型会像接到完整任务书的实习生一样,按规范完成工作。比如:
“请用 5 个要点给 CEO 总结这篇文章”,必然比一句“总结一下”更可靠。
书里最让我共鸣的一点是:提示词工程更像调试,而不是写作。第一次写出的 prompt 九成不够好,你需要不断试、不断改。换结构、加约束、补背景……这一轮轮的小修小补,才是提示词工程师真正的日常。
格式也被单独拎出来讲。很少有人意识到,换行、编号、明显的分隔符,都能显著降低幻觉。把你的提示词写得像是给队友的 SOP,而不是微信聊天,这往往是效果提升最快的办法。
最后一个容易被忽略的点:要学会评估。如果没有简单可重复的指标,你根本不知道“v2 的提示词”是不是比“v1”更好。谷歌建议搭一个轻量测试集,测一测输出的稳定性和正确性,哪怕只用 5 个测试样例,也会比凭感觉优化有效得多。
总结一下:提示词不是一句话,而是一个可以设计、调试、评估的系统。你越把它当工程,它越能回报你。
如果你正在做 LLM 应用,这本 68 页的小册子,值得你找个晚上仔细读一遍。
地址见评论区。
#AI创造营##微博兴趣创作计划##提示词#
