谷歌前几天悄悄发布了一本 68 页的《提示词工程实践指南》。免费的，不用注册，看完只会有一种感觉：我们过去写提示词的方式，可能都太随意了。更有意思的是，这本书不是讲玄学技巧，而是基于大量真实实验，总结出来的一套可复用原则。它让“写好 prompt”从玄学，变成了一门可以被验证、被迭代、被

谷歌前几天悄悄发布了一本 68 页的《提示词工程实践指南》。免费的，不用注册，看完只会有一种感觉：我们过去写提示词的方式，可能都太随意了。

更有意思的是，这本书不是讲玄学技巧，而是基于大量真实实验，总结出来的一套可复用原则。它让“写好 prompt”从玄学，变成了一门可以被验证、被迭代、被训练的工程能力。

先讲一个最颠覆常识的点：写提示词不是比谁更聪明，而是比谁更系统。谷歌的实验显示，结构化、可复现的提示词，几乎在所有任务上都优于“灵光乍现式”的随手一写。

比如链式思维。我们都知道让大模型一步一步想，效果会更好。但研究进一步证明：如果你把“推理过程”写得更明确，让模型按步骤输出，它的表现会稳定地超过“一句话问到底”的提示。也就是说，别着急要答案，先引导模型思考，反而更快得到对的答案。

具体性也是被反复强调的。模糊请求会给模型太多自由度，让它乱跑；但如果你说得很明确——角色、情境、限制、目标格式——模型会像接到完整任务书的实习生一样，按规范完成工作。比如：
“请用 5 个要点给 CEO 总结这篇文章”，必然比一句“总结一下”更可靠。

书里最让我共鸣的一点是：提示词工程更像调试，而不是写作。第一次写出的 prompt 九成不够好，你需要不断试、不断改。换结构、加约束、补背景……这一轮轮的小修小补，才是提示词工程师真正的日常。

格式也被单独拎出来讲。很少有人意识到，换行、编号、明显的分隔符，都能显著降低幻觉。把你的提示词写得像是给队友的 SOP，而不是微信聊天，这往往是效果提升最快的办法。

最后一个容易被忽略的点：要学会评估。如果没有简单可重复的指标，你根本不知道“v2 的提示词”是不是比“v1”更好。谷歌建议搭一个轻量测试集，测一测输出的稳定性和正确性，哪怕只用 5 个测试样例，也会比凭感觉优化有效得多。

总结一下：提示词不是一句话，而是一个可以设计、调试、评估的系统。你越把它当工程，它越能回报你。

如果你正在做 LLM 应用，这本 68 页的小册子，值得你找个晚上仔细读一遍。

地址见评论区。
#AI创造营##微博兴趣创作计划##提示词#

发布于山东