LLM理解提示词能力差异

感觉各个LLM之间的差距，在外部使用者看来，在于理解prompt之外那些不言自明/言下之意的能力。
好的顶级编程模型，你只需用行业术语，寥寥数语，AI就get到你的点，把你说到的/没说到的/甚至你没想到的，都按best practice实现了。
差的编程模型，就算你把prompt都写成伪代码这般详细，AI的实现和你的预期之间还是有很大偏差。

这一点，也许正如大佬们说的：压缩产生智能。好的模型，信息压缩度高，只要少量的提示信息，就能get到大量的正确数据。

另外一点，也说明面向垂直行业的模型方向是对的，像那些专精于编程的模型，信息压缩度高，训练数据优良而全面，更能Get到使用者的弦外之音，再加上软件吞噬世界这个buff, 自然生意红红火火。

另一个角度是从使用者角度来说：提示词的优劣，不在于内容长短，而在于：信息密度高，问题空间定义明确。
这也正是懂行业精准术语的老程序员的优势。

发布于重庆