感觉各个LLM之间的差距,在外部使用者看来,在于理解prompt之外那些不言自明/言下之意的能力。
好的顶级编程模型,你只需用行业术语,寥寥数语,AI就get到你的点,把你说到的/没说到的/甚至你没想到的,都按best practice实现了。
差的编程模型,就算你把prompt都写成伪代码这般详细,AI的实现和你的预期之间还是有很大偏差。
这一点,也许正如大佬们说的:压缩产生智能。好的模型,信息压缩度高,只要少量的提示信息,就能get到大量的正确数据。
另外一点,也说明面向垂直行业的模型方向是对的,像那些专精于编程的模型,信息压缩度高,训练数据优良而全面,更能Get到使用者的弦外之音,再加上软件吞噬世界这个buff, 自然生意红红火火。
另一个角度是从使用者角度来说:提示词的优劣,不在于内容长短,而在于:信息密度高,问题空间定义明确。
这也正是懂行业精准术语的老程序员的优势。
发布于 重庆
