AI解决复杂问题能力探讨

关于 AI 有个常见观点：AI 只能做初级的工作，解决不了困难的问题，因此人类长期会有不可替代性。

我认为，AI 现阶段之所以更多地停留在“初级工作”层面，并不一定是AI能力已经达到上限，而主要受两个因素影响。

首先，是训练数据的分布问题。

AI 的训练数据，本质上来自现实世界从业者的实践记录，而从业者本身的能力水平大致呈正态分布。
这意味着，AI 学到的并不是“专家如何解决问题”，而是“大多数人遇到问题时会怎么做”。

因此，现实中大部分人解决不了的问题，AI 也会更大概率选择错误或次优的解决路径。

比如用 AI 写代码，在遇到需要系统性重构的场景时，
AI 并不是“做不了重构”，而是更可能像很多低效程序员一样，选择“在这里加个 if，先把功能凑出来”。

一旦通过提示词、约束条件或上下文，触发了更接近“高级架构师”的推理分支，AI 往往也能给出相当不错、甚至相当完整的重构方案。

所以这里的关键并不是：AI 会不会解决困难问题，而是它被训练成了“像大多数人一样”去解决问题。

我倾向于认为，随着 AI 在真实复杂场景中的使用不断加深，越来越多“解决困难问题”的过程被记录、反馈和强化，如果能够让 AI 更多学习领域专家而不是普通从业者的决策轨迹，它在解决实际复杂问题上的能力，会随着训练分布的变化而逐步提升。

第二个因素，是上下文长度和信息表示方式的限制。

目前的大模型，仍然主要使用人类语言（字符串）作为基础表示形式，并以线性、逐 token的方式进行信息编码和还原。

但很多被称为“复杂”的问题，复杂的并不是逻辑本身，而是它们往往伴随着大量背景知识、环境约束、运行状态以及效率目标，这些信息很难通过线性的文本序列被完整、准确地表达和利用。

从信息密度的角度看，现实世界中的一张照片、一段视频、一个结构化状态空间所包含的信息量，远远大于等量的文本描述（所谓“一图胜千言”）。

目前 AI 之所以高度依赖文本 token，并不是因为这是最优的计算方式，而是因为人类产生和积累的知识，本身就是通过语言记录和传播的。想要利用这些数据做训练，自然就会倾向于使用基于人类语言的架构。

但当未来 AI 可以自行产生足够多的数据之后，完全有可能基于更利于计算机理解的信息结构，以及非线性的编码与还原方式来组织和处理信息，从而摆脱对“人类语言”这一低效中间层的依赖。

一旦这一点发生，信息处理的效率和规模很可能会远超我们今天基于文本模型的直觉想象。

基于以上想法，我有些悲观地认为，未来或许几乎不会存在太多真正“难以被 AI 替代”的当代信息类工作。这就像工业化生产替代了抡锤的铁匠一样，并不是因为铁匠不重要，而是生产范式发生了根本变化。

而当“信息”这一非物质要素的生产效率也被大幅提升之后，真正值得担忧的或许已经不是“人类是否不可替代”，而是：

在人类社会中，下一个新的增长点究竟会是什么。

发布于北京