大模型人性属性是逻辑陷阱

[CL]《If LLMs Have Human-Like Attributes, Then So Does Age of Empires II》A d Wynter [Microsoft & The University of York] (2026)

在人工智能评估领域，将道德、共情或焦虑等人类特质归于大模型是一个悬而未决的逻辑陷阱。过去的方法受困于“界面幻觉”，本质原因是研究者往往在实验设计阶段就预设了这些特质的存在，导致实验结论陷入循环论证，无法区分模型是在模仿模式还是真正具备内在心智。

本文的核心洞见是：把大模型重新看作一种与物理媒介无关的通用计算过程。由此，作者在帝国时代2这一电子游戏中证明了图灵完备性，并利用游戏中的山羊和村民作为二进制位构建并训练了一个感知机。这一操作证明了如果计算逻辑一致，那么感知到的“人性”仅仅取决于表现形式，而非系统本身的固有属性。

这项工作真正留下的遗产是提出了“零假设”协议，要求研究者在观察模型行为时剥离人格化臆断。它为后来者打开的新门是建立一种基于因果反应而非心理暗示的机械化评估体系，但尚未跨过的门槛是，如何定义一套在不同计算媒介下都能保持稳定且不依赖观察者主观解释的测量标准。

arxiv.org/abs/2605.31514 #机器学习# #人工智能# #论文# #AI创造营#

发布于北京