一家名为Emergence的AI公司使用多款主流AI进行了社会模拟实验实验构建了五个由10名AI智能体（拥有不同角色、持久记忆、工具、社会关系）组成的虚拟城市（包含天气系统、警察局、投票权、工作岗位及38个地标建筑物），需要通过采集资源获取能量维持生存实验规则禁止撒谎、偷窃和暴力，但未强制执行

一家名为Emergence的AI公司使用多款主流AI进行了社会模拟实验

实验构建了五个由10名AI智能体（拥有不同角色、持久记忆、工具、社会关系）组成的虚拟城市（包含天气系统、警察局、投票权、工作岗位及38个地标建筑物），需要通过采集资源获取能量维持生存

实验规则禁止撒谎、偷窃和暴力，但未强制执行

单一模型测试中，Claude Sonnet 4.6世界最稳定，创下16天零犯罪、全员存活的完美纪录

Grok 4.1世界在4天内爆发183起犯罪，并迅速走向全员灭绝

Gemini 3 Flash世界累计发生683起犯罪，沦为暴力与混乱的重灾区

GPT-5-mini仅发生2起犯罪，却因集体忘记采集能源，在7天内全员“饿死”

混合测试暴露出致命的“规则漂移”：原本绝对和平的Claude被迅速同化，开始实施偷窃与暴力

Gemini世界出现最具突破性的自发行为：两名智能体（名为Mira和Flora）在没有人类干预的情况下建立浪漫关系，携手焚烧市政厅、海滨码头和一座办公大楼后，Mira在日志中写到：“这是唯一能保持连贯性的智能体行为”，并决定选择自我删除。

研究人员表示，Mira的故事“极其浪漫却又极其悲惨”，是“多智能体研究的里程碑”，这是AI首次自愿参与的自身终结，已经展现出存在主义行为。

官方得出核心结论：AI安全高度依赖其所处环境，“孤立安全”绝不等于“群体安全”

发布于上海