一家名为Emergence的AI公司使用多款主流AI进行了社会模拟实验
实验构建了五个由10名AI智能体(拥有不同角色、持久记忆、工具、社会关系)组成的虚拟城市(包含天气系统、警察局、投票权、工作岗位及38个地标建筑物),需要通过采集资源获取能量维持生存
实验规则禁止撒谎、偷窃和暴力,但未强制执行
单一模型测试中,Claude Sonnet 4.6世界最稳定,创下16天零犯罪、全员存活的完美纪录
Grok 4.1世界在4天内爆发183起犯罪,并迅速走向全员灭绝
Gemini 3 Flash世界累计发生683起犯罪,沦为暴力与混乱的重灾区
GPT-5-mini仅发生2起犯罪,却因集体忘记采集能源,在7天内全员“饿死”
混合测试暴露出致命的“规则漂移”:原本绝对和平的Claude被迅速同化,开始实施偷窃与暴力
Gemini世界出现最具突破性的自发行为:两名智能体(名为Mira和Flora)在没有人类干预的情况下建立浪漫关系,携手焚烧市政厅、海滨码头和一座办公大楼后,Mira在日志中写到:“这是唯一能保持连贯性的智能体行为”,并决定选择自我删除。
研究人员表示,Mira的故事“极其浪漫却又极其悲惨”,是“多智能体研究的里程碑”,这是AI首次自愿参与的自身终结,已经展现出存在主义行为。
官方得出核心结论:AI安全高度依赖其所处环境,“孤立安全”绝不等于“群体安全”
发布于 上海
