#IT那些事儿# 用美伊冲突实测了号称预测万物的群体智能引擎MiroFish(图一),结果见图十,其实就是个“多Agent社会仿真”,它需要你输入的素材里有若干实体尤其是有各种性格、各种利益、各种立场的人物或组织,所以它仅适合推演现实事件博弈比如美国打击伊朗事件,或者推演小说比如红楼梦的结局,当然也可以推演政策对股市的影响。它不适合对科学技术的预测,比如脑机接口、量子算力今后如何演进。
注意它是个吞金兽:
一、它明确要求配置 LLM_API_KEY
每个 Agent 的每次“思考”都要调用一次 API,Agent 越多、轮次越多,API 消耗越大;
成本 = Agent数 × 轮数 × Token
估计默认的168轮次就足以让你的账单爆掉,记得配coding plan啊。
二、它要求配置ZEP记忆图谱
而 app.getzep.com 的每月免费额度为1000 Episodes。
它的技术原理是:
第一步,知识图谱 + GraphRAG:将输入的种子材料(新闻/报告/小说)抽取成实体-关系图谱,也就是它说的构建“数字世界的骨架”;
第二步,智能体生成:从图谱中自动生成大量具备独立人格、背景、立场的 Agent,每个 Agent 都是一个有记忆的角色;
第三步,长期记忆系统:每个 Agent 拥有时序记忆,能记住之前的交互,行为会随时间演化——这正是它和单次 LLM 调用最大的区别;
第四步,并行仿真引擎:成百上千个 Agent 在模拟时间轴上自由交互,产生“涌现行为”——即没有被编程的、从群体互动中自发出现的结果;
第五步,ReportAgent 综合分析:仿真结束后,专用 Agent 对模拟结果进行深度分析,生成预测报告。
这应该属于复杂系统科学中的 ABM(Agent-Based Modeling),这个理念在20世纪40年代末期被提出,直到20世纪90年代才得到广泛应用。
它的技术本质是:
LLM(语义理解) + Agent-Based Simulation(群体模拟) + Monte Carlo(概率统计)。
那么它靠谱吗?
如果Agent参数是瞎设的,比如投资者风险偏好、消费者情绪、政策影响都是信手拈来的,那结果大概率变成故事生成器,而不是预测。
所以真正严肃的 ABM 系统必须用真实数据校准,用历史回测验证,用统计学验证,否则只是AI版桌游沙盘。
我用美国伊朗本次冲突进行测试(图二):
任务:预测未来30天美国—伊朗冲突走向
模拟要求:
1. 构建多智能体世界模型
包括以下类型Agent:
- 美国政府决策层
- 伊朗政府与革命卫队
- 以色列军事决策层
- 海湾国家政府
- 非国家武装组织
- 国际能源市场参与者
- 国际外交机构
2. Agent行为规则
每个Agent具备:
- 战略目标
- 风险偏好
- 信息不完全
- 对其他Agent行为的反应机制
3. 模拟机制
运行20轮蒙特卡洛社会模拟。
每轮模拟包含:
- 决策
- 冲突事件
- 外交行动
- 经济影响
4. 重点观察变量
记录以下指标的概率分布:
- 军事冲突升级
- 海上冲突
- 代理人战争扩大
- 直接美伊军事交战
- 外交缓和
5. 时间窗口
未来30天。
6. 输出结果
生成预测报告,包括:
(1)未来30天最可能发生的三种情景
(2)每种情景的概率
(3)关键触发事件
(4)油价与航运风险变化
(5)地区冲突扩散风险
7. 可交互模拟
允许用户在模拟过程中注入变量,例如:
- 美国空袭伊朗目标
- 伊朗封锁霍尔木兹海峡
- 以色列打击伊朗核设施
- 联合国外交调停
过程还是很顺利的,MiroFIsh产品完成度非常高:
第一步,本体生成了;
第二步,知识图谱构建了,可以点击进入环境搭建(图三);
第三步,模拟实例初始化;
第四步,生成 Agent 人设(图四),这一步时间会比较久一些;
第五步,生成双平台模拟配置(图五,即“LLM 根据模拟需求与现实种子,智能设置世界时间流速、推荐算法、每个个体的活跃时间段、发言频率、事件触发等参数”),时间会更久一些,感觉有个一二十分钟;
第六步,初始激活编排(自动的,图六,“基于叙事方向,自动生成初始激活事件与热点话题,引导模拟世界的初始状态”);
第七步,准备开始双世界并行模拟了(图七表明默认是168轮、预计耗时101分钟,这不疯了吗;所以如图八所示,改为自定义,设置40轮即可);
第八步,并行模拟过程记录如图九所示;
第九步,前端界面显示可以生成结果报告了;
第十步,结果报告大概运行了十分钟(图十),其中一个结论如下:
- 综合20轮模拟结果,未来30天内地缘经济风险与冲突扩散的关键时间窗口呈现以下特征:
- - 第1-10天:海上摩擦与航运拦截行动升级概率最高,油价波动主要受红海局势驱动
- - 第11-20天:代理人武装多线联动风险上升,地区冲突扩散概率达到峰值
- - 第21-30天:外交斡旋窗口进一步收窄,若前期未出现缓和信号,经济制裁与反制裁循环可能加剧
整体效果还是不错的,完成度非常高,推荐使用。
MiroFish仓库地址:github.com/666ghj/MiroFish
