ReverseMartingale 24-03-05 15:00

#京城大师赛[超话]#

假面舞会的简易博弈分析:

规则简化: 假面无法查验一名玩家是否在舞池,可以连续两晚赐予同一个玩家面具

假设:1. 明牌,即所有人身份都已知,2. 白天公布昨夜舞池信息,3. 白天必投号码最小的狼人,狼人推完后投假面

均衡分析:

在舞者和假面的博弈中,由于双方都无法采取必胜的确定纯策略来完全压制对手,所以他们需要寻求一种最优的混合随机策略。这种最优混合随机策略的特点是,即使对手事先完全获知了该策略并作出最佳反应,自己的期望收益也不会比目前状态更差。也就是说,通过采取这一策略,自己至少可以确保对手无法占据优势地位。如果双方都实行这种策略,那么他们就处在均衡中。

*注:该理论分析对规则和场景做了很多简化,与真实游戏有很多差距,考虑到各种复杂情况,没有什么操作是游戏中应该做的,玩家可以自由选择任意自己偏好的策略。

例子:
入夜前存活玩家数量:
1假面,1狼人,1舞者,1预言家,1白痴 ,3平民
3神已经进入过舞池

这是一个比较特殊的例子,只剩五个玩家没有进过舞池,因此今晚就是最后一舞,该舞也将决定最终的胜负。

由于狼刀落后,且神职已经都进过舞池,狼人想赢只能通过今晚杀死两个平民。因此,狼刀必须在平民身上。假面不需要扣狼或自己,因为这样最多保护狼人阵营不被扣死,没有任何攻击性。剔除了必败的无意义行动,剩余操作如下:

狼人:刀平民(如平民1)
舞者操作:3民,1狼1假面1民,2民1狼/假面
假面操作:扣平民1,扣另一个平民,不扣(这里不需要假面和狼人见面,只需要他们之前就设计好配合的策略即可)。

考虑舞者和假面、狼刀所有可能的有意义行动,可以绘制出附图所示的游戏树和矩阵。在游戏树中,边代表玩家可能的行动,结点代表游戏的结点。虚线框住的地方代表狼人阵营无法区分这些节点。这是因为狼人阵营在行动时,无法得知舞池的信息。游戏树作为示意未绘制完全。

图中的矩阵展现了不同操作下狼人胜利概率。例如如果狼刀平民1,假面扣平民1,舞者选择舞2民1假面。那么平民1必死,舞者一旦选到平民1进舞池,一定会死另一个平民(概率:2/3),但是如果平民1不在舞池,假面的操作无效,只有平民1死亡,好人胜利(概率:1/3)。因此,狼人胜利概率为⅔。

在这个博弈里,舞者和假面都无法利用确定的操作完全压制对方,舞者想要获得尽可能高的期望收益,而假面则希望把舞者的期望收益控制在尽可能低的水平。

舞者可以采取的是一种最优随机策略,即:
1. 首先假设假面会做出最优反应,即尽量降低舞者的期望收益。
2. 在这种最坏情况下,舞者选择一种能让自己期望收益最大化的随机策略。

例如在剪刀石头布里,玩家最优的随机混合策略就是等概率出剪刀石头布。

在这个特殊例子下,经过计算,舞者在均衡处的策略为以1/4的几率舞3民,以3/4的几率舞2民一狼。而假面在均衡处的策略为以1/2几率扣狼刀的平民,以1/2几率扣另外的平民。

在这个例子里,均衡处两方的胜率相等。如果舞者或假面偏移了均衡策略,就可能会让对方占优势。

考虑广义情况下的多轮博弈(见附图2),可以计算一个策略,使得其在每个子游戏节点上都是均衡策略。这里就需要通过代码来迭代计算了。

其它附图是一些代码结果(暂时还没有跑过很多测试例, 有可能有错......)。每张图对应一个入夜状态和该状态下舞者/女巫和假面/狼人的最优随机策略。描述状态时,如果玩家下方有下划线,代表该玩家已进过舞池。结果中显示的好人收益 = 均衡处好人的胜率 - 狼人的胜率。最优混合随机策略不唯一,代码只显示其中一种。由于代码考虑的规则和假设与真实情况不符合,且真实博弈过程中,对手也不一定理性,因此代码推荐策略仅供参考。如果是针对女巫已走的状态,策略中会显示女巫不使用毒药。

相关代码在通过一些测试例检查后会公布,假面舞会确实是一个很有意思的板子,分析起来也很有趣味。谢谢创造、修改和玩这个板子的所有人。如果后面有时间,会考虑标准规则,还有不完全明牌下的博弈分析。未来希望有人可以通过代码辅助设计更多有意思的板子。

发布于 北京