《博弈论》冯·诺依曼给出了与人相处博弈时的最优策略——可激怒性+清晰性+初善性+点到即止性。
在两两循环博弈进行了300次后,阿克塞尔罗德终止了游戏,最后的结果显示,加拿大学者罗伯布的“一报还一报”程序获得了最高得分。“一报还一报”程序的特点在于第一次对局采取合作策略,之后每次对局都以对手上一次的策略作为参考,即对手上一次选择合作,我这一次就选择合作,对手上一次选择不合作,我这一次就选择不合作。
阿克塞尔罗德对得分较高的程序进行了分析,他发现得分排名靠前的程序一般有三个特点:一是具备“善良性”,即从来不主动背叛别人;二是具备“可激怒性”,即对于别人的背叛不能一直许以善意的合作,还要具备一定的报复;三是“宽容性”,即别人背叛了你一次,你不能无休止地进行报复,而要在别人选择合作的时候与其合作。
与此同时,阿克塞尔罗德在这次实验中还有新的发现,即优秀策略还具有“清晰性”,也就是说,优秀的程序通常只需要在几次对弈之后就能被清晰地辨识出来,而那些复杂的策略却并没有令人满意的得分。“一报还一报”策略显然就具备“清晰性”特点,在应用这一策略后,对手很容易发现其中的规律,并明白只有主动与对方合作才能赢得合作。
发布于 山西
