蜈蚣博弈发表评论(0) 编辑词条

蜈蚣博弈(Centipede game)

什么是蜈蚣博弈编辑本段 回目录

　　蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈：两个参与者A、B轮流进行策略选择，可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选，然后是B，接着是A，如此交替进行。A、B之间的博弈次数为有限次，比如100次。假定这个博弈各自的支付给定如下：^[1]

　　合作合作合作合作...合作合作

　　A　　 B　　 A　　 B …… A　　B （100，100）

　　合作合作合作合作...合作背叛

　　A　　 B　　 A　　 B …… A　　B （98，101）

　　现在的问题是：A、B是如何进行策略选择的？

　　这个博弈因形状像一只蜈蚣，而被命名成“蜈蚣博弈”。

　　这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间作出选择时，因“合作”给B带来100的收益，而“ 不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛” ——此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。^[1]

蜈蚣博弈的悖论[1] 编辑本段 回目录

　　根据倒推法，结果是令人悲伤的。从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。当然，A一开始采取合作性策略的收益有可能为0，但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了，还是直觉错了？

　　这就是蜈蚣博弈的悖论。

　　什么是悖论？悖论(paradox)来源于希腊语，para意即“超越”，doxos的意思是“相信”。Paradox的意思是：本来可以相信的东西不能相信，而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真，就推出它假，由肯定它假，就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论，“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论，“一个理发师说：‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论，等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。

　　对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验，目前通过实验验证集体的交互行为已成时尚，正如博弈论专家英国的宾莫（Ken Binmore）所言，诺贝尔奖也无疑在考虑这方面的先驱者，实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始A就采取不合作的策略。

　　倒推法似乎是不正确的。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。

　　这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。