蜈蚣博弈 发表评论(0) 编辑词条
蜈蚣博弈(Centipede game)
什么是蜈蚣博弈 编辑本段回目录
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:[1]
合作 合作 合作 合作...合作 合作
A B A B …… A B (100,100)
合作 合作 合作 合作...合作 背叛
A B A B …… A B (98,101)
现在的问题是:A、B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“ 不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛” ——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。[1]
蜈蚣博弈的悖论[1] 编辑本段回目录
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验,目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者,实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
参考文献 编辑本段回目录
附件列表
→如果您认为本词条还有待完善,请 编辑词条
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0
标签: 蜈蚣博弈 博弈 博弈论 收益 理发师悖论 理性人的假定 罗素悖论 芝诺悖论 说谎者悖论 诺贝尔奖 阿基里斯赶不上乌龟
同义词: 暂无同义词
关于本词条的评论 (共0条)发表评论>>