博弈行为中的演绎与归纳推理及其问题(4)

2016-04-21 01:02

导读：这个博弈形状像一只蜈蚣，而被命名成蜈蚣博弈。这个博弈奇特之处是：当A决策时，他考虑博弈的最后一步即第198步：B在合作和不合作之间作出选择时，

    这个博弈形状像一只蜈蚣，而被命名成蜈蚣博弈。这个博弈奇特之处是：当A决策时，他考虑博弈的最后一步即第198步：B在“合作”和“不合作”之间作出选择时，因“合作”给B带来i00的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“不合作”。但是，要经过第197步才到第198步，在197步，A考虑到B在第198步时会选择“不合作”——此时A的收益是98，小于B合作时的100——那么在第197步时，他的最优策略是“不合作”——因为“不合作”的收益99大于“合作”的收益98。……如此推论下去。最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1！远远小于大家都采取“合作”策略时的收益：A:101,B:99。
    根据逆向归纳法，结果是令人悲伤的。从逻辑推理来看，逆向归纳法是严密的。但结论是违反直觉的。直觉告诉我们，一开始就停止的策略A、B均只能获取1，而采取合作性策略有可能均获取100，当然A一开始采取合作性策略有可能获得0，但1或者0与100相比实在是太小了。直觉告我们采取“合作”策略是好的。而从逻辑的角度看，A一开始应选择“不合作”的策略。
    是逆向归纳法错了，还是直觉错了？
    似乎逆向归纳法不正确。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，但这种合作不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。逆向归纳法肯定在某一步要起作用。只要逆向归纳法起作用，合作便不能进行下去。
    因此，我们不能怀疑逆向归纳法的合理性，它的推理过程严密，符合逻辑。然而如果我们用逆向归纳法来求解蜈蚣博弈，则博弈结果是我们不能接受的。

您可以访问中国科教评价网（www.NsEac.com）查看更多相关的文章。

    许多博弈论专家认为，蜈蚣博弈所反映的不是悖论，逆向归纳法作为求解动态博弈的方法，是有效的。蜈蚣博弈的结果尽管不是我们所期望的，但它是均衡结果。这个均衡结果反映的是多主体下个体理性的局限。这是理性的困境。
    　　4　博弈行为中归纳推理的“合理性”问题
    休谟告诉我们，人们使用归纳法寻求自然现象之间的因果联系的这个过程，只不过是人的心理上的习惯联想。我们有什么其他理由认为，我们所认为的事物之间的所谓因果联系是必然的？这就是休谟问题。休谟质疑的是认识中的归纳法的合理性问题。在博弈行为中，归纳推理同样存在是否合理的问题。
    我们用归纳法对自然进行认识，并根据我们归纳的结果做出相应的行动。如：我们看到天空中乌云密布，风渐渐地大了，我们想，天可能要下雨了，我们要带伞。之所以有这样的认识，是因为以往的经验“告诉”我们：当乌云增多并刮大风时，意味着要下大雨。即，当我们面对自然现象时，我们根据过去的经验来归纳并采取相应的行动。
    在认识论中，我们知道，归纳推理所得出的结论是或然的。但是在认识中我们存在着这样一个信念：全称命题要么真、要么假，并且它是超越时间和空间的。我们用归纳法可以不断地接近真理。在互动的博弈中，理性的人运用归纳法进行推理时，归纳法是否有效？它的合理性在哪里？
    在“酒吧问题”中，我们凭什么说，以前去酒吧的人数与下次去酒吧的人数之间有联系呢？当某人进行预测时，只有当他知道其他人预测的方法，他才能根据以往的人数和其他人的预测方法来“正确地”预测下次去酒吧的人数。这样的预测才能是“有根据的”或者说“有理由的”。但我们除了能知道以往去酒吧的人数外，我们无法知道其他人的预测的方法。即使我们知道了其他人的预测方法，但当其他人知道了我们将根据他们的预测方法来预测时，他们将改变他们的预测方法，从而使我们的预测归于无效。

（转载自http://www.ＮＳＥＡＣ.com中国科教评价网）

    在酒吧问题上，我们通过归纳法无法准确预测下次去酒吧的人数，那么我们通过对过去的历史能够知道什么？或者，在更一般的意义上说，在博弈行动中，人们通过归纳法能够学习到什么东西？这就是归纳法的合理性问题。
    我们发现，在博弈中归纳法的有效性体现在参与人对博弈均衡的认识。即通过归纳性的学习，博弈参与人对该博弈均衡获得了认识，对其他参与人的均衡策略也获得了认识。
    任何一个博弈均存在均衡，这也是诺贝尔经济学奖获得者约翰·纳什的贡献，被称为纳什均衡存在定理。然而，这里的均衡有两类：一类是纯策略均衡，另一类混合策略均衡。归纳法的作用就是对这两种均衡的认识。
    当一个博弈存在惟一一个纯策略纳什均衡点时，并且该博弈是完全信息博弈，参与人在一次博弈中就可达到均衡点。但当博弈不是完全信息博弈时，博弈参与人通过多次博弈，“了解”其他参与人不同策略组合下的得益，一旦策略组合达到了纳什均衡，博弈方均无意改变策略。因为此时，这一点是博弈各方均能够接受的点。在这样的过程中，参与人通过归纳法认识到该策略均衡，同时认识到其他参与人的策略选择。
    如果不存在纯策略均衡，而只存在混合策略均衡，博弈参与人通过归纳法同样能够认识到该混合策略均衡，同样能够认识其他参与人的策略选取，但此时是一混合策略，即参与人在其策略空间上的一个概率分布。在酒吧问题的博弈中不存在“纯策略纳什均衡”点，此时的参与人通过归纳法“认识到”平均去酒吧的人数为"60%"，即每次去酒吧的人数与不去酒吧的人数的“可能”比率为60:40。中国大学排名
    因此，当一个博弈存在纯策略纳什均衡时，博弈各参与人通过对以往的博弈历史的归纳，制定出下次的策略均衡点，从而摸索着接近该均衡，最终达到一个纯策略。而当博弈存在混合策略均衡时，博弈参与人所能够做的只是逐渐认识对方的混合策略，而相应地制订自己的混合策略，最终达到混合策略均衡。
    这就是说，博弈中参与人运用的归纳推理是有效的，这种有效性是针对博弈均衡的认识而言的。
    　　5　结语
    逆向归纳法悖论只是博弈论中一个悖论而已，归纳的合理性也只是多主体互动时理性人进行归纳推理的一个问题。博弈论涉及许多关于推理的逻辑“问题”。本人希望我国有更多的逻辑研究人员参与到博弈逻辑的研究中来，逻辑学家参与到博弈论的研究定能够结出丰硕的研究成果。

【参考文献】

上一篇：对逻辑学范围与性质的反思下一篇：没有了