计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

博弈行为中的演绎与归纳推理及其问题(2)

2016-04-21 01:02
导读:此时,我应当选择招认 因此,无论对方采取招认还是不招认,我最好的策略是招认。 无论是甲,还是乙,他们均推理得出最好的策略是招认。双方均招认

    此时,我应当选择“招认”
    因此,无论对方采取“招认”还是“不招认”,我最好的策略是“招认”。
    无论是甲,还是乙,他们均推理得出最好的策略是“招认”。双方均招认是“纳什均衡”——这是一个稳定的结果。
    在囚徒博弈中存在惟一的纳什均衡(注:纳什均衡,简单地说就是,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的;也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。)点,即两个囚犯均选择“招认”策略。一旦人们处于囚徒困境,“囚徒困境有惟一的纳什均衡点”构成参与人的“公共知识”,双方均毫不犹豫地选择“招认”。
    这是静态博弈的例子。在这个推理过程中,双方的推理均是演绎的。
    (2)动态博弈中的演绎推理 动态博弈过程如同静态博弈,也是一个推理过程。我们来看一下动态博弈中人们是如何进行演绎推理的。先看一个例子。
    有两个企业A、B。企业B独占一个行业的市场,企业A要进入这个领域,想与企业B瓜分该市场。企业B不愿意A与它一起瓜分该市场,它发出“威胁”:“如果你进入,我将打击”。当然,对B进行打击,双方均有损失。——这是双方的“公共知识”。该博弈用博弈树表示,即为:
    附图
    上图中的数字表明:如果A“不进入”,A的得益为0,B的得益为10;如果A“进入”,B“不打击”的话,A与B平分10,各得到5,而如果“打击”的话,A的收益为-3,B的收益为4。
(转载自http://zw.NSEAC.com科教作文网)

    这个博弈的结果是,A选择“进入”,B选择“不打击”。——它们构成“子博弈精炼纳什均衡”。对于这个博弈,B的威胁“如果A进入,我将打击”是“不可信的”威胁。
    在这个动态博弈中,理性的参与人所用的推理方法被称为“逆向归纳法”又称“倒推法”(backward induction)。虽然被称为逆向归纳法,但它是完全归纳法,即它是演绎性的。
    逆向归纳法是求解动态博弈的方法。它是演绎性的,因为它的推理是必然的。在上面的例子,我们看到,企业A作这样的推理:
    假定我(A)进入,B如果“打击”,它的得益为4;“不打击”的得益为5。B是理性人。它将选择“不打击”。既然我预测到B将“不打击”,我在“进入”和“不进入”间进行选择时,“进入”的得益为5,“不进入”的得益为0,我作为理性人,将选择“进入”。
    当A选择“进入”策略时,B的推理是:
    如果采取“打击”,我的得益为4;“不打击”的得益为5,选择“不打击”是理性的选择。
    (3)静态博弈中的归纳推理 博弈中参与人运用归纳推理,原因大体有两个:一是由于信息不完全;二是由于博弈是竞争性的——零和博弈。
    不完全信息博弈,又称贝叶斯博弈,是博弈论研究的重要内容。不完全信息博弈是指博弈参与人的得益函数不是公共知识时的博弈。此时,虽然博弈参与人是理性的构成公共知识。但是,总存在某个策略组合下的得益不是公共知识。这样,即使一个博弈存在惟一的纳什均衡,由于这个均衡不是公共知识,这样的均衡不能够在一次博弈中达到。而所谓竞争性的博弈是指零和博弈,在一个博弈中如果只有两个参与人,其中一方所得等于另外一方所失,此时,双方不可能形成一个大家均接受而不会改变的纯策略对。

(科教论文网 lw.nseaC.Com编辑发布)


    在这样的过程中,博弈参与人如何确定自己的策略选取呢?他只能根据其他参与人“历史”中的策略“归纳地”得出对方此时的策略,从而决定自己的策略。一个例子就是,《三国演义》一书中“空城计”博弈。
    诸葛亮误用马谡,致使街亭失守。孔明在西城中,准备启程。等他安排停当,司马懿引大军15万蜂拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只剩二千五百军在城中。众官听到这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将,旌旗竟皆藏匿,诸军各收城铺。打开城门,每一门用上二十军士,扮作百姓,洒扫街道。而孔明披鹤髦,戴纶巾,引二小童,携琴一张,于城上敌楼前,凭栏而坐,焚香操琴。马司懿来到城下,见到诸葛亮焚香操琴,笑容可掬。司马懿吓坏了,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:莫非诸葛亮无军,故作此态,父亲何故退兵?司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说:司马懿料吾平生谨慎,不曾弄险,见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之。我们兵只有二千五百,若弃城而去,必为之所擒。
    我们可以用如下的博弈矩阵来表示这个博弈:
    附图
    这个博弈中,“进攻”是司马懿的“占优策略”。该博弈有两个纳什均衡,即:(司马懿“进攻”,诸葛亮“守城”);(司马懿“进攻”,诸葛亮“弃城”)。然而,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮知道。他们对博弈结构的知识是不对称的:诸葛亮拥有比司马懿较多的知识。当然这种知识的不对称完全是诸葛亮“制造出来的”。

(科教范文网http://fw.ΝsΕΑc.com编辑)


    司马懿是如何推理的呢?司马懿的推理是“归纳的”。司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。”在司马懿看来,诸葛亮一生都是谨慎的,既然诸葛亮一生没有冒险,此次也肯定不会冒险,诸葛亮有埋伏。司马懿在“攻城”和“撤退”之间作出“撤退”的选择。

   在这里,司马懿归纳作出了一个错误的策略选择。尽管如此,我们不能说司马懿是不理性的。司马懿作出错误的策略选取,是由于不完全信息造成的。在孔明-司马懿的博弈中,孔明做出的空城假象,目的就是让司马懿感到“攻城”有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,“攻城”失败的可能性较大,而“撤退”的期望效用大于“攻城”的期望效用。即:司马懿认为,

上一篇:对逻辑学范围与性质的反思 下一篇:没有了