“博弈论”的粗浅认知|无处不在的巧妙与策略|
博弈论又被称为对策论,它是现代数学的一个新分支,也是运筹学的一个重要组成内容。《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的罗伯特·奥曼教授的说法,博弈论就是研究互动决策的理论。所谓互动决策,即各行动方(即局中人)的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中。在如此跌宕的情形下,考虑并进行决策,选择最有利于自己的战略。
冯·诺依曼
其实,博弈论思想古已有之,我国古代的《孙子兵法》不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,博弈论正式发展成一门学科则是在20世纪初。1928年冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构,并将博弈论系统应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》、《非合作博弈》等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈——好比两个人下棋、或是打乒乓球,一个人赢一局则另一个人必输一局,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方)、策略集合(所有棋局)和盈利集合(赢子输子),能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”、最优的具体策略?怎样才是“合理”?应用传统决定论中的“最小最大”准则,就是博弈的每一方都假设对方的所有攻略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。
博弈的主要要素有:1.决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。2.对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。3.生物亲序:所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。4.局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。5.策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。6.得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。7.次序:各博弈方的决策有先后之分,且一个博弈方要做不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。8.博弈涉及均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。(www.daowen.com)
博弈论不仅仅存在于数学的运筹学中,也在经济学中占据越来越重要的地位。博弈论的应用领域十分广泛,在经济学、政治科学、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,与上司博弈,也在与下属博弈,同样也会跟其他相关部门人员博弈;而要开展业务,在同客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:“要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。”也可以这样说,要想赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。
《博弈圣经》中也说到:“21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是博弈。评论一个人和一个国家的穷富,就看他分享博弈真理的多少。”
数学链接 SHU XUE LIAN JIE
囚徒困境博弈
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。对A来说,尽管他不知道B做何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。所以,两人抵赖是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而都坦白是一个占优战略均衡。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。