百科知识 冷战后美中博弈:囚徒的困境及军备竞赛

冷战后美中博弈:囚徒的困境及军备竞赛

时间:2024-08-10 百科知识 版权反馈
【摘要】:从“囚徒的困境”延伸博弈论又称对策论,是由出生于匈牙利的数学家约翰·冯·纽曼所创立的。“囚徒的困境”最早是由美国普林斯顿大学的数学家增克于1950年提出的。比如,冷战时期美苏长达40年的军备竞赛就是这样一个“囚徒的困境”。“田忌赛马”与“囚徒的困境”都只是设定状态下的简单博弈。双方如果没有较好的信息沟通或者形势判断失误的话,也可能走不出那种“囚徒的困境”,以致于双方循环兜圈子,陷入长期的恶性竞争。

冷战后美中博弈:囚徒的困境及军备竞赛

从“囚徒的困境”延伸

博弈论又称对策论,是由出生于匈牙利的数学家约翰·冯·纽曼所创立的。这一理论研究的是,在两个或两个以上参与者的博弈中,其中每一方为追求自己的利益最大化而研究其他方的策略,并采取相应的有效对策,从而形成以冲突和合作为基本形式的互动。

研究博弈可以从最简单的两伤棋类比赛开始,来理解各类博弈中普遍存在的基本形式和原理。这是一种参与人数确定、游戏规则明确、纯粹以策略取胜(包括以对方策略失误取胜)的简单博弈。但是,最近三四十年来,博弈论已经远远超越了棋局研究,而成为人们从处理生活小事到解读国际风云的一把“智慧之钥”。1994年度诺贝尔经济学奖授予三位博弈论专家,一个重要的原因大概就在这里。

以博弈论中著名的案例“囚徒的困境”为例。

警察抓到两个纵火案犯罪嫌疑人,然后将它们隔离关押起来,并要求他们坦白交代。假定:如果两人都承认纵火,每人将被判刑3年;如果都不承认,每人将被判刑1年;如果一个不承认而另一个坦白并作证,那么抵赖者将被判刑5年,坦白者将被释放。

这两个囚徒将作出怎样的选择呢?

显然,在以上假定中,最好的结果是双方都选择抵赖,结果是大家都只被判刑1年。但是,由于两个囚徒在理论上都是从利己的目的出发进行决策的所谓“理性行为者”,在无法获取对方的完全信息并给予对方充分信任的情况下,每一个人大概都会选择似乎对自己最有利的策略,即选择坦白。

“囚徒的困境”最早是由美国普林斯顿大学的数学家增克于1950年提出的。这个假定的故事反映了现实生活中一个极为深刻的道理,现在人们常常用它来分析经济和政治领域的各种现象。

比如,冷战时期美苏长达40年的军备竞赛就是这样一个“囚徒的困境”。作为博弈的双方,由于美苏互相敌对,信息沟通不畅,甚至人为制造各种强化互不信任的信息,因而两国陷入了一个不断谋求自身安全、然后不断感觉还不安全而且安全形势也确实相应地不断恶化的困境而不能自拔。

其实,两千多年前,中国人还提出了另一个博弈论的著名案例,即“田忌赛马”。

在这个案例中,如果按照游戏规则,齐王和田忌应分别将自己的马分为一、二、三等并进行比赛。由于田忌每一等级的马都不如齐王同等级的马,故如果按游戏规则竞赛的话,田忌必败无疑。故事的结果是田忌“略施小计”,以自己的三等马对付齐王的一等马,然后以自己的二等马对付齐王的三等马,以自己的一等马对付齐王的二等马。尽管田忌每一等级的马都不如齐王同等级的马,但他却以2:1的战绩取得了全局的胜利。(www.daowen.com)

用来观察当今的国际政治和国际军事博弈的话,“田忌赛马”算得上“非对称战略”的先导。但是,田忌的“非对称战迷”必须有一个实施的前提,即假定一方占有对另一方的策略信息,在此条件下做出利益最大化的选择。如果齐王占有田忌的决策信息,也选择违反游戏规则,研究排兵布阵,则这个故事中的赛马过程和结局将出现多种形态。通过这一延伸,也反证了在信息沟通和互信度不高的情况下,“囚徒的困境”是有其产生的必然性的。

不过,尽管“田忌赛马”与“囚徒的困境”方法论意义有所不同,但它们同样表明:在一定的博弈条件下,博弈策略的选择对于博弈结果具有至关重要的作用。这也正是人们对博弈论产生浓厚兴趣的一个重要原因。

当然,我并没有“古已有之”的偏好,非要论证早在春秋战国时期中国就创立了博弈论。事实上,从一个具体的案例上升到一个抽象的概念和原理,在形式上是一小步,在实质上却是一大步。从知道“4比2多2、6比4多2、8比6多2……”到一言以蔽之曰“这个数列依次多2”,这是思维上的一次飞跃。人类的思维从幼年走向成熟,大概也是如此。

“田忌赛马”与“囚徒的困境”都只是设定状态下的简单博弈。在大多数情况下,博弈者都可以有多得多的若干种选择。而对于一方的每一种选择,另一方也有若干可供选择的相应对策。对于对手的每一步回应,另一方又有自己进一步的选择。双方就这样轮流进行自己的选择,循环往复,不断地演进。由于博弈者选择的多样性,博弈过程完全可能呈现多条路径、多种结局的态势。这种纷繁芜杂的分支情况类似一棵不断生长着的参天大树。博弈论称之为博弈树。

在博弈过程中,博弈者存在一个输出与反馈的问题。一方做出一种选择,另一方做出相应的对策。而这种回应不仅仅是简单的回答,它还决定或限制了对方的下一步选择,或者至少是为对方的下一步选择规定了条件和范围。也就是说,每一方并不能有完全的自主权利进行下一步选择。这类似于棋类的对弈,棋手只有一半选择的权利,另一半选择的权利掌握在对手的手里。一方棋手总是将棋子落在可能导致自己胜利的位置,而对手却总是把棋子布在可能导致自己胜利、同时限制和引导另一方布局路径的位置。

同样以棋类比赛来类比博弈的演进结果。谁的努力占了上风谁就将取得博弈的胜利。当然,最后的结果也可能是双方的努力不相上下,这时双方如果能够有较好的信息沟通和形势判断的话,也可能走出所谓的“囚徒的困境”,握手言和,或者开始新的博弈。双方如果没有较好的信息沟通或者形势判断失误的话,也可能走不出那种“囚徒的困境”,以致于双方循环兜圈子,陷入长期的恶性竞争。这是一盘没有结束之日的棋局。

所以,在最简单的“零和游戏”中,博弈结果是单一的。这好比我们童年时代常玩的“石头、剪刀、布”的游戏,其结果只可能是你输我赢或者相反。但在博弈的实际演进中,其分支(各种不同的相互对应的选择)是繁复的,其结果也是多样的,至少包括赢、输、和局以及僵局。进一步说,在实际的经济、政治、社会现象的分析中,我们很少有机会对某一博弈给出绝对的赢和输的判断,和局和僵局也呈现出丰富多彩的形态。

从理论上说,博弈论假定:博弈各方都是理性的,总是按对其最有利的方式行动;另一方在确定自己的对策时,同样也在试图寻找自己的最佳行动方式。在博弈论中,当一个博弈者的战略无论其他博弈者采用何种战略它总是最好的时候,这种战略就叫占优战略。而当全部博弈者都采用占优战略时,其结果就是占优均衡。在这种状态下,各方的利益都达到了最大化。纳什先生在北京向两千多名听众阐述的纳什均衡实际上就是,当设定其他博弈者的战略选择后,每一方都实现了最佳的获利状况;或者说,在博弈战略的选择中,每一种战略都已经是针对其他对手战略的最佳反应。这一理论正是纳什20世纪中期在美国普林斯顿大学进行博弈研究的小结。

但事实上,“纳什均衡”也郴过是设定条件下的理论状态。在实际的政治经济分析中,博弈是一个动态的过程;它不断地由某一个“可接受的均衡”通过一系列的对弈选择达到另一个“可接受的均衡”。在朝鲜核危机中,朝美双方以及其他各方经过了多轮的博弈,使朝鲜半岛的战略态势不断地由某种均衡演变至另一种均衡,堪称此类博弈的典型案例。

由此,博弈之树在不断地延伸。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈