博弈论(Game Theory),也被称为“对策论”和“赛局理论”,原属于应用数学的范畴,现在是经济学中常用的标准分析工具之一。博弈论的含义是双方在平等的对局中各自利用对方的策略变换自己的对抗策略,以达到取胜的目的,主要研究的是人与人、人与环境之间的相互作用和相互影响。
1928年,博弈论正式以一个理论被世人认识。在斯隆商学院,博弈论是研究生的研究课题,它主要引导未来的管理者考察自己的决定如何影响别人以及别人的选择如何影响自己。经理人常常要面临博弈,其对手既有自己公司的下属、同公司不同部门的同事,也有公司外的竞争者、客户、政府机构甚至是市场本身。斯隆商学院认为优秀的管理者能够在复杂而相互影响的环境中进行简略思考。而博弈论在这种情况下具有很大的帮助作用。
斯隆商学院的博弈课程不是一门关于商业战术的课程,在课程中,不会过多提到如何成为一个优秀的谈判者,或是更好的贸易商人,它侧重于指导如何在有多种可能性的战略情况中对重要事件有更深的理解能力。斯隆商学院将博弈论划分成三个主要版块:承诺与战略迁移——根据对方的可信性、对方是否具有威胁性和能够做出的承诺,在博弈中改变方法;发掘隐藏的信息——探索寻找那些被隐藏起来的不明显的信息,判断什么时候披露或不披露信息,决策什么时候让对手大吃一惊;有限合理性——分析在对手不是充分理性的情况下如何博弈,以及在对手不确定你的理性程度时如何博弈。
在博弈中一方的承诺或威胁,将影响另一方的战略制定和转移。我们首先来看在博弈论研究中经典的囚徒困境案例。囚徒困境的故事是这样的:
有两个嫌疑犯作案后被警察抓住,警察将两人分别关在不同的屋子里进行审讯,但是审讯过程并不顺利,他们都抵赖。警察虽然知道两人有罪,但是没有足够的证据,于是,警察对嫌疑犯做出了一个承诺或者说是威胁:如果两个人都抵赖,那么各判刑十年;如果两个人都坦白,那么两人各判八年;如果两人中一个坦白而另一个抵赖,那么坦白的人立即释放,抵赖的人则要判刑十年。如此一来,两个嫌疑犯的抵赖和坦白都将出现不同的结果。假设,同伙在抵赖,而自己坦白的话,立即释放,不坦白则判刑十年,相比之下,坦白的结果更好;假设同伙已经坦白,那么自己抵赖将判刑十年,坦白只判刑八年,显然在这种情况下也是坦白的结果更好。于是最后,两个嫌疑犯都选择坦白,并分别被判刑八年。在这个故事中,对于嫌疑犯来说,两个人都坦白的结果其实并不是最好的结果,但是他们在选择的过程中经过衡量发现这是最好的选择。其中的变化在于警察的承诺,或者说是威胁。
人们不论处于什么样的情况中,总是顾忌上级或者比自己地位和权利更高的人,就如同案例中的囚犯,抛开道德法律,只按照一次决策来说,他们做出决定的前提是警察——这个更高级别的人对结果的控制。而在一次决策中,决策的人所看到的、所顾忌的可能只是一种假象。若是站在警察的角度,现在两个嫌疑犯的选择无疑是最完美的结果,达到了他们的目的。
在博弈论中,承诺和威胁都是影响决策的“权利”范畴的概念,它的含义是向对手说明如果不做某种决策你将怎样,包含诸如利益许诺、强迫威胁、保证行为等方式,若是采用这种方式约束对方,其前提是对方对“权利”的认同,并看到不同的结果。在囚徒困境中,研究者将两名囚犯的最终选择——都坦白——称为“纳什均衡(Nash equilibrium)”,即当其他人不改变策略时,他此时的策略是最好的。这个时候的策略组合中,两个嫌疑犯不论是谁单独改变策略都不会得到好处。在博弈论中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
在实际的商业环境中,纳什均衡也会有多个,此时“承诺”将发挥其作用,成为协调行为的有效方式。但是承诺必须是符合其中涉及的各方的激励机制的,换言之,必须是与对方的利益有关,能够约束对方行为的内容。在运用这个策略的时候,管理者需要先明确“承诺”与“威胁”的区别,承诺是当对方遵循你的利益要求决策时得到的一种奖励,而威胁是当对方违反你的利益决策时的惩罚。
我们可以看一个餐桌博弈的例子,在晚餐中,家长希望孩子多吃蔬菜少吃甜食,但是孩子并不这么想。因此在餐桌博弈中,孩子的意愿是少吃蔬菜,多吃甜食。他们面临一个决策:是否要吃蔬菜;而家长希望孩子能够开心用餐,又希望孩子能够多吃蔬菜对身体健康,因此他们面临的决策:是否在晚餐的时候准备甜食。那么将出现四种结果:准备蔬菜和甜食,孩子将只吃甜食,父母不会高兴;只准备蔬菜,孩子不会高兴;只准备甜食,父母不会高兴;没有甜食也没有蔬菜,大家都不开心。按照理性的分析,不准备蔬菜和甜食是纷争最少的结果,但是显然不是最好的结果。
因此,家长可以在这里选择采用威胁和承诺的方式改变孩子的选择。例如,威胁说:“如果不吃蔬菜就不能够吃甜食”——对对方喜欢的选择加以阻碍;或者承诺:“只要你们吃了蔬菜,就可以吃甜食”——给与对方获得利益的机会。当然,结合这个案例的话,家长在这里是不会使用承诺的方式改变孩子的决策的。
在博弈的过程中还有一个重要的内容,就是挖掘出隐藏的信息,探索和分析一个决策将引发的那些不外显的行为和特征是什么、将会有什么样的结果。爱因斯坦说过:“一知半解是危险的事情,而知道得很多也同样危险。”管理者需要深思熟虑,尽可能知道得多一些。斯隆商学院给予管理者的建议是:使用可以观察的显性信息考察隐性信息。例如,将可以观测的结果与不易观察的行为联系起来,采用激励的方法,高效者多得,低效者少得;利用可以观察的行为考察隐藏的特征和特质,通过各种行为信号进行逆向选择和筛查。
这一点,可以通过斯隆商学院的教学案例来体会。
首先,假设你将一个工程项目承包给一个其他的公司,这个项目有一个不确定的结果。成功的可能性取决于承包公司付出的努力程度。当这个公司按照正常的努力程度,成功的可能是0.6,而当这个公司做出较高的努力时,成功的可能将提高到0.8。
假设,承包公司在普通的努力状态下的成本是10万美元,较高的努力成本是15万美元,项目如果成功的收益是60万美元。那么承包公司采取何种行为将受到你的其他补充方案的影响,例如固定支付计划、可观测的努力状态、奖金机制、特许经营方案等。预期获得利润等于收益减去成本,在固定支付计划的方案中,承包公司采取普通的努力,成本较低,那么支付的价钱较少,最优的支付方案就是10万美元,对应的承包公司的努力程度就是普通水平。可以得到在这种情况下,你获得的利润等于60×0.6-10=26万美元。如果按照可观测的努力状态即许诺给予相应的付款,则若承包公司按照普通程度的努力工作,支付的成本是10万美元,如果按照较高的努力程度工作,则额外增加5万美元的成本,按照预期利润的计算方法,承包公司普通水平的努力程度下,你的收益是26万美元。而承包公司较高水平的努力程度下,你的收益是60×0.8-15=33万美元。这种方式能够诱导出隐藏的较高的努力行为,收益也提高了。
固定支付的方案和基于努力程度的支付方案,能够带来不同的收益,但是二者都存在着一些问题,前者虽然支付成本低,方便可行,但是不能够激发较高的努力,项目成功的机会和完成效果较小;后者虽然能够激发较高的努力行为,但是监测公司的努力程度状态是无法实现的。
接下来再分析一下奖金机制。既然努力是不可观察的,那么可以将努力转换成可以直接看到的内容,例如,项目的成功或失败。然后,给予相应的奖金。
奖金应该具备两个特质:与激励兼容并能诱发行为,即令承包公司愿意选择较高程度的努力,并愿意投入到工作中来。该如何设置奖金呢?根据案例内容可以算出,两种努力程度下的成本差额是5万美金,奖金差额是0.2B(B是两种情况下的奖金,0.8B-0.6B=0.2B),当利益差额大于成本差额的时候,承包公司将采取较高的努力水平。即0.2B≥50000,可以算出当B≥250000,承包公司更愿意选择高水平的努力。(www.daowen.com)
按照奖金的特征:①激励兼容,即B≥250000;②诱发行为,即在较高的努力水平情况下,承包公司能够接受的预期工资(或支付成本)是S基本工资+(0.8)B(奖金)≥150000(成本),令B=250000,采取最低的奖金,则最低基本工资S=-50000。这5万美金事实上是承包公司支付给项目的资金量,也是项目失败的时候公司需要支付的风险。所以,在这方案下的预期利润应该是(0.8)600000-(0.8)B-S=(0.8)60000-(0.8)250000+50000=330000。这个结果和给予努力水平进行付款的方案的预期利润是一样的。
最后,分析一下给予特许经营的方案。这个方案希望改变承包公司对利润的忽视,即由你来承担所有的项目风险,变成与承包公司加盟并收拾失败的残局,承包方需要支付的特许经营费用就是最高的预期利润,即33万美元。
纵观几种补充方案,预期利润都是33万美元,预期支付成本是15万美元,没有很大差异,承担的风险也相同。最好的情况就是能够引导出承担公司较高水平的努力,争取更大的利润,但是不论是承包公司还是员工,都不愿意承担较高的风险。据此,给予管理者的建议是,当知道代理人期望的报酬,却无法预观察和监督其行为时,可以采取一些方案诱导代理人行动并承担一定的风险,例如特许经营权和实施奖金机制都是可行的方案,这是能够提高利润并监测行为的有效方法。
奖励能够鼓励努力行为,要探索隐藏的特质,需要筛选和选择信号。在对方克服困难的时候观测考察,观测到的是对方的行为信息和信号,如果在观测的过程中考察对方克服困难,进行了某种行为,便需要筛选和筛查。在行动中常常要克服障碍,才能够收获不同的结果,首先需要认识和区分这些障碍,通常可以将之分成两种:一种是克服之后收益大于支出的好的障碍,一种是克服之后收益小于支出的不好的障碍。人们当然愿意尝试克服前一种障碍。
我们以汽车保险为例,其中隐藏的特征是风险高低与否。假设人群中高风险和低风险的司机是均等的,高风险的司机有90%的可能遭遇车祸,而低风险的司机遭遇车祸的可能性是10%,车祸需要的修理成本是1万美元,那么保险公司为了涵盖两种类型的司机,可以按照以下方式计算(0.5×0.9+0.5×0.1)×10000=5000,因此保险公司可以与顾客拟定投保6000美元的保险合同,额外的1000美元可以作为保险公司的盈利。那么对于高风险的司机,如果不投保,其承担汽车修理的成本是(0.9)×10000=9000,投保则只支付6000美元,他们自然会选择投保;但是对于低风险的司机,他们不投保时承担的汽车修理成本是(0.1)×10000=1000,投保则要承担6000美元,那么这类司机不会选择保险。这时候可以采取逆向选择的方法,5000美元是车祸预计成本,高风险司机的保险事故的维修成本是9000美元,保险公司的损失是9000美元减去之前司机的投保金额,为3000美元。
据此,为保险公司提出建议,如果只有高风险的司机投保,那么为了避免损失,不妨将投保金额提高。但是这并不意味着保险公司要放弃低风险的司机这个客户群体。这时候就需要采取让客户自己筛选的原则,分别针对不同风险水平的司机,制定不同的合同。对于高风险的司机,可以提高司机的保险金额;对于低风险的司机,可以在合同中给出较多的折扣。在项目和交易过程中,管理者的战略制定和选择依据的是对手信息,要善于发现对手所隐藏起来的那一部分,当对方的行为不可控,处于隐藏之中时,管理者首要分析的是对方的动机,将战略制定侧重于控制行为,将对方的行动引导到期望的方向上。
斯隆商学院介绍的博弈论的第三个内容是关于经理人的理性。这内容将涉及三个概念:理性决策,即很多经济学家认为,一个理性的管理者和决策者,其决策来源于对世界的理解和认识,并且其决策是众多策略中将其利益最大化的一个,要做到这一点,需要一定的想象能力和数理推理能力;理性常识,博弈论的专家认为,在商业环境中,管理者与对手之间的理性是一种常识性认知,即每一个商业参与者都是理性的,每一个参与者都知道对方是理性的,每一个参与者也都知道对方知道自己是理性的……如此循环等;纳什均衡,博弈论中的纳什均衡假设每个参与者都有一定的理性,能判断什么样的决策和策略是他人认同的,并且在不同的决策条件下,每个参与者都认为对方有这样的理性。
斯隆商学院列举了一个猜测游戏来说明这一点。这个游戏的规则是这样的:准备两组容器W和Y,其中W中装有两个白色的球和一个黄色的球,Y中装有两个黄色的球和一个白色的球。游戏中老师或助教将通过扔硬币决定选择哪一个容器,而其他参与者将根据从容器中拿出的球和其他人的猜测结果,猜测扔硬币的结果选择的是哪一个容器。参与者的猜测越正确越好。
游戏的过程中,每轮将邀请8个学生来到教室前边进行,并且每轮的结果单独统计,当轮到某一个学生的时候,他要从容器中拿出一个球,但是不能够让其他人看见,然后将球放回去,写出自己的猜测结果,下一个学生根据自己拿出的球和前面一个人的猜测写出自己的猜测结果。
游戏结果发现,个体的理性是可以整合的。游戏中大家的猜测更多地是依据别人的结果和传达出的信息,而经常忽视自己得到的信息。这种根据所观察到的其他人已发生的行为或信号做出相同的决策和行为的现象被称为信息追随。游戏表明,群体中的人通常会做或者相信与其他周围人一样的事情。这种情况发生的原因除了信息追随之外,还有可能人们只是喜欢追求相同而避免不同的特性,或者他们认为这是对他们来说最好的选择。通过这一点,也可以推论团体行为在一定时间内是稳定的。在信息追随的过程中,理性的个体决策传达出的信息较少,通过游戏结果可以发现,如果有两个人的猜测结果是W容器,其他人将无视自己取出的球的颜色,也将猜测结果定为容器W,这种影响力量,两个人与100人是一样的。看上去更正确的信息和少数非理性的个体行为都会对群体行为产生影响。
博弈论认为先行者的行为将在一定程度上影响组织和团体的行为,因此,管理者可以通过不同设定,令组织做出不同的决策,这个决策包括管理者期望的任何决策。由此可以推断,每个人都是理性的,能够根据情况做出符合组织统一性的判断和决策,但是组织可并不一定是理性的,组织的决策依据的是其中力量最强烈的假设。就如电影《教父》(The Godfather)中第一代教父常说的台词一样:我能够给他下达一个他不能够拒绝的命令(I’llmake him an offer he can’t refuse)。
那么,如何运用这种理性来制定主导性策略呢?可以遵循如下三点:根据自己的理智判断作出主导性决策;无需考虑他人是否具有理性及其判断;理性分析结合主导策略,即决策选择中的纳什均衡,这个过程不需要前文提到的关于理性的常识认识。
全球著名的投资商、2008年福布斯排行榜第一名的巴菲特曾经运用博弈的方式,计划了一次亿万富翁收购计划,影响了一项法案的投票。当时美国的竞选资金改革法案中禁止使用纸币这一条款需要通过投票表决,巴菲特在2000年9月10号《纽约时报》中说道:“一些古怪反常的亿万富翁(绝非是我本人)做出了一项提议,如果该法案被没有通过,我将捐款10亿美元的纸币,支付给为改革通过投赞成票的数额最多的政党。”
亿万富翁收购计划类似于囚徒困境,为方便理解,我们可以这样简化:假设有一个共和党和一个民主党的议员需要就法案是否通进行投票表决。那么,就是说如果共和党议员投了赞成票,民主党的议员投反对票就不会得到捐款,而投赞成票有可能得到捐款;如果共和党议员投了反对票,民主党议员投反对票就不会得到捐款,但投赞成票则一定得到捐款。可见,不论共和党议员如何选择,民主党议员投赞成票的利益最大。反之,对于共和党一样。这与囚徒困境是一样的情况。所以最后的结果就是,两党议员在巴菲特的计划中,都投了赞成票。这个结果并不是纳什均衡的结果,事实上,纳什均衡并不一定是所有情况的策略中最正确的选择,在真实的决策环境中,参与者会因为很多原因失去“理性的分析”,主导性策略则能够给出一个应该关注什么忽视什么的重要方向。可见,理性并非绝对,在管理和交易、决策的过程中,可以随着对方的战略而变化。
任何人都无法在真空的环境下做出决定。我们做出的选择会影响到他人,同样,别人做出的选择也会影响到我们。这就涉及博弈的问题。在培养管理者管理能力的过程中,这是一个严肃的命题,也是一个重要的商业哲学理念。要把握博弈论的观点,需要掌握承诺和威胁在决策过程中的含义和作用,以此引导个体隐藏性的行为和特征,并正确分析个体理性制定符合预期结果的主导性策略。
博弈论是管理者的普遍哲学,可以应用到管理者的很多常规管理中。例如,竞争公司之间的博弈,参见斯隆商学院的“战略决定的产业经济学”课程;公司和供应商间的博弈,经理人和雇员间的博弈,参见“公司战略和广义企业”课程……此外,在谈判、国际宏观经济学、公司财务等方面都有广泛的应用。优秀管理者需要具有对互相影响的战略环境的分析和判断直觉,以及相应的思考框架。在经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理企业内部各种关系、以及在企业与政府的关系和合作等多个方面,博弈论都是企业管理者的十分有效的决策工具,并且能够为管理者提供科学的决策思路。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。