提及博弈,可能我们最熟悉的莫过于“田忌赛马”的故事,该故事可以说是博弈决策中最经典的故事之一。
博弈思想在中国起源于《孙子兵法》。虽然《孙子兵法》是军事著作,但其中蕴含着深刻的博弈思想。博弈作为一种理论——博弈论则始于1944年约翰·冯·诺依曼(John Von Neumann)和奥斯卡·摩根斯顿(Oskar Morgenstern)合著的《博弈论与经济行为》(The Theory of Games and Economic Behaviour)[2]。这部书是公认的博弈论开山之作,标志着博弈理论正式形成。实际上,在20世纪初,塞梅鲁(Zermelo)和鲍罗(Borel)已经开始研究博弈的数学表达,而诺依曼和摩根斯顿则把博弈论纳入经济学领域。
图1-11 冯·诺依曼及其简介
约翰·冯·诺依曼(1903—1957),“现代电子计算机之父”,美籍匈牙利人,经济学家、物理学家、数学家、发明家。著有《量子力学的数学基础》等。
《博弈论与经济行为》建立的合作型博弈模型,奠定了这门学科的基础。合作型博弈研究在20世纪50年代达到高峰,但因其过于抽象,应用范围受到限制。而数学家约翰·福布斯·纳什(John Forbes Nash)(见图1-12)分别在1950年、1951年发表《n人博弈的均衡点》(Equilibrium Points in N-Person Games)和《非合作博弈》(Non-Cooperative Games)两篇论文,证明市场中非合作博弈及其均衡解的存在,即“纳什均衡”(Nash equilibrium)[3]。这使博弈论研究进入了又一个新的阶段。
图1-12 约翰·纳什及其简介
约翰·纳什(1928— ),曾任普林斯顿大学数学系教授。1950年,他获美国普林斯顿高等研究院博士学位,博士论文提出“纳什均衡”的博弈理论。1994年获诺贝尔经济学奖。
1950年,美国普林斯顿大学数学家阿尔伯特·塔克(Albert Tucker)提出囚徒困境的故事来解释纳什博弈和纳什均衡,这个故事后来成为博弈论中最著名的案例之一。故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,被隔离审讯;警方分别告知嫌疑犯,如果两人都抵赖,各判刑1年;如果两人都坦白,各判8年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判10年。于是,每个囚徒都面临两种选择:坦白或抵赖。此时的情景,两人就处于一个利益博弈中(参见图1-13)。
图1-13 囚徒困境
在纳什提出博弈理论之后,塞尔顿(Reinhard Selten)发展了纳什均衡概念,定义了完全信息动态博弈的“子博弈精炼纳什均衡”(Subgame Perfect Nash Equilibrium)[4],在此基础上,进一步描述了不完全信息动态博弈的“精炼贝叶斯-纳什均衡”(Perfect Bayesian Nash Equilibrium)[5]。哈尔萨尼(John C.Harsanyi)发展了不完全信息静态博弈的“贝叶斯-纳什均衡”(Bayesian Nash Equilibrium)[6]。这两个人则共同推动了“纳什均衡”的动态化,并增加了不完全信息条件。
博弈论,英文名为Game Theory,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题[7]。用领导学的概念诠释可表述为,当一个主体——可以是领导者,也可以是被领导者——在一个组织中相互作用时作出一个行为选择,这一选择也会影响其他人的行为选择和决策的均衡。所以,从这个意义上说,博弈论也可称为“对策论”。
一般而言,博弈可分为合作博弈(Cooperative Game)和非合作博弈(Non Cooperative Game)。合作博弈与非合作博弈的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协定(Binding Agreement)。如果有,就是合作博弈;反之,则是非合作博弈。合作博弈强调的是团体理性(Collective Rationality),强调的是效率(Efficiency)、公正(Fairness)和公平(Equality)。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。但是,对一个组织而言,非合作博弈对实现组织的愿景、目标等工作是有害的,是不利的。
在博弈论中有一个著名的案例就是斗鸡博弈,两只公鸡狭路相逢,即将展开一场厮杀(参见图1-14)。结果有四种可能:第一,两只公鸡对峙,谁也不让。第二,两者相斗,两败俱伤。另外两种可能是一退一进。但是,退者有损面子,具体谁退谁进就看哪只公鸡愿意让步或者接受面子的损失了。在斗鸡博弈中,前两种结果都是非合作博弈,对双方都没有利益,后两种只对其中一方有益,有没有更好的解决办法呢?
图1-14 斗鸡博弈
合作博弈是研究人们达成合作协议时,如何分配得到的收益问题,即收益分配问题。非合作博弈是研究人们在利益相互影响的局势中,如何做出决策使自己的收益最大,即策略选择问题。
关于策略选择的问题,我国民间流传着一个有关博弈的小故事。一天,山谷中大雾弥漫,有个聪明的小孩要出山走亲戚,出山的道路上有一条较长的独木桥,雾很大看不到对面是否有人过来。这个小孩快到中间的时候,在独木桥上遇到了一个挑着扁担的卖货郎,独木桥只能容许一个人过。两个人都不愿退回去,因为独木桥也挺长。经过短暂的思考,最终这个聪明的孩子想出了一个办法,让两人不用退回去也能过桥。这个小孩的办法就是,他坐在卖货郎的一个筐子里,让卖货郎担着他转个身再放下,这样双方都可以继续前行而不用退回去了。这个小故事的结果就是参与博弈的双方达成合作博弈的案例。
故事中,小孩和卖货郎顺利通过独木桥可以说是达成合作博弈的一个双赢结果,其实还有三种可能的结果:第一,非合作博弈,双方坚持不让,僵持不下,谁也过不去。第二,零和博弈,这种情况很可能在非合作博弈之后发生,在僵持不下的情况下,如果卖货郎比较急躁,很有可能把小孩子推下桥去,这样产生的结果是一种零和博弈。第三,双方一方退让,让一方先过,这样总会有一方比较费时费力,可以算得上是半合作博弈。因此,最好结果是合作博弈。这个独木桥故事中所体现出的博弈现象,笔者姑且称之为独木桥博弈。
可以想象,在一个组织中出现非合作博弈或者零和博弈的现象,对于一个组织而言,是十分不利的。在市场经济中,非合作博弈等容易扰乱市场经济秩序,造成资源浪费等现象,因而,合作博弈才是各个组织应该争取达成的结果,这样对各方都有利。
合作博弈是一种理想状态,是一种愿景。非合作博弈是一种常态,更切合实际。一个组织应该追求合作博弈而不是非合作博弈,因为合作博弈更有利于实现组织的目标。在领导学研究中,价值领导的愿景应属于合作博弈的范畴,因此合作博弈在领导学中与非合作博弈一样值得研究,甚至可以说非合作博弈的目标是在领导过程中实现最大程度上的合作博弈。
非合作博弈的基本要素包括:博弈规则(包括参与人、行动和结果)、信息、战略、支付函数和均衡(参见图1-15)。用领导学的范畴来表述:
(1)参与人指的是在博弈中选择行动以最大化自己效用的决策主体(在组织中可以是领导者,也可以是被领导者,也可以是一切影响领导过程的领导要素);
(2)行动是参与人的决策变量(如P-G理论中领导者可选择的各种领导行为);
(3)战略是参与人选择行动的规则,它表明参与人在什么时候、什么条件下选择什么行动(如P-G理论中领导者根据下属特征与任务特征的不同来选择自己的行动,并选择什么时候行动);(www.daowen.com)
(4)信息是指参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识(如P-G理论中领导者必须掌握下属特征和任务特征等足够的知识才能进行正确的领导行为选择);
(5)支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西(如领导者通过博弈把更多的下属转化为内集团成员,组织目标得以高效率实现);
(6)结果是指博弈分析者感兴趣的要素的集合(如P-G理论中领导所有可供选择行为带来的所有可能的“行为-结果”集合);
(7)均衡是所有参与人的最优战略或行动的组合(在给定领导者战略的情况下,没有任何下属或其他领导要素有积极性选择其他战略,从而没有人有积极性打破这种均衡,反之亦然)。
根据这些概念,博弈的划分可以从以下两个角度来进行。第一种角度是参与人行动的先后顺序。从这一角度博弈论可划分为静态博弈论(Static Game)和动态博弈论(Dynamic Game)。第二种角度是参与人对其他参与人的特征、战略及支付函数的知识。从这一角度博弈可以划分为完全信息博弈(Perfect Information Game)和不完全信息博弈(Incomplete/Imperfect Information Game)。将上述两角度结合起来,就可得到四种不同类型的博弈,详见表1-2。
图1-15 非合作博弈的基本要素
表1-2 非合作博弈的分类及对应均衡概念
动态博弈,就是指参与博弈的参与者行动有先后顺序,后行动者可以观测到先行动者的选择,然后再做出自己的选择的博弈。静态博弈,指参与者的行动有先后顺序,但是后行动者不知道先行动者的选择,而再去作选择的博弈。
完全信息博弈是指博弈的参与者对其他参与者的特征、策略及得益函数都有精确的信息,然后再采取行动的博弈,此时就是一个完全信息博弈。不完全信息博弈是指,博弈的参与者不完全清楚参与者的信息而采取行动的博弈。比较常见的不完全信息博弈案例就是桥牌游戏。在桥牌游戏中,四人分成两组,你不知道合作伙伴手中是什么牌,也不知道竞争者手中的牌的信息,你作决策时,就必须对其余三个人的信息有一个估计。
在博弈论经济学中,“智猪博弈”的案例广为流传。
假设猪圈里有一头大猪和一头小猪,两只猪在同一个食槽里进食,并且这两头猪都是极具智慧的“智猪”。猪圈两头距离很远,一头安装了踏板,另一头是饲料的出口和食槽。踩一下踏板,就会有相当于10个单位的饲料进槽,但是踩踏板和跑到食槽处所需要消耗的能量相当于2个单位的饲料。两头猪都有两个选择:自己去踩踏板或是等待另一头猪去踩踏板。两头“智猪”的可选行动如表1-3所示。
表1-3 智猪博弈得益数据分析
假如大猪先去踩踏板,它将比小猪后到食槽,除去大猪运动消耗,双方纯得益比大猪/小猪为4∶4;假如小猪先踩踏板,它将比大猪后到食槽,吃到的饲料少,除去运动消耗,双方纯得益比大猪/小猪为9∶(-1);假如两头猪同时踩踏板,双方纯得益比大猪/小猪为5∶1;假如两头猪都选择等待,双方吃不到饲料,双方得益都为0。在这个博弈中,小猪是具有选择优势的,无论大猪是选择行动还是等待,小猪的最优选择都是等待——行动只会让它白白消耗能量。而大猪则不同,对它来说,选择行动优于等待。因此,最佳的方案是大猪行动,小猪等待(参见图1-16)。
图1-16 智猪博弈漫画
其实,员工与企业之间也是一个“智猪博弈”的过程,不过在这个博弈里,企业是“小猪”,具有选择优势,而员工是“大猪”,必须不停奔波。原因何在?
在员工与企业的博弈中,员工有两种选择:努力工作和敷衍工作。如果员工努力工作,那么企业和自己都受益;如果敷衍工作,给多少钱干多少活,久而久之,不是你选择辞职,就是企业对你不满意而辞退你,你的收益自然大受损失,就如博弈中的“大猪”,只有行动才有收益,不行动则不受益,甚至受损。
企业也有两种选择:要么主动激励员工——这样风险很大,收益可能为负数,因此,很少有企业会作出这样的决定;要么选择等待,等待员工行动,如果单个员工不主动积极工作,企业也能维持基本的运转,收益并不受损,即使员工辞职,也会立刻有人来补充这个岗位,对收益没有太大的影响。因此,企业具有选择等待的优势,相当于博弈中的“小猪”。
在员工与企业的博弈中,员工是“大猪”,企业是“小猪”,企业占据着主动优势。所以,一个聪明的员工应该选择在工作中多付出,为工作付出越多,得到的利益也越多。否则,受伤害的是员工自己。正如富兰克林所说:“你追求工作,不是工作追求你。”
“智猪博弈”中,两头“智猪”都对另外一头猪的行动空间、行动组合下的支付函数(得益函数)有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,两头猪的博弈关系会持续一个较长时期,这样形成的博弈就是完全信息动态博弈。
从博弈论视角看,领导就是一个博弈的过程。在信息不完全对称的情况下,领导者个体与一群下属个体互动博弈,以期实现领导目标的过程。这一过程的特征是动态的、不完全信息的。所以,在领导学研究中将把不完全信息动态博弈作为一个主要工具,但合作博弈却是目标。
以共同的使命与愿景为实现的目标,对LMX理论与P-G理论的博弈进行改进,探索民营企业价值观形成的路径,从而提升民营企业战略领导力。这种路径的选择在单个的民营企业中是如何展现的?生命周期理论对剖析一般意义上的民营企业战略领导力作出了理论贡献。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。