理论教育 纳什均衡及其局限性在博弈理论中的应用

纳什均衡及其局限性在博弈理论中的应用

时间:2023-05-31 理论教育 版权反馈
【摘要】:所谓纳什均衡,就是指参与者此时的策略对其余参与者的策略来说都是最优,则称此时达到了纳什均衡。为了更好地解释纳什均衡理论,必须提到博弈模型中的经典——囚徒困境。但是当两个小偷都选择各自利益最大化的背叛策略时,反而达到的是都被各自关5年,谁也逃不掉的最坏结果,达到了纳什均衡。纳什均衡并不是一定利于所有人的结果,从囚徒困境可以看出,虽然每个参与者都选择利益最大化,但是结果并未达到集体利益最大化。

纳什均衡及其局限性在博弈理论中的应用

数学家约翰·纳什的一生非常传奇,在他22岁博士毕业论文中,他就提出了“纳什均衡”理论,而后的几十年,纳什均衡理论逐渐发展,成了博弈论中不可撼动的基石,也拓宽了博弈论经济学领域的应用。

2001年以纳什为原型的传记片《美丽心灵》上映,而在电影里,一场联谊舞会中,讲述了纳什均衡理论的诞生。

大家在欢笑玩闹时,略显孤僻的纳什正在一旁抱着桌子认真学习,当他抬起头看到酒吧里的场景时,在观察后陷入了凝神思考,最后带着满足的笑容说出了经典台词——亚当·斯密错了!

此时舞会中共有5位男生和5位女生。这5位男生都抱着脱单的目的而来,他们每个人都想要追求5位女生中最漂亮的那位,但是这位最漂亮的女生在收到5位男生的追求时,不愿意伤害每一位男生以及其余的4位女生,所以选择了拒绝。这5位男生遭到拒绝后,转头向剩下的女生表白,而剩下的4位女生受到打击,也会选择拒绝。最终,5位男生谁也没能脱单。但我们预期的最好结果应当是,5位男生和5位女生成功配对,都能脱单。

亚当·斯密在《国富论》中认为“个人利益最大化一定会导致集体利益最大化”,而在这个例子中,纳什发现,每位男生的选择都是追求最漂亮的那位女生,即利益最大化,但是最终的结果却没有达到我们预期的全部配对的最好结果,由此否定了亚当·斯密的结论,研究后提出了纳什均衡理论。

这个男女生配对的案例看似与经济学或者博弈模型相差甚远,其实这个理论类似于学生在选择学校时的配对,如果每个学生都选择最优秀的学校,就会导致除了最优秀的学生外,其余学生都没有学校可选择,所以在录取时我们采用志愿填报等各种策略手段来避免这个问题。

所谓纳什均衡,就是指参与者此时的策略对其余参与者的策略来说都是最优,则称此时达到了纳什均衡。

为了更好地解释纳什均衡理论,必须提到博弈模型中的经典——囚徒困境。

此时有两个小偷A和B因联合入室抢劫并杀人被警察认定为嫌疑犯,但警方手上没有掌握犯罪证据。所以将两人隔离,分别关在两个不同房间进行单独审讯。为了使小偷们承认自己的罪行,警方给出了一个巧妙的策略:

1.如果两人沉默不认罪(即合作),则警方没有证据,两人因入室抢劫各判刑1年;

2.如果一人认罪(背叛),而另一人沉默不认罪,则背叛者算戴罪立功,可以立即释放,不认罪者单独被判刑10年;(www.daowen.com)

3.如果两人都认罪,则警方掌握口供,两人罪证确凿,各判刑5年。

表4-2 囚徒困境的收益矩阵

表4-2为囚徒困境的收益矩阵,其中,-n表示被判刑的年份,矩阵每个位置的数组表示二人所做的决定,例如(-1,-1)表示两人都被判刑1年。

对于两名罪犯而言,最好的策略是2人都沉默不认罪,则各自关1年就可以释放。但是假设中提到两人隔离在不同房间,无法沟通,也无法交换信息,而两名罪犯都会怀疑对方是否会背叛自己,即理性人和利益最大化的假设。那么两人都会经过同样的一个思维过程:

如果对方沉默不认罪时,假如我背叛,则立即释放,假如我也沉默,各自关一年,那么对我而言利益最大化的选择是背叛;如果对方背叛时,假如我背叛,各自关5年,假如我沉默,则我一个人关10年,对我而言利益最大化的决策还是背叛。

所以无论哪种情形,我选择背叛一定是利益最大化的决策。

但是当两个小偷都选择各自利益最大化的背叛策略时,反而达到的是都被各自关5年,谁也逃不掉的最坏结果,达到了纳什均衡。

也就是说,虽然两人都做出了利益最大化的选择,但是对于整体而言,利益反而受损了。即个人利益最大化,并不能保证集体利益最大化,利己不利人。

借助囚徒困境,我们也了解了纳什均衡的基本过程,即参与者选定策略后,其他参与者也选定策略,且每一个参与者都不再更改策略,此时的策略组合即为纳什均衡。纳什均衡并不是一定利于所有人的结果,从囚徒困境可以看出,虽然每个参与者都选择利益最大化,但是结果并未达到集体利益最大化。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈