理论教育 重复博弈:策略空间的无限可能

重复博弈:策略空间的无限可能

时间:2023-06-01 理论教育 版权反馈
【摘要】:如果两个囚徒判刑不是很重,在刑满释放之后又作案,作案之后又判刑,释放之后再作案再判刑,如此反复,他们之间进行的就是重复博弈。所以重复博弈中每一个参与人的策略空间远远超过了每一次博弈的策略空间,策略组合的数量当然会更多。这是在一次博弈中不可能得到的,这正是分析重复博弈的意义所在。在有限次重复博弈中,“不合作”是不可置信的。

重复博弈:策略空间的无限可能

重复博弈(repeated games)是指同样结构的博弈重复多次。如果博弈只是进行了一次,参与人只会关心一次性支付;但如果博弈重复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。

1.重复博弈的基本思想

重复博弈模型抓住了参与人会考虑自己当前的行动会影响其他参与人将来的行动这一思想,考察参与人之间长期相互关系。以囚徒困境的博弈为例,该博弈的唯一的纳什均衡是(坦白,坦白)。对两个囚徒来说,选择“坦白”要严格优于选择“抵赖”,尽管他们都选择“抵赖”时结果对他们会更好。在重复博弈理论背后的主要思想是:如果每个囚徒都相信做出“抵赖”的选择在长期内得到的利益将超过他短期内的损失,那么博弈被重复进行时,他们共同想要的结果(抵赖,抵赖)将会出现。

如果两个囚徒判刑不是很重,在刑满释放之后又作案,作案之后又判刑,释放之后再作案再判刑,如此反复,他们之间进行的就是重复博弈。在重复博弈中需要指出的是:每一次的博弈不会改变下一次博弈的结构;所有参与人都观测到博弈过去的历史(如两个囚徒都知道同伙在过去的每次博弈中选择了坦白还是抵赖)。重复博弈中,参与人可能同时行动(如囚徒困境),也可能先后行动(如市场进入博弈)。在后一种情况下,每一次博弈本身就是一个动态博弈。

因为一个参与人可以观测到其他所有参与人过去的历史,所以他在每一次博弈中的选择将会受到其他参与人过去行动的影响。例如,两个囚徒可能都会想到:如果同伙这次选择了抵赖,我下次也将选择抵赖。所以重复博弈中每一个参与人的策略空间远远超过了每一次博弈的策略空间,策略组合的数量当然会更多。在这种情况下,重复博弈就带来了一些“额外”的均衡结果,比如,两个囚徒选择了策略组合(抵赖,抵赖)。这是在一次博弈中不可能得到的,这正是分析重复博弈的意义所在。(www.daowen.com)

2.连锁店悖论

通过前面对图9-5中市场进入博弈的分析可以看到,在一次博弈中,如果进入者先行动,这个博弈唯一的子博弈完全纳什均衡的结果是:(进入,合作)。假设同样的市场有20个(可以理解企业A有20个连锁店),企业B每次只能进入一个市场(连锁店),就成为20次重复博弈。在这个博弈中,企业A选择“不合作”的唯一原因是这一选择能够起到威慑作用,使企业B不敢进入。然而,结果会是这样吗?

在有限次(这里是20次)重复博弈中,“不合作”是不可置信的。设想前19个市场已被企业B进入,企业B下一步要进入第20个市场。因为这是最后一个市场,对于企业A而言,这与第一次博弈没什么区别,选择“合作”是最优策略,企业B自然选择进入。现在倒回去考虑第19个市场。因为无论企业A选择什么策略,第20个市场上的均衡结果均不会改变(因为企业B知道第20个市场上企业A会选择“合作”),企业A的最优选择仍然是“合作”。如此类推,得到的这个博弈的唯一子博弈完全纳什均衡是企业A在每个市场(连锁店)都选择合作,企业B在每个市场都选择进入,这就是所谓“连锁店悖论(chain-store paradox)”。

当然,这个重复博弈中的策略组合“企业B总是不进入,企业A总是不合作”也是一个纳什均衡,但不是子博弈精炼纳什均衡。可以说,只要博弈重复的次数是有限的,则博弈的结果就将与一次性博弈的结果相同。囚徒困境的重复博弈与此相似,只要博弈次数是有限的,两个囚徒仍然都会选择“坦白”,“总是坦白”是唯一的子博弈精炼纳什均衡。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈