理论教育 规则博弈:公共池塘资源的重复性

规则博弈:公共池塘资源的重复性

时间:2023-12-03 理论教育 版权反馈
【摘要】:每次公共池塘资源需要维护时,就可能发生资源提供问题。因此,有关公共池塘资源策略性行为的理论必须考虑博弈多次发生的情况。我们用G来表示每次重复发生的博弈,G通常被称为基本博弈或一次性博弈。复杂性增加的主要根源之一是策略的数量成几何级增多。为解释这一点,我们来考察重复性博弈G除无条件t以外的其他任一策略。

规则博弈:公共池塘资源的重复性

第三节 重复性公共池塘资源博弈

前文研究的所有博弈的特点是都只进行一次。这是具有相当限制的假设。虽然与公共池塘资源有关的某些博弈确实只发生一次,但多数博弈是重复性的。例如,只要提取者返回公共池塘资源,提取的外部性就可能重复发生。每次渔民出去捕鱼,就可能发生分配问题。每次公共池塘资源需要维护时,就可能发生资源提供问题。每次有作物要浇水,就可能发生监督问题。因此,有关公共池塘资源策略性行为的理论必须考虑博弈多次发生的情况。在此,我们将考察这个理论的一些要素。[9]

重复性博弈包含多次发生的博弈。我们用G来表示每次重复发生的博弈,G通常被称为基本博弈或一次性博弈。例如,假设两个局中人将进行两次囚徒困境博弈(如图3.2)。那么,囚徒困境博弈就是G,整个博弈过程为G-G(先进行G,再重复G)。重复性博弈除了保留基本博弈中固有的全部复杂性以外,还增添了新的复杂性。

复杂性增加的主要根源之一是策略的数量成几何级增多。一个策略就是参与博弈的一个完整计划。在囚徒困境中,每个局中人有两种策略可供选择。然而,如果囚徒困境博弈发生两次,每个局中人可以选择的策略将达到32个。以局中人1为例,他必须对两次囚徒困境形成完整的计划。这个局中人必须决定在第一次博弈时做什么及第二次博弈时做什么。而第二次博弈的计划必定要考虑第一次博弈的四个偶然性结果。设s表示策略1;t表示策略2。且设(s,t)代表(局中人1进行s,局中人2进行t)。局中人1可能的计划有:

策略Ⅰ

第一轮:选择s。

第二轮:若第一轮结果是(s,s),选择s。

    若第一轮结果是(s,t),选择s。

    若第一轮结果是(t,s),选择s。

    若第一轮结果是(t,t),选择s。

因此,完整的计划必须考虑现实生活的复杂性,因为很多时候“计划赶不上变化”。[10]即使策略Ⅰ指定局中人1在第一轮进行s,但计划仍必须说明如果局中人1第一轮的计划在执行过程出现偏差的情况下应该如何选择。这就是策略Ⅰ考虑第一轮结果(t,s)与(t,t)的原因。策略Ⅰ是在进行两次囚徒困境博弈的情境中,唯一一个局中人1在所有情况下都选择s的策略。现在,在所有“选择s”的地方,我们都可以替换成“选择t”。因为有五个这样的地方,所以两次重复性博弈有25=32个不同的可能策略。这就是策略成几何级增多的含义。随着重复次数的增加,策略数的增长情况就会更严重。[11]

策略Ⅰ是无条件的策略安排。重复的情境也为有条件策略的出现提供了可能性。下面是非常著名的有条件的囚徒困境策略,俗称“以牙还牙”:

策略Ⅱ

第一轮:选择s。

第二轮:若第一轮结果是(s,s),选择s。

    若第一轮结果是(s,t),选择t。

    若第一轮结果是(t,s),选择s。

    若第一轮结果是(t,t),选择t。

策略Ⅱ始于局中人1选择s。若局中人2在第一轮中也选择s,那么在第二轮中,局中人1继续选择s;若局中人2在第一轮中选择t,那么局中人1在第二轮中也选择t。这就是“以牙还牙”策略,它与总是选择s的无条件策略完全不同。“以牙还牙”是触发策略的一个范例。所谓的触发策略,即一个局中人在基本博弈中只作出一种选择(比如说,选择s),除非另一个局中人作出了其他选择。但后者所做的其他选择将导致前者选择t而不是s。下面我们来看触发策略的另一个范例,重复性承诺博弈(图3.3c):

策略Ⅲ

第一轮:选择s。

第二轮:若第一轮结果是(s,s),选择s。

    若第一轮结果是(s,t),选择t。(www.daowen.com)

    若第一轮结果是(t,s),选择t。

    若第一轮结果是(t,t),选择t。

前面我们曾经讨论过,承诺博弈有两个纯粹策略均衡,但在(s,s)均衡点上的收益比(t,t)均衡点更好。采取触发策略Ⅲ的局中人1会一直选择s,但在发生了意外,且前一轮中没有出现好的均衡的情况下,局中人1会改变选择,于是,策略Ⅲ就转向了坏的均衡。像Ⅱ与Ⅲ这样的触发策略,对在重复性博弈中维持合作有着十分重要的作用。这是第1章中探讨过的无名氏定理的内容,有关细节讨论见J·弗里德曼1990年的著述。

尽管在重复性博弈情境中,局中人策略的复杂性有所增加,但纳什均衡的概念——即每个局中人都在对方的策略选择限定的条件下,实现了收益的最大化——仍是同样的。不过,现在箭头图表这个技术却难以再发挥作用。即使是两个局中人、两个策略、两次博弈这样最简单的博弈,要是用箭头来表示的话,也会有32×32个带箭头的矩阵!出于这个原因,我们不再使用这种通过趋向力寻找均衡的方法。相反,我们将探讨一些有用的方法,来建构以一次性博弈之均衡为基础的重复性博弈均衡。

假设一次性博弈G有唯一的均衡,(t,t)——囚徒困境就属于这种情况。建构(像策略Ⅰ那样)总是选择t的无条件策略;并把这个策略称为“无条件t”。那么这样的策略组(无条件t,无条件t)就是重复性G的均衡。为解释这一点,我们来考察重复性博弈G除无条件t以外的其他任一策略。这时会有两种情况发生:其一,从可观察到的结果来看,这个策略等同于无条件t,即它的收益与无条件t相同;其二,从可观察到的结果来看,这个策略与无条件t不同,其收益少于无条件t。由此可见,这个策略所带来的收益无论怎样都不可能好于无条件t,无条件t是能使收益最大化的策略选择。下面这个是从观察的角度来看等同于无条件t的策略:

策略Ⅳ

第一轮:选择t。

第二轮:若第一轮结果是(s,s),选择s。

    若第一轮结果是(s,t),选择s。

    若第一轮结果是(t,s),选择s。

    若第一轮结果是(t,t),选择t。

策略Ⅳ计划只要第一轮的选择结果是(t,t),局中人1就在第二轮中选择t。但是由于无条件t与策略Ⅳ在第一轮中都选择t,(t,t)会在这一轮与下一轮中都出现。因此,从观察的角度来看,两者的结果是相同的。

我们可以把上述求解重复性博弈均衡的方法用于以拥有多个均衡的一次性博弈——例如,承诺博弈和胆小鬼博弈——为基础的重复性博弈。假设(s,s)与(t,t)都是G的均衡。那么,跟上面的推导情况一样,(无条件s,无条件s)与(无条件t,无条件t)都是均衡。还有一种情况就是,重复性博弈的均衡是一次性博弈的两个均衡轮流出现。我们来考察一下下面这个策略:

策略Ⅴ

第一轮:选择t。

第二轮:若第一轮结果是(s,s),选择s。

    若第一轮结果是(s,t),选择s。

    若第一轮结果是(t,s),选择s。

    若第一轮结果是(t,t),选择s。

策略Ⅴ的计划是轮流选择两个备选方案,即在任何情况下,第一轮都选择t,第二轮都选择s。如果胆小鬼博弈中的均衡策略组(s,t)与(t,s)轮流出现的话,则可以克服我们先前提到的分配问题不对称均衡中的不对称问题。轮流策略组(策略Ⅴ,策略Ⅴ)与触发策略组(策略Ⅲ,策略Ⅲ)也都是拥有两个均衡的重复性博弈的均衡。就像重复性博弈中策略的数量会成几何级增长一样,均衡的数量也会如此。[12]

构建重复性博弈均衡时,除了使用一次性博弈均衡之外,还有其他方法。不过,这些方法因局中人的策略选择方案在有些时候不是收益最大化的,而不可避免地存在缺陷。重复性博弈求解的基本充分条件是:重复性博弈均衡总是建构在一次性博弈均衡的基础上。这个充分条件就是子博弈完美。[13]要保证有限重复博弈的均衡是子博弈完美,其中一个方法是:从后往前倒推求解博弈,即所谓的倒推法。倒推法意味着每个局中人都运用动态的安排以实现最大化。我们将在下一章及实验室实验设计与分析部分集中运用子博弈完美。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈