理论教育 形式模型在规则、博弈与公共池塘资源中的应用

形式模型在规则、博弈与公共池塘资源中的应用

时间:2023-12-03 理论教育 版权反馈
【摘要】:第一节形式模型的使用建立形式博弈是分析行动情境的方法。用博弈论的语言来讲,两个局中人占有同样的一个位置。若局中人1选择策略1,局中人2也选择策略1,那么结果是与第一行和第一列同时对应的单元格,即矩阵左上角的单元格。结果本身就是矩阵的四个单元格的内容。要素体现为矩阵的四个单元格中四个可能的结果。具有这样性质的一组策略被称为纳什均衡。一种论点建立在理性预期的基础上。设想博弈论预测不会有均衡发生。

形式模型在规则、博弈与公共池塘资源中的应用

第一节 形式模型的使用

建立形式博弈是分析行动情境的方法。行动情境的七个组成要素也是每个博弈的基本要素:(1)局中人;(2)位置;(3)每个位置在决策节点上可能的行动选择;(4)把局中人的选择对应于中间或最终结果的决策函数;(5)结果;(6)在决策节点上可用的信息;(7)以行动与结果的成本与收益为基础的收益关系。我们先探讨简单的两人博弈,来说明公共池塘资源博弈何以会出现极其不同的策略后果。

图3.1显示了最简单的博弈情境。图中包含上述所有要素。有两个局中人,即局中人1与局中人2,这是要素(1)一组局中人。用博弈论的语言来讲,两个局中人占有同样的一个位置。每个局中人总是与另一个局中人同时、但独立地作出单一决策。因此,要素(2)只有一个位置。一个局中人只能采取策略1与策略2两个可能行动的其中一个。在图3.1的博弈矩阵中,矩阵的两行为局中人1的选择,矩阵的两列为局中人2的选择。因此,要素(3)可能的行动选择是策略1与策略2。矩阵结构本身显示的就是结果函数。若局中人1选择策略1,局中人2也选择策略1,那么结果是与第一行和第一列同时对应的单元格,即矩阵左上角的单元格。矩阵的四个单元格就代表了整个结果函数,即要素(4)。结果本身就是矩阵的四个单元格的内容。每个单元格都有不同的结果。每个结果由一对数字构成,即单元格左上角的数字(对应局中人1)与右下角的数字(对应局中人2)。例如,如果两个局中人都选择策略1,那么结果是(a,a),前一个a为局中人1的结果,后一个a为局中人2的结果。如果局中人1选择策略1而局中人2选择策略2,那么结果是(b,c),b是局中人1的结果,c是局中人2的结果。要素(5)体现为矩阵的四个单元格中四个可能的结果。每个局中人可用的所有信息也包含在图3.1中。博弈矩阵及其标签的内容构成了决策可用的信息(6)。矩阵中的字母a、b、c、d代表着在博弈结束后局中人可获得的数量不同的现金或其他有价值的收益。[1]要素(7)收益关系就反映在这些数字里。

图3.1中每个局中人面对的决策任务是对策略进行选择:策略1或策略2。这是一个非常复杂的决策。它不仅取决于收益关系数值a、b、c、d,而且取决于另一个局中人的选择。为解释其复杂性,我们来详细考察当收益关系满足特定条件时,局中人所面临的选择。假定收益关系参数满足下列不等式:b<d,c>a。局中人1必须考虑局中人2可能采取的所有行动。设想局中人1首先考虑在局中人2选择策略1时的后果,那么列1是唯一与局中人1的选择相关的列。既然c>a,那么局中人1选择策略2要比选择策略1赚钱更多。我们在图3.2中沿着矩阵左边从上到下画出箭头表示这个结论:即如果局中人2选择策略1,那么局中人1的最佳回应是选择策略2。接着,设想局中人1考虑在局中人2选择策略2时自己会面临的后果。既然d>b,那么局中人1选择策略2比选择策略1能获得更多的收益。我们在图3.2中沿着矩阵右边从上到下画出箭头表示这个结论。现在两个箭头都朝下,这意味着,在我们所考察的这个博弈中,无论局中人2作出何种选择,局中人1都会作出同样的选择:策略2。因此,在这个具体的案例中,局中人1的选择一点都不难。

img8

图3.1 两个局中人、两个策略的博弈

现在我们以同样的推理分析局中人2。设想局中人2首先考虑在局中人1选择策略1时自己将面临的后果,那么矩阵的第一行是唯一与局中人2的选择相关的行。既然c>a,那么局中人2选择策略2比选择策略1得到的钱更多。我们在矩阵上端从左到右画出箭头表示这个结论。再设想局中人2考虑在局中人1选择策略2时自己将面临的后果。既然d>b,局中人2选择策略2要比选择策略1获得更多的收益。我们用矩阵下端从左到右的箭头表示这个结论。局中人2的两个箭头都指向相同的方向。因此局中人2的选择也是很清楚的:无论局中人1作出何种选择,局中人2的选择都是策略2。

img9

图3.2 囚徒困境,(a<c,b<d)

我们现在已经为图3.2的博弈找出了解。两个局中人的箭头同时指的方向构成的是一个结果,即每个局中人都选择策略2。在这个结果上,每个局中人的收益值都是d。这个结果具有一个非常特殊的性质:即每个局中人都在对方的策略选择限定的条件下,实现了收益的最大化。具有这样性质的一组策略被称为纳什均衡。纳什均衡是一组策略成为博弈解的必要条件。[2](www.daowen.com)

为确定哪组策略是纳什均衡或者不是,我们要确定局中人1与局中人2箭头指向的那对策略。图3.2的博弈相当特殊,因为它只有一个纳什均衡。虽然每个有限博弈必然至少有一个纳什均衡,但通常情况是,存在更多的纳什均衡。为解释这一点,我们来考察图3.3,它比图3.2更具有一般性。图3.3根据收益关系参数的两两比较——即a是小于还是大于c,d是小于还是大于b,界定了四种基本情况,左上角的图3.3Ⅰ反映的就是我们刚才已经考察过的情况。与之相对应的情况则是右下角的图3.3Ⅳ,同样也只有一个均衡。图3.3Ⅱ与3.3Ⅲ则有多个均衡。[3]下面,我们将简要解释这四种情况与公共池塘资源的相关性。

img10

图3.3 以收益关系多可能性为基础的箭头图表

我们的目的是解释各类公共池塘资源行动情境中的行为。博弈论按照追求收益最大化的纳什均衡来加以解释。[4]因为纳什均衡包含最大化,所以它体现了新古典经济学最基本的理性假设。除了借助新古典经济学的原理以外,还有其他两种论点适用于纳什均衡。一种论点建立在理性预期的基础上。如果每个局中人预期特定的均衡,那么其最大化行为将确实导致同样的均衡,而且能实现预期(见McGinnis and Williams,1989,1991;Wiliams and McGinnis,1988)。另一种论点属于元理论。设想博弈论预测不会有均衡发生。如果接受这个预测,并假设每个局中人都在按照这样的预测进行博弈。这样,至少会有一个局中人没有使自己的收益最大化。如果有局中人有意要违背理论,理论便会失效。

我们要首先解释与策略有关的一组词汇(像任何技术语言一样),之后才能更好地运用分析性工具。它们包含具有相对关系的两组形容词:纯粹/混合、对称/不对称。纯粹策略是不涉及概率的策略。纯粹策略均衡是每个局中人都采取纯粹策略的均衡。图3.2中的博弈均衡即纯粹策略均衡。纯粹策略的特例是支配策略。所谓的支配策略,即局中人受到的激励是不管其他局中人作出何种选择,自己都会选择的策略。图3.2中的博弈,策略2对于每个局中人而言,都属于支配策略。

混合策略是涉及概率的策略。混合策略要求局中人按照决定预期收益关系的概率分布来选择自己的行动。混合策略均衡是每位局中人都采取混合策略的均衡。我们在后面讨论分配博弈与监督博弈时会举例说明混合策略均衡。对称均衡是每个局中人都选择相同策略的均衡。图3.2中的博弈均衡就是对称的。不对称均衡是至少有两个局中人选择不同策略的均衡。我们也会在后面讨论分配博弈与监督博弈时对不对称均衡进行举例说明。

很多博弈都有适当的名称。例如,图3.2中的博弈,如果再加上一个收益关系参数为a>d的条件,就被称为是囚徒困境。囚徒困境或许是最著名的两人博弈,其中每个人有两个策略。如我们所见,这个博弈有独特的纳什均衡。所谓的困境就在于,均衡结果上的收益关系不是理想结果。因为a>d,所以,两位局中人选择策略2的结果绝对次于都选择策略1时的结果。此类情境被称为帕累托无效率,因为,两个局中人的处境原本可以更好些。帕累托标准代表的是集体理性。“看不见的手”的信奉者断言,个人理性与集体理性之间不存在冲突。囚徒困境正好是这一信仰的反例。

公共池塘资源问题通常被等同于囚徒困境,但这是误导。一方面,从图3.3可以看出,与囚徒困境有关的箭头模式非常特殊。没有什么理论能够必然推导出:任何博弈都是囚徒困境。从经验的角度来说,公共池塘资源困境中有很多子问题可能存在着上述激励结构(见Dasgupta and Heal,1979; Dawes,1973;R.Hardin,1982)。另一方面,并非所有公共池塘资源困境产生的次优结果,都因为具有与囚徒困境一样的激励结构。仍然假设a>d,胆小鬼博弈与承诺博弈也会出现在许多公共池塘资源问题之中(见Taylor,1987)。若收益关系参数满足不等式c>a与b>d,那么博弈就形成胆小鬼博弈的结局(见图3.3Ⅱ)。另外,若收益关系参数满足a>c与d>b,博弈结果就是承诺博弈(见图3.3Ⅲ)。胆小鬼博弈的收益关系结构与策略,可使单个局中人不再采取支配策略。胆小鬼博弈有多个均衡。我们将在后文说明可能形成胆小鬼博弈的分配问题。承诺博弈可代表许多公共池塘资源情境,在这些情境下,个人的贡献不足以获得集体收益,但两个人的贡献将会带来共同收益。因此,如果并且只要另外一个局中人也为集体收益做贡献时,两个局中人就都会愿意选择为提供集体收益做贡献的策略。我们在后面将分析可能形成承诺博弈的提供问题。同胆小鬼博弈一样,承诺博弈也有多个均衡。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈