理论教育 矩阵博弈的纯策略分析

矩阵博弈的纯策略分析

时间:2023-06-01 理论教育 版权反馈
【摘要】:矩阵博弈模型给定后,接下来对各局中人而言就是如何选取对自己最有利的策略,即求解问题。首先给出求解矩阵博弈最优纯策略的基本假设。 设有一矩阵博弈G={S1,S2,A},其中由A可以看出,局中人Ⅰ的最大赢得是12,要想得到这个赢得,他就得选择纯策略α3。 设G={S1,S2,A}为一矩阵博弈,其中:S1={α1,α2,…由例10.3和10.4可知,一般博弈的解不一定是唯一的,当解不唯一时,解之间的关系具有下面两条性质:性质1:无差别性。

矩阵博弈的纯策略分析

矩阵博弈模型给定后,接下来对各局中人而言就是如何选取对自己最有利的策略,即求解问题。首先给出求解矩阵博弈最优纯策略的基本假设。

求解矩阵博弈最优纯策略的假设如下:

1)每个局中人对双方拥有的全部策略及当各自采取某一策略时的相互损失有充分了解。

2)对策的双方是理智的,他们参与对策的目的是力图扩大自己的收益,因而总是采取对自己有利的策略。

3)双方在相互保密的情况下选择自己的策略,并不允许存在任何协议。

下面用一个例子来分析各局中人应如何选择最有利策略。

【例10.2】 设有一矩阵博弈G={S1S2A},其中

978-7-111-46552-2-Chapter10-8.jpg

由A可以看出,局中人Ⅰ的最大赢得是12,要想得到这个赢得,他就得选择纯策略α3。由于假定局中人Ⅱ也是理智的竞争者,他考虑到局中人Ⅰ打算出α3的心理,准备以β3对付之,使局中人Ⅰ不但得不到12,反而失掉3。局中人Ⅰ当然也会猜到局中人Ⅱ的心理,故而出α1来对付,使局中人Ⅱ得不到3,反而失掉9……所以,如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方必然会设法使自己所得最少这一点,就应该从各自可能出现的最不利的情形中选择一个最有利的情形作为决策的依据,这就是所谓的“理智行为”,也就是双方实际上可以接受的稳妥方案。

在本例中,局中人Ⅰ在各纯策略下可能得到的最少赢得分别为:-6、3、-3、-5,其中最好的结果是3。因此,无论局中人Ⅱ选择什么样的纯策略,局中人Ⅰ只要以α2参加博弈,就能保证其赢得不少于3。同理,对局中人Ⅱ来说,各纯策略可能带来的最不利的结果是:12、3、9,其中最好的也是3,即局中人Ⅱ只要选择纯策略β2,无论对方采取什么纯策略,他的损失值都不会超过3,而选择任何其他的纯策略都有可能使自己的损失值超过3。上述分析表明,局中人Ⅰ和Ⅱ的“理智行为”分别是选择纯策略α2和β2,这时,局中人Ⅰ的赢得值和局中人Ⅱ的损失值的绝对值相等,局中人Ⅰ得到了其预期的最少赢得3,而局中人Ⅱ也不会给局中人Ⅰ带来比3更多的所得,相互的竞争使博弈出现了一个平衡局势(α2β2),这个局势就是双方均可接受的并且稳妥的结果。因此,α2和β2应分别是局中人Ⅰ和Ⅱ的最优纯策略。

这样的分析中,局中人Ⅰ是按照最小最大原则,而局中人Ⅱ是按照最大最小原则各自选取策略,所得到的(α2β2)即为该博弈的解。

【定义10.1】 设G={S1S2,A}为一矩阵博弈,其中:

S1={α1α2,…,αm},S2={β1β2,…,βn},A=(aijm×n

978-7-111-46552-2-Chapter10-9.jpg

成立,记其值为VG,则称VG为该博弈的值,对应的策略组合(αi∗,βj∗)称为纯策略意义下的平衡局势,并称αi∗和βj∗分别为局中人Ⅰ和Ⅱ的最优纯策略。

从例10.2还可以看出,矩阵A中平衡局势(α2,β2)对应的元素a22既是其所在行的最小元素,又是其所在列的最大元素,即有

ai2≤a22≤a2ji=1,2,3,4 j=1,2,3,4

将此结论推广,可以得到如下定理:

【定理10.1】 矩阵博弈G={S1,S2,A},在纯策略意义下有解的充要条件是:存在策略组合(αi∗,βj∗),使得对一切i=1,2,…,m;j=1,2,…,n,均有:

aij∗≤aij∗≤aij (10-2)对任意矩阵A,这里使式(10-2)成立的元素αij∗称为矩阵A的鞍点。

定理10.1中式(10-2)的博弈意义是:一个平衡局势(αi∗,βj∗)应具有这样的性质:当局中人Ⅰ选择了纯策略αi∗后,局中人Ⅱ为了使其所失最少,只能选择纯策略βj∗,否则就可能失去更多;反之,当局中人Ⅱ选择了纯策略βj∗后,局中人Ⅰ为了得到最大的赢得也只能选择纯策略αi∗,否则就会赢得更少,双方的竞争在局势(αi∗,βj∗)下达到了一个平衡状态。

【例10.3】 设有矩阵博弈G={S1S2A},其中S1={α1α2α3α4},S2={β1β2β3β4},并且:

978-7-111-46552-2-Chapter10-10.jpg(www.daowen.com)

求这个矩阵博弈的解。

解 直接在赢得表上计算有:

978-7-111-46552-2-Chapter10-11.jpg

978-7-111-46552-2-Chapter10-12.jpg,所以,(α1β1)、(α1β3)、(α3β1)和(α3β3)为该矩阵博弈在纯策略意义下的解。

【例10.4】 设有矩阵博弈G={S1,S2,A},其中:

978-7-111-46552-2-Chapter10-13.jpg

求这个矩阵博弈的解。

解 直接在赢得表A上计算有

978-7-111-46552-2-Chapter10-14.jpg

978-7-111-46552-2-Chapter10-15.jpg,所以,(α1β2),(α1β4),(α4β2)和(α4β4)为该博弈的解。

由例10.3和10.4可知,一般博弈的解不一定是唯一的,当解不唯一时,解之间的关系具有下面两条性质:

性质1:无差别性。若(αi1βj1)和(αi2,βj2)是博弈G的两个解,则

978-7-111-46552-2-Chapter10-16.jpg

性质2:可交换性。若(αi1,βj1)和(αi2,βj2)是博弈G的两个解,则(αi1,βj2)和(αi2βj1)也是G的两个解。

这两条性质表明:矩阵博弈的值是唯一的,即当一个局中人选择了最优纯策略后,他的赢得值不依赖于对方的纯策略。

【例10.5】 某货运单位采购员在秋天时要决定冬季取暖用煤的采购量。已知在正常气温条件下需要煤15t,在较暖和较冷气温条件下分别需要煤10t和20t。假定冬季的煤价随天气寒冷程度而变化,在较暖、正常、较冷气温条件下每吨煤的价格分别为100元、150元和200元。又设秋季时煤的价格为100元/t,在没有关于当年冬季气温情况准确预报的条件下,秋季时应采购多少吨煤能使总支出最少?

在本例中,采购员可以看成一个局中人,其有3个策略:在秋季时购买10t,15t或20t煤,分别记为α1、α2和α3。另一个局中人可以看成环境,也有3种策略:出现较暖、正常或较冷的冬季,分别记为β1β2β3

现将该单位冬季用煤的全部费用(秋季购煤费用与冬季不够时再补购的费用之和)作为采购员的赢得,得到赢得矩阵如下:

表10-2 赢得矩阵

978-7-111-46552-2-Chapter10-17.jpg

则赢得矩阵如下:

978-7-111-46552-2-Chapter10-18.jpg

978-7-111-46552-2-Chapter10-19.jpg可知该博弈的解为(α3β3),即秋季购煤20t较好。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈