理论教育 对策问题建模举例:9月1日2次优化

对策问题建模举例:9月1日2次优化

时间:2023-07-06 理论教育 版权反馈
【摘要】:对策问题建模主要是明确上述三个基本要素。这时A,B分别是局中人1和局中人2,他们各有两个策略,出示硬币的正面或反面。假设局中人1的命中率函数是p1,它表示当距离是x时,击中对方的概率;设局中人2在双方相距为y时开枪击中对方的概率是p2。1-p2是局中人1没有被击中的概率,按规则局中人2将继续向前走,一定被击中,这时局中人1得到的支付是1。

对策问题建模举例:9月1日2次优化

对策问题建模主要是明确上述三个基本要素。

例9.1(猜硬币游戏)两个参加者A,B各出示一枚硬币,在不让对方看见的情况下,将硬币放在桌上。若两个硬币都呈正面或都是反面,则A得1分,B付出1分;若两个硬币一正一反,则B得1分,而A付出1分。

这时A,B分别是局中人1和局中人2,他们各有两个策略,出示硬币的正面或反面。用α12分别表示局中人1出示正面和反面这两个策略;用β12分别表示局中人2出示正面和反面这两个策略,这样

当两个局中人分别从自己的策略集中选定一个策略以后,就得到一个局势。这个游戏的局势集合是

两个局中人的支付函数分别为H1和H2,是定义在局势集合上的函数,由给定的规则可得到

例9.2(两人对决问题)两个人决斗,都拿着已经装上子弹的手枪,站在相隔距离是1单位的地方,然后面对面走近(假如双方前进速度一样),在每一步他们都可以决定是否打出唯一的一发子弹。当然,离得越近,打得越准。假如其中一个开枪而未打中,按规则,他仍要继续往前走,双方各在什么时机开枪好呢?

这个对策中只有两个局中人:局中人1和局中人2。局中人1的策略是选择在双方距离为x(0≤x≤1)时开枪,所以局中人1的策略集合为S1={x|0≤x≤1}。同样,局中人2选择在双方距离为y(0≤y≤1)时开枪,则S2={y|0≤y≤1}。局势集合为

现在再来看定义在局势集合上的支付函数是什么?假设局中人1的命中率函数是p1(x),它表示当距离是x时,击中对方的概率;设局中人2在双方相距为y时开枪击中对方的概率是p2(y)。规定击中对方而自己未被击中得1分,被对方击中但自己没有击中对方得-1分,双方都没有被对方击中或者都被对方击中各得0分。以H1(x,y)表示局中人1的支付函数,则

在上式中,局中人1在双方相距为x时开枪,x>y表示局中人1先开枪。p1(x)是局中人2被击中的概率,若局中人2被击中,则局中人1得到的支付为1。1-p1(x)是局中人2没有被击中的概率,若局中人2没有被击中,则局中人1必被击中,他得到的支付是-1。所以1×p1(x)与(-1)×(1-p1(x))这两项之和是局中人1的期望支付。(www.daowen.com)

x=y是两个局中人同时开枪的情形。其中1×p1(x)(1-p2(y))表示局中人2被击中而局中人1没有被击中时,局中人1的期望支付;(-1)×(1-p1(x))p2(y)则是局中人2没有被击中而局中人1被击中时,局中人1的期望支付。两个人都击中对方或都没有被对方击中时支付为0。

x<y是局中人2先开枪的情况。p2(y)是局中人1被击中的概率,这时他得到的支付是-1。1-p2(y)是局中人1没有被击中的概率,按规则局中人2将继续向前走,一定被击中,这时局中人1得到的支付是1。所以局中人1的期望支付是(-1)×p2(y)+1×(1-p2(y))。

同样可以写出局中人2的支付函数。

例9.3(三人硬币游戏)三个人作一个游戏,每个人同时出示一个硬币的正面或反面。如果三个人出示的全是正面或反面,则三个人的支付都是0;如果有两个人出示正面,一个人出示反面,则出示反面的人扣两分,两个出示正面的人每人各得一分;如果有两个人出示反面,一个人出示正面,则出示正面的人扣两分,两个出示反面的人每人各得一分。

这是一个3人对策,局中人集合I={1,2,3},每个局中人有两个策略:出示正面或反面。如果用1代表出示正面,用0表示出示反面,那么Si={0,1}(i=1,2,3)是局中人1、局中人2、局中人3的策略集合,局势为

用H1(x1,x2,x3)表示局中人1的支付函数,则

同样可以写出局中人2、局中人3的支付函数,从而确定这个问题的对策模型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈