理论教育 演化博弈策略的仿真分析优化

演化博弈策略的仿真分析优化

时间:2023-06-06 理论教育 版权反馈
【摘要】:DisplaySurface 界面的上半部分表示采取合作策略的学研方,下半部分为采取不合作策略的学研方。图5-14 {购买,不合作}策略运行200 轮时的情况:DisplaySurface 界面图5-14 {购买,不合作}策略运行200 轮时的情况:Graph 界面3.{购买,不合作}策略仿真结果的改进{购买,不合作}策略是物流企业种群一方获利的情况,为了实现物流企业种群和学研方种群的共赢,在表5-4 所列参数的基础上进行改进。

演化博弈策略的仿真分析优化

1.{研发,合作}策略的仿真

两类Agent 的初始参数值满足约束条件:

表5-3 {研发,合作}策略的初始参数表

Repast 仿真平台中的参数设置界面如图5-8 所示:

(1)初始情况

如图5-8(a)中的DisplaySurface 界面:“○”代表物流企业选择研发策略;“×”代表物流企业选择购买策略。DisplaySurface 界面的上半部分表示采取合作策略的学研方,下半部分为采取不合作策略的学研方。初始情况下,物流企业种群中有的选择研发策略;有的选择购买策略,学研方有的选择合作有的选择不合作,即{研发,合作}、{研发,不合作}、{购买,合作}、{购买,不合作}这四种策略都存在,并且存在的数量相当。“○”和“×”在DisplaySurface 界面中六个区域里的分布也是很均匀的。

图5-8 {研发,合作}策略的参数设置界面

图5-8(a) {研发,合作}策略初始情况:DisplaySurface 界面

图5-8(b) {研发,合作}策略初始情况:Graph 界面

(2)第100 轮的运行情况

程序运行到第100 轮时,如图5-9(a)中的DisplaySurface 界面所示:“○”明显多于“×”;上半部分包含的物流企业多于下半部分包含的物流企业。说明选择研发的物流企业数目在增加,学研方更愿意与物流企业合作。具有学习能力的物流企业Agent 之间和学研方Agent 之间在互相学习、积累经验,修改着两类主体选择策略的偏好和每一种策略的适应度。图5-9(b)中的Graph 界面显示了物流企业选择研发和购买两种策略的变化趋势,“creat 线”代表了选择研发策略的物流企业数量随时间的变化趋势;“purchase 线”代表了选择购买策略的物流企业数量随时间的变化趋势。从中也能清晰地发现:creat 线呈上升趋势,而purchase 线呈下降趋势,两条曲线之间有明显的交互过程。

图5-9(a) {研发,合作}策略运行100 轮时的情况:DisplaySurface 界面

图5-9(b) {研发,合作}策略运行100 轮时的情况:Graph 界面

(3)第200 轮的运行情况

程序运行了200 轮之后,达到了终止条件,即所有的物流企业都选择了一种策略,所有的学研方也都选择了一种策略。图 5-10(a)中的DisplaySurface 界面中都为“○”并且“○”都在DisplaySurface 界面的上半部分,表明所有的物流企业都选择了研发策略,学研方与采取研发策略的物流企业合作,达到了{研发,合作}的稳定策略。图5-10(b)中的Graph界面显示“creat 线”已经占有绝对的优势。

图5-10(a) {研发,合作}策略运行200 轮时的情况:DisplaySurface 界面

图5-10(b) {研发,合作}策略运行200 轮时的情况:Graph 界面

2.{购买,不合作}策略的仿真

两类Agent 的初始参数值满足约束条件:

表5-4 {购买,不合作}策略的初始参数表

Repast 仿真平台中的参数设置界面如图5-11 所示:

图5-11 {购买,不合作}策略的参数设置界面

(1)初始情况

{购买,不合作}策略的初始情况如图5-12 所示,与{研发,合作}策略的初始情况类似,DisplaySurface 界面中四种策略同时存在,并且数量相当。

图5-12(a) {购买,不合作}策略初始情况:DisplaySurface 界面

图5-12(b) {购买,不合作}策略初始情况:Graph 界面

(2)第100 轮的运行情况

程序运行到100 轮时如图5-13 所示,DisplaySurface 界面中的“×”明显多于“○”,下半部分包含的物流企业多于上半部分,说明选择购买策略的物流企业数目在增加,学研方偏向于不合作。从Graph 界面中观察到:由“creat 线”代表的选择研发策略的企业数量随时间变化呈下降趋势,而由“purchase 线”代表的选择购买策略的物流企业数量随时间变化呈上升趋势。

图5-13(a) {购买,不合作}策略运行100 轮时的情况:DisplaySurface 界面

图5-13(b) {购买,不合作}策略运行100 轮时的情况:Graph 界面

(3)第200 轮的运行情况(www.daowen.com)

程序运行到200 轮之后,图5-14(a)中DisplaySurface 界面中都为“×”并且大部分“×”都在下半部分,表明所有的物流企业都选择了购买策略,学研方不合作,达到了{购买,不合作}的稳定策略。图5-14(b)中Graph界面中的“purchase 线”已经占有绝对的优势。注意到图的上半部分仍然有几个“×”,这是因为无论学研方合作与否,只要物流企业采取购买策略,学研方都没有收益。由第5.3 节中表5-1 物流企业与学研方博弈的支付矩阵式中也能发现,{购买,合作}与{购买,不合作}对于学研方来说收益都为0。所以有几个“×”在图的上方是很正常的。

图5-14(a) {购买,不合作}策略运行200 轮时的情况:DisplaySurface 界面

图5-14(b) {购买,不合作}策略运行200 轮时的情况:Graph 界面

3.{购买,不合作}策略仿真结果的改进

{购买,不合作}策略是物流企业种群一方获利的情况,为了实现物流企业种群和学研方种群的共赢,在表5-4 所列参数的基础上进行改进。改变学研方的技术贡献系数f,使f 由4 变为10,其他初始值不变,则参数设置界面为图5-15 所示:

图5-15 改变f 的{购买,不合作}策略的参数设置界面

改进后的运行结果在200 轮后达到了{研发,合作}的稳定策略,如图5-16 所示,技术贡献系数f 增大后,使(1 - r )× f × p ×profit- CB>0,因此学研方采取合作策略是有利可图的。可见:即使学研方研发的初始成本 CB很大,但是只要学研方有足够的实力,对技术商业转化的贡献系数f 足够大,合作仍然是有收益的。这一仿真结果体现了参数f 的意义。

图5-16(a) 改变f 的{购买,不合作}策略运行200 轮时的情况:DisplaySurface 界面

图5-16(b) 改变f 的{购买,不合作}策略运行200 轮时的情况:Graph 界面

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈