演化博弈策略的仿真分析优化

更新时间：2026-01-12 理论教育 版权反馈

【摘要】：DisplaySurface 界面的上半部分表示采取合作策略的学研方，下半部分为采取不合作策略的学研方。图5-14 {购买，不合作}策略运行200 轮时的情况：DisplaySurface 界面图5-14 {购买，不合作}策略运行200 轮时的情况：Graph 界面3.{购买，不合作}策略仿真结果的改进{购买，不合作}策略是物流企业种群一方获利的情况，为了实现物流企业种群和学研方种群的共赢，在表5-4 所列参数的基础上进行改进。

1.{研发，合作}策略的仿真

两类Agent 的初始参数值满足约束条件：

表5-3 {研发，合作}策略的初始参数表

Repast 仿真平台中的参数设置界面如图5-8 所示：

（1）初始情况

如图5-8（a）中的DisplaySurface 界面：“○”代表物流企业选择研发策略；“×”代表物流企业选择购买策略。DisplaySurface 界面的上半部分表示采取合作策略的学研方，下半部分为采取不合作策略的学研方。初始情况下，物流企业种群中有的选择研发策略；有的选择购买策略，学研方有的选择合作有的选择不合作，即{研发，合作}、{研发，不合作}、{购买，合作}、{购买，不合作}这四种策略都存在，并且存在的数量相当。“○”和“×”在DisplaySurface 界面中六个区域里的分布也是很均匀的。

图5-8 {研发，合作}策略的参数设置界面

图5-8（a） {研发，合作}策略初始情况：DisplaySurface 界面

图5-8（b） {研发，合作}策略初始情况：Graph 界面

（2）第100 轮的运行情况

程序运行到第100 轮时，如图5-9（a）中的DisplaySurface 界面所示：“○”明显多于“×”；上半部分包含的物流企业多于下半部分包含的物流企业。说明选择研发的物流企业数目在增加，学研方更愿意与物流企业合作。具有学习能力的物流企业Agent 之间和学研方Agent 之间在互相学习、积累经验，修改着两类主体选择策略的偏好和每一种策略的适应度。图5-9（b）中的Graph 界面显示了物流企业选择研发和购买两种策略的变化趋势，“creat 线”代表了选择研发策略的物流企业数量随时间的变化趋势；“purchase 线”代表了选择购买策略的物流企业数量随时间的变化趋势。从中也能清晰地发现：creat 线呈上升趋势，而purchase 线呈下降趋势，两条曲线之间有明显的交互过程。

图5-9（a） {研发，合作}策略运行100 轮时的情况：DisplaySurface 界面

图5-9（b） {研发，合作}策略运行100 轮时的情况：Graph 界面

（3）第200 轮的运行情况

程序运行了200 轮之后，达到了终止条件，即所有的物流企业都选择了一种策略，所有的学研方也都选择了一种策略。图 5-10（a）中的DisplaySurface 界面中都为“○”并且“○”都在DisplaySurface 界面的上半部分，表明所有的物流企业都选择了研发策略，学研方与采取研发策略的物流企业合作，达到了{研发，合作}的稳定策略。图5-10（b）中的Graph界面显示“creat 线”已经占有绝对的优势。

图5-10（a） {研发，合作}策略运行200 轮时的情况：DisplaySurface 界面

图5-10（b） {研发，合作}策略运行200 轮时的情况：Graph 界面

2.{购买，不合作}策略的仿真

两类Agent 的初始参数值满足约束条件：

表5-4 {购买，不合作}策略的初始参数表

Repast 仿真平台中的参数设置界面如图5-11 所示：

图5-11 {购买，不合作}策略的参数设置界面

（1）初始情况

{购买，不合作}策略的初始情况如图5-12 所示，与{研发，合作}策略的初始情况类似，DisplaySurface 界面中四种策略同时存在，并且数量相当。

图5-12（a） {购买，不合作}策略初始情况：DisplaySurface 界面

图5-12（b） {购买，不合作}策略初始情况：Graph 界面

（2）第100 轮的运行情况

程序运行到100 轮时如图5-13 所示，DisplaySurface 界面中的“×”明显多于“○”，下半部分包含的物流企业多于上半部分，说明选择购买策略的物流企业数目在增加，学研方偏向于不合作。从Graph 界面中观察到：由“creat 线”代表的选择研发策略的企业数量随时间变化呈下降趋势，而由“purchase 线”代表的选择购买策略的物流企业数量随时间变化呈上升趋势。

图5-13（a） {购买，不合作}策略运行100 轮时的情况：DisplaySurface 界面

图5-13（b） {购买，不合作}策略运行100 轮时的情况：Graph 界面

（3）第200 轮的运行情况(https://www.daowen.com)

程序运行到200 轮之后，图5-14（a）中DisplaySurface 界面中都为“×”并且大部分“×”都在下半部分，表明所有的物流企业都选择了购买策略，学研方不合作，达到了{购买，不合作}的稳定策略。图5-14（b）中Graph界面中的“purchase 线”已经占有绝对的优势。注意到图的上半部分仍然有几个“×”，这是因为无论学研方合作与否，只要物流企业采取购买策略，学研方都没有收益。由第5.3 节中表5-1 物流企业与学研方博弈的支付矩阵式中也能发现，{购买，合作}与{购买，不合作}对于学研方来说收益都为0。所以有几个“×”在图的上方是很正常的。

图5-14（a） {购买，不合作}策略运行200 轮时的情况：DisplaySurface 界面

图5-14（b） {购买，不合作}策略运行200 轮时的情况：Graph 界面

3.{购买，不合作}策略仿真结果的改进

{购买，不合作}策略是物流企业种群一方获利的情况，为了实现物流企业种群和学研方种群的共赢，在表5-4 所列参数的基础上进行改进。改变学研方的技术贡献系数f，使f 由4 变为10，其他初始值不变，则参数设置界面为图5-15 所示：

图5-15 改变f 的{购买，不合作}策略的参数设置界面

改进后的运行结果在200 轮后达到了{研发，合作}的稳定策略，如图5-16 所示，技术贡献系数f 增大后，使(1 - r )× f × p ×profit- CB＞0，因此学研方采取合作策略是有利可图的。可见：即使学研方研发的初始成本 CB很大，但是只要学研方有足够的实力，对技术商业转化的贡献系数f 足够大，合作仍然是有收益的。这一仿真结果体现了参数f 的意义。

图5-16（a）改变f 的{购买，不合作}策略运行200 轮时的情况：DisplaySurface 界面

图5-16（b）改变f 的{购买，不合作}策略运行200 轮时的情况：Graph 界面

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

演化博弈策略的仿真分析优化

演化博弈仿真模型的分析介绍

演化博弈的博弈过程解析

演化博弈的博弈过程解析

矩阵博弈的纯策略分析

鲁棒优化控制策略在需求波动下的仿真分析

数值仿真分析优化

价格监督的博弈策略分析探讨

混合策略博弈的支付矩阵优化

相关推荐