演化博弈论的研究对象是一个“种群”,应重点分析种群结构的变迁,而不是对单个行为个体进行效应分析。演化博弈的学习类型有两种,一种是具有快速学习能力的小群体成员之间的反复博弈,相应的动态机制称为“最优反应动态”(Best-response Dynamics)。另一种是学习速度很慢的大群体成员通过随机配对进行的反复博弈,策略调整用生物进化的“复制动态”(Replicator Dynamics)机制模拟。本小节把物流产学研合作当作一个学习的渐进演化系统,强调其动态性和宏观性,并注重研究影响系统演化过程及演化稳定性的重要因素。
在演化博弈中,最核心的概念是演化稳定策略(Evolutionary Stable Strategy,ESS)和复制动态(Replicator Dynamics)[175]。
ESS 表示一个种群抵抗变异策略侵入的一种稳定状态,其定义为:若策略s*是一个ESS,当且仅当:
(1)s*构成一个Nash 均衡(即对任意的s,有 μ(s*,s)≥μ(s, s));
(2)如果s*≠ s满足 μ(s*,s*)= μ(s*, s),则必有 μ(s*,s)>μ(s, s)。(www.daowen.com)
其中 xk为一个种群中采用策略k 的比例;μ(k s,)表示采用策略k 时的适应度; μ(s s,)表示平均适应度;k 表示不同的策略。演化博弈的博弈过程如图5-2 所示:首先对博弈方群体中的每个主体进行相关参数的初始化,然后根据一定的匹配规则,主体之间开始进行博弈;在博弈结束后,主体通过对自己的收益、对方的收益、自己的选择、对方的选择的观察,根据一定的学习算法,进行模仿学习、知识积累,找出自己下次的最优决策;最后根据一定的匹配规则再次选择对手,重复以上过程,直到整个博弈到达最终的演化均衡[176]。
图5-2 演化博弈的博弈过程
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。