理论教育 奖励和惩罚的激励机制的基本思想!

奖励和惩罚的激励机制的基本思想!

时间:2023-04-14 理论教育 版权反馈
【摘要】:激励机制是最早提出的抑制搭便车行为的方法,此方法应用最为广泛。为了最大限度地调动协作学习者共享学习资源的积极性和建立一种公平的互相交易环境,我们引入奖励和惩罚的激励机制。奖励是最直接也最有效鼓励用户共享资源的激励机制,用户共享且被下载的资源越多、共享受欢迎的资源越多和在线提供服务时间越长,获得的奖励也就越多,表示用户为自主协作学习系统所做的贡献越大。奖励的形式可以是有形的,也可以是无形的。

奖励和惩罚的激励机制的基本思想!

激励机制(Incentive Mechanisms)是最早提出的抑制搭便车行为的方法,此方法应用最为广泛。为了最大限度地调动协作学习者共享学习资源的积极性和建立一种公平的互相交易环境,我们引入奖励和惩罚的激励机制。奖励是最直接也最有效鼓励用户共享资源的激励机制,用户共享且被下载的资源越多、共享受欢迎的资源越多和在线提供服务时间越长,获得的奖励也就越多,表示用户为自主协作学习系统所做的贡献越大。奖励的形式可以是有形的,也可以是无形的。有形的(物质上的)奖励诸如奖金、折扣费率、增值服务等;无形的奖励可以是信誉度、荣誉度、用户等级等。用户的贡献越大,其信誉也就越高,以后享受其他用户服务时优先级也就越高。相反,用户共享的资源越少而下载资源又越多,或者是共享大量没有学习价值而无用的资源,则受到的惩罚就越多。因此,我们根据每个参与节点对网络的贡献情况(称为节点的贡献值)具体对其资源传输请求和传输服务质量进行相应控制,贡献值越大节点越容易获得其他节点资源,并在同一服务节点资源有竞争的情况下享受优先的服务。贡献越小的节点,从网络中查询、下载学习资源的能力就越弱。参与节点为自主协作学习系统做出贡献(为其他节点传输自己或他人的共享文件)就会相应地提高自己的贡献值,反之,就会降低自己的贡献值。

设置节点衰减机制,即如果节点在一段时间t内没有为协作学习P2P网络做贡献或贡献很少,那么该节点的贡献值就会减少θ,t和θ值由实验及系统具体需求设定。引入衰减机制,一是为了防止贡献值“通货膨胀”,使得节点的贡献值始终能保持平稳;二是希望取得更好的激励效果,使得原先贡献值低的节点在经历一段时间后能够获得更多获取资源的机会,使那些贡献值高的节点由于长时间贡献少而丧失其累积的贡献值。(www.daowen.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈