理论教育 学习兴趣相似度计算及分组算法

学习兴趣相似度计算及分组算法

时间:2023-04-14 理论教育 版权反馈
【摘要】:本书采用Dice系数方法计算学习者之间学习兴趣的相似度。

学习兴趣相似度计算及分组算法

用户选择的学习内容、共享和搜索的学习资料在一定程度上代表了用户的学习兴趣,那么用户选择的学习内容、共享和搜索请求的学习资料的相互重叠数量代表用户学习兴趣的相似度。

每次学习过程中,学习者所学习的内容、共享和搜索请求的学习资料,都代表了学习者的学习兴趣,以主题或关键词形式表示并保存在个人学习日志库里,每次登录时,系统会自动从个人学习日志库里提取学习者的学习兴趣信息提交给所注册的目录服务器,即本组超级节点,再计算学习兴趣相似度并进行分组。

1. 学习兴趣相似度计算

在分组时,目录服务器计算学习者彼此间的学习兴趣的相似度,常用的相似度计算方法有内积、Dice系数、Jaccard系数和余弦系数34]。本书采用Dice系数方法计算学习者之间学习兴趣的相似度。

定义1 把学习者的学习兴趣用信息向量空间表示,设Si=(si1, si2, …, sim) 表示学习者i的学习兴趣向量,sim表示学习者的学习内容、共享和搜索资料的关键词向量,则学习者Si与Sj之间的相似度用Dice系数二值权重方案表示如下:

其中C=∣Si∩Sj∣是同时发生在学习者Si和Sj的学习兴趣中的关键词数,A=∣Si∣和B=∣Sj∣分别表示Si、Sj中的关键词数。

2. 分组算法

把学习内容和学习兴趣上相同或比较接近的学习者分为协作学习成员组,首先把学习内容相同或相似程度较高的分在一个协作学习班里,然后再根据学习者的其他学习兴趣的相似度进行协作学习小组分组。由于每个学习者登录这个自主协作学习系统的时间是随机的,那么执行分组动作的时间也不同。分组算法描述如下:

输入:经过处理后的学习者的学习兴趣信息和相似度阈值θ1和θ2(θ1>θ2),组人数m;

输出:n个协作学习组。(www.daowen.com)

(1) 如果只有一个学习者,则跳转到(6)步,否则跳转到(2)步。

(2) 根据公式(3.1)计算两两学习者学习内容的相似度,把相似度值大于θ1的学习者分在同一个协作学习班里。

(3) 如果协作学习班里只有一个学习者,则跳转到(6)步,否则跳转到(4)步。

(4) 如果协作学习班里还有未进行学习兴趣相似度计算的学习者,则选择其中一个与协作学习班里其他学习者根据公式(3.1)进行两两学习兴趣相似度计算,跳转到(5)步,否则,跳转到(9)步。

(5) 如果所有相似度值都小于θ2,则一个人为一组,跳转到(4)步,否则跳转到(6)步。

(6) 从所有相似度值大于θ2中选择最大的一个学习者作为协作学习成员,如果该组人数小于m,则加入该组,跳转到(8)步,否则跳转到(6)步。

(7) 生成一个新组,加入该组。

(8) 生成组账号,跳转到(4)步。

(9) 分组结束。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈