实验数据为勾正数据OTT平台2019年6月的用户直点播数据集,隐式评分方式使用公式(14)计算。基础算法为基于用户的协同过滤与基于项目的协同过滤,计算在不同K值下各数据集所产生的推荐准确率、召回率、覆盖率以及流行度。为衡量基于智能大屏平台的推荐方法的推荐效果,在推荐效果分析中引入MovieLens数据集的协同过滤推荐结果。MovieLens数据集是公开的电影与用户评分数据集,可以使用此数据集通过离线实验测评基础算法的推荐效果,此数据集的评分方式为显式用户评分。
(一)基于用户的协同过滤
基于用户的协同过滤方式下,分别取K=5、10、20、40,使用显式评分方式的MovieLens数据集和隐式评分方式的OTT数据集进行对比实验,得到的实验结果数据如表41、表42以及变化趋势对比如图43、图44、图45、图46:
表41 MovieLens数据集显式评分方式使用用户协同过滤评价结果
表42 OTT数据集隐式评分方式使用用户协同过滤算法评价结果
准确率:与显式评分方式相比,隐式评分方式在K值较小时推荐的准确率较低,但随着K值增大,准确率能够超过显式评分方式。因此,隐式评分方式在此条件下随着K值增大能够获得更好的准确性。
图43 用户协同过滤下显隐式评分准确率随K值变化
召回率:显式评分方式与隐式评分方式的召回率均随着K值的增大而缓慢增加,但可以看出隐式评分方式的召回率始终低于显式评分方式的召回率。
图44 用户协同过滤下显隐式评分召回率随K值变化
覆盖率:隐式评分方式的覆盖率能达到90%以上,明显高于显式评分数据集所得到的覆盖率。并且随着K值的增加,覆盖率下降的幅度也更小,覆盖率能够维持在较高的数值上。
图45 用户协同过滤下显隐式评分覆盖率随K值变化
流行度:两种方式的流行度均随着K值的增大而增加,且变化幅度较小。
图46 用户协同过滤下显隐式评分流行度随K值变化
通过对比可以看出,基于用户的协同过滤算法中,随着K的增加各指标的增减趋势相同,并且指标实际数值相差不大。这说明隐式评分获取模型在基于用户的协同过滤算法中确实能够代替显式评分获得较好的推荐效果。同时,随着K值持续增大,隐式评分的准确率比显式评分更高,说明隐式评分方式随着K值的增大,准确率的提升更明显。同时隐式评分方式比显式评分的覆盖率更高且变化幅度更稳定,流行度也一直比显式评分方式更低,在平台资源利用方面效果更好。(www.daowen.com)
(二)基于项目的协同过滤
在基于项目的协同过滤方式下,分别取K=5、10、20、40,使用显式评分方式的MovieLens数据集和隐式评分方式的OTT数据集进行对比实验,得到的实验结果数据表以及变化趋势对比折线图如图47:
表43 MovieLens数据集显式评分方式使用项目协同过滤算法评价结果
表44 OTT数据集隐式评分方式使用项目协同过滤算法评价结果
准确率:显式评分方式与隐式评分方式的准确率随着K值的增加变化幅度较小,并呈现先增后减的趋势。在K值不同的情况下,隐式评分方式的准确率均明显高于显式评分的准确率。
图47 项目协同过滤下显隐式评分准确率随K值变化
召回率:显式评分方式与隐式评分方式的召回率随着K值的增加变化幅度同样较小,且呈现先增后减的趋势,但隐式评分方式的召回率始终低于显式评分方式的召回率。
图48 项目协同过滤下显隐式评分召回率随K值变化
覆盖率:隐式评分方式的覆盖率随着K值的增大呈现出先略微增长而后下降的趋势;显式评分方式的覆盖率随着K值的增大持续缓慢下降。可以看出,隐式评分方式在覆盖率的表现上明显高于显式评分方式。
图49 项目协同过滤下显隐式评分覆盖率随K值变化
图50 项目协同过滤下显隐式评分流行度随K值变化
流行度:两种方式的流行度均随着K值的增大而增加,隐式评分方式流行度的增长幅度更大。
通过对比可以看出,基于项目的协同过滤算法中,随着K值的增加各指标的增减趋势基本相同,并且在准确率和覆盖率两项指标中,隐式评分推荐结果更好。这说明隐式评分获取模型在基于项目的协同过滤算法中也能够代替显式评分获得较好的推荐效果,并且隐式评分方式通过高覆盖率能够更好地利用平台的节目资源。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。