理论教育 如何评价推荐系统的表现:用户态度统计分析

如何评价推荐系统的表现:用户态度统计分析

时间:2023-05-25 理论教育 版权反馈
【摘要】:图7-2邻居数量对F1值的影响通过用户综合评价引入推荐用户,将使推荐质量得到大幅度提高,然而它对构成F1值的查准率和查全率会产生不同的影响。采用回归分析方法对得到的Ke,Kt,Ks展开描述性统计分析,此三类用户态度的描述性统计分析值详见表7-2。表7-2用户的Ke,Kt,Ks值描述统计表由表7-2可知,用户对Ke这一指标的态度最强烈,即对专家型用户更依赖。

如何评价推荐系统的表现:用户态度统计分析

为验证相关算法的有效性和可信性,本研究主要通过准确性测量以及比对行为研究结果等两个方面进行检验。

1.有效性验证

本节主要采取标准F1方法来测量推荐结果,此方法很好地结合了查准率(Precision Ratio)与查全率(Recall Ratio)两种测量方法,具体见公式(7-16)。

在公式(7-16)中,查全率为,查准率是,其中,top-N为推荐结果集,test为测试数据集,为系统正确推荐结果数量。因推荐准确性在较大程度上受邻居数量影响,所以先针对因邻居数量不同对MU-based CF算法及User-based CF算法推荐效果的影响进行对比分析,具体如图7-2所示。

图7-2 邻居数量对F1值的影响

通过用户综合评价引入推荐用户,将使推荐质量得到大幅度提高,然而它对构成F1值的查准率和查全率会产生不同的影响。采用回归分析方法对得到的Ke,Kt,Ks展开描述性统计分析,此三类用户态度的描述性统计分析值详见表7-2。

表7-2 用户的Ke,Kt,Ks值描述统计表

由表7-2可知,用户对Ke这一指标的态度最强烈,即对专家型用户更依赖。与此同时,用户会慎重、精心选择产品,这契合了本研究数据集的特征。在商品种类里,大多为搜索型产品。

所以,由查全率与查准率的变化趋势对本研究阐述的推荐方法进行对比可以清楚地看道,因目标用户对专家用户的依赖程度较大,从而造成邻居专家值在算法获取的最相似邻居集合内占比较大,因而受不断增加的邻居数量影响使得查准率快速趋于极值;然而邻居相似值具有相对较低的权重,从而在不断增加邻居数量的情况下查全率保持较慢的速度增长至极值。因此,得出的结果能够契合数据集内用户的态度特征,如图7-3所示。

(www.daowen.com)

图7-3 查准率与查全率变化趋势对比分析

2.可信性验证

依据Duhan et al(1997)得出的相关研究结论,用户自身获取的产品信息越全面,对专家用户(对商品熟悉程度或专业程度较高的用户)的依赖度就越低。本研究也是立足某一具体领域的用户预测准确性与活跃度所拥有的众多数据来进行专家值的抽取,所以,这里的专家定义基本近似于行为研究领域的范畴

首先,针对Ke,Kt,Ks的全部用户属性值采用K-means方法开展聚类分析。经多次测试发现,聚类数量4具有较好效果。再用方差齐性LSD方法作为工具对类与类之间进行两两比对,发现,它们在水平0.01上是显著的,其聚类结果如表7-3所示。

表7-3 用户态度 K-means 聚类表

聚类所采用的数据均为已标准化的数据,由F值能够看出,K值会在较大程度上影响聚类。所以,先依Ke值的降序对各类用户进行排序:Cluster 1→Cluster 4→Cluster 3→Cluster 2;然后以专家值的升序对各类用户的描述性值的均值进行排序:Cluster 1→Cluster 4→Cluster 3→Cluster 2,得出的结果与统计分析得出的结果相契合,从而验证了该算法的可信性。若用户自身为专家用户,那么其对专家用户有极小的依赖,具体如表7-4所示。

表7-4 专家值在不同类别中的统计描述

在不同的推荐环境下,用户在新颖性、可信性和准确性上具有不同的依赖程度。对接受推荐结果只付出较低成本的情况来讲,用户可能较为看重新颖性,如音乐鉴赏、电影推荐等;对接受推荐结果需付出较高成本或推荐结果为体验型产品或服务时,用户更关注可信性和准确性,特别是定价高的消费品。

基于实际数据进行全面分析可知,本研究中叙述的方法能够有效提升推荐质量。数据集相关特性研究表明,消费者对专家型用户更为依赖,因此,专家型用户在目标用户的最有价值邻居集合内所占比重越大,算法查准率的提高越快;所占比重越小,查准率的提高越慢。

本研究在B2C环境下对电子类产品所做的研究,只是在算法的通用性和推荐性方面利用相关数据进行更为全面的验证,而就用户对商品排序的接受度及评分预测的准确性方面并未开展实验验证。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈