理论教育 网络购物决策支持方法研究进展

网络购物决策支持方法研究进展

时间:2023-08-01 理论教育 版权反馈
【摘要】:根据中国电子商务研究中心最新的监测报告显示,2015年上半年,中国电子商务交易额7.63万亿元,同比增长30.4%,呈高度增长的态势。新兴电子商务在让用户可以随时随地享受网络购物便捷性的同时,也对用户网络购物中的许多环节提出了新的挑战。如何能够帮助消费者在面对海量信息时迅速而准确地挑选出所需商品,是新兴电子商务背景下消费者决策支持研究中的重要课题。

网络购物决策支持方法研究进展

①相关研究工作得到教育部人文社会科学重点研究基地基金(12JJD630001)和国家自然科学基金(71110107027/71490720)支持。

陈国青 王 聪

(教育部人文社会科学重点研究基地清华大学现代管理研究中心、清华大学经济管理学院)

【摘 要】随着通信技术和互联网技术的飞速发展和应用,新兴电子商务呈现出移动性、虚拟性、个性化、社会性、极端数据等鲜明特征,给消费者网络购物决策过程带来一系列崭新的挑战。面对海量的商品信息和评论信息,消费者网络购物过程中面临严重的信息过载问题,消费者在商品搜索、待选商品评估等网络购物的关键步骤中需花费更多的时间、精力,从而可能影响消费者网络购物体验。这些挑战催生着新兴电子商务背景下消费者网络购物决策支持新方法的研究。本文重点讨论我们在消费者信息搜索过程中的决策支持、消费者评论阅读过程中的决策支持等两个方面的若干研究工作,阐述面临的新问题,并提出有效的解决方法和管理策略。

【关键词】新兴电子商务 网络购物 信息搜索 评论阅读决策支持

Online Shopping Decision Support Methods in the Context of Newly-emerging E-commerce

Guoqing Chen Cong Wang

(Research Center for Contemporary Management,Key Research Institute of Humanities and Social Sciences at Universities,School of Economics and Management,Tsinghua University)

【Abstract】With the rapid development and application of telecommunication and web technologies,the newly-emerging ecommerce shows distinctive characteristics such as mobility,virtuality,personalization,socialization,extreme data etc.,giving rise to a series of new challenges for consumers online shopping processes.Facing a huge volume of product information and reviews contents online,consumers may often suffer from a serious problem of information overload,where they have to spend more time and energy in information search and product evaluation,which affects their shopping experiences.In this context,recent years have witnessed an increasing amount of explorations for new decision support methods.Concretely,this chapter describes our research efforts from two perspectives: one is decision support in the consumer information search process;the other is decision support in the consumer reviews reading process,highlighting related research issues and corresponding methods and managerial strategies.

【Keywords】newly-emerging e-commerce online shopping information search review reading decision support

1 引 言

近年来,电子商务在我国取得了巨大的发展。根据中国电子商务研究中心最新的监测报告显示,2015年上半年,中国电子商务交易额7.63万亿元,同比增长30.4%,呈高度增长的态势。其中移动网购交易规模达到8421亿元,依然保持快速增长的趋势[1]。随着互联网、移动通信技术、云计算、大数据等新型计算模式,社会化网络应用的迅猛发展,新兴电子商务与传统电子商务相比,呈现出移动性(如泛在互联、移动商务)、虚拟性(如虚拟体验、赛博空间)、个性化(如精准营销、推荐服务)、社会性(如社交媒体、社会商务)、极端数据(如富媒体、大数据)等鲜明的新特征。这些新特征是技术进步和应用创新两者交错融合、螺旋式演化的结果[2]。新兴电子商务在让用户可以随时随地享受网络购物便捷性的同时,也对用户网络购物中的许多环节提出了新的挑战。电子商务情景中,消费者的网络购物决策过程包含了需求识别、信息搜寻、待选商品评估、购买和购买后评价等阶段[3][4]。在新兴电子商务背景下,规模巨大的商品信息、商品评论信息等都给消费者的信息搜寻、待选商品评估阶段带来了严重的信息过载问题[5][6]。如何能够帮助消费者在面对海量信息时迅速而准确地挑选出所需商品,是新兴电子商务背景下消费者决策支持研究中的重要课题。本文将围绕我们研究团队近年的若干相关工作进行阐述,重点研究内容以及对应的消费者网上购物决策过程环节如图1所示。

信息搜寻是消费者购物决策过程中的一个关键环节,面对海量商品时,用户难以逐一考察所有商品,而会选择通过信息搜索来对商品进行有选择性地筛选查看。研究指出,消费者在进行商品搜索时经常倾向于采用顺序搜索的方式,即按照给定的顺序每次考察一个商品,经过比较后最终选择最满意商品[7]。这种顺序搜索过程会给消费者带来成本和收益。从成本收益的角度来看,消费者希望增加信息搜索的净收益,即消费者信息搜索收益减去相应的信息搜索成本[8]。但由于消费者面临严重的信息过载问题,在实际搜索过程中,消费者难以估计考察商品的效用或者收益增量[9][10],从而难以制定合理的搜索策略。为了给消费者提供更好的服务,使消费者获得更好的搜索体验,许多网商(如Amazon、Netflix、淘宝等)开发了各种各样的消费者决策支持系统(Consumer Decision Support System,CDSS),包括价格比较引擎、搜索引擎、推荐系统等,用来帮助消费者提高信息搜索效率[11][12]。然而,这些决策支持系统能在一定程度上起到辅助消费者决策的作用,但通常难以帮助消费者预测搜索收益、制定合理的搜索停止策略。有研究表明,即便在决策支持系统的帮助下,实际中消费者也往往存在浏览“过多”或“过少”的现象[9][10]。故设计合理的商品排序方式以帮助消费者降低信息搜索中的成本、准确地估计消费者的信息搜索收益以帮助其制定合理的搜索停止策略,从而最大化消费者在信息搜寻过程中的搜索净收益,在新兴电子商务环境下具有重要的理论和现实意义。

图1 研究框架及主要研究内容

此外,待选商品评估同样也是消费者购物决策中的重要一环,消费者在进行初步信息搜索、筛选后,将部分商品加入考虑集合中(如购物车、收藏夹等)进行进一步的筛选。在进行进一步筛选过程中,消费者除会依据商品自身信息对商品进行比较外,还可以依靠其他用户产生的内容(user generated content,UGC)来进行辅助决策。在线评论作为用户产生内容的一种重要形式,为潜在消费者判断商品质量提供了宝贵的信息[13][14],消费者倾向于在购物决策过程中通过阅读在线评论来辅助其购物决策[4]。在面对海量商品评论信息时,受时间、精力所限,消费者难以阅读全部评论信息进而对商品进行选择。为帮助消费者迅速获取有用的评论信息并获取评论整体意见倾向,许多电商平台推出评论有用性投票机制并提供评论汇总信息。但目前存在的主要问题主要包括以下两个方面:①由于存在胜利者循环和早期优势偏差[15][16],平台上大多数评论无法获得足够的有用性评论;②由于评论排序不够合理,通常将表达正面观点的评论排在前面[10][17],导致消费者阅读到的评论信息与平台提供的评论汇总信息常常存在不一致性。因此,从单条评论角度研究评论有用性预测方法,对未获得足够有用性投票的评论预测其有用性;从评论集合的角度,研究评论排序方法,保证消费者阅读到的评论信息与评论汇总信息的一致性等方向在新兴电子商务背景下具有重要的研究价值。

据上所述,本文将具体讨论下列内容:围绕消费者信息搜索过程中的决策支持方法,重点介绍消费者商品考虑概率的预测方法及消费者信息搜索收益的预测方法;围绕消费者评论阅读中的决策支持方法,重点介绍单条评论角度的评论有用性预测方法及评论集合角度的评论一致性排序方法。

2 消费者信息搜索过程中的决策支持

Simon 指出,几乎所有的问题解决和决策行为都依赖于信息搜索[18]。消费者网上购物活动作为一种决策行为同样离不开信息搜索。消费者信息搜索(consumer information search,CIS)是指消费者在购物过程中为了作出满意的决定而收集相关信息,获取有用资料的过程[19]。从成本收益角度来看,消费者希望增加信息搜索的净收益(即消费者信息搜索收益减去相应的信息搜索成本)[8]。从决策支持的角度来看,消费者在信息搜索中的决策支持方法设计应考虑两个方面:①应尽可能地设计合理的商品排序方式,降低消费者的搜索成本;②准确地估计消费者的信息搜索收益,制定合理的信息搜索停止策略,帮助消费者获得尽可能大的净搜索收益。

2.1 消费者商品考虑概率预测

在新兴电子商务背景下,商品数目非常巨大,消费者在进行商品信息搜寻最终作出购买决策时,很难考察全部的商品[20]。消费者通常会先将一部分商品放入考虑集合(consideration set,CS)中,随后再对考虑集合中的商品进行比较,最终作出购买决策[21][22]。已有研究表明,消费者在面临众多商品信息时,消费者倾向于根据排序结果从前往后进行顺序阅读[23]。虽然浏览越多的商品可能使消费者获得较高的收益,但也会增加其成本,故合理地设计商品的排序,可以降低消费者搜索商品时的成本,为消费者购物过程提供更好地决策支持。已有的关于这一问题的研究中一个很重要的方向为根据消费者对商品的考虑概率(consideration probability,CP)对商品进行排序[24][25]。伴随着信息技术的发展,消费者购买商品过程中的点击、收藏和比较行为已经可以被电商平台所记录。利用购物平台积累的用户历史记录,可以对用户关于商品的考虑概率进行预测,从而依据预测出的考虑概率,为消费者提供个性化的商品推荐排序。

商品考虑概率预测问题可以形式化表示如下:对购物平台上的某一位消费者c(c∈C,C 为平台上消费者集合)而言,平台为其推荐的商品集合为S。根据消费者c 的点击浏览等行为,可以判断该消费者已浏览的商品集合Sc及尚未浏览的商品集合。用acs表示消费者c 对商品s 的考虑概率,则对消费者已浏览的商品而言,可以通过其对该商品的操作记录(如加入购物车或收藏夹等)进行判断。若消费者将商品加入考虑集合,则acs=1,否则acs=0。从而消费者商品考虑概率预测目标即为,根据平台记录的消费者行为,预测消费者c 对其未浏览过的商品s ∈的考虑概率Pr(acs=1)。

由上述形式化表述可以看出,商品考虑概率的预测是一个典型的概率分布估计问题。传统的解决这一问题的方法为潜在类别模型(latent class model,LCM)[26]。其模型推导所基于的基本假设包括以下三个方面:①根据消费者将商品选入考虑集合情况的不同,可将其归入不同的消费者群体中,即潜在类别;②同一类别中的消费者具有相似的偏好,即对同一商品的考虑概率服从相同的概率分布;③给定消费者的潜在类别,其对于未被浏览商品的考虑概率属于独立变量。因此利用LCM 进行考虑概率的预测,可以通过判断消费者所属的潜在类别并分析该潜在类别内其他消费者对于该商品的考虑概率来进行。可以看出,潜在类别模型存在明显的锋利边界的问题,这使得这一模型未将同一潜在类别中消费者间的差异性和不同类别间消费者的相似性加以考虑,从而可能影响消费者商品考虑概率预测的准确度[25]

为克服潜在类别模型的这一局限,Wang 等[25]提出了基于模糊数学理论和信号理论的两阶段预测方法(two-step estimation approach,TEA),解决了LCM 的边界硬划分问题。下面概述TEA方法的基本思想。

在第一阶段,设计了一个增强的潜在类别模型(enhanced latent class model,ELCM),用于估计消费者c 对商品s 的偏好程度,用dcs(dcs∈[0,1])表示。在第二阶段,根据估计出的偏好程度,建立一个生成函数来推测用户对该商品的考虑概率,即PrTEA(acs=1)=h(dcs )。

具体而言,在第一阶段的ELCM 中,为解决锋利边界问题,假设同一消费者可以属于不同的潜在类别,对于每种潜在类别,每个消费者都存在一个隶属程度。给定潜在类别集合G,以及其中的一个潜在类别g,消费者c 属于类别g 的隶属程度用mg(c)(mg(c)∈[0,1])来表示。因此,消费者c 对于商品s 的偏好程度可以计算为[25]

其中,dcsg为通过类别g 对偏好dcs的预测。

在ELCM 中,可以用每一位消费者c 来代表一类消费者gc,组成消费者类别 集合G={gc|c ∈C}。其中,消费者对其本身代表类别的隶属度 为1,即)=1,因此消费者c 对 于商 品s 偏好程度的计算可进一步转化为[25]

为应对现实数据中可用信息矩阵的稀疏性问题,研究中定义了对偶消费者的概念。对消费者c 而言,其对偶消费者c*为在将推荐集合中商品选入考虑集合时具有与其完全相反情况的消费者即在引入对偶消费者的基础上,可以同时考虑具有相同和相反偏好的消费者将商品选入考虑集合的情况信息,增加了可利用的信息量,从而实现更精准的预测。引入对偶消费者概念后,可将对mgy(c)和dcsgy的估计表示为[25]

式中,φ (c,y)为消费者c 与消费者y 的相似程度,研究中采用的相似性程度计算公式为[25]

式中={s|s ∈Sc且acs=i},|Sc∩Sy|为消费者c 和y 均浏览过的商品集合,为均被两位消费者选入或排除考虑集合的商品数目之和,反映了消费者c 和y 的共同偏好。

第二阶段中,在已有研究的基础上,最终商品的考虑概率预测公式为[25]

PrTEA(acs=1)=Pr(a=1|d=dcs)

其中Pr(d|a=1)和Pr(d|a=0),可根据已有研究中常用的分布形式及平台积累的消费者历史数据获得。据此可以对消费者最终的商品考虑概率进行预测。

为比较TEA 与传统方法的预测准确度,研究基于国际Netflix大赛(http:/ /www.netflixprize.com)中提供的消费者购物行为的真实历史数据,借助市场营销领域中的位置图和选择模型理论进行场景仿真,以用均方根误差(RMSE)作为测度比较了TEA 与LCM 对消费者考虑概率的预测精度。实验结果表明,TEA 在预测精度上较传统的LCM 有明显提升,且统计检验显著。

由此可见,引入不确定信息表达的两阶段预测法(TEA),可以更好地刻画消费者所属类别,从而可以更有效地预测消费者商品考虑概率。应用这一方法,可将海量商品以个性化的顺序推荐给消费者,降低其信息搜索成本,辅助其网上购物中的信息搜索决策。

2.2 消费者信息搜索价值增益预测

消费者信息搜索决策支持中另一个重要方面便是帮助消费者制定浏览停止策略。虽然浏览越多的商品可能使消费者获得较高的收益,但也会增加其成本。最理想的情况是消费者在净收益最大时停止浏览商品,从而使得网上商品选择过程效用最大化。因此需要提供相应的浏览停止策略,帮助消费者判断是否已经获得最大的收益,从而判断是否需要继续浏览推荐集合。预测继续浏览商品的收益增益是设计停止策略的重要环节,也是消费者网上商品选择过程中的重要问题。一般来说,消费者信息搜索收益和收益增量难以定义和测量[10][27]。在实际搜索场景中,面对大量待考察的商品,通常情况下消费者会采取“考虑-选择”两阶段决策法[9][28]。这一过程包括两个部分:消费者考察商品后挑选出比较满意的一部分,形成候选集合;接着经过仔细比较,从候选集合中选出最终购买的商品。从这一过程来看,考察更多的商品可能使消费者获得效用更高的商品,因此消费者信息搜索收益可以用最终购买商品的效用来衡量[29]

基于此,可以将消费者信息搜索收益增益问题形式化表示如下:假设消费者集合为C,商品集合为S,消费者c∈C 按照给定的顺序考察商品获得收益并产生成本,其浏览了商品集合S 中的一个子集S1⊂S 后选择了其中的某一商品,则认为消费者浏览商品集合S1的收益为最终选择商品对于该消费者的效用,即B(c,S1)=。若该消费者在浏览了集合S1后未选择任何商品,而是继续浏览了商品集合S2并最终选择商品,此时消费者浏览商品集合S1∪S2的收益为B(c,S1∪S2)= 。因此,消费者c在浏览了商品集合S1后继续浏览商品集合S2的收益增益可表示为:

通常消费者在浏览商品后会选择对其效用最大的商品,即。故可进一步将收益增益表示为:

因此,对信息搜索收益增益的预测可以转化为对商品集合中商品最大效用的预测。通常,消费者的效用难以度量,但随着信息技术的发展,买家对商品的评分可以作为效用的一种评测标准[30][31]。即商品s 对消费者c 的效用可以通过消费者对该商品的评分rcs来衡量。如在观看完电影后,消费者会对所观看的电影给出1~10分(IMDb)或者1~5分(Netflix 或者MovieLens)的评分。这样的评分反映了商品对消费者的效用,进而可以用来测量收益增量。因此消费者继续浏览推荐集合的收益增益可以表示为:

由此,预测消费者继续浏览推荐集合收益增益的主要问题在于估计消费者在浏览商品集合中对效用最高的商品评分这一问题的主要难点在于,待估计的评分为个性化评分,而非商品的平均得分,即不同的消费者对同样的商品评分通常不同。且在现实中,消费者只有在选择并使用后才能对商品评分,故消费者对于商品的评分在搜索过程中是未知的。

传统的评分估计方法可以分为基于点估计的方法和基于分布估计的方法。基于点估计的预测方法(point estimation based prediction method,PM)首先估计不同消费者对不同商品的打分,然后用估计值预测收益增量。具体的,假设的估计值为,则给定估计值,基于点估计的预测方法对消费者考察商品效用最大值的预测值的期望为:

从而消费者信息搜索收益增量可表示为:

协同过滤方法是最主要的一类点估计方法,其基本假设为相似的消费者具有相似的偏好,从而可以利用消费者历史评分数据求得。该方法的问题在于,目前对商品评分进行预测的点估计方法的效果不太令人满意,即便是效果最好的协同过滤方法,其预测误差也较大[32]

基于分布估计的预测方法(distribution estimation based predicted method,DM)诞生于经济学和市场营销学中,这一类方法的基本假设为同一商品对不同消费者的效用可以被看作是独立同分布的随机变量,不同商品对相同或者不同消费者的效用被看作是独立的随机变量[33][34],即:

在这样的假设下,基于分布估计的预测方法DM 预测商品评分最大值的期望可以表示为[30]

进而,信息搜索增益可以表示为:

由上式不难看出,基于分布估计的预测方法的主要局限在于其假设商品对消费者的效用只与商品有关,忽略了不同消费者的特性。即无论是哪个消费者,只要考察的商品相同,那么从这个消费者得到的商品效用的概率分布就相同。应用这一方法对消费者的信息搜索增益进行预测时,只要给定商品集合相同,预测出的信息搜索增益就完全相同。这一方法难以满足个性化预测的需求。

针对PM 和DM 的局限,我们提出了基于机器学习理论的个性化概率分布估计的预测方法(personalized distribution estimation based prediction method,PDM)。这一方法综合考虑了基于点估计和基于分布估计两种方法的优势,将个性化加入到概率分布估计中,形成个性概率分布估计,解决了分布估计方法(DM)中个性化考虑不足的问题以及点估计方法(PM)中不精确的问题,提高了预测准确率。

PDM 预测的收益增量可以表示为[30]

其中,zc和zs分别为消费者c、商品s 的特征向量表示,E(r cs|zc,zs)为消费者c 对商品s 评分的期望值。由于协同过滤(collaborative filtering,CF)方法被认为是一种有效的评分预测方法[35][36],故可以采用协同过滤方法作为对E(rcs|zc,zs)的估计,即E(r cs|zc,zs)=,这样PDM 预测的信息搜索收益增量可以表示为:

可以验证,PDM 相对于PM 和DM 能带来更高的预测准确度。在实验过程中,以 Netflix 大赛提供的真实数据(http:/ /www.netflixprize.com)为基础构造仿真场景,并在场景中比较DM、PM、PDM 三种方法。为使三种方法都达到最佳的表现效果,研究中采用Netflix 大赛中18个最著名的评分预测方法作为PM 和PDM方法中的评分预测方法。实验表明,在各种不同评分预测方法下,应用均方根误差(RMSE)作为预测准确度的测度,PDM 的表现都要优于PM 和DM。

进一步,尽管PDM 方法结合了PM 和DM 的优势,取得了更好的预测效果,但仍存在着扩展提升的空间。在计算评分的后验概率分布 时,评分预测值是重要的输入数据,PDM 考虑了评分预测的具体数值,而没有考虑根据CF 得到的评分预测值不确定性的情形。为进一步探索此不确定性的影响,考虑引入置信度的概念以对PDM 进行扩展。这就得到了一个新的预测消费者搜索收益增量的方法,即考虑置信度的个性化概率分布方法(confidencebased personalized distribution method,CPDM)[31]。CPDM 中,置信度被定义成一个标量,和每个预测值一一对应,即可以记作。从而,CPDM 预测信息搜索的收益可以表示为:

具体而言,在CPDM 中将预测值的“置信度”定义为商品s 在历史数据中被评分的数量,即:

其中,Is表示包含商品s 的评分构成的集合[31]

为检验考虑评分预测值不确定性的CPDM 是否能真正带来预测效果的提升,该研究中采用推荐领域的标杆数据集MovieLens 电影评分数据(http:/ /grouplens.org/datasets/movielens/),设计实验对CF、PDM、CPDM 三种预测搜索收益增量的方法的预测准确度进行验证。为检验三种方法在各种可能的搜索场景下的预测效果,研究中根据可能选择的各种参数组合情况,共构建了288个不同的搜索场景,尽可能反映消费者真实的搜索过程。实验中采用由均方根误差(RMSE)和改进率(IMPR)作为测度评价三种方法的预测准确度。实验结果表明,在各场景下PDM、CPDM 方法的RMSE 值都低于CF,显示了更高的预测准确性;在各场景下PDM、CPDM 相对于CF 方法的平均改进率都为正,且CPDM 对CF 的改进率在所有情况下均大于PDM 对CF 的改进率,从而说明了CPDM方法相对于PDM 方法预测效果有了进一步的提升,在考虑置信度信息后预测结果更加准确。

综上所述,PM、DM、PDM、CPDM 四种方法的关系如图2所示。PDM 结合了PM 与DM 的优势,CPDM 在PDM 的基础上考虑了评分预测的不确定性,从而获得了更好的预测效果。

图2 四种搜索收益估计方法关系示意图

在新兴电子商务环境下,可以利用购物平台积累的大量消费者评分记录,应用PDM、CPDM 等新的预测方法对消费者购买使用商品的效用进行预测,从而估计消费者继续进行商品搜索的收益增益,进而为消费者设计个性化的商品浏览的停止策略。

3 消费者评论阅读过程中的决策支持

相比于传统的实体购物场景,电子商务环境下的网络购物场景使得消费者更加难以判断商品与其购物需求的吻合程度,因此许多用户在作出最终购买决策前会希望寻求已购买并使用过商品的其他用户对商品质量、使用体验等的描述。在线评论作为一种重要的用户产生内容(UGC),为消费者提供了以往购买并使用商品的消费者对该商品的评价,与传统的媒体报告和专家点评等信息相比,具有更加贴近消费者的特点[13],为潜在消费者判断商品质量提供了宝贵的信息。因此,消费者倾向于在购物决策过程中通过阅读在线评论来辅助其购物决策[37]。具体而言,在信息搜寻的初始阶段,消费者可以通过阅读在线评论初步判断商品与其购物需求的吻合程度,从而决定是否将商品作为待选商品进一步考虑;而当确定待选商品后,消费者又需要通过阅读在线评论对商品作出更加细致的判断,从而为后续的待选商品评估和购买做准备[37]。而基于在线评论了解商品质量的能力也在很大程度上决定了网络购物环境中的消费者作出决策的效果以及对于购物体验的满意度[4]。因此,在消费者阅读评论过程中也应设计相应的决策支持方法,使消费者可以快速准确地获取在线评论中传达的商品质量信息,提升消费者网络购物满意度。现实生活中,海量的评论信息给消费者带来严重的信息过载问题[5],为应对这一挑战,消费者评论阅读中的决策支持方法应着眼于帮助消费者缩小要阅读的在线评论信息[38][39]。具体而言,这一问题可以从单条评论和评论集合两个角度出发分别加以考虑。从单条评论角度考虑,可通过设计合理的评论有用性预测方法、有用性排序策略,以帮助消费者快速获取有用评论;从评论集合角度考虑,可考虑评论汇总问题,并重点考虑评论汇总信息与具体评论集合信息的一致性问题。以下将对这两个维度进行具体说明。

3.1 评论有用性预测问题

为帮助消费者在海量在线评论信息中快速识别有用的评论,许多电商平台推出了评论有用性投票机制,依据有用性对评论进行了一定的组织,从而支持消费者的购物决策。而采用该机制的电子商务平台也由于向消费者提供了更好的购物决策支持服务,更容易得到市场的认可从而有更大的盈利空间。据报道,国际著名的电子商务平台Amazon 由于采用了这一机制,使其每年获得了至少27亿美元的额外收益[40]。然而,评论有用性投票机制存在着一些偏差现象,如“胜利者循环”偏差和“早期优势”偏差[15][16]。“胜利者循环”偏差是指:已获得较多投票且投票结果较好的评论,会在该商品的所有评论中被排在较靠前的位置,从而更容易得到后续消费者的关注,因此更容易收到新的有用性投票;而获得投票数较少甚至没有的评论,则会在该商品的所有评论中被排在中间或较靠后的位置,难以得到后续消费者的关注,从而难以收到新的有用性投票结果[15]。而“早期优势偏差”则是指:在商品刚上线时,由于商品总的评论数较少,此时发布的评论更容易获得消费者的关注,得到有用性投票,从而建立起早期优势,被排在较靠前的位置,从而在后续的过程中更容易得到消费者的关注并进一步积累有用性投票;而后期发布的评论,因为一开始没有任何有用性投票,会被排在中间或较靠后的位置,难以得到后续消费者的关注,从而难以积累起有用性投票[16]。由于这两种偏差的存在,使得绝大多数的投票仅集中在极少数的评论上,而绝大多数的评论都无法获得任何投票。由于评论有用性投票机制偏差,评论获得的投票数存在明显的长尾特征,绝大多数评论由于没有获得有用性投票而无从判断其有用性。因此,单纯依靠现有的评论有用性投票机制,消费者难以在短时间内对商品的所有评论进行有用性判断,这将增加消费者决策难度,影响消费者购物决策的效果。因此,关于评论有用性预测问题的研究的重要性便凸显出来。

目前评论有用性预测研究的一般框架如图3所示。评论特征提取模块,对评论的特征进行分析提取;评论有用性度量模块则针对已获得足够多投票的评论,根据投票结果度量其有用性,这两个模块的结果共同作为模型的输入进行训练,从而能够根据未获得足够投票的评论的特征,对这些评论的有用性进行预测。

图3 评论有用性研究一般框架

以往关于评论有用性预测研究大多关注评论特征提取模块,开发了丰富的对评论有用性有预测作用的评论特征。而对于评论有用性度量模块,则往往简单地采用总投票中有用票的比例作为度量方法,即对一条评论而言,若投票者共有n 人,其中s 人认为评论有用,即将评论有用 性记为。尽管该方法较为直观,但忽略了评论的总投票数信息以及电子商务平台上消费者投票模式信息,可能会对评论有用性度量造成一定的误差。举例而言,“10人中有8人认为该评论有用”和“100人中有80人认为该评论有用”得到的有用性标签均为0.8,但这一相同的有用性标签并不能全面概括两者传递的评论有用性信息。若每条评论都能获得平台上全部用户的投票,则这种比例式的有用性度量方式是可行的,但在当前大多数评论难以得到大量用户投票的情况下,现有的有用性标签度量方法容易导致较大的偏差,直接以此作为训练标签学习评论有用性模型,将限制模型的预测精度。因此,评论有用性预测中的一个核心问题便是评论有用性度量问题。应将评论获得的总投票数和平台用户投票模式共同加以考虑,设计更为合理的评论有用性度量方法,进而对未获得足够投票的评论的有用性进行更精准的预测。

针对这一问题,张遵强[41]提出了一种新型的基于迭代贝叶斯概率的评论有用性预测方法(IBP)。该方法假设对于一条有用性为H 的评论,每位投票者会独立地以H 的概率进行投票,从而对于一条有用性为H 且已获得n 个投票的评论,其获得有用票数目X会服从二项分布,与之共轭的先验分布为Beta 分布(Beta(α,β))。根据贝叶斯准则可以计算出评论有用性H 的后验估计,H|X ~Beta(x +α,n-x +β)[41][42]。根据这一后验分布结果可以求得评论的有用性期望值h,并将该期望值作为评论有用性度量结果。为了更准确地估计反映平台用户投票模式的参数α、β,研究中采用迭代的方式对参数进行估计。以传统的比例式的有用性度量结果作为估计的起点,拟合得到初始的先验分布,进而得到新的有用性度量结果,继续作为输入拟合得到新的先验分布参数,如此往复。具体而言,IBP 方法的算法流程如图4所示。其中HSa、HSb分别表示已获得和未获得足够有用性投票的有用性结果集合。在“分析训练集合中评论特征”模块,通过较全面考虑评论格式、内容丰富程度、主观意见、情绪、商品相关、评论者专业性、评论间差异和评分等方面集成纳入了共66个评论特征[41]

图4 IBP 算法流程

为比较基于迭代贝叶斯概率的方法(IBP)与传统的基于有用票比例的方法(PER)在评论有用性预测方面的效果,研究中设计了丰富的实验,包括模拟数据实验、真实两期评论数据实验和用户实验。模拟实验中,考察了16种不同的评论有用性分布情况,用以比较两种方法在不同有用性分布特征平台上的预测精度。真实两期评论数据实验中,实验数据集为2012年6、8月间(T1)和2014年5、6月间(T2)从国际著名电子商务平台Amazon 上抓取的所有商品的两期评论及其投票结果数据构成的真实数据集。实验中应用T1中已获得足够投票的评论训练评论有用性模型,并对所有评论的有用性进行预测;应用T2中已获得了足够投票的评论作为真值,比较这部分评论在T1时的有用性预测结果与T2中的实际投票结果,从而分析方法的预测精度。特别值得一提的是,还进一步进行了用户实验:从两期真实评论数据中随机选择了部分评论,实验在Amazon Mechanical Turk 真实用户平台上展开,将T1时的评论有用性预测结果与用户实验中收集的评论有用性投票结果进行比较,从而分析方法的预测精度。研究采用了平均绝对误差(MAE)和均方根误差(RMSE)来衡量方法在评论有用性预测方面的误差。三项实验结果均表明,IBP 相对于传统的PER 具有更小评论有用性的预测误差,且两者的差异是显著的。

由此可见,从单条评论角度,基于迭代贝叶斯概率的评论有用性预测方法(IBP)可以更为准确地预测在线评论的有用性,从而可以在一定程度上解决目前电子商务平台商品评论中存在的“胜利者循环”和“早期优势偏差”问题。由此得出的有用性预测结果,可用于对评论信息进行合理的排序,降低用户评论阅读过程中的成本,为用户购物决策提供更好的支持。

3.2 评论一致性排序问题

如上所述,消费者在进行评论阅读时面临信息过载问题[5][6]。相应地,许多电子商务平台提供评论汇总功能,以便消费者快速获取评论集合中的意见倾向信息,减少消费者在评论阅读过程中时间、精力的消耗。评论汇总技术通过对商品评论信息进行意见挖掘,分析得到每条评论所评价的商品属性及对应的意见,并进一步汇总得到该商品所有评论中关于各商品属性持各种意见的评论数[43][44][45]。相比于具体的商品评论,评论汇总信息以清晰、简洁的方式向消费者提供了商品所有评论中所包含意见的全局视图[43][44][45][46],对评论信息进行了有效整理和展示,缓解了海量在线评论带来的信息过载问题,支持了消费者的购物决策。但由于评论汇总信息过分简化了原始评论中包含的具体信息,仅仅阅读评论汇总信息消费者难以获得商品评论信息的全貌,故仅呈现评论汇总信息常常是不够的。有研究表明,消费者在关注评论汇总信息的同时,也会关注于具体的评论信息,从而了解评论背后的原因及其他包含在评论文本中的细节信息[17]。因此,在向消费者提供抽象、简化的评论汇总信息的同时,还需要向消费者提供具体的评论个例作为补充,以帮助消费者加深对于评论汇总信息的理解[47],更好地支持消费者的购物决策。而当同时向消费者提供评论汇总信息和具体评论信息时,需要考虑两种视角所表达意见信息的一致性问题。由于电子商务平台往往以评论排序列表的方式组织商品的在线评论,所以需要对评论的一致性度量及排序问题进行研究,使得消费者通过评论排序结果看到的具体评论集合与评论汇总信息在意见分布信息上具有较高的一致性,以减少消费者可能产生的感知混淆和信息缺乏。(www.daowen.com)

由于评论信息中包含消费者对商品属性的意见倾向信息,可以采用属性提取及意见极性分析方法将每条评论结构化表示为由一个或多个“商品属性-对应意见极性”元组构成的向量。进一步地,可以将评论集合意见汇总信息表示为该评论集合在一个商品属性上意见分布向量的集合。于是可将上述评论汇总信息与消费者阅读到评论集合信息的一致性度量问题转化计算为两个评论意见汇总集合的一致性问题。进而,评论一致性排序问题为制定合理的评论排序方案,使消费者阅读到的评论集合信息与评论意见汇总集合的一致性尽可能的大。这一问题可以形式化描述如下[49]

给定某一商品及该商品所有评论集合R={r1,r2,…,rn},评论中包含的商品属性集合为FR={f1,f2,…,fm},包含的意见极性集合。经结构化处理后的每条评论可以表示为。进一步地,可以将评论集合R汇总信息表示为,其中为该评论集合在属性f上持有各种意见极性评论数量的向量。设消费者阅读到的评论集合为,其中包含的商品属性集合为FS。则评论汇总信息与具体评论集合之间的一致性可以表示为之 间的函 数。即。评论一致性排序问题为对评论全集R进行合理的排序,使消费者阅读到的评论集合S与R的一致性得分尽可能地高。

关于上述评论结构化表示和评论信息汇总方法可以用表1中的例子加以说明。如表1所示,三条评论可以分别进行结构化表示,并最终形成每个属性上的评论汇总信息d(口味,R)=由此可得该评论集合 在口味、价格、服务三个属性上的评论意见分布汇总信息集合为d(FR,R)={(3,0),(1,1),(1,1)}。

表1 评论内容结构化表示示例

将评论一致性问题进行形式化表述后可以看出,这一问题的主要研究难点包括两个方面:①消费者阅读评论集合S 的确定,尽管消费者在阅读过程中通常采用顺序阅读的方式,但由于不同的消费者具有不同的阅读习惯,难以对其阅读的集合进行统一衡量;②一致性计算方式及一致性的确定,即具体的Function 函数形式的选取。目前关于一致性的研究中大多集中于第二个难点而回避第一个难点,即在假设消费者阅读评论集合中包含的评论数目为固定的(如前k 条)情况下研究一致性度量方式[50][51]。但这类研究忽视了消费者评论阅读中的异质性,在实际购物环境中,消费者根据评论排序结果所阅读到的评论数量往往会因为消费者行为、购物任务和环境因素的差异而千差万别,故消费者阅读评论数量不能一概而论事先指定。

基于已有研究存在的不足,研究中需对消费者评论阅读过程进行更精细地刻画,从而得到更具有普适性的评论一致性排序问题解决方案,为消费者评论阅读过程提供更好的决策支持。Zhang 等[49]在研究评论一致性排序问题时,引入了消费者停止阅读位置的概率分布P={p1,p2,…,pn},用于对消费者的阅读评论行为进行建模。该研究对评论一致性排序问题进行了系统分析,提出了评论汇总信息与评论子集的一致性测度目标,并通过对消费者阅读评论行为的建模,得到了形式化的评论一致性排序问题。且研究中针对该问题进行了计算复杂性分析,证明其为NP-难问题。设计了相应近似算法进行求解,以较高的效率得到理想的较优解。

具体而言,在引入消费者阅读停止位置的概率分布后,评论一致性排序问题可以定义为给定某一商品的所有评论组成的集合R,及消费者停止阅读概率分布P,从所有可能的评论排序结果中选择一种提供给消费者,使得评论全集R 与评论排序结果L 的期望一致性得分expC(R,L)最大。该研究在借鉴已有研究的基础上,将评论集合R 与S 在商品属性f 上的一致性定义为[49]

其中,分别为评论集合R 与S 在商品属性f 上正面评论的数目。进而可以将考虑消费者阅读停止概率分布的评论一致性排序问题形式化描述为[49]

研究中对一致性排序问题的计算复杂性进行了分析,经证明这一问题可由经典的NP-难问题最大覆盖问题规约得到,故评论一致性排序问题也是NP-难问题。该研究对这一问题的两种精确解法——穷举法和动态规划法的复杂度进行了分析,给定评论数为n、属性数为m 的商品评论集合,穷举法的计算复杂度为O(n! ×n × m),动态规划方法的计算复杂度为O(2n-1× n × m),均难以在可接受的时间(多项式时间)内求得评论一致性排序问题的最优解。因此,需转而寻求该问题的近似解法,该研究中首先提出了一种较为直观的基于贪婪思路的逐步寻优方法(stepwise optimization procedure,SOP),该方法逐步在评论排序列表结尾添加评论使当前排序列表的期望一致性得分最高。经分析,该方法的计算复杂度为O(n2×m),相对于穷举法等精确求解方法有明显的提升;但由于该方法每次仅保留期望一致性得分最高的排序列表,为局部寻优策略,可能会导致仅能找到局部最优解而不能达到全局最优解,从而影响评论一致性排序效果。因此该研究在综合穷举法效果优势和逐步寻优方法效率优势的基础上,提出了增强型逐步寻优方法(enhanced stepwise optimization procedure,eSOP),将评论排序结果的获得视为逐步往评论排序列表末尾添加新评论的过程,并在每一步保留期望一致性得分较高的结果,从而求得问题的近似解[49]。eSOP 算法的主要流程可概括如图5所示。

由eSOP 算法流程可以看出,相比于SOP 在每步只保留期望一致性得分最高的排序列表,eSOP 会在每一步保留一批期望一致性得分满足参数α 要求的列表,并组成相应的备选列表集合以用于下一步列表的生成。在eSOP 中,参数α 要求发挥了权衡效率与效果的作用。当α 值设置较小时,每一步会保留更多的排序列表,从而有较大的寻优范围,可能取得较好的效果,但会花费更多的时间;反之亦然。而当参数α 设置为0时,eSOP 会在每一步保留所有的结果,相当于穷举法;而当参数α 设置为1时,eSOP 在每一步仅保留取得最大期望一致性值的排序列表,从而退化为SOP。

图5 eSOP 算法流程

为检验eSOP 在求解评论一致性排序问题方面的表现并与其他方法进行比较,研究中进行了丰富的实验。实验中首先通过参数分析检验了eSOP 在不同参数情况下效果和效率的变化,随后分别基于模拟评论数据,以及从国内外著名的电子商务平台天猫、Amazon 上分别抓取的中英文真实评论数据对eSOP 与其他可能的启发式算法的算法效率、效果进行了对比。实验中以近似比率(approximation rate)、超越比例(superiority)为测度对几种方法的效果进行了对比。实验结果表明在所有数据集上,eSOP 都具有更高的求解效率,且其效果都显著优于其他所有方法。除采用客观性指标对各方法效果进行评估外,研究中还采用了用户实验对评论一致性排序进行评估,实验结果同样表明该研究中提出的评论汇总信息与具体评论集合间的一致性目标比其他相关的评论集合选取目标更加符合消费者购物决策过程中对评论信息的需求。

由此可见,增强型逐步寻优方法(eSOP)通过引入消费者评论阅读停止位置概率分布,对消费者评论阅读行为进行了更精细地刻画。同时,方法综合了穷举法和逐步寻优方法的优点,可以在保证算法效率可接受的前提下,以较高的精度求解评论一致性排序问题。应用该方法对电子商务平台上的评论进行合理排序,可以使消费者阅读到的评论集合与商品评论汇总信息集合有较高的一致性,从而可以提升消费者购物过程中的信心,更好地支持消费者网上购物决策。

4 结 语

本文首先从对消费者信息搜索进行决策支持视角,分别考虑根据消费者对商品的考虑概率设计合理的商品排序方式以降低消费者信息搜索的成本,以及尽可能准确地估计消费者信息搜索收益以帮助其制定合理的信息搜索停止策略问题。这里的关键步骤为对消费者商品考虑概率、消费者搜索效用进行预测。相应地,通过提出两阶段预测方法(TEA),个性化概率分布模型的预测方法(PDM)、考虑置信度的个性化概率分布模型的预测方法(CPDM)以分别用于解决上述问题,且具有良好的预测效果。接着,从消费者评论阅读进行决策支持视角,从单条评论角度和评论集合角度分别进行分析。从单条评论角度,提出基于迭代贝叶斯的评论有用性预测方法(IBP)并取得了良好的预测效果;从评论集合角度,为解决评论一致性排序问题,在考虑消费者异质性的基础上,设计了能够适应消费者不同的停止阅读位置的增强型逐步寻优算法(eSOP),并得到了满意的优化效果。

后续研究可以进一步结合新兴电子商务背景,考虑其他新型购物和销售模式及其消费者行为特征,如捆绑推荐(bundle recommendation)、概率销售(probabilistic selling)等对消费者在其他具体网络购物场景中可能遇到的问题进行研究,并提出具有针对性和新颖性的决策支持策略。

参考文献

[1]中国电子商务研究中心.2015年(上)中国电子商务市场数据监测报告(2015-09-21)[2015-09-26].http:/ /www.100ec.cn/zt/upload_data/down/2015sndbg.pdf.

[2]周宏仁,等.中国信息化形势分析与预测( 2013)[M].北京:社会科学文献出版社,2013.

[3]Hawkins D I,Mothersbaugh D L.Consumer Behavior (11th edition) [M].McGraw-Hill Companies,2011.

[4]Mudambi S M,Schuff D.What makes a helpful review? A study of customer reviews on Amazon.com [J].MIS quarterly,2010,34(1): 185-200.

[5]Bawden D,Robinson L.The dark side of information: Overload,anxiety and other paradoxes and pathologies [J].Journal of Information Science,2009,35(2): 180-191.

[6]Brynjolfsson E,Hu Y,Simester D.Goodbye pareto principle,hello long tail: The effect of search costs on the concentration of product sales [J].Management Science,2011,57(8): 1373-1386.

[7]Palley A B,Kremer M.Sequential search and learning from rank feedback: Theory and experimental evidence [J].Management Science,2014,60(10): 2525-2542.

[8]Ratchford B T.Cost-benefit models for explaining consumer choice and information seeking behavior [J].Management Science,1982,28(2): 197-212.

[9]Zwick R,Rapoport A,Lo A K C,et al.Consumer sequential search: Not enough or too much? [J].Marketing Science,2003,22(4): 503-519.

[10]Diehl K.When two rights make a wrong: Searching too much in ordered environments [J].Journal of Marketing Research,2005,42(3): 313-322.

[11]Wang W,Benbasat I.Interactive decision aids for consumer decision making in e-commerce: The influence of perceived strategy restrictiveness [J].MIS Quarterly,2009: 293-320.

[12]Xiao B,Benbasat I.E-commerce product recommendation agents: Use,characteristics,and impact [J].MIS Quarterly,2007,31(1): 137-209.

[13]Chen Y,Xie J.Online consumer review: Word-of-mouth as a new element of Marketing communication mix [J].Management Science,2008,54(3): 477-491.

[14]Chevalier J A,Mayzlin D.The effect of word of mouth on sales:Online book reviews [J].Journal of Marketing Research,2006,43(3): 345-354.

[15]Liu Y,Huang X,An A,et al.Modeling and predicting the helpfulness of online reviews [ C]/ /Data Mining,2008.ICDM'08.Eighth IEEE International Conference on.IEEE,2008: 443-452.

[16]Liu J,Cao Y,Lin C Y,et al.Low-quality product review detection in opinion summarization [ C]/ /EMNLP-CoNLL.2007: 334-342.

[17]Oulasvirta A,Hukkinen J P,Schwartz B.When more is less:the paradox of choice in search engine use [C]/ /Proceedings of the 32nd International ACM SIGIR Conference on Research and Development In Information Retrieval.ACM,2009: 516-523.

[18]Simon H A.The sciences of the artificial [M].MIT Press,1996.

[19]Solomon M R,Dahl D W,White K,et al.Consumer behavior:buying,having,and being [M].Upper Saddle River,NJ:Prentice Hall,2014.

[20]Häubl G,Trifts V.Consumer decision making in online shopping environments: The effects of interactive decision aids [J].Marketing Science,2000,19(1): 4-21.

[21]Gu B,Konana P,Chen H W M.Identifying consumer consideration set at the purchase time from aggregate purchase data in online retailing [J].Decision Support Systems,2012,53(3): 625-633.

[22]Tan W K,Tan C H,Teo H H.Consumer-based decision aid that explains which to buy: Decision confirmation or overconfidence bias? [J].Decision Support Systems,2012,53(1): 127-141.

[23]Cutrell E,Guan Z.What are you looking for?: an eye-tracking study of information usage in web search [C]/ /Proceedings of the SIGCHI Conference on Human Factors in Computing Systems.ACM,2007: 407-416.

[24]Fleder D,Hosanagar K.Blockbuster culture's next rise or fall:The impact of recommender systems on sales diversity [J].Management Science,2009,55(5): 697-712.

[25]Wang H,Wei Q,Chen GQ.From clicking to consideration: A business intelligence approach to estimating consumers' consideration probabilities [J].Decision Support Systems,2013(56): 397-405.

[26]Hofmann T.Latent semantic models for collaborative filtering[J].ACM Transactions on Information Systems (TOIS),2004,22(1): 89-115.

[27]Reutskaja E,Nagel R,Camerer C F,et al.Search dynamics in consumer choice under time pressure: An eye-tracking study[J].The American Economic Review,2011: 900-926.

[28]Moe W W.An empirical two-stage choice model with varying decision rules applied to internet clickstream data [J].Journal of Marketing Research,2006,43(4): 680-692.

[29]Wang H,Guo XH,Wei Q,et al.Providing a Service for Interactive Online Decision Aids through Estimating Consumers'Incremental Search Benefit [C]/ /Proceedings of Thirty Second International Conference on Information Systems (ICIS).2011:10.

[30]Wang H,Guo XH,Zhang MY,Wei Q,Chen GQ.Predicting the incremental benefits of online information search for heterogeneousconsumers [J].Decision Sciences,2015accepted.

[31]陈国青,张明月,王昊.面向在线购物决策的消费者信息搜索收益预测方法[J].重大管理评论,2015.

[32]Jahrer M,Töscher A,Legenstein R.Combining predictions for accurate recommender systems [C]/ /Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2010: 693-702.

[33]Adam K.Learning while searching for the best alternative [J].Journal of Economic Theory,2001,101(1): 252-280.

[34]Nelson P.Information and consumer behavior [J].The Journal of Political Economy,1970: 311-329.

[35]Adomavicius G,Tuzhilin A.Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions [J].Knowledge and Data Engineering,IEEE Transactions on,2005,17(6): 734-749.

[36]Adomavicius G,Tuzhilin A,Zheng R.REQUEST: A query language for customizing recommendations [ J].Information Systems Research,2011,22(1): 99-117.

[37]Sun M.How does the variance of product ratings matter? [J].Management Science,2012,58(4): 696-707.

[38]Jacoby J.Perspectives on Information Overload [J].Journal of Consumer Research,1984(10): 432-435.

[39]Kuksov D,Villas-Boas J M.When more alternatives lead to less choice [J].Marketing Science,2010,29(3): 507-524.

[40]Spool J M.The magic behind amazon's 2.7billion dollar question.User Interface Engineering,2009.http: / /www.uie.com/articles/magicbehindamazon/.

[41]张遵强.基于在线评论的网络购物决策支持方法研究[D].清华大学,2015.

[42]Rice J.Mathematical statistics and data analysis [M].Cengage Learning,2006.

[43]Hu M,Liu B.Mining and summarizing customer reviews[C]/ /Proceedings of the tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2004: 168-177.

[44]Liu B,Hu M,Cheng J.Opinion observer: analyzing and comparing opinions on the web [C]/ /Proceedings of the 14th International Conference on World Wide Web.ACM,2005:342-351.

[45]Zhuang L,Jing F,Zhu X Y.Movie review mining and summarization [C]/ /Proceedings of the 15th ACM International Conference on Information and Knowledge Management.ACM,2006: 43-50.

[46]Lu Y,Zhai C X,Sundaresan N.Rated aspect summarization of short comments [C]/ /Proceedings of the 18th International Conference on World Wide Web.ACM,2009: 131-140.

[47]Weinberg B D,Davis L.Exploring the WOW in online-auction feedback [J].Journal of Business Research,2005,58(11):1609-1621.

[48]Archak N,Ghose A,Ipeirotis P G.Deriving the pricing power of product features by mining consumer reviews [J].Management Science,2011,57(8): 1485-1509.

[49]Zhang ZQ,Chen GQ,Zhang J,et al.Providing Consistent Opinions from Online Reviews: A Heuristic Stepwise Optimization Approach [J].Informs Journal on Computing.2015accepted.

[50]Lappas T,Crovella M,Terzi E.Selecting a characteristic set of reviews [ C ]/ /Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2012: 832-840.

[51]Tsaparas P,Ntoulas A,Terzi E.Selecting a comprehensive set of reviews [ C ]/ /Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and DataMining.ACM,2011: 168-176.

【作者简介】

陈国青,清华大学经济管理学院EMC讲席教授。国际模糊系统学会(IFSA)副主席,国际信息系统协会中国分会(CNAIS)创始主席(2005—2013)。主要研究兴趣包括管理信息系统、商务智能与电子商务、模糊逻辑等。

王聪,清华大学经济管理学院管理科学与工程专业博士研究生。主要研究兴趣包括商务智能与电子商务、网络搜索与信息检索等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈