理论教育 推荐系统应用发展现状--《出版学研究进展》

推荐系统应用发展现状--《出版学研究进展》

时间:2023-08-08 理论教育 版权反馈
【摘要】:显然,利用推荐系统向用户推荐其所需的信息,能有效解决上述因信息过载导致的各种问题,有利于电子政务的健康快速发展。接下来,本文将从政府对市民和政府对商业两个方面,介绍电子政务推荐系统在电子政务网站的个性化和自适应服务推荐的应用和发展。

推荐系统应用发展现状--《出版学研究进展》

近年来,推荐系统被广泛应用于社会不同领域,为了方便起见,本文从电子政务、电子贸易以及数字资源三个角度对推荐系统的应用现状研究做介绍。

2.2.1 推荐系统与电子政务

电子政务是指政府通过Internet和其他电子通信技术来完成信息发布和政务服务以及商务活动。电子政务的快速发展导致信息过载,使得用户和商户难以有效获取所需信息,降低政务的服务效率,影响到用户对电子政务推广和使用的信心。显然,利用推荐系统向用户推荐其所需的信息,能有效解决上述因信息过载导致的各种问题,有利于电子政务的健康快速发展。接下来,本文将从政府对市民(G2C)和政府对商业(G2B)两个方面,介绍电子政务推荐系统在电子政务网站的个性化和自适应服务推荐的应用和发展。

对于推荐系统在G2C的应用,De Meo等人首先提出利用政务推荐系统来为市民提供高效快速的个性化政务服务。这种推荐系统根据市民的配置文件以及使用配置文件的设备,为市民提供其感兴趣的政务服务[40]。Terán等人利用模糊分类技术,根据候选人与选民的偏好相近程度,提出一种推荐系统,以辅助选民在电子选举中做出选择[41]

与G2C不同,大多数G2B服务具有一次性和信息不确定等特点,例如突发事件。这意味着推荐打分在事件结束即完成,也就是说传统的协同过滤技术由于评分矩阵的稀疏性问题而无法使用。为了解决这一问题,Guo和Lu将语义相关技术融入到协同过滤技术中,提出一种新的基于属性特性的推荐方法,并以此为基础设计出一种能应用于展览贸易活动的推荐系统Smart Trade Exhibition Finder(STEF)[42]。Cornelis则关注G2B领域中如何解决不确定信息的问题,并将这种情况下的用户和评估间的相关性形式化为模糊关系。在此基础上,他们提出一种新型的基于CF-CB的推荐方法。该方法基于已有事件的特性来反映未来可能发生事件的特性,并做出相应的信息推荐[43]。Lu等人则提出一种基于模糊逻辑的混合推荐框架,为电子政务的贸易展览活动提供信息推荐。为了解决政府如何有效地向个体商户推荐合适的合作伙伴的问题,学者们提出一种名为BizSeeker的推荐系统,利用该系统,用户能获得潜在合作伙伴的推荐列表,并选择适合自己的合作伙伴。现实应用表明,BizSeeker推荐系统有助于解决推荐系统矩阵稀疏的问题,能有效提高推荐的准确性。虽然BizSeeker采用了语义技术,但其语义处理能力较弱,无法胜任复杂的语义处理,例如对同一件产品的专家观念与用户兴趣间的相关性等问题。为了解决这一问题,学者对BizSeeker推荐系统进行了改良,提出一种基于模糊语义测量的方法和一种混合模糊语义推荐系统[45]

2.2.2 推荐系统与电子商贸

电子商贸是推荐系统发展活跃的另一个领域,也是近期推荐系统研究的热点之一,包括Business-to-Consumer(B2C)和Businessto-Business(B2B)两类。

对于B2B,其核心目的是为了便于用户管理商品,维护市场和更新产品数据库。为此,学者们提出基于本体的产品推荐系统。这种系统采用了基于关键词、本体和贝叶斯网络等技术,以便准确快速地进行信息推荐[46]。为了帮助用户选择值得信赖的在线拍卖者,学者们提出利用交易关系来计算推荐等级,并设计出相应的推荐系统[47]。为了构建稳定的数字商贸生态系统,研究者引入计算生态技术,构建出一种基于生态监测和谈判类型的推荐系统[48]。还有一些学者关注私人银行投资问题,引入语义技术和模糊逻辑技术,并提出一种名为PB-ADVISOR的多投资推荐系统[49]。除了信息推荐外,客户关系管理也是B2B的主要关注点。为了保证公司能向其贸易伙伴或客户推荐合适的产品,Zhang等人设计出相应的个性化推荐系统。该系统能根据客户的具体情况,为客户推荐相应的服务计划和相应的产品[50]。可以看出,在电子商贸推荐系统中,基于KB的方法,如本体和语义技术,被广泛应用到CF和CB推荐方法中,形成相应的混合推荐技术,其主要原因在于电子商贸是高度依赖于领域知识来实现推荐的。(www.daowen.com)

从狭义上讲,电子商务是B2B的一种特殊形式,是一种直接针对客户销售商品的特殊B2B形式。在电子商务系统中,评分是一种常见的方式,尤其对于一些电子产品。例如在iTunes商店,客户可以通过对自己购买的商品进行评分的方式来实现用户对商品的反馈。这种评分数据为系统推荐提供相应的依据。除了评分之外,打标签也是一种与商品直接相连的常用方式。如电影网站Movielens的用户可以通过简单的文字来描述对应的电影,以表达该用户对其打标签的电影的态度和评价。鉴于此,研究者综合利用CF和社会标签分析的方法来提升推荐系统的性能[51]。在现实系统中,一些大型电商网站在详细分析客户过去的购买行为以及商品总的销售情况下,对客户的购买行为进行预测,并以总的销售多少为基准向客户进行推荐[52]。与业界不同,学者提出一些新的预测模型,并以此为基础构建推荐系统[91]。比如Wasabi Personal Shopper(WPS)推荐系统应用KB分析技术来收集用户评分数据,以获得更好的推荐效果,然后设计出相应的推荐系统[53]。此外,模糊技术也被广泛应用到基于CB的电商推荐系统中。Cao和Li提出一个基于模糊的推荐系统。它是一款基于多组件的电子产品推荐系统,能根据组件性能特点和用户需求,为用户提供相应的产品推荐[28]。Mooney and Roy利用机器学习和信息抽取的方法来进行文本分类,并提出一种基于内容的图书推荐系统[54]。最后,贝叶斯文本分类方式也被应用到数据抽取,以构建图书特性和用户的配置文件,并以此为用户推荐相应的图书。新媒体的出现能为用户提供更多的富媒体信息,也给卖家为客户提供更准确的产品提供可能。为此,一些学者利用这些富媒体信息,引入超图模型,构建基于社交媒体信息的音乐推荐系统[53]

除了上述两类应用,近年来为移动用户提供推荐也是推荐系统的一个研究热点。与上述推荐系统不同,为移动用户提供推荐的推荐系统需要满足用户的移动性能,适应移动网络环境和移动设备的特性,如网络环境复杂和连接的不连续性等[55]

2.2.3 数字资源推荐

广义上讲,数字资源是指各类以数字形式存储和传播的各类信息资源,包括电子图书[90]、各类学习和教育资源以及各类音视频和文档图片等内容资源,是推荐系统最重要的应用领域之一。利用推荐系统,能有效地向用户推荐其所需资源,或者向用户准确展现其所需资源的位置,便于用户快速获取所需资源。

首先是图书推荐,斯坦福大学开发出一个数字图书馆推荐系统Fab,该系统采用的是一种融合CB与CF的混合推荐系统,其目的是为读者提供个性化定制推荐服务,以便更好地为读者提供个性化服务[56]。斯坦福在该系统基础上,进一步研发出了CYCLADES的个性化推荐系统。该系统的算法根据读者个人信息和所属社团信息,综合了CB和CF两种方法,能根据读者所处的环境及其所属的社团,为读者提供个性化的推荐服务[57]。此外,Porcel等人针对学术研究的特点,设计并研发出一种推荐系统。该系统在利用多规则模糊语义模型来表示并处理语义标签的含义基础上,融合CB和CF技术,实现基于模糊语义的图书阅读推荐[58]。而S Guerrero等人则引入模糊语义技术来表示用户的阅读偏好,并利用基于模糊语义的推荐技术,设计出相应的图书推荐系统,以提高输入内容过少时推荐的准确度不高的问题[59]。在线学习推荐是电子资源推荐的另一个重要方面,也是近年来随着新兴技术发展而快速发展的一个领域。在该领域,推荐系统主要关注帮助学生制定学习课程、学习目标和相应的学习材料等工作。Zaiane利用数据挖掘技术来构建用户网上行为模型,并设计出相应的推荐系统,为学生在线推荐学习资源[60]。Lu利用计算分析模型,设计出在线学习个性化推荐系统Personalized E-learning Material Recommender System(PLRS)。该系统能根据读者注册信息、学习材料数据库以及学习活动数据库来为学生定制学习内容和推荐学习材料[61]。此外,学者们还研发出一种个性化学习材料推荐系统。该系统利用模糊条目响应理论来收集学习者的初始偏好数据,然后进行相应的学习资料推荐。除了图书推荐和学习资源推荐之外,各种数字资源形如音视频和图片文字的推荐也是当前推荐系统研究的热点。对于音频,研究者利用用户会使用标签来表示和管理上传到网络上的音频资源的现状,利用标签来构建用户的习惯和偏好,并以此设计出相应的推荐系统[89]。Zheng和Li设计出一个基于标签的Web推荐系统,根据标签和时间关系来构建相似矩阵,利用CF来进行推荐[63]。Gemmell等人也设计出一款基于标签的推荐系统FolkRank。该推荐系统利用标签来计算资源间的距离,并利用图论的理论,利用CF算法来实现音频资源的推荐[64]。至于视频推荐,最常用的推荐系统是利用描述视频的信息如男女主角的内容而设计出的基于CB的内容推荐系统。与音视频推荐系统相比,文本推荐的研究则要长久一些,主要原因在于文本内容一直都是互联网资源的主要部分。通常,文本文件都会通过一系列关键词进行描述,这些关键词可以从历史数据、URLs和搜索引擎中获取[86]。因此,基于关键词的推荐方法是文本推荐最常用的方式,信息恢复中常用的概率模型也被广泛应用到文本内容的推荐系统中。这种方式往往将文本资源转换成矢量。矢量中每个元素通常用来描述关键词,包括其使用频率和所在位置。例如,AMALTHAEA通过检查主机的浏览记录来提取关键词,然后通过信息恢复来找出用户的兴趣点。在此基础上,系统引入CB的方法来比较Web和浏览页面的相似性[65]。除了用CB之外,CF方法也经常用来对用户评估的内容进行打分[66][67]。例如新闻推荐系统News Dude采用CF来为用户的短暂兴趣进行建模,笑话推荐系统Eigentaste也采用CF来获取用户的兴趣点。在利用关键词的推荐系统中,除了采用CF和CB方法之外,k临近方法、贝叶斯方法和基于图的方法也经常采用。近年来,一些研究者开始使用本体和语义知识的方式来分析数据,并构建相应的基于关键词的推荐系统,以提高系统的准确性[68]。除了关键词之外,一些学者还利用用户的反馈信息来构建相应的推荐系统。ACR News Vectors则构建页面推荐模型,该模型是建立在用户对页面的浏览频率和停留时间的基础上的[69]

显然,上述资源服务推荐系统旨在管理和组织Web服务内容,节约用户繁重的搜索时间和工作。对于音频,利用标签和CF的方法在各类推荐系统中占据主导地位。对于视频,基于贝叶斯分类器、二分树和语义分析的人工智能技术被广泛使用,这些方法通常需要结合CF与CB一起使用,共同构建推荐系统。而对于文本内容,常见的几类推荐方法,如CB、CF、基于记忆的和基于模型的方法都被广泛使用。近年来,基于社会网络分析、内容认知技术和传统的CF和CB技术融合使用,共同构建推荐系统逐渐开始成为热点。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈