理论教育 学术出版内容检索现状:出版学研究进展

学术出版内容检索现状:出版学研究进展

时间:2023-08-08 理论教育 版权反馈
【摘要】:3.1.2高级检索高级检索属于各平台为用户提供的内容检索和推荐功能的新研究成果的体现,反映各平台对当前推荐技术应用的程度,包括高级检索和语义关联两部分。

学术出版内容检索现状:出版学研究进展

3.1.1 基本检索

基本检索是各类检索技术的最初形式,能从数据库中获得信息,也是内容推荐的基础,调查的十种学术数据库出版平台都提供这一功能,但从表现形式上来看,存在一定差别。阿帕比主要提供电子图书的检索,用户可以在“全部资料”和“全部图书”两类资源库中依据书名、作者、出版社、ISBN、目录和正文限制检索范围。进入页面后,左侧按中图法分类,选择某一细分类别后,该类图书默认按出版年份从久到近排列。特色功能:用户注册后,可拥有自己的个人图书馆,管理自己的借阅、检索器、评论、打分、推荐等个人信息。万方提供的基本检索依据数据库类型进行了细分,包括学术论文、期刊、学位、会议、外文文献专利、标准、地方志、成果、法规、机构、图书、专家、学者,以提高内容检索和推荐的准确性。此外,万方检索基础页面左侧边栏支持按学科分类、论文类型、年份、按刊分类等条件细分检索范围。维普的基本检索中资源库限制包括时间、期刊范围(核心期刊,EI,SCI等)、学科;检索词可以为任意字段、题名、关键字、文摘、作者、第一作者、机构、刊名、分类号、参考文献、作者简介、基金资助、栏目信息。二次检索时可以选择在结果中检索、在结果中添加和在结果中去除,相当于在两个检索条件中的“与”“或”“非”的关系。CALIS联合目录中心数据库的简单检索提供按照全面检索、题名、责任者、主题、分类号、所有标准号码、ISBN、ISSN搜索。在页面的左侧,用户可进一步筛选中文/日文/西文数据库、责任者、资源类型、丛书题名、统一题名、学科分类、出版日期和语种,并标有相应的信息数量,操作方便,为不会使用“与”“或”“非”的用户提供人性化服务。超星数字图书馆将基本检索简化为快速检索,以异常简单的方式并以书名、作者、主题词和中图法的全部图书分类目录进行检索。也可点击“在结果中检索”进行二次查询。从超星快速搜索栏右下角可直接超链接到读秀图书检索系统。EI(Engineering Compendex)的基础检索则有所不同,它在compendex(计算机化工程检索)数据库中设置三个检索词,范围可以是不限、题目摘要、作者、作者所属单位、题名、EI分类码、分类编号、会议信息、会议代码、ISSN、EI控制项等;此外,它还可在三个检索条件之间设置“与”“或”“非”三种逻辑,以提供相应的逻辑关系检索。ScienceDirect的简单检索界面分为上下两个区,即检索策略输入区和检索结果的限定区。检索策略可在输入区中选择所有字段、文章标题、文摘、作者、期刊名等字段输入,再利用限定区,限定检索结果的出版时间、命中结果数及排序方式,而后点击“Search the Collections”按钮检索。左侧有出版年份、期刊名、话题、文档类型(期刊、图书、参考文献)等过滤条件,方便进一步筛选。如图1以“digital publishing”为关键词,共搜索到221008条信息,点击“See image results”则文章中的相关图片被单独摘出,共1079条记录。

Web of science的基本检索界面简洁,可以自主增加检索词,且检索语句间为“与”“或”“非”的布尔逻辑运算,并列的检索条件数量不限,可限制主题、标题、作者、作者识别号、团体作者、编者、出版物名称、DOI、出版年、地址、机构扩展、会议、语种、文献类型等,另外可在下方设置时间跨度,如本周、最近2周、最近4周、本年迄今、最近五年以及年份跨度。例如检索2015年出版的主题为“digital publishing”的论文,可得到800多条信息,默认按照时间顺序排列,如图2所示。如在结果中检索,限制在“social science”类型中,则只剩下9条记录,按相关性排列后,仔细观察可知Web of science是基于关键词的相关性检索。

图1 ScienceDirect基本检索界面

图2 Web of science基本检索界面

SpringerLink电子期刊数据库是德国施普林格世界著名科技出版集团公司的产品,通过SpringerLink系统提供学术期刊及电子图书的在线服务,主要收录1996年至今的期刊,按学科分为12个在线图书馆。其基本检索是在检索主页左上角的一个基本检索框,输入检索词后可在右边栏选定不同的文档类型(文章、章节、参考书、系类书、期刊等)、学科门类、学科分支、语言等进一步筛选检索记录。例如搜索大数据,可得505553条记录,如图3所示,点击“data published”可以选定出版时间段。

图3 SpringerLink电子期刊数据库检索基本页面

中国知网的简单检索可把关键词限制在全文、主题、篇名、作者、单位、关键词、参考文献、中图分类号,如检索“曹操”全文,则题名中没有曹操的文章中从《三国演义》到新编电视剧《三国》也在记录之列。右侧边栏可进一步在结果中限制文献来源和关键词,如图4所示。

3.1.2 高级检索(www.daowen.com)

高级检索属于各平台为用户提供的内容检索和推荐功能的新研究成果的体现,反映各平台对当前推荐技术应用的程度,包括高级检索和语义关联两部分。从用户界面来看,阿帕比的高级检索包含书名、作者、出版社、ISBN、目录、正文等检索条件,且条件间可选择“与”和“或”的逻辑。出版时间有前推时间点、时间区间和后退时间点三种限制方式。万方的高级检索可以限定期刊类型,高级检索中可限定主题、题名、关键字、创作者、作者单位、摘要、日期、DOI(数字对象唯一标识符)、期刊刊名和期数、学位及其专业、学位授予单位、导师等信息、外文期刊名等条件。三条检索条件之间,可设置“与”“或”“非”的检索逻辑。另外,还为有能力输入检索语句的用户提供“专业搜索”框。同时,支持在现有检索结果中进一步限定标题、作者、关键词、年份区间进行二次检索。亦可导出检索历史(txt格式)。

图4 中国知网检索基本界面

从检索页面的显示上看,超星主要提供电子图书的检索,用户可以在“全部资料”和“全部图书”两类资源库中依据书名、作者、出版社、ISBN、目录和正文限制检索范围。进入检索页面后,左侧按中图法分类,选择某一细分类别后,该类图书默认按出版年份从久到近排列。除了上述基本检索功能外,超星数字图书馆还提供了“与”和“或”两种逻辑关系与前推时间点、时间区间以及后退时间点等三种时间限制的检索,以提高检索的准确度。此外,超星还对注册读者的借阅、检索、评论、打分等功能提供个性化管理动能。不同于超星数字图书馆,万方数字库出版对检索做了较为详细的细分,包括学术论文、期刊、学位、会议、外文文献、专利、标准、地方志、成果、法规、机构、图书、专家、学者,而且还支持按学科分类、论文类型、年份、按刊分类等条件细分检索范围,以确保检索效率和准确性。除了上述基础检索之外,万方甚至还可以限定期刊类型、主题、题名、关键字、创作者、作者单位、摘要、日期、DOI(数字对象唯一标识符)、期刊刊名和期数、学位及其专业、学位授予单位、导师等信息、外文期刊名等条件。与超星相类似,万方也提供了“与”“或”和“非”等检索逻辑。在上述缩小检索范围和提供逻辑关系检索之外,万方还支持在现有检索结果中进一步限定标题、作者、关键词、年份区间进行二次检索。亦可导出检索历史(txt格式),如图5所示。维普的高级检索支持五个检索条件,且检索之间可限定“与”“或”“非”,在更多检索条件中可以限定时间区间和更新时间、专业、期刊范围,或直接输入检索式。由此可见,维普的检索功能做得相当全面、细致人性化,如图6所示。其语义关联检索包含在高级检索之中,即高级检索框的右侧按钮支持同义词、同名/合著作者、分类表、相关机构、期刊导航等相关字段推荐。能较为准确地根据关键词的语义分析推荐相关的一些词汇,以备用户检索参考。

图5 万方高级检索页面

CALIS联合目录中心数据库的高级检索可以按照全面检索、题名、责任者、责任者模糊、主题、出版者、出版地、期刊题名、丛编题名、统一题名、个人责任者、团体责任者、会议名称、分类号、所有标准号码、ISBN ISSN ISRC、记录控制号等检索词查询,最多可输入三项检索词,默认逻辑运算方式为“与”,也可以在复选框中选择“或”“非”。默认的检索匹配方式为前方一致,也可以在复选框中选择:精确匹配或包含;选择分类号检索点,可以点击“中图分类号表”按钮浏览,选中的分类号将自动填写到检索词输入框中;支持限制性检索,限制性检索的文献类型可选择:普通图书、连续出版物、中文古籍,默认为全部类型;限制性检索的内容特征可选择:统计资料、字典词典、百科全书,默认为全部;可通过输入出版时间对检索结果进行限定,例如:选择“介于之间”并输入“1998—2000”,即检索1998年至2000年出版的文献;检索词与限制性检索之间为“与”的关系,如图7所示。CALIS联合目录中心数据库也使用语义相关检索,以“曹阿瞒”为关键词,前十条均有“曹操”直接相关,说明系统可以识别“曹阿瞒=曹操”。若换成“曹孟德”,除第一条因责任者叫“曹孟德”以外,其他都与曹操有关。

图6 维普高级检索页面图

图7 CALIS联合目录中心数据库高级检索界面

超星数字图书馆的高级检索检索项有书名、作者和主题词三项,三条检索句之间的逻辑关系是“并且”和“或”,可以限制出版年代区间和每页显示记录条数,并依照出版日期或书名,按升序或降序排列。检索范围为中图法的全部图书分类目录。EI提供专业检索和同义词检索选定数据库后,用户可输入检索词,设定时间段、排序方式,并设置历史检索语句之间的“与”“或”“非”关系,实现多步骤精确查找。同时,右侧浏览目录中包含了对作者、作者所属单位、语言、来源文章、文档类型、出版商、处理类型的索引功能。选择“browse”可浏览与检索词相关的其他推荐词汇,以方便后续的检索操作。ScienceDirect也提供高级检索,在简单检索的界面或检索结果的界面中,点击左侧的“advanced search”进入高级检索界面。高级检索除了摘要、关键词、作者、来源期刊、题名、参考文献、ISSN(国际标准刊号)、所属单位等检索字段外,还包含两个检索条件,检索条件间是“与”“或”“非”的逻辑关系。用户可选择在所有数据库中检索,可以选择期刊、报纸、参考书、图片等具体的类型。并可将检索范围进一步限制在收藏、订阅的出版者、开放存取的文章中。最下面还提供了常用的学科类别。Web of Science除了基本检索之外,还提供高级检索和作者检索。其高级检索使用字段标识、布尔运算符、括号和检索结果集来创建检索式。字段标示表在界面右侧已经给出,检索框下方可通过语种、文献类型和时间跨度来限制检索结果。作者检索是Web of Science中比较特殊的一项检索功能,通过输入作者姓名、研究领域和所属单位来查找在库的作者信息。SpringerLink电子期刊及电子图书服务平台在使用高级检索时,点击搜索框旁边的“设置”按钮,可进入高级搜索,SpringerLink电子期刊数据库的高级检索项简单明确,一问一答,内容全名、关键短语、至少一个词、排除某词、标题所含地点、作者/编者姓名、出版时间段。需要限制就填写,检索条件越多搜索越精确。中国知网在提供基础检索的基础上,还提供高级检索、专业检索和语义关联检索等三种高级模式。使用高级检索时,输入内容检索条件主题、主题、篇名、作者、单位、关键词、参考文献、中图分类号等,选择词频和检索词间的“与”“或”“非”布尔逻辑关系,输入检索控制条件:发表时间、文献来源、支持基金、作者、作者单位,可以直接检索也可在结果中检索。输入专业检索语法表达式,用户亦可定制直接的专业检索式;另外检索功能还包括作者发文检索、科研基金检索、句子检索、文献来源检索。以“曹孟德”和阿瞒为关键词都可以搜到与曹操高度相关的信息,说明中国知网运用了语义检索。点开第二条记录“阿瞒如意十二生肖系列”所讲内容是一种阿瞒酒而不是曹操,由此可见语义检索和关键词检索兼而有之,语义还不是很精确。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈