理论教育 出版学领域: 出版物语义增强

出版学领域: 出版物语义增强

时间:2023-08-08 理论教育 版权反馈
【摘要】:Rich HTML是近年来最常见的出版物语义增强形式。

出版学领域: 出版物语义增强

出版物语义增强也是属于语义出版研究的一部分,其目标是通过一系列诸如数据可视化、可变图表、外部知识库链接等手段,实现STM出版从单一的PDF文章或HTML页面向动态更新、扩展性强、集成多种多媒体资源的出版形式转变,形成各种增强型出版物或Rich HTML格式文档。

2.4.1 出版物语义增强的基本形式

2009年,SURF基金会在一份报告中第一次明确定义了增强型出版物(Enhanced Publication)的概念[89]。增强型出版物是以集成研究数据、辅助材料、数据记录、公开发表的出版物等为增强手段,实现对传统出版物的延伸与扩展。Hoogerwerf认为增强型出版物的结构是以对象为基础(Object-based Structure)的,不同对象之间存在着显性关联,对象泛指各种多媒体要素和文本块,如声音、图像、视频、用户评论以及数据库[90]

Rich HTML是近年来最常见的出版物语义增强形式。英国皇家化学学会(RSC)[91]、爱思唯尔(Elsevier)[92]、自然(Nature)等出版机构均基于Rich HTML进行了初步的出版物增强实验,并开发了相应的富语义出版模型,诸如the future article、anywhere article、smart content等。目前,《细胞》(Cell)、《分子生物系统》(Molecular BioSystems)、《自然·化学》(Nature Chemistry)等期刊均对论文内容的描述能力进行了增强,并提供了所有参考文献的链接,同时也采用通用的数据描述规范发布文献信息,实现开放访问。除此之外,部分期刊还对文献内部知识实体提供语义标注,同时也借助诸如JavaScript、HTML5等技术,实现文献内容的可计算、可视化、可交互。

总的来说,出版物语义增强按增强目标的不同可以分为两类:一类是面对文献信息的语义增强,包括文献内容的关联与集成、文献基本信息及文献内容的规范化描述、文献内容知识实体的语义标注等;另一类则针对文献内容的多维展示,借助多媒体实现文献内容的可计算、可视化,增强文本的交互性

2.4.2 增强型出版物

增强型出版物的研究最早可追溯到1998年,Kircz等人提出了文献的模块化模型(modular model)[93]。在将数字出版视为一系列文本、图像、音视频的组合之后,Kircz认为文献可以拆分成诸如摘要、问题描述、方法论等一系列独立的模块,每个具有相同属性的模块之间可以进行聚合,这是增强型出版物的基础模型。Hunter等人在2008年提出了科学出版物包(Scientific Publication Packages,SPPs)的概念[94]。与模块化模型类似,SPPs也强调出版物是由不同模块构成,但更加重视在文献内部的工作流模块,如实验过程。SPPs以实验数据为核心,将与之关联的基础知识、背景信息、实验方法、实验过程、实验反馈等信息集中在一个包裹(packages)内,进而将其视为一个数字对象(digital object),便于进一步的重组。SPPs打破了传统文献的界限,集成了文献内与文献外的多种信息。(www.daowen.com)

2010年以来,学界与业界逐渐就增强型出版物的作用及增强手段达成了共识,主要包括:集成研究材料、内容的不同形式表达、科学实验的重现及评价等。最近几个具有代表性的增强型出版系统均不同程度地实现了以上几点要求。

Utopia[95]是由牛津大学的Attwood等人开发的一款阅读器。它是为了将科学文献与研究数据连接起来而开发的一种增强型出版物系统。Utopia系统主要实现了以下几种功能:①添加解释。Utopia与领域知识本体以及维基百科等网络资源相结合,可以对文献内的术语、实体进行解释。②可交互内容及辅助性数据。Utopia可以将静态的内容转变为动态内容,传统PDF文档中静态的图表、图像通过Utopia系统中可转化为动态、可交互的对象,以提高数据的利用程度。③链接源文献。Utopia自动将参考文献与源文献相连接,简化了科研人员寻找相关文献的过程。

2009年,爱思唯尔曾实施了Article of the Furture项目[96]。该项目确定了三个着力点,分别是丰富文献展示形式、丰富文献内容和添加文献背景信息。爱思唯尔使用了三栏式的用户界面设计,将检索、正文阅读、附加信息集成在同一阅读环境内,以丰富文献展示形式。文献内容的丰富则是通过将特定领域的研究工具和实验内容嵌入文章来实现。文献背景信息包括了参考文献、知识实体的详细解释、相关的数据集等。

2014年,Bardi及Manghi提出了一个管理特定领域内增强型出版物的信息系统模型(如图6所示),即增强型出版物信息系统(Enhanced Publication Information System,EPISs)[97][98],同时也提出了增强型出版物的一般性数据模式以及元数据格式。

图6 增强型出版物元模型[98]

除以上研究外,Garcia等人还提出了BioTea模型[99]。Breure等人的Rich Internet Publications[100]也在一定程度上实现了增强型出版物的核心功能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈