语义出版(semantic publishing)的概念最早由David Shotton在2009年提出,他认为,语义出版的目标是实现在线文档资源中数据、信息和知识的识别、抽取、整合与再利用[1]。之后,语义出版的概念逐渐扩散开来,并得到学界认同。Peroni在分析了多人关于语义出版的观点之后指出,语义出版是借助语义网技术及其他相关技术对科学文献进行语义增强,以实现对文章信息可操作性和交互性的提升,文章关联度的提高,文献内知识资源聚合程度的提高以及出版流程的改进,进而在机器可读的基础上实现知识的自动发现[2]。2011年,语义出版的概念被引入我国,王晓光介绍了语义出版形式和研究进展,并指出语义出版是运用语义网相关技术向用户提供科学知识的智能发布、个性化获取和共享处理的一种新兴科学交流系统模型,它有四种明显的特点,分别是内容结构化、数据融合化、信息可视化以及对象关联化[3][4]。同年,徐丽芳等人在总结全球科技出版发展趋势时认为,语义出版的理想状态是在庞大语义网基础之上,利用相关技术将科学论文文献与数据关联,并引入相应的领域本体,支持用户的非线性阅读[5]。张晓林认为,语义出版需要在科学内容创作与出版时,对其中的知识对象与知识关系进行鉴别和标引,并把逻辑解析与结果作为内容出版的有机组成部分[6]。
语义出版的概念虽然产生时间不长,但其目标是信息资源组织者的长期追求。从本质上讲,语义出版是对文献学家Paul Otlet、情报学先驱Vannevar Bush、情报学家Bertram C.Brookes等人的知识网络概念的具象化实现。在实际操作上,语义出版借助数据清洗、数据挖掘等手段,使用自然语言处理、本体、语义网等技术,自动识别文本中出现的实体、概念术语、命题观点,并建立跨篇章的语义链接,在词、篇章、内容的逻辑结构3个层面上实现对期刊论文的精确分析和关联[7]。(www.daowen.com)
语义出版在自然科学和人文领域的应用,正在配合e-science、数字学术(digital scholarship)以及数字人文(digital humanities)的发展推动现代科学知识生产和科学交流走向新的高度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。