邓仲华 黄 鑫
【摘 要】交流是科学的重要组成部分,科学交流随着科学的发展而发展。过去,传统的科学交流过程以纸质文献为主体。现在,科学交流受到开放存取理念的影响正在发生巨大的变革。未来,数据密集型科研范式为科学交流的发展指明了方向。本文介绍了科学交流的基本概念,研究了科学交流模型的演变及发展,开放存取理念对科学交流的影响,以及数据密集型科研范式环境下的科学交流未来发展趋势。
【关键词】科学交流 科学交流模型 开放存取 数据密集型科学
Scholarly Communication Development Research
Zhonghua Deng Xin Huang
(School of Information Management,Wuhan University)
【Abstract】Communication is an important part of science,the development of scholarly communication is along with the development of science.In the past,the traditional scholarly communication process use paper as the main body.Now,scholarly communication is affected by the concept of open access is undergoing tremendous changes.In the future,data intensive scientific research paradigm will point out thedirection for the development of scholarly communication.This paper introduces the basic concept of scholarly communication,studies the evolution and development of scholarly communication model,the influences of open access on the scholarly communication and the future of scholarly communication under the influence of data-intensive scientific paradigm.
【Keywords】scientific research scientific research model open access data-intensive science
1 引 言
科学交流和科学密不可分,在科学的发展历程中,科学交流也呈现着与之相适应的形态。传统的科学交流是以期刊为核心,包括从研究开始、研究结束、稿件提交、专家评审、最终论文出版和保存的一系列过程。在网络和数字技术出现以后,科学发展日新月异,对科学交流的需求也与日俱增,传统的科学交流模式已经不能满足数字科研环境下的科学交流需求,于是诞生了电子期刊、电子预印本、学术博客、电子会议等以网络为基础的科学交流模式。之后,开放存取理念的提出、机构知识库的建立再次极大地推动了科学交流的发展。在开放存取理念的影响下,科学论文出版时间缩短,论文引用速度和引用率提高,科学交流更具效率。而近年来随着数据采集成本的下降,科研数据呈现爆发式增长,科学在朝着计算化和数据化的方向发展,科学研究在经历了以自然实验为主的第一范式实验科学、以理论的假设推理为主的第二范式理论科学和以计算模拟为主的第三范式实验科学之后,进入了以数据为核心的数据密集型科学研究范式时代[1],在数据密集型科研范式的影响下,以数据为核心的科学交流体系将成为未来的发展趋势。
2 科学交流的概述
2.1 科学交流的定义
科学的研究过程需要大量的数据、信息和知识交换,科学交流渗透于科学成果的产生、认证、传播和保存的整个过程。英国的诺贝尔生理学与医学奖获得者Francis Crick 曾于1979年指出“科学的精要是交流”[2]。苏联科学情报学者米哈依洛夫在1976年给出科学交流的定义:“人类社会中提供、传递和获取科学情报的过程是科学赖以存在和发展的基本机制,这些过程被统称为科学交流”[3]。同期,1979年伽尔维在“Communication:The Essence of Science”一文中认为科学交流即是科学家在科研活动中发生的信息交互活动[4]。较新的定义则是由2014年美国大学与研究图书馆协会给出的:科学交流(scholarly communication)是一个通过其进行科学成果的创作、评价、传播以及保存以促进学术发展和共享的系统[5]。
2.2 科学交流的功能
在科学交流的发展历程中,学者们对科学交流功能的定义较为一致。F.Rowland 在“Print journals:Fit for the future?”一文中将科学交流的功能概括为:①信息传播( dissemination of information),是科学交流的基本功能;② 质量控制(quality control),包括同行评审和筛选;③规范化存档(the canonical archive),建立规范化标准,保存科学成果;④认定(recognition of authors),对作者的科学贡献进行认定并授予荣誉[4]。而后H.E.Roosendaal 等在“Forces and functions in scientific communication:An analysis of their interplay”一文中指出科学交流系统必须执行五点功能:①注册(registration),用于确定科学发现和学术成果的优先权,这些成果通常体现在科研工作者创作的科学出版物中;②认证(certification),利用质量评价体系和相关科学标准对已注册的科学发现和科研成果进行检验以确定其质量和价值;③通告(awareness),向科学系统中的科研工作者通告最新的声明和发现,确保科研工作者可以及时获取最新的研究成果;④存档(archiving),长期保存科学记录供未来使用,图书馆在科学记录存档中扮演了非常重要的角色;⑤奖励(rewards),根据发表刊物级别的不同以及被引用情况来对科研工作者进行奖励[5]。
2.3 科学的正式交流和非正式交流
美国社会科学家Menzel[8]系统研究了科学交流过程,较早地提出了科学的“正式交流过程”和“非正式交流过程”。Menzel 认为,正式交流过程是借助科学文献进行科学交流的过程,例如科学图书、科学译文、科学报告以及科技说明书等,而非正式交流过程则是指科学家之间的对话、参观、演讲、讨论等。之后,联合国教科文组织和国际科学联盟理事会ICSU 合作提出了UNISIST 科学交流模型,同样将科学交流分为正式交流、非正式交流和表单交流,而其中的核心则是正式交流。同期,俄罗斯情报科学家米哈依洛夫认为区分正式交流和非正式交流的依据在于科学过程是否涉及科学文献的交流,并提出了非正式交流的五种过程和正式交流的四种过程[3]。
科学研究进入Web2.0时代之后,Web2.0时代的科学正式交流不再局限于图书、期刊、报纸、会议文献、技术报告、学位论文、专利等渠道,新的渠道例如数据库、电子期刊、电子图书、电子报纸、电子版工具书以及权威网站等可靠信息源也在科学正式交流过程中发挥着重要作用[9]。另外,Søndergaard 将在线数字交流归类为科学正式交流之中[10],包括预印本数据库、全文数据库、出版站点、科学研究服务器、虚拟图书馆、搜索引擎以及元数据搜索工具等形式。其中,预印本是指在正式出版之前或在同行评议之前就在互联网上发布的文献,传播速度快是它的最大优势。科学的正式交流过程作为科学交流的中心,徐佳宁[11]总结了科学正式交流过程的特点:①服务面广;②汇集知识多样化;③文献经过同行评议,可靠性高;④科学知识更为完整、系统;⑤科学知识妥善保存,方便他人重用和检索。
相对于科学的正式交流过程,科学的非正式交流过程是指正式交流之外的,仅发生于信息创造者和信息接收者之间,不借助正式的文献系统和专业工作者的交流过程。非正式交流过程在形式上具有偶然性,在内容上具有广泛性和多样性,既包括未经审核的初步实验数据,也包括未经验证的科学假想,既可以是隐性知识,也可以是显性知识。传统的非正式交流形式主要有交谈、书信、电话、参观访问等,而在Web2.0时代,电子邮件、学术论坛、学术博客、维基百科等非正式交流形式正在被科学家广泛使用。科学非正式交流过程的特点有:①传播速度快。相对于正式交流过程的提交、接收、审核直到出版发布的繁琐流程,非正式交流的传播更为直接快速。②信息互动性强。学术博客、维基百科等非正式科学交流平台为科学家提供了实时的反馈和互动功能,思想的碰撞有利于促进科研进程的推进。③推动学术信息的自组织。通过个人科学观点、科学数据、科学猜想等在网络上的发布及互动,科学信息经过自组织而变得有序化,逐渐形成科学资源体系[12]。
2.4 科学交流的系统结构
Gerhard Fröhlich 认为科学交流过程具有系统性[13]。Poultney和Van Raan 认为科学交流具有双重系统结构:第一重是免费的科学交流空间,例如预印本等初步交流方式,它的特点是拥有较快的科学传播速度;第二重则是以正式出版物为主的科学交流空间,包括同行评议、认证、科学成果的保存等。相对于第一重免费交流空间,第二重交流空间拥有更为正式的评价和存档功能[14][15]。此外,徐丽芳提出了科学交流的多维子系统结构,将科学交流系统划分为科学信息发生子系统、科学信息出版子系统、科学信息组织子系统、科学信息传递子系统、科学信息保存子系统、科学信息检索子系统以及科学信息吸收利用子系统等[16]。
3 科学交流的模型发展
模型是简化并认识对象的有效手段,复杂的自然现象和社会现象可以通过建立模型得到简明的揭示和反映。在科学交流活动中,随着科学的发展,科学交流模型也在不断变化,自20世纪70年代以来,科学家对科学交流模型的研究从未中断。最早在1970年由Garvey 和Griffith 通过对心理学领域科学交流的观察,提出了Garvey-Griffith 科学交流模型[4],初步探索了科学交流的通用过程。次年联合国教科文组织UNESCO 和国际科学联盟发布了UNISIST科学交流模型,描述了信息通过多种方式从生产者到使用者的过程。2003年Fjordback Søndergaard 等人对UNISIST 模型进行了扩展,并提出了Søndergaard 模型[17][18]。2005年瑞典经济商业管理学院的Björk 教授发布了科学交流的生命周期模型[19](Scholarly Communication Life-cycle model,即SCLC 模型),从赞助研发、开始研究、交流成果和知识应用四个环节来描述科学交流的整个过程。近年来,基于开放存取OA 的科学交流模型成为研究热点,Herbert Van de Sompel 通过对在线预印本数据库arXiv 中科学信息交流路径的研究提出了科学交流的通用路径模型[20],黄如花[21]于2008年提出了基于开放存取出版技术的科学信息交流供应链模型,蔡迎春[22]以机构知识库为中心提出了基于开放式存取OA 的网络结构科学交流模型。
3.1 Garvey-Griffith 科学交流模型
20世纪70年代,约翰霍普金斯大学的Garvey 和Griffith 通过对心理学领域科学家的研究提出了Garvey-Griffith 模型[12],如图1所示。
作为最早被总结概括的科学交流模型,Garvey-Griffith 模型描述了从研究开始、研究完成、举办学术讨论会、稿件提交和预印本发布、审核之后的期刊出版、创建索引以及年度评审等一系列科学研究活动。此外,该模型最早发现了科学非正式交流过程在科学交流系统中的重要作用,并将其纳入模型中。
图1 Garvey-Griffith 的科学交流模型
Garvey-Griffith 模型对科学交流的基础过程作了较为全面的概况,但由于其并非诞生于计算机普及的时代,模型里没有涉及网络环境下的科学交流元素。Hurd 研究了网络环境下的科学交流过程,对Garvey-Griffith 模型进行了多次修正。他于1996年引入了电子会议、电子预印本、科学服务器、数据库和电子出版等元素,以原模型为框架构建了网络时代的Garvey-Griffith 模型[23]。2004年,他再次以“大科学”时代为基础,引入开放获取、网络自出版、跨库链接和机构知识库等新元素,并定义了数字环境中的科研工作者、图书馆、图书馆员、出版商等角色在科学交流过程中的具体工作内容,提出了数字时代的Garvey-Griffith 科学交流模型[24]。如图2所示。
Hurd 不仅在模型中强调了电子预印本、机构知识库、开放存档、参考文献链接等元素在数字时代科学交流体系中的重要性,还定义了科学家、多级出版商、大学、图书馆和图书馆员、专业组织以及新的参与者在科学交流系统中的职能。①科学家:创建并通过服务器列表、网络会议、预印本存档和网页来传播新知识;②多级出版商:出版电子期刊和数据库、支持通过参考文献链接的知识获取、打破按期出版、发展搜索引擎、提供回溯服务;③大学:与SPARC 合作、建立机构知识库、建立电子预印本库、建立科学家个人网站、管理本地知识;④图书馆和图书馆员:对科学资源授权、组织和帮助资源获取、引导信息搜寻、为科研访问者提供技术支持、新出版模式的合作和软件开发、建立数字馆藏、数字内容存档;⑤专业组织:举办实体的和虚拟会议、SPARC 合作者、多级电子文献出版、电子内容存档;⑥新参与者:DOI 注册、整合内容、开放存取。
图1 Garvey-Griffith 的科学交流模型
Garvey-Griffith 模型对科学交流的基础过程作了较为全面的概况,但由于其并非诞生于计算机普及的时代,模型里没有涉及网络环境下的科学交流元素。Hurd 研究了网络环境下的科学交流过程,对Garvey-Griffith 模型进行了多次修正。他于1996年引入了电子会议、电子预印本、科学服务器、数据库和电子出版等元素,以原模型为框架构建了网络时代的Garvey-Griffith 模型[23]。2004年,他再次以“大科学”时代为基础,引入开放获取、网络自出版、跨库链接和机构知识库等新元素,并定义了数字环境中的科研工作者、图书馆、图书馆员、出版商等角色在科学交流过程中的具体工作内容,提出了数字时代的Garvey-Griffith 科学交流模型[24]。如图2所示。
Hurd 不仅在模型中强调了电子预印本、机构知识库、开放存档、参考文献链接等元素在数字时代科学交流体系中的重要性,还定义了科学家、多级出版商、大学、图书馆和图书馆员、专业组织以及新的参与者在科学交流系统中的职能。①科学家:创建并通过服务器列表、网络会议、预印本存档和网页来传播新知识;②多级出版商:出版电子期刊和数据库、支持通过参考文献链接的知识获取、打破按期出版、发展搜索引擎、提供回溯服务;③大学:与SPARC 合作、建立机构知识库、建立电子预印本库、建立科学家个人网站、管理本地知识;④图书馆和图书馆员:对科学资源授权、组织和帮助资源获取、引导信息搜寻、为科研访问者提供技术支持、新出版模式的合作和软件开发、建立数字馆藏、数字内容存档;⑤专业组织:举办实体的和虚拟会议、SPARC 合作者、多级电子文献出版、电子内容存档;⑥新参与者:DOI 注册、整合内容、开放存取。
图1 Garvey-Griffith 的科学交流模型
Garvey-Griffith 模型对科学交流的基础过程作了较为全面的概况,但由于其并非诞生于计算机普及的时代,模型里没有涉及网络环境下的科学交流元素。Hurd 研究了网络环境下的科学交流过程,对Garvey-Griffith 模型进行了多次修正。他于1996年引入了电子会议、电子预印本、科学服务器、数据库和电子出版等元素,以原模型为框架构建了网络时代的Garvey-Griffith 模型[23]。2004年,他再次以“大科学”时代为基础,引入开放获取、网络自出版、跨库链接和机构知识库等新元素,并定义了数字环境中的科研工作者、图书馆、图书馆员、出版商等角色在科学交流过程中的具体工作内容,提出了数字时代的Garvey-Griffith 科学交流模型[24]。如图2所示。
Hurd 不仅在模型中强调了电子预印本、机构知识库、开放存档、参考文献链接等元素在数字时代科学交流体系中的重要性,还定义了科学家、多级出版商、大学、图书馆和图书馆员、专业组织以及新的参与者在科学交流系统中的职能。①科学家:创建并通过服务器列表、网络会议、预印本存档和网页来传播新知识;②多级出版商:出版电子期刊和数据库、支持通过参考文献链接的知识获取、打破按期出版、发展搜索引擎、提供回溯服务;③大学:与SPARC 合作、建立机构知识库、建立电子预印本库、建立科学家个人网站、管理本地知识;④图书馆和图书馆员:对科学资源授权、组织和帮助资源获取、引导信息搜寻、为科研访问者提供技术支持、新出版模式的合作和软件开发、建立数字馆藏、数字内容存档;⑤专业组织:举办实体的和虚拟会议、SPARC 合作者、多级电子文献出版、电子内容存档;⑥新参与者:DOI 注册、整合内容、开放存取。
图2 Hurd 提出的数字时代科学交流模型
Hurd 修正后的Garvey-Griffith 模型对科学交流活动中信息流动过程以及交流路径的改变作了准确的概括,及时地反映了科学交流系统变革,促进了电子预印本、开放式存取、机构知识库等科学交流新模式的发展,定义了数字环境下各角色在科学交流系统中应发挥的作用。但相比于其他科学交流模型,该模型过多地强调学术产品链,而较少地描述科学信息在建立索引和保存后是如何向科学信息消费者传播的。
3.2 UNISIST 科学交流模型
3.2.1 UNISIST 模型原型
UNISIST 的全称为United Nations Information System in Science and Technology,即联合国科技情报系统,是由联合国教科文组织UNESCO 和国际科学联盟ISCU 共同提出的[25]。这一模型在当时非常先进,相对于更为强调学术产品链的Garvey-Griffith 模型,UNISIST 详细描述了科学交流中不同角色之间的相互关系,以及各种类型的科学信息是如何通过多种路径从信息生产者传播至信息消费者的。如图3所示。
在UNISIST 模型中,科学交流信息分为一次信息源、二次信息源和三次信息源。其中,一次信息源是科学信息生产的起点,它的作用是选择、加工制作和发行科学信息;二次信息源旨在对一次信息源的文献进行分析、存储和传播,具体工作是登记、描述、汇集和整理一次信息源;三次信息源是对一、二次文献以后的产物进行收集、整理和评价,如专题书目、综述等。在该模型中,科学交流的参与者主要有信息生产者、信息中介和信息用户,从事写作、出版、存储、检索和利用等科学研究活动。科学信息用户与科学信息生产者通常是同一个群体,只是它们作为生产者和作为用户时的需求不同。模型中的信息中心、数据交换中心和数据中心则是信息中介,信息中心功能是同时生产二次文献和三次文献,数据交换中心的任务是分析、存储和传播非正式出版的文献,数据中心的任务是处理原始的科学信息,这些信息与出版过程并行,或者早于出版过程产生[26]。
图2 Hurd 提出的数字时代科学交流模型
Hurd 修正后的Garvey-Griffith 模型对科学交流活动中信息流动过程以及交流路径的改变作了准确的概括,及时地反映了科学交流系统变革,促进了电子预印本、开放式存取、机构知识库等科学交流新模式的发展,定义了数字环境下各角色在科学交流系统中应发挥的作用。但相比于其他科学交流模型,该模型过多地强调学术产品链,而较少地描述科学信息在建立索引和保存后是如何向科学信息消费者传播的。
3.2 UNISIST 科学交流模型
3.2.1 UNISIST 模型原型
UNISIST 的全称为United Nations Information System in Science and Technology,即联合国科技情报系统,是由联合国教科文组织UNESCO 和国际科学联盟ISCU 共同提出的[25]。这一模型在当时非常先进,相对于更为强调学术产品链的Garvey-Griffith 模型,UNISIST 详细描述了科学交流中不同角色之间的相互关系,以及各种类型的科学信息是如何通过多种路径从信息生产者传播至信息消费者的。如图3所示。
在UNISIST 模型中,科学交流信息分为一次信息源、二次信息源和三次信息源。其中,一次信息源是科学信息生产的起点,它的作用是选择、加工制作和发行科学信息;二次信息源旨在对一次信息源的文献进行分析、存储和传播,具体工作是登记、描述、汇集和整理一次信息源;三次信息源是对一、二次文献以后的产物进行收集、整理和评价,如专题书目、综述等。在该模型中,科学交流的参与者主要有信息生产者、信息中介和信息用户,从事写作、出版、存储、检索和利用等科学研究活动。科学信息用户与科学信息生产者通常是同一个群体,只是它们作为生产者和作为用户时的需求不同。模型中的信息中心、数据交换中心和数据中心则是信息中介,信息中心功能是同时生产二次文献和三次文献,数据交换中心的任务是分析、存储和传播非正式出版的文献,数据中心的任务是处理原始的科学信息,这些信息与出版过程并行,或者早于出版过程产生[26]。
图2 Hurd 提出的数字时代科学交流模型
Hurd 修正后的Garvey-Griffith 模型对科学交流活动中信息流动过程以及交流路径的改变作了准确的概括,及时地反映了科学交流系统变革,促进了电子预印本、开放式存取、机构知识库等科学交流新模式的发展,定义了数字环境下各角色在科学交流系统中应发挥的作用。但相比于其他科学交流模型,该模型过多地强调学术产品链,而较少地描述科学信息在建立索引和保存后是如何向科学信息消费者传播的。
3.2 UNISIST 科学交流模型
3.2.1 UNISIST 模型原型
UNISIST 的全称为United Nations Information System in Science and Technology,即联合国科技情报系统,是由联合国教科文组织UNESCO 和国际科学联盟ISCU 共同提出的[25]。这一模型在当时非常先进,相对于更为强调学术产品链的Garvey-Griffith 模型,UNISIST 详细描述了科学交流中不同角色之间的相互关系,以及各种类型的科学信息是如何通过多种路径从信息生产者传播至信息消费者的。如图3所示。
在UNISIST 模型中,科学交流信息分为一次信息源、二次信息源和三次信息源。其中,一次信息源是科学信息生产的起点,它的作用是选择、加工制作和发行科学信息;二次信息源旨在对一次信息源的文献进行分析、存储和传播,具体工作是登记、描述、汇集和整理一次信息源;三次信息源是对一、二次文献以后的产物进行收集、整理和评价,如专题书目、综述等。在该模型中,科学交流的参与者主要有信息生产者、信息中介和信息用户,从事写作、出版、存储、检索和利用等科学研究活动。科学信息用户与科学信息生产者通常是同一个群体,只是它们作为生产者和作为用户时的需求不同。模型中的信息中心、数据交换中心和数据中心则是信息中介,信息中心功能是同时生产二次文献和三次文献,数据交换中心的任务是分析、存储和传播非正式出版的文献,数据中心的任务是处理原始的科学信息,这些信息与出版过程并行,或者早于出版过程产生[26]。
图3 UNISIST 科学交流模型
UNISIST 模型将科学交流过程分为三种:非正式交流过程、正式交流过程和表单过程。其中,非正式交流过程包括交谈、手稿、通信等交流方式。而正式交流过程有两种:正式出版文献和未出版的文献。正式出版的文献包括图书、期刊、学位论文、专利等,它们由信息生产者创作,然后通过出版商出版,接着再通过文摘和索引服务、图书馆和信息中心等传播至信息消费者。表单过程是指表格数据交流,所交流的数据是以表格形式呈现的资料。UNISIST 模型将表单渠道作为一种独立的交流方式单独列出,是因为UNISIST认为大量的科学数据并没有在期刊、论文和著作中列出,而是存于科学家、科研团队和机构数据库中。对于表单交流渠道来说,印刷文献并非最佳载体,而当时的自动化数据库已经可以对数据进行检索、计算和处理,是表单数据交流的最佳方式。
UNISIST 科学交流原型在提出时是当时最先进的科学交流模型,它完整地描述了科学交流过程中科学信息是如何从信息生产者通过各种渠道向信息用户传播的。但它是针对自然科学提出的,没有将人文社会科学交流模型列入其中,对于各个学科之间的差异也没有加以区分。
3.2.2 Søndergaard 改进后的UNISIST 模型
20世纪90年代之后,随着Internet 的普及,科学交流发生了巨大的变革,基于Internet 的科学交流成为最普遍的交流方式。UNISIST 模型原型虽然在当时已经非常完备和先进,但其并没有涉及基于网络的数字化时代交流方式,也没有考虑学科间的差异问题。为了解决这个问题,北欧科学家Søndergaard 于2003年提出了UNISIST 模型的三种改良模型:基于互联网的UNISIST 科学交流模型、反映数字交流和传统交流并适用于一切学科领域的UNISIST 通用科学交流模型以及反映学科差异并针对某一学科的UNISIST 学科交流模型[18]。
基于互联网的UNISIST 模型描述了网络环境下的科学正式交流过程和非正式交流过程。科学非正式交流过程包括电子邮件、服务器列表、电子会议或网络会议、新闻组等。而科学正式交流过程则包括在线预印本库、书目和全文数据库、科研组织的服务器、出版商网站、虚拟图书馆、搜索引擎或者元搜索工具等。该模型对科学正式交流过程中的科学文献作出定义:①电子期刊和在线期刊。Søndergaard 认为电子期刊是只以电子和数字形式存在的期刊,而在线期刊则是纸质期刊的网络版本。在网络科学交流时代的早期,此类期刊的科学价值难以被验证,只能属于迅速传递信息的非正式交流过程,但现在随着加入同行评议的数字期刊越来越多,电子期刊和在线期刊的科学价值可以得到认证,已经归属于科学正式交流过程。②预印本。预印本是在正式出版之前或者在同行评议之前就发布的文献,较快的传播速度是其优点。近年来,随着电子预印本服务器的建立,电子预印本这一科学交流方式得到广泛应用。③灰色文献和未出版文献。例如学位论文、报告等,常见于机构服务器上。这类文献的获取更为容易,费用也较低。基于互联网的UNISIST 科学交流模型在原模型的基础上去除了数据中心,添加了各种网络环境中的新技术,如预印本数据库、虚拟图书馆、搜索引擎、元数据搜索引擎、网络主题目录和数据交换中心等,更为完整地描述了网络时代的科学信息交流过程。
UNISIST 通用科学交流模型把互联网上的各种组织单元和文献单元并行添加进原模型,将原模型和基于互联网的UNISIST 模型进行整合,组成了包含网络交流过程和传统交流过程的多回路交流模型。在该模型中,信息流在传统交流通道和网络交流通道上同时流动,从信息生产者向信息用户扩散。该模型认为:即使是在网络环境中,科学交流仍然应该分为正式交流过程和非正式交流过程。对于网络时代新兴的科学交流元素,应该根据它们在现实中的用法来将其归纳进正式交流过程和非正式交流过程。在该模型中,科学非正式交流过程和科学正式交流过程的划分与基于互联网的UNISIST模型相近,科学非正式交流过程包括电子邮件、邮件列表服务器、新闻组、电子会议或网络视频会议等方式,正式交流过程则包括预印本数据库、书目或全文数据库、科研组织服务器、出版商网站、搜索引擎和元搜索引擎等方式。一、二、三次文献的说法得以沿用,但在一次文献中增添了书评这种正式交流方式,在二次文献中增加了词典和叙词表,在三次文献中增加了手册和百科全书等。而且,该模型试图打通模型的学科适用性。社会科学和自然科学的交流方式并不相同,对于社会科学而言,学术专著和书评具有不可替代的作用,而对于自然科学来说,科研数据、期刊论文则是重点。通用UNISIST 科学交流模型基于互联网技术新增加了多种信息机构和文献种类,阐述了网络时代各个学科的信息交流过程,衍生了针对特定学科差异的UNISIST 学科交流模型。
UNISIST 学科交流模型是反映某一具体学科领域科学信息交流情况而设计的UNISIST 修正模型[17]。如图4所示。
图3 UNISIST 科学交流模型
UNISIST 模型将科学交流过程分为三种:非正式交流过程、正式交流过程和表单过程。其中,非正式交流过程包括交谈、手稿、通信等交流方式。而正式交流过程有两种:正式出版文献和未出版的文献。正式出版的文献包括图书、期刊、学位论文、专利等,它们由信息生产者创作,然后通过出版商出版,接着再通过文摘和索引服务、图书馆和信息中心等传播至信息消费者。表单过程是指表格数据交流,所交流的数据是以表格形式呈现的资料。UNISIST 模型将表单渠道作为一种独立的交流方式单独列出,是因为UNISIST认为大量的科学数据并没有在期刊、论文和著作中列出,而是存于科学家、科研团队和机构数据库中。对于表单交流渠道来说,印刷文献并非最佳载体,而当时的自动化数据库已经可以对数据进行检索、计算和处理,是表单数据交流的最佳方式。
UNISIST 科学交流原型在提出时是当时最先进的科学交流模型,它完整地描述了科学交流过程中科学信息是如何从信息生产者通过各种渠道向信息用户传播的。但它是针对自然科学提出的,没有将人文社会科学交流模型列入其中,对于各个学科之间的差异也没有加以区分。
3.2.2 Søndergaard 改进后的UNISIST 模型
20世纪90年代之后,随着Internet 的普及,科学交流发生了巨大的变革,基于Internet 的科学交流成为最普遍的交流方式。UNISIST 模型原型虽然在当时已经非常完备和先进,但其并没有涉及基于网络的数字化时代交流方式,也没有考虑学科间的差异问题。为了解决这个问题,北欧科学家Søndergaard 于2003年提出了UNISIST 模型的三种改良模型:基于互联网的UNISIST 科学交流模型、反映数字交流和传统交流并适用于一切学科领域的UNISIST 通用科学交流模型以及反映学科差异并针对某一学科的UNISIST 学科交流模型[18]。
基于互联网的UNISIST 模型描述了网络环境下的科学正式交流过程和非正式交流过程。科学非正式交流过程包括电子邮件、服务器列表、电子会议或网络会议、新闻组等。而科学正式交流过程则包括在线预印本库、书目和全文数据库、科研组织的服务器、出版商网站、虚拟图书馆、搜索引擎或者元搜索工具等。该模型对科学正式交流过程中的科学文献作出定义:①电子期刊和在线期刊。Søndergaard 认为电子期刊是只以电子和数字形式存在的期刊,而在线期刊则是纸质期刊的网络版本。在网络科学交流时代的早期,此类期刊的科学价值难以被验证,只能属于迅速传递信息的非正式交流过程,但现在随着加入同行评议的数字期刊越来越多,电子期刊和在线期刊的科学价值可以得到认证,已经归属于科学正式交流过程。②预印本。预印本是在正式出版之前或者在同行评议之前就发布的文献,较快的传播速度是其优点。近年来,随着电子预印本服务器的建立,电子预印本这一科学交流方式得到广泛应用。③灰色文献和未出版文献。例如学位论文、报告等,常见于机构服务器上。这类文献的获取更为容易,费用也较低。基于互联网的UNISIST 科学交流模型在原模型的基础上去除了数据中心,添加了各种网络环境中的新技术,如预印本数据库、虚拟图书馆、搜索引擎、元数据搜索引擎、网络主题目录和数据交换中心等,更为完整地描述了网络时代的科学信息交流过程。
UNISIST 通用科学交流模型把互联网上的各种组织单元和文献单元并行添加进原模型,将原模型和基于互联网的UNISIST 模型进行整合,组成了包含网络交流过程和传统交流过程的多回路交流模型。在该模型中,信息流在传统交流通道和网络交流通道上同时流动,从信息生产者向信息用户扩散。该模型认为:即使是在网络环境中,科学交流仍然应该分为正式交流过程和非正式交流过程。对于网络时代新兴的科学交流元素,应该根据它们在现实中的用法来将其归纳进正式交流过程和非正式交流过程。在该模型中,科学非正式交流过程和科学正式交流过程的划分与基于互联网的UNISIST模型相近,科学非正式交流过程包括电子邮件、邮件列表服务器、新闻组、电子会议或网络视频会议等方式,正式交流过程则包括预印本数据库、书目或全文数据库、科研组织服务器、出版商网站、搜索引擎和元搜索引擎等方式。一、二、三次文献的说法得以沿用,但在一次文献中增添了书评这种正式交流方式,在二次文献中增加了词典和叙词表,在三次文献中增加了手册和百科全书等。而且,该模型试图打通模型的学科适用性。社会科学和自然科学的交流方式并不相同,对于社会科学而言,学术专著和书评具有不可替代的作用,而对于自然科学来说,科研数据、期刊论文则是重点。通用UNISIST 科学交流模型基于互联网技术新增加了多种信息机构和文献种类,阐述了网络时代各个学科的信息交流过程,衍生了针对特定学科差异的UNISIST 学科交流模型。
UNISIST 学科交流模型是反映某一具体学科领域科学信息交流情况而设计的UNISIST 修正模型[17]。如图4所示。
图3 UNISIST 科学交流模型
UNISIST 模型将科学交流过程分为三种:非正式交流过程、正式交流过程和表单过程。其中,非正式交流过程包括交谈、手稿、通信等交流方式。而正式交流过程有两种:正式出版文献和未出版的文献。正式出版的文献包括图书、期刊、学位论文、专利等,它们由信息生产者创作,然后通过出版商出版,接着再通过文摘和索引服务、图书馆和信息中心等传播至信息消费者。表单过程是指表格数据交流,所交流的数据是以表格形式呈现的资料。UNISIST 模型将表单渠道作为一种独立的交流方式单独列出,是因为UNISIST认为大量的科学数据并没有在期刊、论文和著作中列出,而是存于科学家、科研团队和机构数据库中。对于表单交流渠道来说,印刷文献并非最佳载体,而当时的自动化数据库已经可以对数据进行检索、计算和处理,是表单数据交流的最佳方式。
UNISIST 科学交流原型在提出时是当时最先进的科学交流模型,它完整地描述了科学交流过程中科学信息是如何从信息生产者通过各种渠道向信息用户传播的。但它是针对自然科学提出的,没有将人文社会科学交流模型列入其中,对于各个学科之间的差异也没有加以区分。
3.2.2 Søndergaard 改进后的UNISIST 模型
20世纪90年代之后,随着Internet 的普及,科学交流发生了巨大的变革,基于Internet 的科学交流成为最普遍的交流方式。UNISIST 模型原型虽然在当时已经非常完备和先进,但其并没有涉及基于网络的数字化时代交流方式,也没有考虑学科间的差异问题。为了解决这个问题,北欧科学家Søndergaard 于2003年提出了UNISIST 模型的三种改良模型:基于互联网的UNISIST 科学交流模型、反映数字交流和传统交流并适用于一切学科领域的UNISIST 通用科学交流模型以及反映学科差异并针对某一学科的UNISIST 学科交流模型[18]。
基于互联网的UNISIST 模型描述了网络环境下的科学正式交流过程和非正式交流过程。科学非正式交流过程包括电子邮件、服务器列表、电子会议或网络会议、新闻组等。而科学正式交流过程则包括在线预印本库、书目和全文数据库、科研组织的服务器、出版商网站、虚拟图书馆、搜索引擎或者元搜索工具等。该模型对科学正式交流过程中的科学文献作出定义:①电子期刊和在线期刊。Søndergaard 认为电子期刊是只以电子和数字形式存在的期刊,而在线期刊则是纸质期刊的网络版本。在网络科学交流时代的早期,此类期刊的科学价值难以被验证,只能属于迅速传递信息的非正式交流过程,但现在随着加入同行评议的数字期刊越来越多,电子期刊和在线期刊的科学价值可以得到认证,已经归属于科学正式交流过程。②预印本。预印本是在正式出版之前或者在同行评议之前就发布的文献,较快的传播速度是其优点。近年来,随着电子预印本服务器的建立,电子预印本这一科学交流方式得到广泛应用。③灰色文献和未出版文献。例如学位论文、报告等,常见于机构服务器上。这类文献的获取更为容易,费用也较低。基于互联网的UNISIST 科学交流模型在原模型的基础上去除了数据中心,添加了各种网络环境中的新技术,如预印本数据库、虚拟图书馆、搜索引擎、元数据搜索引擎、网络主题目录和数据交换中心等,更为完整地描述了网络时代的科学信息交流过程。
UNISIST 通用科学交流模型把互联网上的各种组织单元和文献单元并行添加进原模型,将原模型和基于互联网的UNISIST 模型进行整合,组成了包含网络交流过程和传统交流过程的多回路交流模型。在该模型中,信息流在传统交流通道和网络交流通道上同时流动,从信息生产者向信息用户扩散。该模型认为:即使是在网络环境中,科学交流仍然应该分为正式交流过程和非正式交流过程。对于网络时代新兴的科学交流元素,应该根据它们在现实中的用法来将其归纳进正式交流过程和非正式交流过程。在该模型中,科学非正式交流过程和科学正式交流过程的划分与基于互联网的UNISIST模型相近,科学非正式交流过程包括电子邮件、邮件列表服务器、新闻组、电子会议或网络视频会议等方式,正式交流过程则包括预印本数据库、书目或全文数据库、科研组织服务器、出版商网站、搜索引擎和元搜索引擎等方式。一、二、三次文献的说法得以沿用,但在一次文献中增添了书评这种正式交流方式,在二次文献中增加了词典和叙词表,在三次文献中增加了手册和百科全书等。而且,该模型试图打通模型的学科适用性。社会科学和自然科学的交流方式并不相同,对于社会科学而言,学术专著和书评具有不可替代的作用,而对于自然科学来说,科研数据、期刊论文则是重点。通用UNISIST 科学交流模型基于互联网技术新增加了多种信息机构和文献种类,阐述了网络时代各个学科的信息交流过程,衍生了针对特定学科差异的UNISIST 学科交流模型。
UNISIST 学科交流模型是反映某一具体学科领域科学信息交流情况而设计的UNISIST 修正模型[17]。如图4所示。
图4 Søndergaard 修正的UNISIST 学科交流模型
在该模型中,Søndergaard 加入了很多数字环境中的科学交流新技术和新元素,科学的非正式交流过程包括传统会议、新闻组、列表服务器、电子邮件、电子会议或网络会议、公告牌等,而科学的正式交流过程包括未正式出版发行的论文报告、电子期刊、电子图书馆、虚拟图书馆、搜索引擎、在线期刊、预印本等。该模型认为,科学交流中的每个角色元素都是在为了达到共同目标、解决共同问题而组织起来的相互合作的群体,每个特定的学科领域都有其独特的交流结构、交流方式和出版物,建立科学交流模型的目标是对每个学科独特的交流体系和结构进行详细描述,区分不同领域的科学信息交流路径,检验每一种信息元素和交流过程角色对于该学科所具有的价值。因此,该模型是一个完全基于学科分析的科学交流模型,通过将整个学科交流模型用虚线椭圆包括来表示一个特定的学科领域。椭圆之外的输入和输出则表示学科领域之间通常是开放且相互联系的,由此形成了由自然科学和人文社会科学组成的科学整体。
总的来说,UNISIST 原型及Søndergaard 的改进模型都可谓是较为完整的科学交流模型。UNISIST 原型最早明确将科学正式交流过程和科学非正式交流过程写入到模型中,强调了以正式交流过程和非正式交流过程为主的科学交流方式。此外,它还最早对科学信息交流过程中的各种机构和角色任务进行了明确的界定,为科学信息交流模型的发展提供了坚实的理论基础。而Søndergaard 的改进使得UNISIST 模型在网络和数字时代仍然具有较好的适应性和很高的理论价值。
3.3 科学交流的生命周期模型SCLC
科学交流的生命周期模型 SCLC 的全称为 Scientific Communication Lifecycle Model,是2000年到2006年欧盟资助的科学信息交流自组织机构库SciX 和芬兰科学院资助的开放科学交流OACS 两个项目的共同研究成果,由芬兰的Björk 教授于2004年首次提出[27]。2005年发展至第三版本[28]。2007年,Björk 再次对模型进行升级[19]。其A0综合图如图5所示。
图4 Søndergaard 修正的UNISIST 学科交流模型
在该模型中,Søndergaard 加入了很多数字环境中的科学交流新技术和新元素,科学的非正式交流过程包括传统会议、新闻组、列表服务器、电子邮件、电子会议或网络会议、公告牌等,而科学的正式交流过程包括未正式出版发行的论文报告、电子期刊、电子图书馆、虚拟图书馆、搜索引擎、在线期刊、预印本等。该模型认为,科学交流中的每个角色元素都是在为了达到共同目标、解决共同问题而组织起来的相互合作的群体,每个特定的学科领域都有其独特的交流结构、交流方式和出版物,建立科学交流模型的目标是对每个学科独特的交流体系和结构进行详细描述,区分不同领域的科学信息交流路径,检验每一种信息元素和交流过程角色对于该学科所具有的价值。因此,该模型是一个完全基于学科分析的科学交流模型,通过将整个学科交流模型用虚线椭圆包括来表示一个特定的学科领域。椭圆之外的输入和输出则表示学科领域之间通常是开放且相互联系的,由此形成了由自然科学和人文社会科学组成的科学整体。
总的来说,UNISIST 原型及Søndergaard 的改进模型都可谓是较为完整的科学交流模型。UNISIST 原型最早明确将科学正式交流过程和科学非正式交流过程写入到模型中,强调了以正式交流过程和非正式交流过程为主的科学交流方式。此外,它还最早对科学信息交流过程中的各种机构和角色任务进行了明确的界定,为科学信息交流模型的发展提供了坚实的理论基础。而Søndergaard 的改进使得UNISIST 模型在网络和数字时代仍然具有较好的适应性和很高的理论价值。
3.3 科学交流的生命周期模型SCLC
科学交流的生命周期模型 SCLC 的全称为 Scientific Communication Lifecycle Model,是2000年到2006年欧盟资助的科学信息交流自组织机构库SciX 和芬兰科学院资助的开放科学交流OACS 两个项目的共同研究成果,由芬兰的Björk 教授于2004年首次提出[27]。2005年发展至第三版本[28]。2007年,Björk 再次对模型进行升级[19]。其A0综合图如图5所示。
图4 Søndergaard 修正的UNISIST 学科交流模型
在该模型中,Søndergaard 加入了很多数字环境中的科学交流新技术和新元素,科学的非正式交流过程包括传统会议、新闻组、列表服务器、电子邮件、电子会议或网络会议、公告牌等,而科学的正式交流过程包括未正式出版发行的论文报告、电子期刊、电子图书馆、虚拟图书馆、搜索引擎、在线期刊、预印本等。该模型认为,科学交流中的每个角色元素都是在为了达到共同目标、解决共同问题而组织起来的相互合作的群体,每个特定的学科领域都有其独特的交流结构、交流方式和出版物,建立科学交流模型的目标是对每个学科独特的交流体系和结构进行详细描述,区分不同领域的科学信息交流路径,检验每一种信息元素和交流过程角色对于该学科所具有的价值。因此,该模型是一个完全基于学科分析的科学交流模型,通过将整个学科交流模型用虚线椭圆包括来表示一个特定的学科领域。椭圆之外的输入和输出则表示学科领域之间通常是开放且相互联系的,由此形成了由自然科学和人文社会科学组成的科学整体。
总的来说,UNISIST 原型及Søndergaard 的改进模型都可谓是较为完整的科学交流模型。UNISIST 原型最早明确将科学正式交流过程和科学非正式交流过程写入到模型中,强调了以正式交流过程和非正式交流过程为主的科学交流方式。此外,它还最早对科学信息交流过程中的各种机构和角色任务进行了明确的界定,为科学信息交流模型的发展提供了坚实的理论基础。而Søndergaard 的改进使得UNISIST 模型在网络和数字时代仍然具有较好的适应性和很高的理论价值。
3.3 科学交流的生命周期模型SCLC
科学交流的生命周期模型 SCLC 的全称为 Scientific Communication Lifecycle Model,是2000年到2006年欧盟资助的科学信息交流自组织机构库SciX 和芬兰科学院资助的开放科学交流OACS 两个项目的共同研究成果,由芬兰的Björk 教授于2004年首次提出[27]。2005年发展至第三版本[28]。2007年,Björk 再次对模型进行升级[19]。其A0综合图如图5所示。
图5 SCLC 模型——A0综合图:研究、交流、成果的运用
SCLC 模型是基于图形化建模语言IDEF0建立的,IDEF0建模语言可以以结构化的方式来描述系统功能和各功能之间的相互关系,为使用者提供更为直观的结构化图形以了解系统的运作方式和各功能所需的各项资源。通过使用IDEF0建模语言,SCLC 模型详细的阐释了科学交流中的科学研究过程、交流过程和成果应用活动,目的是为政策制定者提供了一个详细的路线图,涵盖从开始研究到应用研究成果再到改善日常生活的整个科学交流价值链。SCLC 模型包括科学正式交流过程、非正式交流过程以及原始数据的出版,重点关注以正式出版物为主的科学正式交流过程,例如同行评议期刊的出版索引过程、用户获取文献的活动、开放获取期刊和电子预印本文库等网络数字时代新的交流方式。SCLC 模型有五大要素:活动、输入、输出、机制和控制。整个科学交流过程分为资助研发、进行研究、交流成果和应用知识四阶段,每一个阶段都有自己的输入、输出、控制和机制。而每个阶段的子活动又可以分解为不同的子阶段,同样具有自己的输入、输出、控制和机制,以此构成等级式的图表。例如,A0结构图中的资助研发阶段又可以分为 A11、A12…… 阶 段,而 A11阶 段 又 可 以 分 为 A111、A112……阶段。SCLC 的7.0模型版本一共包含53个图表,190个活动。2008年,英国联合信息系统委员会JISC 资助的澳大利亚维多利亚大学和英国拉夫堡大学两个团队对SCLC 模型进行修正升级,提出了科学出版的经济模型EI-ASPM[29]。相对于原型,该经济模型对SCLC 模型中每处活动的花费作了经济分析,从经济和利益的角度重新描述了SCLC 模型。
相比较于Garvey-Griffith 模型和UNISIST 模型,SCLC 生命周期模型同样加入了数字时代的科学交流元素,不同的是:它将科学交流过程结构化和层次化,并从经济和利益的角度对科学交流过程中的各个活动、输入、输出、控制和机制进行评估和分析。
3.4 基于开放存取OA 的科学交流模型
3.4.1 基于电子预印本库arXiv 的科学交流通用路径模型
数字时代的科学交流环境正在变化,开放存取OA、电子预印本库、机构知识库等技术对科学交流系统产生了深远的影响。2004年,Van de Sompel 等人将科学交流系统的注册、确认、认知、归档、奖励五种功能与数字技术融合,在开放存取理念的影响下,以电子预印本库arXiv 为基础,从价值链的角度提出了科学交流的通用路径模型[20]。如图6所示。
该模型描绘了某一科学交流单元从提交进入arXiv,然后经过各个功能节点的过程,包括注册提交个人成果、验证该成果的有效性、发布并扩散其研究成果、保存研究成果以及通过评价获得奖励。每一个箭头代表一个信息流,箭头的方向指示了进入系统后的交流单元在科学交流系统中的演变过程。
图5 SCLC 模型——A0综合图:研究、交流、成果的运用
SCLC 模型是基于图形化建模语言IDEF0建立的,IDEF0建模语言可以以结构化的方式来描述系统功能和各功能之间的相互关系,为使用者提供更为直观的结构化图形以了解系统的运作方式和各功能所需的各项资源。通过使用IDEF0建模语言,SCLC 模型详细的阐释了科学交流中的科学研究过程、交流过程和成果应用活动,目的是为政策制定者提供了一个详细的路线图,涵盖从开始研究到应用研究成果再到改善日常生活的整个科学交流价值链。SCLC 模型包括科学正式交流过程、非正式交流过程以及原始数据的出版,重点关注以正式出版物为主的科学正式交流过程,例如同行评议期刊的出版索引过程、用户获取文献的活动、开放获取期刊和电子预印本文库等网络数字时代新的交流方式。SCLC 模型有五大要素:活动、输入、输出、机制和控制。整个科学交流过程分为资助研发、进行研究、交流成果和应用知识四阶段,每一个阶段都有自己的输入、输出、控制和机制。而每个阶段的子活动又可以分解为不同的子阶段,同样具有自己的输入、输出、控制和机制,以此构成等级式的图表。例如,A0结构图中的资助研发阶段又可以分为 A11、A12…… 阶 段,而 A11阶 段 又 可 以 分 为 A111、A112……阶段。SCLC 的7.0模型版本一共包含53个图表,190个活动。2008年,英国联合信息系统委员会JISC 资助的澳大利亚维多利亚大学和英国拉夫堡大学两个团队对SCLC 模型进行修正升级,提出了科学出版的经济模型EI-ASPM[29]。相对于原型,该经济模型对SCLC 模型中每处活动的花费作了经济分析,从经济和利益的角度重新描述了SCLC 模型。
相比较于Garvey-Griffith 模型和UNISIST 模型,SCLC 生命周期模型同样加入了数字时代的科学交流元素,不同的是:它将科学交流过程结构化和层次化,并从经济和利益的角度对科学交流过程中的各个活动、输入、输出、控制和机制进行评估和分析。
3.4 基于开放存取OA 的科学交流模型
3.4.1 基于电子预印本库arXiv 的科学交流通用路径模型
数字时代的科学交流环境正在变化,开放存取OA、电子预印本库、机构知识库等技术对科学交流系统产生了深远的影响。2004年,Van de Sompel 等人将科学交流系统的注册、确认、认知、归档、奖励五种功能与数字技术融合,在开放存取理念的影响下,以电子预印本库arXiv 为基础,从价值链的角度提出了科学交流的通用路径模型[20]。如图6所示。
该模型描绘了某一科学交流单元从提交进入arXiv,然后经过各个功能节点的过程,包括注册提交个人成果、验证该成果的有效性、发布并扩散其研究成果、保存研究成果以及通过评价获得奖励。每一个箭头代表一个信息流,箭头的方向指示了进入系统后的交流单元在科学交流系统中的演变过程。
图5 SCLC 模型——A0综合图:研究、交流、成果的运用
SCLC 模型是基于图形化建模语言IDEF0建立的,IDEF0建模语言可以以结构化的方式来描述系统功能和各功能之间的相互关系,为使用者提供更为直观的结构化图形以了解系统的运作方式和各功能所需的各项资源。通过使用IDEF0建模语言,SCLC 模型详细的阐释了科学交流中的科学研究过程、交流过程和成果应用活动,目的是为政策制定者提供了一个详细的路线图,涵盖从开始研究到应用研究成果再到改善日常生活的整个科学交流价值链。SCLC 模型包括科学正式交流过程、非正式交流过程以及原始数据的出版,重点关注以正式出版物为主的科学正式交流过程,例如同行评议期刊的出版索引过程、用户获取文献的活动、开放获取期刊和电子预印本文库等网络数字时代新的交流方式。SCLC 模型有五大要素:活动、输入、输出、机制和控制。整个科学交流过程分为资助研发、进行研究、交流成果和应用知识四阶段,每一个阶段都有自己的输入、输出、控制和机制。而每个阶段的子活动又可以分解为不同的子阶段,同样具有自己的输入、输出、控制和机制,以此构成等级式的图表。例如,A0结构图中的资助研发阶段又可以分为 A11、A12…… 阶 段,而 A11阶 段 又 可 以 分 为 A111、A112……阶段。SCLC 的7.0模型版本一共包含53个图表,190个活动。2008年,英国联合信息系统委员会JISC 资助的澳大利亚维多利亚大学和英国拉夫堡大学两个团队对SCLC 模型进行修正升级,提出了科学出版的经济模型EI-ASPM[29]。相对于原型,该经济模型对SCLC 模型中每处活动的花费作了经济分析,从经济和利益的角度重新描述了SCLC 模型。
相比较于Garvey-Griffith 模型和UNISIST 模型,SCLC 生命周期模型同样加入了数字时代的科学交流元素,不同的是:它将科学交流过程结构化和层次化,并从经济和利益的角度对科学交流过程中的各个活动、输入、输出、控制和机制进行评估和分析。
3.4 基于开放存取OA 的科学交流模型
3.4.1 基于电子预印本库arXiv 的科学交流通用路径模型
数字时代的科学交流环境正在变化,开放存取OA、电子预印本库、机构知识库等技术对科学交流系统产生了深远的影响。2004年,Van de Sompel 等人将科学交流系统的注册、确认、认知、归档、奖励五种功能与数字技术融合,在开放存取理念的影响下,以电子预印本库arXiv 为基础,从价值链的角度提出了科学交流的通用路径模型[20]。如图6所示。
该模型描绘了某一科学交流单元从提交进入arXiv,然后经过各个功能节点的过程,包括注册提交个人成果、验证该成果的有效性、发布并扩散其研究成果、保存研究成果以及通过评价获得奖励。每一个箭头代表一个信息流,箭头的方向指示了进入系统后的交流单元在科学交流系统中的演变过程。
图6 基于电子预印本库arXiv 的科学交流模型
该模型与传统学术交流模型的区别是该模型将数字化技术和开放存取理念融入到学术交流的每个节点功能之中。在注册节点,该模型允许科学家将自己的手稿提交至电子预印本库中;在验证节点,该模型提供了一种经由潜在提交者同行评议的验证渠道,另外,其他志愿者的评议也同样作为验证标准;在通知节点,该模型通过开放已经提交的手稿、允许搜索引擎索引内容,以及将研究成果通知相关学者等数字化方式来实现认知功能;在存档节点,通过对分布式镜像系统的操作来确保科研成果的有效备份;在奖励节点,传统的学术评价是通过作者在ISI 收录的期刊中发表论文的次数及其影响因子等方式来确定奖励的标准,而该模型使用了一个支持在线搜索的引文搜索引擎CiteBase,它可以在科研成果注册时对其监控,也可以提取科研成果的引用指标,从而确定科研奖励的标准。
基于arXiv 的科学交流模型是一个通用的路径模型,它从科学交流的注册、验证、通知、存档和奖励五个功能的角度描述了开放存取理念下科学交流的基本步骤,具有很强的数字化特征[30]。
3.4.2 基于开放存取出版技术的科学交流供应链模型
科学信息的出版作为科学交流的重要环节,正随着科学交流的发展而发生巨大变革,基于开放存取OA 的科学出版技术已经受到学术界、图书馆界和出版界的广泛关注。开放存取出版技术作数字时代的新型出版技术,打破了传统出版行业中出版商对科学交流信息的垄断,进一步满足了数字时代科学研究人员对科学信息交流更高层次的需求,对科学信息交流产生了深远的影响。2008年,黄如花等针对传统科学交流体系中出版模式的弊端,结合数字时代开放存取出版技术对科学信息交流过程中各个环节的影响,提出了开放存取环境下科学信息的供应链模型[21]。如图7所示。
图6 基于电子预印本库arXiv 的科学交流模型
该模型与传统学术交流模型的区别是该模型将数字化技术和开放存取理念融入到学术交流的每个节点功能之中。在注册节点,该模型允许科学家将自己的手稿提交至电子预印本库中;在验证节点,该模型提供了一种经由潜在提交者同行评议的验证渠道,另外,其他志愿者的评议也同样作为验证标准;在通知节点,该模型通过开放已经提交的手稿、允许搜索引擎索引内容,以及将研究成果通知相关学者等数字化方式来实现认知功能;在存档节点,通过对分布式镜像系统的操作来确保科研成果的有效备份;在奖励节点,传统的学术评价是通过作者在ISI 收录的期刊中发表论文的次数及其影响因子等方式来确定奖励的标准,而该模型使用了一个支持在线搜索的引文搜索引擎CiteBase,它可以在科研成果注册时对其监控,也可以提取科研成果的引用指标,从而确定科研奖励的标准。
基于arXiv 的科学交流模型是一个通用的路径模型,它从科学交流的注册、验证、通知、存档和奖励五个功能的角度描述了开放存取理念下科学交流的基本步骤,具有很强的数字化特征[30]。
3.4.2 基于开放存取出版技术的科学交流供应链模型
科学信息的出版作为科学交流的重要环节,正随着科学交流的发展而发生巨大变革,基于开放存取OA 的科学出版技术已经受到学术界、图书馆界和出版界的广泛关注。开放存取出版技术作数字时代的新型出版技术,打破了传统出版行业中出版商对科学交流信息的垄断,进一步满足了数字时代科学研究人员对科学信息交流更高层次的需求,对科学信息交流产生了深远的影响。2008年,黄如花等针对传统科学交流体系中出版模式的弊端,结合数字时代开放存取出版技术对科学信息交流过程中各个环节的影响,提出了开放存取环境下科学信息的供应链模型[21]。如图7所示。
图6 基于电子预印本库arXiv 的科学交流模型
该模型与传统学术交流模型的区别是该模型将数字化技术和开放存取理念融入到学术交流的每个节点功能之中。在注册节点,该模型允许科学家将自己的手稿提交至电子预印本库中;在验证节点,该模型提供了一种经由潜在提交者同行评议的验证渠道,另外,其他志愿者的评议也同样作为验证标准;在通知节点,该模型通过开放已经提交的手稿、允许搜索引擎索引内容,以及将研究成果通知相关学者等数字化方式来实现认知功能;在存档节点,通过对分布式镜像系统的操作来确保科研成果的有效备份;在奖励节点,传统的学术评价是通过作者在ISI 收录的期刊中发表论文的次数及其影响因子等方式来确定奖励的标准,而该模型使用了一个支持在线搜索的引文搜索引擎CiteBase,它可以在科研成果注册时对其监控,也可以提取科研成果的引用指标,从而确定科研奖励的标准。
基于arXiv 的科学交流模型是一个通用的路径模型,它从科学交流的注册、验证、通知、存档和奖励五个功能的角度描述了开放存取理念下科学交流的基本步骤,具有很强的数字化特征[30]。
3.4.2 基于开放存取出版技术的科学交流供应链模型
科学信息的出版作为科学交流的重要环节,正随着科学交流的发展而发生巨大变革,基于开放存取OA 的科学出版技术已经受到学术界、图书馆界和出版界的广泛关注。开放存取出版技术作数字时代的新型出版技术,打破了传统出版行业中出版商对科学交流信息的垄断,进一步满足了数字时代科学研究人员对科学信息交流更高层次的需求,对科学信息交流产生了深远的影响。2008年,黄如花等针对传统科学交流体系中出版模式的弊端,结合数字时代开放存取出版技术对科学信息交流过程中各个环节的影响,提出了开放存取环境下科学信息的供应链模型[21]。如图7所示。
图7 开放存取环境下科学信息的供应链模型
该模型认为:①开放存取出版环境下的科学信息交流更具开放性。开放存取出版提供了开放存取期刊和作者自存档两大新型科学交流途径,还包括个人网站、学术博客、论坛、维基等多种交流途径。②开放存取出版环境下的科学信息交流更有效率。开放存取出版利用先进的数字出版技术,通过网络发布科学信息,省去传统出版模式中的排版、印刷、销售等步骤,简化了出版流程,缩短了出版周期,信息传播速度大幅增加。③开放存取出版环境下的科学信息交流具有更强的交互性。相对于传统的出版模式,开放存取出版允许科研成果作者和科学信息用户直接进行交流对话,用户可以对科研成果提出建议,而作者则可以实时的对建议作出反馈,另外,在开放存取出版环境中,科学信息的生产者和用户身份是可以相互转化的,科学信息生产者同时也是科学信息用户,而科学信息用户同时也是科学信息生产者。④开放存取出版环境下的科学信息交流内容更为丰富。开放存取出版向科研人员提供了一个科学信息交流平台,不仅包括科研论文、会议报告等传统交流内容,同时电子预印本、非结构化科研数据等科学信息的交流也更为便捷。
图7 开放存取环境下科学信息的供应链模型
该模型描述了传统出版、数字出版和开放存取出版相结合的新型科学信息交流过程,突出了科学信息作者与科学信息用户之间的直接交流。但该模型较为笼统,没有描述传统出版和数字出版的具体环节,同时也缺乏对科学信息作者和科学信息用户之间的交流过程的进一步分析[31]。
3.4.3 基于开放式存取OA 的网络结构科学交流模型
蔡迎春[22]借鉴传统文献传播系统的诸要素及交流模式,构建了一种基于OA 的网络结构学术交流模型。该模型以机构知识库IR作为科学交流的核心,描述了科研成果作者和用户之间的信息传递过程。如图8所示。
该模型认为:①开放存取出版环境下的科学信息交流更具开放性。开放存取出版提供了开放存取期刊和作者自存档两大新型科学交流途径,还包括个人网站、学术博客、论坛、维基等多种交流途径。②开放存取出版环境下的科学信息交流更有效率。开放存取出版利用先进的数字出版技术,通过网络发布科学信息,省去传统出版模式中的排版、印刷、销售等步骤,简化了出版流程,缩短了出版周期,信息传播速度大幅增加。③开放存取出版环境下的科学信息交流具有更强的交互性。相对于传统的出版模式,开放存取出版允许科研成果作者和科学信息用户直接进行交流对话,用户可以对科研成果提出建议,而作者则可以实时的对建议作出反馈,另外,在开放存取出版环境中,科学信息的生产者和用户身份是可以相互转化的,科学信息生产者同时也是科学信息用户,而科学信息用户同时也是科学信息生产者。④开放存取出版环境下的科学信息交流内容更为丰富。开放存取出版向科研人员提供了一个科学信息交流平台,不仅包括科研论文、会议报告等传统交流内容,同时电子预印本、非结构化科研数据等科学信息的交流也更为便捷。
该模型认为,传统科学文献传播系统包括交流物、交流活动、交流对象、交流技术和交流工作等基本要素。科学文献交流通过交流工作和交流技术,将文献从生产者手中传递到消费者及用户手中。该模型中的A、B、C 三个过程指的是科学文献的生产领域、服务领域和利用领域,它们之间是相互连接和紧密结合的。在开放式存取环境下,机构知识库作为交流技术和交流工作的统一体,其交流物即是通过知识积聚而存储在机构知识库中的数字版本科学成果,交流对象则是学术研究成果的作者和用户。与传统文献交流模式不同的是,该模型融合了新型数字化技术,能够自动完成科研成果的提交、审核、存储、索引等过程,通过检索、浏览、下载等知识传递活动,实现知识共享,并利用机构知识库的特点,将交流对象按研究成果生成与利用的关系划分成“用户”和“作者”,增加了过程①:用户对已发布科研成果的评价反馈;过程②:作者接收用户的反馈,不断地修缮科研成果;过程③:研究成果通过用户利用,融入其知识创造活动,推动科学研究的发展。
该模型描述了传统出版、数字出版和开放存取出版相结合的新型科学信息交流过程,突出了科学信息作者与科学信息用户之间的直接交流。但该模型较为笼统,没有描述传统出版和数字出版的具体环节,同时也缺乏对科学信息作者和科学信息用户之间的交流过程的进一步分析[31]。
3.4.3 基于开放式存取OA 的网络结构科学交流模型
蔡迎春[22]借鉴传统文献传播系统的诸要素及交流模式,构建了一种基于OA 的网络结构学术交流模型。该模型以机构知识库IR作为科学交流的核心,描述了科研成果作者和用户之间的信息传递过程。如图8所示。
该模型认为,传统科学文献传播系统包括交流物、交流活动、交流对象、交流技术和交流工作等基本要素。科学文献交流通过交流工作和交流技术,将文献从生产者手中传递到消费者及用户手中。该模型中的A、B、C 三个过程指的是科学文献的生产领域、服务领域和利用领域,它们之间是相互连接和紧密结合的。在开放式存取环境下,机构知识库作为交流技术和交流工作的统一体,其交流物即是通过知识积聚而存储在机构知识库中的数字版本科学成果,交流对象则是学术研究成果的作者和用户。与传统文献交流模式不同的是,该模型融合了新型数字化技术,能够自动完成科研成果的提交、审核、存储、索引等过程,通过检索、浏览、下载等知识传递活动,实现知识共享,并利用机构知识库的特点,将交流对象按研究成果生成与利用的关系划分成“用户”和“作者”,增加了过程①:用户对已发布科研成果的评价反馈;过程②:作者接收用户的反馈,不断地修缮科研成果;过程③:研究成果通过用户利用,融入其知识创造活动,推动科学研究的发展。
图7 开放存取环境下科学信息的供应链模型
该模型认为:①开放存取出版环境下的科学信息交流更具开放性。开放存取出版提供了开放存取期刊和作者自存档两大新型科学交流途径,还包括个人网站、学术博客、论坛、维基等多种交流途径。②开放存取出版环境下的科学信息交流更有效率。开放存取出版利用先进的数字出版技术,通过网络发布科学信息,省去传统出版模式中的排版、印刷、销售等步骤,简化了出版流程,缩短了出版周期,信息传播速度大幅增加。③开放存取出版环境下的科学信息交流具有更强的交互性。相对于传统的出版模式,开放存取出版允许科研成果作者和科学信息用户直接进行交流对话,用户可以对科研成果提出建议,而作者则可以实时的对建议作出反馈,另外,在开放存取出版环境中,科学信息的生产者和用户身份是可以相互转化的,科学信息生产者同时也是科学信息用户,而科学信息用户同时也是科学信息生产者。④开放存取出版环境下的科学信息交流内容更为丰富。开放存取出版向科研人员提供了一个科学信息交流平台,不仅包括科研论文、会议报告等传统交流内容,同时电子预印本、非结构化科研数据等科学信息的交流也更为便捷。
该模型描述了传统出版、数字出版和开放存取出版相结合的新型科学信息交流过程,突出了科学信息作者与科学信息用户之间的直接交流。但该模型较为笼统,没有描述传统出版和数字出版的具体环节,同时也缺乏对科学信息作者和科学信息用户之间的交流过程的进一步分析[31]。
3.4.3 基于开放式存取OA 的网络结构科学交流模型
蔡迎春[22]借鉴传统文献传播系统的诸要素及交流模式,构建了一种基于OA 的网络结构学术交流模型。该模型以机构知识库IR作为科学交流的核心,描述了科研成果作者和用户之间的信息传递过程。如图8所示。
该模型认为,传统科学文献传播系统包括交流物、交流活动、交流对象、交流技术和交流工作等基本要素。科学文献交流通过交流工作和交流技术,将文献从生产者手中传递到消费者及用户手中。该模型中的A、B、C 三个过程指的是科学文献的生产领域、服务领域和利用领域,它们之间是相互连接和紧密结合的。在开放式存取环境下,机构知识库作为交流技术和交流工作的统一体,其交流物即是通过知识积聚而存储在机构知识库中的数字版本科学成果,交流对象则是学术研究成果的作者和用户。与传统文献交流模式不同的是,该模型融合了新型数字化技术,能够自动完成科研成果的提交、审核、存储、索引等过程,通过检索、浏览、下载等知识传递活动,实现知识共享,并利用机构知识库的特点,将交流对象按研究成果生成与利用的关系划分成“用户”和“作者”,增加了过程①:用户对已发布科研成果的评价反馈;过程②:作者接收用户的反馈,不断地修缮科研成果;过程③:研究成果通过用户利用,融入其知识创造活动,推动科学研究的发展。
图8 基于OA 的网络结构交流模型
4 开放存取环境下的科学交流发展
4.1 开放存取的概念
开放存取OA(Open Acess)是一种学术信息免费共享的理念与出版机制,是学术交流机制演进的结果。随着科学研究进入网络和数字时代,传统的学术交流系统已经完全不能满足数字科研环境下的科学交流需求,为促进科学交流的发展、提高科学研究的效率、提升科研成果的有效利用、满足学术及出版等各界人士对科研成果自由获取与交流的迫切需求,20世纪90年代末,学术界、出版界和图书情报界发起了开放存取运动,各国政府也对此持肯定态度,以欧美为代表的发达国家和以巴西、印度、中国为代表的发展中国家先后签署了《布达佩斯开放存取倡议》 《百斯达声明》 和《柏林宣言》 等文件[32][33]。《布达佩斯开放存取声明》(BOAI)将开放存取解释为“允许用户不受经济、法律和技术的限制免费获取公共网络上的论文以进行阅读、下载、复制、打印和搜索等[34]”,开放存取作为一种新的学术交流理念正在被越来越多的国内外学术机构、图书馆和科研人员所接受。
《布达佩斯开放存取声明》 确定了开放存取期刊和开放存取仓储两种开放存取实现途径。开放存取期刊又包含纯OA 期刊和复合OA 期刊两种形式。纯OA 期刊只在网络中发行,通过作者付费或者机构赞助的方式支付论文的同行评议、稿件编辑加工、电子期刊出版等费用,而读者可以免费获取期刊论文。复合OA 期刊指一个期刊同时使用传统出版模式和开放存取出版模式,将传统期刊在数字化之后发布至网络,以提高期刊影响力。例如,美国的科学公共图书馆可为科研人员提供免费的科技期刊获取服务。OA 仓储是指科学研究机构或作者将未发表或已经在传统期刊中发表的论文等科研成果作为开放式的电子档案储存,供用户免费访问和使用,例如,电子预印本库arXiv 是一种典型的OA 仓储,作者可以在线提交个人科研成果,经同行评议和专家评议验证该成果的有效性之后,公开发布并扩散,保存研究成果以及通过评价获得奖励。
除了科学研究论文,其他的科研资源如电子图书、教学视频、课件及其他教学资料、政府信息等,也正在实现开放存取。哈佛大学可以为老师和同学提供高水平学位论文开放获取服务。麻省理工大学图书馆创建了开放课件,哈佛Berkman 中心创建了开放教学与学习资料,还有印度教育改革联盟发起的全国性的开放教育项目及中国开放教育协会创建的各种开放资源等。在政府信息资源开放获取方面,Carl Malamud 于2007年5月启动的Public Resource Org 项目,专注于收集美国政府部门发布的公共领域的信息,并提供开放获取[35]。
4.2 开放存取环境下的科学交流发展
4.2.1 开放存取科学交流系统的优势
相对于传统科学交流系统,开放存取环境下的科学交流系统拥有诸多优势。李金林[36]等从系统意义、运行模式、论文时效性、论文严谨度、论文影响力、论文版权和用户认可度等方面将开放存取科学交流系统和传统科学交流系统相对比,认为开放存取科学交流系统在加速科研进程、扩大科学影响、提高科研效率、缩短出版时间、提高论文引用速度和引用率、提高科学交流效率等方面具有优势。①加速推动科学发展。在传统科学交流模式中,出版商作为科学交流系统中的重要角色,可以通过控制版权、付费获取获得高额利润,一定程度上延缓了科学的发展速度。而开放存取科学交流系统不以营利为目的,免费科学资源的检索、获取和传播更为直接,加速推进了科学的发展。②促进科研作者和用户之间的互动。相对于传统科学交流系统中科学信息从科研作者到信息用户的单向流动,开放存取科学交流系统可以让信息用户和科研作者进行直接沟通,信息用户可以对科研作者在线发布的研究成果即时作出评价或提出建议,科研作者则可以及时接收反馈并作出修正和升级,双方更为密切的互动交流,可以促进新思想的产生,提高科学交流效率。③提高论文引用速度和引用率,扩大科学影响。更快的出版速度会带来更快的传播速度,论文引用率和学术知名度也会更高。在传统科学交流系统中科研成果的传播需要经过提交、评审、出版、获取一系列过程,知识获取存在时滞性。而开放存取科学交流系统利用最新的网络和数字技术,简化了传统编辑工作中的校对、印刷等程序,通过网络进行投稿、审稿、返修等,缩短了科研成果的出版周期,提高了论文引用速度。马景娣[37]对ISI 引文数据库所收录的开放存取期刊进行了研究,通过对ISI 收录的239种OA 期刊的影响因子和即时指数进行比较,得出OA 期刊相对于传统印刷期刊论文引用速度更快的结论。
4.2.2 开放存取环境下的科研人员
开放存取作为数字科学环境下的科学交流新模式,很大程度上对科研人员的科研活动起到了推动和促进作用。曾元祥等[38]从信息获取、成果发表和学术影响力三个方面分析了开放存取对科研人员的影响。李金林[36]等从对科研作者和科研读者的角度分析了开放存取对科研人员的影响。
(1)更便捷的科学资源获取。
科研人员以了解研究领域内最新科研信息作为科研的起点。开放存取给科研人员获取科研信息带来了积极的影响,它能使广大的科研人员免费、快速地获取、掌握世界范围内最新的相关领域研究成果及学术发展动态。一方面,开放存取模式下机构知识库、电子预印本库的建立为科研人员提供了一个及时获取科学资源的平台,使科研人员能够更快速地了解最前沿的学术动态,满足其方便、快捷地获取科研信息的需求;另一方面,开放存取模式大大降低了科研人员获取科学资源的成本。开放存取倡导的是一种开放共享的理念,科研人员免费获取科研资源是其最主要的特征与价值所在。
(2)加速科研成果的出版。
科研成果的提交、评价和发布是科学交流过程的重要环节。开放存取的提出颠覆了传统学术科研成果的出版方式,科研成果出版速度更快,出版方式更为多元,从广度和速度上促进了科研成果的传播。
(3)加速学术影响力增长。
学术影响力很大程度上与科研成果的引用速度和引用率有关,而引用速度和引用率又取决于科研成果的传播速度和广度。在传统学术交流系统中,科技期刊发布方式单一、出版周期长、传播范围受限,研究人员学术影响力的提升受到制约,而科学交流的开放存取模式可以极大地促进科研人员及其研究成果学术影响力的提升。虽然开放存取期刊发展时间较短,但和传统印刷期刊相比,OA 期刊更高的浏览量、下载量及被引频率表明了开放存取技术会加速推进科研人员学术影响力的增长。例如,在电子工程和数学领域,发表于同一种期刊中OA 论文的平均被引次数为非OA 论文的1.5~2倍。英国联合信息系统委员会的一项调查表明,多数科研人员支持OA 期刊能够扩大其论文读者群的观点[39]。Kristin Antelman 通过对哲学、政治学、电气工程和数学4类学科领域中开放存取论文引用率的调查发现,开放获取的论文具有更大的研究影响力[40]。
目前,开放存取对科研用户特别是科学信息作者也存在一些负面影响,开放存取采用“作者付费出版、用户免费使用”的付费模式无疑会给作者增加经济压力,对于经费较为欠缺的欠发达地区研究机构问题将更为明显。长期以往可能会导致部分地区机构的科研边缘化,对科研的全球化趋势不利。
4.2.3 开放存取环境下的图书馆和科研机构
张晓蒙[41]认为,开放存取环境下的图书馆资金压力更为减缓、馆藏资源更为丰富、服务方式更为多元。图书馆收集、保存和整理已经发布的开放存取资源,或者在图书馆资源主页上提供开放存取数据库的链接,从而获得那些无需付费的科学文献,扩充图书馆的数字馆藏,这既节约了科学文献的购置费用又为丰富图书馆馆藏资源作出了重要贡献。另外,在开放存取环境下,图书馆资源内容和结构、用户信息需求以及学术交流方式都在变化,图书馆的服务也呈现着内容多样化、服务对象广泛化、服务模式集成化的趋势,并为科研用户增加了数字仓储服务、版权服务、在线出版、数据监护等服务。
孙希波[35]认为,开放存取对科研机构的影响主要体现在更高学术影响力和更密切的机构间交流两个方面。开放环境下的科研机构通过建立机构知识库、创办OA 期刊,提供机构学术成果的开放获取,在提高作者学术影响力的同时,也将提升科研机构的知名度。同时,在开放存取环境下,科学资源通过网络逐渐集中起来,形成更为开放的学术交流平台。高校和科研机构的研究人员能够便捷地获取领域内最新的研究成果,各高校和科研机构之间的学术交流活动将更加密切。
4.2.4 开放存取环境下的出版商
开放存取技术的实施给出版商带来的冲击是巨大的。孙希波[35]从科学交流地位削弱、竞争压力增大和影响力变化三个方面论述了开放存取环境下出版商的变化。首先,传统的主导地位被削弱。在传统学术交流系统中,学术期刊的出版发行必须经过出版商,出版商掌握着大量科学成果的版权。开放存取的多元化出版模式使得学术成果的出版不再必须经过出版商这一环节,削弱了出版商在科学出版中的主导地位,夺回了科学成果版权,动摇了以出版商为主导的学术交流局面。其次,竞争压力增大。在开放存取环境下,大量最新科研成果的在线免费获取在一定程度上影响了出版商的发行量和稿源,导致出版商利润的降低和市场份额的缩小,增加了出版商的生存压力。最后,科学影响力扩大。在开放存取环境下,传统出版商纷纷从单一的印刷出版转向在线出版和印刷出版的混合出版模式,出版模式的多元化无疑会增加出版商的科学影响力。
夏莉霞[42]等从出版市场主体多元化、学术出版物价格变化和版权政策三个方面研究了开放存取对出版商的影响。首先,随着OA 期刊的发展,政府、大学、研究机构等组织在科学文献出版中扮演着越来越重要的角色,传统出版商的垄断地位得以动摇。其次,学术出版物价格下降。自20世纪90年代以来,随着不断兼并和收购,商业出版者日益垄断期刊市场,大幅度提高期刊价格,导致所谓的“学术期刊危机”。而开放存取的出现极大地改善了这个问题,由于用户在网上获取学术资源十分便捷,传统学术期刊在学术研究工作中的地位降低,各大传统出版机构的期刊发行量逐年下降,迫使商业出版机构不得不降低学术期刊的价格。最后,OA 出版模式对版权的政策较为宽松,科研作者可以越过出版商直接向科研用户授权,赋予了作者和用户更多权力,促进科学信息的广泛传播。
4.3 机构知识库模式下的科学交流发展
机构知识库IR(Institutional Repository)是科研机构建立的数字仓库,用于保存机构内的科研资源,包括学术论文、实验数据、学位论文、电子预印本、科学数据库、会议录、教学课件等,它可以提供跨库的无缝检索,实现科学资源的整合并提供服务,是开放存取理念下的一种以数据库为核心的新的科学交流模式。
4.3.1 机构知识库的概念
目前有很多专家、学者对机构知识库作出了不同的定义,SPARC 高级顾问Crow 认为“机构知识库是收集与保存一所大学或多所高校研究成果的数字资源集合[43]”。麻省理工学院图书馆的Workbook 认为:“机构知识库是一个具有一系列服务功能的数据库,获取、存储、索引、保存和发布学术机构中以数字形式存在的学术研究内容[44]。”CNI 执行主任Lynch 认为:“机构知识库是数字时代学术研究的基础设施,一个大学的IR 是学校为师生员工所提供的一系列服务,目的是用于管理和发布由本机构及其成员所创造的数字资料[45]。”
4.3.2 机构知识库的科学交流功能
蔡迎春[22]通过将机构知识库和传统科学交流模式相比较,认为机构知识库作为科学交流的新模式,具有更为优越的科学交流性能、客观的分析评价功能、较强的信息反馈机制,以及便捷的知识共享功能。
①优越的科学交流性能。机构知识库所保存的科研资源的获取更为便捷,学术交流过程更具效率。
②客观的分析评价功能。IR 将机构内部所有的科研资源进行整合集成,通过对各种科研资源历史版本的保存,展现机构发展的脉络,可以用来评价机构学术能力,也可以预测机构研究趋势,加深了科研访问者对科研机构的了解。
③较强的信息反馈机制。相对于传统学术交流的简单反馈机制,IR 的学术交流反馈机制可以在科研作者和科研用户之间形成网状互动的结构,不同研究人员或研究机构的思维交汇推动着科学研究的发展,学术信息发出者与接收者之间的角色在科学交流过程中不断互换,思想的碰撞会推动科研进程,加速科研成果的产出。
④便捷的知识共享功能。为多个机构知识库内的所有科学资源设置元数据,制定统一的标记协议对其进行标记,以实现搜索引擎可以对全部机构知识库进行搜索,并以恰当的方式显示给用户,为用户提供便捷的获取途径,促进了知识的有效传递,实现知识在更广范围的共享和利用。
4.3.3 机构知识库对科学交流的推进
机构知识库的出现很大程度上推动了科学交流的发展,马漫江[46]作出了归纳:
(1)机构知识库为科学交流的发展提供了一个高效的科研资源保存和交流平台。随着科学技术的不断发展,科学成果需要被完善保存。机构知识库作为一种新的学术交流模式,它可以安全的、完整地保存机构内科学研究发展的历程。通过建立机构知识库,借助先进的管理技术,收集机构内所拥有的各种学术资源,以开放存取为理念,提供出版、发布、检索、获取等服务,可以有效推动科学交流的发展。
(2)提高科学交流效率,促进科学研究发展。机构知识库促进科学研究资源在研究人员之间免费、快速的传播,是机构知识库的一项重要功能。机构知识库在获得作者授权后,以数字形式保存并传播其研究成果,可以加速机构内学术研究成果的向外传播、展示机构科学研究的深度与广度,有效地提高了科研交流效率和机构知名度。
(3)通过收割、汇集、索引实现科学交流与资源共享。机构知识库是基于OAI-PMH 元数据收割协议的开放系统,能够处理复杂的数字对象,支持数字对象的元数据管理,保障和满足机构内外的资源服务需求。对机构知识库的元数据进行收割、汇集、索引并提供全文链接是机构知识库服务的一个重要内容。机构知识库还可以将机构外的电子预印本库、开放期刊等在线科学资源连接在一起,通过统一检索服务向科研工作者提供更为丰富的科学资源。
5 数据密集型科学研究范式环境下的科学交流发展趋势
随着以博客、社交网络、基于位置的服务LBS 为代表的新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,数据正以前所未有的速度在不断地增长和累积,科学家不仅通过对广泛的数据进行实时、动态的监测与分析来解决以前难以解决的科学难题,更是把数据作为科学研究的对象和工具,基于数据来思考、设计和实施科学研究。G.Bell[47]从生物学、天文学和物理学等学科的角度,阐述了数据的爆发式增长给科学研究带来的巨大变革。数据指引着科学未来的发展方向,如何建立以海量科学数据为核心的数据密集型科研范式是科学界关注的重大问题。在数据的洪流中,在数据密集型科研范式环境下,科学交流将迎来变革式的发展。
5.1 数据密集型科学研究范式的兴起
传统的科学研究在经历了以自然实验为主的第一范式实验科学、以理论的假设推理为主的第二范式理论科学和以计算与模拟为主的第三范式计算科学之后,迎来了数据密集型计算科学范式即科学研究第四范式[1]。
(1)第一范式实验科学。实验科学是最早出现的科研范式,大多是对自然现象进行重复实验而得到成果,少有系统的理论归纳。例如,爱迪生测试几千种材料而发明钨丝灯泡、富兰克林收集雷电而发明避雷针等都属于典型的实验科学。
(2)第二范式理论科学。理论科学是在实验科学的基础上发展而来,理论科学强调对现象的理论总结和概括,强调普遍原理的发现而不是针对单个现象的研究实验。科研流程是先由重复发生的现象提出假设理论,然后设计不同变量下的多次实验,并使用假设理论对实验结果进行预测,实验结果是否和预测结果一致以及在实验过程中产生的新现象将会检验与修正假设理论,假设理论在经过无数的实验与修正后才会上升至定理和真理。
(3)第三范式计算科学。随着20世纪计算机的发明和计算能力的不断增强,科学从理论推理转向计算仿真,计算科学被认为是实验科学和理论科学的扩展,是通过计算机分析和模拟来解决科学问题的新范式。当研究范围由微观原理发现扩大至区域复杂系统研究例如天气预报、自然灾害的预测时,计算和仿真模拟研究方法体现出巨大的优势。但随着更加精密的数据采集仪器的出现,实验数据呈现爆发式增长,由此引出了数据密集型计算科学,即科研第四范式。
(4)第四范式数据密集型计算科学。科研第四范式是以数据为核心的研究范式,数据是科学研究的对象和工具,相对于传统科学研究对精确的原始数据和严密的假设检验过程的要求,数据密集型科研范式下的科研发现不再追求绝对精确的原始数据,也不再依赖严密的假设检验过程,海量原始数据的采集能力以及云计算所带来的强大集群计算和存储资源正在建立以数据密集型计算为中心的科学研究,更多复杂无序的相关关系的发现以及学科间更为密切的交流合作产生了科学研究的新方法[48]。
5.2 科学交流模式的转变
自科学交流活动进入网络时代以来,基于网络的科学交流带来了丰富的科学交流方式和高效的资源共享体系。随着科学进入数据密集型时代,数据在科研活动中逐渐成为科学交流的核心,科学交流方式和内容也在发生转变。
(1)科学交流内容的转变。虽然数据一直以来都是科学研究中的关键因素,但传统的科学交流多以由分析处理数据而获得的研究论文作为主要交流内容,在数据密集型科研环境下,科研数据在科研活动中的重要性与日俱增,科研数据已经被认为是重要的科研成果,和科研论文同为科学交流的核心内容,各种类型的结构化、半结构化、非结构化数据,如视频、音频、图片开始嵌入到各类科研交流活动中。例如,期刊论文中不仅可以使用文字、表格、图片来记录实验,还可以使用视频、音频等数据来描述研究过程。另外,在跨学科的科学交流活动中,由于学科间的数据类型、研究方法等差异较大,数据作为科研活动的基础,此时跨学科数据交流就显得更为重要。科学界正在积极探讨并探索实施将数据集整合进科学信息系统的所有功能:数据的登记、认证、发现、存储和奖励。F.Berman[49]研究了科学家对于数据的可信赖性以及长期储存重要性的关注程度。R.Ruusalepp[50]等研究了支持共享数据发现的基础设施需求,M.Altman[51]研究了数据引用格式的标准,体现了数据作为独立的科研成果正在逐渐受到认可。
(2)科学交流方式的转变。传统方式的科学交流以科技期刊的出版、举办科学交流会议、开设学术讲座等方式为主,随着近年来信息技术的快速发展,出现了以电子期刊、电子图书馆、学术博客、学术论坛等基于网络的科学交流新形式。网络科学交流的出现很大程度上丰富了科学交流方式,例如,查询他人学术成果、下载电子图书、关注科研机构网站、RSS 科研专题订阅等交流行为也对科研活动产生了积极的影响,但也存在着资源分散、管理混乱、缺乏规范等问题。现阶段的科学交流在网络科学交流的基础上朝着开放式科学交流发展,开放式科学交流的核心是科研数据和科研论文等学术资源的开放获取,包括开放数据、开放信息、开放知识等内容,目标是实现开放创新。科研数据、软件、硬件、文献等学术成果被集成在学术平台上,科研用户通过网络从集成学术平台上主动共享或获取他人所共享的数据、软件、文献等学术资源,开放式科学交流对于消除“数据鸿沟”、推动知识创新等方面具有重要意义。而当科学进入数据密集型科研时代后,科学研究需要多领域知识的融合,科技领域之间需要建立连接,多学科研究和跨领域合作将成为科学交流的新方式,跨学科跨国界的大型科研项目合作将成为引领学科发展的核心力量[52]。
5.3 科研用户对于科学交流的新需求
科研人员只靠个体或小研究团体就能完成从数据收集到论文写作全部工作的研究方式已经衰落,而由大量的分散研究团体为了共同的项目而进行跨时间和跨空间合作的时代已经到来。在科研第四范式环境下,科研活动中科研人员对于科学信息交流的需求显得更为迫切。这种需求主要体现在更为开放便捷的科学资源获取以及联系更为紧密的科研团体间的交流合作上。
(1)更开放便捷的数据获取。特别是跨学科数据资源的获取,数据作为科学研究活动的重要组成部分,是科学交流的目的之一。传统的科学交流活动以期刊、会议作为主要交流方式,以学术成果的出版为主,鲜有科学数据的储存,这加大了后续科研工作者查阅获取相关实验数据的难度。在科研第四范式环境下,科学家需求的不仅仅是学术研究的最终成果,学术成果所使用的数据,所涉及的科学交流过程也是非常重要的。
(2)科研团体之间的交流合作[53]。科学研究合作方式正在由学科内的小范围团体合作向跨学科跨国境的更大规模合作方式转变。海量的学术文献使得研究人员不能全面阅读了解所有领域的相关文献,需要有服务来帮助科研人员阅读和过滤信息,由于研究人员越来越需要跨学科地吸收和处理文献、链接不同领域的知识点,这种需求将孤立的科研发现结合在一起,从而发现新的知识,这点需求在跨学科研究领域非常明显。
5.4 数据密集型科研范式环境下的科学交流体系变化
(1)新型科学记录。科学记录是对科学研究全过程的描述,科学记录的首要目标是交流,科研工作者通过各自的学术记录来互相分享科学观点。它的另一目标是组织,学科即是通过大量科学记录的积累、关联而形成的。科学记录还是一种媒介,用以串联跨空间和跨时间的大规模科研合作。它还是一种手段,通过对科学记录的评议可以确定科学成果的版权和价值,通过科学记录中的科学问题的重复验证可以对科学错误进行识别和纠正。
在科学第一范式和第二范式时期,科学记录主要以科技期刊、会议演讲、会议记录以及科学基础数据为主,这些记录分散的储存于各个图书馆、档案馆和科研机构的资料室中,不仅获取不便,科学成果的重复验证难度也非常大,这一阶段的科学记录方式以科学成果的储藏为主。到了20世纪科研第三范式阶段,随着网络和计算技术的出现,用于科学实验的数据在不断增加,但它们只能被总结性的写入科学出版物中,依赖复杂的软件对科学进行重复验证仍然具有较大难度,这一阶段的科学记录以部分数据、期刊论文为主。而在数据密集型科研范式下,科学记录将不再完全以期刊论文为核心,Lynch[54][55]对数据密集型科研范式影响下的新型科学记录做了研究:①以数据为核心的科学记录。随着科学进入数据密集型时代,数据拥有前所未有的重要性,数据和软件必须被完整写入科学记录,数据将以复杂的形态与科学论文交织,论文的创作过程将更充分地考虑数据的采集、筛选和分析过程,对科学研究过程中实验数据的完整记录使得科学成果更容易重复验证,为后续的扩展研究做好基础。②参考数据集的引用。参考数据集是独立于科学研究,受学科内认可并被大量引用的通用数据集,是随着科研的发展而不断更新的。与传统的科学研究不同,数据密集型科研范式下的参考数据集将以计算的方式进行引用,而不是单纯的通过阅读引用。在参考数据集被更新时,可能引发新的计算,结果可能导致科学成果的重新评估。以计算方式引用的参考数据集的论文比起单纯通过阅读来引用参考数据集的论文,受到参考数据集更新所带来的混乱将会大大减少。③可以被计算的科学记录。相对于传统以部分数据和科学文献为主的科学记录,数据密集型科研范式下的科学记录以数据为核心,数据和文本的挖掘、信息的检索、过滤及聚类使得科学记录可以被计算。科学家在进行科研活动时,运用计算工具对科学记录的计算可以获取更为结构化的支撑某一科学理论的论文体系和数据集。
(2)跨学科科学资源的知识发现。由于研究人员越来越需要跨学科的吸收和处理文献、链接不同领域的知识点来发现新的知识,海量的科学文献使得科学家不可能全部阅读与其科学研究领域有关的全部文献,需要利用机器来对科学信息进行过滤。这一需求在生命科学、遗传学、分子生物学、生物化学和医药化学等跨学科性较强的领域更为凸显。A.Ruttenberg[56]认为,缺乏统一结构化的数据已经成为阻碍生物和医学领域将基础性研究成果转化为临床领域应用的主要因素。D.Shotton[57]等认为更高级的文本分析技术正在应用到从文献中抽取实体和实体间的关系,共享的知识本体可以被用来实现统一知识表达,这一方式可以对原来只能由人去阅读的文献所包含信息进行分析以发现新的知识。国际概念网络联盟提出要建立一个全球性的跨学科平台,讨论、设计并实现大规模、分布式复杂数据的互操作性和可用性的解决方案,该联盟的成立代表了科学界对面向机器操作的内容处理技术的关注和重视。通过对跨学科复杂知识的机器处理,可以帮助科学家对复杂知识体系进行推理以促进知识发现、避免重复研究、发现解决科学问题的新途径。Ginsparg[52]认为科学交流体系正在数据密集型科研的影响下迅速转变,科学研究不再以小型科研团队为主体,跨多个学科领域的科研群体将会引领科研变革,成为科学研究的核心力量。
(3)数据与文献的语义集成。在数据密集型科研范式环境下,科研成果的论证往往需要大量的科研数据支持,期刊在刊出文献的同时,也在变成包含文献、数据和其他实验细节的网站。科研第四范式环境下的科研活动需要对数据相关的文献和支持文献的数据进行集成,通过数据关联、语义标记等技术,可以方便科研人员在阅读科研文献时直接获取支持文献的数据,也可以在搜索科研数据时链接至相关研究文献。例如,美国国立生物技术信息中心NCBI 主持的生命科学数据库检索系统Entrez[58],它将核酸和蛋白序列、三维结构、文献以及基因组等不同类型的数据库有机地链接在一起,用户可以从一个DNA 序列查询到蛋白产物以及相关文献,再通过点击“Related Articles”链接至其它相关文献,还能使用“Related Sequence”工具找到与查询所得蛋白质序列同源的其他蛋白质序列,并且利用相关软件直接显示分子三维结构图形。
(4)以数据溯源为主的学术成果演变跟踪。传统的科学交流体系中,学术引文图被用于说明新知识对原有知识的使用情况,揭示科学研究的动态变化,发现科学关联,对学科发展趋势进行预测。但是,学术引文图的覆盖范围经常只包括学科内的各类期刊,少有学科外的知识引用,覆盖类型也以期刊论文为主,少有实验数据的引用。更大的问题是,对学术成果在整个科学体系中的演变过程没有明确的、可记录、可视化的跟踪,也不涉及演变性质等信息。如何向科研工作者更清晰地展示学术成果的动态变化、关系和交互过程,数据溯源信息共享机制是一种更好的解决方案。科研数据的溯源包含了科研数据的试验产生过程、原始数据源信息和演变过程[59]。科研数据溯源信息的保存对科研活动至关重要,它包括作者、试验过程、原始数据源、演变流程图等属性,溯源信息的缺失会降低数据可信度,影响数据的共享,导致数据价值降低。溯源信息的保存一方面可以用来学习和了解科研数据的产生过程,另一方面更是为了保证科研数据的准确性,以支持可重复的科学实验和演变过程推理。在科研第四范式环境下,语义技术、元数据技术和可视化技术可以被用来加工整合科研数据溯源信息以支持学术研究的系列成果发现及其影响力评价。
6 结 语
科学交流体系是动态发展的体系,科学交流的模式最早以纸质文献为主要载体,在网络与数字技术的基础上,科学交流增加了电子预印本、学术博客、电子邮件、电子会议或网络会议、全文数据库等新元素和新渠道。随着近年开放存取理念的提出,论文期刊等科学资源的在线免费获取,在线电子预印本交流平台的开放,机构知识库的建立,科学交流正在发生巨大的变革。本文最后基于数据密集型科研范式的概念,研究了数据密集型科研范式指引下的科学交流未来发展方向。目前,数据密集型科研范式这一概念目前国内研究论文较少,国外的研究主要体现在科学数据的管理、科学数据的共享、跨学科科研合作与知识发现以及国际数据政策等问题,没有解决或难以解决的问题还有很多。作为科学的重要组成部分,科学交流的变革式发展将极大地推动世界范围内科学的发展进程。
参考文献
[1]Tony Hey,Stewart Tansley,Kristin Tolle.The fourth paradigm:Data-intensive scientific discovery [ M].Microsoft research,Redmond,Washington,2009.
[2]Mlhan I V,Rao.Agricultural knowledge transfer in india: A study of prevailing communication channels [J].Library Philosophy andPractice,2007: 1-11.
[3]米哈依洛夫,乔尔内等.徐新民等译.科学交流与情报学[M].北京:科学技术文献出版社,1980.
[4]Garvey W D.Communication: The essence of science [M].Elmsford,NY: Pergamon Press,1979.
[5]ACRL.Integrating scholarly communication into your library [EB/OL].[2015-09-20].http: / /acrl.ala.org/scholcomm/.
[6]Rowland F.Print journals: Fit for the future? [J/OL].[2015-8-20].http: / /www.ariadne.ac.uk/issue7/fytton/.
[7]Roosendaal H E,Peter A,Geurts Th M.Forces and functions in scientific communication: An analysis of their interplay [EB/OL].[ 2015-6-30].http: / /doc.utwente.nl/60395/1/Roo sendaal 97forces.pdf.
[8]Menzel H.Planned and unplanned scientific communication [C]/ / Proceedings of the International Conference on Scientific Information.Washington,D.C: National Academy of Sciences,National Research Council,1959: 199-243.
[9]贾二鹏.Web2.0对科学交流的影响及效果分析[J].情报探索,2009(7):40-42.
[10]Søndergaard T F,Andersen J,Hjørland B.Documents and the communication of scientific and scholarly information: Revising and updating the UNISIST model [J].Journal of Documentation,2003: 278- 320.
[11]徐佳宁.数字环境下科学交流系统重组与功能实现[M].北京:光明日报出版社,2010.
[12]Garvey W D,Griffith B C.Communication and information processing within scientific disciplines: Empirical findings for Psychology [J].Information Storage and Retrieval,1972(8):123-126.
[13]Fröhlich G.The (Surplus) value of scientific communication[EB/OL].[2015-07-30].http: / /eprints.rclis.org/8924/1/SurplusValueScienComm.pdf.
[14]Poultney R W.Front-Ends are the way to go [N].Europhysics News,1996(27): 24-25.
[15]Van Raan A F.Bibiometrics and internet: Some oberservations and expections [J].Scientometrics,2001(50): 59-63.
[16]徐丽芳.科学交流系统的要素、结构、功能及其演进[J].图书情报知识,2008(6):114-117.
[17]Hjørland B,Søndergaard T F,Andersen J.UNISIST model and knowledge domains [J].Encyclopedia of Library and Information Science,2005(4): 1-4.
[18]Søndergaard T F,Andersen J,Hjørland B.Documents and the communication of scientific and scholarlu information: Revising and updating the UNISIST model [J].Journal of Documentation,2003,59(3): 278-320.
[19]Björk B-C.A model of scientific communication as a global distributed information system [J].Information Research,2007,12(2): 1-48.
[20]Van de Sompel,Payette S,Erickson J,et al.Rethinking scholarly communication: Building the system that scholars deserve [J].D-Lib Magazine,2004,10(9).
[21]黄如花,冯晴.论开放存取出版对科学信息交流和利用的影响[J].出版科学,2008(3):75-78.
[22]蔡迎春.机构知识库:基于开放存取的学术交流机制[J].情报理论与实践,2008(5):680-683.
[23]Crawford S Y,Hurd J M,Weller A C.From print to electronic:the transformation of scientific communication [M].Medford,NJ: Information Today,Inc.,1996.
[24]Hurd J M.Scientific communication: New roles and new players[J].Science & Technology Libraries,2004(25): 5-22.
[25]Unesco.UNISIST: Study report on the feasibility of a World Science Information System [J].New York: UNIPUB Inc.,1971: 30.
[26]徐丽芳.UNISIST 模型及其数字化发展[J].图书情报工作,2008(10):65-69.
[27]Björk B-C.,Hedlund T.A formalized model of the scientific publication process [J].Online Information Review,2004,28(1): 8-21.
[28]Björk B-C.A life model of the scientific communication process[J].Learned Publishing,2005(3): 165-176.
[29]Houghton J W,Rasmussen B,Sheehan P J,et al.Economic implications of alternative scholarly publishing models: Exploring the costs and benefits [EB/OL].[2014-09-15].http: / /www.jisc.ac.uk/media/documents/publications/rpteconomicoapublishing.pdf.
[30]孙玉伟.数字环境下科学交流模型的分析与述评[J].大学图书馆学报,2010(1):41-45.
[31]胡德华,韩欢.学术交流模型研究[J].图书情报工作,2010,54(2):26-30.
[32]胡德华,尹加帮,陶雯.发展中国家的开放存取期刊研究[J].情报杂志,2007(2):140- 142.
[33]赵莉莉.国内两大开放存取系统的对比研究——奇迹文库和中国预印本服务系统[J].现代情报,2007(9):48-50.
[34]Budapest Open Access Initiative [EB/OL].[2015-05-06].http: / /www.soros.org/openaccess/ read.shtml.
[35]孙希波.开放存取对学术交流系统的影响[J].现代情报,2009(10):29-30.
[36]李金林,张秋菊,冉仑.开放存取对学术交流系统的影响分析[J].图书馆论坛,2013(3):13-17.
[37]马景娣.ISI 引文数据库收录的开放存取期刊[J].中国科技期刊研究,2005,16(5):624.
[38]曾元祥,方卿.论开放存取对学术交流的影响(一)——基于科研人员视角的分析[J].信息资源管理学报,2011(3):53-56.
[39]Swan A,Brown S.Open access self-archiving: An author study[ EB/OL ].[ 2014-09-22].http: / /cogprints.org/4385/1/jisc2.pdf.
[40]Antelman K.Do open-access articles have a greater research impact ? [EB/OL].[2014-08- 09].http: / /www.socolar.com/man/NewsUpload/200726948375274.pdf.
[41]张晓蒙,方卿.论开放存取对学术交流的影响(二)——基于图书情报角的分析[J].信息资源管理学报,2011(3):57-61.
[42]夏莉霞,方卿.论开放存取对学术交流的影响(三)——基于学术出版机构视角的分析[J].信息资源管理学报,2011(3):62-66.
[43]Crow R.The case for institutional repositories A SPARC position paper [EB/OL].[2014-08- 06].http: / /www.arlorg/spare/IR/ir.html.
[44]Barton M R,Waters M M.Creating an institutional repositories LEADIRS workbook [ EB/OL].[ 2012-03-05].http: / /www.Dspace.org/implement/leadirs.pdf.
[45]Lynch C A.Institutional repositories essential infrastructure for scholarship in the digital age [J].ARI,2003: 1-7.
[46]马漫江.机构知识库:学术交流与资源共享新模式[J].高校图书馆工作,2007(1):10-13.
[47]Bell G,Hey T,Szalay A.Beyond the data deluge [J].Science,2009(323): 1297-1298.
[48]Szalay A,Gray J.2020Computing: Science in an exponential world [J].Nature,2006(440): 413-414.
[49]Berman F.Got data? : A guide to data preservation in the information age [J].Commun.ACM,2008,51(12): 50-56.
[50]Ruusalepp R.Infrastructure planning and data curation: A comparative study of international approaches to enabling the sharing of research data [J].JISC,2008: 3-103.
[51]Altman M,King G.A proposed standard for the scholarly citation ofquantitative data [J].D-Lib Magazine,2007,13(3): 1-9.
[52]Ginsparg P.Next generation implications of open access [J/OL].CTWatch Quarterly,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/next-generation-implications-of- openaccess/.
[53]赵蓉英,温芳芳.科研合作与知识交流[J].图书情报工作,2011(20):6-10.(www.daowen.com)
[54]Lynch C A.The shape of the scientific article in the developing cyber infrastructure [J/OL].CTWatch,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/the-shape-of- thescientific-article-in-the-developing-cyberinfrastructure/.
[55]Lynch C A.Open computation: Beyond human-reader-centric views of scholarly literatures [J/OL].Chandos Publishing,2006:185-193.http: / /old.cni.org/staff/cliffpubs/OpenComput ation.htm.
[56]Ruttenberg A,Clark T,Bug W,et al.Advancing translational research with the Semantic Web [J].BMC Bioinf ormatics,2007,8(3): 1-16.
[57]Shotton D,Portwin K,Klyne G,et al.Adventures in semantic publishing: Exemplar semantic enhancements of a research article[J].PLoS Computational Biology,2009(5): 1- 17.
[58]http: / /www.ncbi.nlm.nih.gov.
[59]Bose R,Frew J.Lineage retrieval for scientific data processing:A survey [J].ACM Computing Surveys,2005(37): 1-28.
【作者简介】
图8 基于OA 的网络结构交流模型
4 开放存取环境下的科学交流发展
4.1 开放存取的概念
开放存取OA(Open Acess)是一种学术信息免费共享的理念与出版机制,是学术交流机制演进的结果。随着科学研究进入网络和数字时代,传统的学术交流系统已经完全不能满足数字科研环境下的科学交流需求,为促进科学交流的发展、提高科学研究的效率、提升科研成果的有效利用、满足学术及出版等各界人士对科研成果自由获取与交流的迫切需求,20世纪90年代末,学术界、出版界和图书情报界发起了开放存取运动,各国政府也对此持肯定态度,以欧美为代表的发达国家和以巴西、印度、中国为代表的发展中国家先后签署了《布达佩斯开放存取倡议》 《百斯达声明》 和《柏林宣言》 等文件[32][33]。《布达佩斯开放存取声明》(BOAI)将开放存取解释为“允许用户不受经济、法律和技术的限制免费获取公共网络上的论文以进行阅读、下载、复制、打印和搜索等[34]”,开放存取作为一种新的学术交流理念正在被越来越多的国内外学术机构、图书馆和科研人员所接受。
《布达佩斯开放存取声明》 确定了开放存取期刊和开放存取仓储两种开放存取实现途径。开放存取期刊又包含纯OA 期刊和复合OA 期刊两种形式。纯OA 期刊只在网络中发行,通过作者付费或者机构赞助的方式支付论文的同行评议、稿件编辑加工、电子期刊出版等费用,而读者可以免费获取期刊论文。复合OA 期刊指一个期刊同时使用传统出版模式和开放存取出版模式,将传统期刊在数字化之后发布至网络,以提高期刊影响力。例如,美国的科学公共图书馆可为科研人员提供免费的科技期刊获取服务。OA 仓储是指科学研究机构或作者将未发表或已经在传统期刊中发表的论文等科研成果作为开放式的电子档案储存,供用户免费访问和使用,例如,电子预印本库arXiv 是一种典型的OA 仓储,作者可以在线提交个人科研成果,经同行评议和专家评议验证该成果的有效性之后,公开发布并扩散,保存研究成果以及通过评价获得奖励。
除了科学研究论文,其他的科研资源如电子图书、教学视频、课件及其他教学资料、政府信息等,也正在实现开放存取。哈佛大学可以为老师和同学提供高水平学位论文开放获取服务。麻省理工大学图书馆创建了开放课件,哈佛Berkman 中心创建了开放教学与学习资料,还有印度教育改革联盟发起的全国性的开放教育项目及中国开放教育协会创建的各种开放资源等。在政府信息资源开放获取方面,Carl Malamud 于2007年5月启动的Public Resource Org 项目,专注于收集美国政府部门发布的公共领域的信息,并提供开放获取[35]。
4.2 开放存取环境下的科学交流发展
4.2.1 开放存取科学交流系统的优势
相对于传统科学交流系统,开放存取环境下的科学交流系统拥有诸多优势。李金林[36]等从系统意义、运行模式、论文时效性、论文严谨度、论文影响力、论文版权和用户认可度等方面将开放存取科学交流系统和传统科学交流系统相对比,认为开放存取科学交流系统在加速科研进程、扩大科学影响、提高科研效率、缩短出版时间、提高论文引用速度和引用率、提高科学交流效率等方面具有优势。①加速推动科学发展。在传统科学交流模式中,出版商作为科学交流系统中的重要角色,可以通过控制版权、付费获取获得高额利润,一定程度上延缓了科学的发展速度。而开放存取科学交流系统不以营利为目的,免费科学资源的检索、获取和传播更为直接,加速推进了科学的发展。②促进科研作者和用户之间的互动。相对于传统科学交流系统中科学信息从科研作者到信息用户的单向流动,开放存取科学交流系统可以让信息用户和科研作者进行直接沟通,信息用户可以对科研作者在线发布的研究成果即时作出评价或提出建议,科研作者则可以及时接收反馈并作出修正和升级,双方更为密切的互动交流,可以促进新思想的产生,提高科学交流效率。③提高论文引用速度和引用率,扩大科学影响。更快的出版速度会带来更快的传播速度,论文引用率和学术知名度也会更高。在传统科学交流系统中科研成果的传播需要经过提交、评审、出版、获取一系列过程,知识获取存在时滞性。而开放存取科学交流系统利用最新的网络和数字技术,简化了传统编辑工作中的校对、印刷等程序,通过网络进行投稿、审稿、返修等,缩短了科研成果的出版周期,提高了论文引用速度。马景娣[37]对ISI 引文数据库所收录的开放存取期刊进行了研究,通过对ISI 收录的239种OA 期刊的影响因子和即时指数进行比较,得出OA 期刊相对于传统印刷期刊论文引用速度更快的结论。
4.2.2 开放存取环境下的科研人员
开放存取作为数字科学环境下的科学交流新模式,很大程度上对科研人员的科研活动起到了推动和促进作用。曾元祥等[38]从信息获取、成果发表和学术影响力三个方面分析了开放存取对科研人员的影响。李金林[36]等从对科研作者和科研读者的角度分析了开放存取对科研人员的影响。
(1)更便捷的科学资源获取。
科研人员以了解研究领域内最新科研信息作为科研的起点。开放存取给科研人员获取科研信息带来了积极的影响,它能使广大的科研人员免费、快速地获取、掌握世界范围内最新的相关领域研究成果及学术发展动态。一方面,开放存取模式下机构知识库、电子预印本库的建立为科研人员提供了一个及时获取科学资源的平台,使科研人员能够更快速地了解最前沿的学术动态,满足其方便、快捷地获取科研信息的需求;另一方面,开放存取模式大大降低了科研人员获取科学资源的成本。开放存取倡导的是一种开放共享的理念,科研人员免费获取科研资源是其最主要的特征与价值所在。
(2)加速科研成果的出版。
科研成果的提交、评价和发布是科学交流过程的重要环节。开放存取的提出颠覆了传统学术科研成果的出版方式,科研成果出版速度更快,出版方式更为多元,从广度和速度上促进了科研成果的传播。
(3)加速学术影响力增长。
学术影响力很大程度上与科研成果的引用速度和引用率有关,而引用速度和引用率又取决于科研成果的传播速度和广度。在传统学术交流系统中,科技期刊发布方式单一、出版周期长、传播范围受限,研究人员学术影响力的提升受到制约,而科学交流的开放存取模式可以极大地促进科研人员及其研究成果学术影响力的提升。虽然开放存取期刊发展时间较短,但和传统印刷期刊相比,OA 期刊更高的浏览量、下载量及被引频率表明了开放存取技术会加速推进科研人员学术影响力的增长。例如,在电子工程和数学领域,发表于同一种期刊中OA 论文的平均被引次数为非OA 论文的1.5~2倍。英国联合信息系统委员会的一项调查表明,多数科研人员支持OA 期刊能够扩大其论文读者群的观点[39]。Kristin Antelman 通过对哲学、政治学、电气工程和数学4类学科领域中开放存取论文引用率的调查发现,开放获取的论文具有更大的研究影响力[40]。
目前,开放存取对科研用户特别是科学信息作者也存在一些负面影响,开放存取采用“作者付费出版、用户免费使用”的付费模式无疑会给作者增加经济压力,对于经费较为欠缺的欠发达地区研究机构问题将更为明显。长期以往可能会导致部分地区机构的科研边缘化,对科研的全球化趋势不利。
4.2.3 开放存取环境下的图书馆和科研机构
张晓蒙[41]认为,开放存取环境下的图书馆资金压力更为减缓、馆藏资源更为丰富、服务方式更为多元。图书馆收集、保存和整理已经发布的开放存取资源,或者在图书馆资源主页上提供开放存取数据库的链接,从而获得那些无需付费的科学文献,扩充图书馆的数字馆藏,这既节约了科学文献的购置费用又为丰富图书馆馆藏资源作出了重要贡献。另外,在开放存取环境下,图书馆资源内容和结构、用户信息需求以及学术交流方式都在变化,图书馆的服务也呈现着内容多样化、服务对象广泛化、服务模式集成化的趋势,并为科研用户增加了数字仓储服务、版权服务、在线出版、数据监护等服务。
孙希波[35]认为,开放存取对科研机构的影响主要体现在更高学术影响力和更密切的机构间交流两个方面。开放环境下的科研机构通过建立机构知识库、创办OA 期刊,提供机构学术成果的开放获取,在提高作者学术影响力的同时,也将提升科研机构的知名度。同时,在开放存取环境下,科学资源通过网络逐渐集中起来,形成更为开放的学术交流平台。高校和科研机构的研究人员能够便捷地获取领域内最新的研究成果,各高校和科研机构之间的学术交流活动将更加密切。
4.2.4 开放存取环境下的出版商
开放存取技术的实施给出版商带来的冲击是巨大的。孙希波[35]从科学交流地位削弱、竞争压力增大和影响力变化三个方面论述了开放存取环境下出版商的变化。首先,传统的主导地位被削弱。在传统学术交流系统中,学术期刊的出版发行必须经过出版商,出版商掌握着大量科学成果的版权。开放存取的多元化出版模式使得学术成果的出版不再必须经过出版商这一环节,削弱了出版商在科学出版中的主导地位,夺回了科学成果版权,动摇了以出版商为主导的学术交流局面。其次,竞争压力增大。在开放存取环境下,大量最新科研成果的在线免费获取在一定程度上影响了出版商的发行量和稿源,导致出版商利润的降低和市场份额的缩小,增加了出版商的生存压力。最后,科学影响力扩大。在开放存取环境下,传统出版商纷纷从单一的印刷出版转向在线出版和印刷出版的混合出版模式,出版模式的多元化无疑会增加出版商的科学影响力。
夏莉霞[42]等从出版市场主体多元化、学术出版物价格变化和版权政策三个方面研究了开放存取对出版商的影响。首先,随着OA 期刊的发展,政府、大学、研究机构等组织在科学文献出版中扮演着越来越重要的角色,传统出版商的垄断地位得以动摇。其次,学术出版物价格下降。自20世纪90年代以来,随着不断兼并和收购,商业出版者日益垄断期刊市场,大幅度提高期刊价格,导致所谓的“学术期刊危机”。而开放存取的出现极大地改善了这个问题,由于用户在网上获取学术资源十分便捷,传统学术期刊在学术研究工作中的地位降低,各大传统出版机构的期刊发行量逐年下降,迫使商业出版机构不得不降低学术期刊的价格。最后,OA 出版模式对版权的政策较为宽松,科研作者可以越过出版商直接向科研用户授权,赋予了作者和用户更多权力,促进科学信息的广泛传播。
4.3 机构知识库模式下的科学交流发展
机构知识库IR(Institutional Repository)是科研机构建立的数字仓库,用于保存机构内的科研资源,包括学术论文、实验数据、学位论文、电子预印本、科学数据库、会议录、教学课件等,它可以提供跨库的无缝检索,实现科学资源的整合并提供服务,是开放存取理念下的一种以数据库为核心的新的科学交流模式。
4.3.1 机构知识库的概念
图8 基于OA 的网络结构交流模型
4 开放存取环境下的科学交流发展
目前有很多专家、学者对机构知识库作出了不同的定义,SPARC 高级顾问Crow 认为“机构知识库是收集与保存一所大学或多所高校研究成果的数字资源集合[43]”。麻省理工学院图书馆的Workbook 认为:“机构知识库是一个具有一系列服务功能的数据库,获取、存储、索引、保存和发布学术机构中以数字形式存在的学术研究内容[44]。”CNI 执行主任Lynch 认为:“机构知识库是数字时代学术研究的基础设施,一个大学的IR 是学校为师生员工所提供的一系列服务,目的是用于管理和发布由本机构及其成员所创造的数字资料[45]。”
4.1 开放存取的概念
4.3.2 机构知识库的科学交流功能
蔡迎春[22]通过将机构知识库和传统科学交流模式相比较,认为机构知识库作为科学交流的新模式,具有更为优越的科学交流性能、客观的分析评价功能、较强的信息反馈机制,以及便捷的知识共享功能。
①优越的科学交流性能。机构知识库所保存的科研资源的获取更为便捷,学术交流过程更具效率。
②客观的分析评价功能。IR 将机构内部所有的科研资源进行整合集成,通过对各种科研资源历史版本的保存,展现机构发展的脉络,可以用来评价机构学术能力,也可以预测机构研究趋势,加深了科研访问者对科研机构的了解。
③较强的信息反馈机制。相对于传统学术交流的简单反馈机制,IR 的学术交流反馈机制可以在科研作者和科研用户之间形成网状互动的结构,不同研究人员或研究机构的思维交汇推动着科学研究的发展,学术信息发出者与接收者之间的角色在科学交流过程中不断互换,思想的碰撞会推动科研进程,加速科研成果的产出。
成果自由获取与交流的迫切需求,20世纪90年代末,学术界、出版界和图书情报界发起了开放存取运动,各国政府也对此持肯定态度,以欧美为代表的发达国家和以巴西、印度、中国为代表的发展中国家先后签署了《布达佩斯开放存取倡议》 《百斯达声明》 和《柏林宣言》 等文件 [32][33]。《布达佩斯开放存取声明》(BOAI)将开放存取解释为“允许用户不受经济、法律和技术的限制免费获取公共网络上的论文以进行阅读、下载、复制、打印和搜索等 [34]”,开放存取作为一种新的学术交流理念正在被越来越多的国内外学术机构、图书馆和科研人员所接受。④便捷的知识共享功能。为多个机构知识库内的所有科学资源设置元数据,制定统一的标记协议对其进行标记,以实现搜索引擎可以对全部机构知识库进行搜索,并以恰当的方式显示给用户,为用户提供便捷的获取途径,促进了知识的有效传递,实现知识在更广范围的共享和利用。
4.3.3 机构知识库对科学交流的推进
《布达佩斯开放存取声明》 确定了开放存取期刊和开放存取仓储两种开放存取实现途径。开放存取期刊又包含纯OA 期刊和复合OA 期刊两种形式。纯OA 期刊只在网络中发行,通过作者付费或者机构赞助的方式支付论文的同行评议、稿件编辑加工、电子期刊出版等费用,而读者可以免费获取期刊论文。复合OA 期刊指一个期刊同时使用传统出版模式和开放存取出版模式,将传统期刊在数字化之后发布至网络,以提高期刊影响力。例如,美国的科学公共图书馆可为科研人员提供免费的科技期刊获取服务。OA 仓储是指科学研究机构或作者将未发表或已经在传统期刊中发表的论文等科研成果作为开放式的电子档案储存,供用户免费访问和使用,例如,电子预印本库arXiv 是一种典型的OA 仓储,作者可以在线提交个人科研成果,经同行评议和专家评议验证该成果的有效性之后,公开发布并扩散,保存研究成果以及通过评价获得奖励。
机构知识库的出现很大程度上推动了科学交流的发展,马漫江[46]作出了归纳:
(1)机构知识库为科学交流的发展提供了一个高效的科研资源保存和交流平台。随着科学技术的不断发展,科学成果需要被完善保存。机构知识库作为一种新的学术交流模式,它可以安全的、完整地保存机构内科学研究发展的历程。通过建立机构知识库,借助先进的管理技术,收集机构内所拥有的各种学术资源,以开放存取为理念,提供出版、发布、检索、获取等服务,可以有效推动科学交流的发展。
l Malamud 于2007年5月启动的Public Resource Org 项目,专注于收集美国政府部门发布的公共领域的信息,并提供开放获取 [35]。 service maturity levels [ J ].Government Information Quarterly,2011,28(1): 17-35.[94]Wang Y S,Li H T,Li C R,et al.A model for assessing blogbased learning systems success [J].Onl
4.2 开放存取环境下的科学交流发展
4.2.1 开放存取科学交流系统的优势
(2)提高科学交流效率,促进科学研究发展。机构知识库促进科学研究资源在研究人员之间免费、快速的传播,是机构知识库的一项重要功能。机构知识库在获得作者授权后,以数字形式保存并传播其研究成果,可以加速机构内学术研究成果的向外传播、展示机构科学研究的深度与广度,有效地提高了科研交流效率和机构知名度。
(3)通过收割、汇集、索引实现科学交流与资源共享。机构知识库是基于OAI-PMH 元数据收割协议的开放系统,能够处理复杂的数字对象,支持数字对象的元数据管理,保障和满足机构内外的资源服务需求。对机构知识库的元数据进行收割、汇集、索引并提供全文链接是机构知识库服务的一个重要内容。机构知识库还可以将机构外的电子预印本库、开放期刊等在线科学资源连接在一起,通过统一检索服务向科研工作者提供更为丰富的科学资源。
5 数据密集型科学研究范式环境下的科学交流发展趋势
相对于传统科学交流系统,开放存取环境下的科学交流系统拥有诸多优势。李金林[36]等从系统意义、运行模式、论文时效性、论文严谨度、论文影响力、论文版权和用户认可度等方面将开放存取科学交流系统和传统科学交流系统相对比,认为开放存取科学交流系统在加速科研进程、扩大科学影响、提高科研效率、缩短出版时间、提高论文引用速度和引用率、提高科学交流效率等方面具有优势。①加速推动科学发展。在传统科学交流模式中,出版商作为科学交流系统中的重要角色,可以通过控制版权、付费获取获得高额利润,一定程度上延缓了科学的发展速度。而开放存取科学交流系统不以营利为目的,免费科学资源的检索、获取和传播更为直接,加速推进了科学的发展。②促进科研作者和用户之间的互动。相对于传统科学交流系统中科学信息从科研作者到信息用户的单向流动,开放存取科学交流系统可以让信息用户和科研作者进行直接沟通,信息用户可以对科研作者在线发布的研究成果即时作出评价或提出建议,科研作者则可以及时接收反馈并作出修正和升级,双方更为密切的互动交流,可以促进新思想的产生,提高科学交流效率。③提高论文引用速度和引用率,扩大科学影响。更快的出版速度会带来更快的传播速度,论文引用率和学术知名度也会更高。在传统科学交流系统中科研成果的传播需要经过提交、评审、出版、获取一系列过程,知识获取存在时滞性。而开放存取科学交流系统利用最新的网络和数字技术,简化了传统编辑工作中的校对、印刷等程序,通过网络进行投稿、审稿、返修等,缩短了科研成果的出版周期,提高了论文引用速度。马景娣[37]对ISI 引文数据库所收录的开放存取期刊进行了研究,通过对ISI 收录的239种OA 期刊的影响因子和即时指数进行比较,得出OA 期刊相对于传统印刷期刊论文引用速度更快的结论。
4.2.2 开放存取环境下的科研人员
随着以博客、社交网络、基于位置的服务LBS 为代表的新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,数据正以前所未有的速度在不断地增长和累积,科学家不仅通过对广泛的数据进行实时、动态的监测与分析来解决以前难以解决的科学难题,更是把数据作为科学研究的对象和工具,基于数据来思考、设计和实施科学研究。G.Bell[47]从生物学、天文学和物理学等学科的角度,阐述了数据的爆发式增长给科学研究带来的巨大变革。数据指引着科学未来的发展方向,如何建立以海量科学数据为核心的数据密集型科研范式是科学界关注的重大问题。在数据的洪流中,在数据密集型科研范式环境下,科学交流将迎来变革式的发展。
开放存取作为数字科学环境下的科学交流新模式,很大程度上对科研人员的科研活动起到了推动和促进作用。曾元祥等[38]从信息获取、成果发表和学术影响力三个方面分析了开放存取对科研人员的影响。李金林[36]等从对科研作者和科研读者的角度分析了开放存取对科研人员的影响。
5.1 数据密集型科学研究范式的兴起
(1)更便捷的科学资源获取。
科研人员以了解研究领域内最新科研信息作为科研的起点。开放存取给科研人员获取科研信息带来了积极的影响,它能使广大的科研人员免费、快速地获取、掌握世界范围内最新的相关领域研究成果及学术发展动态。一方面,开放存取模式下机构知识库、电子预印本库的建立为科研人员提供了一个及时获取科学资源的平台,使科研人员能够更快速地了解最前沿的学术动态,满足其方便、快捷地获取科研信息的需求;另一方面,开放存取模式大大降低了科研人员获取科学资源的成本。开放存取倡导的是一种开放共享的理念,科研人员免费获取科研资源是其最主要的特征与价值所在。
传统的科学研究在经历了以自然实验为主的第一范式实验科学、以理论的假设推理为主的第二范式理论科学和以计算与模拟为主的第三范式计算科学之后,迎来了数据密集型计算科学范式即科学研究第四范式[1]。
(2)加速科研成果的出版。
科研成果的提交、评价和发布是科学交流过程的重要环节。开放存取的提出颠覆了传统学术科研成果的出版方式,科研成果出版速度更快,出版方式更为多元,从广度和速度上促进了科研成果的传播。
(3)加速学术影响力增长。
(1)第一范式实验科学。实验科学是最早出现的科研范式,大多是对自然现象进行重复实验而得到成果,少有系统的理论归纳。例如,爱迪生测试几千种材料而发明钨丝灯泡、富兰克林收集雷电而发明避雷针等都属于典型的实验科学。
(2)第二范式理论科学。理论科学是在实验科学的基础上发展而来,理论科学强调对现象的理论总结和概括,强调普遍原理的发现而不是针对单个现象的研究实验。科研流程是先由重复发生的现象提出假设理论,然后设计不同变量下的多次实验,并使用假设理论对实验结果进行预测,实验结果是否和预测结果一致以及在实验过程中产生的新现象将会检验与修正假设理论,假设理论在经过无数的实验与修正后才会上升至定理和真理。
学术影响力很大程度上与科研成果的引用速度和引用率有关,而引用速度和引用率又取决于科研成果的传播速度和广度。在传统学术交流系统中,科技期刊发布方式单一、出版周期长、传播范围受限,研究人员学术影响力的提升受到制约,而科学交流的开放存取模式可以极大地促进科研人员及其研究成果学术影响力的提升。虽然开放存取期刊发展时间较短,但和传统印刷期刊相比,OA 期刊更高的浏览量、下载量及被引频率表明了开放存取技术会加速推进科研人员学术影响力的增长。例如,在电子工程和数学领域,发表于同一种期刊中OA 论文的平均被引次数为非OA 论文的1.5~2倍。英国联合信息系统委员会的一项调查表明,多数科研人员支持OA 期刊能够扩大其论文读者群的观点[39]。Kristin Antelman 通过对哲学、政治学、电气工程和数学4类学科领域中开放存取论文引用率的调查发现,开放获取的论文具有更大的研究影响力[40]。
(3)第三范式计算科学。随着20世纪计算机的发明和计算能力的不断增强,科学从理论推理转向计算仿真,计算科学被认为是实验科学和理论科学的扩展,是通过计算机分析和模拟来解决科学问题的新范式。当研究范围由微观原理发现扩大至区域复杂系统研究例如天气预报、自然灾害的预测时,计算和仿真模拟研究方法体现出巨大的优势。但随着更加精密的数据采集仪器的出现,实验数据呈现爆发式增长,由此引出了数据密集型计算科学,即科研第四范式。
目前,开放存取对科研用户特别是科学信息作者也存在一些负面影响,开放存取采用“作者付费出版、用户免费使用”的付费模式无疑会给作者增加经济压力,对于经费较为欠缺的欠发达地区研究机构问题将更为明显。长期以往可能会导致部分地区机构的科研边缘化,对科研的全球化趋势不利。
4.2.3 开放存取环境下的图书馆和科研机构
(4)第四范式数据密集型计算科学。科研第四范式是以数据为核心的研究范式,数据是科学研究的对象和工具,相对于传统科学研究对精确的原始数据和严密的假设检验过程的要求,数据密集型科研范式下的科研发现不再追求绝对精确的原始数据,也不再依赖严密的假设检验过程,海量原始数据的采集能力以及云计算所带来的强大集群计算和存储资源正在建立以数据密集型计算为中心的科学研究,更多复杂无序的相关关系的发现以及学科间更为密切的交流合作产生了科学研究的新方法[48]。
5.2 科学交流模式的转变
张晓蒙[41]认为,开放存取环境下的图书馆资金压力更为减缓、馆藏资源更为丰富、服务方式更为多元。图书馆收集、保存和整理已经发布的开放存取资源,或者在图书馆资源主页上提供开放存取数据库的链接,从而获得那些无需付费的科学文献,扩充图书馆的数字馆藏,这既节约了科学文献的购置费用又为丰富图书馆馆藏资源作出了重要贡献。另外,在开放存取环境下,图书馆资源内容和结构、用户信息需求以及学术交流方式都在变化,图书馆的服务也呈现着内容多样化、服务对象广泛化、服务模式集成化的趋势,并为科研用户增加了数字仓储服务、版权服务、在线出版、数据监护等服务。
自科学交流活动进入网络时代以来,基于网络的科学交流带来了丰富的科学交流方式和高效的资源共享体系。随着科学进入数据密集型时代,数据在科研活动中逐渐成为科学交流的核心,科学交流方式和内容也在发生转变。
孙希波[35]认为,开放存取对科研机构的影响主要体现在更高学术影响力和更密切的机构间交流两个方面。开放环境下的科研机构通过建立机构知识库、创办OA 期刊,提供机构学术成果的开放获取,在提高作者学术影响力的同时,也将提升科研机构的知名度。同时,在开放存取环境下,科学资源通过网络逐渐集中起来,形成更为开放的学术交流平台。高校和科研机构的研究人员能够便捷地获取领域内最新的研究成果,各高校和科研机构之间的学术交流活动将更加密切。
4.2.4 开放存取环境下的出版商
(1)科学交流内容的转变。虽然数据一直以来都是科学研究中的关键因素,但传统的科学交流多以由分析处理数据而获得的研究论文作为主要交流内容,在数据密集型科研环境下,科研数据在科研活动中的重要性与日俱增,科研数据已经被认为是重要的科研成果,和科研论文同为科学交流的核心内容,各种类型的结构化、半结构化、非结构化数据,如视频、音频、图片开始嵌入到各类科研交流活动中。例如,期刊论文中不仅可以使用文字、表格、图片来记录实验,还可以使用视频、音频等数据来描述研究过程。另外,在跨学科的科学交流活动中,由于学科间的数据类型、研究方法等差异较大,数据作为科研活动的基础,此时跨学科数据交流就显得更为重要。科学界正在积极探讨并探索实施将数据集整合进科学信息系统的所有功能:数据的登记、认证、发现、存储和奖励。F.Berman[49]研究了科学家对于数据的可信赖性以及长期储存重要性的关注程度。R.Ruusalepp[50]等研究了支持共享数据发现的基础设施需求,M.Altman[51]研究了数据引用格式的标准,体现了数据作为独立的科研成果正在逐渐受到认可。
开放存取技术的实施给出版商带来的冲击是巨大的。孙希波[35]从科学交流地位削弱、竞争压力增大和影响力变化三个方面论述了开放存取环境下出版商的变化。首先,传统的主导地位被削弱。在传统学术交流系统中,学术期刊的出版发行必须经过出版商,出版商掌握着大量科学成果的版权。开放存取的多元化出版模式使得学术成果的出版不再必须经过出版商这一环节,削弱了出版商在科学出版中的主导地位,夺回了科学成果版权,动摇了以出版商为主导的学术交流局面。其次,竞争压力增大。在开放存取环境下,大量最新科研成果的在线免费获取在一定程度上影响了出版商的发行量和稿源,导致出版商利润的降低和市场份额的缩小,增加了出版商的生存压力。最后,科学影响力扩大。在开放存取环境下,传统出版商纷纷从单一的印刷出版转向在线出版和印刷出版的混合出版模式,出版模式的多元化无疑会增加出版商的科学影响力。
(2)科学交流方式的转变。传统方式的科学交流以科技期刊的出版、举办科学交流会议、开设学术讲座等方式为主,随着近年来信息技术的快速发展,出现了以电子期刊、电子图书馆、学术博客、学术论坛等基于网络的科学交流新形式。网络科学交流的出现很大程度上丰富了科学交流方式,例如,查询他人学术成果、下载电子图书、关注科研机构网站、RSS 科研专题订阅等交流行为也对科研活动产生了积极的影响,但也存在着资源分散、管理混乱、缺乏规范等问题。现阶段的科学交流在网络科学交流的基础上朝着开放式科学交流发展,开放式科学交流的核心是科研数据和科研论文等学术资源的开放获取,包括开放数据、开放信息、开放知识等内容,目标是实现开放创新。科研数据、软件、硬件、文献等学术成果被集成在学术平台上,科研用户通过网络从集成学术平台上主动共享或获取他人所共享的数据、软件、文献等学术资源,开放式科学交流对于消除“数据鸿沟”、推动知识创新等方面具有重要意义。而当科学进入数据密集型科研时代后,科学研究需要多领域知识的融合,科技领域之间需要建立连接,多学科研究和跨领域合作将成为科学交流的新方式,跨学科跨国界的大型科研项目合作将成为引领学科发展的核心力量[52]。
5.3 科研用户对于科学交流的新需求
科研人员只靠个体或小研究团体就能完成从数据收集到论文写作全部工作的研究方式已经衰落,而由大量的分散研究团体为了共同的项目而进行跨时间和跨空间合作的时代已经到来。在科研第四范式环境下,科研活动中科研人员对于科学信息交流的需求显得更为迫切。这种需求主要体现在更为开放便捷的科学资源获取以及联系更为紧密的科研团体间的交流合作上。
(1)更开放便捷的数据获取。特别是跨学科数据资源的获取,数据作为科学研究活动的重要组成部分,是科学交流的目的之一。传统的科学交流活动以期刊、会议作为主要交流方式,以学术成果的出版为主,鲜有科学数据的储存,这加大了后续科研工作者查阅获取相关实验数据的难度。在科研第四范式环境下,科学家需求的不仅仅是学术研究的最终成果,学术成果所使用的数据,所涉及的科学交流过程也是非常重要的。
(2)科研团体之间的交流合作[53]。科学研究合作方式正在由学科内的小范围团体合作向跨学科跨国境的更大规模合作方式转变。海量的学术文献使得研究人员不能全面阅读了解所有领域的相关文献,需要有服务来帮助科研人员阅读和过滤信息,由于研究人员越来越需要跨学科地吸收和处理文献、链接不同领域的知识点,这种需求将孤立的科研发现结合在一起,从而发现新的知识,这点需求在跨学科研究领域非常明显。
出现极大地改善了这个问题,由于用户在网上获取学术资源十分便捷,传统学术期刊在学术研究工作中的地位降低,各大传统出版机构的期刊发行量逐年下降,迫使商业出版机构不得不降低学术期刊的价格。最后,OA 出版模式对版权的政策较为宽松,科研作者可以越过出版商直接向科研用户授权,赋予了作者和用户更多权力,促进科学信息的广泛传播。 面临新的问题,有待国内外相关学者积极开展系统和深入的研究,推动各类信息系统在实际应用中获得成功。参考文献
[1]Vodanovich S,Sundaram D,Myers M.Research commentarydigital natives and ubiquitous information systems [ J ].Information Systems Research,2010,21(4): 711-723.
[2]Shannon C E,Weaver W.The mathematical theo
5.4 数据密集型科研范式环境下的科学交流体系变化
4.3 机构知识库模式下的科学交流发展
(1)新型科学记录。科学记录是对科学研究全过程的描述,科学记录的首要目标是交流,科研工作者通过各自的学术记录来互相分享科学观点。它的另一目标是组织,学科即是通过大量科学记录的积累、关联而形成的。科学记录还是一种媒介,用以串联跨空间和跨时间的大规模科研合作。它还是一种手段,通过对科学记录的评议可以确定科学成果的版权和价值,通过科学记录中的科学问题的重复验证可以对科学错误进行识别和纠正。
机构知识库IR(Institutional Repository)是科研机构建立的数字仓库,用于保存机构内的科研资源,包括学术论文、实验数据、学位论文、电子预印本、科学数据库、会议录、教学课件等,它可以提供跨库的无缝检索,实现科学资源的整合并提供服务,是开放存取理念下的一种以数据库为核心的新的科学交流模式。
4.3.1 机构知识库的概念
在科学第一范式和第二范式时期,科学记录主要以科技期刊、会议演讲、会议记录以及科学基础数据为主,这些记录分散的储存于各个图书馆、档案馆和科研机构的资料室中,不仅获取不便,科学成果的重复验证难度也非常大,这一阶段的科学记录方式以科学成果的储藏为主。到了20世纪科研第三范式阶段,随着网络和计算技术的出现,用于科学实验的数据在不断增加,但它们只能被总结性的写入科学出版物中,依赖复杂的软件对科学进行重复验证仍然具有较大难度,这一阶段的科学记录以部分数据、期刊论文为主。而在数据密集型科研范式下,科学记录将不再完全以期刊论文为核心,Lynch[54][55]对数据密集型科研范式影响下的新型科学记录做了研究:①以数据为核心的科学记录。随着科学进入数据密集型时代,数据拥有前所未有的重要性,数据和软件必须被完整写入科学记录,数据将以复杂的形态与科学论文交织,论文的创作过程将更充分地考虑数据的采集、筛选和分析过程,对科学研究过程中实验数据的完整记录使得科学成果更容易重复验证,为后续的扩展研究做好基础。②参考数据集的引用。参考数据集是独立于科学研究,受学科内认可并被大量引用的通用数据集,是随着科研的发展而不断更新的。与传统的科学研究不同,数据密集型科研范式下的参考数据集将以计算的方式进行引用,而不是单纯的通过阅读引用。在参考数据集被更新时,可能引发新的计算,结果可能导致科学成果的重新评估。以计算方式引用的参考数据集的论文比起单纯通过阅读来引用参考数据集的论文,受到参考数据集更新所带来的混乱将会大大减少。③可以被计算的科学记录。相对于传统以部分数据和科学文献为主的科学记录,数据密集型科研范式下的科学记录以数据为核心,数据和文本的挖掘、信息的检索、过滤及聚类使得科学记录可以被计算。科学家在进行科研活动时,运用计算工具对科学记录的计算可以获取更为结构化的支撑某一科学理论的论文体系和数据集。
目前有很多专家、学者对机构知识库作出了不同的定义,SPARC 高级顾问Crow 认为“机构知识库是收集与保存一所大学或多所高校研究成果的数字资源集合[43]”。麻省理工学院图书馆的Workbook 认为:“机构知识库是一个具有一系列服务功能的数据库,获取、存储、索引、保存和发布学术机构中以数字形式存在的学术研究内容[44]。”CNI 执行主任Lynch 认为:“机构知识库是数字时代学术研究的基础设施,一个大学的IR 是学校为师生员工所提供的一系列服务,目的是用于管理和发布由本机构及其成员所创造的数字资料[45]。”
4.3.2 机构知识库的科学交流功能
蔡迎春[22]通过将机构知识库和传统科学交流模式相比较,认为机构知识库作为科学交流的新模式,具有更为优越的科学交流性能、客观的分析评价功能、较强的信息反馈机制,以及便捷的知识共享功能。
①优越的科学交流性能。机构知识库所保存的科研资源的获取更为便捷,学术交流过程更具效率。
②客观的分析评价功能。IR 将机构内部所有的科研资源进行整合集成,通过对各种科研资源历史版本的保存,展现机构发展的脉络,可以用来评价机构学术能力,也可以预测机构研究趋势,加深了科研访问者对科研机构的了解。
③较强的信息反馈机制。相对于传统学术交流的简单反馈机制,IR 的学术交流反馈机制可以在科研作者和科研用户之间形成网状互动的结构,不同研究人员或研究机构的思维交汇推动着科学研究的发展,学术信息发出者与接收者之间的角色在科学交流过程中不断互换,思想的碰撞会推动科研进程,加速科研成果的产出。
④便捷的知识共享功能。为多个机构知识库内的所有科学资源设置元数据,制定统一的标记协议对其进行标记,以实现搜索引擎可以对全部机构知识库进行搜索,并以恰当的方式显示给用户,为用户提供便捷的获取途径,促进了知识的有效传递,实现知识在更广范围的共享和利用。
4.3.3 机构知识库对科学交流的推进
(3)数据与文献的语义集成。在数据密集型科研范式环境下,科研成果的论证往往需要大量的科研数据支持,期刊在刊出文献的同时,也在变成包含文献、数据和其他实验细节的网站。科研第四范式环境下的科研活动需要对数据相关的文献和支持文献的数据进行集成,通过数据关联、语义标记等技术,可以方便科研人员在阅读科研文献时直接获取支持文献的数据,也可以在搜索科研数据时链接至相关研究文献。例如,美国国立生物技术信息中心NCBI 主持的生命科学数据库检索系统Entrez[58],它将核酸和蛋白序列、三维结构、文献以及基因组等不同类型的数据库有机地链接在一起,用户可以从一个DNA 序列查询到蛋白产物以及相关文献,再通过点击“Related Articles”链接至其它相关文献,还能使用“Related Sequence”工具找到与查询所得蛋白质序列同源的其他蛋白质序列,并且利用相关软件直接显示分子三维结构图形。
机构知识库的出现很大程度上推动了科学交流的发展,马漫江[46]作出了归纳:
(1)机构知识库为科学交流的发展提供了一个高效的科研资源保存和交流平台。随着科学技术的不断发展,科学成果需要被完善保存。机构知识库作为一种新的学术交流模式,它可以安全的、完整地保存机构内科学研究发展的历程。通过建立机构知识库,借助先进的管理技术,收集机构内所拥有的各种学术资源,以开放存取为理念,提供出版、发布、检索、获取等服务,可以有效推动科学交流的发展。
(2)提高科学交流效率,促进科学研究发展。机构知识库促进科学研究资源在研究人员之间免费、快速的传播,是机构知识库的一项重要功能。机构知识库在获得作者授权后,以数字形式保存并传播其研究成果,可以加速机构内学术研究成果的向外传播、展示机构科学研究的深度与广度,有效地提高了科研交流效率和机构知名度。
(4)以数据溯源为主的学术成果演变跟踪。传统的科学交流体系中,学术引文图被用于说明新知识对原有知识的使用情况,揭示科学研究的动态变化,发现科学关联,对学科发展趋势进行预测。但是,学术引文图的覆盖范围经常只包括学科内的各类期刊,少有学科外的知识引用,覆盖类型也以期刊论文为主,少有实验数据的引用。更大的问题是,对学术成果在整个科学体系中的演变过程没有明确的、可记录、可视化的跟踪,也不涉及演变性质等信息。如何向科研工作者更清晰地展示学术成果的动态变化、关系和交互过程,数据溯源信息共享机制是一种更好的解决方案。科研数据的溯源包含了科研数据的试验产生过程、原始数据源信息和演变过程[59]。科研数据溯源信息的保存对科研活动至关重要,它包括作者、试验过程、原始数据源、演变流程图等属性,溯源信息的缺失会降低数据可信度,影响数据的共享,导致数据价值降低。溯源信息的保存一方面可以用来学习和了解科研数据的产生过程,另一方面更是为了保证科研数据的准确性,以支持可重复的科学实验和演变过程推理。在科研第四范式环境下,语义技术、元数据技术和可视化技术可以被用来加工整合科研数据溯源信息以支持学术研究的系列成果发现及其影响力评价。
6 结 语
5 数据密集型科学研究范式环境下的科学交流发展趋势
科学交流体系是动态发展的体系,科学交流的模式最早以纸质文献为主要载体,在网络与数字技术的基础上,科学交流增加了电子预印本、学术博客、电子邮件、电子会议或网络会议、全文数据库等新元素和新渠道。随着近年开放存取理念的提出,论文期刊等科学资源的在线免费获取,在线电子预印本交流平台的开放,机构知识库的建立,科学交流正在发生巨大的变革。本文最后基于数据密集型科研范式的概念,研究了数据密集型科研范式指引下的科学交流未来发展方向。目前,数据密集型科研范式这一概念目前国内研究论文较少,国外的研究主要体现在科学数据的管理、科学数据的共享、跨学科科研合作与知识发现以及国际数据政策等问题,没有解决或难以解决的问题还有很多。作为科学的重要组成部分,科学交流的变革式发展将极大地推动世界范围内科学的发展进程。
参考文献
随着以博客、社交网络、基于位置的服务LBS 为代表的新型信息发布方式的不断涌现,以及云计算、物联网等技术的兴起,数据正以前所未有的速度在不断地增长和累积,科学家不仅通过对广泛的数据进行实时、动态的监测与分析来解决以前难以解决的科学难题,更是把数据作为科学研究的对象和工具,基于数据来思考、设计和实施科学研究。G.Bell[47]从生物学、天文学和物理学等学科的角度,阐述了数据的爆发式增长给科学研究带来的巨大变革。数据指引着科学未来的发展方向,如何建立以海量科学数据为核心的数据密集型科研范式是科学界关注的重大问题。在数据的洪流中,在数据密集型科研范式环境下,科学交流将迎来变革式的发展。
5.1 数据密集型科学研究范式的兴起
[1]Tony Hey,Stewart Tansley,Kristin Tolle.The fourth paradigm:Data-intensive scientific discovery [ M].Microsoft research,Redmond,Washington,2009.
传统的科学研究在经历了以自然实验为主的第一范式实验科学、以理论的假设推理为主的第二范式理论科学和以计算与模拟为主的第三范式计算科学之后,迎来了数据密集型计算科学范式即科学研究第四范式[1]。
[2]Mlhan I V,Rao.Agricultural knowledge transfer in india: A study of prevailing communication channels [J].Library Philosophy andPractice,2007: 1-11.
(1)第一范式实验科学。实验科学是最早出现的科研范式,大多是对自然现象进行重复实验而得到成果,少有系统的理论归纳。例如,爱迪生测试几千种材料而发明钨丝灯泡、富兰克林收集雷电而发明避雷针等都属于典型的实验科学。
[3]米哈依洛夫,乔尔内等.徐新民等译.科学交流与情报学[M].北京:科学技术文献出版社,1980.
[4]Garvey W D.Communication: The essence of science [M].Elmsford,NY: Pergamon Press,1979.
(2)第二范式理论科学。理论科学是在实验科学的基础上发展而来,理论科学强调对现象的理论总结和概括,强调普遍原理的发现而不是针对单个现象的研究实验。科研流程是先由重复发生的现象提出假设理论,然后设计不同变量下的多次实验,并使用假设理论对实验结果进行预测,实验结果是否和预测结果一致以及在实验过程中产生的新现象将会检验与修正假设理论,假设理论在经过无数的实验与修正后才会上升至定理和真理。
[5]ACRL.Integrating scholarly communication into your library [EB/OL].[2015-09-20].http: / /acrl.ala.org/scholcomm/.
(3)第三范式计算科学。随着20世纪计算机的发明和计算能力的不断增强,科学从理论推理转向计算仿真,计算科学被认为是实验科学和理论科学的扩展,是通过计算机分析和模拟来解决科学问题的新范式。当研究范围由微观原理发现扩大至区域复杂系统研究例如天气预报、自然灾害的预测时,计算和仿真模拟研究方法体现出巨大的优势。但随着更加精密的数据采集仪器的出现,实验数据呈现爆发式增长,由此引出了数据密集型计算科学,即科研第四范式。
[6]Rowland F.Print journals: Fit for the future? [J/OL].[2015-8-20].http: / /www.ariadne.ac.uk/issue7/fytton/.
(4)第四范式数据密集型计算科学。科研第四范式是以数据为核心的研究范式,数据是科学研究的对象和工具,相对于传统科学研究对精确的原始数据和严密的假设检验过程的要求,数据密集型科研范式下的科研发现不再追求绝对精确的原始数据,也不再依赖严密的假设检验过程,海量原始数据的采集能力以及云计算所带来的强大集群计算和存储资源正在建立以数据密集型计算为中心的科学研究,更多复杂无序的相关关系的发现以及学科间更为密切的交流合作产生了科学研究的新方法[48]。
[7]Roosendaal H E,Peter A,Geurts Th M.Forces and functions in scientific communication: An analysis of their interplay [EB/OL].[ 2015-6-30].http: / /doc.utwente.nl/60395/1/Roo sendaal 97forces.pdf.
ook=384,pagenumber_b自科学交流活动进入网络时代以来,基于网络的科学交流带来了丰富的科学交流方式和高效的资源共享体系。随着科学进入数据密集型时代,数据在科研活动中逐渐成为科学交流的核心,科学交流方式和内容也在发生转变。
[8]Menzel H.Planned and unplanned scientific communication [C]/ / Proceedings of the International Conference on Scientific Information.Washington,D.C: National Academy of Sciences,National Research Council,1959: 199-243.
[9]贾二鹏.Web2.0对科学交流的影响及效果分析[J].情报探索,2009(7):40-42.
[10]Søndergaard T F,Andersen J,Hjørland B.Documents and the communication of scientific and scholarly information: Revising and updating the UNISIST model [J].Journal of Documentation,2003: 278- 320.
[11]徐佳宁.数字环境下科学交流系统重组与功能实现[M].北京:光明日报出版社,2010.
(1)科学交流内容的转变。虽然数据一直以来都是科学研究中的关键因素,但传统的科学交流多以由分析处理数据而获得的研究论文作为主要交流内容,在数据密集型科研环境下,科研数据在科研活动中的重要性与日俱增,科研数据已经被认为是重要的科研成果,和科研论文同为科学交流的核心内容,各种类型的结构化、半结构化、非结构化数据,如视频、音频、图片开始嵌入到各类科研交流活动中。例如,期刊论文中不仅可以使用文字、表格、图片来记录实验,还可以使用视频、音频等数据来描述研究过程。另外,在跨学科的科学交流活动中,由于学科间的数据类型、研究方法等差异较大,数据作为科研活动的基础,此时跨学科数据交流就显得更为重要。科学界正在积极探讨并探索实施将数据集整合进科学信息系统的所有功能:数据的登记、认证、发现、存储和奖励。F.Berman[49]研究了科学家对于数据的可信赖性以及长期储存重要性的关注程度。R.Ruusalepp[50]等研究了支持共享数据发现的基础设施需求,M.Altman[51]研究了数据引用格式的标准,体现了数据作为独立的科研成果正在逐渐受到认可。
[12]Garvey W D,Griffith B C.Communication and information processing within scientific disciplines: Empirical findings for Psychology [J].Information Storage and Retrieval,1972(8):123-126.
[13]Fröhlich G.The (Surplus) value of scientific communication[EB/OL].[2015-07-30].http: / /eprints.rclis.org/8924/1/SurplusValueScienComm.pdf.
(2)科学交流方式的转变。传统方式的科学交流以科技期刊的出版、举办科学交流会议、开设学术讲座等方式为主,随着近年来信息技术的快速发展,出现了以电子期刊、电子图书馆、学术博客、学术论坛等基于网络的科学交流新形式。网络科学交流的出现很大程度上丰富了科学交流方式,例如,查询他人学术成果、下载电子图书、关注科研机构网站、RSS 科研专题订阅等交流行为也对科研活动产生了积极的影响,但也存在着资源分散、管理混乱、缺乏规范等问题。现阶段的科学交流在网络科学交流的基础上朝着开放式科学交流发展,开放式科学交流的核心是科研数据和科研论文等学术资源的开放获取,包括开放数据、开放信息、开放知识等内容,目标是实现开放创新。科研数据、软件、硬件、文献等学术成果被集成在学术平台上,科研用户通过网络从集成学术平台上主动共享或获取他人所共享的数据、软件、文献等学术资源,开放式科学交流对于消除“数据鸿沟”、推动知识创新等方面具有重要意义。而当科学进入数据密集型科研时代后,科学研究需要多领域知识的融合,科技领域之间需要建立连接,多学科研究和跨领域合作将成为科学交流的新方式,跨学科跨国界的大型科研项目合作将成为引领学科发展的核心力量[52]。
[14]Poultney R W.Front-Ends are the way to go [N].Europhysics News,1996(27): 24-25.
5.3 科研用户对于科学交流的新需求
[15]Van Raan A F.Bibiometrics and internet: Some oberservations and expections [J].Scientometrics,2001(50): 59-63.
科研人员只靠个体或小研究团体就能完成从数据收集到论文写作全部工作的研究方式已经衰落,而由大量的分散研究团体为了共同的项目而进行跨时间和跨空间合作的时代已经到来。在科研第四范式环境下,科研活动中科研人员对于科学信息交流的需求显得更为迫切。这种需求主要体现在更为开放便捷的科学资源获取以及联系更为紧密的科研团体间的交流合作上。
[16]徐丽芳.科学交流系统的要素、结构、功能及其演进[J].图书情报知识,2008(6):114-117.
(1)更开放便捷的数据获取。特别是跨学科数据资源的获取,数据作为科学研究活动的重要组成部分,是科学交流的目的之一。传统的科学交流活动以期刊、会议作为主要交流方式,以学术成果的出版为主,鲜有科学数据的储存,这加大了后续科研工作者查阅获取相关实验数据的难度。在科研第四范式环境下,科学家需求的不仅仅是学术研究的最终成果,学术成果所使用的数据,所涉及的科学交流过程也是非常重要的。
[17]Hjørland B,Søndergaard T F,Andersen J.UNISIST model and knowledge domains [J].Encyclopedia of Library and Information Science,2005(4): 1-4.
(2)科研团体之间的交流合作[53]。科学研究合作方式正在由学科内的小范围团体合作向跨学科跨国境的更大规模合作方式转变。海量的学术文献使得研究人员不能全面阅读了解所有领域的相关文献,需要有服务来帮助科研人员阅读和过滤信息,由于研究人员越来越需要跨学科地吸收和处理文献、链接不同领域的知识点,这种需求将孤立的科研发现结合在一起,从而发现新的知识,这点需求在跨学科研究领域非常明显。
5.4 数据密集型科研范式环境下的科学交流体系变化
J,Hjørland B.Documents and the communication of scientific and scholarlu information: Revising and updating the UNISIST model [J].Journal of Documentation,2003,59(3): 278-320. L M,et al.Predicting different(1)新型科学记录。科学记录是对科学研究全过程的描述,科学记录的首要目标是交流,科研工作者通过各自的学术记录来互相分享科学观点。它的另一目标是组织,学科即是通过大量科学记录的积累、关联而形成的。科学记录还是一种媒介,用以串联跨空间和跨时间的大规模科研合作。它还是一种手段,通过对科学记录的评议可以确定科学成果的版权和价值,通过科学记录中的科学问题的重复验证可以对科学错误进行识别和纠正。
[19]Björk B-C.A model of scientific communication as a global distributed information system [J].Information Research,2007,12(2): 1-48.
[20]Van de Sompel,Payette S,Erickson J,et al.Rethinking scholarly communication: Building the system that scholars deserve [J].D-Lib Magazine,2004,10(9).
[21]黄如花,冯晴.论开放存取出版对科学信息交流和利用的影响[J].出版科学,2008(3):75-78.
[22]蔡迎春.机构知识库:基于开放存取的学术交流机制[J].情报理论与实践,2008(5):680-683.
[23]Crawford S Y,Hurd J M,Weller A C.From print to electronic:the transformation of scientific communication [M].Medford,NJ: Information Today,Inc.,1996.
在科学第一范式和第二范式时期,科学记录主要以科技期刊、会议演讲、会议记录以及科学基础数据为主,这些记录分散的储存于各个图书馆、档案馆和科研机构的资料室中,不仅获取不便,科学成果的重复验证难度也非常大,这一阶段的科学记录方式以科学成果的储藏为主。到了20世纪科研第三范式阶段,随着网络和计算技术的出现,用于科学实验的数据在不断增加,但它们只能被总结性的写入科学出版物中,依赖复杂的软件对科学进行重复验证仍然具有较大难度,这一阶段的科学记录以部分数据、期刊论文为主。而在数据密集型科研范式下,科学记录将不再完全以期刊论文为核心,Lynch[54][55]对数据密集型科研范式影响下的新型科学记录做了研究:①以数据为核心的科学记录。随着科学进入数据密集型时代,数据拥有前所未有的重要性,数据和软件必须被完整写入科学记录,数据将以复杂的形态与科学论文交织,论文的创作过程将更充分地考虑数据的采集、筛选和分析过程,对科学研究过程中实验数据的完整记录使得科学成果更容易重复验证,为后续的扩展研究做好基础。②参考数据集的引用。参考数据集是独立于科学研究,受学科内认可并被大量引用的通用数据集,是随着科研的发展而不断更新的。与传统的科学研究不同,数据密集型科研范式下的参考数据集将以计算的方式进行引用,而不是单纯的通过阅读引用。在参考数据集被更新时,可能引发新的计算,结果可能导致科学成果的重新评估。以计算方式引用的参考数据集的论文比起单纯通过阅读来引用参考数据集的论文,受到参考数据集更新所带来的混乱将会大大减少。③可以被计算的科学记录。相对于传统以部分数据和科学文献为主的科学记录,数据密集型科研范式下的科学记录以数据为核心,数据和文本的挖掘、信息的检索、过滤及聚类使得科学记录可以被计算。科学家在进行科研活动时,运用计算工具对科学记录的计算可以获取更为结构化的支撑某一科学理论的论文体系和数据集。
[24]Hurd J M.Scientific communication: New roles and new players[J].Science & Technology Libraries,2004(25): 5-22.
[25]Unesco.UNISIST: Study report on the feasibility of a World Science Information System [J].New York: UNIPUB Inc.,1971: 30.
[26]徐丽芳.UNISIST 模型及其数字化发展[J].图书情报工作,2008(10):65-69.
[27]Björk B-C.,Hedlund T.A formalized model of the scientific publication process [J].Online Information Review,2004,28(1): 8-21.
[28]Björk B-C.A life model of the scientific communication process[J].Learned Publishing,2005(3): 165-176.
(2)跨学科科学资源的知识发现。由于研究人员越来越需要跨学科的吸收和处理文献、链接不同领域的知识点来发现新的知识,海量的科学文献使得科学家不可能全部阅读与其科学研究领域有关的全部文献,需要利用机器来对科学信息进行过滤。这一需求在生命科学、遗传学、分子生物学、生物化学和医药化学等跨学科性较强的领域更为凸显。A.Ruttenberg[56]认为,缺乏统一结构化的数据已经成为阻碍生物和医学领域将基础性研究成果转化为临床领域应用的主要因素。D.Shotton[57]等认为更高级的文本分析技术正在应用到从文献中抽取实体和实体间的关系,共享的知识本体可以被用来实现统一知识表达,这一方式可以对原来只能由人去阅读的文献所包含信息进行分析以发现新的知识。国际概念网络联盟提出要建立一个全球性的跨学科平台,讨论、设计并实现大规模、分布式复杂数据的互操作性和可用性的解决方案,该联盟的成立代表了科学界对面向机器操作的内容处理技术的关注和重视。通过对跨学科复杂知识的机器处理,可以帮助科学家对复杂知识体系进行推理以促进知识发现、避免重复研究、发现解决科学问题的新途径。Ginsparg[52]认为科学交流体系正在数据密集型科研的影响下迅速转变,科学研究不再以小型科研团队为主体,跨多个学科领域的科研群体将会引领科研变革,成为科学研究的核心力量。
[29]Houghton J W,Rasmussen B,Sheehan P J,et al.Economic implications of alternative scholarly publishing models: Exploring the costs and benefits [EB/OL].[2014-09-15].http: / /www.jisc.ac.uk/media/documents/publications/rpteconomicoapublishing.pdf.
[30]孙玉伟.数字环境下科学交流模型的分析与述评[J].大学图书馆学报,2010(1):41-45.
[31]胡德华,韩欢.学术交流模型研究[J].图书情报工作,2010,54(2):26-30.
(3)数据与文献的语义集成。在数据密集型科研范式环境下,科研成果的论证往往需要大量的科研数据支持,期刊在刊出文献的同时,也在变成包含文献、数据和其他实验细节的网站。科研第四范式环境下的科研活动需要对数据相关的文献和支持文献的数据进行集成,通过数据关联、语义标记等技术,可以方便科研人员在阅读科研文献时直接获取支持文献的数据,也可以在搜索科研数据时链接至相关研究文献。例如,美国国立生物技术信息中心NCBI 主持的生命科学数据库检索系统Entrez[58],它将核酸和蛋白序列、三维结构、文献以及基因组等不同类型的数据库有机地链接在一起,用户可以从一个DNA 序列查询到蛋白产物以及相关文献,再通过点击“Related Articles”链接至其它相关文献,还能使用“Related Sequence”工具找到与查询所得蛋白质序列同源的其他蛋白质序列,并且利用相关软件直接显示分子三维结构图形。
[32]胡德华,尹加帮,陶雯.发展中国家的开放存取期刊研究[J].情报杂志,2007(2):140- 142.
[33]赵莉莉.国内两大开放存取系统的对比研究——奇迹文库和中国预印本服务系统[J].现代情报,2007(9):48-50.
[34]Budapest Open Access Initiative [EB/OL].[2015-05-06].http: / /www.soros.org/openaccess/ read.shtml.
[35]孙希波.开放存取对学术交流系统的影响[J].现代情报,2009(10):29-30.
[36]李金林,张秋菊,冉仑.开放存取对学术交流系统的影响分析[J].图书馆论坛,2013(3):13-17.
[37]马景娣.ISI 引文数据库收录的开放存取期刊[J].中国科技期刊研究,2005,16(5):624.
6 结 语
[38]曾元祥,方卿.论开放存取对学术交流的影响(一)——基于科研人员视角的分析[J].信息资源管理学报,2011(3):53-56.
[39]Swan A,Brown S.Open access self-archiving: An author study[ EB/OL ].[ 2014-09-22].http: / /cogprints.org/4385/1/jisc2.pdf.
科学交流体系是动态发展的体系,科学交流的模式最早以纸质文献为主要载体,在网络与数字技术的基础上,科学交流增加了电子预印本、学术博客、电子邮件、电子会议或网络会议、全文数据库等新元素和新渠道。随着近年开放存取理念的提出,论文期刊等科学资源的在线免费获取,在线电子预印本交流平台的开放,机构知识库的建立,科学交流正在发生巨大的变革。本文最后基于数据密集型科研范式的概念,研究了数据密集型科研范式指引下的科学交流未来发展方向。目前,数据密集型科研范式这一概念目前国内研究论文较少,国外的研究主要体现在科学数据的管理、科学数据的共享、跨学科科研合作与知识发现以及国际数据政策等问题,没有解决或难以解决的问题还有很多。作为科学的重要组成部分,科学交流的变革式发展将极大地推动世界范围内科学的发展进程。
参考文献
[40]Antelman K.Do open-access articles have a greater research impact ? [EB/OL].[2014-08- 09].http: / /www.socolar.com/man/NewsUpload/200726948375274.pdf.
[41]张晓蒙,方卿.论开放存取对学术交流的影响(二)——基于图书情报角的分析[J].信息资源管理学报,2011(3):57-61.
[1]Tony Hey,Stewart Tansley,Kristin Tolle.The fourth paradigm:Data-intensive scientific discovery [ M].Microsoft research,Redmond,Washington,2009.
[42]夏莉霞,方卿.论开放存取对学术交流的影响(三)——基于学术出版机构视角的分析[J].信息资源管理学报,2011(3):62-66.
[2]Mlhan I V,Rao.Agricultural knowledge transfer in india: A study of prevailing communication channels [J].Library Philosophy andPractice,2007: 1-11.
[43]Crow R.The case for institutional repositories A SPARC position paper [EB/OL].[2014-08- 06].http: / /www.arlorg/spare/IR/ir.html.
[3]米哈依洛夫,乔尔内等.徐新民等译.科学交流与情报学[M].北京:科学技术文献出版社,1980.
[4]Garvey W D.Communication: The essence of science [M].Elmsford,NY: Pergamon Press,1979.
[44]Barton M R,Waters M M.Creating an institutional repositories LEADIRS workbook [ EB/OL].[ 2012-03-05].http: / /www.Dspace.org/implement/leadirs.pdf.
[5]ACRL.Integrating scholarly communication into your library [EB/OL].[2015-09-20].http: / /acrl.ala.org/scholcomm/.
[45]Lynch C A.Institutional repositories essential infrastructure for scholarship in the digital age [J].ARI,2003: 1-7.
[46]马漫江.机构知识库:学术交流与资源共享新模式[J].高校图书馆工作,2007(1):10-13.
[6]Rowland F.Print journals: Fit for the future? [J/OL].[2015-8-20].http: / /www.ariadne.ac.uk/issue7/fytton/.
[47]Bell G,Hey T,Szalay A.Beyond the data deluge [J].Science,2009(323): 1297-1298.
[48]Szalay A,Gray J.2020Computing: Science in an exponential world [J].Nature,2006(440): 413-414.
[7]Roosendaal H E,Peter A,Geurts Th M.Forces and functions in scientific communication: An analysis of their interplay [EB/OL].[ 2015-6-30].http: / /doc.utwente.nl/60395/1/Roo sendaal 97forces.pdf.
[49]Berman F.Got data? : A guide to data preservation in the information age [J].Commun.ACM,2008,51(12): 50-56.
[8]Menzel H.Planned and unplanned scientific communication [C]/ / Proceedings of the International Conference on Scientific Information.Washington,D.C: National Academy of Sciences,National Research Council,1959: 199-243.
[9]贾二鹏.Web2.0对科学交流的影响及效果分析[J].情报探索,2009(7):40-42.
tion: A comparative study of international approaches to enabling the sharing of research data [J].JISC,2008: 3-103. 2006,26(8): 882-903. Management Science,1999,27(3):[51]Altman M,King G.A proposed standard for the scholarly citation ofquantitative data [J].D-Lib Magazine,2007,13(3): 1-9.
[10]Søndergaard T F,Andersen J,Hjørland B.Documents and the communication of scientific and scholarly information: Revising and updating the UNISIST model [J].Journal of Documentation,2003: 278- 320.
[11]徐佳宁.数字环境下科学交流系统重组与功能实现[M].北京:光明日报出版社,2010.
[52]Ginsparg P.Next generation implications of open access [J/OL].CTWatch Quarterly,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/next-generation-implications-of- openaccess/.
[53]赵蓉英,温芳芳.科研合作与知识交流[J].图书情报工作,2011(20):6-10.
[12]Garvey W D,Griffith B C.Communication and information processing within scientific disciplines: Empirical findings for Psychology [J].Information Storage and Retrieval,1972(8):123-126.
[13]Fröhlich G.The (Surplus) value of scientific communication[EB/OL].[2015-07-30].http: / /eprints.rclis.org/8924/1/SurplusValueScienComm.pdf.
[54]Lynch C A.The shape of the scientific article in the developing cyber infrastructure [J/OL].CTWatch,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/the-shape-of- thescientific-article-in-the-developing-cyberinfrastructure/.
[14]Poultney R W.Front-Ends are the way to go [N].Europhysics News,1996(27): 24-25.
[55]Lynch C A.Open computation: Beyond human-reader-centric views of scholarly literatures [J/OL].Chandos Publishing,2006:185-193.http: / /old.cni.org/staff/cliffpubs/OpenComput ation.htm.
[15]Van Raan A F.Bibiometrics and internet: Some oberservations and expections [J].Scientometrics,2001(50): 59-63.
[16]徐丽芳.科学交流系统的要素、结构、功能及其演进[J].图书情报知识,2008(6):114-117.
[56]Ruttenberg A,Clark T,Bug W,et al.Advancing translational research with the Semantic Web [J].BMC Bioinf ormatics,2007,8(3): 1-16.
[17]Hjørland B,Søndergaard T F,Andersen J.UNISIST model and knowledge domains [J].Encyclopedia of Library and Information Science,2005(4): 1-4.
[57]Shotton D,Portwin K,Klyne G,et al.Adventures in semantic publishing: Exemplar semantic enhancements of a research article[J].PLoS Computational Biology,2009(5): 1- 17.
[58]http: / /www.ncbi.nlm.nih.gov.
[18]Søndergaard T F,Andersen J,Hjørland B.Documents and the communication of scientific and scholarlu information: Revising and updating the UNISIST model [J].Journal of Documentation,2003,59(3): 278-320.
[59]Bose R,Frew J.Lineage retrieval for scientific data processing:A survey [J].ACM Computing Surveys,2005(37): 1-28.
【作者简介】
[19]Björk B-C.A model of scientific communication as a global distributed information system [J].Information Research,2007,12(2): 1-48.
[20]Van de Sompel,Payette S,Erickson J,et al.Rethinking scholarly communication: Building the system that scholars deserve [J].D-Lib Magazine,2004,10(9).
[21]黄如花,冯晴.论开放存取出版对科学信息交流和利用的影响[J].出版科学,2008(3):75-78.
[22]蔡迎春.机构知识库:基于开放存取的学术交流机制[J].情报理论与实践,2008(5):680-683.
[23]Crawford S Y,Hurd J M,Weller A C.From print to electronic:the transformation of scientific communication [M].Medford,NJ: Information Today,Inc.,1996.
[24]Hurd J M.Scientific communication: New roles and new players[J].Science & Technology Libraries,2004(25): 5-22.
[25]Unesco.UNISIST: Study report on the feasibility of a World Science Information System [J].New York: UNIPUB Inc.,1971: 30.
[26]徐丽芳.UNISIST 模型及其数字化发展[J].图书情报工作,2008(10):65-69.
[27]Björk B-C.,Hedlund T.A formalized model of the scientific publication process [J].Online Information Review,2004,28(1): 8-21.
[28]Björk B-C.A life model of the scientific communication process[J].Learned Publishing,2005(3): 165-176.
[29]Houghton J W,Rasmussen B,Sheehan P J,et al.Economic implications of alternative scholarly publishing models: Exploring the costs and benefits [EB/OL].[2014-09-15].http: / /www.jisc.ac.uk/media/documents/publications/rpteconomicoapublishing.pdf.
[30]孙玉伟.数字环境下科学交流模型的分析与述评[J].大学图书馆学报,2010(1):41-45.
[31]胡德华,韩欢.学术交流模型研究[J].图书情报工作,2010,54(2):26-30.
[32]胡德华,尹加帮,陶雯.发展中国家的开放存取期刊研究[J].情报杂志,2007(2):140- 142.
[33]赵莉莉.国内两大开放存取系统的对比研究——奇迹文库和中国预印本服务系统[J].现代情报,2007(9):48-50.
[34]Budapest Open Access Initiative [EB/OL].[2015-05-06].http: / /www.soros.org/openaccess/ read.shtml.
[35]孙希波.开放存取对学术交流系统的影响[J].现代情报,2009(10):29-30.
[36]李金林,张秋菊,冉仑.开放存取对学术交流系统的影响分析[J].图书馆论坛,2013(3):13-17.
[37]马景娣.ISI 引文数据库收录的开放存取期刊[J].中国科技期刊研究,2005,16(5):624.
[38]曾元祥,方卿.论开放存取对学术交流的影响(一)——基于科研人员视角的分析[J].信息资源管理学报,2011(3):53-56.
[39]Swan A,Brown S.Open access self-archiving: An author study[ EB/OL ].[ 2014-09-22].http: / /cogprints.org/4385/1/jisc2.pdf.
[40]Antelman K.Do open-access articles have a greater research impact ? [EB/OL].[2014-08- 09].http: / /www.socolar.com/man/NewsUpload/200726948375274.pdf.
[41]张晓蒙,方卿.论开放存取对学术交流的影响(二)——基于图书情报角的分析[J].信息资源管理学报,2011(3):57-61.
[42]夏莉霞,方卿.论开放存取对学术交流的影响(三)——基于学术出版机构视角的分析[J].信息资源管理学报,2011(3):62-66.
[43]Crow R.The case for institutional repositories A SPARC position paper [EB/OL].[2014-08- 06].http: / /www.arlorg/spare/IR/ir.html.
[44]Barton M R,Waters M M.Creating an institutional repositories LEADIRS workbook [ EB/OL].[ 2012-03-05].http: / /www.Dspace.org/implement/leadirs.pdf.
[45]Lynch C A.Institutional repositories essential infrastructure for scholarship in the digital age [J].ARI,2003: 1-7.
[46]马漫江.机构知识库:学术交流与资源共享新模式[J].高校图书馆工作,2007(1):10-13.
[47]Bell G,Hey T,Szalay A.Beyond the data deluge [J].Science,2009(323): 1297-1298.
[48]Szalay A,Gray J.2020Computing: Science in an exponential world [J].Nature,2006(440): 413-414.
[49]Berman F.Got data? : A guide to data preservation in the information age [J].Commun.ACM,2008,51(12): 50-56.
[50]Ruusalepp R.Infrastructure planning and data curation: A comparative study of international approaches to enabling the sharing of research data [J].JISC,2008: 3-103.
[51]Altman M,King G.A proposed standard for the scholarly citation ofquantitative data [J].D-Lib Magazine,2007,13(3): 1-9.
[52]Ginsparg P.Next generation implications of open access [J/OL].CTWatch Quarterly,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/next-generation-implications-of- openaccess/.
[53]赵蓉英,温芳芳.科研合作与知识交流[J].图书情报工作,2011(20):6-10.
[54]Lynch C A.The shape of the scientific article in the developing cyber infrastructure [J/OL].CTWatch,2007(3) .http: / /www.ctwatch.org/quarterly/articles/2007/08/the-shape-of- thescientific-article-in-the-developing-cyberinfrastructure/.
[55]Lynch C A.Open computation: Beyond human-reader-centric views of scholarly literatures [J/OL].Chandos Publishing,2006:185-193.http: / /old.cni.org/staff/cliffpubs/OpenComput ation.htm.
[56]Ruttenberg A,Clark T,Bug W,et al.Advancing translational research with the Semantic Web [J].BMC Bioinf ormatics,2007,8(3): 1-16.
[57]Shotton D,Portwin K,Klyne G,et al.Adventures in semantic publishing: Exemplar semantic enhancements of a research article[J].PLoS Computational Biology,2009(5): 1- 17.
[58]http: / /www.ncbi.nlm.nih.gov.
[59]Bose R,Frew J.Lineage retrieval for scientific data processing:A survey [J].ACM Computing Surveys,2005(37): 1-28.
【作者简介】
邓仲华,男,博士,武汉大学信息管理学院教授,博士生导师。长期从事信息系统理论及开发技术的研究,对商务、政务、企事业管理等各类系统的开发与项目管理,经验丰富。
黄鑫,男,1990年生,武汉大学在读博士生,研究方向为数据组织与管理。
邓仲华,男,博士,武汉大学信息管理学院教授,博士生导师。长期从事信息系统理论及开发技术的研究,对商务、政务、企事业管理等各类系统的开发与项目管理,经验丰富。
邓仲华,男,博士,武汉大学信息管理学院教授,博士生导师。长期从事信息系统理论及开发技术的研究,对商务、政务、企事业管理等各类系统的开发与项目管理,经验丰富。
黄鑫,男,1990年生,武汉大学在读博士生,研究方向为数据组织与管理。
rceived risk on consumer's online shopping免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。