理论教育 学术影响力测评方法-CitNetExplorer

学术影响力测评方法-CitNetExplorer

时间:2023-10-06 理论教育 版权反馈
【摘要】:尽管可以获取到被引期刊的刊名数据,但是CitNetExplorer不使用这些数据。用CitNetExplorer生成的基于时序的可视化视图中的横轴用来表示文献间的关系。CitNetExplorer给每个文献贴标签,标签内容是文献第一作者的姓。目前这一版本的CitNetExplorer可以使用的技术有:提取相关联的成分,对文献聚类,识别核心文献,查找文献间最短和最长的路径。在CitNetExplorer的新版本中将增加新的分析技术。

学术影响力测评方法-CitNetExplorer

CitNetExplorer利用基于时序的方法对文献间的直接引用网络进行可视化分析。它能对含有成千上万个文献以及引证关系的大型网络进行可视化分析。CitNetExplorer能处理的网络规模取决于计算机能调度的内存大小。

13.4.2.1 构建文献引文网络

CitNetExplorer能基于Web of Science的输出文件构建文献引文网络。Web of Science的输出文件包含文献的题录数据,但是这些数据不能直接反应文献间的引用关系。从Web of Science里下载的每个文献都有参考文献。为了挖掘出文献之间的引用关系,需要将Web of Science文件中的参考文献与Web of Science的文献进行匹配。对于一些参考文献而言,在Web of Science数据库中可能找不到相关的文献匹配,这种情况可能是Web of Science数据库没有收录该文献,对于其他的参考文献,可以找到相应的文献与其匹配。在Web of Science文件里,如果参考文献能找到匹配文献,那就说明有两篇文献存在引用关系。

有很多种方式能实现引文配对查找。CitNetExplorer最先尝试了基于DOI的匹配关系查找。然而,DOI数据通常不存在。这时候需要借助第一作者的姓名(姓,以及第一个名字的首字母)、文献发表年、卷数及页码等信息查找文献间的匹配关系。有了这些数据才能实现文献之间的精确匹配。尽管可以获取到被引期刊的刊名数据,但是CitNetExplorer不使用这些数据。这是因为在很多情况下,同一期刊的刊名写法并不一致。

CitNetExplorer假设文献的引文网络是非循环的。举个例子来说,不允许文献A和文献B之间互相引用。也不允许出现这样的情况:如果文献B引用文献A,文献C引用文献B,则文献A引用文献C。换言之,按照引文关系在文献引文网络中的移动,同一篇文献不可能被访问两次。但事实上,文献引文网络并非严格的不可循环。发表在某一期刊的同一期的两篇文献可能互相引用。为了解决这个问题,CitNetExplorer会对引文网络中是否存在循环引用问题进行检查,如果存在,CitNetExplorer将去掉引起循环的引用关系。CitNetExplorer也将消除向未来时间点施引的引用关系,例如2013年出版的文献引用2014年出版的文献,这种引用关系将被CitNetExplorer移除。

13.4.2.2 展示文献引文网络

如果在文献引文网络中,文献数高达50多篇甚至100篇,那么将全部的引用关系可视化的意义不大。引文网络中有许许多多的引用关系,把这些关系全部呈现出来会发现有许多边不可避免地交叉,导致可视化结果很难解释。正因为如此,在可视化大型网络时,CitNetExplorer对于文献的展示是有选择的。在默认情况下,可视化网络只展示40个高被引论文,但是使用者也可以根据自身的需求对其进行修改。为了简单起见,在下文的讨论中基于这样一个假设,我们处理的是一个小型网络,并且所有的文献都在网络中显示。大型网络以同样的方式可视化,所不同的是只有一部分文献在可视化结果中显示。

用CitNetExplorer做出的基于时序的可视化结果中,纵轴表示时间,越往下表示时间越接近当前。在纵轴方向,文献按发表时间决定具体位置。纵轴按层级组织,层与层的间距均等。一层至少代表一年,但是若干年也可以用多层表示。当同一年的文献间有引用关系,那么这一年就用多层来表示。用CitNetExplorer生成的基于时序的可视化视图中的横轴用来表示文献间的关系。一般而言,如果文献之间有很强的引用关系,那么这些文献在横轴上的位置就很近。

在基于时序的方法做出的文献引文网络视图中,确定文献的横纵坐标位置是等级图测绘的问题(Hierarchical Drawing)。根据等级图测绘(如,Healy,Nikolov,2013)方面的文献,CitNetExplorer首先提出在纵轴方向把文献对应到相应的层级上。文献的发表年决定文献落在哪一层。此外,在可视化视图中,引用关系沿着向上的方向传递,这一规则也决定文献分布在哪一层。换言之,对于任意引用关系,施引文献所在的层级一定在被引文献所在的层级的下方。确定文献在纵轴上属于哪一层级后,CitNetExplorer接着确定文献在横轴上的位置。(www.daowen.com)

在纵轴上,文献逐年按层级排列。如果某一年的文献相互间没有引用,只要该年的文献数没有超过对应层所容纳的最大文献数,那么这些文献都分布在同一层级上。在默认情况下,每一层所能容纳的最大文献数为10篇。如果某一年的文献间有引用关系,那么施引文献所在的层位于被引文献所在的层的下方。这是为了确保引用关系沿着向上的方向传递。CitNetExplorer使用简单启发式算法将文献分配在多个层级上,该算法是为了将层级的数量按实际需求最小化。

文献在横轴上的位置取决于文献之间的引用关系。引用关系既包括直接引用关系,也包括各类间接引用关系(如:同被引,文献耦合关系)。在横轴上,文献间的引用关系越强,它们的距离就越近。然而,纵轴方向上同一层分布的文献,在横轴方向上相互间要保持最小距离。这么做是为了减小在可视化视图中文献重叠的问题。CitNetExplorer在横轴上确定文献位置所使用的技术与VOS制图技术(见本章第4小节第1部分及附录)相似。

为了将文献引文网络的可视化效果最优化,CitNetExplorer使用了与VOSviewer相似的技术。CitNetExplorer给每个文献贴标签,标签内容是文献第一作者的姓。为了防止标签相互重叠,在可视化视图中有时只显示被选择的文献的标签。和VOSviewer一样,CitNetExplorer也有放大和缩小的功能。

13.4.2.3 分析技术

CitNetExplorer提供多样化的文献引文网络分析技术。目前这一版本的CitNetExplorer可以使用的技术有:提取相关联的成分,对文献聚类,识别核心文献,查找文献间最短和最长的路径。在CitNetExplorer的新版本中将增加新的分析技术。

文献聚类技术是参照Waltman和Van Eck(2012)所提出的方法实现的。该方法能使模块化函数〔Newman and Girvan(2004),Newman(2004)〕的一个变型最优化。分辨率参数决定着聚类群的精密度。与VOSviewer类似,CitNetExplorer使用Waltman和Van Eck(2013)引进的最优化算法。

CitNetExplorer使用K核来寻找核心文献,K核这一概念是Seidman(1983)提出的。核心文献就是指那些对其他核心文献的引用次数不低于某一最小值的文献。此处提到的引用关系数包括施引次数和被引次数。因此,为了寻找核心文献,需要将文献引文网络看成是无向图。找到核心文献就有可能帮助研究者移除那些在文献引文网络外围的不重要的节点。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈