VOSviewer使用基于距离的方法对文献计量网络进行可视化分析。任何类型的文献计量网络都能进行可视化分析。有向网络(例如基于直接引文关系的网络)在VOSviewer中被当作无向网络对待。一个网络可能由几千个点组成,但是由于计算能力及存储的限制,VOSviewer很难处理超过10000个点的网络。
13.4.1.1 标准化、制图及聚类
在文献计量网络中,节点之间所拥有的边的数目有很大不同。活跃的节点,代表高被引论文或者高产作者,这些节点的连接强度要比次活跃节点高几个等级。在文献计量网络分析中,应对不同节点之间的差异进行标准化处理。在默认情况下,VOSviewer使用关联强度标准。Van Eck和Waltman(2009)对关联强度标准化有详细的论述。
在标准化网络构建以后,接下来要在二维空间中确定网络节点的位置,强关联节点之间的距离近,弱关联节点之间的距离远。VOSviewer使用VOS绘图技术实现这一目标,而VOS的含义是相似性可视化(Visualization of Similarities)。Van Eck等(2010)对VOS绘图技术有详细的讨论。
在默认情况下,VOSviewer将节点聚类。一个聚类群就是一群关系紧密的节点的集合。网络中的每个节点都属于一个特定的聚类群。聚类群的数量由分辨率参数决定。分辨率越高,聚类群数量越多。在文献计量学网络可视化视图中,VOSviewer使用不同颜色代表不同聚类群。Waltman、Van Eck、Noyons(2010)的研究中探讨过VOSviewer使用的聚类技术。该技术需要使用最优解算法。为了求得最优解,VOSviewer使用了Waltman、Van Eck(2013)引入的智能位移算法。
在附录部分,我们对VOSviewer使用的标准化、绘图及聚类技术做了技术总结。
13.4.1.2 文献计量网络的展示
二维空间对网络中的节点在进行定位,并将节点归入相应的聚类群后,可视化网络就基本成形了。VOSviewer通过使用多样化的技术以最优化的方式展示可视化网络。为了确保节点的标签不重叠,是否显示标签是可以选择的。选择哪些节点标签在视图中显示遵循如下原则:让尽可能多的节点显示标签,重要的节点(即拥有更多边的点)优先显示标签。正如Google地图这样的软件能探索地图一样,VOSviewer也提供了放大和缩小的功能。这样的功能在研究由成百上千个节点组成的网络时是非常有用。放大后,视图将重新选择哪些节点可以显示标签,之前看不到的标签变得可见了。(www.daowen.com)
VOSviewer支持显示有重叠的可视化视图。在重叠视图中,节点的颜色代表节点的某些属性。例如,节点代表期刊,而节点的颜色代表期刊被引用的次数。重叠的可视化网络示例参见Van Eck、Waltman、Van Raan、Klautz、Peul(2013)的研究。VOSviewer还支持密度可视化。在密度可视化视图中,颜色能说明节点是如何在二维空间分布的。密度可视化能让人迅速地发现许多紧挨节点的密集区域。关于密度可视化的技术细节详见Van Eck、Waltman(2010)的著作。
13.4.1.3 分数计数法
正如在本章第5小节所展示的,VOSviewer可以处理Web of Science文献数据库的输出文件。
根据这些文件,VOSviewer能构建文献、期刊及著者之间的共被引及耦合网络。VOSviewer有一个特殊功能,即能使用分数计数法构建共被引网络及文献耦合网络。为了解释什么是分数计数法,我们以文献耦合网络为例进行说明,该方法可以用同样的方式处理其他类型的网络。
假设有100篇文献引用了同一篇文献,使用普通全计数法,100篇文献中的每一篇都与另外99篇文献有文献耦合关系,且权重值都为1。于是每篇文献的文献耦合总权值都为99×1=99。换成分数计数法,每篇文献与任意一篇文献的文献耦合权值为1/99,那么每一篇文献与所有文献的总权值为99×(1/99)=1。换句话说,使用分数计数法时,无论引用相同文献的其他文献的数量(毫无疑问,至少还有一篇施引文献)是多少,每篇文献的耦合总权值一定为1。因此,在使用分数计数法的情况下,高被引论文在构建耦合网络时所起的作用显得并不是那么重要。同理,附有一长串参考文献的文献在同被引网络的构建中所起作用也不是那么重要。一般情况下,我们推荐使用VOSviewer的分数计数法,不用普通全计数法。
13.4.1.4 文本挖掘技术
最后,简要地介绍下VOSviewer的文本挖掘功能,该功能用于构建从英语文本数据中提取相应条目(Term)的共现网络,这些条目可以从文献的标题及摘要中提取(Van Eck,Waltman,2011)。VOSviewer依靠Apache OpenNLP工具包(http://opennlp.apache.org)进行词性标注(例如,识别动词、名词、形容词等)。随后,Apache OpenNLP工具包使用语言过滤器识别名词词组。过滤器挑选所有由名词和形容词构成的词组(词组以名词为结尾)。复数名词词组被转换成单数。有些名词词组(如:结论,有趣的结果,新方法)很常见,研究者可能不希望这些短语出现在共现网络中。在计算时,VOSviewer给每个名词词组赋予一个关联值。原则上,如果名词词组与其他短语随机地共现,那么名词词组的关联值就小一些;如果名词词组主要与有限数量的短语共现,那么名词词组的关联值就大一些。得分较低的名词词组为常见词组,得分较高的短语往往具有特别的意义。VOSviewer允许剔除那些得分低的名词词组,如此一来舍弃了很多普通的名词词组。剩下的词组代表了某一研究领域的相关词组。VOSviewer能将这些词组的共现网络进行可视化。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。