理论教育 引文网络及节点度在学术影响力测评中的重要性

引文网络及节点度在学术影响力测评中的重要性

时间:2023-10-06 理论教育 版权反馈
【摘要】:科学和学术网络最普遍的类型就是引文网络。引文网络的相关文献很多,对其综述超出了本章的范围。节点度能在引文网络中计算。在引文网络中,出度与每篇文章的参考文献数量对应。在图3.16中,很显然,《文献计量学》文章引文网络的入度分布大概遵循了幂率分布。

引文网络及节点度在学术影响力测评中的重要性

科学和学术网络最普遍的类型就是引文网络。有各种不同类型的引文网络:作者引文网络(在作者全部作品层面上的综合数据)、文章引文网络(将独立文章作为分析的对象)和期刊引文网络(关注独立期刊的引文模式)。作者引文网络已经用于评估,例如,评价在一个科学领域独立作者的影响力,对他们进行排序,然后奖励他们。尽管文献计量学用于评估的广泛用途,但仍有一些未解决的问题,科学计量学研究人员长期以来一直反对任何单一评估方法的使用。在描述型书目计量学中,文章引文网络已基本用于理解科学的知识方面。他们已被用于理解知识库和研究前沿。研究的界限遵循Small(1978)提出的假说,参考文献代表了独有的观点。引文网络的相关文献很多,对其综述超出了本章的范围。最新的文献综述请参见Radicchi、Fortunato、Vespignani(2012)。

通常,引文网络是无环有向网络,因为在多数案例中(期刊的特别发行版除外),被引用的参考文献不能引用那些引用的文献。这种网络需要采用与我们所讨论的无向协作网络不同的度量方式。节点度能在引文网络中计算。但是,不只是一个单独的节点度,我们要计算两种:入度和出度。在引文网络案例中,入度的度量与一个作者、文章或期刊被引用的数量相对应。出度定义为发源于此节点的链接数量。在引文网络中,出度与每篇文章的参考文献数量对应。对作者来说,这种度量等于这个作者已经参考的所有文献;对期刊来说,则等于期刊里所有的参考文献。我们使用上述的《文献计量学》数据集测验文章和作者引文网络的入度分布。注意,此分析关注的是发表在《文献计量学》近10年时间的研究知识库,不包括其他来源的引文。

在图3.16中,很显然,《文献计量学》文章引文网络的入度分布大概遵循了幂率分布。这意味着对知识库的贡献不是均匀分布的,但是存在清楚的“中心”,或者吸引不均匀的高关注度的文章。在我们的数据集中,被引用最多的文章是Hirsch 2005年关于hindex的文章,有202个引用。排在第二的文章是Katz和Martin的1997的文章What is Research Collaboration,有70个引用。紧接着这两篇文章的是Sol la Price在1963年著的书Big Science,Little Science,有64个引用。King在2004年《自然》上的文章The Scientific Impact of Nations以63个引用排在第四位。最后,第五位的是Glänzel在2001年发表的文章National Characteristics inInternational Scientific Co-authorship Relations。

图3.16 《科学计量学》文章引文网络的入度分布

作者引文网络的入度分布也大约遵循幂率分布(见图3.17)。根据这种度量方式,最核心的作者是:W.Glänzel,E.Garfield,L.Leydesdorff,L.Egghe和H.Moed。

这些结果与《科学计量学》认知方面的最新发现及其历史根源相一致。也就是说,在最核心的文章中有两种不同的国际趋势。这一点很有趣,一方面通过检验发表于《科学计量学》(2007—2011)的文章主题词,Milojevi和Leydesdorff(2013)发现这一期刊与其他发表科学计量学研究的期刊比,更加关注地理的国际化趋势。与其余三篇最核心的文章相对应,他们已经发现一个在协作、评估和估价方面的重点。另一方面,一些最核心的作者与这一领域的知识基础相对应。也就是说,在iMetrics、Leydesdorff、Bornmann、Marx和Milojevi(2014)的编史研究中,发现《科学计量学》的风格早在20世纪60年代就被科学历史学家Derek de Solla Price的工作和“引文索引”的创建者Eugene Garfield定型。Derek de Solla Price的学术著作Big Science,Little Science是高被引的著作之一,Garfield是最核心作者列表中的一员。

图3.17 《科学计量学》作者引文网络的入度分布

根据介数中心性度量,发表在《科学计量学》上最核心的五篇文章是:Vanclay,J.(2012)的Impact Factor:Outdated Artefact or Stepping-stone to Journal Certification;Boyack,K.,Klavans,R.,Börner(2005)的Mapping the Backbone of Science;Leydesdorff(2003)的The Mutual Information of University-industry-government Relations:An Indicator of the Triple Helix Dynamics;Batista,P.D.,Campiteli,M.G.,Kinouchi,O.(2006)的Is it Possible to Compare Researchers with Different Scientific Interests;Weingart,P.(2005)的Impact of Bibliometrics upon the Science System:Inadvertent Consequences。这些文章的中心性是被许多不同的文章索引的结果。在某种程度上,他们充当了不同社区间的边界对象。

基于介数中心性,作者引文网络中最核心的作者是W.Glänzel、L.Leydesdorff、L.Bornmann、L.Egghe和M.Meyer。有趣的是,五位作者中的三位Glänzel、Leydesdorff和Meyer在协作网络中基于介数中心性就已经被识别为最核心的作者。这些作者的中心地位可能是多种因素作用的结果:高产出率,研究不同团体感兴趣的不同主题或者研究一个或多个团体感兴趣的主题。

最后,让我们看一下文章和作者的PageRank。PageRank是由Brin和Page(1998)提出的对Web查询结果排序的一个算法。其核心是和特征向量中心性度量一样的假设:不是所有的节点都是平等的,因此不是所有的标注都是平等的。在Web环境中,主要的区别是这种度量方式考虑了出度,这一点尤其重要。也就是说,如果一个页面被一个有影响的节点和其他100个节点标注,与被同样影响力的节点和只有5个其他节点标注的页面相比,它应该更重要。PageRank也依赖一个叫作阻尼因子的参数。最常用的参数d的值是0.85、0.5和0.15。0.85的阻尼因子强调网络拓扑,0.5的阻尼因子强调两个节点的短路径,0.15的阻尼因子强调的则是随机引用(Ding,2011)。Bollen、Rodriquez、Van de Sompel(2006)使用加权PageRank来度量期刊的声望。许多作者使用PageRank、加权PageRank及其扩展形式来对文章和作者评估或排序(Ding,2011;Ding,Yan,Frazho,Caverlee,2009;Radicchi,Fortunato,Markines,Vespignani,2009;Yan,Ding,2011;,2010)。PageRank的深入讨论请参见第4章。

使用Sci2来计算PageRank,可点击Analysis>Network>Weighted&Directed>PageRank(见图3.18)。在弹出窗口选择权属性(“Treat All Edges as Weight One”是默认值,因为文章引文网络是无权的,所以选择默认)和期望阻尼值(这里使用默认值0.85)。(www.daowen.com)

一旦获得PageRank,我们就能观察到顶层节点,点击Preprocessing>Neworks>Extract Top Nodes,并选择要展示的顶层节点的数量。在Data Manager里点击右键能打开结果文件(见图3.19),从弹出窗口的下拉菜单中选择the Viewer Application。

作为一个例子,我们列出了文章引文网络中根据无权PageRank0.85的阻尼值得出的顶级文章:Hirsch 2005年在《美国科学院院报》(PNAS)上关于h-index的文章;Egghe 2006年在《科学计量学》上的文章Theory and Practice of the G-index;Bornmann和Daniel 2005年在《科学计量学》上的文章Does the H-index for Ranking of Scientists Really Work;Ball 2005年在《自然》上的文章Index Aimsfor Fair Ranking of Scientists;King 2004年在《自然》上的文章The Scientific Impact of Nations。五篇中的两篇也是使用入度中心性度量的前五篇之一。有趣的是,这些文章全是基于影响力和排序得到的。在作者引文网络中,应用加权PageRank度量出的最核心的五位作者是:W.Glänzel,T.Braun,L.Egghe,E.Garfield和L.Leydesdorff。其中四位也是用入度中心性度量出的最核心作者。☞

图3.18 使用Sci2计算PageRank

图3.19 PageRank计算后的结果

总结

在这一章,我们主要关注各种不同的中心性度量方式如何用于研究科学。如本章所陈述的,这些度量方式不仅用于对独立研究人员或文章的排序和评估,而且也丰富了科学计量学家的工具箱,能展示科学的进程和趋势及其发展过程中不同研究人员和文章所发挥的作用。虽然也有与社区发现、观念传播和网络动力学相关的其他网络度量方式,它们也可能对网络计量学是有用的,我们却只关注中心性度量,有很多原因:它们可应用于有向和无向网络;它们计算起来相对简单;它们在增强我们对科学和学术网络的理解方面还远未被广泛使用(除了PageRank)。

【注释】

[1]S.Milojevi Department of Information and Library Science,School of Informatics and Computing,Indiana University,Bloomington,IN,USA,E-mail:smilojev@indiana.edu.

[2]http://www.leydesdorff.net/jcr04/centrality/index.htm。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈