理论教育 学术影响力测评方法:信息计量学中的文献引用分析

学术影响力测评方法:信息计量学中的文献引用分析

时间:2023-10-06 理论教育 版权反馈
【摘要】:文献调研表明,一些学者已经对影响文献引用影响力的内在因素和外在因素进行了研究。我们选取此变量是因为合著论文的被引频次较高。国际合作会增加论文的被引频次。参考文献较多的论文被引频次较高。Rigby报道了基金信息和论文影响力之间的弱阳性关系。在我们的数据集中,最大的方差膨胀因子VIF是2.0,我们认为这个值是可接受的,因为在有些文献中临界值大于或等于5的情况很普遍。

学术影响力测评方法:信息计量学中的文献引用分析

文献调研表明,一些学者已经对影响文献引用影响力的内在因素和外在因素进行了研究。本章中所使用的模型共设置12个变量来解释文献自出版后历年的引证次数(包括自引),其中前5个变量是受Didegah和Thelwall(2013b)研究的启发。我们的目的是阐述受限因变量模型的应用。上述12个解释变量如下:

(1)发表论文的期刊(我们的样本中有8%的论文发表在JOI上,33%发表在SM上,21%发表在RP上,6%发表在RE上,32%发表在JASIST上)。期刊的欢迎程度与论文的影响力是正相关的。

(2)论文的作者数量(NumAut:最小值为1,最大值为11,平均值为2.4,标准差为1.34)。我们选取此变量是因为合著论文的被引频次较高。

(3)论文地址栏所涉及的国家数(NumCoun:最小值为1,最大值为9,平均值为1.31,标准差为0.06)。国际合作会增加论文的被引频次。

(4)论文的参考文献数量(NumRef:最小值为0,最大值为282,平均值为40.20,标准差为25.34)。参考文献较多的论文被引频次较高。

(5)论文的篇幅页码(NumPag:最小值为1,最大值为37,平均值为13.33,标准差为4.88)。论文篇幅长说明内容丰富,有更多的图表,相应地会得到更多的被引量。

(6)论文题目的字数长度(NumTitle:最小值为10,最大值为284,平均值为87.48,标准差为31.10)。短题目可能更切题,而长题目可能在论文检索中更容易出现。

(7)论文是否为该期刊的首篇(有8%的论文为相应期刊的首篇论文)。如果一篇文献是某一期的第一篇论文,可能会受到更多的关注,因此其引文量也会增多。(www.daowen.com)

(8)论文的致谢中是否包括基金项目信息(20%的论文有基金信息)。Rigby(2013)报道了基金信息和论文影响力之间的弱阳性关系。

(9)论文的发表年份(PubYear:最小值为2008,最大值为2011,平均值为2009.60,标准差为1.1)。随着时间的推移,论文的引文量在逐渐增加(因为越来越多的出版物被WoS收录),因此我们需要确定其出版年。

(10)论文见刊的月份(PubMon:最小是1,最大是12,平均是6.63,标准差是3.42)。该值的计算是基于WoS中的论文印刷日期,不考虑杂志延迟出版和优先出版等因素。我们将此变量纳入分析是因为论文的被引量可能会受出版时间的影响。

(11)论文的主题是否涉及h指数(H:7%的文献是关于h指数的)。如果论文摘要中出现“h-ind*”“h ind*”和/或“Hirsch”,则认为该论文是有关h指数的。由Rousseau、Garcia-Zorita、Sanz-Casado(2013)写的关于h-bubble的论文,表明与h指数相关的论文在某种程度上可以在短期内使其引文量急剧增长,因此我们将这一变量考虑在内。

(12)论文所解决的问题是否与发明或申请专利相关(InnoPat:18%的文献与此主题相关)。如果论文标题或摘要中出现“innovation”或“patent*”则认为该论文与发明和专利相关。由于创新得到了政府的高度重视,因此我们想知道发明的引用次数是否也会增加。

当评估回归模型时,我们需要考虑解释变量之间的相关性。相关性高(多重共线性)会使估计参数的标准误过高,这就导致数据的估计效果不稳定,对很小的数据变化也很会敏感。作为共线性程度的指标,我们可以为每一个解释变量计算方差膨胀因子(Variance Inflation Factor,VIF)[2]。在我们的数据集中,最大的方差膨胀因子VIF是2.0,我们认为这个值是可接受的,因为在有些文献中临界值大于或等于5的情况很普遍(Menard,1995;O'Brien,2007)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈