理论教育 学术影响力评估方法:R脚本计算论文多样性

学术影响力评估方法:R脚本计算论文多样性

时间:2023-10-06 理论教育 版权反馈
【摘要】:文件“diversity_measures_1.R”包含R语言脚本,基于WoS类引用赋值,用来计算列表中每篇论文的Rao-Stirling多样性。基于WoS分类,本章用电子表格说明了如何计算多样性和连贯性。或者,研究组织中新课题的多样性时,不仅要考虑计算组织的数量,而且要考虑组织的认知距离。感谢D.Chavarro为计算多样性编写了R语言的代码,以及Y.X.Liu、R.Rousseau和A.Stirling提出的宝贵意见。

学术影响力评估方法:R脚本计算论文多样性

这个协议提供了一个在大数据集上计算多样性的脚本。文件获取地址:http://www.sussex.ac.uk/users/ir28/book/diversity.zip。

文件“diversity_measures_1.R”包含R语言脚本,基于WoS类引用赋值,用来计算列表中每篇论文的Rao-Stirling多样性。它要求有距离矩阵的文件(“cosine_similarity_matrix_sc.csv”)和一个包含参考文献列的分布列,如“articles_sample.csv”文件中所列的输入文件。运行之前,文件的地址需要写进脚本。☞

总结

在这一章中,基于认知多样性和连贯性的概念,提出了用于分析知识整合与扩散的框架。知识扩散随一个给定的发现或技术传播进入的领域的认知多样性而增加。知识整合随认知多样性和/或连贯性而增加。本章介绍了这些概念的数学公式,提出了多样性的属性,即多样性、平衡性和差异性,以及连贯性的属性,即密度、强度和差异性。根据其属性的相对权重,多样性和连贯性可以用多种方式来表示,因此它们的值将取决于所赋予的权重。

考虑到元素选择、关系和表征多样性的分类的重要性,本章讨论了对科学进行分类的不同方法,从自上而下的粗分类(如WoS类别)到更细粒度的分类。简要地提到了用从业者导向的观点来表征科学类,如医学主题词表(MeSH)所提供的类。基于WoS分类,本章用电子表格说明了如何计算多样性和连贯性。由于WoS类别是非常不准确的,这种方法也只是探索性的。

事实上,可以使用各种数学公式来测量多样性和连贯性,对每种方法,就元素和选择的类别来说多种操作都是可能的。这说明:知识整合与扩散强烈地依赖于所选取的视角。从一个学科的角度来说,研究课题是停滞不前的(停留在同一学科),但从医学的角度,主题可能扩散到新的领域,如疾病。因此,测量和可视化时应不可避免地从局部的视角来解读,局部视角只涉及了获取知识动态的少数可能性。没有被多样性和连贯性覆盖的其他知识整合动力也是可能存在的,例如,侧重于桥接过程的“中介”是另一种获取知识整合的方式(Chen et al.,2009;Rafols et al.,2012)。

本章提出的这个框架已经在可视化传统科学认知维度(学科和主题)上有了发展,但很容易扩展到其他认知视角,如通过医学出现的视角(通过医学主题词表)。同样,也可以利用技术全景图谱(Kay,Newman,Youtie,Porter,Rafols,2012;Leydesdorff,Kushnir,Rafols,2012;Schoen et al.,2012),该方法可容易地扩展成与专利和多样性密切相关的测量方法(Nesta,Saviotti,2005,2006)。

最后,要强调的是,虽然框架已经应用于认知距离,原则上也可以应用于其他分析维度。例如,我们关注合作项目的地理多样性时,不需要计算国家的数量,而是就其地理距离研究合作或引用(Ahlgren,Persson,Tijssen,2013)。或者,研究组织中新课题的多样性时,不仅要考虑计算组织的数量,而且要考虑组织的认知距离。如Frenken(2010)所做的研究,通过将该框架扩展用于其他分析维度,可以探讨知识整合如何受到地理、组织、机构和社会网络的影响。☞

致谢

本章总结了许多合作者的工作,特别是L.Leydesdorff、A.L.Porter和A.Stirling。感谢D.Chavarro为计算多样性编写了R语言的代码,以及Y.X.Liu、R.Rousseau和A.Stirling提出的宝贵意见。感谢英国ESRC(RES-360-25-0076,“新兴技术动态可视化”)和美国国家科学基金会(#1064146,“揭示创新途径:技术评估及预见的混合科学图谱”)的资助。本章得出的结论仅为作者的个人观点,并不代表资助方的观点。

【注释】
(www.daowen.com)

[1]I.Rafols,Ingenio(CSIC-UPV),Universitat Politècnica de València,València,(Spain),SPRU(Science Policy Research Unit),University of Sussex,Brighton,(UK),E-mail:i.rafols@ingenio.upv.es.

[2]应该指出的是,科学和技术的进化观点在建构主义社会学家〔如Bijker(Pinch,Bijker,1984)〕和实证经济学家〔如Dosi(1982)〕中较为流行。

[3]这五个维度的使用是一个有效的简化。从这些列出的维度中,我们很容易想到更多的维度,例如,对认知或社会维度作一个更细粒度的描述。

[4]这个框架由Rafols和Meyer(2010)首次提出,在Liu、Rafols、Rousseau(2012)的研究中有更一般形式的表示,在Rafols、Leydesdorff、O'Hare、Nightingale、Stirling(2012)的实证案例中有一些实质性的变化,本章中,笔者通过一些改进使连贯性概念更加一般化。

[5]据我所知,连贯性只用这种单一的形式提到,其强度定义为WoS中类iij=pij的引用比例。本章中笔者采用了Soós和Kampis(2012)提到的形式,而不是Rafols、Leydesdorff等人(2012)的。后来,连贯性,例如,是由Rao-Stirling多样性标准化而来的。这种标准化对消除两个变量之间的相关性是很有用的,但它对整个框架来说似乎增加了不太必要的复杂性。

[6]这种分类和基本图可以下载和公开使用。获取地址:http://sci.cns.iu.edu/ucsdmap/。

[7]这种分类的获取地址:http://www.ludowaltman.nl/classification_system/。

[8]根据Boyack、Klavans、Small和Ungar(2014)的研究,99%的科学集群都稳定在大约500个集群中。

[9]http://www.thevantagepoint.com/。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈