理论教育 学术影响力测评实践之元素分类

学术影响力测评实践之元素分类

时间:2023-10-06 理论教育 版权反馈
【摘要】:面临的挑战是如何进行元素分类。表8.2回顾了分析单位、元素和类别不同选择的一些研究工作。因此,对于文献题录元素,如论文或参考文献,最直接的分类方法是用数据库中提供的类别。下一步是计算类别之间的认知距离。表8.2多样性测量中选择不同系统、元素、类别和测量方法的例子续表另一种替代WoS或Scopus类别误差的方法是使用文献计量学数据进行聚类。到目前为止的所有分析都是基于所有稳定科学类别的静态分类。

学术影响力测评实践之元素分类

我们需要选择分析单元内“包含”的元素和这些元素会被分派的类别。元素的选择是直接进行的。它们通常是论文、参考文献、作者、机构(在地址或附属机构中显示),或列在文献题录中的关键字。面临的挑战是如何进行元素分类。表8.2回顾了分析单位、元素和类别不同选择的一些研究工作。由于认知距离在测量多样性和连贯性时是一个关键组成部分,使用的分类类别间的认知计量的可利用性也是被考虑的一个相关因素。计量方法的选择详见综述(Börner,Chen,Boyack,2003;Boyack et al.,2011)。

科学中,学科是最传统的认知类别。大多数数据库提供商将论文(通常通过学术期刊)分为一定的学科类别。因此,对于文献题录元素,如论文或参考文献,最直接的分类方法是用数据库中提供的类别。使用最广泛的分类法是Thomson-Reuters WoS类别,它是基于期刊的,也是有问题的(Rafols,Leydesdorff,2009),因为同一期刊中的论文不一定是类似的主题或学科视角的。

下一步是计算类别之间的认知距离。在分类的情况下,特定认知距离的选择是基于判断的。一个合理的选择是取dij=1-sij,其中sij是WoS类别的余弦相似度。2007年以后,这个数据可以在Loet Leydesdorff的网站(http://www.leydesdorff.net/overlaytoolkit)上的Excel文件中获取(Leydesdorff,Carley,Rafols,2012)。

即使选择了WoS类别的余弦相似度,还是有以不同方式定义距离的可能性。例如,Soós和Kampis(2012)提出的定义dij的总和为WoS类别从i到j最短路径(1-sij)下边的权重的总和。Jensen和Lutkouskaya(2014)使用dij=1/sij来代替计算距离。在这两种选择中,比起标准相似性,完全不同的类别共现时被赋予了更大的权重(最短路径长时,1/sij高时)。这些方案的缺点是多样性的测量值不在0和1之间。

为了避免使用来自数据提供者的期刊类别(缺乏透明度),另一种可能性是使用期刊类别本身来计算多样性值(Leydesdorff,Rafols,2011b)。这里的问题是,大多数期刊仅仅类似于一个小的相关期刊集。导致大多数期刊的余弦距离几乎是零。因为,在原则上认知距离测量的目的是描述距离较大的领域之间的差异,这样的结果对于捕捉跨学科认知距离是没用的。为了克服这一困难,Leydesdorff、Rafols、Chen(2013)最近提出了另一种距离,也就是真实距离矩阵的1000维地图的二维投影中的距离。这是一个非常粗糙的近似,但优势是分布相当均匀,期刊间的距离在零和最大值之间(我们定义为1)。

表8.2 多样性测量中选择不同系统、元素、类别和测量方法的例子

(www.daowen.com)

续表

另一种替代WoS或Scopus类别误差的方法是使用文献计量学数据进行聚类(Rafols,Leydesdorff,2009)。这些自下而上的类别可能与研究实践较为一致,至少从引文来看是这样的。他们可以根据期刊聚类〔例如在UCSD中超过500类(Börner et al.,2012)[6],(Rosvall、Bergstrom,2008)〕,或论文聚类(例如Waltman,vanEck,2012[7],给出了大约700个类)。

到目前为止的所有分析都是基于所有稳定科学类别的静态分类。[8]在知识整合的案例中,这对于从科学的传统视角表征知识背景是非常有用的(如,各子学科条目)。在新兴技术的案例中,新的研究内容不符合这些传统范畴,它往往需要从更细粒度的、局部的角度,自下而上地和动态分类地来获得启发以补充传统观点。这种方法的困难之处在于需要构建非常细粒度的和/或有意义的动态集群(Havemann,Gläser,Heinz,Struck,2012)。因为噪声随着样本减少而增加,许多低于阈值100~1000篇的集群变得不稳定(出现、消亡、分裂等)(Boyack,Klavans,Small,Ungar,2014),它们局部的结构可能不同于全局图的集群(Klavans,Boyack,2011)。这种聚类方法是Kajikawa和他的同事们采用的,使用了直接引用链接聚类,例如在能源技术(Kajikawa,Yoshikawa,Takeda,Matsushima,2008)或纳米技术(Takeda,Mae,Kajikawa,Matsushima,2009)的研究中。Boyack、Klavans、Small、Ungar(2014)也用这一方法从一个全局数据集中得到了非常小的集群。原则上,这里提出的框架也可能作用于小的动态类别。在实践中,面临的挑战是要构建这些类别。

除了依靠总的类别,作为粗粒度、静态分类的对比,我们可以尝试直接使用元素作为类别计算它们的认知距离,而不用进一步再加以分类(Rafols,Meyer,2010;Soós,Kampis,2011)。Jensen和Lutkouskaya(2014)用不同的分类,使用多种多样性测量方法对法国国家实验室的学科交叉程度得到一个更多元的观点。这些努力同科学计量建议的概念化一致,可帮助科学政策争论中观点的开放,而不是缩小决策范围(如:关闭)(Barré,2010;Rafols,Ciarli,VanZwanenberg,Stirling,2012)。

此外,不使用有关的计量元素和基于科学观点的认知类别的分类,如子学科,上述提到的一个新兴的领域或课题,我们可以将元素与外部科学的类别联系起来,诸如疾病或技术。PubMed的医学主题词表(MeSH)提供了出版物元素和特定的医生导向的等级分类观点之间联系的方式,如疾病描述、技术和设备、化学品/药品、保健。当分析研究的社会影响时,使用一个或更多从业者导向的类别可能特别有用。Leydesdorff、Rotolo、Rafols(2012)和Skupin、Biberstine、Börner(2013)最近创建了全球医学主题词图。然而,不同于表明共识的全球科学图(Klavans,Boyack,2009),这些地图不能被匹配。因此,医学主题词表潜在的认知结构和计量值得进一步研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈